CN112000503A - 一种服务器故障调试的方法、系统及远端服务器 - Google Patents

一种服务器故障调试的方法、系统及远端服务器 Download PDF

Info

Publication number
CN112000503A
CN112000503A CN202010820092.3A CN202010820092A CN112000503A CN 112000503 A CN112000503 A CN 112000503A CN 202010820092 A CN202010820092 A CN 202010820092A CN 112000503 A CN112000503 A CN 112000503A
Authority
CN
China
Prior art keywords
debugging
accelerator card
log file
fault
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010820092.3A
Other languages
English (en)
Other versions
CN112000503B (zh
Inventor
李振辉
王彦伟
阚宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010820092.3A priority Critical patent/CN112000503B/zh
Publication of CN112000503A publication Critical patent/CN112000503A/zh
Application granted granted Critical
Publication of CN112000503B publication Critical patent/CN112000503B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种服务器故障调试的方法,包括:加载FPGA加速卡的驱动并创建块设备节点,通过块设备节点映射FPGA加速卡的内存空间;当发生故障时将生成的故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中;通过FPGA加速卡接收本地服务器发送的调试命令,并执行调试命令完成对故障的调试。本申请将生成的故障日志文件存储到FPGA加速卡的内存空间中,使得故障日志文件具有掉电不丢失的物理特性;同时不需要调试人员去现场部署远程服务器的调试环境,简化了远端服务器故障的调试实施过程,极大的提高了远端服务器的调试效率。本申请同时还提供了一种服务器故障调试的系统、远端服务器及可读存储介质,具有上述有益效果。

Description

一种服务器故障调试的方法、系统及远端服务器
技术领域
本申请涉及故障调试领域,特别涉及一种服务器故障调试的方法、系统、远端服务器及可读存储介质。
背景技术
linux使用内核日志进行驱动调试的方法由来已久。日志不仅在理解系统的内部操作方面很有用,而且对于通过时间标记的日志中按时间顺序排列的消息所记录的系统活动的计时和关系也非常有用。
目前linux操作系统的内核日志文件通常是要存储在动态随机存储器(DynamicRandom Access Memory,DRAM)的缓冲区中,因为DRAM特性是只能将数据保持很短时间,为了保持数据,必须隔一段时间刷新一次,如果存储单元掉电那么存储的信息就会丢失,所以在调试驱动过程中出现系统意外断电或者宕机,将会导致内核的日志文件丢失,最终将不能准确定位问题所在。
对于上述问题,通常的做法是在远端的服务器添加硬件串口调试设备,通过串口将日志文件输出到另一台服务器上,调试人员再通过另一台服务器获取日志文件并进行内核调试,实施该方案需要串口设备和另一台服务器配合,并需要软件开发人员去现场部署,导致远端服务器故障调试的实施过程极为困难,造成远端服务器的调试效率低下。
因此,如何提高远端服务器的调试效率是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种服务器故障调试的方法、系统、远端服务器及可读存储介质,用于提高远端服务器的调试效率。
为解决上述技术问题,本申请提供一种服务器故障调试的方法,应用于远端服务器,该方法包括:
加载FPGA加速卡的驱动并创建块设备节点,通过所述块设备节点映射所述FPGA加速卡的内存空间;
当发生故障时将生成的故障日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述故障日志文件发送至本地服务器;
通过所述FPGA加速卡接收所述本地服务器发送的调试命令,并执行所述调试命令完成对故障的调试。
可选的,通过所述FPGA加速卡接收所述本地服务器发送的调试命令,并执行所述调试命令完成对故障的调试,包括:
执行所述调试命令,并将生成的调试日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述调试日志文件发送至所述本地服务器,以使用户根据所述调试日志文件的内容通过所述本地服务器输入下一步的调试命令;
重复执行所述执行所述调试命令,并将生成的调试日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述调试日志文件发送至所述本地服务器的步骤,直至完成此次调试。
可选的,所述FPGA加速卡将所述故障日志文件发送至本地服务器,包括:
所述FPGA加速卡采用中断方式将所述故障日志文件实时发送至所述本地服务器。
可选的,在加载FPGA加速卡的驱动并创建块设备节点之后,还包括:
获取所述本地服务器的ip和mac地址信息,并传递给所述FPGA加速卡的驱动。
可选的,所述FPGA加速卡将所述故障日志文件发送至本地服务器,包括:
所述FPGA加速卡根据所述本地服务器的ip和mac地址信息,通过MAC接口将所述故障日志文件发送至所述本地服务器中,并将内存空间中的故障日志文件清除。
可选的,在所述FPGA加速卡将所述故障日志文件发送至本地服务器之后,还包括:
所述本地服务器通过socket接口接收所述故障日志文件。
可选的,还包括:
所述本地服务器将所述故障日志文件通过显示器终端进行显示。
本申请还提供一种服务器故障调试的系统,应用于远端服务器,该系统包括:
加载模块,用于加载FPGA加速卡的驱动并创建块设备节点,通过所述块设备节点映射所述FPGA加速卡的内存空间;
存储模块,用于当发生故障时将生成的故障日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述故障日志文件发送至本地服务器;
接收模块,用于通过所述FPGA加速卡接收所述本地服务器发送的调试命令,并执行所述调试命令完成对故障的调试。
本申请还提供一种远端服务器,该远端服务器包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述服务器故障调试的方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述服务器故障调试的方法的步骤。
本申请所提供服务器故障调试的方法,包括:加载FPGA加速卡的驱动并创建块设备节点,通过块设备节点映射FPGA加速卡的内存空间;当发生故障时将生成的故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将故障日志文件发送至本地服务器;通过FPGA加速卡接收本地服务器发送的调试命令,并执行调试命令完成对故障的调试。
本申请所提供的技术方案,通过创建的块设备节点映射FPGA加速卡的内存空间,在发生故障时将生成的故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中,使得故障日志文件具有掉电不丢失的物理特性;同时不需要调试人员去现场部署远程服务器的调试环境,简化了远端服务器故障的调试实施过程,极大的提高了远端服务器的调试效率。本申请同时还提供了一种服务器故障调试的系统、远端服务器及可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种服务器故障调试的方法的流程图;
图2为本申请实施例所提供的一种服务器故障调试的系统的结构图;
图3为本申请实施例所提供的一种远端服务器的结构图。
具体实施方式
本申请的核心是提供一种服务器故障调试的方法、系统、远端服务器及可读存储介质,用于提高远端服务器的调试效率。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种服务器故障调试的方法的流程图。
应用于远端服务器,其具体包括如下步骤:
S101:加载FPGA加速卡的驱动并创建块设备节点,通过块设备节点映射FPGA加速卡的内存空间;
远端服务器通常安装于生产现场或管理现场,基于现有技术中通过在远端的服务器添加硬件串口调试设备的方式对远端服务器进行调试,即通过串口将日志文件输出到另一台服务器上,调试人员再通过另一台服务器获取日志文件并进行内核调试,实施该方案需要串口设备和另一台服务器配合,并需要软件开发人员去现场部署,导致远端服务器故障调试的实施过程极为困难,造成远端服务器的调试效率低下;故本申请提供了一种服务器故障调试的方法,用于解决上述问题。
在本步骤中,加载FPGA加速卡的驱动并创建块设备节点的目的在于,通过块设备节点映射FPGA加速卡的内存空间,进而可以将故障日志文件存储到FPGA加速卡的内存空间中,使得故障日志文件具有掉电不丢失的物理特性,能够在调试驱动过程中出现系统意外断电或者宕机的情况时,避免出现日志文件丢失导致的不能准确定位问题所在的情况。
S102:当发生故障时将生成的故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将故障日志文件发送至本地服务器;
在本步骤中,将故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中的目的在于,令FPGA加速卡将故障日志文件发送至本地服务器,以使用户能够对该故障日志文件进行分析,并通过本地服务器输入对应的调试命令,进而实现用户远程对远端服务器的调试。
可选的,在一个具体实施例中,FPGA加速卡可以通过PCIE的BAR地址空间映射预设大小(例如1G)的内存空间,该内存空间用于存储应用态软件发送的日志文件。
可选的,为进一步提高服务器调试的效率,可以通过加快故障日志文件发送速度的方式实现,即这里提到的FPGA加速卡将故障日志文件发送至本地服务器,其具体可以为:
FPGA加速卡采用中断方式将故障日志文件实时发送至本地服务器。
可选的,在执行完步骤S101加载FPGA加速卡的驱动并创建块设备节点之后,还可以执行如下步骤:
获取本地服务器的ip和mac地址信息,并传递给FPGA加速卡的驱动。
在此基础上,这里提到的FPGA加速卡将故障日志文件发送至本地服务器,其具体可以通过执行如下步骤实现:
FPGA加速卡根据本地服务器的ip和mac地址信息,通过MAC接口将故障日志文件发送至本地服务器中,并将内存空间中的故障日志文件清除。
在本实施例中,在加载FPGA加速卡的驱动并创建块设备节点之后,获取本地服务器的ip和mac地址信息,并传递给FPGA加速卡的驱动,以实现FPGA加速卡根据本地服务器的ip和mac地址信息,通过MAC接口将故障日志文件发送至本地服务器中,完成故障日志文件的传输。
可选的,在FPGA加速卡将故障日志文件发送至本地服务器之后,本地服务器还可以通过socket接口接收故障日志文件;
在此基础上,本地服务器还可以将故障日志文件通过显示器终端进行显示。
在本实施例中,本地服务器通过socket接口接收故障日志文件,并将故障日志文件通过显示器终端进行显示,进而用户可以在本地服务器实现对远端服务器上linux驱动或内核的可视化调试。
S103:通过FPGA加速卡接收本地服务器发送的调试命令,并执行调试命令完成对故障的调试。
可选的,基于对故障的调试可能需要多次调试才能完成,因此这里提到的通过FPGA加速卡接收本地服务器发送的调试命令,并执行调试命令完成对故障的调试,其具体可以通过执行如下步骤实现:
执行调试命令,并将生成的调试日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将调试日志文件发送至本地服务器,以使用户根据调试日志文件的内容通过本地服务器输入下一步的调试命令;
重复执行执行调试命令,并将生成的调试日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将调试日志文件发送至本地服务器的步骤,直至完成此次调试。
基于上述实施例,本申请可以通过FPGA加速卡实现远端服务器与本地服务器的实时交互,即用户可以在本地服务器实现对远端服务器的实时调试,极大的提高了服务器故障调试的效率。
基于上述技术方案,本申请所提供的一种服务器故障调试的方法,通过创建的块设备节点映射FPGA加速卡的内存空间,在发生故障时将生成的故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中,使得故障日志文件具有掉电不丢失的物理特性;同时不需要调试人员去现场部署远程服务器的调试环境,简化了远端服务器故障的调试实施过程,极大的提高了远端服务器的调试效率。
下面介绍本申请提供的一种应用实施例,上述实施例中提到的技术方案可以由远端服务器和本地服务器执行如下步骤实现:
远端服务器:
步骤1、FPGA加速卡插在服务器PCIE插槽上,启动服务器,通过驱动模块的形式加载FPGA加速卡驱动,并通过模块参数的方式传递将本地服务器的ip和mac地址信息传递给驱动程序。
步骤2、FPGA加速卡通过PCIE的BAR地址空间映射1G的DDR空间,此空间用于存储应用态软件发送的日志文件。
步骤3、驱动将上述通过BAR地址映射的空间进行块设备虚拟化,并提供转换接口将通过标准文件系统写入的文件数据转换为以太网数据流,之后在系统下创建/dev/memdev设备节点。
步骤4、驱动获取PCIE中断并创建中断处理函数,此函数处理应用态通过/dev/memdev设备节点写到FPGA加速卡DDR上的数据,在FPGA加速卡的内部逻辑中,每当FPGA加速卡检测到“\n”换行符会触发PCIE中断,并立即执行驱动注册的中断处理函数,函数将通过FPGA加速卡的MAC接口把DDR上的数据发送给步骤1传递的ip和mac地址的服务器。并在之后清除FPGA加速卡DDR上的数据。
步骤5、系统通过格式化命令将/dev/memdev格式化成标准ext4文件系统,并通过mount挂载命令将虚拟化块设备节点挂载到日志文件目录下,这样当系统通过日志守护进程写入的日志内容就可以通过标准文件系统写入到FPGA加速卡的DDR上,并经过驱动转换模块将数据转化后通过MAC发送到本地服务器。
本地服务器:
步骤1、系统启动守护进程,通过socket接口接收远端服务器发送的数据。
步骤2、将接收到的数据输出到本地指定位置的日志文件中,并通过显示模块将数据显示到显示器终端上。
通过上述所有步骤,服务器环境搭建完毕,之后可以在本地服务器调试远端服务器上的linux驱动或内核,远端服务器会实时的将调试的日志文件通过FPGA加速卡的MAC接口输出到本地服务器。
请参考图2,图2为本申请实施例所提供的一种服务器故障调试的系统的结构图。
应用于远端服务器,该系统可以包括:
加载模块100,用于加载FPGA加速卡的驱动并创建块设备节点,通过块设备节点映射FPGA加速卡的内存空间;
存储模块200,用于当发生故障时将生成的故障日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将故障日志文件发送至本地服务器;
接收模块300,用于通过FPGA加速卡接收本地服务器发送的调试命令,并执行调试命令完成对故障的调试。
在上述实施例的基础上,在一个具体实施例中,接收模块300可以包括:
执行子模块,用于执行调试命令,并将生成的调试日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将调试日志文件发送至本地服务器,以使用户根据调试日志文件的内容通过本地服务器输入下一步的调试命令;
重复子模块,用于重复执行执行调试命令,并将生成的调试日志文件通过块设备节点存储到FPGA加速卡的内存空间中,FPGA加速卡将调试日志文件发送至本地服务器的步骤,直至完成此次调试。
在上述实施例的基础上,在一个具体实施例中,存储模块200可以包括:
第一发送子模块,用于FPGA加速卡采用中断方式将故障日志文件实时发送至本地服务器。
在上述实施例的基础上,在一个具体实施例中,该系统还可以包括:
获取模块,用于获取本地服务器的ip和mac地址信息,并传递给FPGA加速卡的驱动。
在上述实施例的基础上,在一个具体实施例中,存储模块200可以包括:
第二发送子模块,用于FPGA加速卡根据本地服务器的ip和mac地址信息,通过MAC接口将故障日志文件发送至本地服务器中,并将内存空间中的故障日志文件清除。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
请参考图3,图3为本申请实施例所提供的一种远端服务器的结构图。
该远端服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对装置中的一系列指令操作。更进一步地,处理器422可以设置为与存储介质430通信,在远端服务器400上执行存储介质430中的一系列指令操作。
远端服务器400还可以包括一个或一个以上电源424,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述图1所描述的服务器故障调试的方法中的步骤由远端服务器基于该图3所示的结构实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置、远端服务器和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请所提供的一种服务器故障调试的方法、系统、远端服务器及可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种服务器故障调试的方法,应用于远端服务器,其特征在于,包括:
加载FPGA加速卡的驱动并创建块设备节点,通过所述块设备节点映射所述FPGA加速卡的内存空间;
当发生故障时将生成的故障日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述故障日志文件发送至本地服务器;
通过所述FPGA加速卡接收所述本地服务器发送的调试命令,并执行所述调试命令完成对故障的调试。
2.根据权利要求1所述的方法,其特征在于,通过所述FPGA加速卡接收所述本地服务器发送的调试命令,并执行所述调试命令完成对故障的调试,包括:
执行所述调试命令,并将生成的调试日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述调试日志文件发送至所述本地服务器,以使用户根据所述调试日志文件的内容通过所述本地服务器输入下一步的调试命令;
重复执行所述执行所述调试命令,并将生成的调试日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述调试日志文件发送至所述本地服务器的步骤,直至完成此次调试。
3.根据权利要求1所述的方法,其特征在于,所述FPGA加速卡将所述故障日志文件发送至本地服务器,包括:
所述FPGA加速卡采用中断方式将所述故障日志文件实时发送至所述本地服务器。
4.根据权利要求1所述的方法,其特征在于,在加载FPGA加速卡的驱动并创建块设备节点之后,还包括:
获取所述本地服务器的ip和mac地址信息,并传递给所述FPGA加速卡的驱动。
5.根据权利要求4所述的方法,其特征在于,所述FPGA加速卡将所述故障日志文件发送至本地服务器,包括:
所述FPGA加速卡根据所述本地服务器的ip和mac地址信息,通过MAC接口将所述故障日志文件发送至所述本地服务器中,并将内存空间中的故障日志文件清除。
6.根据权利要求1所述的方法,其特征在于,在所述FPGA加速卡将所述故障日志文件发送至本地服务器之后,还包括:
所述本地服务器通过socket接口接收所述故障日志文件。
7.根据权利要求6所述的方法,其特征在于,还包括:
所述本地服务器将所述故障日志文件通过显示器终端进行显示。
8.一种服务器故障调试的系统,应用于远端服务器,其特征在于,包括:
加载模块,用于加载FPGA加速卡的驱动并创建块设备节点,通过所述块设备节点映射所述FPGA加速卡的内存空间;
存储模块,用于当发生故障时将生成的故障日志文件通过所述块设备节点存储到所述FPGA加速卡的内存空间中,所述FPGA加速卡将所述故障日志文件发送至本地服务器;
接收模块,用于通过所述FPGA加速卡接收所述本地服务器发送的调试命令,并执行所述调试命令完成对故障的调试。
9.一种远端服务器,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述服务器故障调试的方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述服务器故障调试的方法的步骤。
CN202010820092.3A 2020-08-14 2020-08-14 一种服务器故障调试的方法、系统及远端服务器 Active CN112000503B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010820092.3A CN112000503B (zh) 2020-08-14 2020-08-14 一种服务器故障调试的方法、系统及远端服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010820092.3A CN112000503B (zh) 2020-08-14 2020-08-14 一种服务器故障调试的方法、系统及远端服务器

Publications (2)

Publication Number Publication Date
CN112000503A true CN112000503A (zh) 2020-11-27
CN112000503B CN112000503B (zh) 2022-11-25

Family

ID=73473501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010820092.3A Active CN112000503B (zh) 2020-08-14 2020-08-14 一种服务器故障调试的方法、系统及远端服务器

Country Status (1)

Country Link
CN (1) CN112000503B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286883A (zh) * 2008-05-04 2008-10-15 杭州华三通信技术有限公司 分布式设备中设备板卡的集中调试系统及集中调试方法
CN102752150A (zh) * 2012-07-20 2012-10-24 迈普通信技术股份有限公司 提供远程板卡调试的分布式通信设备及方法
CN106649152A (zh) * 2016-12-29 2017-05-10 郑州云海信息技术有限公司 一种基于非易失内存的系统日志存储方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286883A (zh) * 2008-05-04 2008-10-15 杭州华三通信技术有限公司 分布式设备中设备板卡的集中调试系统及集中调试方法
CN102752150A (zh) * 2012-07-20 2012-10-24 迈普通信技术股份有限公司 提供远程板卡调试的分布式通信设备及方法
CN106649152A (zh) * 2016-12-29 2017-05-10 郑州云海信息技术有限公司 一种基于非易失内存的系统日志存储方法及装置

Also Published As

Publication number Publication date
CN112000503B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
US11392461B2 (en) Method and apparatus for processing information
CN112738060B (zh) 微服务数据的处理方法、装置、微服务处理平台及介质
CN109324874B (zh) 一种虚拟机内存快照导入块设备的方法、系统及装置
CN112565443A (zh) 物联网数据解析方法、装置、设备及存储介质
CN112286746A (zh) 针对axi从设备接口的通用验证平台及方法
CN113656357A (zh) 文件管理方法、装置、系统及存储介质
CN117032812B (zh) 服务器的管理方法、设备、装置、存储介质和电子设备
CN112000503B (zh) 一种服务器故障调试的方法、系统及远端服务器
CN111367804B (zh) 基于云计算及网络编程实现前端协作调试的方法
CN112243033A (zh) 获取内存信息的方法、装置、设备及计算机可读存储介质
EP4339779A1 (en) Software host construction method and construction system, and software host and simulation device
CN113157274B (zh) 基于微前端的软件开发方法、装置、电子设备及存储介质
CN112073505B (zh) 在云服务器上进行卸载的方法、控制装置、存储介质
CN115145381A (zh) 一种远程重置bmc芯片的方法、系统、存储介质及设备
CN114217927A (zh) 一种线程调用方法、装置、计算机设备及存储介质
CN112231409B (zh) 数据库同步的初始化装载方法、装置、设备和存储介质
CN106201508B (zh) 一种信息显示方法、装置及电子设备
CN107454124B (zh) 设备自动化方法及装置
CN113761548B (zh) 用于Shuffle过程的数据传输方法和装置
CN114826811A (zh) 数据传输方法及其系统
CN117632312B (zh) 数据交互方法及相关装置
CN114866397B (zh) 基于国产化平台的系统健康状态自动监测方法
CN114826994A (zh) 用户环境回放方法、系统、电子设备及可读存储介质
CN115658154A (zh) Usb配置方法、装置、电子设备、存储介质及程序产品
CN112988415A (zh) 一种数据交换对接方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant