CN113515429A - 固态硬盘的多核异常监控方法、装置、计算机设备及存储介质 - Google Patents

固态硬盘的多核异常监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113515429A
CN113515429A CN202110857427.3A CN202110857427A CN113515429A CN 113515429 A CN113515429 A CN 113515429A CN 202110857427 A CN202110857427 A CN 202110857427A CN 113515429 A CN113515429 A CN 113515429A
Authority
CN
China
Prior art keywords
cpu
slave
core
watchdog
main cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110857427.3A
Other languages
English (en)
Inventor
王猛
徐伟华
贾宗铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Union Memory Information System Co Ltd
Original Assignee
Shenzhen Union Memory Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Union Memory Information System Co Ltd filed Critical Shenzhen Union Memory Information System Co Ltd
Priority to CN202110857427.3A priority Critical patent/CN113515429A/zh
Publication of CN113515429A publication Critical patent/CN113515429A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/24Resetting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种固态硬盘的多核异常监控方法、装置、计算机设备及存储介质,其中该方法包括:获取固态硬盘的多核异常监控请求;根据所述多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;由看门狗监控所述主CPU是否工作正常,若所述主CPU发生异常则触发系统复位;若所述主CPU工作正常,则由所述主CPU对各个从CPU进行检测;所述主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。本发明可以在不增加硬件成本的基础上,实现对多核的异常监控,有效地提升了固态硬盘的可靠性。

Description

固态硬盘的多核异常监控方法、装置、计算机设备及存储介质
技术领域
本发明涉及固态硬盘技术领域,特别是涉及一种固态硬盘的多核异常监控方法、装置、计算机设备及存储介质。
背景技术
SSD(Solid State Disk,固态硬盘)已经被广泛应用于各种场合,目前在PC市场,已经逐步替代传统的HDD(Hard Disk Drive,机械硬盘),从可靠性和性能方面为用户提供较好的体验。随着性能要求越高,SSD内部的SOC控制器上一般会集成多个CPU,其用于共享系统资源,提供独立的CPU运算能力,进而提升了整体性能。进一步地,随着应用场景越来越多,对于SSD的可靠性性越来越高,类似CPU卡死导致丢盘无法响应主机的请求的失效必须触发自恢复措施,从而保证盘的稳定性。
在传统的单CPU时代,SOC上一般集成了一个Watchdog(看门狗),其用于监控CPU运行是否正常,如果长时间无响应,则会触发复位从而进行修复;但当扩展到多CPU后,考虑到成本的原因,SSD内部一般只有一个Watchdog,其只能监控一个CPU。而随着SSD性能的提升,其往往有多个CPU,其中任意CPU出现异常均会导致无法正常工作。所以,在现有的SSD中无法达到对多个CPU是否正常的监控,可靠性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种固态硬盘的多核异常监控方法、装置、计算机设备及存储介质。
一种固态硬盘的多核异常监控方法,所述方法包括:
获取固态硬盘的多核异常监控请求;
根据所述多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;
由看门狗监控所述主CPU是否工作正常,若所述主CPU发生异常则触发系统复位;
若所述主CPU工作正常,则由所述主CPU对各个从CPU进行检测;
所述主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
在其中一个实施例中,所述方法还包括:
设定看门狗计数器的计数并启动看门狗监控所述主CPU;
当所述计数器的计数持续递减至0时则触发系统复位;
主CPU周期性发送数据包给第一从CPU,当每个从CPU拿到所述数据包后往下一个从CPU转发;
最后一个从CPU逆向传递所述数据包至主CPU。
在其中一个实施例中,在所述最后一个从CPU逆向传递所述数据包至主CPU的步骤之后还包括:
若主CPU正确接收到返回的数据包,则重新设置看门狗计数器;否则停止更新看门狗计数器,等待看门狗超时进行系统复位。
在其中一个实施例中,在所述最后一个从CPU逆向传递所述数据包至主CPU的步骤之后还包括:
若在所述数据包的传输过程中主CPU出现异常,则会触发看门狗超时进行系统复位。
一种固态硬盘的多核异常监控装置,所述装置包括:
获取模块,所述获取模块用于获取固态硬盘的多核异常监控请求;
划分模块,所述划分模块用于根据所述多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;
监控模块,所述监控模块用于由看门狗监控所述主CPU是否工作正常,若所述主CPU发生异常则触发系统复位;
主从模块,所述主从模块用于若所述主CPU工作正常,则由所述主CPU对各个从CPU进行检测;
触发模块,所述触发模块用于所述主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
在其中一个实施例中,所述装置还包括数据包传递模块,所述数据包传递模块用于:
设定看门狗计数器的计数并启动看门狗监控所述主CPU;
当所述计数器的计数持续递减至0时则触发系统复位;
主CPU周期性发送数据包给第一从CPU,当每个从CPU拿到所述数据包后往下一个从CPU转发;
最后一个从CPU逆向传递所述数据包至主CPU。
在其中一个实施例中,所述数据包传递模块还用于:
若主CPU正确接收到返回的数据包,则重新设置看门狗计数器;否则停止更新看门狗计数器,等待看门狗超时进行系统复位。
在其中一个实施例中,所述数据包传递模块还用于:
若在所述数据包的传输过程中主CPU出现异常,则会触发看门狗超时进行系统复位。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项方法的步骤。
上述固态硬盘的多核异常监控方法、装置、计算机设备及存储介质将多核CPU系统进行主从模式划分。由看门狗监控主CPU是否工作正常,若异常则触发系统复位;在主CPU工作正常的前提下,由主CPU对各个从CPU进行检测,通过定期发送数据包检查应答,若无应答则说明至少一个从CPU出现了异常,进而停止加载看门狗计数器,触发系统复位。本发明通过引入上述策略,可以在不增加硬件成本的基础上,实现对多核的异常监控,有效地提升了固态硬盘的可靠性。
附图说明
图1为传统技术中单核SSD异常监控流程的示意图;
图2为本发明中单个Watchdog对多核CPU的监控流程的示意图;
图3为一个实施例中固态硬盘的多核异常监控方法的流程示意图;
图4为另一个实施例中固态硬盘的多核异常监控方法的流程示意图;
图5为一个实施例中完整实现固态硬盘的多核异常监控方法的流程示意图;
图6为一个实施例中固态硬盘的多核异常监控装置的结构框图;
图7为另一个实施例中固态硬盘的多核异常监控装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
目前,参考图1所示的传统单核SSD异常监控流程的示意图,具体包括:S0:CPU0初始化Watchdog计数器,设定其计数为T,并启动Watchdog监控。S1:Watchdog持续递减当前的计数器,如果达到0,则触发系统复位。S2:CPU0周期性重置Watchdog计数器计数为T,避免其降低到0触发复位。其中S1/S2并行执行,如果某次CPU0出现异常,导致其没有及时重置Watchdog计数器,则Watchdog会触发系统复位。在此过程中,在单个Watchdog系统下可以很好地监控单个CPU是否工作正常,而随着性能的提升,通过SSD内的SOC有多个CPU,无法实现对多个CPU是否工作正常的监控。
基于此,本发明提供了一种固态硬盘的多核异常监控方法,参考图2所示的单个Watchdog对多核CPU的监控流程的示意图。具体地,将CPU划分为主从模式,例如:CPU0为主模式;CPU 1-n为从模式,Watchdog负责监控CPU0是否工作正常。主模式CPU负责探测各个从CPU是否工作正常,且将SOC中的Watchdog设置为监控主模式CPU。当主CPU工作异常时,Watchdog会检测到并按预期触发系统复位进行修复;而当从CPU发生异常时,主CPU探测到后,主动停止更新Watchdog的计数器,则也会触发系统复位修复。通过引入该策略,可以在不增加硬件成本的基础上,实现对多核的异常监控,有效提升了SSD的可靠性。
在一个实施例中,如图3所示,提供了一种固态硬盘的多核异常监控方法,该方法包括:
步骤302,获取固态硬盘的多核异常监控请求;
步骤304,根据多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;
步骤306,由看门狗监控主CPU是否工作正常,若主CPU发生异常则触发系统复位;
步骤308,若主CPU工作正常,则由主CPU对各个从CPU进行检测;
步骤310,主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
在本实施例中,提供了一种固态硬盘的多核异常监控方法,其具体的实现步骤如下:
首先,获取固态硬盘的多核异常监控请求,根据多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU。具体地,本实施例中,将CPU划分为主从模式,例如:CPU0为主模式;CPU 1-n为从模式,Watchdog(看门狗)负责监控CPU0是否工作正常。
看门狗,又被称为Watchdog是一种监控系统的运行状况的手段,通过软硬件结合的方式实现对系统运行状况的监控。稳定运行的软件会在执行完特定指令后进行喂狗,若在一定周期内看门狗没有收到来自软件的喂狗信号,则认为系统故障,会进入中断处理程序或强制系统复位。系统上电后根据不同的工作模式可以选择使能看门狗的时机,若看门狗被使能则计数器开始计数,如果在设定的时间内没有及时喂狗则会发生看门狗超时。看门狗主要由寄存器、计数器和狗叫模块构成:通过寄存器对看门狗进行基本设置,计数器计算狗叫时间,狗叫模块决定看门狗超时后发出的中断或复位方式。
接着,由看门狗监控主CPU是否工作正常,若主CPU发生异常则触发系统复位。当主CPU工作异常时,Watchdog会检测到并按预期触发系统复位进行修复。若主CPU工作正常,则由主CPU对各个从CPU进行检测。
具体地,当从CPU发生异常时,主CPU探测到后,主动停止更新Watchdog的计数器,则也会触发系统复位修复。例如:主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
在本实施例中,将多核CPU系统进行主从模式划分。由看门狗监控主CPU是否工作正常,若异常则触发系统复位;在主CPU工作正常的前提下,由主CPU对各个从CPU进行检测,通过定期发送数据包检查应答,若无应答则说明至少一个从CPU出现了异常,进而停止加载看门狗计数器,触发系统复位。本方案通过引入上述策略,可以在不增加硬件成本的基础上,实现对多核的异常监控,有效地提升了固态硬盘的可靠性。
在一个实施例中,如图4所示,提供了一种固态硬盘的多核异常监控方法,该方法还包括:
步骤402,设定看门狗计数器的计数并启动看门狗监控所述主CPU;
步骤404,当计数器的计数持续递减至0时则触发系统复位;
步骤406,主CPU周期性发送数据包给第一从CPU,当每个从CPU拿到所述数据包后往下一个从CPU转发;
步骤408,最后一个从CPU逆向传递数据包至主CPU。
在本实施例中,提供了一种固态硬盘的多核异常监控方法,具体可参考图2所示,其实现步骤如下:
S0:CPU0初始化Watchdog计数器,设定其计数为T,并启动Watchdog监控。
S1:Watchdog持续递减当前的计数器,如果达到0,则触发系统复位。
S2:CPU0周期性发送数据包给第一个从模式的CPU1。
S3:每个从模式的CPU拿到该数据包后往下一个从模式的CPU转发。
S4:最后一个从模式的CPUn逆向传递该数据包。
S5:数据包返回到主模式CPU0。
S6:如果CPU0正确接收到返回的数据包,则重新设置Watchdog计数器;否则不设置,等待Watchdog超时复位。进一步地,若整个过程中CPU0出现异常,则会同传统单一CPU模式一样,触发Watchdog超时进行系统复位。
在本实施例中,将多核CPU系统进行主从模式划分,由Watchdog监控CPU0是否工作正常,若异常则触发系统复位,在CPU0工作正常的前提下,由CPU0对各个从CPU进行检测,通过定期发送数据包检查应答,若无应答则说明至少一个从CPU出现了异常,进而停止加载Watchdog计数器,触发系统复位。
在一个实施例中,在最后一个从CPU逆向传递所述数据包至主CPU的步骤之后还包括:若主CPU正确接收到返回的数据包,则重新设置看门狗计数器;否则停止更新看门狗计数器,等待看门狗超时进行系统复位。
在一个实施例中,在最后一个从CPU逆向传递所述数据包至主CPU的步骤之后还包括:若在所述数据包的传输过程中主CPU出现异常,则会触发看门狗超时进行系统复位。
参考图5所示,在本实施例中提供了一个完整的实现固态硬盘的多核异常监控方法,其具体的实现步骤如下:
步骤5.1、系统初始化,设定CPU主从模式(CPU0为主,其他为从)。
步骤5.2、CPU0初始化Watchdog,设置初始计数器值,并启动Watchdog。
步骤5.3、CPU0周期性发送数据包(下行)给从CPU1。
步骤5.4、CPU1接收到数据包(下行)后,转发给从CPU2。
步骤5.5、每个从CPU接收到数据包(下行)后,转发给其下一个从CPU。
步骤5.6、最后一个从CPU接收到数据包(下行)后,将其修改为数据包(上行),并转发给其前一个CPU。
步骤5.7、每个从CPU接收到数据包(上行)后,转发给其前一个CPU。
步骤5.8、主CPU等待接收返回的数据包(上行)。
步骤5.8.1、若没有接收到对应的返回数据包,停止更新Watchdog计数器,进而超时后Watchdog触发复位。
步骤5.8.2、若接收到对应的返回数据包,则继续步骤5.9。
步骤5.9、主CPU0是否工作正常。
步骤5.9.1、若工作异常,则超时后Watchdog触发复位。
步骤5.9.2、若工作正常,继续步骤5.10。
步骤5.10、CPU0重新设置Watchdog计数器。
步骤5.11、循环步骤5.3–步骤5.10。
在本实施例中,可在不增加硬件成本的基础上,实现对多核异常的监控,保障了可靠性。
应该理解的是,虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种固态硬盘的多核异常监控装置600,该装置包括:
获取模块601,所述获取模块用于获取固态硬盘的多核异常监控请求;
划分模块602,所述划分模块用于根据所述多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;
监控模块603,所述监控模块用于由看门狗监控所述主CPU是否工作正常,若所述主CPU发生异常则触发系统复位;
主从模块604,所述主从模块用于若所述主CPU工作正常,则由所述主CPU对各个从CPU进行检测;
触发模块605,所述触发模块用于所述主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
在一个实施例中,如图7所示,提供了一种固态硬盘的多核异常监控装置600,该装置还包括数据包传递模块606,所述数据包传递模块用于:
设定看门狗计数器的计数并启动看门狗监控所述主CPU;
当所述计数器的计数持续递减至0时则触发系统复位;
主CPU周期性发送数据包给第一从CPU,当每个从CPU拿到所述数据包后往下一个从CPU转发;
最后一个从CPU逆向传递所述数据包至主CPU。
在一个实施例中,数据包传递模块606还用于:
若主CPU正确接收到返回的数据包,则重新设置看门狗计数器;否则停止更新看门狗计数器,等待看门狗超时进行系统复位。
在一个实施例中,数据包传递模块606还用于:
若在所述数据包的传输过程中主CPU出现异常,则会触发看门狗超时进行系统复位。
关于固态硬盘的多核异常监控装置的具体限定可以参见上文中对于固态硬盘的多核异常监控方法的限定,在此不再赘述。
在一个实施例中,提供了一种计算机设备,其内部结构图可以如图8所示。该计算机设备包括通过装置总线连接的处理器、存储器以及网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作装置、计算机程序和数据库。该内存储器为非易失性存储介质中的操作装置和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种固态硬盘的多核异常监控方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以上各个方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以上各个方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种固态硬盘的多核异常监控方法,其特征在于,所述方法包括:
获取固态硬盘的多核异常监控请求;
根据所述多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;
由看门狗监控所述主CPU是否工作正常,若所述主CPU发生异常则触发系统复位;
若所述主CPU工作正常,则由所述主CPU对各个从CPU进行检测;
所述主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
2.根据权利要求1所述的固态硬盘的多核异常监控方法,其特征在于,所述方法还包括:
设定看门狗计数器的计数并启动看门狗监控所述主CPU;
当所述计数器的计数持续递减至0时则触发系统复位;
主CPU周期性发送数据包给第一从CPU,当每个从CPU拿到所述数据包后往下一个从CPU转发;
最后一个从CPU逆向传递所述数据包至主CPU。
3.根据权利要求2所述的固态硬盘的多核异常监控方法,其特征在于,在所述最后一个从CPU逆向传递所述数据包至主CPU的步骤之后还包括:
若主CPU正确接收到返回的数据包,则重新设置看门狗计数器;否则停止更新看门狗计数器,等待看门狗超时进行系统复位。
4.根据权利要求2所述的固态硬盘的多核异常监控方法,其特征在于,在所述最后一个从CPU逆向传递所述数据包至主CPU的步骤之后还包括:
若在所述数据包的传输过程中主CPU出现异常,则会触发看门狗超时进行系统复位。
5.一种固态硬盘的多核异常监控装置,其特征在于,所述装置包括:
获取模块,所述获取模块用于获取固态硬盘的多核异常监控请求;
划分模块,所述划分模块用于根据所述多核异常监控请求将多核CPU系统进行主从模式划分,包括一个主CPU和多个从CPU;
监控模块,所述监控模块用于由看门狗监控所述主CPU是否工作正常,若所述主CPU发生异常则触发系统复位;
主从模块,所述主从模块用于若所述主CPU工作正常,则由所述主CPU对各个从CPU进行检测;
触发模块,所述触发模块用于所述主CPU向各个从CPU定期发送数据包检查是否应答,若无应答则说明至少一个从CPU出现了异常并触发系统复位。
6.根据权利要求5所述的固态硬盘的多核异常监控装置,其特征在于,所述装置还包括数据包传递模块,所述数据包传递模块用于:
设定看门狗计数器的计数并启动看门狗监控所述主CPU;
当所述计数器的计数持续递减至0时则触发系统复位;
主CPU周期性发送数据包给第一从CPU,当每个从CPU拿到所述数据包后往下一个从CPU转发;
最后一个从CPU逆向传递所述数据包至主CPU。
7.根据权利要求6所述的固态硬盘的多核异常监控装置,其特征在于,所述数据包传递模块还用于:
若主CPU正确接收到返回的数据包,则重新设置看门狗计数器;否则停止更新看门狗计数器,等待看门狗超时进行系统复位。
8.根据权利要求6所述的固态硬盘的多核异常监控装置,其特征在于,所述数据包传递模块还用于:
若在所述数据包的传输过程中主CPU出现异常,则会触发看门狗超时进行系统复位。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN202110857427.3A 2021-07-28 2021-07-28 固态硬盘的多核异常监控方法、装置、计算机设备及存储介质 Pending CN113515429A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110857427.3A CN113515429A (zh) 2021-07-28 2021-07-28 固态硬盘的多核异常监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110857427.3A CN113515429A (zh) 2021-07-28 2021-07-28 固态硬盘的多核异常监控方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN113515429A true CN113515429A (zh) 2021-10-19

Family

ID=78068737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110857427.3A Pending CN113515429A (zh) 2021-07-28 2021-07-28 固态硬盘的多核异常监控方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113515429A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114020569A (zh) * 2021-11-02 2022-02-08 广州城建职业学院 一种大数据实时监控系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114020569A (zh) * 2021-11-02 2022-02-08 广州城建职业学院 一种大数据实时监控系统

Similar Documents

Publication Publication Date Title
CN108834086B (zh) 短信发送的方法、装置、计算机设备和存储介质
US8176365B2 (en) Computer apparatus and processor diagnostic method
US7574620B2 (en) Method for operating an arrangement of a plurality of computers in the event of a computer failure
WO2023115999A1 (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
US20160321127A1 (en) Determine when an error log was created
CN113515429A (zh) 固态硬盘的多核异常监控方法、装置、计算机设备及存储介质
CN116245305A (zh) 任务调度方法
JP2015069384A (ja) 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム
CN115904793B (zh) 一种基于多核异构系统的内存转存方法、系统及芯片
CN114817075B (zh) 一种进程间心跳检测方法及装置
US20200111539A1 (en) Information processing apparatus for repair management of storage medium
US9176806B2 (en) Computer and memory inspection method
CN111064636B (zh) 前置机连接的控制方法、装置、系统、计算机设备
CN117234787B (zh) 系统级芯片运行状态监控方法及系统
CN110879757B (zh) 客户端异常运行时的重启方法、装置和计算机设备
JP2010072995A (ja) 情報処理装置の保守管理方法、その装置及びそのプログラム
CN116483612B (zh) 内存故障处理方法、装置、计算机设备和存储介质
KR102213254B1 (ko) 단일 와치독 장치를 이용한 복수 개의 마이컴 에러 검출 방법 및 단일 와치독 장치
CN113486355B (zh) 一种信息保存装置、方法、通信装置、芯片及其模组设备
CN114327274A (zh) 基于固态硬盘的映射表加载检查方法、装置及计算机设备
CN116991559B (zh) 不可中断的睡眠状态进程的退出方法和装置
WO2022267812A1 (zh) 软件恢复方法、电子设备及存储介质
US20230350695A1 (en) Information processing device and profile tool control method
US11422876B2 (en) Systems and methods for monitoring and responding to bus bit error ratio events
CN117421038A (zh) 系统维护方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination