CN111143127B - 监管网络设备的方法、装置、存储介质及设备 - Google Patents

监管网络设备的方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN111143127B
CN111143127B CN201911337103.6A CN201911337103A CN111143127B CN 111143127 B CN111143127 B CN 111143127B CN 201911337103 A CN201911337103 A CN 201911337103A CN 111143127 B CN111143127 B CN 111143127B
Authority
CN
China
Prior art keywords
vcpu
working state
abnormal
kernel thread
protection mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911337103.6A
Other languages
English (en)
Other versions
CN111143127A (zh
Inventor
郑磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou DPTech Technologies Co Ltd
Original Assignee
Hangzhou DPTech Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou DPTech Technologies Co Ltd filed Critical Hangzhou DPTech Technologies Co Ltd
Priority to CN201911337103.6A priority Critical patent/CN111143127B/zh
Publication of CN111143127A publication Critical patent/CN111143127A/zh
Application granted granted Critical
Publication of CN111143127B publication Critical patent/CN111143127B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Abstract

本说明书提供一种监管网络设备的方法、装置、存储介质及设备。该方法中,由具有保护机制的VCPU创建内核线程,通过该内核线程监控其他VCPU的工作状态,当监控到其他VCPU出现异常、且持续异常时间超过预设值时,由于保护机制具有重启系统的能力,因此可以利用保护机制在其他VCPU出现故障时重启系统,在只有一个监控芯片保护执行管理任务的VCPU时,实现对其他没有保护机制的VCPU的监管,缓解了其他VCPU出现异常造成的设备故障和业务事故的情况。

Description

监管网络设备的方法、装置、存储介质及设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种监管网络设备的方法、装置、存储介质及设备。
背景技术
随着网络技术的发展,人们对网络设备的性能有着越来越严格的要求。在处理复杂任务时,普通使用的是具有多核处理器的网络设备。组成每个核的每个线程相当于一个虚拟CPU(VCPU),多核处理器包含了多个VCPU。通常情况下,这类网络设备会通过一个保护机制监控着执行管理任务的VCPU,比如硬件看门狗,而其他VCPU是没有保护机制的。然而,由于当今网络设备所处理的业务越来越复杂化,其他VCPU执行的工作任务也越来越重要,一旦这些VCPU出现工作异常,那么其工作任务势必无法完成,还容易造成网络设备瘫痪。
发明内容
为克服相关技术中存在的问题,本说明书提供了一种监管网络设备的方法、装置、存储介质及设备。
根据本说明书实施例的第一方面,提供一种监管网络设备的方法,所述网络设备具有多核处理器,所述方法包括:
创建一内核线程,所述内核线程通过具有保护机制的第一VCPU创建,并利用所述内核线程监控第二VCPU的工作状态;
当监控到所述第二VCPU的工作状态为异常、且持续异常时间超过预设值时,基于所述保护机制重启系统。
在某些例子中,上述利用所述内核线程监控第二VCPU的工作状态包括:
利用所述内核线程周期性通知第二VCPU执行计数任务;
根据所述第二VCPU的计数结果与所发的通知数是否一致确定所述第二VCPU的工作状态是否异常。
在某些例子中,上述根据所述第二VCPU的计数结果与所发的通知数是否一致确定所述第二VCPU的工作状态是否异常,包括:
在通知第二VCPU执行计数任务后,所述内核线程获取第二VCPU的计数结果并记录;
如果所述计数结果的当前值与上一次所获取的计数结果的值相同,则确定所述第二VCPU工作状态为异常,如果不同,则确定所述第二VCPU工作状态为正常。
在某些例子中,上述利用所述内核线程监控第二VCPU的持续异常时间包括:
从首次确定所述第二VCPU工作状态为异常开始,统计工作状态异常的次数,所述预设值表征允许工作状态异常的上限值。
在某些例子中,当确定所述第二VCPU工作状态为正常时,清除所统计的工作状态异常的次数。
在某些例子中,上述方法还包括:
提供一接口,以使其他业务模块通过调用所述接口更改所统计的工作状态异常的次数。
在某些例子中,上述重启系统之前,包括:
所述内核线程通知所述第二VCPU执行中断处理,以使所述第二VCPU记录当前寄存器信息,并保存在外部存储器中。
根据本说明书实施例的第二方面,提供一种监管网络设备的装置,所述所述网络设备具有多核处理器,所述装置包括:
监控模块,用于创建一内核线程,所述内核线程通过具有保护机制的第一VCPU创建,并利用所述内核线程监控第二VCPU的工作状态;
重启模块,用于当监控到所述第二VCPU的工作状态为异常、且持续异常时间超过预设值时,基于所述保护机制重启系统。
根据本说明书实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现说明书实施例中任一项方法。
根据本说明书实施例的第四方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现说明书实施例中任一项方法。
本说明书的实施例提供的技术方案可以包括以下有益效果:
本说明书实施例中,公开了一种监管网络设备的方法、装置、存储介质及设备。该方法中,由具有保护机制的VCPU创建内核线程,通过该内核线程监控其他VCPU的工作状态,当监控到其他VCPU出现异常、且持续异常时间超过预设值时,由于保护机制具有重启系统的能力,因此可以利用保护机制在其他VCPU出现故障时重启系统,在只有一个监控芯片保护执行管理任务的VCPU时,实现对其他没有保护机制的VCPU的监管,缓解了其他VCPU出现异常造成的设备故障和业务事故的情况。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1是本说明书根据一示例性实施例示出的一种监管网络设备的方法的流程图;
图2是本说明书根据一示例性实施例示出的一种监管网络设备的方法的示意图;
图3是本说明书实施例监管网络设备的装置所在计算机设备的一种硬件结构图;
图4是本说明书根据一示例性实施例示出的一种监管网络设备的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
核心,又称为内核,是CPU最重要的组成部分,CPU所有的计算、接受/存储命令、处理数据都由核心执行。处理器的核心数一般指的就是物理核心数,双核就是包括2个独立的CPU核心单元组,四核就是包括4个独立的CPU核心单元组。多核处理器,就是指在一枚处理器中集成两个或多个完整的计算引擎(内核),能提供比单核处理器更好的性能和效率。相关技术中,多核处理器是基于多线程机制处理任务,通过超线程技术,将一个核心做到两个或多个线程计算,此时,组成每个核心的每个线程相当于一个虚拟CPU(VCPU)。
现有的网络设备为处理复杂的任务,往往使用的是多核处理器,其中,每个VCPU执行各自分配到的任务,相互隔离独自运行。相关技术中,这类网络设备会通过一个保护机制监控着执行管理任务的VCPU,而其他VCPU是没有保护机制的。这种情况下,如果某个没有保护机制的VCPU发生死锁、死循环、跑飞等工作异常,那么该VCPU执行的任务就无法完成,还容易造成网络系统的崩溃。因此,往往会造成很严重的设备故障和业务事故。
接下来对本说明书实施例进行详细说明。
如图1所示,图1是本说明书根据一示例性实施例示出的一种监管网络设备的方法,所述网络设备具有多核处理器,所述方法包括:
在步骤101、创建一内核线程,所述内核线程通过具有保护机制的第一VCPU创建,并利用所述内核线程监控第二VCPU的工作状态;
在步骤102、当监控到所述第二VCPU的工作状态为异常、且持续异常时间超过预设值时,基于所述保护机制重启系统。
线程通常被定义为一个进程中代码的不同执行路线,一个进程可包含多个线程,从实现方式上,可分为用户线程和内核线程两种类型。与不需要内核支持而在用户程序中实现的用户线程不同,内核线程是指:需要内核的参与,由内核完成线程的调度。在某些例子中,步骤101可以是指:执行管理任务的VCPU创建一个内核线程,利用该内核线程监控其他VCPU的工作状态,而其自身工作状态的监控基于保护机制实现。在某些例子中,步骤101中的保护机制可以是指:硬件看门狗机制。看门狗,属于监控芯片的一种,其本质上是一个定时器电路,该电路的输入叫做喂狗,输出一般连接到另外一个部分的复位端,一般是连接到单片机。稳定运行的软件会在执行完特定指令后进行喂狗,若在一定周期内看门狗没有收到来自软件的喂狗信号,则认为系统故障,会进入中断处理程序或强制系统复位。
在某些例子中,步骤101中提到的利用所述内核线程监控第二VCPU的工作状态可以包括:利用所述内核线程周期性通知第二VCPU执行计数任务;根据所述第二VCPU的计数结果与所发的通知数是否一致确定所述第二VCPU的工作状态是否异常。本步骤中,第一VCPU利用内核线程向第二VCPU周期性发送计数任务,第二VCPU创建一单工作队列,当第二VCPU工作正常时,第二VCPU将计数任务在该单工作队列中执行,每次执行任务后其计数结果加1,当第二VCPU出现死锁、死循环、跑飞等异常时,该单工作队列无法工作,其计数结果保持不变。因此,第二VCPU保持正常工作时,其计数结果应当与内核线程发送的通知数相同,也就是说,当第二VCPU的计数结果与所发的通知数一致时,确定第二VCPU的工作状态正常,反之则异常。另外,这里提到的周期可以是1秒,也可以是2秒、1分钟等,其可以根据具体场景的需求进行设置。以周期是1秒为例,当内核线程发送计数任务后,当确定第二VCPU的工作状态正常时,内核线程进行睡眠,睡眠1秒后执行发送下一个计数任务,从而实现对第二VCPU的定时监控。
在某些例子中,第二VCPU的计数结果与所发的通知数是否一致,也可以通过第二VCPU的计数结果的变化值推导出来。在通知第二VCPU执行计数任务后,内核线程获取第二VCPU的计数结果并记录,如果所述计数结果的当前值与上一次所获取的计数结果的值相同,则确定所述第二VCPU工作状态为异常,如果不同,则确定所述第二VCPU工作状态为正常。例如,以change表示第二VCPU的计数结果,假定上一次获取的change的值为50,在通知第二VCPU执行计数任务后,若第二VCPU工作状态正常,则当前获得的change的值为51;若第二VCPU工作状态异常,则当前获得的change的值仍为50。
当首次确定第二VCPU的工作状态为异常时,并不能立即认为第二VCPU处于严重异常,其可能是处于被当前任务占用的状态。因此,为避免偶然性,只有监控到第二VCPU处于长时间异常状态时,才能确认第二VCPU严重异常,需要特殊处理。因此,步骤102中提到的预设值表征允许工作状态异常的上限值。在某些例子中,利用内核线程监控第二VCPU的持续异常时间可以包括:从首次确定所述第二VCPU工作状态为异常开始,统计工作状态异常的次数。由于多核处理器中多个VCPU所执行的任务各不相同,各个VCPU对于允许VCPU长时间占用的标准也不同,因此,这里的预设值可以根据具体场景,包括多核处理器的型号、处理的业务内容等进行配置。
沿用前面提到的change为例,并将工作状态异常的次数记为count,假定上一次获取的change的值为50,当前获取的change的值也为50,确定第二VCPU工作状态为异常,此时count为1;当下一次获取的change的值仍为50时,统计得count为2,以此类推,当count的值超过预设值时,重启系统。然而,在count的值超过预设值之前,当下一次获取的change的值为51时,说明第二VCPU的单工作队列执行了计数任务,即确定第二VCPU工作状态为正常,则清除统计的工作状态异常的次数,count为0。当第二VCPU工作状态持续正常时,count的值保持为0。在网络系统中,有一些工作任务是需要长时间占用CPU的,为避免这些任务误触发count的值超过预设值而造成系统重启,本说明书实施例还包括步骤:提供一接口,以使其他业务模块通过调用所述接口更改所统计的工作状态异常的次数。也就是说,本说明书实施例支持其他业务模块通过调用接口的方式对count进行赋值操作。
本领域技术人员可以理解的,当多核处理器中还包括了第三VCPU、第四VCPU时,本说明书实施例的方法仍然适用。第一VCPU对第三VCPU、第四VCPU进行监管时,其处理步骤与对第二VCPU的相应的一致。
本说明实施例,由具有保护机制的VCPU创建内核线程,通过该内核线程监控其他VCPU的工作状态,当监控到其他VCPU出现异常、且持续异常时间超过预设值时,基于具有重启系统能力的保护机制在其他VCPU出现故障时重启系统,在只有一个监控芯片保护执行管理任务的VCPU时,实现对其他没有保护机制的VCPU的监管,使得VCPU出现死锁、死循环、跑飞等异常时,网络设备能够重启系统、自行恢复业务,从而避免出现严重设备故障和业务事故的情况。
另外,相关技术中,VCPU工作异常的问题定位较为困难,从而导致开发人员解决设备隐患时效率低,为解决这一问题,本说明书实施例在步骤102中重启系统之前,还包括步骤:内核线程通知第二VCPU执行中断处理,以使所述第二VCPU记录当前寄存器信息,并保存在外部存储器中。这一步骤中,由第二VCPU注册核间中断,并等待接收核间中断,当第二VCPU接收到该核间中断时,第二VCPU执行记录当前寄存器信息,并保存到外部存储器中的响应操作。则第一VCPU监控到第二VCPU的工作状态为异常、且持续异常时间超过预设值时,发送核间中断给第二VCPU,以使第二VCPU执行该响应操作。由于记录的寄存器信息保存在外部存储器中,重启系统也不会被擦除,而且这些信息可以帮助开发人员快速定位异常问题,进而解决隐患,提高了效率。
为方便理解本说明书实施例的方法,接下来将以一较优实施例进行阐述。如图2所示,图2是本说明书根据一示例性实施例示出的一种监管网络设备的方法的示意图,所述网络设备包括多核处理器,多核处理器包含了多个VCPU,其中,以vcpu0表示执行管理任务的VCPU,由于执行特定任务的其他VCPU的处理过程类似,以vcpu1表示其他VCPU。其中:
所述vcpu1的流程包括:创建一单工作队列,接收vpu0发送的计数任务在该单工作队列中执行,并统计执行计数任务的次数,计数结果记为change;以及,注册核间中断,等待接收核间中断,当接收到核间中断时,执行记录当前寄存器信息并保存在外部存储器中的操作。
所述vcpu0的流程即为本说明书实施例示出的对网络设备中VCPU的监管流程,包括:
S201、基于硬件看门狗机制监控vcpu0自身的工作状态;
S202、创建一内核线程,基于该内核线程完成对vcpu1的监管工作;
S203、内核线程将指定变量count赋值为0,这一指定变量用于统计vcpu1工作状态异常的次数;
S204、当count的值为0时,跳转到S208,否则执行S205;
S205、内核线程获取vcpu1当前的计数结果change,记为change1;
S206、内核线程比较change1和vcpu1上一次的计数结果change0,当change1和change0不相等时,说明vcpu1在正常运行,跳转到S203;当change1和change0相等时,说明vcpu1处于异常或者被占用,执行S207;
S207、内核线程执行count加1操作;
S208、内核线程将表示vcpu1上一次计数结果的change0赋值为change1的值;
S209、内核线程向vcpu1的单工作队列发送计数任务;
S210、内核线程比较count和预设值time,当count小于或等于time时,内核线程睡眠1秒后执行S205;当count大于time时,执行S211;
S211、内核线程向vcpu1发送核间中断;
S212、基于硬件看门狗机制重启系统,恢复业务。
本说明书实施例中,当任一VCPU出现死锁、死循环、跑飞等异常时,网络设备都能够自行恢复,且记录的信息可以为开发人员解决隐患提供快速定位异常问题的帮助。
与前述方法的实施例相对应,本说明书还提供了监管网络设备的装置及其所应用的终端的实施例。
本说明书监管网络设备的装置的实施例可以应用在计算机设备上,例如服务器或终端设备。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在文件处理的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图3所示,为本说明书实施例监管网络设备的装置所在计算机设备的一种硬件结构图,除了图3所示的处理器510、内存530、网络接口520、以及非易失性存储器540之外,实施例中装置531所在的服务器或电子设备,通常根据该计算机设备的实际功能,还可以包括其他硬件,对此不再赘述。
相应地,本说明书实施例还提供一种计算机存储介质,所述存储介质中存储有程序,所述程序被处理器执行时实现上述任一实施例中的方法。
本说明书实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
如图4所示,图4是本说明书根据一示例性实施例示出的一种监管网络设备的装置的框图,所述网络设备具有多核处理器,所述装置包括:
监控模块41,用于创建一内核线程,所述内核线程通过具有保护机制的第一VCPU创建,并利用所述内核线程监控第二VCPU的工作状态;
重启模块42,用于当监控到所述第二VCPU的工作状态为异常、且持续异常时间超过预设值时,基于所述保护机制重启系统。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (8)

1.一种监管网络设备的方法,所述网络设备具有多核处理器,其特征在于,所述方法包括:
创建一内核线程,所述内核线程通过具有保护机制的第一VCPU创建,并利用所述内核线程监控第二VCPU的工作状态;
当监控到所述第二VCPU的工作状态为异常、且持续异常时间超过预设值时,基于所述保护机制重启系统;
利用所述内核线程监控第二VCPU的持续异常时间包括:
从首次确定所述第二VCPU工作状态为异常开始,统计工作状态异常的次数,所述预设值表征允许工作状态异常的上限值;
所述方法还包括:
提供一接口,以使其他业务模块通过调用所述接口更改所统计的工作状态异常的次数。
2.根据权利要求1所述的方法,其特征在于,利用所述内核线程监控第二VCPU的工作状态包括:
利用所述内核线程周期性通知第二VCPU执行计数任务;
根据所述第二VCPU的计数结果与所发的通知数是否一致确定所述第二VCPU的工作状态是否异常。
3.根据权利要求2所述的方法,其特征在于,根据所述第二VCPU的计数结果与所发的通知数是否一致确定所述第二VCPU的工作状态是否异常,包括:
在通知第二VCPU执行计数任务后,所述内核线程获取第二VCPU的计数结果并记录;
如果所述计数结果的当前值与上一次所获取的计数结果的值相同,则确定所述第二VCPU工作状态为异常,如果不同,则确定所述第二VCPU工作状态为正常。
4.根据权利要求1所述的方法,其特征在于,当确定所述第二VCPU工作状态为正常时,清除所统计的工作状态异常的次数。
5.根据权利要求1所述的方法,其特征在于,所述重启系统之前,包括:
所述内核线程通知所述第二VCPU执行中断处理,以使所述第二VCPU记录当前寄存器信息,并保存在外部存储器中。
6.一种监管网络设备的装置,所述网络设备具有多核处理器,其特征在于,所述装置包括:
监控模块,用于创建一内核线程,所述内核线程通过具有保护机制的第一VCPU创建,并利用所述内核线程监控第二VCPU的工作状态;
重启模块,用于当监控到所述第二VCPU的工作状态为异常、且持续异常时间超过预设值时,基于所述保护机制重启系统;
所述监控模块具体用于从首次确定所述第二VCPU工作状态为异常开始,统计工作状态异常的次数,所述预设值表征允许工作状态异常的上限值;
所述监控模块还用于提供一接口,以使其他业务模块通过调用所述接口更改所统计的工作状态异常的次数。
7.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1~5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1~5任一项所述的方法。
CN201911337103.6A 2019-12-23 2019-12-23 监管网络设备的方法、装置、存储介质及设备 Active CN111143127B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911337103.6A CN111143127B (zh) 2019-12-23 2019-12-23 监管网络设备的方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911337103.6A CN111143127B (zh) 2019-12-23 2019-12-23 监管网络设备的方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN111143127A CN111143127A (zh) 2020-05-12
CN111143127B true CN111143127B (zh) 2023-09-26

Family

ID=70519413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911337103.6A Active CN111143127B (zh) 2019-12-23 2019-12-23 监管网络设备的方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN111143127B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116547612A (zh) * 2021-09-26 2023-08-04 宁德时代新能源科技股份有限公司 一种生产系统的异常检测方法及装置、生产线设备

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149417A (ja) * 2000-11-15 2002-05-24 Hitachi Ltd レジスタ退避・回復方法
CN1734427A (zh) * 2004-08-02 2006-02-15 微软公司 基于事务处理的性能模型的自动化确认和校准
WO2006076853A1 (fr) * 2005-01-18 2006-07-27 Huawei Technologies Co., Ltd. Procede de traitement multifiliere/multitache/multiprocesseur
CN101042669A (zh) * 2006-06-28 2007-09-26 华为技术有限公司 一种系统信息记录的方法及装置
CN101996106A (zh) * 2010-12-17 2011-03-30 南京中兴力维软件有限公司 一种对软件运行状态进行监控的方法
CN102073572A (zh) * 2009-11-24 2011-05-25 中兴通讯股份有限公司 用于多核处理器的监控方法及系统
CN103246589A (zh) * 2012-02-03 2013-08-14 京信通信系统(中国)有限公司 一种多线程的监控方法及装置
CN103684862A (zh) * 2013-12-06 2014-03-26 大唐移动通信设备有限公司 告警消息的处理方法、装置、系统以及设备
CN106354575A (zh) * 2016-08-12 2017-01-25 中国航空工业集团公司西安飞行自动控制研究所 一种基于堆栈追溯的故障排查装置和方法
CN106407032A (zh) * 2016-09-18 2017-02-15 深圳震有科技股份有限公司 一种基于多核系统的硬件看门狗控制方法及系统
CN106502356A (zh) * 2016-10-20 2017-03-15 广州视源电子科技股份有限公司 智能穿戴设备的复位方法与系统
CN108694093A (zh) * 2017-04-06 2018-10-23 迈普通信技术股份有限公司 进程异常监控方法及装置
CN108710544A (zh) * 2018-03-20 2018-10-26 青岛海信网络科技股份有限公司 一种数据库系统的进程监控方法及轨道交通综合监控系统
CN109597719A (zh) * 2018-12-10 2019-04-09 浪潮(北京)电子信息产业有限公司 一种多核系统的监控方法、系统、装置及可读存储介质
CN110032487A (zh) * 2018-11-09 2019-07-19 阿里巴巴集团控股有限公司 保活监控方法、装置及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080177994A1 (en) * 2003-01-12 2008-07-24 Yaron Mayer System and method for improving the efficiency, comfort, and/or reliability in Operating Systems, such as for example Windows
CN101354663A (zh) * 2007-07-25 2009-01-28 联想(北京)有限公司 应用于虚拟机系统的真实cpu资源的调度方法及调度装置
CN101561764B (zh) * 2009-05-18 2012-05-23 华为技术有限公司 一种多核环境下的补丁方法与补丁装置
KR101283809B1 (ko) * 2009-08-04 2013-07-08 후지쯔 가부시끼가이샤 리셋 방법 및 감시 장치
US9552206B2 (en) * 2010-11-18 2017-01-24 Texas Instruments Incorporated Integrated circuit with control node circuitry and processing circuitry
US9459601B2 (en) * 2013-04-10 2016-10-04 Starfield Lighting Automation Llc Multi-sensor, event based occupancy determination and load management system

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149417A (ja) * 2000-11-15 2002-05-24 Hitachi Ltd レジスタ退避・回復方法
CN1734427A (zh) * 2004-08-02 2006-02-15 微软公司 基于事务处理的性能模型的自动化确认和校准
WO2006076853A1 (fr) * 2005-01-18 2006-07-27 Huawei Technologies Co., Ltd. Procede de traitement multifiliere/multitache/multiprocesseur
CN101042669A (zh) * 2006-06-28 2007-09-26 华为技术有限公司 一种系统信息记录的方法及装置
CN102073572A (zh) * 2009-11-24 2011-05-25 中兴通讯股份有限公司 用于多核处理器的监控方法及系统
CN101996106A (zh) * 2010-12-17 2011-03-30 南京中兴力维软件有限公司 一种对软件运行状态进行监控的方法
CN103246589A (zh) * 2012-02-03 2013-08-14 京信通信系统(中国)有限公司 一种多线程的监控方法及装置
CN103684862A (zh) * 2013-12-06 2014-03-26 大唐移动通信设备有限公司 告警消息的处理方法、装置、系统以及设备
CN106354575A (zh) * 2016-08-12 2017-01-25 中国航空工业集团公司西安飞行自动控制研究所 一种基于堆栈追溯的故障排查装置和方法
CN106407032A (zh) * 2016-09-18 2017-02-15 深圳震有科技股份有限公司 一种基于多核系统的硬件看门狗控制方法及系统
CN106502356A (zh) * 2016-10-20 2017-03-15 广州视源电子科技股份有限公司 智能穿戴设备的复位方法与系统
CN108694093A (zh) * 2017-04-06 2018-10-23 迈普通信技术股份有限公司 进程异常监控方法及装置
CN108710544A (zh) * 2018-03-20 2018-10-26 青岛海信网络科技股份有限公司 一种数据库系统的进程监控方法及轨道交通综合监控系统
CN110032487A (zh) * 2018-11-09 2019-07-19 阿里巴巴集团控股有限公司 保活监控方法、装置及电子设备
CN109597719A (zh) * 2018-12-10 2019-04-09 浪潮(北京)电子信息产业有限公司 一种多核系统的监控方法、系统、装置及可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于微控制器的分布式监控终端设计;黄志强;王成福;唐晓强;;仪表技术与传感器(05);第58-59、73页 *
基于软件开发过程数据的可视化产品质量监控工具;潘森;林云;彭鑫;赵文耘;;计算机应用与软件(09);第8-12页 *
武马群.《汇编程序设计》.电子科技大学出版本社,1994,(第第1版版),第207页. *
电动汽车驱动装置测试与仿真系统软件的研究;罗立元, 何鸿肃, 王鸿贵, 梁秀玲, 姚震, 刘方铭;广东工业大学学报(04);第14-19页 *

Also Published As

Publication number Publication date
CN111143127A (zh) 2020-05-12

Similar Documents

Publication Publication Date Title
US5815651A (en) Method and apparatus for CPU failure recovery in symmetric multi-processing systems
US7493477B2 (en) Method and apparatus for disabling a processor core based on a number of executions of an application exceeding a threshold
RU2437144C2 (ru) Способ устранения исключительной ситуации в одном из ядер многоядерной системы
CN108121630B (zh) 电子装置、重新启动方法及记录媒介
CN109064327B (zh) 一种智能合约处理方法、装置及设备
US20170147422A1 (en) External software fault detection system for distributed multi-cpu architecture
US9459949B2 (en) Methods and apparatus to provide failure detection
CN109144873B (zh) 一种linux内核处理方法及装置
US20150006978A1 (en) Processor system
CN111209164B (zh) 异常信息存储方法及装置、电子设备、存储介质
CN111143127B (zh) 监管网络设备的方法、装置、存储介质及设备
JP5623557B2 (ja) 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム
CN102708015A (zh) 基于cpu不可屏蔽中断系统问题诊断的调试方法
CN113220535A (zh) 程序异常的处理方法、装置、设备及存储介质
CN113590285A (zh) 一种用于线程池参数动态设置的方法、系统及设备
CN109446034B (zh) 上报崩溃事件的方法、装置、计算机设备及存储介质
CN113064765B (zh) 节点异常处理方法、装置、电子设备及机器可读存储介质
CN115576734A (zh) 一种多核异构日志存储方法和系统
JPH02294739A (ja) 障害検出方式
JP2006227962A (ja) アプリケーションタスク監視システムおよび方法
US9176806B2 (en) Computer and memory inspection method
TWI736564B (zh) 用於診斷執行指令串流的處理器之方法、設備、及系統
CN116991559B (zh) 不可中断的睡眠状态进程的退出方法和装置
CN108415788B (zh) 用于对无响应处理电路作出响应的数据处理设备和方法
CN117234848A (zh) 一种进程监控方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant