CN107819617B - 一种通信设备的监控方法和通信设备 - Google Patents

一种通信设备的监控方法和通信设备 Download PDF

Info

Publication number
CN107819617B
CN107819617B CN201711057121.XA CN201711057121A CN107819617B CN 107819617 B CN107819617 B CN 107819617B CN 201711057121 A CN201711057121 A CN 201711057121A CN 107819617 B CN107819617 B CN 107819617B
Authority
CN
China
Prior art keywords
board
standby
main
main board
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711057121.XA
Other languages
English (en)
Other versions
CN107819617A (zh
Inventor
李秉荣
方彬浩
陈炳锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Comba Network Systems Co Ltd
Original Assignee
Comba Network Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Comba Network Systems Co Ltd filed Critical Comba Network Systems Co Ltd
Priority to CN201711057121.XA priority Critical patent/CN107819617B/zh
Publication of CN107819617A publication Critical patent/CN107819617A/zh
Application granted granted Critical
Publication of CN107819617B publication Critical patent/CN107819617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Abstract

本发明实施例提供一种通信设备的监控方法和通信设备。在通信设备的监控方法中,通信设备包括数字板组,用于监控通信设备运行,数字板组中包括一个主用板和至少一个备用板,方法包括:通过主用板对主用板进行硬件状态监控,获得第一监控结果,根据第一监控结果确定主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,选取第一备用板对数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板。

Description

一种通信设备的监控方法和通信设备
技术领域
本发明涉及通信设备领域,尤其涉及一种通信设备的监控方法和通信设备。
背景技术
随着通信技术的不断发展和广泛应用,通信设备在人们的生产生活中扮演着越来越重要的角色。例如,数字射频拉远设备广泛应用于移动通信网络中,为各地无线信号覆盖提供技术保障。
目前,当通信设备出现故障时,需要技术人员立即对故障进行修复,当无法修复故障时需要重新更换设备。整个修复或更换的过程中通信设备都无法正常工作,并且耗时较长,导致通信网络在较长时间内无法正常通信。
在一些对通信传输的可靠性要求比较严格的场合,如铁路调度系统等,不允许通信传输出现长时间的中断。为此,现有技术中在一些通信设备上对整套硬件装置进行了冗余备份,当处于工作状态的一套硬件装置出现故障时,将出现故障的硬件装置上的任务完全切换到冗余的硬件装置上,以保障通信设备能够在较短时间内恢复运行。
然而,现有技术中对整套硬件装置进行冗余备份的方式中,实现硬件装置切换的耗时仍然较长,并且,无法保证及时地发现处于工作状态的硬件装置出现的故障,可靠性较低。
发明内容
本发明实施例提供一种通信设备的监控方法和通信设备,用以解决现有技术中通信设备发生故障时无法及时恢复正常通信,可靠性低的技术问题。
第一方面,提供一种通信设备的监控方法,所述通信设备包括数字板组,用于监控所述通信设备运行,所述数字板组中包括一个主用板和至少一个备用板,所述方法包括:
通过主用板对所述主用板进行硬件状态监控,获得第一监控结果,根据所述第一监控结果确定所述主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
选取第一备用板对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定所述主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
在一种可能的实现方式中,所述方法还包括:
通过所述主用板对所述至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定所述至少一个备用板中存在软件工作状态异常的备用板时,修复所述存在软件工作状态异常的备用板。
在一种可能的实现方式中,选取第一备用板对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,包括:
通过所述第一备用板周期性地执行以下操作:向所述主用板发送第一心跳确认信息,并确定是否在发送所述第一心跳确认信息后的第一预设时长内接收到所述主用板发送的第一心跳响应信息,以生成所述第二监控结果;
通过所述主用板对所述至少一个备用板进行软件状态监控,获得第三监控结果,包括:
通过所述主用板针对所述至少一个备用板中的任一备用板周期性地执行以下操作:向所述任一备用板发送第二心跳确认信息,并确定是否在发送所述第二心跳确认信息后的第二预设时长内接收到所述任一备用板发送的第二心跳响应信息,以生成所述第三监控结果。
在一种可能的实现方式中,所述通信设备还包括至少一组功能模块,所述至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,所述方法还包括:
通过主用板对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据所述第四监控结果确定所述至少一组功能模块中的第一主用功能模块发生异常时,从所述第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将所述第一主用功能模块设置为新的备用功能模块。
在一种可能的实现方式中,所述通信设备还包括与所述数字板组连接的逻辑器件,通过主用板对所述主用板进行硬件状态监控,获得第一监控结果,包括:
通过所述主用板周期性地执行以下操作:从所述逻辑器件读取所述主用板的数字板状态信息,并根据所述数字板状态信息确定所述主用板的硬件工作状态是否发生异常,以生成所述第一监控结果;
所述逻辑器件还与所述至少一组功能模块连接,通过主用板对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,包括:
通过所述主用板针对所述至少一组功能模块中的任一组功能模块周期性地执行以下操作:从所述逻辑器件中读取所述任一组功能模块中的主用功能模块的功能模块状态信息,并根据所述功能模块状态信息,确定所述任一组功能模块中的主用功能模块是否发生异常,以生成所述第四监控结果。
在一种可能的实现方式中,所述通信设备包括与所述数字板组连接的逻辑器件,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板,包括:
硬件工作状态发生异常的主用板向所述逻辑器件发送第一切换指令,所述第一切换指令用于指示所述逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使所述选取的一个备用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,硬件工作状态发生异常的主用板切换自身的工作模式为备用板;
将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,包括:
所述第一备用板向所述逻辑器件发送第二切换指令,所述第二切换指令用于指示所述逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,所述第一备用板将所述第二备用板的工作模式切换为主用板。
第二方面,提供一种通信设备,所述通信设备包括数字板组,用于监控所述通信设备运行,所述数字板组中包括一个主用板和至少一个备用板,其中:
所述主用板,用于对所述主用板进行硬件状态监控,获得第一监控结果,根据所述第一监控结果确定所述主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
第一备用板,用于对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定所述主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
在一种可能的实现方式中,所述主用板还用于:
对所述至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定所述至少一个备用板中存在软件工作状态异常的备用板时,修复所述存在软件工作状态异常的备用板。
在一种可能的实现方式中,所述第一备用板用于:
周期性地执行以下操作:向所述主用板发送第一心跳确认信息,并确定是否在发送所述第一心跳确认信息后的第一预设时长内接收到所述主用板发送的第一心跳响应信息,以生成所述第二监控结果;
所述主用板用于:
针对所述至少一个备用板中的任一备用板周期性地执行以下操作:向所述任一备用板发送第二心跳确认信息,并确定是否在发送所述第二心跳确认信息后的第二预设时长内接收到所述任一备用板发送的第二心跳响应信息,以生成所述第三监控结果。
在一种可能的实现方式中,所述通信设备还包括至少一组功能模块,所述至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,所述主用板还用于:
对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据所述第四监控结果确定所述至少一组功能模块中的第一主用功能模块发生异常时,从所述第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将所述第一主用功能模块设置为新的备用功能模块。
在一种可能的实现方式中,所述通信设备还包括与所述数字板组连接的逻辑器件,所述主用板用于:
周期性地执行以下操作:从所述逻辑器件读取所述主用板的数字板状态信息,并根据所述数字板状态信息确定所述主用板的硬件工作状态是否发生异常,以生成所述第一监控结果;
所述逻辑器件还与所述至少一组功能模块连接,所述主用板用于:
针对所述至少一组功能模块中的任一组功能模块周期性地执行以下操作:从所述逻辑器件中读取所述任一组功能模块中的主用功能模块的功能模块状态信息,并根据所述功能模块状态信息,确定所述任一组功能模块中的主用功能模块是否发生异常,以生成所述第四监控结果。
在一种可能的实现方式中,所述通信设备包括与所述数字板组连接的逻辑器件,硬件工作状态发生异常的主用板用于:
向所述逻辑器件发送第一切换指令,所述第一切换指令用于指示所述逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使所述选取的一个备用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,切换自身的工作模式为备用板;
所述第一备用板用于:
向所述逻辑器件发送第二切换指令,所述第二切换指令用于指示所述逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,将所述第二备用板的工作模式切换为主用板。
第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被加载并运行时,执行如第一方面所述的方法的步骤。
本发明实施例中,通信设备包括有用于监控通信设备的数字板组,该数字板组中包括一个主用板和至少一个备用板,主用板和备用板互为备份,因而,在当前的主用板发生故障时,能够进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,主用板对自身的硬件状态进行监控,当确定主用板的硬件状态发生异常时,主用板可以主动地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,选取第一备用板对主用板进行软件状态监控,当确定主用板的软件工作状态发生异常时,可以及时地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,通过对主用板在硬件状态和软件状态的全方位监视,可以及时有效地发现主用板发生的故障,以在最短的时间内启动主用板和备用板的切换,提高通信设备的可靠性。
进一步地,本发明实施例中,当主用板发生故障时,仅仅对主用板和备用板进行切换,其它的硬件装置无需进行切换,使得整个切换的过程耗时更短,能够更为快速地恢复正常通信。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例中一种通信设备的结构示意图;
图2为本发明实施例中一种通信设备的监控方法中主用板监控主用板部分的流程示意图;
图3为本发明实施例中一种通信设备的监控方法中备用板监控主用板部分的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
实施例一
本发明实施例提供一种通信设备的监控方法。其中,通信设备可以是数字射频拉远设备、基站设备、直放站、用户设备等可以进行通信的设备,本发明实施例对通信设备的具体类型不做限制。
例如,该通信可以为图1所示的通信设备,在图1所举例的通信设备中,包括数字板组,两组功能模块;其中,该数字板组中包括2个数字板,分别为主用板和备用板,第一组功能模块中包括2个第一种功能模块,分别为第一种主用功能模块和第一种备用功能模块,第二组功能模块中包括2个第二种功能模块,分别为第二种主用功能模块和第二种备用功能模块。
通信设备中包括有数字板组,该数字板组用于监控通信设备的运行,例如,对通信设备包括的功能模块进行监控。该数字板组中包括一个主用板和至少一个备用板,其中,主用板和备用板式可以是根据数字板的工作模式来进行区别的,也就是说,该数字板组中的每一个数字板可以成为主用板,每一个数字板都可以成为备用板。其中,数字板可以是具有数据处理能力的处理单元,例如可以是具有数据处理能力的主板,等等。在具体的实施过程中,每个数字板在具体的硬件型号上可以是相同的,也可以是不同的。
在具体的实施过程中,在通信设备启动时,可以从该数字板组中随机选取一个作为主用板,并将其它的数字板作为备用板;也可以在设置通信设备时(如通信设备出厂配置时),在该数字板组中确定一个数字板作为默认的主用板,当通信设备启动时,总是以该确定的数字板作为主用板,将其他的数字板作为备用板,等等。
本发明实施例中,该数字板组中每个数字板上可以运行有软件,如每个数字板上可以运行有相同的监控系统软件和全局管理软件。数字板通过运行软件实现监控功能,即对通信设备包括的各模块监测并进行控制。
其中,数字板上运行的监控系统软件具有与数字板的工作模式相对应的软件工作模式。如,在本发明实施例中,主用板上运行的监控系统软件的软件工作模式为激活(Active),以下将该种模式下的监控系统软件简称Active监控系统软件,备用板上运行的监控系统软件的软件工作模式为备用(Standby),以下将该种模式下的监控系统软件简称Standby监控系统软件。
Active监控系统软件和Standby监控系统软件在功能配置上具有差别,例如,可以在Active监控系统上配置完整的监控功能,而在Standby监控系统软件上配置部分的监控功能。也就是说,可以通过配置监控系统软件上的功能,来调整一个监控系统软件是Active监控系统软件还是Standby监控系统软件。在具体的实施过程中,可以通过各数字板上运行的全局管理软件来配置数字板上的监控系统软件的功能。
本发明实施例中,各数字板之间可以进行通信,例如,各数字板可以通过以太网的方式连接。在启动通信设备的过程中,Active监控系统软件和Standby监控系统软件即开始启动,并且,在启动后,Active监控系统软件和Standby监控系统软件之间可以进行文件同步,以使Active监控系统软件和Standby监控系统软件中的文件相一致。
举例来说,Active监控系统软件和Standby监控系统软件启动后,Active监控系统可以在预定次数内,每隔预定的时间间隔向Standby监控系统软件发送一次文件,如每隔5秒发送一次文件,共发送5次。Standby监控系统软件在接收到文件后,即可对自身的文件进行更新。
并且,在通信设备运行的过程中,当Active监控系统软件中的文件有修改时,Active监控系统软件可以将修改后的文件发送至Standby监控系统软件,以使Standby监控系统软件同步修改文件。
在具体的实施过程中,Active监控系统软件和Standby监控系统软件之间的文件传输可以是通过数字板之间的以太网连接进行传输,例如,通过文件传输协议(FileTransfer Protocol,FTP)方式进行文件传输。
本发明实施例中,在通信设备运行的过程中,还可以对监控系统软件进行升级更新,并且,具体的软件升级方式有多种,以下以其中一种进行举例:
首先,连接各数字板的以太网还可以与互联网连接,Active监控系统软件在获得更新提示后,可以通过互联网下载更新文件,并使用更新文件对自身进行升级更新。当然,在具体的实施过程中,Active监控系统软件也可以是在获得更新文件推送后,使用推送的更新文件对自身进行升级更新。Active监控系统软件在对自身进行升级更新后会自行进行复位。
进一步,在Active监控系统软件复位完成后,Active监控系统软件可以校验更新文件的合法性,如果更新文件合法,则通知Standby监控系统软件进行软件同步更新。
进一步,在Standby监控系统软件获得软件同步更新通知后,可以从Active监控系统获得更新文件,例如以FTP下载的方式从Active监控系统获得更新文件,进而Standby监控系统软件自行进行复位后,使用获得的更新文件对自身进行升级更新。
为了更好的理解本发明实施例中的通信设备的监控方法,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
请参见图2、图3,本发明实施例中的通信设备的监控方法的流程描述如下。
本发明实施例中,在通信设备运行的过程中,主用板和备用板同时对主用板进行监控,即本发明实施例中的监控方法包括有同时进行的主用板监控主用板部分,和备用板监控主用板部分。通过主用板和备用板同时对主用板进行监控,能够更加准确及时地发现主用板存在的故障。
请参见图2,在主用板监控主用板部分中,监控方法包括如下步骤:
步骤101:通过主用板对主用板进行硬件状态监控,获得第一监控结果。
本发明实施例中,主用板可以对主用板进行硬件状态监控,也就是说,主用板可以对自身的硬件状态进行监测,以判断自身的硬件状态是否存在异常。并且,通过对自身的硬件状态进行监控,主用板可以获得第一监控结果,该第一监控结果可以用于表明主用板的硬件状态是否存在异常。
并且,在具体的实施过程中,主用板对自身进行硬件状态监控可以是周期性地执行的,即主用板可以周期性地对自身进行硬件状态监控,并且周期性地获得第一监控结果。
步骤102:根据第一监控结果确定主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板。
本发明实施例中,主用板根据第一监控结果确定主用板的硬件状态发生异常时,可以主动进行工作模式切换。其中,确定主用板的硬件状态发生异常可以是确定主用板在硬件上发生了预设的故障,也可以是主用板的硬件状态发生异常的数量达到一个预设数量,等等。
在主用板进行工作模式切换的过程中,硬件状态发生异常的主用板可以选取一个备用板设置为新的主用板,并且将硬件工作状态发生异常的主用板设置为新的备用板。
请参见图3,在备用板监控主用板部分中,监控方法包括如下步骤:
步骤111:选取第一备用板对数字板组中的主用板进行软件状态监控,获得第二监控结果。
本发明实施例中,备用板可以对主用板进行软件状态监控,通过对主用板的软件状态监控获得的第二监控结果,可以反映主用板的软件是否工作正常,并且,也可以体现主用板本身是否正常工作以保证软件的正常运行。举例来说,对主用板进行软件状态监控可以是监控主用板上运行的监控系统软件是否正常运行,也可以是监控主用板上运行的全局管理软件是否正常运行,也可以是对主用板上运行的其它软件进行监控,也可以是对主用板上运行的全部软件进行监控,等等。
本发明实施例中,该数字板组中可以包括有至少一个备用数字板。在通过备用板对主用板进行软件状态监控的过程中,可以从至少一个备用板中选取第一备用板对主用板进行软件状态监控。
在具体的实施过程中,当至少一个备用板为多个备用板,该第一备用板可以是至少一个备用板中的任一个备用板,例如可以是至少一个备用板中优先级最高的备用板,或者是至少一个备用板中随机的一个备用板;而当至少一个备用板仅包括一个备用板时,该第一备用板即为至少一个备用板中唯一包括的那个备用板。
本发明实施例中,备用板可以对主用板的软件状态进行监测,以判断主用板的软件状态是否存在异常。并且,通过对主用板的软件状态的进行监控,备用板可以获得第二监控结果,该第二监控结果可以用于表明主用板的软件状态是否存在异常。
并且,在具体的实施过程中,备用板对主用板进行软件状态监控可以是周期性地执行的,即备用板可以周期性地对主用板进行软件状态监控,并且周期性地获得第二监控结果。
步骤112:根据第二监控结果确定主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板。其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
本发明实施例中,备用板根据第二监控结果确定主用板的软件状态发生异常时,可以进行工作模式切换。在进行工作模式切换的过程中,一方面,第一备用板可以将软件工作状态发生异常的主用板设置为新的备用板,另一方面,第一备用板可以将第二备用板设置为新的主用板,即可以将第二备用板的工作模式更改为主用板以完成设置。
在具体的实施过程中,第一备用板和第二备用板为同一个数字板或不同的数字板,第一备用板可以直接将自身设置为主用板,也可以从该数字板组当前的其它备用板中选取另一个备用板设置为新的主用板。
在一种可能的实施方式中,主用板还可以对至少一个备用板进行软件状态监控,获得第三监控结果,并且,在根据第三监控结果确定至少一个备用板中存在软件工作状态异常的备用板时,修复存在软件工作状态异常的备用板。
本发明实施例中,主用板对备用板进行软件状态监控可以是与备用板对主用板进行软件状态监控同时进行的,也就是说,本发明实施例中,主用板和备用板之间可以相互进行监控,以保证通信设备的稳定性。
本发明实施例中,主用板修复软件工作状态异常的备用板可以控制软件工作状态异常的备用板上的故障软件进行复用、更新等操作。
举例来说,当确定备用板上运行的Standby监控软件发生故障时,主用板可以通知软件工作状态异常的备用板上运行的全局管理软件对Standby监控软件进行复位,当复位后,主用板确定该软件工作状态异常的备用板上的Standby监控软件仍然存在异常时,主用板可以通过该全局管理软件对Standby监控系统软件进行软件同步更新。
在一种可能的实施方式中,步骤102选取第一备用板对数字板组中的主用板进行软件状态监控,获得第二监控结果的实施过程中,可以通过选取的第一备用板周期性地向主用板发送第一心跳确认信息,并确定是否在发送第一心跳确认信息后的第一预设时长内接收到主用板发送的第一心跳响应信息,以生成第二监控结果。也就是说,第一备用板可以通过向主用板发送心跳确认包,判断主用板心跳响应是否正常的方式来判断主用板的软件状态是否正常。
本发明实施例中,主用板和备用板之间的发送心跳确认信息和心跳响应信息,可以是通过数字板之间的以太网连接来传输的。
举例来说,第一备用板上的Standby监控系统软件可以不断地向主用板上的Active监控系统软件发送第一心跳确认信息。正常的情况下,当Active监控系统软件接收第一心跳确认信息后,就会在规定的时长内向该Standby监控系统软件回发对应的第一心跳响应信息,以表示自己工作正常,Standby监控系统软件接收到该对应的第一心跳响应信息后,则可以确定Active监控系统软件工作正常。但是,当Active监控系统软件发生异常时,如Active监控系统软件运行失败时,Standby监控系统软件就无法收到对应的第一心跳响应信息,则可以确定Active监控系统软件工作异常。
例如,Standby监控系统软件可以每3秒发送第一心跳确认信息给Active监控系统软件,当连续3分15秒内未收到Active监控系统软件回发的第一心跳确认信息时,可以确定Active监控系统软件发生异常。
在一种可能的实施方式中,通过主用板对至少一个备用板进行软件状态监控,获得第三监控结果的实施过程中,可以通过主用板针对至少一个备用板中的任一备用板周期性地执行以下操作:
向备用板发送第二心跳确认信息,并确定是否在发送第二心跳确认信息后的第二预设时长内接收到该备用板发送的第二心跳响应信息,以生成第三监控结果。
在具体的实施过程中,当至少一个备用板为多个备用板时,主用板可以分别向每个备用板发送第二心跳确认信息,分别计录接收对应的第二心跳确认信息的时长;当至少一个备用板为一个备用板时,主用板可以仅向该一个备用板发送第二心跳确认信息,并计录接收对应的第二心跳确认信息的时长。
以主用板确定其中一个备用板上运行的Standby监控系统软件的工作状态为例,主用板上的Active监控系统软件每3秒向Standby监控系统发送一次第二心跳确认信息,当Active监控系统软件在3分钟内接收到该Standby监控系统回应的第二心跳确认信息,则可以确定该Standby监控系统软件工作正常,当Active监控系统软件3分钟内未收到该Standby监控系统回应的第二心跳确认信息,则可以确定该Standby监控系统工作异常。
并且,当Standby监控系统软件在一预设时长内(如3分15秒)未接收到Active监控系统软件发送的第二心跳确认信息时,也可以确定Active监控系统软件工作异常。
本发明实施例中,第一预设时长和第二预设时长相同或不相同。
在一种可能的实施方式中,通信设备还包括至少一组功能模块,该至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块。本发明实施例中,可以通过主用板对该至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果。并且,主用板根据第四监控结果确定该至少一组功能模块中的第一主用功能模块发生异常时,从第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将第一主用功能模块设置为新的备用功能模块。
本发明实施例中,至少一组功能模块可以是通信设备用于实现通信功能的硬件装置,例如功能模块可以是功放模块、低噪放模块,等等。
举例来说,以通信设备中可以包括的一组功放模块来举例,假设该组功放模块中包括有3个功放模块,其中包括1个主用功放模块和2个备用功放模块。当主用板通过监控确定该主用功放模块发生异常时,主用板可以从这2个备用功放模块中选取一个备用功放模块设置为新的主用功放模块,并且,将该发生异常的主用功放模块设置为新的备用功放模块。
在一种可能的实施方式中,通信设备还包括与该数字板组连接的逻辑器件。该逻辑器件可以是可编程的逻辑器件,例如可以是复杂可编程逻辑器件(ComplexProgrammable Logic Device,CPLD)。该逻辑器件记录有各个数字板的数字板状态信息。其中,数字板状态信息可以包括有数字板的工作模式信息,也可以包括有数字板的告警信息,等等。
在具体的实施过程中,各个数字板可以将自身的数字板状态信息传输到逻辑器件上的各自对应的端口。逻辑器件可以记录下各个数字板的数字板状态信息。例如,数字板可以将产生的告警信息发送至逻辑器件,逻辑器件可以记录下获得的告警信息。又例如,数字板可以将修改后的工作模式信息发送至逻辑器件,数字板可以记录下数字板发送的工作模式信息,等等。本发明实施例中,数字板也可以是以电平信号的形式向逻辑器件发送信息。
并且,本发明实施例中,当逻辑器件检测到数字板掉电时,可以修改掉电的数字板的数字板状态信息。例如,当逻辑器件检测到主用板掉电时,逻辑器件可以修改掉电的主用板的工作模式信息中的工作模式为备用板,并且,逻辑器件可以从至少一个备用板中选取一个备用板作为新的主用板,并修改所选取的一个备用板的工作模式信息中的工作模式为主用板。
并且,本发明实施例中,该数字板组还可以与一切换开关连接,该切换开关可以发送切换指令,以指示数字板进行工作模式切换。数字板进行工作模式切换时,可以将修改后的工作模式信息发送至逻辑器件。
本发明实施例中,步骤101中,通过主用板对主用板进行硬件状态监控,获得第一监控结果的过程中,通过主用板周期性地从逻辑器件读取主用板的数字板状态信息,并根据数字板状态信息确定主用板的硬件工作状态是否发生异常,以生成第一监控结果。
在具体的实施过程中,可以是主用板上运行的Active监控系统从逻辑器件读取主用板的数字板状态信息,在读取到主用板的数字板状态信息后,可以根据数字板状态信息的内容生成第一监控结果。
举例来说,当读取到的数字板状态信息中包括告警信息时,生成的第一监控结果中可以确认主用板发生了异常,需要切换主备用数字板;当读取到的数字板状态信息中包括的工作模式信息表明该当前的主用板的工作模式不再是主用板时,生成的第一监控结果中可以确认主用板发生了异常,需要切换主备用数字板。
在一种可能的实施方式中,与数字板连接的逻辑器件还可以与该至少一组功能模块中的各功能模块连接。
在具体的实施过程中,各功能模块可以将自身的功能模块状态信息传输到逻辑器件上的各自对应的端口。逻辑器件可以记录下各个功能模块的功能模块状态信息。例如,功能模块可以将产生的告警信息发送至逻辑器件,逻辑器件可以记录下获得的告警信息,等等。本发明实施例中,数字板也可以是以电平信号的形式向逻辑器件发送信息。
并且,本发明实施例中,当逻辑器件检测到功能模块掉电时,可以修改掉电的功能模块的功能模块状态信息。例如,当逻辑器件检测到某个主用功能模块掉电时,逻辑器件可以修改掉电的该主用功能模块的工作模式信息中的工作模式为备用功能模块,并且,逻辑器件可以从该掉电的主用功能模块所在一组功能模块中选取一个备用功能模块作为新的主用功能模块,并修改所选取的一个备用功能模块的工作模式信息中的工作模式为主用功能模块。
并且,本发明实施例中,数字板还可以与用于控制至少一组功能模块的至少一个功能模块切换开关连接,其中每个功能模块切换开关用于切换对应的一组功能模块中功能模块的工作模式,功能模块切换开关可以发送功能模块切换指令至主用板,主用板可以根据功能模块切换指令,通过逻辑器件直接修改该功能模块切换指令所指示切换的功能模块的工作模式信息。
本发明实施例中,通过主用板对至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果的实施过程中,可以通过主用板针对至少一组功能模块中的任一组功能模块周期性地执行以下操作:
从逻辑器件中读取一组功能模块中的主用功能模块的功能模块状态信息,并根据该功能模块状态信息,确定该一组功能模块中的主用功能模块是否发生异常,以生成第四监控结果。
在一种可能的实施方式中,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板,可以通过如下的方式实现:
硬件工作状态发生异常的主用板可以向逻辑器件发送第一切换指令,该第一切换指令用于指示逻辑器件更新所选取的一个备用板的工作模式标记(即工作模式信息)为主用板,以使该所选取的一个备用板从逻辑器件读取到更新后的工作模式信息后,切换自身的工作模式为主用板;以及
并且,硬件工作状态发生异常的主用板可以切换自身的工作模式为备用板,在具体的实施过程中,该异常的主用板可以是通过自身的全局管理软件切换自身的监控系统软件的工作模式为Standby,也可以是向逻辑器件发送一切换指令,该切换指令用于指示逻辑器件更新该硬件工作状态发生异常的主用板的工作模式标记为备用板。
在一种可能的实施方式中,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,可以通过如下的方式实现:
第一备用板向逻辑器件发送第二切换指令,该第二切换指令用于指示逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;
以及,第一备用板将第二备用板的工作模式切换为主用板,在具体的实施过程中,可以是第一备用板向逻辑器件发送一切换指令,该切换指令用于指示逻辑器件更新第二备用板的工作模式标记为主用板。并且,第一备用板和第二备用板可以为同一个数字板或不同的数字板,当第一备用板和第二备用板为同一个备用板时,第一备用板还可以是通过自身的全局管理软件切换自身的监控系统软件的工作模式为Active。
本发明实施例中,在将硬件工作状态发生异常的主用板设置为新的备用板后,还可以对该存在异常的新的备用板进行修复,例如对该存在异常的新的备用板的PM8910、现场可编程门阵列(Field-Programmable Gate Array,FPGA)进行重配修复。
本发明实施例中,主用板和第一备用板可以同时监控所有的主备数字板、主备功能模块,但备用板上的Standby监控系统软件处于监控失效状态,即不能控制切换主备功能模块。当主备数字板发生工作模式转换时,新的主用板上的监控系统软件立即由监控失效状态变为监控激活状态。
本发明实施例中,在设置备用板为新的主用板时,还会先确定该备用板是否异常,如果该备用板工作异常则不会将该备用板设置为新的主用板。以及,本发明实施例中,在设置备用功能模块为新的主用功能模块时,还会先确定该备用功能模块是否异常,如果该备用功能模块工作异常则不会将该备用功能模块设置为新的主用功能模块。
本发明实施例中,为了保证主备功能模块切换后信号增益的一致性,对于主备功能模块的硬件差异,可以使用独立的文件进行补偿,保证主备功能模块切换后信号增益的一致性。
具体来说,可以预先对主备模块进行高低温测试,以生成主备模块各自的温度补偿文件;以及可以对主备模块进行定标,以生成不同的定标数据文件,在配置通信设备时,可以将这些温度补偿文件、定标数据文件存储在通信设备中。其中,主备模块可以包括主备数字板和/或主备功能模块。
Active监控系统软件和Standby监控系统软件启动后,可以分别根据各自所在数字板的加载各自的温度补偿文件,并将各个模块不同的定标数据文件设置给各组模块的FPGA,并根据当前主用模块的角色,控制各FPGA使用主用模块对应的定标数据文件。
本发明实施例中,通信设备包括有一组用于监控通信设备的数字板,该数字板组中包括一个主用板和至少一个备用板,主用板和备用板互为备份,因而,在当前的主用板发生故障时,能够进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,主用板对自身的硬件状态进行监控,当确定主用板的硬件状态发生异常时,主用板可以主动地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,选取第一备用板对主用板进行软件状态监控,当确定主用板的软件工作状态发生异常时,可以及时地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,通过对主用板在硬件状态和软件状态的全方位监视,可以及时有效地发现主用板发生的故障,以在最短的时间内启动主用板和备用板的切换,提高通信设备的可靠性。
进一步地,本发明实施例中,当主用板发生故障时,仅仅对主用板和备用板进行切换,其它的硬件装置无需进行切换,使得整个切换的过程耗时更短,能够更为快速地恢复正常通信。
实施例二
基于同一发明构思,本发明实施例提供一种通信设备,该通信设备包括数字板组,用于监控通信设备运行,该数字板组中包括一个主用板和至少一个备用板。在具体的实施过程中,该通信设备实施例一中的通信设备,即可以是图1所示的通信设备。
并且,由于本发明实施例提供的通信设备可以用于执行前述的通信设备的监控方法,因此对于本发明实施例中的通信设备中各部件或模块所能够实现的功能及一些实现过程可参考前述的通信设备的监控方法的实施例中的描述,在此不再赘述。其中:
主用板,用于对主用板进行硬件状态监控,获得第一监控结果,根据第一监控结果确定主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
第一备用板,用于对数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
在一种可能的实施方式中,主用板还用于:
对至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定至少一个备用板中存在软件工作状态异常的备用板时,修复存在软件工作状态异常的备用板。
在一种可能的实施方式中,第一备用板用于:
周期性地执行以下操作:向主用板发送第一心跳确认信息,并确定是否在发送第一心跳确认信息后的第一预设时长内接收到主用板发送的第一心跳响应信息,以生成第二监控结果;
主用板用于:
针对至少一个备用板中的任一备用板周期性地执行以下操作:向任一备用板发送第二心跳确认信息,并确定是否在发送第二心跳确认信息后的第二预设时长内接收到任一备用板发送的第二心跳响应信息,以生成第三监控结果。
在一种可能的实施方式中,通信设备还包括至少一组功能模块,至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,主用板还用于:
对至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据第四监控结果确定至少一组功能模块中的第一主用功能模块发生异常时,从第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将第一主用功能模块设置为新的备用功能模块。
在一种可能的实施方式中,通信设备还包括与数字板组连接的逻辑器件,主用板用于:
周期性地执行以下操作:从逻辑器件读取主用板的数字板状态信息,并根据数字板状态信息确定主用板的硬件工作状态是否发生异常,以生成第一监控结果;
逻辑器件还与至少一组功能模块连接,主用板用于:
针对至少一组功能模块中的任一组功能模块周期性地执行以下操作:从逻辑器件中读取任一组功能模块中的主用功能模块的功能模块状态信息,并根据功能模块状态信息,确定任一组功能模块中的主用功能模块是否发生异常,以生成第四监控结果。
在一种可能的实施方式中,通信设备包括与数字板组连接的逻辑器件,硬件工作状态发生异常的主用板用于:
向逻辑器件发送第一切换指令,第一切换指令用于指示逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使选取的一个备用板从逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,切换自身的工作模式为备用板;
第一备用板用于:
向逻辑器件发送第二切换指令,第二切换指令用于指示逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,将第二备用板的工作模式切换为主用板。
实施例三
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序指令,当计算机程序指令被加载并运行时,可以执行如第一方面所述的通信设备的监控方法。并且,执行通信设备的监控方法时的具体实施过程可以参照第一方面的描述,在此不再赘述。
在具体的实施过程中,计算机可读存储介质包括:通用串行总线闪存盘(Universal Serial Bus flash drive,USB)、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的存储介质。
上述技术方案中的一个或多个技术方案,具有如下技术效果或优点:
本发明实施例中,通信设备包括有用于监控通信设备的数字板组,该数字板组中包括一个主用板和至少一个备用板,主用板和备用板互为备份,因而,在当前的主用板发生故障时,能够进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,主用板对自身的硬件状态进行监控,当确定主用板的硬件状态发生异常时,主用板可以主动地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,选取第一备用板对主用板进行软件状态监控,当确定主用板的软件工作状态发生异常时,可以及时地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,通过对主用板在硬件状态和软件状态的全方位监视,可以及时有效地发现主用板发生的故障,以在最短的时间内启动主用板和备用板的切换,提高通信设备的可靠性。
进一步地,本发明实施例中,当主用板发生故障时,仅仅对主用板和备用板进行切换,其它的硬件装置无需进行切换,使得整个切换的过程耗时更短,能够更为快速地恢复正常通信。
进一步地,本发明实施例中,主用板对至少一个备用板进行软件状态监控,并且在检测到存在软件工作状态异常的备用板时,修复存在软件工作状态异常的备用板,一方面可以保证主用板故障时,可以切换到能够正常工作的备用板,另一方面可以保证备用板能够正常地对主用板的工作状态进行监控。通过主用板和备用板之间的相互监控,提高通信设备的稳定性。
进一步地,本发明实施例中,主用板对至少一组功能模块进行监控,但发现有异常的主用功能模块时,可以及时地进行主备用功能模块的切换,保障通信设备正常运行。
进一步地,本发明实施例中,在进行主备模块切换时,通过加载对应的温度补偿文件和定标数据文件,可以保证主备模块切换前后通信设备信号增益的一致性。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (11)

1.一种通信设备的监控方法,所述通信设备包括数字板组,用于监控所述通信设备运行,所述数字板组中的数字板是具有数据处理能力的处理单元,所述数字板组中包括一个主用板和至少一个备用板,其特征在于,所述方法包括:
通过主用板对所述主用板进行硬件状态监控,获得第一监控结果,根据所述第一监控结果确定所述主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
选取第一备用板对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定所述主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板;
所述通信设备还包括至少一组功能模块,所述至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,通过所述主用板对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据所述第四监控结果确定所述至少一组功能模块中的第一主用功能模块发生异常时,从所述第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将所述第一主用功能模块设置为新的备用功能模块。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
通过所述主用板对所述至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定所述至少一个备用板中存在软件工作状态异常的备用板时,修复所述存在软件工作状态异常的备用板。
3.如权利要求2所述的方法,其特征在于,选取第一备用板对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,包括:
通过所述第一备用板周期性地执行以下操作:向所述主用板发送第一心跳确认信息,并确定是否在发送所述第一心跳确认信息后的第一预设时长内接收到所述主用板发送的第一心跳响应信息,以生成所述第二监控结果;
通过所述主用板对所述至少一个备用板进行软件状态监控,获得第三监控结果,包括:
通过所述主用板针对所述至少一个备用板中的任一备用板周期性地执行以下操作:向所述任一备用板发送第二心跳确认信息,并确定是否在发送所述第二心跳确认信息后的第二预设时长内接收到所述任一备用板发送的第二心跳响应信息,以生成所述第三监控结果。
4.如权利要求1所述的方法,其特征在于,所述通信设备还包括与所述数字板组连接的逻辑器件,通过主用板对所述主用板进行硬件状态监控,获得第一监控结果,包括:
通过所述主用板周期性地执行以下操作:从所述逻辑器件读取所述主用板的数字板状态信息,并根据所述数字板状态信息确定所述主用板的硬件工作状态是否发生异常,以生成所述第一监控结果;
所述逻辑器件还与所述至少一组功能模块连接,通过主用板对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,包括:
通过所述主用板针对所述至少一组功能模块中的任一组功能模块周期性地执行以下操作:从所述逻辑器件中读取所述任一组功能模块中的主用功能模块的功能模块状态信息,并根据所述功能模块状态信息,确定所述任一组功能模块中的主用功能模块是否发生异常,以生成所述第四监控结果。
5.如权利要求1-4中任一权利要求所述的方法,所述通信设备包括与所述数字板组连接的逻辑器件,其特征在于,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板,包括:
硬件工作状态发生异常的主用板向所述逻辑器件发送第一切换指令,所述第一切换指令用于指示所述逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使所述选取的一个备用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,硬件工作状态发生异常的主用板切换自身的工作模式为备用板;
将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,包括:
所述第一备用板向所述逻辑器件发送第二切换指令,所述第二切换指令用于指示所述逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,所述第一备用板将所述第二备用板的工作模式切换为主用板。
6.一种通信设备,所述通信设备包括数字板组,用于监控所述通信设备运行,所述数字板组中的数字板是具有数据处理能力的处理单元,所述数字板组中包括一个主用板和至少一个备用板,其特征在于:
所述主用板,用于对所述主用板进行硬件状态监控,获得第一监控结果,根据所述第一监控结果确定所述主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
第一备用板,用于对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定所述主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板;
所述通信设备还包括至少一组功能模块,所述至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,所述主用板还用于:
对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据所述第四监控结果确定所述至少一组功能模块中的第一主用功能模块发生异常时,从所述第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将所述第一主用功能模块设置为新的备用功能模块。
7.如权利要求6所述的设备,其特征在于,所述主用板还用于:
对所述至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定所述至少一个备用板中存在软件工作状态异常的备用板时,修复所述存在软件工作状态异常的备用板。
8.如权利要求7所述的设备,其特征在于,所述第一备用板用于:
周期性地执行以下操作:向所述主用板发送第一心跳确认信息,并确定是否在发送所述第一心跳确认信息后的第一预设时长内接收到所述主用板发送的第一心跳响应信息,以生成所述第二监控结果;
所述主用板用于:
针对所述至少一个备用板中的任一备用板周期性地执行以下操作:向所述任一备用板发送第二心跳确认信息,并确定是否在发送所述第二心跳确认信息后的第二预设时长内接收到所述任一备用板发送的第二心跳响应信息,以生成所述第三监控结果。
9.如权利要求6所述的设备,其特征在于,所述通信设备还包括与所述数字板组连接的逻辑器件,所述主用板用于:
周期性地执行以下操作:从所述逻辑器件读取所述主用板的数字板状态信息,并根据所述数字板状态信息确定所述主用板的硬件工作状态是否发生异常,以生成所述第一监控结果;
所述逻辑器件还与所述至少一组功能模块连接,所述主用板用于:
针对所述至少一组功能模块中的任一组功能模块周期性地执行以下操作:从所述逻辑器件中读取所述任一组功能模块中的主用功能模块的功能模块状态信息,并根据所述功能模块状态信息,确定所述任一组功能模块中的主用功能模块是否发生异常,以生成所述第四监控结果。
10.如权利要求6-9中任一权利要求所述的设备,所述通信设备包括与所述数字板组连接的逻辑器件,其特征在于,硬件工作状态发生异常的主用板用于:
向所述逻辑器件发送第一切换指令,所述第一切换指令用于指示所述逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使所述选取的一个备用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,切换自身的工作模式为备用板;
所述第一备用板用于:
向所述逻辑器件发送第二切换指令,所述第二切换指令用于指示所述逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,将所述第二备用板的工作模式切换为主用板。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被加载并运行时,执行如权利要求1-5中任一权利要求所述的方法的步骤。
CN201711057121.XA 2017-11-01 2017-11-01 一种通信设备的监控方法和通信设备 Active CN107819617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711057121.XA CN107819617B (zh) 2017-11-01 2017-11-01 一种通信设备的监控方法和通信设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711057121.XA CN107819617B (zh) 2017-11-01 2017-11-01 一种通信设备的监控方法和通信设备

Publications (2)

Publication Number Publication Date
CN107819617A CN107819617A (zh) 2018-03-20
CN107819617B true CN107819617B (zh) 2021-08-24

Family

ID=61604739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711057121.XA Active CN107819617B (zh) 2017-11-01 2017-11-01 一种通信设备的监控方法和通信设备

Country Status (1)

Country Link
CN (1) CN107819617B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113067780B (zh) * 2021-03-15 2022-11-01 杭州迪普科技股份有限公司 虚拟交换矩阵的流量处理方法及电子设备
CN113742165A (zh) * 2021-07-23 2021-12-03 文华学院 双主控设备及主备控制方法
CN117440907A (zh) * 2022-01-12 2024-01-23 烟台杰瑞石油服务集团股份有限公司 车辆的控制方法、控制装置、处理器与车辆系统
CN115037674B (zh) * 2022-05-16 2023-08-22 郑州小鸟信息科技有限公司 一种中央控制系统单机及多设备冗余备份方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1476178A (zh) * 2003-07-08 2004-02-18 大唐移动通信设备有限公司 通信系统中实现高可用性(ha)的装置和方法
CN101145895A (zh) * 2007-09-20 2008-03-19 中兴通讯股份有限公司 主备设备倒换方法
CN101207408A (zh) * 2006-12-22 2008-06-25 中兴通讯股份有限公司 一种用于主备倒换的综合故障检测装置和方法
CN101631345A (zh) * 2009-08-13 2010-01-20 中兴通讯股份有限公司 单板运行状态的监控方法及装置
CN101714109A (zh) * 2009-11-24 2010-05-26 杭州华三通信技术有限公司 双cpu系统主板的控制方法及设备
JP4494035B2 (ja) * 2004-02-20 2010-06-30 株式会社三共 遊技機

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1476178A (zh) * 2003-07-08 2004-02-18 大唐移动通信设备有限公司 通信系统中实现高可用性(ha)的装置和方法
JP4494035B2 (ja) * 2004-02-20 2010-06-30 株式会社三共 遊技機
CN101207408A (zh) * 2006-12-22 2008-06-25 中兴通讯股份有限公司 一种用于主备倒换的综合故障检测装置和方法
CN101145895A (zh) * 2007-09-20 2008-03-19 中兴通讯股份有限公司 主备设备倒换方法
CN101631345A (zh) * 2009-08-13 2010-01-20 中兴通讯股份有限公司 单板运行状态的监控方法及装置
CN101714109A (zh) * 2009-11-24 2010-05-26 杭州华三通信技术有限公司 双cpu系统主板的控制方法及设备

Also Published As

Publication number Publication date
CN107819617A (zh) 2018-03-20

Similar Documents

Publication Publication Date Title
CN107819617B (zh) 一种通信设备的监控方法和通信设备
WO2009129058A2 (en) A global broadcast communication system
US20210226871A1 (en) Cluster management method, apparatus and system
CN112148567A (zh) 一种智能设备主动运维方法、设备及存储介质
CN111897697A (zh) 服务器硬件故障修复方法和装置
CN109032320B (zh) 电池备份单元测试方法及相关设备
CN113965494A (zh) 用于冗余进程网络中的故障检测和角色选择的方法
JP2012181131A (ja) 蓄電管理装置
CN114978296B (zh) 设备切换方法、装置、地球站及可读存储介质
JP2006318394A (ja) ネットワークシステムの無停電電源装置の管理方法
CN115225464B (zh) 一种网络切换方法、装置、设备及存储介质
JP2008140280A (ja) サーバの運用管理における信頼性強化方法
JP6569247B2 (ja) 障害検証装置及び障害検証方法、検証対象装置、無線通信システム、コンピュータ・プログラム
JP7061636B2 (ja) オペレーション装置及びプログラム
JP4973516B2 (ja) ネットワーク管理システム、ネットワーク管理装置、装置管理方法及び装置管理制御プログラム
CN117215859B (zh) 主备bios自动切换方法、自动切换装置和计算机
JP2004007930A (ja) 電力系統監視制御システムおよびプログラム
CN110955210B (zh) Agv调度方法、装置和系统
JP6409805B2 (ja) 電源制御装置、電源制御システム、電源制御方法および電源制御プログラム
JP2009211279A (ja) 操業データ管理サーバシステム
JP2012114552A (ja) 無線システム
JP2021118508A (ja) 無線増幅装置の監視装置、無線通信システム
CN114461464A (zh) 一种服务器生产测试方法、装置、电子设备及介质
CN104702422A (zh) 实现通信设备高可用性的方法、装置和系统
WO2016093795A1 (en) Redundant ethernet-based control apparatus and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200107

Address after: 510663 Shenzhou Road 10, Guangzhou Science City, Guangzhou economic and Technological Development Zone, Guangzhou, Guangdong

Applicant after: Jingxin Communication System (China) Co., Ltd.

Address before: 510663 Luogang District Science City, Guangzhou, Shenzhou Road, No. 10, Guangdong

Applicant before: Jingxin Communication System (China) Co., Ltd.

Applicant before: Jingxin Communication System (Guangzhou) Co., Ltd.

Applicant before: Jingxin Communication Technology (Guangzhou) Co., Ltd.

Applicant before: TIANJIN COMBA TELECOM SYSTEMS CO., LTD.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510663 Shenzhou Road 10, Guangzhou Science City, Guangzhou economic and Technological Development Zone, Guangzhou, Guangdong

Applicant after: Jingxin Network System Co.,Ltd.

Address before: 510663 Shenzhou Road 10, Guangzhou Science City, Guangzhou economic and Technological Development Zone, Guangzhou, Guangdong

Applicant before: Comba Telecom System (China) Ltd.

GR01 Patent grant
GR01 Patent grant