发明内容
本发明实施例提供一种通信设备的监控方法和通信设备,用以解决现有技术中通信设备发生故障时无法及时恢复正常通信,可靠性低的技术问题。
第一方面,提供一种通信设备的监控方法,所述通信设备包括数字板组,用于监控所述通信设备运行,所述数字板组中包括一个主用板和至少一个备用板,所述方法包括:
通过主用板对所述主用板进行硬件状态监控,获得第一监控结果,根据所述第一监控结果确定所述主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
选取第一备用板对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定所述主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
在一种可能的实现方式中,所述方法还包括:
通过所述主用板对所述至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定所述至少一个备用板中存在软件工作状态异常的备用板时,修复所述存在软件工作状态异常的备用板。
在一种可能的实现方式中,选取第一备用板对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,包括:
通过所述第一备用板周期性地执行以下操作:向所述主用板发送第一心跳确认信息,并确定是否在发送所述第一心跳确认信息后的第一预设时长内接收到所述主用板发送的第一心跳响应信息,以生成所述第二监控结果;
通过所述主用板对所述至少一个备用板进行软件状态监控,获得第三监控结果,包括:
通过所述主用板针对所述至少一个备用板中的任一备用板周期性地执行以下操作:向所述任一备用板发送第二心跳确认信息,并确定是否在发送所述第二心跳确认信息后的第二预设时长内接收到所述任一备用板发送的第二心跳响应信息,以生成所述第三监控结果。
在一种可能的实现方式中,所述通信设备还包括至少一组功能模块,所述至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,所述方法还包括:
通过主用板对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据所述第四监控结果确定所述至少一组功能模块中的第一主用功能模块发生异常时,从所述第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将所述第一主用功能模块设置为新的备用功能模块。
在一种可能的实现方式中,所述通信设备还包括与所述数字板组连接的逻辑器件,通过主用板对所述主用板进行硬件状态监控,获得第一监控结果,包括:
通过所述主用板周期性地执行以下操作:从所述逻辑器件读取所述主用板的数字板状态信息,并根据所述数字板状态信息确定所述主用板的硬件工作状态是否发生异常,以生成所述第一监控结果;
所述逻辑器件还与所述至少一组功能模块连接,通过主用板对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,包括:
通过所述主用板针对所述至少一组功能模块中的任一组功能模块周期性地执行以下操作:从所述逻辑器件中读取所述任一组功能模块中的主用功能模块的功能模块状态信息,并根据所述功能模块状态信息,确定所述任一组功能模块中的主用功能模块是否发生异常,以生成所述第四监控结果。
在一种可能的实现方式中,所述通信设备包括与所述数字板组连接的逻辑器件,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板,包括:
硬件工作状态发生异常的主用板向所述逻辑器件发送第一切换指令,所述第一切换指令用于指示所述逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使所述选取的一个备用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,硬件工作状态发生异常的主用板切换自身的工作模式为备用板;
将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,包括:
所述第一备用板向所述逻辑器件发送第二切换指令,所述第二切换指令用于指示所述逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,所述第一备用板将所述第二备用板的工作模式切换为主用板。
第二方面,提供一种通信设备,所述通信设备包括数字板组,用于监控所述通信设备运行,所述数字板组中包括一个主用板和至少一个备用板,其中:
所述主用板,用于对所述主用板进行硬件状态监控,获得第一监控结果,根据所述第一监控结果确定所述主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
第一备用板,用于对所述数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定所述主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
在一种可能的实现方式中,所述主用板还用于:
对所述至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定所述至少一个备用板中存在软件工作状态异常的备用板时,修复所述存在软件工作状态异常的备用板。
在一种可能的实现方式中,所述第一备用板用于:
周期性地执行以下操作:向所述主用板发送第一心跳确认信息,并确定是否在发送所述第一心跳确认信息后的第一预设时长内接收到所述主用板发送的第一心跳响应信息,以生成所述第二监控结果;
所述主用板用于:
针对所述至少一个备用板中的任一备用板周期性地执行以下操作:向所述任一备用板发送第二心跳确认信息,并确定是否在发送所述第二心跳确认信息后的第二预设时长内接收到所述任一备用板发送的第二心跳响应信息,以生成所述第三监控结果。
在一种可能的实现方式中,所述通信设备还包括至少一组功能模块,所述至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,所述主用板还用于:
对所述至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据所述第四监控结果确定所述至少一组功能模块中的第一主用功能模块发生异常时,从所述第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将所述第一主用功能模块设置为新的备用功能模块。
在一种可能的实现方式中,所述通信设备还包括与所述数字板组连接的逻辑器件,所述主用板用于:
周期性地执行以下操作:从所述逻辑器件读取所述主用板的数字板状态信息,并根据所述数字板状态信息确定所述主用板的硬件工作状态是否发生异常,以生成所述第一监控结果;
所述逻辑器件还与所述至少一组功能模块连接,所述主用板用于:
针对所述至少一组功能模块中的任一组功能模块周期性地执行以下操作:从所述逻辑器件中读取所述任一组功能模块中的主用功能模块的功能模块状态信息,并根据所述功能模块状态信息,确定所述任一组功能模块中的主用功能模块是否发生异常,以生成所述第四监控结果。
在一种可能的实现方式中,所述通信设备包括与所述数字板组连接的逻辑器件,硬件工作状态发生异常的主用板用于:
向所述逻辑器件发送第一切换指令,所述第一切换指令用于指示所述逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使所述选取的一个备用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,切换自身的工作模式为备用板;
所述第一备用板用于:
向所述逻辑器件发送第二切换指令,所述第二切换指令用于指示所述逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,将所述第二备用板的工作模式切换为主用板。
第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被加载并运行时,执行如第一方面所述的方法的步骤。
本发明实施例中,通信设备包括有用于监控通信设备的数字板组,该数字板组中包括一个主用板和至少一个备用板,主用板和备用板互为备份,因而,在当前的主用板发生故障时,能够进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,主用板对自身的硬件状态进行监控,当确定主用板的硬件状态发生异常时,主用板可以主动地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,选取第一备用板对主用板进行软件状态监控,当确定主用板的软件工作状态发生异常时,可以及时地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,通过对主用板在硬件状态和软件状态的全方位监视,可以及时有效地发现主用板发生的故障,以在最短的时间内启动主用板和备用板的切换,提高通信设备的可靠性。
进一步地,本发明实施例中,当主用板发生故障时,仅仅对主用板和备用板进行切换,其它的硬件装置无需进行切换,使得整个切换的过程耗时更短,能够更为快速地恢复正常通信。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
实施例一
本发明实施例提供一种通信设备的监控方法。其中,通信设备可以是数字射频拉远设备、基站设备、直放站、用户设备等可以进行通信的设备,本发明实施例对通信设备的具体类型不做限制。
例如,该通信可以为图1所示的通信设备,在图1所举例的通信设备中,包括数字板组,两组功能模块;其中,该数字板组中包括2个数字板,分别为主用板和备用板,第一组功能模块中包括2个第一种功能模块,分别为第一种主用功能模块和第一种备用功能模块,第二组功能模块中包括2个第二种功能模块,分别为第二种主用功能模块和第二种备用功能模块。
通信设备中包括有数字板组,该数字板组用于监控通信设备的运行,例如,对通信设备包括的功能模块进行监控。该数字板组中包括一个主用板和至少一个备用板,其中,主用板和备用板式可以是根据数字板的工作模式来进行区别的,也就是说,该数字板组中的每一个数字板可以成为主用板,每一个数字板都可以成为备用板。其中,数字板可以是具有数据处理能力的处理单元,例如可以是具有数据处理能力的主板,等等。在具体的实施过程中,每个数字板在具体的硬件型号上可以是相同的,也可以是不同的。
在具体的实施过程中,在通信设备启动时,可以从该数字板组中随机选取一个作为主用板,并将其它的数字板作为备用板;也可以在设置通信设备时(如通信设备出厂配置时),在该数字板组中确定一个数字板作为默认的主用板,当通信设备启动时,总是以该确定的数字板作为主用板,将其他的数字板作为备用板,等等。
本发明实施例中,该数字板组中每个数字板上可以运行有软件,如每个数字板上可以运行有相同的监控系统软件和全局管理软件。数字板通过运行软件实现监控功能,即对通信设备包括的各模块监测并进行控制。
其中,数字板上运行的监控系统软件具有与数字板的工作模式相对应的软件工作模式。如,在本发明实施例中,主用板上运行的监控系统软件的软件工作模式为激活(Active),以下将该种模式下的监控系统软件简称Active监控系统软件,备用板上运行的监控系统软件的软件工作模式为备用(Standby),以下将该种模式下的监控系统软件简称Standby监控系统软件。
Active监控系统软件和Standby监控系统软件在功能配置上具有差别,例如,可以在Active监控系统上配置完整的监控功能,而在Standby监控系统软件上配置部分的监控功能。也就是说,可以通过配置监控系统软件上的功能,来调整一个监控系统软件是Active监控系统软件还是Standby监控系统软件。在具体的实施过程中,可以通过各数字板上运行的全局管理软件来配置数字板上的监控系统软件的功能。
本发明实施例中,各数字板之间可以进行通信,例如,各数字板可以通过以太网的方式连接。在启动通信设备的过程中,Active监控系统软件和Standby监控系统软件即开始启动,并且,在启动后,Active监控系统软件和Standby监控系统软件之间可以进行文件同步,以使Active监控系统软件和Standby监控系统软件中的文件相一致。
举例来说,Active监控系统软件和Standby监控系统软件启动后,Active监控系统可以在预定次数内,每隔预定的时间间隔向Standby监控系统软件发送一次文件,如每隔5秒发送一次文件,共发送5次。Standby监控系统软件在接收到文件后,即可对自身的文件进行更新。
并且,在通信设备运行的过程中,当Active监控系统软件中的文件有修改时,Active监控系统软件可以将修改后的文件发送至Standby监控系统软件,以使Standby监控系统软件同步修改文件。
在具体的实施过程中,Active监控系统软件和Standby监控系统软件之间的文件传输可以是通过数字板之间的以太网连接进行传输,例如,通过文件传输协议(FileTransfer Protocol,FTP)方式进行文件传输。
本发明实施例中,在通信设备运行的过程中,还可以对监控系统软件进行升级更新,并且,具体的软件升级方式有多种,以下以其中一种进行举例:
首先,连接各数字板的以太网还可以与互联网连接,Active监控系统软件在获得更新提示后,可以通过互联网下载更新文件,并使用更新文件对自身进行升级更新。当然,在具体的实施过程中,Active监控系统软件也可以是在获得更新文件推送后,使用推送的更新文件对自身进行升级更新。Active监控系统软件在对自身进行升级更新后会自行进行复位。
进一步,在Active监控系统软件复位完成后,Active监控系统软件可以校验更新文件的合法性,如果更新文件合法,则通知Standby监控系统软件进行软件同步更新。
进一步,在Standby监控系统软件获得软件同步更新通知后,可以从Active监控系统获得更新文件,例如以FTP下载的方式从Active监控系统获得更新文件,进而Standby监控系统软件自行进行复位后,使用获得的更新文件对自身进行升级更新。
为了更好的理解本发明实施例中的通信设备的监控方法,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
请参见图2、图3,本发明实施例中的通信设备的监控方法的流程描述如下。
本发明实施例中,在通信设备运行的过程中,主用板和备用板同时对主用板进行监控,即本发明实施例中的监控方法包括有同时进行的主用板监控主用板部分,和备用板监控主用板部分。通过主用板和备用板同时对主用板进行监控,能够更加准确及时地发现主用板存在的故障。
请参见图2,在主用板监控主用板部分中,监控方法包括如下步骤:
步骤101:通过主用板对主用板进行硬件状态监控,获得第一监控结果。
本发明实施例中,主用板可以对主用板进行硬件状态监控,也就是说,主用板可以对自身的硬件状态进行监测,以判断自身的硬件状态是否存在异常。并且,通过对自身的硬件状态进行监控,主用板可以获得第一监控结果,该第一监控结果可以用于表明主用板的硬件状态是否存在异常。
并且,在具体的实施过程中,主用板对自身进行硬件状态监控可以是周期性地执行的,即主用板可以周期性地对自身进行硬件状态监控,并且周期性地获得第一监控结果。
步骤102:根据第一监控结果确定主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板。
本发明实施例中,主用板根据第一监控结果确定主用板的硬件状态发生异常时,可以主动进行工作模式切换。其中,确定主用板的硬件状态发生异常可以是确定主用板在硬件上发生了预设的故障,也可以是主用板的硬件状态发生异常的数量达到一个预设数量,等等。
在主用板进行工作模式切换的过程中,硬件状态发生异常的主用板可以选取一个备用板设置为新的主用板,并且将硬件工作状态发生异常的主用板设置为新的备用板。
请参见图3,在备用板监控主用板部分中,监控方法包括如下步骤:
步骤111:选取第一备用板对数字板组中的主用板进行软件状态监控,获得第二监控结果。
本发明实施例中,备用板可以对主用板进行软件状态监控,通过对主用板的软件状态监控获得的第二监控结果,可以反映主用板的软件是否工作正常,并且,也可以体现主用板本身是否正常工作以保证软件的正常运行。举例来说,对主用板进行软件状态监控可以是监控主用板上运行的监控系统软件是否正常运行,也可以是监控主用板上运行的全局管理软件是否正常运行,也可以是对主用板上运行的其它软件进行监控,也可以是对主用板上运行的全部软件进行监控,等等。
本发明实施例中,该数字板组中可以包括有至少一个备用数字板。在通过备用板对主用板进行软件状态监控的过程中,可以从至少一个备用板中选取第一备用板对主用板进行软件状态监控。
在具体的实施过程中,当至少一个备用板为多个备用板,该第一备用板可以是至少一个备用板中的任一个备用板,例如可以是至少一个备用板中优先级最高的备用板,或者是至少一个备用板中随机的一个备用板;而当至少一个备用板仅包括一个备用板时,该第一备用板即为至少一个备用板中唯一包括的那个备用板。
本发明实施例中,备用板可以对主用板的软件状态进行监测,以判断主用板的软件状态是否存在异常。并且,通过对主用板的软件状态的进行监控,备用板可以获得第二监控结果,该第二监控结果可以用于表明主用板的软件状态是否存在异常。
并且,在具体的实施过程中,备用板对主用板进行软件状态监控可以是周期性地执行的,即备用板可以周期性地对主用板进行软件状态监控,并且周期性地获得第二监控结果。
步骤112:根据第二监控结果确定主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板。其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
本发明实施例中,备用板根据第二监控结果确定主用板的软件状态发生异常时,可以进行工作模式切换。在进行工作模式切换的过程中,一方面,第一备用板可以将软件工作状态发生异常的主用板设置为新的备用板,另一方面,第一备用板可以将第二备用板设置为新的主用板,即可以将第二备用板的工作模式更改为主用板以完成设置。
在具体的实施过程中,第一备用板和第二备用板为同一个数字板或不同的数字板,第一备用板可以直接将自身设置为主用板,也可以从该数字板组当前的其它备用板中选取另一个备用板设置为新的主用板。
在一种可能的实施方式中,主用板还可以对至少一个备用板进行软件状态监控,获得第三监控结果,并且,在根据第三监控结果确定至少一个备用板中存在软件工作状态异常的备用板时,修复存在软件工作状态异常的备用板。
本发明实施例中,主用板对备用板进行软件状态监控可以是与备用板对主用板进行软件状态监控同时进行的,也就是说,本发明实施例中,主用板和备用板之间可以相互进行监控,以保证通信设备的稳定性。
本发明实施例中,主用板修复软件工作状态异常的备用板可以控制软件工作状态异常的备用板上的故障软件进行复用、更新等操作。
举例来说,当确定备用板上运行的Standby监控软件发生故障时,主用板可以通知软件工作状态异常的备用板上运行的全局管理软件对Standby监控软件进行复位,当复位后,主用板确定该软件工作状态异常的备用板上的Standby监控软件仍然存在异常时,主用板可以通过该全局管理软件对Standby监控系统软件进行软件同步更新。
在一种可能的实施方式中,步骤102选取第一备用板对数字板组中的主用板进行软件状态监控,获得第二监控结果的实施过程中,可以通过选取的第一备用板周期性地向主用板发送第一心跳确认信息,并确定是否在发送第一心跳确认信息后的第一预设时长内接收到主用板发送的第一心跳响应信息,以生成第二监控结果。也就是说,第一备用板可以通过向主用板发送心跳确认包,判断主用板心跳响应是否正常的方式来判断主用板的软件状态是否正常。
本发明实施例中,主用板和备用板之间的发送心跳确认信息和心跳响应信息,可以是通过数字板之间的以太网连接来传输的。
举例来说,第一备用板上的Standby监控系统软件可以不断地向主用板上的Active监控系统软件发送第一心跳确认信息。正常的情况下,当Active监控系统软件接收第一心跳确认信息后,就会在规定的时长内向该Standby监控系统软件回发对应的第一心跳响应信息,以表示自己工作正常,Standby监控系统软件接收到该对应的第一心跳响应信息后,则可以确定Active监控系统软件工作正常。但是,当Active监控系统软件发生异常时,如Active监控系统软件运行失败时,Standby监控系统软件就无法收到对应的第一心跳响应信息,则可以确定Active监控系统软件工作异常。
例如,Standby监控系统软件可以每3秒发送第一心跳确认信息给Active监控系统软件,当连续3分15秒内未收到Active监控系统软件回发的第一心跳确认信息时,可以确定Active监控系统软件发生异常。
在一种可能的实施方式中,通过主用板对至少一个备用板进行软件状态监控,获得第三监控结果的实施过程中,可以通过主用板针对至少一个备用板中的任一备用板周期性地执行以下操作:
向备用板发送第二心跳确认信息,并确定是否在发送第二心跳确认信息后的第二预设时长内接收到该备用板发送的第二心跳响应信息,以生成第三监控结果。
在具体的实施过程中,当至少一个备用板为多个备用板时,主用板可以分别向每个备用板发送第二心跳确认信息,分别计录接收对应的第二心跳确认信息的时长;当至少一个备用板为一个备用板时,主用板可以仅向该一个备用板发送第二心跳确认信息,并计录接收对应的第二心跳确认信息的时长。
以主用板确定其中一个备用板上运行的Standby监控系统软件的工作状态为例,主用板上的Active监控系统软件每3秒向Standby监控系统发送一次第二心跳确认信息,当Active监控系统软件在3分钟内接收到该Standby监控系统回应的第二心跳确认信息,则可以确定该Standby监控系统软件工作正常,当Active监控系统软件3分钟内未收到该Standby监控系统回应的第二心跳确认信息,则可以确定该Standby监控系统工作异常。
并且,当Standby监控系统软件在一预设时长内(如3分15秒)未接收到Active监控系统软件发送的第二心跳确认信息时,也可以确定Active监控系统软件工作异常。
本发明实施例中,第一预设时长和第二预设时长相同或不相同。
在一种可能的实施方式中,通信设备还包括至少一组功能模块,该至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块。本发明实施例中,可以通过主用板对该至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果。并且,主用板根据第四监控结果确定该至少一组功能模块中的第一主用功能模块发生异常时,从第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将第一主用功能模块设置为新的备用功能模块。
本发明实施例中,至少一组功能模块可以是通信设备用于实现通信功能的硬件装置,例如功能模块可以是功放模块、低噪放模块,等等。
举例来说,以通信设备中可以包括的一组功放模块来举例,假设该组功放模块中包括有3个功放模块,其中包括1个主用功放模块和2个备用功放模块。当主用板通过监控确定该主用功放模块发生异常时,主用板可以从这2个备用功放模块中选取一个备用功放模块设置为新的主用功放模块,并且,将该发生异常的主用功放模块设置为新的备用功放模块。
在一种可能的实施方式中,通信设备还包括与该数字板组连接的逻辑器件。该逻辑器件可以是可编程的逻辑器件,例如可以是复杂可编程逻辑器件(ComplexProgrammable Logic Device,CPLD)。该逻辑器件记录有各个数字板的数字板状态信息。其中,数字板状态信息可以包括有数字板的工作模式信息,也可以包括有数字板的告警信息,等等。
在具体的实施过程中,各个数字板可以将自身的数字板状态信息传输到逻辑器件上的各自对应的端口。逻辑器件可以记录下各个数字板的数字板状态信息。例如,数字板可以将产生的告警信息发送至逻辑器件,逻辑器件可以记录下获得的告警信息。又例如,数字板可以将修改后的工作模式信息发送至逻辑器件,数字板可以记录下数字板发送的工作模式信息,等等。本发明实施例中,数字板也可以是以电平信号的形式向逻辑器件发送信息。
并且,本发明实施例中,当逻辑器件检测到数字板掉电时,可以修改掉电的数字板的数字板状态信息。例如,当逻辑器件检测到主用板掉电时,逻辑器件可以修改掉电的主用板的工作模式信息中的工作模式为备用板,并且,逻辑器件可以从至少一个备用板中选取一个备用板作为新的主用板,并修改所选取的一个备用板的工作模式信息中的工作模式为主用板。
并且,本发明实施例中,该数字板组还可以与一切换开关连接,该切换开关可以发送切换指令,以指示数字板进行工作模式切换。数字板进行工作模式切换时,可以将修改后的工作模式信息发送至逻辑器件。
本发明实施例中,步骤101中,通过主用板对主用板进行硬件状态监控,获得第一监控结果的过程中,通过主用板周期性地从逻辑器件读取主用板的数字板状态信息,并根据数字板状态信息确定主用板的硬件工作状态是否发生异常,以生成第一监控结果。
在具体的实施过程中,可以是主用板上运行的Active监控系统从逻辑器件读取主用板的数字板状态信息,在读取到主用板的数字板状态信息后,可以根据数字板状态信息的内容生成第一监控结果。
举例来说,当读取到的数字板状态信息中包括告警信息时,生成的第一监控结果中可以确认主用板发生了异常,需要切换主备用数字板;当读取到的数字板状态信息中包括的工作模式信息表明该当前的主用板的工作模式不再是主用板时,生成的第一监控结果中可以确认主用板发生了异常,需要切换主备用数字板。
在一种可能的实施方式中,与数字板连接的逻辑器件还可以与该至少一组功能模块中的各功能模块连接。
在具体的实施过程中,各功能模块可以将自身的功能模块状态信息传输到逻辑器件上的各自对应的端口。逻辑器件可以记录下各个功能模块的功能模块状态信息。例如,功能模块可以将产生的告警信息发送至逻辑器件,逻辑器件可以记录下获得的告警信息,等等。本发明实施例中,数字板也可以是以电平信号的形式向逻辑器件发送信息。
并且,本发明实施例中,当逻辑器件检测到功能模块掉电时,可以修改掉电的功能模块的功能模块状态信息。例如,当逻辑器件检测到某个主用功能模块掉电时,逻辑器件可以修改掉电的该主用功能模块的工作模式信息中的工作模式为备用功能模块,并且,逻辑器件可以从该掉电的主用功能模块所在一组功能模块中选取一个备用功能模块作为新的主用功能模块,并修改所选取的一个备用功能模块的工作模式信息中的工作模式为主用功能模块。
并且,本发明实施例中,数字板还可以与用于控制至少一组功能模块的至少一个功能模块切换开关连接,其中每个功能模块切换开关用于切换对应的一组功能模块中功能模块的工作模式,功能模块切换开关可以发送功能模块切换指令至主用板,主用板可以根据功能模块切换指令,通过逻辑器件直接修改该功能模块切换指令所指示切换的功能模块的工作模式信息。
本发明实施例中,通过主用板对至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果的实施过程中,可以通过主用板针对至少一组功能模块中的任一组功能模块周期性地执行以下操作:
从逻辑器件中读取一组功能模块中的主用功能模块的功能模块状态信息,并根据该功能模块状态信息,确定该一组功能模块中的主用功能模块是否发生异常,以生成第四监控结果。
在一种可能的实施方式中,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板,可以通过如下的方式实现:
硬件工作状态发生异常的主用板可以向逻辑器件发送第一切换指令,该第一切换指令用于指示逻辑器件更新所选取的一个备用板的工作模式标记(即工作模式信息)为主用板,以使该所选取的一个备用板从逻辑器件读取到更新后的工作模式信息后,切换自身的工作模式为主用板;以及
并且,硬件工作状态发生异常的主用板可以切换自身的工作模式为备用板,在具体的实施过程中,该异常的主用板可以是通过自身的全局管理软件切换自身的监控系统软件的工作模式为Standby,也可以是向逻辑器件发送一切换指令,该切换指令用于指示逻辑器件更新该硬件工作状态发生异常的主用板的工作模式标记为备用板。
在一种可能的实施方式中,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,可以通过如下的方式实现:
第一备用板向逻辑器件发送第二切换指令,该第二切换指令用于指示逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从所述逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;
以及,第一备用板将第二备用板的工作模式切换为主用板,在具体的实施过程中,可以是第一备用板向逻辑器件发送一切换指令,该切换指令用于指示逻辑器件更新第二备用板的工作模式标记为主用板。并且,第一备用板和第二备用板可以为同一个数字板或不同的数字板,当第一备用板和第二备用板为同一个备用板时,第一备用板还可以是通过自身的全局管理软件切换自身的监控系统软件的工作模式为Active。
本发明实施例中,在将硬件工作状态发生异常的主用板设置为新的备用板后,还可以对该存在异常的新的备用板进行修复,例如对该存在异常的新的备用板的PM8910、现场可编程门阵列(Field-Programmable Gate Array,FPGA)进行重配修复。
本发明实施例中,主用板和第一备用板可以同时监控所有的主备数字板、主备功能模块,但备用板上的Standby监控系统软件处于监控失效状态,即不能控制切换主备功能模块。当主备数字板发生工作模式转换时,新的主用板上的监控系统软件立即由监控失效状态变为监控激活状态。
本发明实施例中,在设置备用板为新的主用板时,还会先确定该备用板是否异常,如果该备用板工作异常则不会将该备用板设置为新的主用板。以及,本发明实施例中,在设置备用功能模块为新的主用功能模块时,还会先确定该备用功能模块是否异常,如果该备用功能模块工作异常则不会将该备用功能模块设置为新的主用功能模块。
本发明实施例中,为了保证主备功能模块切换后信号增益的一致性,对于主备功能模块的硬件差异,可以使用独立的文件进行补偿,保证主备功能模块切换后信号增益的一致性。
具体来说,可以预先对主备模块进行高低温测试,以生成主备模块各自的温度补偿文件;以及可以对主备模块进行定标,以生成不同的定标数据文件,在配置通信设备时,可以将这些温度补偿文件、定标数据文件存储在通信设备中。其中,主备模块可以包括主备数字板和/或主备功能模块。
Active监控系统软件和Standby监控系统软件启动后,可以分别根据各自所在数字板的加载各自的温度补偿文件,并将各个模块不同的定标数据文件设置给各组模块的FPGA,并根据当前主用模块的角色,控制各FPGA使用主用模块对应的定标数据文件。
本发明实施例中,通信设备包括有一组用于监控通信设备的数字板,该数字板组中包括一个主用板和至少一个备用板,主用板和备用板互为备份,因而,在当前的主用板发生故障时,能够进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,主用板对自身的硬件状态进行监控,当确定主用板的硬件状态发生异常时,主用板可以主动地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,选取第一备用板对主用板进行软件状态监控,当确定主用板的软件工作状态发生异常时,可以及时地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,通过对主用板在硬件状态和软件状态的全方位监视,可以及时有效地发现主用板发生的故障,以在最短的时间内启动主用板和备用板的切换,提高通信设备的可靠性。
进一步地,本发明实施例中,当主用板发生故障时,仅仅对主用板和备用板进行切换,其它的硬件装置无需进行切换,使得整个切换的过程耗时更短,能够更为快速地恢复正常通信。
实施例二
基于同一发明构思,本发明实施例提供一种通信设备,该通信设备包括数字板组,用于监控通信设备运行,该数字板组中包括一个主用板和至少一个备用板。在具体的实施过程中,该通信设备实施例一中的通信设备,即可以是图1所示的通信设备。
并且,由于本发明实施例提供的通信设备可以用于执行前述的通信设备的监控方法,因此对于本发明实施例中的通信设备中各部件或模块所能够实现的功能及一些实现过程可参考前述的通信设备的监控方法的实施例中的描述,在此不再赘述。其中:
主用板,用于对主用板进行硬件状态监控,获得第一监控结果,根据第一监控结果确定主用板的硬件工作状态发生异常时,选取一个备用板设置为新的主用板,以及将硬件工作状态发生异常的主用板设置为新的备用板;以及,
第一备用板,用于对数字板组中的主用板进行软件状态监控,获得第二监控结果,根据第二监控结果确定主用板的软件工作状态发生异常时,将第二备用板设置为新的主用板,以及将软件工作状态发生异常的主用板设置为新的备用板,其中,第一备用板和第二备用板为同一个数字板或不同的数字板。
在一种可能的实施方式中,主用板还用于:
对至少一个备用板进行软件状态监控,获得第三监控结果,根据第三监控结果确定至少一个备用板中存在软件工作状态异常的备用板时,修复存在软件工作状态异常的备用板。
在一种可能的实施方式中,第一备用板用于:
周期性地执行以下操作:向主用板发送第一心跳确认信息,并确定是否在发送第一心跳确认信息后的第一预设时长内接收到主用板发送的第一心跳响应信息,以生成第二监控结果;
主用板用于:
针对至少一个备用板中的任一备用板周期性地执行以下操作:向任一备用板发送第二心跳确认信息,并确定是否在发送第二心跳确认信息后的第二预设时长内接收到任一备用板发送的第二心跳响应信息,以生成第三监控结果。
在一种可能的实施方式中,通信设备还包括至少一组功能模块,至少一组功能模块中的任一组功能模块包括互为备份的一个主用功能模块和至少一个备用功能模块,主用板还用于:
对至少一组功能模块包括的所有主用功能模块进行监控,获得第四监控结果,根据第四监控结果确定至少一组功能模块中的第一主用功能模块发生异常时,从第一主用功能模块所在的一组功能模块中,选取一个备用功能模块设置为新的主用功能模块,以及将第一主用功能模块设置为新的备用功能模块。
在一种可能的实施方式中,通信设备还包括与数字板组连接的逻辑器件,主用板用于:
周期性地执行以下操作:从逻辑器件读取主用板的数字板状态信息,并根据数字板状态信息确定主用板的硬件工作状态是否发生异常,以生成第一监控结果;
逻辑器件还与至少一组功能模块连接,主用板用于:
针对至少一组功能模块中的任一组功能模块周期性地执行以下操作:从逻辑器件中读取任一组功能模块中的主用功能模块的功能模块状态信息,并根据功能模块状态信息,确定任一组功能模块中的主用功能模块是否发生异常,以生成第四监控结果。
在一种可能的实施方式中,通信设备包括与数字板组连接的逻辑器件,硬件工作状态发生异常的主用板用于:
向逻辑器件发送第一切换指令,第一切换指令用于指示逻辑器件更新选取的一个备用板的工作模式标记为主用板,以使选取的一个备用板从逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为主用板;以及,切换自身的工作模式为备用板;
第一备用板用于:
向逻辑器件发送第二切换指令,第二切换指令用于指示逻辑器件更新软件工作状态发生异常的主用板的工作模式标记为主用板,以使软件工作状态发生异常的主用板从逻辑器件读取到更新后的工作模式标记后,切换自身的工作模式为备用板;以及,将第二备用板的工作模式切换为主用板。
实施例三
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序指令,当计算机程序指令被加载并运行时,可以执行如第一方面所述的通信设备的监控方法。并且,执行通信设备的监控方法时的具体实施过程可以参照第一方面的描述,在此不再赘述。
在具体的实施过程中,计算机可读存储介质包括:通用串行总线闪存盘(Universal Serial Bus flash drive,USB)、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的存储介质。
上述技术方案中的一个或多个技术方案,具有如下技术效果或优点:
本发明实施例中,通信设备包括有用于监控通信设备的数字板组,该数字板组中包括一个主用板和至少一个备用板,主用板和备用板互为备份,因而,在当前的主用板发生故障时,能够进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,主用板对自身的硬件状态进行监控,当确定主用板的硬件状态发生异常时,主用板可以主动地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,选取第一备用板对主用板进行软件状态监控,当确定主用板的软件工作状态发生异常时,可以及时地进行主用板和备用板的切换,保障通信设备正常运行。
进一步地,本发明实施例中,通过对主用板在硬件状态和软件状态的全方位监视,可以及时有效地发现主用板发生的故障,以在最短的时间内启动主用板和备用板的切换,提高通信设备的可靠性。
进一步地,本发明实施例中,当主用板发生故障时,仅仅对主用板和备用板进行切换,其它的硬件装置无需进行切换,使得整个切换的过程耗时更短,能够更为快速地恢复正常通信。
进一步地,本发明实施例中,主用板对至少一个备用板进行软件状态监控,并且在检测到存在软件工作状态异常的备用板时,修复存在软件工作状态异常的备用板,一方面可以保证主用板故障时,可以切换到能够正常工作的备用板,另一方面可以保证备用板能够正常地对主用板的工作状态进行监控。通过主用板和备用板之间的相互监控,提高通信设备的稳定性。
进一步地,本发明实施例中,主用板对至少一组功能模块进行监控,但发现有异常的主用功能模块时,可以及时地进行主备用功能模块的切换,保障通信设备正常运行。
进一步地,本发明实施例中,在进行主备模块切换时,通过加载对应的温度补偿文件和定标数据文件,可以保证主备模块切换前后通信设备信号增益的一致性。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。