CN1859203A - 系统反复启动故障的定位方法及其装置 - Google Patents
系统反复启动故障的定位方法及其装置 Download PDFInfo
- Publication number
- CN1859203A CN1859203A CN 200610034487 CN200610034487A CN1859203A CN 1859203 A CN1859203 A CN 1859203A CN 200610034487 CN200610034487 CN 200610034487 CN 200610034487 A CN200610034487 A CN 200610034487A CN 1859203 A CN1859203 A CN 1859203A
- Authority
- CN
- China
- Prior art keywords
- user
- administration module
- parameter
- subsystem
- report
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Stored Programmes (AREA)
Abstract
本发明公开一种系统反复启动故障的定位方法及其装置,该装置包括前管理模块和后管理模块,其中前管理模块子系统包括操作系统和业务模块,操作系统中配置有故障定位模块和上报异常启动报告模块。该方法包括前管理模块子系统在启动过程中,操作系统对加载的软件和数据文件的源头和版本是否一致进行核查,业务模块对数据文件的配置参数的正确性进行检查,由操作系统记录各个进程和线程的启动过程,若系统启动异常,则故障定位模块定位并记录导致异常情况的故障原因,上报异常启动报告模块将故障原因通知用户,由用户进行相应处理。通过采用这种方法,能够保证通信系统可靠、稳定、安全地运行,大大加强系统的鲁棒性。
Description
技术领域
本发明是有关一种通信系统,特别是涉及一种系统反复启动故障的定位方法及其装置。
背景技术
如图1所示,通信设备系统一般分为后管理模块(Back AdministrationModule,BAM)和前管理模块(Front Administration Module,FAM)。后管理模块和前管理模块通过通信链路相互连接起来。后管理模块主要提供数据管理、告警管理、性能管理、软件管理等功能,保证前管理模块上报的信息(包括告警、性能等)能及时反馈给用户;另外,后管理模块还保存各个子系统所需要的软件和数据文件,保证前台各个子系统能够正常的加载软件和数据文件。
为了保证前台各个子系统加载的软件能够可靠启动、运行,FAM各个子系统都有对加载的软件和数据文件版本是否一致进行核查以及对数据文件的各个配置参数的正确性进行检查,以防止本子系统出现由于版本不一致以及配置的数据参数错误,导致出现系统运行异常,甚至宕机的致命事故。
然而,在现有的通信系统中,FAM各个子系统在启动过程中存在两种现况:一、FAM各个子系统不检查本子系统加载的软件和数据文件版本是否一致以及对数据文件中的各个配置参数是否正确,系统启动以后出现链路配置成功但是由于参数不正确,导致与对端设备(即与该通信设备相连的其他通信设备)无法对通;二、虽然FAM各个子系统检查本子系统加载的软件和数据文件版本是否一致以及对数据文件中的各个配置参数是否正确,但如果出现加载的软件和数据文件版本不一致或者数据文件中的各个配置参数不正确就直接复位本子系统,并不告知用户(本发明所称用户是指设备维护人员)是何原因导致的复位,这样导致子系统反复启动而用户却无法究其原因,用户很难定位并针对这种异常问题进行处理,设备可服务性和可用性大大下降。
发明内容
有鉴于此,本发明所要解决的主要技术问题是在于提供一种系统反复启动故障的定位方法及其装置,解决系统反复启动而用户却无法究其原因的问题,保证通信系统能够可靠、稳定、安全地运行。
为解决上述主要技术问题,本发明是通过采用如下技术方案来实现的:
一种系统反复启动故障的定位方法,其包括在具有前管理模块和后管理模块的通信系统中,当FAM子系统在启动过程中,FAM子系统的操作系统对加载的软件和数据文件的源头和版本是否一致进行核查,FAM子系统的业务模块对数据文件的配置参数的正确性进行检查,由FAM子系统中的操作系统记录各个进程和线程的启动过程,若系统启动异常,则FAM子系统检查定位出导致系统启动异常的故障原因,通过上报异常启动报告将故障原因通知用户,由用户进行相应处理。
本发明还提供了一种系统反复启动故障的定位装置,其包括前管理模块和后管理模块,其中前管理模块子系统包括操作系统和业务模块,操作系统用于核查加载的软件和数据文件的源头和版本是否一致,业务模块用于检查数据文件的配置参数的正确性,前管理模块子系统的操作系统中配置有故障定位模块和上报异常启动报告模块,当前管理模块子系统在启动过程中,若系统启动异常,则故障定位模块定位并记录导致系统异常启动的故障原因,并将故障原因传递给上报启动报告模块,上报启动报告模块将故障原因通知给用户,由用户进行相应处理。
与现有技术相比,本发明通过记录导致系统异常启动的故障原因,然后通过上报异常启动报告通知用户,让用户进行相关的处理,从而能够保证通信系统可靠、稳定、安全地运行;解决由于软件版本与数据文件版本不一致导致系统无法启动,提高产品的可用性和可服务性;解决由于配置参数范围或参数约束关系检查失败导致系统无法启动,提高产品的可用性和可服务性;通过上报启动报告的形式和解决由于约束关系而导致启动无法启动的问题,大大加强系统的鲁棒性。
附图说明
图1是一种典型的通信设备系统的示意图。
图2是根据本发明具体实施方式的FAM子系统启动过程中的流程图。
具体实施方式
为了使本发明的特征和优点更加清楚明白,下面参照附图结合具体实施例对本发明作进一步的描述。
本发明具体实施例的一种系统反复启动故障的定位方法及其装置,其发明基本思路是:系统在启动过程中记录导致系统异常启动的故障原因,通过上报异常启动报告将故障原因通知用户,用户根据异常启动报告提供的帮助信息和操作指导书进行相应处理。
本发明具体实施例的一种系统反复启动故障的定位方法,其包括在具有前管理模块(Front Administration Module,FAM)和后管理模块(BackAdministration Module,BAM)的通信系统中,当FAM子系统在启动过程中,FAM子系统的操作系统对加载的软件和数据文件的源头和版本是否一致进行核查,FAM子系统的业务模块对数据文件的配置参数的正确性进行检查,由FAM子系统中的操作系统记录各个进程和线程的启动过程,若系统启动异常,则FAM子系统的操作系统记录由于软件约束检查导致的在启动过程中发生的异常,这些异常可能影响系统正常运行,通过上报异常启动报告提醒用户获取启动报告中记录的故障原因,为用户采取相应措施提供参考信息。但是,如果属于软件不可规避的缺陷或者是硬件异常,导致的软件启动异常则不适用于本发明的异常启动报告范围。
本发明的一种系统反复启动故障的定位方法通过上报异常启动报告通知用户系统在启动过程中是否出现异常,其具体实现方式如下,参阅图2所示:
FAM子系统中的操作系统先加载软件,在软件加载的过程中,FAM子系统中的操作系统要求从BAM加载软件,FAM子系统启动,在启动过程中,再加载由用户配置的数据文件,FAM子系统中的操作系统记录各个进程和线程启动过程,
(1)在数据文件加载过程中,FAM子系统中的操作系统检查数据文件加载的源头,如果是从FLASH加载,则重启FAM子系统软件,要求从BAM加载数据文件以确保软件与数据文件加载源头的一致性。
(2)从BAM加载数据文件后,当加载的软件版本和数据文件版本不匹配时,操作系统记录异常报告,继续初始化流程,等软件初始化完成以后,上报软件版本与数据文件版本不一致启动报告给用户,让用户进行相关的处理。
(3)在数据文件加载成功以后,FAM子系统中的各个业务模块需要从数据文件中读取相关的配置参数,如果读取配置数据失败,则并不复位系统而是记录异常启动报告,同时业务模块将参数其赋值为缺省参数,等系统启动以后,上报读取数据文件失败的启动报告,让用户进行相关的处理。
(4)从数据文件中读取相关的配置参数成功后,FAM子系统的业务模块检查参数范围或参数约束关系是否成功,如果参数范围或参数约束关系检查失败,则并不复位系统而是记录异常启动报告,同时业务模块将参数其赋值为缺省参数,等系统启动以后,上报参数范围或参数约束关系检查失败的启动报告,让用户进行相关的处理。
本发明的一种系统反复启动故障的定位装置,其包括前管理模块和后管理模块,其中前管理模块子系统包括操作系统和业务模块,操作系统核查加载的软件和数据文件的源头和版本是否一致,业务模块检查数据文件的配置参数的正确性,另外,在前管理模块子系统的操作系统中配置有故障定位模块和上报异常启动报告模块,当前管理模块子系统在启动过程中,若系统启动异常,则故障定位模块定位并记录导致系统异常启动的故障原因,并将故障原因传递给上报启动报告模块,上报启动报告模块将故障原因通知给用户,由用户进行相应处理。
需注意的是,图2所示的流程图仅为本发明的其中一个实施例,惟,本发明并不仅仅局限于该实施例,其中FAM子系统对于加载的软件和数据文件的源头是否一致的检查,对于加载的软件和数据文件的版本是否匹配的检查,对于从数据文件中读取相关的配置参数是否成功的检查,以及对于配置参数的范围或约束关系是否成功的检查四个步骤并不存在先后关系,该四个步骤可以叠加进行检查,只要其中某一步骤出现异常,则FAM子系统记录导致系统启动异常的故障原因,通过上报相应的异常启动报告将故障原因通知用户,由用户针对该故障原因进行相应的处理。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1、一种系统反复启动故障的定位方法,其包括在具有前管理模块和后管理模块的通信系统中,其特征在于,当前管理模块子系统在启动过程中,若系统启动异常,则前管理模块子系统定位异常情况,将故障原因通知用户,由用户进行相应处理。
2、根据权利要求1所述的方法,其特征在于,该方法包括前管理模块子系统中的操作系统检查数据文件和软件加载的源头是否一致,若不一致,则要求从同一源头加载数据文件。
3、根据权利要求1或2所述的方法,其特征在于,该方法包括前管理模块子系统中的操作系统检查加载的软件版本和数据文件版本是否匹配,若不匹配,则前管理模块子系统中的操作系统记录异常报告,继续初始化流程,等软件初始化完成以后,上报软件版本与数据文件版本不一致启动报告给用户,让用户进行相关的处理。
4、根据权利要求1或2所述的方法,其特征在于,该方法包括前管理模块子系统中的业务模块检查从数据文件中读取的相关配置参数是否成功,若读取配置参数失败,并不复位系统而是记录异常启动报告;同时业务模块将参数其赋值为缺省参数,等系统启动以后,上报读取配置参数失败的启动报告给用户,让用户进行相关的处理。
5、根据权利要求3所述的方法,其特征在于,该方法包括前管理模块子系统中的业务模块检查从数据文件中读取的相关配置参数是否成功,若读取配置参数失败,并不复位系统而是记录异常启动报告;同时业务模块将参数其赋值为缺省参数,等系统启动以后,上报读取配置参数失败的启动报告给用户,让用户进行相关的处理。
6、根据权利要求1或2所述的方法,其特征在于,该方法包括前管理模块子系统中的业务模块检查配置参数的范围或约束关系是否成功,若检查失败,并不复位系统而是记录异常启动报告;同时前管理模块子系统中的业务模块将参数其赋值为缺省参数,等系统启动以后,上报参数范围或参数约束关系检查失败的启动报告给用户,让用户进行相关的处理。
7、根据权利要求3所述的方法,其特征在于,该方法包括前管理模块子系统中的业务模块检查配置参数的范围或约束关系是否成功,若检查失败,并不复位系统而是记录异常启动报告;同时前管理模块子系统中的业务模块将参数其赋值为缺省参数,等系统启动以后,上报参数范围或参数约束关系检查失败的启动报告给用户,让用户进行相关的处理。
8、根据权利要求4所述的方法,其特征在于,该方法包括前管理模块子系统中的业务模块检查配置参数的范围或约束关系是否成功,若检查失败,并不复位系统而是记录异常启动报告;同时前管理模块子系统中的业务模块将参数其赋值为缺省参数,等系统启动以后,上报参数范围或参数约束关系检查失败的启动报告给用户,让用户进行相关的处理。
9、根据权利要求5所述的方法,其特征在于,该方法包括前管理模块子系统中的业务模块检查配置参数的范围或约束关系是否成功,若检查失败,并不复位系统而是记录异常启动报告;同时前管理模块子系统中的业务模块将参数其赋值为缺省参数,等系统启动以后,上报参数范围或参数约束关系检查失败的启动报告给用户,让用户进行相关的处理。
10、一种系统反复启动故障的定位装置,其包括前管理模块和后管理模块,其中前管理模块子系统包括操作系统和业务模块,其特征在于,前管理模块子系统的操作系统中配置有故障定位模块和上报启动报告模块,当前管理模块子系统在启动过程中,若系统启动异常,则故障定位模块定位并记录导致系统异常启动的故障原因,并将故障原因传递给上报启动报告模块,上报启动报告模块将故障原因通知给用户,由用户进行相应处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100344870A CN100471130C (zh) | 2006-03-15 | 2006-03-15 | 系统反复启动故障的定位方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100344870A CN100471130C (zh) | 2006-03-15 | 2006-03-15 | 系统反复启动故障的定位方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1859203A true CN1859203A (zh) | 2006-11-08 |
CN100471130C CN100471130C (zh) | 2009-03-18 |
Family
ID=37298069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006100344870A Active CN100471130C (zh) | 2006-03-15 | 2006-03-15 | 系统反复启动故障的定位方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100471130C (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102316503A (zh) * | 2011-09-30 | 2012-01-11 | 大唐移动通信设备有限公司 | 一种rru的故障处理方法及装置 |
CN103713920B (zh) * | 2011-06-20 | 2017-11-14 | 北京奇虎科技有限公司 | 便携设备操作系统启动保护方法和装置 |
CN111427676A (zh) * | 2020-03-20 | 2020-07-17 | 达而观信息科技(上海)有限公司 | 一种机器人流程自动化任务处理方法及装置 |
CN111858114A (zh) * | 2019-04-30 | 2020-10-30 | 阿里巴巴集团控股有限公司 | 设备启动异常处理,设备启动控制方法、装置及系统 |
CN113672907A (zh) * | 2021-07-29 | 2021-11-19 | 济南浪潮数据技术有限公司 | 基于JVM沙箱与黑白名单的Java安全防范方法、装置及介质 |
-
2006
- 2006-03-15 CN CNB2006100344870A patent/CN100471130C/zh active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103713920B (zh) * | 2011-06-20 | 2017-11-14 | 北京奇虎科技有限公司 | 便携设备操作系统启动保护方法和装置 |
CN102316503A (zh) * | 2011-09-30 | 2012-01-11 | 大唐移动通信设备有限公司 | 一种rru的故障处理方法及装置 |
CN102316503B (zh) * | 2011-09-30 | 2014-09-10 | 大唐移动通信设备有限公司 | 一种rru的故障处理方法及装置 |
CN111858114A (zh) * | 2019-04-30 | 2020-10-30 | 阿里巴巴集团控股有限公司 | 设备启动异常处理,设备启动控制方法、装置及系统 |
CN111427676A (zh) * | 2020-03-20 | 2020-07-17 | 达而观信息科技(上海)有限公司 | 一种机器人流程自动化任务处理方法及装置 |
CN111427676B (zh) * | 2020-03-20 | 2024-03-29 | 达观数据有限公司 | 一种机器人流程自动化任务处理方法及装置 |
CN113672907A (zh) * | 2021-07-29 | 2021-11-19 | 济南浪潮数据技术有限公司 | 基于JVM沙箱与黑白名单的Java安全防范方法、装置及介质 |
CN113672907B (zh) * | 2021-07-29 | 2023-12-22 | 济南浪潮数据技术有限公司 | 基于JVM沙箱与黑白名单的Java安全防范方法、装置及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN100471130C (zh) | 2009-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107678936B (zh) | 业务系统预先稽查方法、服务器及计算机可读存储介质 | |
CN1859203A (zh) | 系统反复启动故障的定位方法及其装置 | |
US9075695B2 (en) | Version conflict checking to installable unit | |
CN112286709B (zh) | 一种服务器硬件故障的诊断方法、诊断装置及诊断设备 | |
GB2493828A (en) | Linking a test case error to a code segment to re-execute the test when the code segment is modified | |
CN104216746B (zh) | 一种星上设备dsp程序地面在线烧写的实时监控和校验方法 | |
US20120278900A1 (en) | Systems and methods for regulatory compliance with qualified systems | |
CN112561370A (zh) | 软件发版的管理方法、装置、计算机设备及存储介质 | |
CN107817729B (zh) | 电子产品回收测试方法、存储介质及设备 | |
CN113220777A (zh) | 业务数据处理方法、装置、计算机设备及存储介质 | |
CN112233268A (zh) | 一种电力生产现场作业方法、移动终端、巡检设备及系统 | |
CN115757099A (zh) | 平台固件保护恢复功能自动测试方法和装置 | |
CN106528248B (zh) | 一种移动终端基于软件完整性的下载方法及系统 | |
CN114138600A (zh) | 一种固件关键信息的存储方法、装置、设备及存储介质 | |
CN112069009A (zh) | 一种在Recovery模式下进行压力测试的方法、装置和终端设备 | |
US7210070B2 (en) | Maintenance interface unit for servicing multiprocessor systems | |
CN111737132B (zh) | 项目代码数据的发布方法、系统、电子设备及存储介质 | |
CN111367862A (zh) | 一种检测方法、装置、存储介质及服务器 | |
CN100511161C (zh) | 一种解决芯片失效故障的方法 | |
CN114290828B (zh) | 图像形成设备的控制方法及装置 | |
JP2012256220A (ja) | 判定作業支援システム、判定作業支援方法、及びプログラム | |
CN115907520A (zh) | Rams指标确定方法、装置和电子设备 | |
JP4109447B2 (ja) | 被疑確率生成方法,被疑確率生成プログラム及びサービスプロセッサ | |
CN114625607A (zh) | 一种软件的监测方法、装置以及电子设备 | |
CN118377658A (zh) | 故障处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |