CN1490982A - 网络故障分析监测方法及装置 - Google Patents

网络故障分析监测方法及装置 Download PDF

Info

Publication number
CN1490982A
CN1490982A CNA031536328A CN03153632A CN1490982A CN 1490982 A CN1490982 A CN 1490982A CN A031536328 A CNA031536328 A CN A031536328A CN 03153632 A CN03153632 A CN 03153632A CN 1490982 A CN1490982 A CN 1490982A
Authority
CN
China
Prior art keywords
information
record
network failure
statistical
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA031536328A
Other languages
English (en)
Inventor
鑫 庞
庞鑫
陈志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJIANG GANGWAN NETWORK Co Ltd
Original Assignee
BEIJIANG GANGWAN NETWORK Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJIANG GANGWAN NETWORK Co Ltd filed Critical BEIJIANG GANGWAN NETWORK Co Ltd
Priority to CNA031536328A priority Critical patent/CN1490982A/zh
Publication of CN1490982A publication Critical patent/CN1490982A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种网络故障分析监测方法,属于计算机网络通信领域,该方法包括:在任务进行切换重新调度时,对系统日常工作的信息进行统计并记录到一个公用缓存区中,通过定时器定时从公用缓存区中搜集所统计的信息,并对统计信息进行分析监测,如监测到异常,输出到串口上给出提示警告,同时记录到系统日志中以及非易失随机存取存储器中,并可根据需要随时读取统计信息的记录。在系统发生问题时,能够提供定位的信息,以协助开发人员尽快有效的解决问题;在系统看似正常的时候,可以提早发现系统中隐藏的运行错误,及时定位、纪录、告警,提示工作人员关注问题模块。

Description

网络故障分析监测方法及装置
所属技术领域
本发明属于计算机网络通信领域,具体涉及一种网络故障分析监测方法。
背景技术
目前,系统监控的方法有很多种,但大多数都是采用轮询监测的方式,即需要由主任务定时检查一遍系统中所有需要监控的模块,同时进行信息的分析,一般来说,负责监测分析的任务优先级都较高,这样如果在监测任务中处理太多的业务,在实时操作系统中就会影响其它任务的正常执行以及正常业务的处理,因此以轮询处理的方式会大大消耗系统时间,降低系统性能。
发明内容
本发明目的:提供一种在系统任务重新调度切换时进行系统监测的网络故障分析监测方法及装置,可使开发人员快速、有效了解系统的运行情况,及时确定网络故障的所在位置。
本发明的技术内容:一种网络故障分析监测方法,包括:
(1)在任务进行切换重新调度时,对系统日常工作的信息进行统计并记录到一个公用缓存区中;
(2)通过定时器定时从公用缓存区中搜集所统计的信息,并对统计信息进行分析监测,如监测到异常,输出到串口上给出提示警告,同时记录到系统日志(syslog)中。
步骤(1)还包括给统计信息加时间戳。
在步骤(2)中所述记录还包括将信息记录在非易失随机存取存储器中。
进一步包括通过命令行读取记录并提供统计信息的输出命令。
步骤(1)中所述信息包括:通用系统信息、内存管理信息、任务信息、消息队列和信号量。
一种网络故障分析监测装置,包括:
统计模块,用于记录每一次任务切换时刻的系统日常工作中所需的统计信息:
记录模块,用于对信息进行分析监测,如果监测到异常,在日志中给出提示警告并将当前信息存放在系统日志(syslog)中作纪录;
调度模块,负责每隔一定时间,从统计模块中取得统计信息,并调用记录模块进行分析和记录。
统计模块可对所统计的信息打上时间戳标记。
记录模块可对统计信息进行管理,维护内存中的统计表,定期更新系统存储设备的纪录。
记录模块可将统计信息记录在非易失随机存取存储器中。
设置命令接口,通过该命令接口与外部的命令行模块连接,可以实现统计信息的直接读取和输出。
本发明的技术效果:在系统任务重新调度切换时,进行系统各项统计信息的统计,另外使用一个定时器定时读取统计信息进行分析和纪录,从而达到了对系统中各项性能进行全方位的实时监测和纪录的目的,如果监测到异常,可在显示屏上给出提示,报告工作人员哪一部分模块出现问题,同时将异常时刻的系统信息记录在日志和非易失随机存取存储器(Non-Volatile Random AccessMemory,NVRAM)中,并给出提示警告,以便在系统重启后,仍然有足够信息以供开发人员诊断故障所在的位置,还可根据需要随时读取统计信息的记录。本发明在系统发生问题时,能够提供丰富的故障位置的定位的信息,以协助开发人员尽快有效的解决问题。另外在系统看似正常的时候,可以提早发现系统中隐藏的运行错误,及时定位、纪录、告警,提示工作人员关注问题模块。并可按照用户需求增加统计信息的内容,具有很强的扩展性。
附图说明
本发明的示意框图。
具体实施方式
本发明提供了一种网络故障分析监测方法,参考附图,步骤1,系统运行时,在每次任务进行切换重新调度时,对系统日常工作中所需的信息进行统计,同时对所有统计信息打上时间戳,所统计的信息包括:(1)通用系统信息:包括有CPU利用率、内存占用、任务状态、(硬)中断次数、指定的变量的变化情况;(2)内存管理信息(memory,MEM):某个内存占用是否有增长情况、是否丢内存;(3)任务信息(TASK):任务标识、名称、优先级、状态;各任务执行以来CPU占用时间、上次CPU占用时间、上次被调用的时间戳、上上次被调用的时间戳、(为了得到调用频度)调度次数、被抢占次数;(4)消息队列(Message):启动以来消息总数、队列长度、等待处理消息的任务;(5)信号量(Semephore):信号量被释放总数、Take的任务列表。步骤2,使用一个定时器定时读取统计信息,对统计信息的合法性进行分析,如监测到异常,报告工作人员哪一部分模块出现问题,输出到syslog日志和串口(console)上,并在显示屏上给出提示,将异常时刻的系统信息保存到内存记录和NVRAM中。在系统重启后,由于当时的系统运行关键数据得到了保存,使开发人员可及时进行问题的定位。,
通过与外部的命令行模块连接的命令接口,实现读取记录信息,并将统计信息输出成容易理解的格式。如按时间顺序显示内存中的系统监视记录;显示重启前的系统监控模块所纪录的所有信息;显示几个重要消息队列的长度;设置内存告警的百分比,当系统使用内存达到这个数值时,系统将会提出告警信息。同时由于统计信息是采用加时间戳的方法来纪录的,所以通过显示一段时间内的统计信息就可以得到一个阶段内系统运行情况的变化,如果输入最后的时间参数,可表示显示前几秒、前几分钟、前几小时的系统监控信息,这种加时间戳的记录方式给用户提供了一种快照功能,对于比较分析一段时间内系统的变化情况极为方便。
本发明提供了一种网络故障分析监测装置,包括:
统计模块,在每次任务重新调度进行切换时进行一系列信息的统计工作,它负责提供每一次任务切换时当前系统的各项统计信息,并对每一项纪录都加上时间戳标记;
记录模块,用于对信息的合法性作分析,如果检测到异常,需要在显示屏上给出提示,报告工作人员哪一部分模块出现问题。出现异常后,还需要在日志中给出提示警告并将当前系统信息存放在NVRAM中作纪录;以及对统计信息进行管理,维护内存中的统计表,定期更新系统存储设备的纪录,并在系统崩溃前dump出相关数据。
调度模块,负责每隔一定时间进行调用,实现方式是由一个定时器触发,从统计模块中取得统计信息,并调用记录模块进行分析和记录。
设置命令接口,通过该命令接口与外部的命令行模块连接,实现记录信息的读取和输出。可以通过命令接口一次输出前几秒、前几分钟、前几小时的系统纪录,通过前后时间的比较,就可以得到当前系统是否处于正常运行状况。
由上述可见,当系统正常运行时,本发明对于系统中各项性能可进行全方位的自我运行状况监测和纪录,发现错误或异常时,及时发出告警同时保存错误以备查询,如系统发生死机,重起系统之后能够得到死机前的系统内部情况。并可通过复位模块、芯片使相应的模块和芯片复位。
同时可以按照用户需求增加监测模块,具有很强的扩展性。

Claims (10)

1.一种网络故障分析监测方法,其特征在于包括:
(1)在任务进行切换重新调度时,对系统日常工作的信息进行统计并记录到一个公用缓存区中;
(2)通过定时器定时从公用缓存区中搜集所统计的信息,并对统计信息进行分析监测,如监测到异常,输出到串口上给出提示警告,同时记录到系统日志(syslog)中。
2.如权利要求1所述的网络故障分析监测方法,其特征在于步骤(1)还包括给统计信息加时间戳。
3.如权利要求1或2所述的网络故障分析监测方法,其特征在于步骤(2)中所述记录还包括将统计信息记录在非易失随机存取存储器中。
4.如权利要求1所述的网络故障分析监测方法,其特征在于进一步包括通过命令行读取统计信息的记录并提供输出命令。
5.如权利要求1所述的网络故障分析监测方法,其特征在于步骤(1)中所述信息包括:通用系统信息、内存管理信息、任务信息、消息队列和信号量。
6.一种网络故障分析监测装置,其特征在于该装置包括:
统计模块,用于记录每一次任务切换时刻的系统日常工作中所需的统计信息;
记录模块,用于对信息进行分析监测,如果监测到异常,在日志中给出提示警告并将当前信息存放在系统日志(syslog)中作纪录;
调度模块,用于负责每隔一定时间,从统计模块中取得统计信息,并调用记录模块进行分析。
7.如权利要求6所述的网络故障分析监测装置,其特征在于统计模块对所统计的信息打上时间戳标记。
8.如权利要求6所述的网络故障分析监测装置,其特征在于记录模块对统计信息进行管理,维护内存中的统计表,定期更新系统存储设备的纪录。
9.如权利要求6或8所述的网络故障分析监测装置,其特征在于记录模块将统计信息记录在非易失随机存取存储器中。
10.如权利要求6所述的网络故障分析监测装置,其特征在于设置命令接口通过该命令接口与外部的命令行模块连接,实现统计信息的直接读取和输出。
CNA031536328A 2003-08-18 2003-08-18 网络故障分析监测方法及装置 Pending CN1490982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA031536328A CN1490982A (zh) 2003-08-18 2003-08-18 网络故障分析监测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA031536328A CN1490982A (zh) 2003-08-18 2003-08-18 网络故障分析监测方法及装置

Publications (1)

Publication Number Publication Date
CN1490982A true CN1490982A (zh) 2004-04-21

Family

ID=34156735

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA031536328A Pending CN1490982A (zh) 2003-08-18 2003-08-18 网络故障分析监测方法及装置

Country Status (1)

Country Link
CN (1) CN1490982A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100370866C (zh) * 2005-03-02 2008-02-20 华为技术有限公司 无线网络控制器日志记录系统及其方法
CN100389567C (zh) * 2004-08-25 2008-05-21 富士通株式会社 用于检测网络中的网络异常的方法和系统
WO2008095390A1 (fr) * 2007-02-07 2008-08-14 Huawei Technologies Co., Ltd. Équipement de détection d'incident de ligne en émulation de pseudo-fil et procédé correspondant
CN100415026C (zh) * 2004-08-23 2008-08-27 华为技术有限公司 单板告警监测方法
CN100450016C (zh) * 2005-06-03 2009-01-07 华为技术有限公司 通信网络中在线维护的实现方法
CN100456695C (zh) * 2005-03-08 2009-01-28 日本电气株式会社 无线电接入网系统和对该系统进行故障分析的方法
CN100461924C (zh) * 2005-11-01 2009-02-11 华为技术有限公司 一种NodeB小区级故障的定位分析方法
CN101201786B (zh) * 2006-12-13 2010-05-19 中兴通讯股份有限公司 一种故障日志监控方法及装置
CN101166124B (zh) * 2006-10-20 2010-10-06 中兴通讯股份有限公司 网络处理器微引擎运行异常的检测处理方法
CN101222742B (zh) * 2007-11-22 2010-12-01 中国移动通信集团山东有限公司 移动通信网管系统中告警自定位和自处理的方法及系统
CN1905590B (zh) * 2006-08-16 2011-01-05 华为技术有限公司 一种单板信息采集的方法
CN101741681B (zh) * 2008-11-18 2013-03-06 富士通株式会社 节点装置
WO2013071755A1 (zh) * 2011-11-17 2013-05-23 中兴通讯股份有限公司 基站设备自愈的实现方法及装置
CN104462606A (zh) * 2014-12-31 2015-03-25 中国科学院深圳先进技术研究院 一种基于日志数据确定诊断处理措施的方法
CN106326049A (zh) * 2016-08-16 2017-01-11 广东欧珀移动通信有限公司 一种故障定位方法及终端
CN106682746A (zh) * 2016-12-25 2017-05-17 杭州博烁晟斐智能科技有限公司 一种通信铁塔维护作业单的生成方法及系统
CN107202604A (zh) * 2017-03-02 2017-09-26 湖南工业大学 一种告警处理方法及系统
CN107480002A (zh) * 2017-07-26 2017-12-15 阿里巴巴集团控股有限公司 消息处理方法及装置、电子设备

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100415026C (zh) * 2004-08-23 2008-08-27 华为技术有限公司 单板告警监测方法
CN100389567C (zh) * 2004-08-25 2008-05-21 富士通株式会社 用于检测网络中的网络异常的方法和系统
CN100370866C (zh) * 2005-03-02 2008-02-20 华为技术有限公司 无线网络控制器日志记录系统及其方法
CN100456695C (zh) * 2005-03-08 2009-01-28 日本电气株式会社 无线电接入网系统和对该系统进行故障分析的方法
US8064352B2 (en) 2005-06-03 2011-11-22 Huawei Technologies Co., Ltd. Method for implementing online maintenance in communication network
CN100450016C (zh) * 2005-06-03 2009-01-07 华为技术有限公司 通信网络中在线维护的实现方法
CN100461924C (zh) * 2005-11-01 2009-02-11 华为技术有限公司 一种NodeB小区级故障的定位分析方法
CN1905590B (zh) * 2006-08-16 2011-01-05 华为技术有限公司 一种单板信息采集的方法
CN101166124B (zh) * 2006-10-20 2010-10-06 中兴通讯股份有限公司 网络处理器微引擎运行异常的检测处理方法
CN101201786B (zh) * 2006-12-13 2010-05-19 中兴通讯股份有限公司 一种故障日志监控方法及装置
CN101013928B (zh) * 2007-02-07 2011-09-14 华为技术有限公司 实现伪线仿真线路故障检测的装置及方法
WO2008095390A1 (fr) * 2007-02-07 2008-08-14 Huawei Technologies Co., Ltd. Équipement de détection d'incident de ligne en émulation de pseudo-fil et procédé correspondant
CN101222742B (zh) * 2007-11-22 2010-12-01 中国移动通信集团山东有限公司 移动通信网管系统中告警自定位和自处理的方法及系统
CN101741681B (zh) * 2008-11-18 2013-03-06 富士通株式会社 节点装置
WO2013071755A1 (zh) * 2011-11-17 2013-05-23 中兴通讯股份有限公司 基站设备自愈的实现方法及装置
CN104462606A (zh) * 2014-12-31 2015-03-25 中国科学院深圳先进技术研究院 一种基于日志数据确定诊断处理措施的方法
CN104462606B (zh) * 2014-12-31 2018-06-22 中国科学院深圳先进技术研究院 一种基于日志数据确定诊断处理措施的方法
CN106326049A (zh) * 2016-08-16 2017-01-11 广东欧珀移动通信有限公司 一种故障定位方法及终端
CN106326049B (zh) * 2016-08-16 2019-07-19 Oppo广东移动通信有限公司 一种故障定位方法及终端
CN106682746A (zh) * 2016-12-25 2017-05-17 杭州博烁晟斐智能科技有限公司 一种通信铁塔维护作业单的生成方法及系统
CN107202604A (zh) * 2017-03-02 2017-09-26 湖南工业大学 一种告警处理方法及系统
CN107202604B (zh) * 2017-03-02 2019-09-03 湖南工业大学 一种告警处理方法及系统
CN107480002A (zh) * 2017-07-26 2017-12-15 阿里巴巴集团控股有限公司 消息处理方法及装置、电子设备
CN107480002B (zh) * 2017-07-26 2020-06-30 阿里巴巴集团控股有限公司 消息处理方法及装置、电子设备

Similar Documents

Publication Publication Date Title
CN1490982A (zh) 网络故障分析监测方法及装置
Castelli et al. Proactive management of software aging
US5796633A (en) Method and system for performance monitoring in computer networks
US5432932A (en) System and method for dynamically controlling remote processes from a performance monitor
US5553235A (en) System and method for maintaining performance data in a data processing system
KR100772999B1 (ko) 분산 환경에서 어플리케이션의 성능을 모니터링하는 방법및 시스템
US5506955A (en) System and method for monitoring and optimizing performance in a data processing system
CA2753019C (en) Monitoring of distributed applications
US20110035366A1 (en) Real-time database performance and availability monitoring method and system
WO2003073203A2 (en) System and method for analyzing input/output activity on local attached storage
US20060294221A1 (en) System for programmatically controlling measurements in monitoring sources
EP2324406B1 (en) Method and apparatus for monitoring the performance of a power delivery control system
KR20120023703A (ko) 서버 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 관리 서버, 가상 서버 배치 방법
WO2007075638A2 (en) System and method for monitoring system performance levels across a network
US20060130001A1 (en) Apparatus and method for call stack profiling for a software application
CN1864157A (zh) 自主记日志支持
CN101719852B (zh) 一种中间件性能的监控方法和设备
US20080168044A1 (en) System and method for providing performance statistics for application components
CN107807872A (zh) 一种输变电系统运行状态监测方法
CN1725706A (zh) 系统的复位处理方法及装置
CN100530126C (zh) 一种记录导致系统异常的函数的方法
CN1567248A (zh) 应用程序日志记录方法及系统
CN1940889B (zh) 用于管理访问历史的方法和装置以及信息处理装置
CN101038564A (zh) 应用服务器分级再生方法
Balaton et al. Comparison of representative grid monitoring tools

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication