CN101056220A - 无网管接口的数据业务系统的集中监控方法 - Google Patents

无网管接口的数据业务系统的集中监控方法 Download PDF

Info

Publication number
CN101056220A
CN101056220A CN 200710022973 CN200710022973A CN101056220A CN 101056220 A CN101056220 A CN 101056220A CN 200710022973 CN200710022973 CN 200710022973 CN 200710022973 A CN200710022973 A CN 200710022973A CN 101056220 A CN101056220 A CN 101056220A
Authority
CN
China
Prior art keywords
module
testing
short message
centralized
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200710022973
Other languages
English (en)
Other versions
CN100466563C (zh
Inventor
王鹰
宗序梅
鲍一民
穆明鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Jiangsu Co Ltd
Original Assignee
China Mobile Group Jiangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Jiangsu Co Ltd filed Critical China Mobile Group Jiangsu Co Ltd
Priority to CNB2004100843174A priority Critical patent/CN100466563C/zh
Publication of CN101056220A publication Critical patent/CN101056220A/zh
Application granted granted Critical
Publication of CN100466563C publication Critical patent/CN100466563C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出了一种无网管接口的数据业务系统的集中监控方法,系统包括智能巡检模块、拨测模块、集中操作维护模块、故障管理模块、安全管理模块和网元设备,其中:智能巡检模块建立在集中操作维护模块、权限管理模块以及自动拨测模块之上,可以实现数据网络设备和主机系统TELNET/SSH字符界面登陆程序自动化脚本执行,并将返回结果通过维护人员编写的模式匹配逻辑进行处理,自动纳入数据综合网管统一处理,并与故障模块关联,实现告警自动派发工作。

Description

无网管接口的数据业务系统的集中监控方法
技术领域
本发明涉及信息安全监控管理领域。尤其是一种适合电信行业通信领域信息监控和管理,即无网管接口的数据业务系统的集中监控方法。
背景技术
目前电信运营商的短信中心和短信网关设备由于缺乏网管接口,一直以来都无法实现设备的实时监控维护工作。随着短信业务的发展,短信中心和短信网关数量急剧增长,以往的监控巡检方式需要定时人工登陆所有的网关和短信中心的主机系统进行手工记录巡检结果,这种方式的弊病在于故障实时性无法保证,工作效率极其低下。
发明内容
为了概括本发明的目的,在这里描述了本发明的某些方面、优点和新颖特征。应了解,无需所有这些方面、优点和特征包含在任一特殊的实施例中。
为解决现有现有技术存在的问题和不足之处和需求,本发明目前是利用现有网络数据建立智能巡检模块,根据该模块和有线业务拨测模块实现对短信中心和短信网关的巡检工作,并与故障模块并联,实现告警自动派发工作。其技术方案是:一种无网管接口的数据业务系统的集中监控方法,系统包括智能巡检模块、拨测模块、集中操作维护模块、故障管理模块、安全管理模块和网元设备,其中:智能巡检模块通过集中操作维护模块统一底层网元的接口,智能巡检模块利用集中操作维护模块实现对网元的命令下发和数据采集,并且在应用上完全独立集中操作维护模块;工作在底层的集中操作维护模块通过安全管理模块获取网元的登陆用户名和口令系统,并且将登陆日志进行后台管理;智能巡检模块通过集中操作维护模块登陆到网元设备发送信息采集命令,并把返回的信息通过相应的巡检接口模块进行模式匹配识别,自动提取关键参数入库处理,如果发现性能指标异常,智能巡检模块将发送设备告警或性能告警到上层的故障管理模块,从而实现设备的巡检监控。
上述的无网管接口的数据业务系统的集中监控方法,其进一步的特征在于,所述的集中操作维护系统具备了标准的命令行接口,支持TELNET协议和SSH协议。
上述的无网管接口的数据业务系统的集中监控方法,其进一步的特征在于,利用拨测模块对短信中心和短信网关进行拨测。数据网管系统实现了分布式的前置拨测器管理,因此拨测监控点非常灵活,对于短信中心和短信网关,主要采用了三种拨测手段:第一、采用PING拨测探测主机系统是否在线,同时利用PING拨测探测网络路由连通是否正常;第二、模拟SP发送短信,测试短信网关短信中心是否工作正常;第三、拨测短信中心、短信网关的主机服务UDP端口,可以在出现故障时定位告警,基于资源建模实现故障关联分析。
本发明的有益效果:本发明的无网管接口的数据业务系统的集中监控方法具有如下优点:利用智能巡检模块和有线业务拨测模块实现了短信中心和短信网关的巡检工作,上线以来,系统运行稳定可靠,基本解决了设备的实时监控维护工作。
附图说明
图1为本发明实施例中系统框架结构图;图2为本发明实施例中命令模式自动匹配器设置界面;图3为本发明实施例中短信网关巡检逻辑;图4为本发明实施例中有线业务拨测模块框图。
具体实施方式
下面结合附图和实施例对本发明进一步描述。
目前,在江苏移动数据综合网管二期系统中发明人已经开发了智能巡检模块,该模块建立在集中操作维护模块、权限管理模块以及自动拨测模块之上,可以实现数据网络设备和主机系统TELNET/SSH字符界面登陆程序自动化脚本执行,并将返回结果通过维护人员编写的模式匹配逻辑进行处理,自动纳入数据综合网管统一处理,并与故障模块关联,实现告警自动派发工作。该模块智能化主要表现在:第一、能够对命令的执行过程进行控制,下一条命令的执行依赖于上一条命令的执行结果是否正确,保证了设备运行的安全性;第二、能够由运维人员编写模式匹配模块,自动匹配任意的字符串,系统的扩容性很强。江苏移动开发的这套智能巡检模块,目前已经应用于较多数据小业务平台的监控管理,华为短信中心和短信网关的巡检管理可以说是该模块的一个典型应用。
华为短信中心和短信网关设备由于缺乏网管接口,一直以来都无法满足“三个集中”的管理要求,随着短信业务的发展,短信中心和短信网关数量急剧增长,以往的监控巡检方式需要定时人工登陆所有的网关和短信中心的主机系统进行手工记录巡检结果,这种方式的弊病在于故障实时性无法保证,工作效率极其低下。
数据网管二期系统强调了系统功能扩充能力,发明人利用现有的集中操作维护模块来实现了数据网络非标准接口的数据采集,特别适用人机界面命令行接口。如图1所示,本发明实施例中智能巡检系统框架结构图,智能巡检系统通过集中操作维护模块统一底层网元的接口,智能巡检系统对网元的命令下发和数据采集完全利用了集中操作维护模块,并且在应用上完全独立集中操作维护模块,达到配置简单的目的。目前江苏移动数据网管二期系统的集中操作维护系统具备了标准的命令行接口,支持TELNET协议和SSH协议。工作在底层的集中操作维护模块通过权限管理模块获取网元的登陆用户名和口令系统,并且将登陆日志进行后台管理。智能巡检模块通过集中操作维护模块登陆到网元设备发送信息采集命令,并把返回的信息通过相应的巡检接口模块进行模式匹配识别,自动提取关键参数入库处理,如果发现性能指标异常,智能巡检模块将发送设备告警或性能告警到上层的故障管理模块,从而实现设备的巡检监控。
更进一步,利用拨测模块对短信中心和短信网关进行拨测,数据网管二期系统实现了分布式的前置拨测器管理,因此拨测监控点非常灵活,可以满足任意网络环境拨测需要。对于短信中心和短信网关,主要采用了三种拨测手段:第一、采用PING拨测探测主机系统是否在线,同时利用PING拨测探测网络路由连通是否正常;第二、模拟SP发送短信,测试短信网关短信中心是否工作正常;第三、拨测短信中心、短信网关的主机服务UDP端口,可以在出现故障时定位告警,基于资源建模实现故障关联分析。
根据华为短信网关和短信中心维护经验,在现有系统中,主要通过主机设备关键指标监控,业务性能指标采集,拨测实现了多维立体监测维护。
华为短信中心监测方法[监控积压实体数、短消息数:]使用集中操作维护模块登陆短消息调度中心,执行:smcdbg open stat app再执行log,再cd smcapp,执行:tail-f smcapp.stat..*出现如此界面:[2005-03-15 18:52:58]============================SMCAPPStatistic===========================EntityCount|MaxEntityCount‖  SMCount|MaxSMCount‖RegUserCount|MaxRegUser0|         800000‖       0|   800000‖          0|     50000MOCount      |MOSpeed/s      ‖MTCount     |MTSpeed/s‖CoreMsgCount0|              0‖       0|        0‖          0MOErrCount|MOErrSpeed/s  ‖MTErrCount|MTErrSpeed/s601|              0‖   51255|        0其中EnttityCount为内存中积压实体数;SMCount为内存中积压短消息数;MaxEntityCount为最大实体数;MaxSMCount为最大短消息数;MOSpeed/s为MO速度;MTSpeed/s为MT速度;检查完务必执行以下指令,否则会占用系统资源:smcdbg close stat app对上面数据的分析,发明人采用了智能巡检的自动进行正则式模式匹配,将数据自动按照预先定义的模式字符串编译后提取并且实时入库处理,同时根据门限派发性能告警,图2就是本发明实施例的命令模式自动匹配器设置界面。
[进程监控:]使用smc用户登陆短消息调度中心,执行命令:p,应出现以下进程Process List Of Short Message CenterUSER PID PPID COMMANDsmc 23658     1 clustermngsmc 10140 23658 smcappsmc 28894 23658 dbdaemon
smc 10950 23658 billcreatersmc 25058 23658 backupdaemonsmc 17572 23658 filemirrorsmc 25312 23658 mapserversmc 12792 23658 mtiserversmc 16708 23658 ctiserversmc 25712     1 icdcommsmc 24432 23658 spyres[有线业务拨测监控:]采用有线业务拨测短信中心,通过短信平台API接口发送短信是否成功来判断,同时利用PING拨测测试设备网络是否在线正常。
[其他监控:]硬盘空间监控:df-k系统负荷监控:topas、sar-u 1 10等通用命令。这些监控可以根据实际情况采用主机代理来完成。
华为短信网关监测图3是本发明实施例中对短信网关巡检时采用的一些智能判断逻辑。
[话单生成监控:]通过检查特定目录下话单文件是否正常生成来判定网关计费功能是否正常。判断逻辑为:■在/bill/cmppbill目录(给计费取的话单)至少有一个.tmp文件,但如果文件有积压(积压指该目录下有超过15个以OSMHA开头的文件)或文件生成日期不是最近的(即有15分钟前生成的文件),则说明计费没有及时取走该文件。(从文件名可以看出文件的生成时间,文件名格式为:OSMHA91MMDDHHMi,如OSMHA9107251700,表示7月25日17:00生成的文件)■在/bill/smppbill目录(给预统计取的话单)至少有一个文件,但文件不能太多(超过15个)[监控积压实体数、短消息数:]使用infox用户登陆短消息网关执行:setpprn-s stat@appTrace flag:smsapp                [OFF]chargeserver          [OFF]msgstore              [OFF]userflushserver       [OFF]spyres                [OFF]dsmpfep               [OFF]Statistic flag:smsapp                [ON]chargeserver          [OFF]msgstore              [OFF]userflushserver       [OFF]spyres                [OFF]dsmpfep               [OFF]再执行log,执行:tail-f smsapp.stat..*出现以下界面:====thread num is[291=>292]===User Count is          [0=>0]Dynamic Route Count is [0=>0]User load status is    [0=>0]Active Entity is       [265788=>  265785]Free Entity is         [534212=>  534215]Pri Lv1 Msg Num is     [     0=>       0]Pri Lv2 Msg Num is     [     0=>       0]Normal Msg Num is      [     0=>       0]其中Active Entity为激活实体数,Free Entity为剩余实体数检查完务必执行以下指令,否则会占用系统资源:setprn-c stat@appTrace flag:smsapp                [OFF]chargeserver          [OFF]msgstore              [OFF]userflushserver       [OFF]spyres                [OFF]dsmpfep               [OFF]Statistic flag:smsapp                [OFF]chargeserver          [OFF]msgstore              [OFF]userflushserver       [OFF]spyres                [OFF]dsmpfep               [OFF][网关进程监控:]使用infox用户登陆短消息网关执行命令:p,应出现以下进程infox  3641    1  0  Mar  9  ?    1:20 startappinfox  3565    1  0  Mar  9  ?    2697:38 smsappinfox  3510    1  0  Mar  9  ?    24:19 msgstoreinfox  3446    1  0  Mar  9  ?    465:16 chargeserverinfox  3385    1  0  Mar  9  ?    20:05 userflushserverinfox  3320    1  0  Mar  9  ?    1:27 spyresinfox  3252    1  0  Mar  9  ?    23:01 icdcomm-finfox  3769    1  0  Mar  9  ?    798:49 fepinfox  3620    1  0  Mar  9  ?    0:02/bin/sh/home/infox/bin/billzip
[有线业务拨测:]使用短信网关与SP的拨测模块以及PING拨测来测试SP是否能够成功发送短信来验证短信网关是否工作正常。
图4为本发明实施例中有线业务拨测模块框图。
准实时检测网关的主机及与短信中心连接的端口是否正常,其基本功能实现是:拨测器每15分钟向省内梦网网关的6500端口、全网梦网网关的7890、7891端口,互联互通网关的6400端口发送连接请求,如能在规定时延内连接成功,则表明网关主机及端口正常,否则报警告错。
[其他监控:]实时检测网关主机的CPU、内存负荷、硬盘空间、文件系统占用空间的大小,指标过高或过低时都会根据预先定义的性能数据模型产生性能告警。
本实施例阐述了数据综合网管系统如何利用智能巡检和拨测模块来实现华为短信中心和短信网关的管理。该方法可以推广到目前申请人已有的较多业务系统的监控及网管接入工作,随着网管的建设和数据业务的发展,以建立起一套功能强大的多维立体维护体系,为蓬勃发展的移动数据业务提供有力保障。
虽然本发明已以较佳实施例公开如上,但它们并不是用来限定本发明,任何熟习此技艺者,在不脱离本发明之精神和范围内,自当可作各种变化或润饰,因此本发明的保护范围应当以本申请的权利要求保护范围所界定的为准。

Claims (4)

1.一种无网管接口的数据业务系统的集中监控方法,系统包括智能巡检模块、拨测模块、集中操作维护模块、故障管理模块、安全管理模块和网元设备,其特征在于:智能巡检模块通过集中操作维护模块统一底层网元的接口,智能巡检模块利用集中操作维护模块实现对网元的命令下发和数据采集,并且在应用上完全独立集中操作维护模块;工作在底层的集中操作维护模块通过安全管理模块获取网元的登陆用户名和口令系统,并且将登陆日志进行后台管理;智能巡检模块通过集中操作维护模块登陆到网元设备发送信息采集命令,并把返回的信息通过相应的巡检接口模块进行模式匹配识别,自动提取关键参数入库处理,如果发现性能指标异常,智能巡检模块将发送设备告警或性能告警到上层的故障管理模块,从而实现设备的巡检监控。
2.根据权利要求1所述的无网管接口的数据业务系统的集中监控方法,其特征在于,所述的集中操作维护系统具备了标准的命令行接口,支持TELNET协议和SSH协议。
3.根据权利要求1所述的无网管接口的数据业务系统的集中监控方法,其特征在于,利用拨测模块对短信中心和短信网关进行拨测。
4.根据权利要求3所述的无网管接口的数据业务系统的集中监控方法,其特征在于,系统实行分布式的前置拨测器管理,对于短信中心和短信网关,主要采用了三种拨测手段:第一、采用PING拨测探测主机系统是否在线,同时利用PING拨测探测网络路由连通是否正常;第二、模拟SP发送短信,测试短信网关短信中心是否工作正常;第三、拨测短信中心、短信网关的主机服务UDP端口,可以在出现故障时定位告警,基于资源建模实现故障关联分析。
CNB2004100843174A 2007-05-29 2007-05-29 无网管接口的数据业务系统的集中监控方法 Active CN100466563C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100843174A CN100466563C (zh) 2007-05-29 2007-05-29 无网管接口的数据业务系统的集中监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100843174A CN100466563C (zh) 2007-05-29 2007-05-29 无网管接口的数据业务系统的集中监控方法

Publications (2)

Publication Number Publication Date
CN101056220A true CN101056220A (zh) 2007-10-17
CN100466563C CN100466563C (zh) 2009-03-04

Family

ID=38795840

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100843174A Active CN100466563C (zh) 2007-05-29 2007-05-29 无网管接口的数据业务系统的集中监控方法

Country Status (1)

Country Link
CN (1) CN100466563C (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197714B (zh) * 2007-12-13 2011-02-09 中国移动通信集团湖北有限公司 一种移动数据业务状态集中采集的方法
WO2011044783A1 (zh) * 2009-10-13 2011-04-21 中兴通讯股份有限公司 一种业务系统的维护系统及方法
CN102509247A (zh) * 2011-12-02 2012-06-20 国电南瑞科技股份有限公司 Ems系统一键智能体检方法
CN102684927A (zh) * 2012-05-31 2012-09-19 迈普通信技术股份有限公司 一种巡检网络设备的方法和装置
CN103198018A (zh) * 2013-04-09 2013-07-10 厦门亿联网络技术股份有限公司 一种利用telnetd线程快速调试程序代码的方法
WO2014153920A1 (zh) * 2013-03-29 2014-10-02 中兴通讯股份有限公司 一种监测方法、装置及短消息中心局点
CN104125085A (zh) * 2013-04-27 2014-10-29 中国移动通信集团黑龙江有限公司 一种基于esb的数据管控方法及装置
WO2015131708A1 (zh) * 2014-10-17 2015-09-11 中兴通讯股份有限公司 一种监控终端设备的方法、装置及系统
CN105282094A (zh) * 2014-06-16 2016-01-27 北京神州泰岳软件股份有限公司 一种数据采集方法和系统
CN110768872A (zh) * 2019-10-31 2020-02-07 南方电网数字电网研究院有限公司 巡检方法、系统、装置、计算机设备和存储介质
CN111314137A (zh) * 2020-02-18 2020-06-19 国家电网有限公司 信息通信网络自动化运维方法、装置、存储介质和处理器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6072857A (en) * 1996-12-19 2000-06-06 Bellsouth Intellectual Property Management Corporation Methods and system for monitoring the operational status of a network component in an advanced intelligent network
CN1063898C (zh) * 1998-05-13 2001-03-28 广东省邮电科学技术研究院 模拟移动通信网的集中操作维护方法
US7302478B2 (en) * 2001-03-02 2007-11-27 Hewlett-Packard Development Company, L.P. System for self-monitoring of SNMP data collection process
CN100536403C (zh) * 2006-08-18 2009-09-02 亿阳信通股份有限公司 一种通信网络智能巡检的方法及设备

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197714B (zh) * 2007-12-13 2011-02-09 中国移动通信集团湖北有限公司 一种移动数据业务状态集中采集的方法
WO2011044783A1 (zh) * 2009-10-13 2011-04-21 中兴通讯股份有限公司 一种业务系统的维护系统及方法
CN102509247A (zh) * 2011-12-02 2012-06-20 国电南瑞科技股份有限公司 Ems系统一键智能体检方法
CN102684927B (zh) * 2012-05-31 2016-04-20 迈普通信技术股份有限公司 一种巡检网络设备的方法和装置
CN102684927A (zh) * 2012-05-31 2012-09-19 迈普通信技术股份有限公司 一种巡检网络设备的方法和装置
WO2014153920A1 (zh) * 2013-03-29 2014-10-02 中兴通讯股份有限公司 一种监测方法、装置及短消息中心局点
CN103198018A (zh) * 2013-04-09 2013-07-10 厦门亿联网络技术股份有限公司 一种利用telnetd线程快速调试程序代码的方法
CN104125085B (zh) * 2013-04-27 2018-05-22 中国移动通信集团黑龙江有限公司 一种基于esb的数据管控方法及装置
CN104125085A (zh) * 2013-04-27 2014-10-29 中国移动通信集团黑龙江有限公司 一种基于esb的数据管控方法及装置
CN105282094A (zh) * 2014-06-16 2016-01-27 北京神州泰岳软件股份有限公司 一种数据采集方法和系统
CN105282094B (zh) * 2014-06-16 2018-05-08 北京神州泰岳软件股份有限公司 一种数据采集方法和系统
WO2015131708A1 (zh) * 2014-10-17 2015-09-11 中兴通讯股份有限公司 一种监控终端设备的方法、装置及系统
CN105577412A (zh) * 2014-10-17 2016-05-11 中兴通讯股份有限公司 一种监控终端设备的方法、装置及系统
CN110768872A (zh) * 2019-10-31 2020-02-07 南方电网数字电网研究院有限公司 巡检方法、系统、装置、计算机设备和存储介质
CN110768872B (zh) * 2019-10-31 2020-07-17 南方电网数字电网研究院有限公司 巡检方法、系统、装置、计算机设备和存储介质
CN111314137A (zh) * 2020-02-18 2020-06-19 国家电网有限公司 信息通信网络自动化运维方法、装置、存储介质和处理器

Also Published As

Publication number Publication date
CN100466563C (zh) 2009-03-04

Similar Documents

Publication Publication Date Title
CN101056220A (zh) 无网管接口的数据业务系统的集中监控方法
CN1913452A (zh) 一种通信网络智能巡检的方法及设备
CN1150717C (zh) 综合网管设备日志管理系统
CN101060436A (zh) 一种用于通信设备的故障分析方法及装置
CN101035039A (zh) Usb映射方法
CN101043384A (zh) 一种网络测试的系统和方法
CN1320801C (zh) 一种计算机辅助安全方法及系统
CN1791037A (zh) 一种实现Web服务自动化测试的方法
CN1794646A (zh) 一种网络管理服务器从网元设备获取日志信息的方法
CN1741460A (zh) 一种电信网络通用性能管理的实现方法及系统
CN1929472A (zh) 数据网络中管理数据传输的方法、系统、信号及介质
CN1858719A (zh) 一种自动化测试实现方法及其系统
CN1852175A (zh) 一种巡检方法和一种巡检系统
CN101038488A (zh) 一种桥梁远程监测系统
CN1866951A (zh) 在网络中检测共享接入主机的方法及系统
CN1841340A (zh) 一种驱动软件的测试方法及测试系统
CN101060370A (zh) 一种对pon终端管理的方法及系统
CN1794242A (zh) 一种故障诊断数据采集与发布方法
CN1921492A (zh) 配置管理方法和装置
CN101035025A (zh) 一种网络设备管理的方法和系统
CN101051861A (zh) 可配置监控参数的直放站及对直放站的监控方法
CN1744522A (zh) 在通信网络中使用的模块化的基于演进的知识的诊断设备
CN1975689A (zh) 可配置的通用同步异步串行通信调试器及其调试方法
CN1254047C (zh) 对接入服务器进行测试的方法
CN101056193A (zh) 一种网络运行分析服务器、分析系统及分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant