CN105703942B - 一种日志采集方法及装置 - Google Patents

一种日志采集方法及装置 Download PDF

Info

Publication number
CN105703942B
CN105703942B CN201511031878.2A CN201511031878A CN105703942B CN 105703942 B CN105703942 B CN 105703942B CN 201511031878 A CN201511031878 A CN 201511031878A CN 105703942 B CN105703942 B CN 105703942B
Authority
CN
China
Prior art keywords
inspection
polling
log
module
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511031878.2A
Other languages
English (en)
Other versions
CN105703942A (zh
Inventor
刘强
吴飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201511031878.2A priority Critical patent/CN105703942B/zh
Publication of CN105703942A publication Critical patent/CN105703942A/zh
Application granted granted Critical
Publication of CN105703942B publication Critical patent/CN105703942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种日志采集方法及装置,涉及计算机技术领域,以解决现有技术在执行巡检任务时,不能获取到完整的巡检任务执行过程中的软件系统日志、软件系统与网络设备的交互报文信息和网络设备上的巡检日志的问题。日志采集方法包括:巡检平台启动巡检任务后,依据巡检任务中设定的巡检顺序,各巡检功能模块对待巡检网络设备上对应的待巡检功能模块执行巡检操作;巡检平台在巡检任务执行过程中,记录各巡检功能模块执行巡检操作时产生的巡检日志;在巡检平台执行巡检任务过程中,待巡检网络设备记录各待巡检功能模块在被执行巡检操作时产生的巡检日志,并采集各待巡检功能模块在被执行巡检操作时与对应的巡检功能模块之间的巡检交互报文。

Description

一种日志采集方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种日志采集方法及装置。
背景技术
随着互联网技术的发展,企业所管理的软硬件系统也越来越多,企业的系统维护工作量也越来越大,为了提前发现系统的故障,避免给企业造成经营损失,系统一般会采用巡检的方法,定期启动巡检任务的执行,当发现有业务故障的时候,就通过告警、短信等方式通知相关人员。当维护人员收到通知之后,首先会根据告警通知的描述,查看巡检系统中相应时间段的日志信息,根据查询到的软件日志信息来分析问题。
目前,通常做法为:尝试重现故障,并登录到怀疑有问题的网络设备启动抓包命令,当故障重现后,再结合巡检平台侧日志以及通过抓包命令抓包到的信息来定位故障原因。但是,在现实情况下,使用上述通常做法可能无法有效获取到巡检平台和被巡检的硬件设备之间的报文交互信息,进而严重影响维护人员分析和定位故障原因。例如,故障可能是偶现的,在有限的时间内,故障可能不会重现;再例如,基于安全考虑,网络设备可能是不允许远程登录上去进行抓包等操作的,导致不能获取到巡检平台和被秀巡检网络设备之间的报文交互信息。
所以,通常情况下单一的巡检系统自身的日志信息不能准确定位和分析发生故障的根本原因,还需要结合当时故障发生时,巡检平台与被巡检的各种网络设备间的报文交互情况才能较准确地确定故障的根源,因此,如何获取故障发生时巡检平台和网络设备间的报文交互信息并结合巡检平台自身日志信息和被巡检的网络设备侧日志信息成为定位故障原因的首要问题。
发明内容
本发明的实施例提供一种日志采集方法及装置,以解决现有在执行巡检任务时,不能获取到完整的巡检任务执行过程中的巡检平台日志、巡检平台与被巡检的网络设备的交互报文记录信息和网络设备上的日志信息,进而严重影响维护人员分析和定位故障原因的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种日志采集方法,应用于包括巡检平台和至少一个待巡检网络设备的巡检系统,所述方法包括:
在所述巡检平台上部署与待巡检网络设备上待巡检功能模块一一对应的巡检功能模块;
所述巡检平台启动巡检任务后,依据所述巡检任务中设定的巡检顺序,各巡检功能模块对待巡检网络设备上对应的待巡检功能模块执行巡检操作;
所述巡检平台在所述巡检任务执行过程中,记录各巡检功能模块执行巡检操作时产生的巡检日志;
在所述巡检平台执行所述巡检任务过程中,所述待巡检网络设备记录各待巡检功能模块在被执行巡检操作时产生的巡检日志,并采集所述各待巡检功能模块在被执行巡检操作时与对应的巡检功能模块之间的巡检交互报文。
进一步的,所述方法还包括:在所述巡检任务执行完成后,所述待巡检网络设备将记录的巡检日志以及采集的巡检交互报文上报到巡检平台。
以及,所述方法还包括:所述巡检平台接收所述待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文,与所述巡检平台自身记录的巡检日志一起,按照对应的巡检任务进行归类整理。
具体的,所述巡检日志包含对应巡检任务的标识;所述巡检交互报文中包含有对应巡检任务的标识。
第二方面,本发明实施例提供一种巡检平台,包括巡检任务启动模块、与待巡检网络设备上待巡检功能模块一一对应的至少一个巡检功能模块以及巡检日志记录模块;
所述巡检任务启动模块,用于自动启动巡检任务,并将所述巡检任务下发到需要执行巡检操作的各巡检功能模块;
所述至少一个巡检功能模块,用于根据所述自动启动的巡检任务中设定的巡检顺序,对待巡检网络设备上对应的待巡检功能模块执行巡检操作;
巡检日志记录模块,用于在所述自动启动的巡检任务执行过程中,记录所述至少一个巡检功能模块执行巡检操作时产生的巡检日志。
进一步的,所述巡检平台还包括:巡检信息接收模块,用于接收待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文。
进一步的,所述巡检平台还包括:日志整理模块,用于将接收的所述待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文,与所述巡检日志记录模块记录的巡检日志一起,按照对应的巡检任务进行归类整理。
进一步的,所述日志整理模块还用于为网络维护人员提供查询某一巡检任务对应巡检日志的用户操作界面。
第三方面,本发明实施例提供网络设备,包括至少一个待巡检功能模块、巡检日志记录模块以及巡检报文采集模块,
所述至少一个待巡检功能模块,用于在巡检平台执行巡检任务过程中,与所述对应的巡检功能模块进行巡检操作的交互;
所述巡检日志记录模块,用于记录在所述至少一个待巡检功能模块被执行巡检操作时产生的巡检日志;
所述巡检报文采集模块,用于采集所述至少一个待巡检功能模块在被执行巡检操作时与对应的巡检功能模块之间的巡检交互报文。
进一步的,所述网络设备还包括:巡检信息上报模块,用于在一个巡检任务执行完成后,将所述巡检日志记录模块记录的巡检日志以及所述巡检报文采集模块采集的巡检交互报文上报到巡检平台。
由上可知,本发明实施例提供一种日志采集方法、巡检平台和网络设备,从而实现在巡检业务过程中,在巡检平台侧从各个功能模块采集巡检日志;当巡检平台与待巡检的网络设备交互时候,网络设备采集巡检交互报文;网络设备侧巡检日志记录模块将从设备侧的功能模块采集巡检日志,巡检平台将收集到的日志和巡检交互报文按照巡检任务进行归类和整理,把日志与巡检任务一一对应,实现了对平台巡检日志、巡检交互报文以及网络设备巡检日志三方面信息的记录,使采集到的日志信息更加全面,无需依赖通过重现问题来收集日志信息,且能够在故障发生的时候收集到问题发生时刻的平台侧日志信息、巡检平台和被巡检网络设备交互的巡检报文、网络设备侧日志信息,将更全面的日志信息反馈给运维人员,大大提高维护人员分析和定位问题的准确性和效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的日志采集方法的流程图;
图2为本发明实施例提供的另外一种日志采集方法的流程图;
图3为本发明实施例提供的网络架构示意图;
图4为本发明实施例提供的巡检平台结构框图;
图5为本发明实施例提供的待巡检网络设备结构框图。
具体实施方式
本发明的基本原理是:在巡检业务过程中,在巡检平台侧设置一个巡检业务启动模块,定期启动巡检任务,触发巡检平台侧的各个功能模块执行巡检操作,使巡检平台侧的巡检日志记录模块记录各功能模块在执行巡检操作过程中产生的日志信息,同时在网络设备侧设置巡检报文采集模块,当巡检平台与网络设备交互时候,由巡检报文采集模块采集巡检平台与网络设备之间交互的巡检交互报文,同时在网络设备侧设置巡检日志记录模块记录的各功能模块在被巡检过程中产生的日志信息,最后,将巡检平台侧采集到的日志信息、网络设备侧采集到的巡检交互报文、网络设备侧采集到的日志信息与对应的巡检任务对应存储,以便后期将日志信息反馈给运维人员进行故障分析和定位,相比于现有技术,本发明无需依赖通过重现问题来收集日志信息,且本发明采集到日志信息更加全面,这大大提高维护人员分析和定位问题的准确性和效率。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。其中,需要理解的是,在本发明的描述中,术语“第一”、“第二”、“另一”等指示的系统或元件为基于实施例描述的具有一定功能的系统或元件,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的系统或元件必须有此命名,因此不能理解为对本发明的限制。
图1为本发明实施例提供的一种日志采集方法的流程图,应用于包括巡检平台和至少一个待巡检网络设备的巡检系统,所述方法包括:
S101:在所述巡检平台上部署与待巡检网络设备上待巡检功能模块一一对应的巡检功能模块。
本技术领域人员很清楚,在对网络设备的各功能模块进行巡检时,一般会以模拟业务功能的方式与待巡检的功能模块进行交互;所以本发明实施例在巡检平台上部署与待巡检网络设备上待巡检功能模块一一对应的巡检功能模块,即巡检功能模块的个数与待巡检的功能模块的个数是对应的。
S102:所述巡检平台启动巡检任务后,依据所述巡检任务中设定的巡检顺序,各巡检功能模块对待巡检网络设备上对应的待巡检功能模块执行巡检操作。
巡检平台的巡检任务一般是定时自动启动的,每个巡检任务中已设定执行巡检操作的巡检功能模块有哪些以及执行巡检操作的顺序。该技术本领域现有技术不再赘述。
S103:所述巡检平台在所述巡检任务执行过程中,记录各巡检功能模块执行巡检操作时产生的巡检日志。
巡检平台在巡检任务执行过程中,记录下在本次巡检任务执行过程中执行巡检操作过程中,所述巡检平台中各巡检功能模块执行巡检任务时的巡检日志;所述巡检任务包含任务标识和对应需要启动巡检操作的各巡检功能模块的标识,所述巡检任务用于指示所述巡检平台的记录各巡检功能模块执行巡检任务时产生的巡检日志。
其中,任务标识可以由当前启动巡检任务的日期和编号组成,编号为该日期内顺序发送巡检任务的序号;例如,若该巡检任务为在2015.12.25日发送的第3次巡检任务,则任务编号为:日期2015.12.25和编号3。
所述巡检日志为巡检平台在一段时间内的运行情况的记录信息,每条巡检日志描述了巡检平台一次单独的活动行为,可以包含:网络设备执行事件的时间戳、事件级别、信息简介、事件消息等信息。
可选的,巡检平台可以通过现有日志扫描抓取技术获取自身运行过程中产生的巡检日志,如:可以通过网络爬虫技术获取自身运行过程中产生的巡检日志,在此不再详细赘述。
S104:在所述巡检平台执行所述巡检任务过程中,所述待巡检网络设备记录各待巡检功能模块在被执行巡检操作时产生的巡检日志,并采集所述各待巡检功能模块在被执行巡检操作时与对应的巡检功能模块之间的巡检交互报文。
巡检平台在巡检任务启动后,该巡检任务中需要执行巡检操作的巡检功能模块向所述待巡检网络设备发送执行巡检操作的巡检交互报文;每个巡检交互报文包含所述待巡检网络设备中对应待巡检功能模块的标识、所述巡检交互报文用于控制所述待巡检网络设备中对应待巡检功能模块执行相应的操作,所述待巡检网络设备记录各个待巡检功能模块在被巡检过程中产生的巡检日志。
需要说明的是,当巡检平台将用户发送的请求消息成功编译为巡检交互报文后,该巡检平台才可以向执行该请求的待巡检网络设备发送,由待巡检网络设备执行相应的符合用户请求的操作,若巡检平台编译报文失败,则不会发出巡检交互报文。
待巡检网络设备监听所述至少一个巡检交互报文,根据所述至少一个巡检交互报文中的中包含的巡检功能模块的标识,向所述待巡检网络设备的对应的待巡检功能模块发送所述巡检交互报文,并记录所述待巡检网络设备所述待巡检功能模块根据巡检交互报文执行相应操作时产生的巡检日志。
其中,巡检交互报文可以为:简单网络管理协议(Simple Network ManagementProtocol,SNMP)报文、传输控制协议/因特网互联协议(Transmission Control Protocol/Internet Protocol,TCP/IP)报文、用户数据报协议(User Datagram Protocol,UDP)等不同类型的报文。
对于某些类型的巡检交互报文而言,记录该报文的类型对后期故障分析和定位没有太大的帮助,所以,为了降低日志采集的复杂度,在本发明实施例中,待巡检网络设备监听所述至少一个巡检交互报文,获取监听到的符合预设特征报文的巡检交互报文;一般符合预设特征的报文可以为:SNMP、TCP/IP等能够对后期故障分析和定位提供一定贡献的报文。
图2为本发明实施例提供的另外一种日志采集方法的流程图,本实施例的日志采集方法流程图,除了包括图1中的S101-S104以外,还包括:
S104:在所述巡检任务执行完成后,所述待巡检网络设备将记录的巡检日志以及采集的巡检交互报文上报到巡检平台。
S105:所述巡检平台接收所述待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文,与所述巡检平台自身记录的巡检日志一起,按照对应的巡检任务进行归类整理。
巡检平台存储其自身采集的巡检日志、以及被巡检设备上报的巡检日志,以及被巡检设备上报的巡检交互报文,根据巡检任务的标识建立与所述巡检任务的对应关系。
进一步的,在本发明实施例中,还可以根据用户的需要在预设时间对部署的巡检功能模块启动巡检任务,如:所述巡检平台内设置有巡检任务启动模块;所述巡检平台启动巡检任务具体可以包括:
所述巡检任务启动模块根据预设的巡检策略启动巡检任务;
其中,所述巡检策略用于指示所述巡检任务启动模块在预设时间向预设的哪些巡检功能模块发送巡检任务,所述巡检策略预先存储在所述巡检平台内,或者由用户通过巡检平台的用户交互界面发送给所述巡检任务启动模块。预设时间可以根据进行设置,本发明实施例对此不进行限定。
进一步的,为了便于后期将记录的巡检日志呈现给运维人员进行故障分析和定位,所述方法还可以包括:
接收用户发送的查询指令,所述查询指令包含:所述任务标识;所述查询指令用于指示所述巡检平台查询与所述任务标识对应的巡检日志;
查询所述巡检平台存储所述自身采集巡检日志、所述被巡检网络设备上报的巡检交互报文、巡检设备上报的巡检日志与所述任务标识的对应关系;并将所述与所述任务标识对应的巡检日志、巡检交互报文以及通过所述巡检平台的用户交互界面呈现给所述用户。
由上可知,本发明实施例提供一种日志采集方法,所述巡检平台自动启动巡检任务,记录下所述巡检平台中各巡检功能模块执行巡检任务时的巡检日志;所述巡检平台向所述待巡检网络设备发送巡检交互报文;所述待巡检网络设备监听所述巡检交互报文,根据所述至少一个巡检交互报文中包含的功能模块的标识,向所述待巡检网络设备的对应的至少一个待巡检功能模块一一对应的发送巡检交互报文,并记录所述待巡检网络设备的至少一个待巡检功能模块根据巡检交互报文执行相应操作时产生的巡检日志。所述巡检平台存储自身记录的巡检日志、所述待巡检设备记录的巡检日志以及待巡检设备采集的巡检日志与所述任务标识的对应关系。如此,在巡检业务过程中,在巡检平台侧从各个巡检功能模块采集巡检日志;当巡检平台与网络设备交互时候,网络设备采集巡检平台与网络设备交互的巡检交互报文;把日志信息与巡检任务一一对应,实现了对巡检平台日志信息、巡检交互报文以及网络设备的硬件日志信息三方面信息的记录,使采集到的日志信息更加全面,无需依赖通过重现问题来收集日志信息,且能够在故障发生的时候收集到问题发生时刻的巡检平台侧日志信息、巡检交互报文、网络设备侧日志信息,将更全面的日志信息反馈给运维人员,大大提高维护人员分析和定位问题的准确性和效率。
图3为本发明实施例提供的巡检平台架构示意图,该巡检平台可以是一个软硬件结合网络管理系统,其目的是管理网络,使网络高效正常运行,如图3所示,在该网络架构中,用户可以通过包含软件系统的巡检平台管理其他多个待巡检的网络设备(如电脑、打印机和复印机),其中,巡检平台包括操作系统和一系列实用程序,是人与计算机进行信息交换、通信对话、对计算机进行控制与管理的工具,它包含系统中配置的各种系统软件和为满足用户需要而编制的各种应用软件,用户可以通过巡检平台中的软件系统编制一些巡检交互报文,将报文发送至网络设备来实现对网络设备的管理,在用户通过巡检平台实现对其他网络设备管理的过程中,可能会出现故障(巡检平台中的软件系统故障或网络发生故障或网络设备内部发生故障),此时,可以通过本发明实施例提供的日志采集方法及装置记录系统运行过程中的日志信息(包括软件系统的日志信息、报文信息以及网络设备的日志信息),根据记录的日志信息进行后续故障分析和定位。
具体的,图4为本发明实施例提供的巡检平台10的结构框图;所述巡检平台10可以包括:巡检任务启动模块101、至少一个巡检功能模块102以及巡检日志记录模块103。
巡检任务启动模块101,用于自动启动巡检任务,并将所述巡检任务下发到需要执行巡检操作的各巡检功能模块。
本发明实施例中巡检任务启动模块101自动启动巡检任务后,可以用于向所述至少一个巡检功能模块102发送该巡检任务,该巡检任务包含任务标识,所述巡检任务用于指示巡检功能模块102执行相应的巡检操作。
其中,任务标识可以由当前所发送的巡检任务的日期和编号组成,编号为该日期内顺序发送巡检任务的序号;例如,若该巡检任务为在2015.12.25日发送的第3次巡检任务,则任务标识为:日期2015.12.25加上编号3。
至少一个巡检功能模块102,可以用于根据所述巡检任务设定的巡检顺序,对待巡检网络设备上对应的待巡检功能模块执行巡检操作。
在实际应用中,当巡检平台中的巡检功能模块102将巡检任务中的巡检操作请求成功编译为巡检交互报文后,该巡检功能模块才可以向执行该请求的待巡检功能模块发送该巡检交互报文,由待巡检功能模块执行相应的巡检任务中的巡检操作,若巡检功能模块编译巡检交互报文失败,则不会发出巡检交互报文。
巡检日志记录模块103,用于在所述自动启动的巡检任务执行过程中,记录所述至少一个巡检功能模块102执行巡检操作时产生的巡检日志。
所述巡检日志为执行巡检操作的巡检功能模块102在一段时间内的运行情况的记录信息,每条巡检日志描述了巡检功能模块102一次单独的活动行为,可以包含:巡检功能模块102执行事件的时间戳、事件级别、信息简介、事件消息等信息;巡检功能模块102执行事件可以为:巡检功能模块102解析用户发送的用于执行巡检操作的请求消息,采用一些软件语言编译与用户请求消息相对应的巡检交互报文,再将该巡检交互报文发送至待巡检的网络设备的对应待巡检的功能模块,由网络设备的对应待巡检功能模块根据该巡检交互报文执行相应的操作的过程。
可选的,巡检功能模块102可以通过现有日志扫描抓取技术获取自身运行过程中产生的巡检日志,如:可以通过网络爬虫技术获取自身运行过程中产生的巡检日志,在此不再详细赘述。
可选的,如图4所示,所述巡检平台10还可以包括巡检信息接收模块104,用于接收待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文。
在待巡检网络设备的待巡检功能模块接收到的至少一个巡检功能模块102发送的巡检交互报文后,所述巡检交互报文用于控制所述待巡检功能模块201执行相应的操作,此时待巡检网络设备会采集巡检交互报文,所述巡检交互报文中包含所述巡检任务的任务标识。待巡检设备会将采集的巡检交互报文上报到巡检平台,巡检信息接收模块104用于接收该待巡检设备上报的巡检交互报文。同时由于待巡检网络设备中记录所述待巡检功能模块201在被巡检过程中产生的巡检日志并上报给巡检平台,巡检信息接收模块104用于接收该待巡检设备上报的巡检日志。
可选的,巡检信息接收模块104可以通过无线网络、蓝牙、有线网络等传输方法与待巡检设备进行信息交互。
可选的,如图4所示,所述巡检平台10还包括日志整理模块105,用于将接收的所述待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文,与所述巡检日志记录模块记录的巡检日志一起,按照对应的巡检任务进行归类整理,从而便于后期将记录的巡检日志呈现给运维人员进行故障分析和定位,
进一步的,为了便于后期将记录的巡检日志呈现给运维人员进行故障分析和定位,所述日志整理模块105,为网络维护人员提供查询某一巡检任务对应巡检日志的用户操作界面,接收用户发送的查询指令,所述查询指令包含:所述任务标识;所述查询指令用于指示所述巡检平台查询与所述任务标识对应的巡检日志呈现给所述用户。
具体的,图5为本发明实施例提供的待巡检网络设备的结构框图;所述待巡检网络设备20可以包括:至少一个待巡检功能模块201、巡检日志记录模块202以及巡检报文采集模块203。
所述至少一个待巡检功能模块201,用于在巡检平台执行巡检任务过程中,与所述对应的巡检功能模块进行巡检操作的交互。至少一个待巡检功能模块201中的任一待巡检功能模块201在接收到巡检平台的巡检模块下发的巡检操作时,双方通过巡检交互报文进行交互。
所述巡检日志记录模块202,用于记录在所述至少一个待巡检功能模块201被执行巡检操作时产生的巡检日志。
可选的,同巡检平台的巡检日志记录模块103一样,待巡检设备的巡检日志记录模块202也可以通过现有日志扫描抓取技术获取自身运行过程中产生的巡检日志,如:可以通过网络爬虫技术获取自身运行过程中产生的巡检日志,在此不再详细赘述。检日志记录模块202记录待巡检功能模块201被巡检过程中产生巡检日志。所述巡检日志与对应巡检任务对应保存。
所述巡检报文采集模块203,用于采集所述至少一个待巡检功能模块201在被执行巡检操作时与对应的巡检功能模块102之间的巡检交互报文。
待巡检功能模块201在被执行巡检操作时与对应的巡检功能模块102之间的巡检交互报文中包含有巡检任务标识。可选的,巡检交互报文中还包含有待巡检功能模块标识,例如,若待巡检功能模块为功能模块1,巡检交互报文包含的待巡检功能模块的标识为1。
巡检报文采集模块203,可以用于监听所述至少一个巡检交互报文,根据所述至少一个巡检交互报文中的中包含的待巡检功能模块的标识,向所述待巡检网络设备的对应的待巡检功能模块发送所述巡检交互报文,获取巡检交互报文与巡检任务的任务标识的对应关系。
巡检交互报文可以为:简单网络管理协议(Simple Network ManagementProtocol,SNMP)报文、传输控制协议/因特网互联协议(Transmission Control Protocol/Internet Protocol,TCP/IP)报文、用户数据报协议(User Datagram Protocol,UDP)等不同类型的报文。
对于某些类型的巡检交互报文而言,记录该报文的类型对后期故障分析和定位没有太大的帮助,所以,为了降低日志采集的复杂度,在本发明实施例中,巡检报文采集模块203,具体可以用于:
获取监听到的所述至少一个巡检交互报文中符合预设特征的巡检交互报文;将符合预设特征的巡检交互报文确定为需要采集并上报的巡检交互报文。所述预设特征可以为:SNMP、TCP/IP等能够对后期故障分析和定位提供一定贡献的特征。
可选的,参见图5所示,所述待巡检网络设备20可以包括巡检信息上报模块204,用于在一个巡检任务执行完成后,将所述巡检日志记录模块202记录的巡检日志以及所述巡检报文采集模块203采集的巡检交互报文上报到巡检平台。
需要说明的是,本发明图4的巡检平台以及图5所示待巡检网络设备中的巡检信息采集模块、巡检日志记录模块、巡检报文采集模块可以为一个存储器,巡检任务启动模块、巡检信息发送模块、巡检功能模块以及待巡检功能模块可以为单独设立的处理器,也可以将巡检任务启动模块和巡检功能模块集成在巡检平台的某一个处理器中实现,将巡检报文采集模块以及待巡检功能模块集成在待巡检网络设备的某一个处理器中实现,此外,也可以以程序代码的形式存储于设备的存储器中,由设备的某一个处理器调用并执行以上日志采集的功能。这里所述的处理器可以是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路;这里所述的存储器,可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者上述种类的存储器的组合。
由上可知,本发明在巡检平台侧巡检日志记录模块采集各个巡检功能模块执行巡检过程中的巡检日志;当巡检平台与网络设备交互时候,网络设备侧巡检日志记录模块将从设备侧采集待巡检功能被巡检过程中的巡检日志,并采集巡检交互报文;网络设备将采集的巡检日志与巡检交互报文上报到巡检平台。巡检平台将收集到的信息按照巡检任务进行归类和整理,把巡检日志与巡检任务一一对应,实现了对巡检平台巡检日志、巡检交互报文以及网络设备巡检日志三方面信息的记录,使采集到的日志信息更加全面,无需依赖通过重现问题来收集日志信息,且能够在故障发生的时候收集到问题发生时刻的巡检平台侧日志信息、软件和设备交互的特征报文、设备侧日志信息,将更全面的日志信息反馈给运维人员,大大提高维护人员分析和定位问题的准确性和效率。
为了便于描述,以下以步骤的形式示出并详细描述了本发明中的信道模型校正方法,其中,示出的步骤也可以在信道模型校正装置之外的诸如一组可执行指令的计算机系统中执行,此外,虽然在图中示出了逻辑顺序,但是在某些可以以不同于此处的顺序执行所示出或描述的步骤。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种日志采集方法,应用于包括巡检平台和至少一个待巡检网络设备的巡检系统,其特征在于,所述方法包括:
在所述巡检平台上部署与待巡检网络设备上待巡检功能模块一一对应的巡检功能模块;
所述巡检平台启动巡检任务后,依据所述巡检任务中设定的巡检顺序,各巡检功能模块对待巡检网络设备上对应的待巡检功能模块执行巡检操作;
所述巡检平台在所述巡检任务执行过程中,记录各巡检功能模块执行巡检操作时产生的巡检日志;
在所述巡检平台执行所述巡检任务过程中,所述待巡检网络设备记录各待巡检功能模块在被执行巡检操作时产生的巡检日志,并采集所述各待巡检功能模块在被执行巡检操作时与对应的巡检功能模块之间的巡检交互报文。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述巡检任务执行完成后,所述待巡检网络设备将记录的巡检日志以及采集的巡检交互报文上报到巡检平台。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述巡检平台接收所述待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文,与所述巡检平台自身记录的巡检日志一起,按照对应的巡检任务进行归类整理。
4.根据权利要求1-3任一项所述的方法,其特征在于,
所述巡检日志包含对应巡检任务的标识;
所述巡检交互报文中包含有对应巡检任务的标识。
5.一种巡检平台,其特征在于,包括:巡检任务启动模块、与待巡检网络设备上待巡检功能模块一一对应的至少一个巡检功能模块以及巡检日志记录模块;
所述巡检任务启动模块,用于自动启动巡检任务,并将所述巡检任务下发到需要执行巡检操作的各巡检功能模块;
所述至少一个巡检功能模块,用于根据所述自动启动的巡检任务中设定的巡检顺序,对待巡检网络设备上对应的待巡检功能模块执行巡检操作;
巡检日志记录模块,用于在所述自动启动的巡检任务执行过程中,记录所述至少一个巡检功能模块执行巡检操作时产生的巡检日志。
6.如权利要求5所述的巡检平台,其特征在于,所述巡检平台还包括:
巡检信息接收模块,用于接收待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文。
7.如权利要求6所述的巡检平台,其特征在于,所述巡检平台还包括:
日志整理模块,用于将接收的所述待巡检网络设备记录的巡检日志以及所述待巡检网络设备采集的巡检交互报文,与所述巡检日志记录模块记录的巡检日志一起,按照对应的巡检任务进行归类整理。
8.如权利要求7所述的巡检平台,其特征在于,
所述日志整理模块还用于,为网络维护人员提供查询某一巡检任务对应巡检日志的用户操作界面。
9.一种网络设备,其特征在于,包括至少一个待巡检功能模块、巡检日志记录模块以及巡检报文采集模块,
所述至少一个待巡检功能模块,用于在巡检平台执行巡检任务过程中,与对应的巡检功能模块进行巡检操作的交互;
所述巡检日志记录模块,用于记录在所述至少一个待巡检功能模块被执行巡检操作时产生的巡检日志;
所述巡检报文采集模块,用于采集所述至少一个待巡检功能模块在被执行巡检操作时与对应的巡检功能模块之间的巡检交互报文。
10.如权利要求9所述的网络设备,其特征在于,还包括:
巡检信息上报模块,用于在一个巡检任务执行完成后,将所述巡检日志记录模块记录的巡检日志以及所述巡检报文采集模块采集的巡检交互报文上报到巡检平台。
CN201511031878.2A 2015-12-31 2015-12-31 一种日志采集方法及装置 Active CN105703942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511031878.2A CN105703942B (zh) 2015-12-31 2015-12-31 一种日志采集方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511031878.2A CN105703942B (zh) 2015-12-31 2015-12-31 一种日志采集方法及装置

Publications (2)

Publication Number Publication Date
CN105703942A CN105703942A (zh) 2016-06-22
CN105703942B true CN105703942B (zh) 2020-01-10

Family

ID=56226522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511031878.2A Active CN105703942B (zh) 2015-12-31 2015-12-31 一种日志采集方法及装置

Country Status (1)

Country Link
CN (1) CN105703942B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572908B (zh) * 2017-03-14 2021-04-02 腾讯科技(深圳)有限公司 信息反馈方法及装置
CN110851324B (zh) * 2019-10-25 2023-03-21 泰康保险集团股份有限公司 基于日志的巡检处理方法、装置以及电子设备、存储介质
CN115994046B (zh) * 2023-03-22 2023-07-28 远洋亿家物业服务股份有限公司 一种用于设备巡检的高精度识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103227798A (zh) * 2013-04-23 2013-07-31 西安电子科技大学 一种免疫网络系统
CN104021212A (zh) * 2014-06-20 2014-09-03 国家电网公司 一种数据库自动化巡检装置
CN104036000A (zh) * 2014-06-13 2014-09-10 赵维佺 一种数据库审计方法、装置及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100536403C (zh) * 2006-08-18 2009-09-02 亿阳信通股份有限公司 一种通信网络智能巡检的方法及设备
US7734961B2 (en) * 2007-05-01 2010-06-08 International Business Machines Corporation Distributed logging apparatus system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103227798A (zh) * 2013-04-23 2013-07-31 西安电子科技大学 一种免疫网络系统
CN104036000A (zh) * 2014-06-13 2014-09-10 赵维佺 一种数据库审计方法、装置及系统
CN104021212A (zh) * 2014-06-20 2014-09-03 国家电网公司 一种数据库自动化巡检装置

Also Published As

Publication number Publication date
CN105703942A (zh) 2016-06-22

Similar Documents

Publication Publication Date Title
CN103200050B (zh) 服务器的硬件状态监控方法和系统
CN107508722B (zh) 一种业务监控方法和装置
CN107632918B (zh) 计算存储设备的监控系统及方法
US6856942B2 (en) System, method and model for autonomic management of enterprise applications
CN104022904B (zh) 分布式机房it设备统一管理平台
CN101197621B (zh) 一种对网管系统故障进行远程诊断定位的方法及其系统
WO2017161964A1 (zh) 通讯网络巡检的方法、装置及巡检客户端
CN109462490B (zh) 视频监控系统及故障分析方法
CN102111797A (zh) 一种故障的诊断方法和设备
CN107066370A (zh) 一种自动监控并收集故障硬盘日志的工具及方法
CN108282355B (zh) 云桌面系统中设备巡检装置
CN104125085A (zh) 一种基于esb的数据管控方法及装置
CN105703942B (zh) 一种日志采集方法及装置
CN112994972B (zh) 一种分布式探针监测平台
CN110231998B (zh) 分布式定时任务的检测方法、装置及存储介质
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
CN107635003A (zh) 系统日志的管理方法、装置及系统
CN114363222A (zh) 一种基于Netconf协议的网络设备巡检方法和系统
CN107943665A (zh) 一种系统主机监控方法及装置
CN103516558B (zh) 监控平台以及对服务器上应用的监控方法
TWI448975B (zh) 應用於影像監控平台的分散式運算系統
CN113537590A (zh) 一种数据异常预测方法及系统
CN116204386B (zh) 应用服务关系自动识别及监控方法、系统、介质和设备
CN111901172A (zh) 基于云计算环境下的应用服务监控方法及系统
CN105391571A (zh) 一种办税服务厅监控设备巡检方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant