CN114244685A - 一种云服务中心访问异常处置系统 - Google Patents

一种云服务中心访问异常处置系统 Download PDF

Info

Publication number
CN114244685A
CN114244685A CN202111351261.4A CN202111351261A CN114244685A CN 114244685 A CN114244685 A CN 114244685A CN 202111351261 A CN202111351261 A CN 202111351261A CN 114244685 A CN114244685 A CN 114244685A
Authority
CN
China
Prior art keywords
abnormal
module
access
intelligent
handling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111351261.4A
Other languages
English (en)
Inventor
汪亚娟
张虎
王晨飞
金中超
王虎
安业腾
李志民
常鹏华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Co ltd Customer Service Center
Original Assignee
State Grid Co ltd Customer Service Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Co ltd Customer Service Center filed Critical State Grid Co ltd Customer Service Center
Priority to CN202111351261.4A priority Critical patent/CN114244685A/zh
Publication of CN114244685A publication Critical patent/CN114244685A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明属于运维领域,公开了一种云服务中心访问异常处置系统,包括采集模块、异常访问判断模块、异常消息报送模块、分析模块、智能处置模块和总结归纳模块;其中采集模块主要用于进行数据采集;异常访问判断模块用于根据数据判断访问是否为异常访问,同时将异常访问对应的访问信息发送至异常信息报送模块;异常消息报送模块用于接收发送的访问信息,并将访问信息发送至运维人员和分析模块;分析模块用于分析异常访问的原因,同时将异常访问及对应的原因发送至智能处置模块;智能处置模块自动处置模块或者人为处置模块;总结归纳模块用于对异常的原因进行总结。本发明能够减少运维人员的工作量,便于及时对异常情况进行自动或者人工处置。

Description

一种云服务中心访问异常处置系统
技术领域
本发明属于运维管理技术领域,尤其是一种云服务中心访问异常处置系统。
背景技术
国网的智能运维平台主要用于实现数据归集、全量监控、数据分析和智能调度等运维调度要求。在数据归集方面,目前已经归集95598核心业务系统和95598呼叫平台主机、中间件、数据库以及网络数据。网上国网内外网完成主机、数据库、微服务以及网络设备的数据归集。在全面监控方面,目前已经实现了包括台账管理、智能配线、统一展示以及容量查询等功能。在数据分析方面,完成了完成95598核心业务系统、95598呼叫平台以及网上国网的物理拓扑绘制、五维模型构建以及配置完成健康评分等功能,完成智能运维大屏、秒秒等研发工作。完成健康模型、趋势预测、单指标/多指标分析、软硬件模型、CPU模型、性能模型、共线性分析、多维度分析模型等。在智能调度方面,完成了自动化巡检、自动化发布与部署的研发实施工作,弱口令的部署工作,完成日志分析的部署、实施工作,完成南北园区巡检机器人的实施工作,目前北园区的三台机器人正常巡检。
云服务是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。当云服务中心出现访问异常时,会严重影响到智能运维中心对信息的存储、获取等,目前尚没有相应的解决方案。
发明内容
发明目的:提供一种云服务中心访问异常处置系统,以解决现有技术存在的上述问题。
技术方案:一种云服务中心访问异常处置系统,包括:
采集模块:用于通过ELK途径进行数据采集,并将采集的数据存储在智能运维的数据归集平台;
异常访问判断模块:用于根据数据归集平台的数据判断访问是否为异常访问,如果是异常访问则异常访问判断模块直接终断各访问端口至云服务中心的访问通道,同时将异常访问对应的访问信息发送至异常信息报送模块;
异常消息报送模块:用于接收异常访问判断模块发送的访问信息,并将访问信息发送至运维人员和分析模块;
分析模块:用于分析异常访问的原因,并将异常访问及对应的原因发送至智能处置模块;
智能处置模块:用于将分析模块发送的异常访问匹配至自动处置模块或者人为处置模块,自动处置模块对异常情况进行自动处置,人为处置模块将异常情况及对应原因发送至运维人员;
总结归纳模块:用于对异常的原因进行总结,通过关键词提取提取异常原因的关键词,将关键词相同的异常原因总结在一起,从而对异常原因进行总结。
进一步的:异常访问判断模块包括计数模块和判断模块,
计数模块用于分别统计各端口每分钟访问云服务中心的次数;
判断模块用于将每分钟的访问次数和访问的阈值进行比较,根据比较结果判断是否为异常访问;
该技术方案中,通过将判断模块设计的阈值和采集模块采集的数据进行对比,可以判断是否为异常访问,例如每分钟内有300次的访问智能运维的某一窗口的操作,则可以认定该操作是异常操作。
进一步的:访问的阈值是200次/分钟。
进一步的:异常消息报送模块通过短信、企信、微信或者电话将访问信息发送至运维人员。该技术方案中,异常消息通过多种渠道及时发送至对应的运维人员,能够便于运维人员及时了解异常的情况,便于对异常问题进行跟踪处理。
进一步的:分析模块包括:网络分析模块、服务分析模块和宿主机状态分析模块。
该技术方案中分析模块用于对异常情况进行分析和判断,便于对异常情况进行针对性的处理。
进一步的:当异常原因是网络连通性和/或网口状态异常时,则智能处置模块将异常原因对应的异常访问匹配至人工处置模块。
进一步的:当异常原因是tce服务和/或mysql服务异常时,则智能处置模块将异常原因对应的异常访问匹配至自动处置模块,自动处置模块自动对tce服务和/或mysql服务异常进行修复。
进一步的:当异常原因是宿主机状态异常时,则智能处置模块将异常原因对应的异常访问匹配至自动处置模块,自动处置模块对异常情况进行处置;如果宿主机状态没有异常时,则智能处置模块将当前结果匹配至人工处置模块,通过人工处置模块进一步进行检查。
本发明公开了一种云服务中心访问异常处置系统,具有如下有益效果:
1、运维人员能够通过各种渠道及时了解异常情况,从而便于对异常情况进行跟踪和处理;
2、分析模块能够对异常的原因进行分析,便于智能处置模块对异常情况进行自动处理或者转为人工处理;
3、通过总结模块的总结能够便于对异常的趋势进行分析,从而对硬件设备或者软件设备进行改进/改良。
附图说明
图1是本发明的一种云服务中心访问异常处置系统的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种云服务中心访问异常处置系统,包括采集模块、异常访问判断模块、异常消息报送模块、分析模块、智能处置模块和总结归纳模块;其中,
采集模块主要用于通过ELK途径或者其他途径进行数据采集,数据主要是访问的次数,并将采集的数据存储在智能运维的数据归集平台,从而可以通过数据归集平台对访问的记录进行保存,便于后期有需要时查询;
异常访问判断模块用于根据数据归集平台归集的访问数据判断访问是否为异常访问,同时对异常访问情况进行处理,如果异常访问判断模块判断出某一访问是异常访问则直接终断各访问端口至云服务中心的访问通道,从而可以避免异常访问获取云服务中心的数据,同时异常访问判断模块还用于将异常访问对应的访问信息发送至异常信息报送模块;
异常消息报送模块:用于接收异常访问判断模块发送的访问信息,并将访问信息发送至运维人员和分析模块,异常消息报送模块主要是通过短信、企信、微信或者电话等方式将访问信息发送至运维人员;
分析模块:用于分析异常访问的原因,分析模块主要通过分析网络连通性和网口状态、tce服务或者mysql服务、宿主机状态从而得到异常的原因;同时将异常访问及对应的原因发送至智能处置模块;
智能处置模块:用于根据分析模块发送的异常的原因匹配自动处置模块或者人为处置模块,自动处置模块对异常原因对应的异常访问进行自动处置,例如自动禁止该访问同时将该访问对应的历史记录删除,人为处置模块将异常原因及对应的异常访问发送至运维人员,通过智能处置模块能够对需要处置的异常访问进行划分,使一部分可以通过自动处理的异常访问直接通过自动处置模块进行处置,另外一部分无法通过自动处置模块解决的发送至人为处置模块,人为处置模块通过向运维人员发送短信、企信等方式将需要认为处置的异常访问发送至运维人员,从而减少运维人员的工作量;
总结归纳模块:用于对异常的原因进行总结,通过关键词提取提取异常原因的关键词,将关键词相同的异常原因总结在一起,从而对异常原因进行总结。通过总结归纳模块的总结归纳能够对异常的情况进行了解,从而便于及时对软件模块或者硬件模块进行改进或者更新,减少异常访问出现的次数。
其中,在本发明中,异常访问判断模块包括计数模块和判断模块,计数模块用于分别统计各端口每分钟访问云服务中心的次数;判断模块用于将每分钟的访问次数和访问的阈值进行比较,根据比较结果判断是否为异常访问,其中设定的访问的阈值是200次/分钟,如果某端口每分钟访问云服务器的次数为300次,则可以认定为该端口对云服务中心的访问是异常访问;如果某端口每分钟访问云服务器的次数为120次,则可以认定为该端口对云服务中心的访问是正常访问。
其中,本发明中分析模块包括:网络分析模块、服务分析模块和宿主机状态分析模块;
其中,网络分析模块用于分析出网络连通性和/或网口状态是否异常;服务分析模块用于查看tce服务或者mysql服务是否正常;宿主机状态分析模块用于判断宿主机的状态是否异常。另外分析模块的分析步骤如下:
首先由网络分析模块开始运行,分析网络连通性和网口状态,如果经过分析发现网络连通性和/或网口状态出现异常,则终止后续的分析操作,并由网络分析模块将异常原因及对应的异常访问发送至智能处置模块,如果经过分析发现网络连通性和/或网口状态正常,则触发服务分析模块开始运行;
服务分析模块开始查看tce服务或者mysql服务是否正常,如果tce服务和/或mysql服务出现异常,则终止后续的操作并将异常情况发送至智能处置模块,如果经过分析发现tce服务和mysql服务正常,则触发宿主机状态分析模块开始运行;
宿主机状态分析模块开始通过cpu、内存和文件系统性能指标判断宿主机状态,如果宿主机状态出现异常,则终止后续的操作并将异常情况发送至智能处置模块,如果经过分析发现宿主机状态正常,则向运维人员发送“没有发现异常”的字样,运维人员可以从其他方面排查异常访问的原因并根据原因对异常访问进行处置;
其中网络分析模块、服务分析模块和宿主机状态分析模块三个模块向智能处置模块发送的异常情况均包括异常访问的原因及对应的异常访问。
智能处置模块用于对不同异常访问对应的异常访问原因进行处置,当异常原因是网络连通性和/或网口状态异常时,则智能处置模块将异常原因对应的异常访问匹配至人工处置模块,通过人工检查网口的状态或者网线是否连接牢固等方面进行排查;当异常原因是tce服务和/或mysql服务异常时,则智能处置模块将异常原因对应的异常访问匹配至自动处置模块,自动处置模块自动对tce服务和/或mysql服务异常进行自动修复,从而可以减少运维人员的工作量;当异常原因是宿主机状态异常时,则智能处置模块将异常原因对应的异常访问匹配至自动处置模块,自动处置模块对异常情况进行处置;如果宿主机状态没有异常时,则智能处置模块将当前结果匹配至人工处置模块,运维人员通过人工排查从其他方面得到异常访问的原因并根据原因对异常访问进行处置。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。

Claims (8)

1.一种云服务中心访问异常处置系统,其特征在于,包括:
采集模块:用于通过ELK途径进行数据采集,并将采集的数据存储在智能运维的数据归集平台;
异常访问判断模块:用于根据数据归集平台的数据判断访问是否为异常访问,如果是异常访问则异常访问判断模块直接终断各访问端口至云服务中心的访问通道,同时将异常访问对应的访问信息发送至异常信息报送模块;
异常消息报送模块:用于接收异常访问判断模块发送的访问信息,并将访问信息发送至运维人员和分析模块;
分析模块:用于分析异常访问的原因,并将异常访问及对应的原因发送至智能处置模块;
智能处置模块:用于将分析模块发送的异常访问匹配至自动处置模块或者人为处置模块,自动处置模块对异常情况进行自动处置,人为处置模块将异常情况及对应原因发送至运维人员;
总结归纳模块:用于对异常的原因进行总结,通过关键词提取提取异常原因的关键词,将关键词相同的异常原因总结在一起,从而对异常原因进行总结。
2.根据权利要求1所述的一种云服务中心访问异常处置系统,其特征在于:异常访问判断模块包括计数模块和判断模块,
计数模块用于分别统计各端口每分钟访问云服务中心的次数;
判断模块用于将每分钟的访问次数和访问的阈值进行比较,根据比较结果判断是否为异常访问。
3.根据权利要求2所述的一种云服务中心访问异常处置系统,其特征在于:访问的阈值是200次/分钟。
4.根据权利要求1所述的一种云服务中心访问异常处置系统,其特征在于:异常消息报送模块通过短信、企信、微信或者电话将访问信息发送至运维人员。
5.根据权利要求1所述的一种云服务中心访问异常处置系统,其特征在于:分析模块包括:
网络分析模块:用于分析出网络连通性和/或网口状态是否异常,如果异常则将异常情况发送至智能处置模块,如果网络连通性和网口状态正常,则触发服务分析模块;
服务分析模块:用于查看tce服务或者mysql服务是否正常,如果tce服务和/或mysql服务出现异常,则将异常情况发送至智能处置模块,如果tce服务和mysql服务正常,则触发宿主机状态分析模块;
宿主机状态分析模块:用于判断宿主机的状态是否正常,如果宿主机状态异常,则将异常情况发送至智能处置模块,如果宿主机状态正常则停止分析并将消息发送至智能运维人员;
其中异常情况包括异常原因及异常原因对应的异常访问。
6.根据权利要求5所述的一种云服务中心访问异常处置系统,其特征在于:当异常原因是网络连通性和/或网口状态异常时,则智能处置模块将异常原因对应的异常访问匹配至人工处置模块。
7.根据权利要求6所述的一种云服务中心访问异常处置系统,其特征在于:当异常原因是tce服务和/或mysql服务异常时,则智能处置模块将异常原因对应的异常访问匹配至自动处置模块,自动处置模块自动对tce服务和/或mysql服务异常进行修复。
8.根据权利要求7所述的一种云服务中心访问异常处置系统,其特征在于:当异常原因是宿主机状态异常时,则智能处置模块将异常原因对应的异常访问匹配至自动处置模块,自动处置模块对异常情况进行处置;如果宿主机状态没有异常时,则智能处置模块将当前结果匹配至人工处置模块,通过人工处置模块进一步进行检查。
CN202111351261.4A 2021-11-16 2021-11-16 一种云服务中心访问异常处置系统 Pending CN114244685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111351261.4A CN114244685A (zh) 2021-11-16 2021-11-16 一种云服务中心访问异常处置系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111351261.4A CN114244685A (zh) 2021-11-16 2021-11-16 一种云服务中心访问异常处置系统

Publications (1)

Publication Number Publication Date
CN114244685A true CN114244685A (zh) 2022-03-25

Family

ID=80749485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111351261.4A Pending CN114244685A (zh) 2021-11-16 2021-11-16 一种云服务中心访问异常处置系统

Country Status (1)

Country Link
CN (1) CN114244685A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115766786A (zh) * 2022-11-11 2023-03-07 四川启睿克科技有限公司 一种智能家电终端业务异常的排查系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211725A (ja) * 2009-06-18 2009-09-17 Toshiba Corp 異常データ検出装置、異常データ検出方法及び異常データ検出プログラム
CN104394201A (zh) * 2014-11-12 2015-03-04 国云科技股份有限公司 分布式web应用监控方法
CN109714209A (zh) * 2018-12-29 2019-05-03 中国科学院计算技术研究所 一种网站访问故障的诊断方法及系统
CN111556070A (zh) * 2020-05-12 2020-08-18 广州鹄志信息咨询有限公司 网页异常访问检测方法及装置
CN112799923A (zh) * 2020-12-24 2021-05-14 深圳前海微众银行股份有限公司 系统异常原因确定方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211725A (ja) * 2009-06-18 2009-09-17 Toshiba Corp 異常データ検出装置、異常データ検出方法及び異常データ検出プログラム
CN104394201A (zh) * 2014-11-12 2015-03-04 国云科技股份有限公司 分布式web应用监控方法
CN109714209A (zh) * 2018-12-29 2019-05-03 中国科学院计算技术研究所 一种网站访问故障的诊断方法及系统
CN111556070A (zh) * 2020-05-12 2020-08-18 广州鹄志信息咨询有限公司 网页异常访问检测方法及装置
CN112799923A (zh) * 2020-12-24 2021-05-14 深圳前海微众银行股份有限公司 系统异常原因确定方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115766786A (zh) * 2022-11-11 2023-03-07 四川启睿克科技有限公司 一种智能家电终端业务异常的排查系统及方法
CN115766786B (zh) * 2022-11-11 2024-05-14 四川启睿克科技有限公司 一种智能家电终端业务异常的排查系统及方法

Similar Documents

Publication Publication Date Title
CN107992398A (zh) 一种业务系统的监控方法和监控系统
CN101997925A (zh) 具有预警功能的服务器监控方法及其系统
CN113342564A (zh) 日志审计方法、装置、电子设备和介质
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN111191247A (zh) 数据库安全审计系统
CN112416902A (zh) 一种主机与数据库一键巡检方法
CN107635003A (zh) 系统日志的管理方法、装置及系统
CN111740868A (zh) 告警数据的处理方法和装置及存储介质
CN112306700A (zh) 一种异常rpc请求的诊断方法和装置
CN115529595A (zh) 一种日志数据的异常检测方法、装置、设备及介质
CN111488258A (zh) 一种用于软硬件运行状态分析与预警的系统
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
CN114244685A (zh) 一种云服务中心访问异常处置系统
CN110191097A (zh) 登录页面安全性的检测方法、系统、设备及存储介质
CN106951360B (zh) 数据统计完整度计算方法和系统
CN113760634A (zh) 一种数据处理方法和装置
CN110535972B (zh) 一种平台化的燃气检测设备集中管控及通信系统,设备及可读存储介质
CN116645082A (zh) 一种系统巡检方法、装置、设备以及存储介质
CN111176950A (zh) 一种监控服务器集群的网卡的方法和设备
CN113472881B (zh) 在线终端设备的统计方法和装置
CN114500178B (zh) 一种自运维的智慧物联网关
CN114938521A (zh) 网络状态检测方法、装置、电子设备及存储介质
CN109885465A (zh) 多品牌服务器上ssd磁盘寿命的批量统计与监控方法
CN114546759B (zh) 数据库访问错误监测、分析方法、装置和电子设备
CN113688005B (zh) 运维监控方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination