CN106130797A - 一种基于报文流量的云计算集群服务状态监控方法和系统 - Google Patents

一种基于报文流量的云计算集群服务状态监控方法和系统 Download PDF

Info

Publication number
CN106130797A
CN106130797A CN201610752273.0A CN201610752273A CN106130797A CN 106130797 A CN106130797 A CN 106130797A CN 201610752273 A CN201610752273 A CN 201610752273A CN 106130797 A CN106130797 A CN 106130797A
Authority
CN
China
Prior art keywords
cloud computing
server
message number
computing cluster
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610752273.0A
Other languages
English (en)
Inventor
钟传新
郭裴哲
苏情
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin Haoxin Science and Technology Service Co Ltd
Original Assignee
Guilin Haoxin Science and Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin Haoxin Science and Technology Service Co Ltd filed Critical Guilin Haoxin Science and Technology Service Co Ltd
Priority to CN201610752273.0A priority Critical patent/CN106130797A/zh
Publication of CN106130797A publication Critical patent/CN106130797A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明涉及一种基于报文流量的云计算集群服务状态监控方法和系统,云计算集群包括集群服务器和备份服务器,集群服务器包括多个云计算服务器,备份服务器连接到集群服务器的多个云计算服务器,用于对多个云计算服务器的数据进行备份,其中方法包括如下步骤:步骤S1,统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;步骤S2,判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则返回步骤S1,否则产生云计算集群状态异常提醒信息。本发明能够提前感知云服务集群的异常,并根据异常进行相应的动作,化被动为主动。

Description

一种基于报文流量的云计算集群服务状态监控方法和系统
技术领域
本发明涉及云计算服务器领域,尤其涉及一种基于报文流量的云计算集群服务状态监控方法和系统。
背景技术
云计算是一种全新的计算模式,其核心思想是企业或个人不再需要在电脑中安装大量应用软件,而是通过Web浏览器接入到一种大范围的、按需定制的服务中,即“云服务”。云计算技术将使用户体验发生根本性的变化。相比传统服务器架构,云计算服务器大大提高了其利用率,同时也在系统中省去了很多重复的硬件,将计算、存储、交换、管理等集成到标准系统中,并且与外界的网络设备、存储设备间的接口和通用架构保待一致。
集群服务器,简而言之,就是一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。一组集群服务器包含多台拥有共享数据存储空间的服务器,各服务器之间通过内部局域网进行相互通信;当其中一台服务器发生故障时,它所运行的应用程序将由其他的服务器自动接管;在大多数情况下,集群中所有的计算机都拥有一个共同的名称,集群系统内任意一台服务器都可被所有的网络用户所使用。
在云计算集群服务器系统中,由多个服务器组成的集群服务器做用户负载和服务器备份,用户登录服务器时,会根据云计算服务器负载到指定服务器上处理用户数据。其中服务器之间都有至少一个备份服务器,对大规模集群方式的云计算服务器组来说,感知其中一台服务器设备的指定业务模块异常非常重要,其中云计算服务器通常由网页处理模块,用户交互管理模块,用户数据存储模块组成,当其中一个业务模块出现异常时,其他模块无法感知。
现有技术存在的问题:现有技术是服务器设备异常后,等待管理员重启;或等待服务器设备进程异常调度超时,服务器设备重启,现有技术比较被动,无法实现对集群服务器状态的监控以及出现异常的提前预警。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种基于报文流量的云计算集群服务状态监控方法和系统。
本发明解决上述技术问题的技术方案如下:一种基于报文流量的云计算集群服务状态监控方法,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,其特征在于,包括如下步骤:
步骤S1,统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;
步骤S2,判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则返回步骤S1,否则产生云计算集群状态异常提醒信息。
本发明的有益效果是:本发明能够提前感知云服务集群的异常,并根据异常进行相应的动作,化被动为主动。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,步骤S1中,每隔预设第二时间阈值统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目。
进一步地,步骤S2中,若所述云计算集群中所述云计算服务器的非数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述非数据模块对应的云计算服务器。
进一步地,步骤S2中,若所述云计算集群中所述云计算服务器的数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则通知所述备份服务器给所述数据模块进行数据备份。
进一步地,步骤S2中,若所述云计算集群中所述备份服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述备份数据库。
本发明解决上述技术问题的另一种技术方案如下:一种基于报文流量的云计算集群服务状态监控系统,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,其特征在于,包括:
统计模块,用于统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;
判断模块,用于判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则调用所述统计模块,否则调用异常提醒模块;
异常提醒模块,用于产生云计算集群状态异常提醒信息。
本发明的有益效果是:本发明能够提前感知云服务集群的异常,并根据异常进行相应的动作,化被动为主动。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,所述统计模块的具体实施包括:每隔预设第二时间阈值统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目。
进一步地,所述判断模块的具体实施包括:
若所述云计算集群中所述云计算服务器的非数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述非数据模块对应的云计算服务器。
进一步地,所述判断模块的具体实施包括:
若所述云计算集群中所述云计算服务器的数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则通知所述备份服务器给所述数据模块进行数据备份。
进一步地,所述判断模块的具体实施包括:
若所述云计算集群中所述备份服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述备份数据库。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
图1为本发明所述基于报文流量的云计算集群服务状态监控方法流程图;
图2为本发明所述基于报文流量的云计算集群服务状态监控系统结构图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明所述基于报文流量的云计算集群服务状态监控方法流程图。
如图1所示,一种基于报文流量的云计算集群服务状态监控方法,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,其中方法包括如下步骤:
步骤S1,统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;
步骤S2,判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则返回步骤S1,否则产生云计算集群状态异常提醒信息。
在本发明的具体实施例中,步骤S1中,每隔预设第二时间阈值统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目。
在本发明的具体实施例中,步骤S2中,若所述云计算集群中所述云计算服务器的非数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述非数据模块对应的云计算服务器。
在本发明的具体实施例中,步骤S2中,若所述云计算集群中所述云计算服务器的数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则通知所述备份服务器给所述数据模块进行数据备份。
在本发明的具体实施例中,步骤S2中,若所述云计算集群中所述备份服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述备份数据库。
图2为本发明所述基于报文流量的云计算集群服务状态监控系统结构图。
如图2所示,一种基于报文流量的云计算集群服务状态监控系统,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,包括:
统计模块,用于统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;
判断模块,用于判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则调用所述统计模块,否则调用异常提醒模块;
异常提醒模块,用于产生云计算集群状态异常提醒信息。
在本发明的具体实施例中,统计模块的具体实施包括:每隔预设第二时间阈值统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目。
在本发明的具体实施例中,判断模块的具体实施包括:
若所述云计算集群中所述云计算服务器的非数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述非数据模块对应的云计算服务器。
在本发明的具体实施例中,判断模块的具体实施包括:
若所述云计算集群中所述云计算服务器的数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则通知所述备份服务器给所述数据模块进行数据备份。
在本发明的具体实施例中,判断模块的具体实施包括:
若所述云计算集群中所述备份服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述备份数据库。
在本说明书的描述中,参考术语“实施例一”、“实施例二”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体方法、装置或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于报文流量的云计算集群服务状态监控方法,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,其特征在于,包括如下步骤:
步骤S1,统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;
步骤S2,判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则返回步骤S1,否则产生云计算集群状态异常提醒信息。
2.根据权利要求1所述的基于报文流量的云计算集群服务状态监控方法,其特征在于,步骤S1中,每隔预设第二时间阈值统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目。
3.根据权利要求1所述的基于报文流量的云计算集群服务状态监控方法,其特征在于,步骤S2中,若所述云计算集群中所述云计算服务器的非数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述非数据模块对应的云计算服务器。
4.根据权利要求1所述的基于报文流量的云计算集群服务状态监控方法,其特征在于,步骤S2中,若所述云计算集群中所述云计算服务器的数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则通知所述备份服务器给所述数据模块进行数据备份。
5.根据权利要求1所述的基于报文流量的云计算集群服务状态监控方法,其特征在于,步骤S2中,若所述云计算集群中所述备份服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述备份数据库。
6.一种基于报文流量的云计算集群服务状态监控系统,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,其特征在于,包括:
统计模块,用于统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目;
判断模块,用于判断所述接收到的报文数目和所述发出的报文数目是否相同,若是,则调用所述统计模块,否则调用异常提醒模块;
异常提醒模块,用于产生云计算集群状态异常提醒信息。
7.根据权利要求6所述的基于报文流量的云计算集群服务状态监控系统,其特征在于,所述统计模块的具体实施包括:每隔预设第二时间阈值统计所述云计算集群中每个云计算服务器和备用服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目。
8.根据权利要求6所述的基于报文流量的云计算集群服务状态监控系统,其特征在于,所述判断模块的具体实施包括:
若所述云计算集群中所述云计算服务器的非数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述非数据模块对应的云计算服务器。
9.根据权利要求6所述的基于报文流量的云计算集群服务状态监控系统,其特征在于,所述判断模块的具体实施包括:
若所述云计算集群中所述云计算服务器的数据模块在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则通知所述备份服务器给所述数据模块进行数据备份。
10.根据权利要求6所述的基于报文流量的云计算集群服务状态监控系统,其特征在于,所述判断模块的具体实施包括:
若所述云计算集群中所述备份服务器在预设第一时间阈值中接收到的报文数目和发出的报文数目不相同,则发送重启信息给所述备份数据库。
CN201610752273.0A 2016-08-29 2016-08-29 一种基于报文流量的云计算集群服务状态监控方法和系统 Pending CN106130797A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610752273.0A CN106130797A (zh) 2016-08-29 2016-08-29 一种基于报文流量的云计算集群服务状态监控方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610752273.0A CN106130797A (zh) 2016-08-29 2016-08-29 一种基于报文流量的云计算集群服务状态监控方法和系统

Publications (1)

Publication Number Publication Date
CN106130797A true CN106130797A (zh) 2016-11-16

Family

ID=57273822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610752273.0A Pending CN106130797A (zh) 2016-08-29 2016-08-29 一种基于报文流量的云计算集群服务状态监控方法和系统

Country Status (1)

Country Link
CN (1) CN106130797A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096530A (zh) * 2019-04-22 2019-08-06 安徽晶奇网络科技股份有限公司 一种基于云计算的特困人员供养信息存储管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571499A (zh) * 2012-02-14 2012-07-11 广州亦云信息技术有限公司 一种云端数据库服务器集群的监控方法
CN103475696A (zh) * 2013-08-23 2013-12-25 汉柏科技有限公司 云计算集群服务器状态监控系统和方法
CN104202212A (zh) * 2014-08-28 2014-12-10 浪潮(北京)电子信息产业有限公司 一种获取分布式集群系统告警的系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571499A (zh) * 2012-02-14 2012-07-11 广州亦云信息技术有限公司 一种云端数据库服务器集群的监控方法
CN103475696A (zh) * 2013-08-23 2013-12-25 汉柏科技有限公司 云计算集群服务器状态监控系统和方法
CN104202212A (zh) * 2014-08-28 2014-12-10 浪潮(北京)电子信息产业有限公司 一种获取分布式集群系统告警的系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096530A (zh) * 2019-04-22 2019-08-06 安徽晶奇网络科技股份有限公司 一种基于云计算的特困人员供养信息存储管理系统
CN110096530B (zh) * 2019-04-22 2022-08-23 安徽晶奇网络科技股份有限公司 一种基于云计算的特困人员供养信息存储管理系统

Similar Documents

Publication Publication Date Title
CN102340415B (zh) 一种服务器集群系统的监控方法和一种服务器集群系统
CN102929961B (zh) 基于构建快速数据分级通道的数据处理方法及其装置
CN108322345A (zh) 一种故障修复数据包的发布方法及服务器
CN106817408B (zh) 一种分布式服务器集群调度方法及装置
CN109739919B (zh) 一种用于电力系统的前置机和采集系统
CN104750596B (zh) 一种告警信息处理方法及服务子系统
CN106357430A (zh) 一种云计算集群服务状态监控方法和系统
CN105471671A (zh) 一种云平台资源自定义监控规则的方法
CN103841129B (zh) 云计算的资源信息采集服务器和客户端、信息处理方法
CN103475696A (zh) 云计算集群服务器状态监控系统和方法
CN110891094A (zh) 一种基于中台的终端软件支撑平台
CN102354296B (zh) 一种可扩展监控资源的监控系统和方法
CN103118130A (zh) 一种用于分布式服务的集群管理方法和系统
CN105592164A (zh) 一种数据处理的分布式系统及方法
CN110727508A (zh) 一种任务调度系统和调度方法
CN105072139A (zh) 推荐方法和装置
CN105491078A (zh) Soa系统中的数据处理方法及装置、soa系统
CN110728498A (zh) 一种信息交互方法和装置
CN104967532A (zh) Toc技术运维系统及应用方法
CN108737543B (zh) 一种分布式物联网中间件及工作方法
CN109753501A (zh) 一种离线状态的数据显示方法、装置、设备和存储介质
CN106130797A (zh) 一种基于报文流量的云计算集群服务状态监控方法和系统
CN100454846C (zh) 分布式系统中上报告警信息的方法和装置
CN110868330B (zh) 云平台可划分cpu资源的评估方法、装置及评估系统
CN111698301A (zh) 一种保证服务延续的服务管理方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161116