CN110290019B

CN110290019B - 监测方法及系统

Info

Publication number: CN110290019B
Application number: CN201910444582.5A
Authority: CN
Inventors: 许永峰
Original assignee: Wangsu Science and Technology Co Ltd
Current assignee: Wangsu Science and Technology Co Ltd
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2021-09-10
Anticipated expiration: 2039-05-27
Also published as: CN110290019A

Abstract

本发明实施例涉及网络技术领域，公开了一种监测方法及系统。监测方法包括：包括：分别对多个服务器进行检测，并接收各服务器返回的检测结果；根据各服务器的检测结果，更新各服务器的状态；若任一服务器的状态发生变化，发送第一通知信息到决策中心，以供决策中心响应于第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息；第一通知信息至少包括任一服务器的状态。本发明中，能够监测多个服务器的状态，并在任一服务器的状态切换时，及时通知目标设备，以便于目标设备及时更新服务器的状态。

Description

监测方法及系统

技术领域

本发明实施例涉及网络技术领域，特别涉及一种监测方法及系统。

背景技术

在流媒体服务产品中，由于涉及到音视频的传输，传输的时延和可靠性成为用户使用该产品的重要参考。因此在分布式服务部署架构中，如何根据用户的区域、运营商等参数为用户提供可用、最优的接入服务器已经成为各种流媒体服务产品的重要设计指标。目前，通用的方案是另外部署一个调度中心，该调度中心用于维护一份待调度的服务器列表，从而根据用户请求中的运营商、所在区域等信息返回最优的接入服务器，为用户提供流媒体服务。

发明人发现现有技术中至少存在如下问题：现有技术中，如果某个服务器出现故障，但是调度中心中的调度的服务器列表还没来及更新，则会导致用户请求被调度到故障服务器，影响用户体验。

发明内容

本发明实施方式的目的在于提供一种监测方法及系统，能够监测多个服务器的状态，并在任一服务器的状态切换时，及时通知目标设备，以便于目标设备及时更新服务器的状态；同时利用多个检测中心对多个服务器进行轮询检测，能够避免单个检测中心故障导致服务器的误检。

为解决上述技术问题，本发明的实施方式提供了一种监测方法，应用于监测系统的检测中心，监测系统包括多个检测中心，以及连接于多个检测中心的决策中心；方法包括：分别对多个服务器进行检测，并接收各服务器返回的检测结果；根据各服务器的检测结果，更新各服务器的状态；若任一服务器的状态发生变化，发送第一通知信息到决策中心，以供决策中心响应于第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息；第一通知信息至少包括任一服务器的状态。

本发明的实施方式还提供了一种监测方法，应用于监测系统的决策中心，监测系统还包括连接于决策中心的多个检测中心；方法包括：响应于检测中心发送的表征任一服务器的状态变化的第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息，第一通知信息中至少包括任一服务器的状态。

本发明的实施方式还提供了一种监测系统，包括：决策中心，以及连接于决策中心的多个检测中心；检测中心用于执行上述第一项的监测方法；决策中心用于执行上述第二项的监测方法。

本发明实施方式相对于现有技术而言，通过多个检测中心分别对服务器进行检测，并接收各服务器返回的检测结果，从而检测中心能够根据各服务器的检测结果，更新各服务器的状态，并在任一服务器的状态发生变化时，发送包括该服务器的状态的第一通知消息到决策中心，决策中心响应于包括该服务器的状态的第一通知消息，根据多个检测中心中该服务器的状态，确定是否向目标设备发送表征该服务器的状态切换的第二通知消息，即能够监测多个服务器的状态，并在任一服务器的状态切换时，及时通知目标设备，以便于目标设备及时更新服务器的状态；同时利用多个检测中心对多个服务器进行轮询检测，能够避免单个检测中心故障导致服务器的误检。

另外，每个检测中心均设有与多个服务器一一对应的多组状态机，每组状态机包括检测状态机与服务器状态机；分别对多个服务器进行检测，并接收各服务器返回的检测结果，具体为：对于每个服务器，通过服务器对应的检测状态机对服务器进行检测，并接收服务器返回的检测结果；根据各服务器的检测结果，更新各服务器的状态，具体为：对于每个服务器，通过服务器对应的服务器状态机根据服务器的检测结果，更新服务器的状态；若任一服务器的状态发生变化，发送第一通知信息到决策中心，具体为：对于每个服务器，若服务器的状态发生变化，通过服务器对应的服务器状态机发送第一通知信息到决策中心。本实施方式提供了通过有限状态机来实现监测方法的具体方式。

另外，检测状态机的工作状态包括：检测状态与接收状态；通过服务器对应的检测状态机对服务器进行检测，并接收服务器返回的检测结果，包括：通过服务器对应的处于检测状态的检测状态机对服务器进行检测，并在检测成功后，切换到接收状态；通过处于接收状态的检测状态机接收服务器返回的检测结果。本实施方式提供了通过服务器对应的检测状态机对服务器进行检测，并接收服务器返回的检测结果的一种具体实现方式。

另外，服务器状态机的工作状态包括：正常状态与异常状态；通过服务器对应的服务器状态机根据服务器的检测结果，更新服务器的状态，包括：通过服务器对应的处于正常状态的服务器状态机获取到的服务器的检测结果为检测成功时，保持当前的工作状态不变；通过服务器对应的处于异常状态的服务器状态机获取到的服务器的检测结果为检测成功时，切换工作状态到正常状态；通过服务器对应的处于正常状态的服务器状态机获取到的服务器的检测结果为检测失败时，切换工作状态到异常状态；通过服务器对应的处于异常状态的服务器状态机获取到的服务器的检测结果为检测失败时，保持当前的工作状态不变。本实施方式提供了通过服务器对应的服务器状态机根据服务器的检测结果，更新服务器的状态的一种具体实现方式。

另外，服务器状态机的工作状态还包括中间状态，服务器状态机中还预设有服务器状态机对应的服务器的第一异常参数；通过服务器对应的处于正常状态的服务器状态机获取到的服务器的检测结果为检测失败时，切换工作状态到异常状态，包括：通过服务器对应的处于正常状态的服务器状态机获取到的服务器的检测结果为检测失败时，切换工作状态到中间状态，并将服务器的第一异常参数加1；通过服务器对应的处于中间状态的服务器状态机获取到的服务器的检测结果为检测失败时，将服务器的第一异常参数加1，并判断服务器的第一异常参数是否大于第一预设阈值；若服务器的第一异常参数大于第一预设阈值，切换工作状态到异常状态；通过服务器对应的服务器状态机根据服务器的检测结果，更新服务器的状态，还包括：通过服务器对应的处于中间状态的服务器状态机获取到的服务器的检测结果为检测成功时，切换工作状态到正常状态。本实施方式中，在服务器状态机的工作状态中加入中间状态，以避免由于网络波动导致单次误检时服务器被切换为异常状态，避免了单次检测结果的不准确性。

另外，每个检测中心均设有包括多个单线程的线程池，每个服务器对应于一个单线程；分别对多个服务器进行检测，并接收各服务器返回的检测结果，具体为：对于每个服务器，通过服务器对应的单线程对服务器进行检测，并接收各服务器返回的检测结果；根据各服务器的检测结果，更新各服务器的状态，具体为：对于每个服务器，通过服务器对应的单线程根据各服务器的检测结果，更新各服务器的状态；发送第一通知信息到决策中心，具体为：通过服务器对应的单线程发送第一通知信息到决策中心。本实施方式中，各服务器由检测中心中对应的单线程进行检测，实现了监测系统的无锁化操作，从而不会出现多线程并发操作时的加锁问题，避免了加锁带来的性能损耗。

另外，通过服务器对应的单线程对服务器进行检测，具体为：在对服务器进行检测时，按照预设方式计算服务器的校验值，并根据服务器的校验值，选择服务器对应的单线程对服务器进行检测。本实施方式提供了通过服务器对应的单线程对服务器进行检测的一种具体实现方式。

另外，监测系统还包括连接于决策中心以及各检测中心的消息中间件；发送第一通知信息到决策中心，具体为：通过消息中间件发送第一通知信息到决策中心。

另外，决策中心中设有状态参数；响应于检测中心发送的表征任一服务器的状态变化的第一通知信息时，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息，包括：响应于检测中心发送的第一通知信息，遍历多个检测中心最近一次发送的通知信息中任一服务器的状态；对于每个检测中心，若检测中心最近一次发送的通知信息中任一服务器的状态与第一通知信息中任一服务器的状态相同，将状态参数加1；若述状态参数达到第二预设阈值，向目标设备发送表征任一服务器的状态切换的第二通知信息。本实施方式提供了响应于检测中心发送的表征任一服务器的状态变化的第一通知信息时，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息的一种具体实现方式。

另外，对于每个检测中心，若检测中心最近一次发送的通知信息中任一服务器的状态与第一通知信息中任一服务器的状态相同，将状态参数加1，具体为：对于每个检测中心，若检测中心最近一次发送的通知信息中任一服务器的状态与第一通知信息中任一服务器的状态相同，且检测中心的通知信息的时间戳未超过预设时间时，将状态参数加1。本实施方式中，检测中心在发送通知消息时，同时发送相应的时间戳，以避免决策中心使用过期的通知消息来判断服务器状态的状态是否切换。

另外，状态参数包括对应于服务器的正常状态的正常参数与对应于服务器的异常状态的第二异常参数。本实施方式提供了状态参数的具体内容。

另外，监测系统还包括连接于决策中心以及各检测中心的消息中间件；根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息，具体为：根据多个检测中心中任一服务器的状态，确定是否通过消息中间件向目标设备发送表征任一服务器的状态切换的第二通知信息。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1和图2是根据本发明第一实施方式中的监测系统的示意图；

图3是根据本发明第二实施方式中的监测系统的示意图；

图4是根据本发明第二实施方式中的检测状态机的状态切换示意图；

图5是根据本发明第二实施方式中的服务器状态机的状态切换示意图；

图6是根据本发明第五实施方式中的监测方法的具体流程图；

图7是根据本发明第六实施方式中的监测方法的具体流程图；

图8是根据本发明第七实施方式中的监测方法的具体流程图；

图9是根据本发明第八实施方式中的监测方法的具体流程图；

图10是根据本发明第九实施方式中的监测方法的具体流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请所要求保护的技术方案。

本发明的第一实施方式涉及一种监测系统，用于对多个服务器的状态进行实时监测，多个服务器可以分布式部署在各地的机房，以实现用户就近接入，降低用户时延。

如图1所示，监测系统包括决策中心1，以及连接于决策中心1的多个检测中心2；本实施例中监测系统还包括连接于决策中心1以及各检测中心2的消息中间件3，决策中心1与检测中心2之间通过该消息中间件3完成信息交互。需要说明的是，本实施例以及之后的实施例中均以检测中心2的数量为4个，服务器4的数量为2个为例进行说明。

检测中心2用于分别对多个服务器4进行检测，并接收各服务器4返回的检测结果，检测中心2在接收到各服务器4返回的检测结果后，根据各服务器4的检测结果，更新各服务器4的状态，并在任一服务器4的状态发生变化时，发送至少包括任一服务器4的状态的第一通知信息到决策中心1。其中，检测中心2在对多个服务器4进行检测时，各服务器4仅需提供一个检测接口，便可以采用本实施例的监测系统进行监测，从而降低了对各服务器4的代码入侵，并且提升检测系统的适用范围。

具体的，以检测中心21对服务器41至服务器44进行轮询检测为例，就服务器41来说，服务器41返回检测结果，检测结果包括检测成功与检测失败，检测成功表征服务器41处于可用的正常状态，检测失败表征服务器41处于不可用的异常状态。

当服务器41返回的检测结果为检测成功时，若服务器41当前状态为异常状态，将服务器41的状态切换为正常状态，通过消息中间件3发送包括服务器41的状态为正常状态的第一通知消息到决策中心1；若服务器41返回的检测结果为检测成功，服务器41当前状态为正常状态，服务器41的状态未发生变化，无需通知决策中心1，若上一次发出第一通知信息的时间超过配置的时间，则仍需发送第一通知信息到决策中心1，并更新发出第一通知信息的时间。

当服务器41返回的检测结果为检测失败时，若服务器41当前状态为正常状态，将服务器41的状态切换为异常状态，通过消息中间件3发送包括服务器41的状态为异常状态的第一通知消息到决策中心1；若服务器41返回的检测结果为检测失败，服务器41当前状态为异常状态，服务器41的状态未发生变化，无需通知决策中心1，若上一次发出第一通知信息的时间超过配置的时间，则仍需发送第一通知信息到决策中心1，并更新发出第一通知信息的时间。

决策中心1用于响应于包括任一服务器4的状态的第一通知信息，根据多个检测中心2中该服务器4的状态，确定是否向目标设备5发送表征任一服务器4的状态切换的通知信息；其中，目标设备5为订阅了该通知信息的设备，例如目标设备5为多个服务器4的调度中心，从而调度中心能够及时维护待调度的服务器列表，提升调度中心调度的准确性，避免用户请求被调度到不可用的服务器4。

本实施例中，若服务器4的状态切换为异常状态，决策中心1则发送警告邮件到服务器4的维护人员，以便于维护人员及时对服务器4进行抢修。

具体的，决策中心1中预设有每个服务器4对应的上下文(Context)，每个服务器4的IP对应有一个上下文，每个上下文中维护有对应的服务器4的状态；仍以检测中心21对服务器41至服务器44进行轮询检测为例，就服务器41来说，决策中心1通过消息中间件3接收到检测中心21发送的包括服务器41的状态的第一通知消息后，获取检测中心22、检测中心23、检测中心24最近一次发送的通知信息中服务器41的状态，从而能够确定服务器41的状态是否切换，若确定服务器41的状态发生切换，通过消息中间件3发送表征服务器41的状态发生切换的第二通知信息到目标设备5。另外，若服务器41的状态切换为异常状态，决策中心1还会发送警告邮件到服务器41的维护人员，以便于维护人员及时对服务器41进行抢修。

本实施例中，决策中心1与检测中心2之间通过该消息中间件3完成信息交互，该消息中间件3可以为多个服务器4与目标设备5之间的消息中间件，从而实现了消息中间件的复用，便于监测系统的部署，降低了部署难度。

本实施方式相对于现有技术而言，通过多个检测中心分别对服务器进行检测，并接收各服务器返回的检测结果，从而检测中心能够根据各服务器的检测结果，更新各服务器的状态，并在任一服务器的状态发生变化时，发送包括该服务器的状态的第一通知消息到决策中心，决策中心响应于包括该服务器的状态的第一通知消息，根据多个检测中心中该服务器的状态，确定是否向目标设备发送表征该服务器的状态切换的第二通知消息，即能够监测多个服务器的状态，并在任一服务器的状态切换时，及时通知目标设备，以便于目标设备及时更新服务器的状态；同时利用多个检测中心对多个服务器进行轮询检测，能够避免单个检测中心故障导致服务器的误检。

本发明第二实施方式涉及一种监测系统。第二实施方式是在第一实施方式基础上的改进，主要改进之处在于：本实施方式中，提供了通过有限状态机实现检测中心的具体设置方式。

请参考图3，每个检测中心2中均设有与多个服务器4一一对应的多组状态机，每组状态机包括检测状态机与服务器状态机，即各组中的检测状态机与服务器状态机均对应同一个服务器4，如图3所示，检测中心21中包括两组状态机，与服务器41对应的一组状态机包括检测状态机211与服务器状态机212，与服务器42对应的一组状态机包括检测状态机221与服务器状态机222，其他检测中心22至检测中心24与检测中心21类似，在此不再赘述。

检测中心2对各服务器4进行检测时，通过与该服务器4对应的检测状态机对服务器4进行检测，并接收服务器4返回的检测结果；具体的，检测状态机能够执行预设的检测动作以对与其对应的服务器4进行检测，并接收服务器4返回的检测结果，将该检测结果发送到同组的服务器状态机，服务器状态在接收到与其对应的服务器4的检测结果后，根据服务器4的检测结果，更新服务器4的状态，若服务器4的状态发生变化，发送至少包括服务器4的状态的第一通知信息到决策中心1。

请参考图4与图5，每个检测状态机的工作状态包括：检测状态与接收状态；每个服务器状态机的工作状态包括：正常状态与异常状态，在一个例子中，服务器状态机还设置有中间状态，以避免单次检测结果的不准确性，同时服务器状态机中还预设有服务器状态机对应的服务器4的第一异常参数；本领域技术人员可以理解的，检测状态机与服务器状态机还包括初始状态。其中，服务器状态机的工作状态即用来表征对应的服务器4的状态。

下面以检测中心21的检测状态机211与服务器状态机212为例进行说明，具体如下：

检测状态机211未启动时，处于初始化状态，并在检测流程启动时，切换到检测状态，该状态下只能执行检测动作；在执行预设的检测动作对检测状态机211对应的服务器41进行检测后，若服务器41可以执行检测动作并执行成功，检测状态机211切换到接收状态，该状态下检测状态机211只能够接收服务器41返回的检测结果；若接收到服务器41返回的检测结果，将检测结果发送到对应的服务器状态机212，并切换回检测状态，等待下一次检测；若未接收到服务器41返回的检测结果，则维持在接收状态。

服务器状态机212在接收到检测状态机211发送服务器41的检测结果时，若服务器状态机212处在正常状态且服务器41的检测结果为检测成功时，说明服务器41仍然为正常状态，服务器状态机212保持当前的正常状态不变。

若服务器状态机212处在中间状态且服务器41的检测结果为检测成功时，表征服务器41当前处于正常状态，服务器状态机212也切换到正常状态，将服务器41的第一异常参数置零，并将包括服务器41的状态切换为正常状态的第一通知信息发送到决策中心1。

若服务器状态机212处在异常状态且服务器41的检测结果为检测成功时，表征服务器41当前处于正常状态，服务器状态机212也切换到正常状态，并将包括服务器41的状态切换为异常状态的第一通知信息发送到决策中心1。

若服务器状态机212处在正常状态且服务器41的检测结果为检测失败时，说明服务器41当前可能处于异常状态，服务器状态机212切换到中间状态，将服务器41的第一异常参数加1。

若服务器状态机212处在中间状态且服务器41的检测结果为检测失败时，说明服务器41当前可能处于异常状态，将服务器41的第一异常参数加1，并判断服务器41的第一异常参数是否大于第一预设阈值；若服务器41的第一异常参数大于第一预设阈值，确定服务器41当前处于异常状态，服务器状态机212切换到异常状态，并将包括服务器41的状态切换为异常状态的第一通知信息发送到决策中心1；若服务器41的第一异常参数小于或等于第一预设阈值，服务器状态机212保持当前的中间状态不变。

若服务器状态机212处在异常状态且服务器41的检测结果为检测失败时，说明服务器仍处于异常状态，服务器状态机212保持当前的异常状态不变。

在一个例子中，服务器状态机212未启动时处于初始化状态，当检测流程启动时，切换到中间状态，以在检测中心21由于组件升级等原因重启时，能够向调度中心发送一次检测结果。

本实施方式相对于第一实施方式而言，提供了通过有限状态机实现检测的具体设置方式。

本发明第三实施方式涉及一种监测系统。第三实施方式是在第一实施方式基础上的细化，主要细化之处在于：本实施方式中，请参考图1与图2，提供了决策中心1的具体工作方式。

本实施例中，决策中心1中预设有状态参数，状态参数包括对应于服务器4的正常状态的正常参数与对应于服务器4的异常状态的第二异常参数。

决策中心1用于响应于包括任一服务器4的状态的第一通知信息，遍历多个检测中心2最近一次发送的通知信息中任一服务器4的状态；对于每个检测中心2，若检测中心2最近一次发送的通知信息中该服务器4的状态与第一通知信息中服务器4的状态相同，将状态参数加1；遍历完成后，判断状态参数是否达到第二预设阈值；若状态参数达到第二预设阈值，向目标设备5发送表征任一服务器4的状态切换的第二通知信息。

在一个例子中，检测中心2发送的第一通知消息中还包括更新服务器4状态的时间戳。即检测中心2还用于在任一服务器4的状态发生变化时，发送包括更新服务器4状态的时间戳与服务器4的状态的第一通知信息到决策中心1，以避免决策中心1使用过期的通知消息来判断服务器4的状态是否切换。

具体的，用于响应于包括任一服务器4的状态的第一通知信息，遍历多个检测中心2最近一次发送的通知信息中任一服务器4的状态，对于每个检测中心2，若检测中心2最近一次发送的通知信息中该服务器4的状态与第一通知信息中服务器4的状态相同，且该检测中心2的通知信息的时间戳为超过预设时间，将状态参数加1，遍历完成后，并判断状态参数是否达到第二预设阈值；若状态参数是否达到第二预设阈值，向目标设备5发送表征任一服务器4的状态切换的第二通知信息。

下面以检测中心21对服务器41至服务器44进行轮询检测为例进行说明，具体如下：

以检测中心21检测到服务器41的状态切换为正常状态为例，决策中心1通过消息中间件3接收到检测中心21发送的包括服务器41为正常状态的第一通知消息后，将正常参数加1，并标记检测中心21；然后遍历未被标记的检测中心22、检测中心23、检测中心24最近一次发送的通知信息中服务器41的状态，每存在一个检测中心的通知消息中服务器41的状态为正常状态且该通知消息的时间戳未超过预设时间时，将正常参数加1，在遍历检测中心22、检测中心23、检测中心24之后，判断正常参数是否达到第二预设阈值，若正常参数达到第二预设阈值，决策中心1判定服务器41切换为正常状态，决策中心1通过消息中间件3发送表征服务器41的状态切换为正常状态的通知消息发送到目标设备5；检测中心21检测到服务器41的状态切换为异常状态的判断方式与上述类似，在此不再赘述；若决策中心1判定服务器41切换为异常状态，决策中心1通过消息中间件3发送表征服务器41的状态切换为异常状态的通知消息发送到目标设备5时，同时发送警告邮件到服务器41的维护人员，以便于维护人员及时对服务器41进行抢修。

需要说明的是，本实施例中，正常参数与第二异常参数可以对应不同的第二预设阈值。

本实施方式相对于第一实施方式而言，提供了决策中心根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的通知信息的具体实现方式。需要说明的是，本实施方式还可以作为在第二实施方式基础上的改进，可以达到同样的技术效果。

本发明第四实施方式涉及一种监测系统，第四实施方式是在第一实施方式基础上的改进，主要改进之处在于：请参考图1与图2，各服务器4仅由检测中心2中的一个单线程进行检测。

本实施例中，检测中心2设有包括多个单线程的线程池，每个服务器4对应于一个单线程，一个单线程可以对应于一个或多个服务器4，检测中心2中可以设定每个单线程对应于一个或多个服务器4的校验值，从而检测中心2在对服务器4进行检测时，按照预设方式计算服务器4的校验值，根据服务器4的校验值，选择与该校验值对应的单线程作为该服务为4对应的单线程。校验值可以为服务器4的IP的哈希值，则预设方式为哈希算法。

以服务器41为例，检测中心21在对服务器41进行检测时，检测中心21利用哈希算法计算服务器41的IP的哈希值，并根据服务器41的哈希值选择与服务器41对应的单线程，从而可以通过与服务器41对应的单线程对服务器41进行检测，并接收服务器41返回的检测结果，该单线程在接收到服务器41返回的检测结果后，根据服务器41的检测结果，更新服务器41的状态，并在服务器41的状态发生变化时，发送至少包括服务器41的状态通知信息到决策中心1。

本实施方式相对于第一实施方式而言，各服务器由检测中心中对应的单线程进行检测，实现了监测系统的无锁化操作，从而不会出现多线程并发操作时的加锁问题，避免了加锁带来的性能损耗。本实施方式还可以作为在第二或第三实施例基础上的改进，可以达到同样的技术效果。

本发明第五实施方式涉及一种监测方法，应用于第一实施例中的监测系统的检测中心，监测系统如图1与图2所示。

本实施方式的监测方法的具体流程如图6所示。

步骤101，分别对多个服务器进行检测，并接收各服务器返回的检测结果。

具体而言，检测中心2分别对多个服务器4进行检测，并接收各服务器4返回的检测结果。

步骤102，根据各服务器的检测结果，更新各服务器的状态。

具体而言，检测中心2在接收到各服务器4返回的检测结果后，根据各服务器4的检测结果，更新各服务器4的状态。

步骤103，若任一服务器的状态发生变化，发送第一通知信息到决策中心，以供决策中心响应于第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息；第一通知信息至少包括任一服务器的状态。

具体而言，检测中心2在多个服务器4中任一服务器4的状态发生变化时，发送至少包括任一服务器4的状态的第一通知信息到决策中心1。其中，检测中心2在对多个服务器4进行检测时，各服务器4仅需提供一个检测接口，便可以采用本实施例的监测系统进行监测，从而降低了对各服务器4的代码入侵，并且提升检测系统的适用范围。

由于第一实施例与本实施例相互对应，因此本实施例可与第一实施例互相配合实施。第一实施例中提到的相关技术细节在本实施例中依然有效，在第一实施例中所能达到的技术效果在本实施例中也同样可以实现，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在第一实施例中。

本发明第六实施方式涉及一种监测方法，第六实施方式是在第五实施方式基础上的改进，主要改进之处在于：本实施方式中，提供了通过有限状态机实现检测中心的具体设置方式。

本实施方式的监测方法的具体流程如图7所示。

步骤201，对于每个服务器，通过服务器对应的检测状态机对服务器进行检测，并接收服务器返回的检测结果。

具体而言，检测状态机能够执行预设的检测动作以对与其对应的服务器4进行检测，并接收服务器4返回的检测结果，将该检测结果发送到同组的服务器状态机。

步骤202，对于每个服务器，通过服务器对应的服务器状态机根据服务器的检测结果，更新服务器的状态。

具体而言，服务器状态在接收到与其对应的服务器4的检测结果后，根据服务器4的检测结果，更新服务器4的状态。

步骤203，对于每个服务器，若服务器的状态发生变化，通过服务器对应的服务器状态机发送第一通知信息到决策中心，以供决策中心响应于第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息；第一通知信息至少包括任一服务器的状态。

具体而言，服务器状态在服务器4的状态发生变化，发送至少包括服务器4的状态的第一通知信息到决策中心1。

由于第二实施例与本实施例相互对应，因此本实施例可与第二实施例互相配合实施。第二实施例中提到的相关技术细节在本实施例中依然有效，在第二实施例中所能达到的技术效果在本实施例中也同样可以实现，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在第二实施例中。

本实施方式相对于第五实施方式而言，提供了通过有限状态机实现检测的具体设置方式。

本发明第七实施方式涉及一种监测方法，本实施方式是在第五实施方式基础上的改进，主要改进之处在于：各服务器仅由检测中心中的一个单线程进行检测。

本实施方式的监测方法的具体流程如图8所示。

步骤301，对于每个服务器，通过服务器对应的单线程对服务器进行检测，并接收各服务器返回的检测结果。

步骤302，对于每个服务器，通过服务器对应的单线程根据各服务器的检测结果，更新各服务器的状态。

步骤303，若任一服务器的状态发生变化，通过服务器对应的单线程发送第一通知信息到决策中心，以供决策中心响应于第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息；第一通知信息至少包括任一服务器的状态。

具体而言，以服务器41为例，检测中心21在对服务器41进行检测时，检测中心21利用哈希算法计算服务器41的IP的哈希值，并根据服务器41的哈希值选择与服务器41对应的单线程，从而可以通过与服务器41对应的单线程对服务器41进行检测，并接收服务器41返回的检测结果，该单线程在接收到服务器41返回的检测结果后，根据服务器41的检测结果，更新服务器41的状态，并在服务器41的状态发生变化时，发送至少包括服务器41的状态通知信息到决策中心1。

由于第四实施例与本实施例相互对应，因此本实施例可与第四实施例互相配合实施。第四实施例中提到的相关技术细节在本实施例中依然有效，在第四实施例中所能达到的技术效果在本实施例中也同样可以实现，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在第四实施例中。

本实施方式相对于第五实施方式而言，各服务器由检测中心中对应的单线程进行检测，实现了监测系统的无锁化操作，从而不会出现多线程并发操作时的加锁问题，避免了加锁带来的性能损耗。本实施方式还可以作为在第六实施例基础上的改进，可以达到同样的技术效果。

本发明第八实施方式涉及一种监测方法，应用于第一实施例中的监测系统的决策中心，监测系统如图1与图2所示。

本实施方式的监测方法的具体流程如图9所示。

步骤401，响应于检测中心发送的表征任一服务器的状态变化的第一通知信息，根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息。

具体而言，检测中心2分别对多个服务器4进行检测，并接收各服务器4返回的检测结果，检测中心2在接收到各服务器4返回的检测结果后，根据各服务器4的检测结果，更新各服务器4的状态，并在任一服务器4的状态发生变化时，发送至少包括任一服务器4的状态的第一通知信息到决策中心1；决策中心1响应于包括任一服务器4的状态的第一通知信息，根据多个检测中心2中任一服务器4的状态，确定是否向目标设备5发送表征任一服务器4的状态切换的第二通知信息。

本发明第九实施方式涉及一种监测方法，本实施方式是在第八实施方式基础上的细化，主要细化之处在于：提供了根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息的一种具体实现方式。

本实施方式的监测方法的具体流程如图10所示。

步骤501，包括以下子步骤：

子步骤5011，响应于检测中心发送的第一通知信息，遍历多个检测中心最近一次发送的通知信息中任一服务器的状态。

子步骤5012，对于每个检测中心，若检测中心最近一次发送的通知信息中任一服务器的状态与第一通知信息中任一服务器的状态相同，将状态参数加1。

子步骤5013，若述状态参数达到第二预设阈值，向目标设备发送表征任一服务器的状态切换的第二通知信息。

具体而言，决策中心1中预设有状态参数，决策中心1响应于包括任一服务器4的状态的第一通知信息，遍历多个检测中心2最近一次发送的通知信息中任一服务器4的状态；对于每个检测中心2，若检测中心2最近一次发送的通知信息中该服务器4的状态与第一通知信息中服务器4的状态相同，将状态参数加1；遍历完成后，判断状态参数是否达到第二预设阈值；若状态参数达到第二预设阈值，向目标设备5发送表征任一服务器4的状态切换的第二通知信息。其中，状态参数包括对应于服务器4的正常状态的正常参数与对应于服务器4的异常状态的第二异常参数。

由于第三实施例与本实施例相互对应，因此本实施例可与第三实施例互相配合实施。第三实施例中提到的相关技术细节在本实施例中依然有效，在第三实施例中所能达到的技术效果在本实施例中也同样可以实现，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在第三实施例中。

本实施方式相对于第八实施方式而言，提供了根据多个检测中心中任一服务器的状态，确定是否向目标设备发送表征任一服务器的状态切换的第二通知信息的一种具体实现方式。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

1.一种监测方法，其特征在于，应用于监测系统的检测中心，所述监测系统包括多个所述检测中心，以及连接于多个所述检测中心的决策中心；所述方法包括：

分别对多个服务器进行检测，并接收各所述服务器返回的检测结果；

根据各所述服务器的所述检测结果，更新各所述服务器的状态；

若任一所述服务器的状态发生变化，发送第一通知信息到所述决策中心，以供所述决策中心响应于所述第一通知信息，根据所述多个检测中心中所述任一所述服务器的状态，确定是否向目标设备发送表征所述任一所述服务器的状态切换的第二通知信息；所述第一通知信息至少包括所述任一所述服务器的状态；

其中，每个所述检测中心均设有与多个服务器一一对应的多组状态机，每组状态机包括检测状态机与服务器状态机；所述服务器状态机包括正常状态、中间状态和异常状态，当检测流程启动时，所述服务器状态机切换到中间状态；

所述分别对多个服务器进行检测，并接收各所述服务器返回的检测结果，具体为：

对于每个所述服务器，通过所述服务器对应的所述检测状态机对所述服务器进行检测，并接收所述服务器返回的检测结果；

所述根据各所述服务器的所述检测结果，更新各所述服务器的状态，具体为：

对于每个所述服务器，通过所述服务器对应的所述服务器状态机根据所述服务器的检测结果，更新所述服务器的状态；

所述若任一所述服务器的状态发生变化，发送第一通知信息到所述决策中心，具体为：

对于每个所述服务器，若所述服务器的状态发生变化，通过所述服务器对应的所述服务器状态机发送所述第一通知信息到所述决策中心。

2.根据权利要求1所述的监测方法，其特征在于，所述检测状态机的工作状态包括：检测状态与接收状态；

所述通过所述服务器对应的所述检测状态机对所述服务器进行检测，并接收所述服务器返回的检测结果，包括：

通过所述服务器对应的处于检测状态的所述检测状态机对所述服务器进行检测，并在检测成功后，切换到接收状态；

通过处于接收状态的所述检测状态机接收所述服务器返回的检测结果。

3.根据权利要求1所述的监测方法，其特征在于，所述服务器状态机的工作状态包括：正常状态与异常状态；

所述通过所述服务器对应的所述服务器状态机根据所述服务器的检测结果，更新所述服务器的状态，包括：

通过所述服务器对应的处于正常状态的所述服务器状态机获取到的所述服务器的检测结果为检测成功时，保持当前的工作状态不变；

通过所述服务器对应的处于异常状态的所述服务器状态机获取到的所述服务器的检测结果为检测成功时，切换工作状态到正常状态；

通过所述服务器对应的处于正常状态的所述服务器状态机获取到的所述服务器的检测结果为检测失败时，切换工作状态到异常状态；

通过所述服务器对应的处于异常状态的所述服务器状态机获取到的所述服务器的检测结果为检测失败时，保持当前的工作状态不变。

4.根据权利要求3所述的监测方法，其特征在于，所述服务器状态机的工作状态还包括中间状态，所述服务器状态机中还预设有所述服务器状态机对应的所述服务器的第一异常参数；

通过所述服务器对应的处于正常状态的所述服务器状态机获取到的所述服务器的检测结果为检测失败时，切换工作状态到异常状态，包括：

通过所述服务器对应的处于正常状态的所述服务器状态机获取到的所述服务器的检测结果为检测失败时，切换工作状态到中间状态，并将所述服务器的第一异常参数加1；

通过所述服务器对应的处于中间状态的所述服务器状态机获取到的所述服务器的检测结果为检测失败时，将所述服务器的第一异常参数加1，并判断所述服务器的第一异常参数是否大于第一预设阈值；若所述服务器的第一异常参数大于第一预设阈值，切换工作状态到异常状态；

所述通过所述服务器对应的所述服务器状态机根据所述服务器的检测结果，更新所述服务器的状态，还包括：

通过所述服务器对应的处于中间状态的所述服务器状态机获取到的所述服务器的检测结果为检测成功时，切换工作状态到正常状态。

5.根据权利要求1所述的监测方法，其特征在于，每个所述检测中心均设有包括多个单线程的线程池，每个所述服务器对应于一个所述单线程；

对于每个所述服务器，通过所述服务器对应的所述单线程对所述服务器进行检测，并接收各所述服务器返回的检测结果；

所述根据各所述服务器的检测结果，更新各所述服务器的状态，具体为：

对于每个所述服务器，通过所述服务器对应的所述单线程根据各所述服务器的检测结果，更新各所述服务器的状态；

所述发送第一通知信息到所述决策中心，具体为：

通过所述服务器对应的所述单线程发送第一通知信息到所述决策中心。

6.根据权利要求5所述的监测方法，其特征在于，所述通过所述服务器对应的所述单线程对所述服务器进行检测，具体为：

在对所述服务器进行检测时，按照预设方式计算所述服务器的校验值，并根据所述服务器的校验值，选择所述服务器对应的所述单线程对所述服务器进行检测。

7.根据权利要求1所述的监测方法，其特征在于，所述监测系统还包括连接于所述决策中心以及各所述检测中心的消息中间件；

所述发送第一通知信息到所述决策中心，具体为：

通过所述消息中间件发送所述第一通知信息到所述决策中心。

8.一种监测方法，其特征在于，应用于监测系统的决策中心，所述监测系统还包括连接于所述决策中心的多个检测中心；

所述方法包括：

响应于所述检测中心发送的表征任一服务器的状态变化的第一通知信息，根据多个所述检测中心中所述任一所述服务器的状态，确定是否向目标设备发送表征所述任一所述服务器的状态切换的第二通知信息，所述第一通知信息中至少包括所述任一所述服务器的状态；每个所述检测中心均设有与多个服务器一一对应的多组状态机，每组状态机包括检测状态机与服务器状态机；所述服务器状态机包括正常状态、中间状态和异常状态，当检测流程启动时，所述服务器状态机切换到中间状态。

9.根据权利要求8所述的监测方法，其特征在于，所述决策中心中设有状态参数；

所述响应于所述检测中心发送的表征任一服务器的状态变化的第一通知信息时，根据多个所述检测中心中所述任一所述服务器的状态，确定是否向目标设备发送表征所述任一所述服务器的状态切换的第二通知信息，包括：

响应于所述检测中心发送的所述第一通知信息，遍历所述多个所述检测中心最近一次发送的通知信息中所述任一所述服务器的状态；

对于每个所述检测中心，若所述检测中心最近一次发送的通知信息中所述任一所述服务器的状态与所述第一通知信息中所述任一所述服务器的状态相同，将所述状态参数加1；

若所述状态参数达到第二预设阈值，向目标设备发送表征所述任一所述服务器的状态切换的第二通知信息。

10.根据权利要求8所述的监测方法，其特征在于，所述第一通知信息还包括更新所述任一所述服务器的状态的时间戳；

对于每个所述检测中心，若所述检测中心最近一次发送的通知信息中所述任一所述服务器的状态与所述第一通知信息中所述任一所述服务器的状态相同，将所述状态参数加1，具体为：

对于每个所述检测中心，若所述检测中心最近一次发送的通知信息中所述任一所述服务器的状态与所述第一通知信息中所述任一所述服务器的状态相同，且所述检测中心的通知信息的时间戳未超过预设时间，将所述状态参数加1。

11.根据权利要求8所述的监测方法，其特征在于，所述状态参数包括对应于所述服务器的正常状态的正常参数与对应于所述服务器的异常状态的第二异常参数。

12.根据权利要求8所述的监测方法，其特征在于，所述监测系统还包括连接于所述决策中心以及各所述检测中心的消息中间件；

根据多个所述检测中心中所述任一所述服务器的状态，确定是否向目标设备发送表征所述任一所述服务器的状态切换的第二通知信息，具体为：

根据多个所述检测中心中所述任一所述服务器的状态，确定是否通过所述消息中间件向目标设备发送表征所述任一所述服务器的状态切换的第二通知信息。

13.一种监测系统，其特征在于，包括：决策中心，以及连接于所述决策中心的多个检测中心；

所述检测中心用于执行权利要求1至7中任一项所述的监测方法；

所述决策中心用于执行权利要求8至12中任一项所述的监测方法。