CN115549751A - 遥感卫星地面站监控系统和方法 - Google Patents

遥感卫星地面站监控系统和方法 Download PDF

Info

Publication number
CN115549751A
CN115549751A CN202210975262.4A CN202210975262A CN115549751A CN 115549751 A CN115549751 A CN 115549751A CN 202210975262 A CN202210975262 A CN 202210975262A CN 115549751 A CN115549751 A CN 115549751A
Authority
CN
China
Prior art keywords
service
monitoring
virtual machine
remote sensing
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210975262.4A
Other languages
English (en)
Other versions
CN115549751B (zh
Inventor
殷慈
黄艳
李亚林
冯旭祥
张洪群
李安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Information Research Institute of CAS
Original Assignee
Aerospace Information Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Information Research Institute of CAS filed Critical Aerospace Information Research Institute of CAS
Priority to CN202210975262.4A priority Critical patent/CN115549751B/zh
Publication of CN115549751A publication Critical patent/CN115549751A/zh
Application granted granted Critical
Publication of CN115549751B publication Critical patent/CN115549751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1851Systems using a satellite or space-based relay
    • H04B7/18519Operations control, administration or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Radio Relay Systems (AREA)

Abstract

本发明提供一种遥感卫星地面站监控系统和方法,该系统包括业务监控模块和部署有多个监控节点的虚拟机集群,每个监控节点上部署至少一个对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的业务服务;监控节点用于采集与其通信连接的至少一个接收站设备的运行状态数据,基于运行状态数据确定监控节点上部署的业务服务的服务运行状态信息;业务监控模块用于对多个监控节点上部署的所有业务服务进行统一管理,响应于服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务。本发明提供的技术方案可以实现遥感卫星地面站监控系统的分级运行,提高系统的可靠性。

Description

遥感卫星地面站监控系统和方法
技术领域
本发明涉及遥感卫星数据接收技术领域,尤其涉及一种遥感卫星地面站监控系统和方法。
背景技术
遥感卫星数据在测绘、交通、地矿、电力、农业、公共安全等领域有着广泛的应用。遥感卫星地面站负责卫星观测数据的接收,其稳定运行是保障遥感卫星数据及时可靠落地的必要前提。监控系统作为遥感卫星地面站的管控中枢,负责管控遥感卫星地面站的遥感卫星数据接收业务,并监视遥感卫星地面站内各设备的运行状态,因此,监控系统的连续稳定运行是保证遥感卫星地面站可靠运行的必要前提。
目前的遥感卫星地面站监控系统主要采用统一监控的方式,全部的监控和业务调度在同一个软件服务中完成,这样,某一业务发生故障会影响其他业务的运行,特别是非核心业务发生故障时会导致核心业务无法运行,严重影响了监控系统的可靠性。
发明内容
本发明提供一种遥感卫星地面站监控系统和方法,用以解决现有技术中遥感卫星地面站监控系统的非核心业务发生故障会导致核心业务功能无法运行的缺陷,实现遥感卫星地面站监控系统的分级运行,提高遥感卫星地面站监控系统的可靠性。
本发明提供一种遥感卫星地面站监控系统,包括业务监控模块和与所述业务监控模块通信连接的虚拟机集群,所述虚拟机集群上部署有多个监控节点,每个所述监控节点上部署至少一个业务服务,所述至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,所述卫星数据接收系统运行在所述虚拟机集群上;
所述监控节点用于与至少一个接收站设备通信连接,采集所述接收站设备的运行状态数据,基于所述运行状态数据确定所述监控节点上部署的业务服务的服务运行状态信息,并将所述服务运行状态信息发送给所述业务监控模块;
所述业务监控模块用于对所述多个监控节点上部署的所有业务服务进行统一管理,响应于所述服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复所述服务运行状态信息指示的出现异常的业务服务。
根据本发明提供的一种遥感卫星地面站监控系统,所述业务监控模块中包括分级监控单元和业务自启动单元;
所述分级监控单元用于接收所述服务运行状态信息,响应于所述服务运行状态信息指示业务服务异常,触发所述业务自启动单元重新启动所述服务运行状态信息指示的出现异常的业务服务,响应于重启所述出现异常的业务服务失败,从所述多个监控节点中确定第一目标监控节点,并将所述出现异常的业务服务迁移至所述第一目标监控节点运行。
根据本发明提供的一种遥感卫星地面站监控系统,所述业务监控模块还包括虚拟机自动迁移单元;
所述分级监控单元还用于响应于将所述出现异常的业务服务迁移至所述第一目标监控节点失败,触发所述虚拟机自动迁移单元将所述出现异常的业务服务从当前虚拟机迁移至第一目标虚拟机运行。
根据本发明提供的一种遥感卫星地面站监控系统,所述业务监控模块中包括分级监控单元和双机热备单元,所述多个监控节点上部署的业务服务中的核心业务服务同时部署在两台虚拟机上并行运行,所述两台虚拟机包括主虚拟机和备虚拟机;
所述分级监控单元还用于获取所述主虚拟机的运行状态信息,得到第一运行状态信息,响应于所述第一运行状态信息指示所述主虚拟机出现故障或所述服务运行状态信息指示所述主虚拟机上运行的核心业务服务异常,触发所述双机热备单元进行所述主虚拟机到所述备虚拟机的切换。
根据本发明提供的一种遥感卫星地面站监控系统,所述分级监控单元还用于响应于所述双机热备单元进行所述主虚拟机到所述备虚拟机的切换失败,重新启动所述主虚拟机上运行所述核心业务服务的监控节点,响应于重新启动所述主虚拟机上运行所述核心业务服务的监控节点失败,从所述多个监控节点中确定第二目标监控节点,并将所述核心业务服务迁移至所述第二目标监控节点运行。
根据本发明提供的一种遥感卫星地面站监控系统,所述业务监控模块还包括虚拟机自动迁移单元;
所述分级监控单元还用于响应于将所述核心业务服务迁移至所述第二目标监控节点失败,触发所述虚拟机自动迁移单元从所述虚拟机集群中确定第二目标虚拟机,并将所述核心业务服务从当前虚拟机迁移至所述第二目标虚拟机运行。
根据本发明提供的一种遥感卫星地面站监控系统,所述遥感卫星地面站监控系统还包括与所述业务监控模块通信连接的应急备份设备;
所述应急备份设备与所述卫星数据接收系统通信连接,接收所述卫星数据接收系统的同步配置信息;
所述分级监控单元还用于响应于将所述核心业务服务从当前虚拟机迁移至所述第二目标虚拟机失败,启动所述应急备份设备;所述应急备份设备启动后基于所述同步配置信息执行运行所述卫星数据接收系统的所有核心业务服务。
根据本发明提供的一种遥感卫星地面站监控系统,所述业务监控模块中包括分级监控单元和虚拟机自动迁移单元;
所述分级监控单元用于获取所述虚拟机集群中各虚拟机的运行状态,得到第二运行状态信息,响应于所述第二运行状态信息指示第一虚拟机出现异常,触发所述虚拟机自动迁移单元从所述虚拟机集群中确定第二虚拟机,并将所述第一虚拟机上运行的业务服务迁移至所述第二虚拟机。
根据本发明提供的一种遥感卫星地面站监控系统,所述监控节点配置有对应的热备监控节点,所述监控节点和所述监控节点对应的热备监控节点上部署相同的业务服务;
所述业务监控模块还用于监测所述监控节点的节点运行状态信息,响应于所述节点运行状态信息指示所述监控节点出现故障,启动所述监控节点对应的热备监控节点,并向所述监控节点对应的热备监控节点下发所述监控节点的配置信息。
根据本发明提供的一种遥感卫星地面站监控系统,所述业务监控模块还用于接收请求新增接收站设备的请求信息,响应于所述请求信息,在所述虚拟机集群当前部署的监控节点中确定待绑定监控节点,在所述待绑定监控节点上添加所述请求信息请求新增的接收站设备的访问权限信息;或者,所述业务监控模块响应于所述请求信息,在所述虚拟机集群上新增监控节点,在新增的监控节点上添加所述请求信息请求新增的接收站设备的访问权限信息。
本发明还提供一种遥感卫星地面站监控方法,包括:
获取多个监控节点发送的业务服务的服务运行状态信息,所述多个监控节点中的每个监控节点上部署至少一个业务服务,所述至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,所述多个监控节点部署在虚拟机集群上,所述虚拟机集群运行所述卫星数据接收系统;
响应于所述服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复所述服务运行状态信息指示的出现异常的业务服务。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的遥感卫星地面站监控方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的遥感卫星地面站监控方法。
本发明提供的遥感卫星地面站监控系统和方法,通过将卫星数据接收系统的业务基于业务功能划分为多个业务服务部署到虚拟机集群的多个监控节点上运行,分离业务服务,监控节点可以对每个业务服务进行监测,当某个业务服务异常时,可以基于设定的故障分级处理机制对该业务服务进行恢复,保证该业务服务的正常运行。这样,通过分离业务服务可以解耦核心业务服务和非核心业务服务,实现遥感卫星地面站监控系统的分级运行和业务服务故障的隔离处理,当非核心业务服务出现故障时不会影响核心业务服务的正常运行,从而保证了核心业务服务的独立稳定运行,提高了遥感卫星地面站监控系统的可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的遥感卫星地面站监控系统的结构示意图之一;
图2是本发明提供的遥感卫星地面站监控系统的结构示意图之二;
图3是本发明提供的利用服务守护和业务服务迁移机制恢复业务服务的方法流程示意图;
图4是本发明提供的利用虚拟机自动迁移机制迁移虚拟机以恢复业务服务的方法流程示意图;
图5是本发明提供的通过应急备份功能恢复业务服务的方法流程示意图;
图6是本发明提供的核心业务服务故障处理方法的流程示意图;
图7是本发明提供的遥感卫星地面站监控方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
遥感卫星地面站监控系统的连续稳定运行是保证遥感卫星地面站可靠运行的必要前提。随着遥感卫星地面站系统规模的日益庞大,遥感卫星地面站监控系统也更加复杂,这便对遥感卫星地面站监控系统提出了更高的要求。相关技术中,遥感卫星地面站监控系统主要采用“客户端-服务器”的软件架构,将卫星数据接收系统的业务逻辑集中于单一服务端软件,各业务功能耦合程度较高,一旦有业务功能出现故障,可能导致整个系统崩溃而影响其他业务功能的正常运行,特别是非核心业务功能出现故障会导致核心业务功能失效,严重降低监控系统的可靠性,且故障隔离处理困难,无法保证业务功能的连续性。
基于此,在本发明实施例中,采用微服务架构,将遥感卫星地面站所有的卫星数据接收系统的全部业务封装成多个业务服务,部署在虚拟机的多个监控节点上运行。这些分散部署的业务服务由业务监控模块进行整合和统一管理,形成完整的业务能力。监控节点可以与至少一个接收站设备通信连接,采集接收站设备的运行状态数据,基于该运行状态数据确定监控节点上部署的业务服务的服务运行状态信息;业务监控模块响应于监控节点发送的服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务。
在本发明实施例中,核心业务服务是与遥感卫星地面站接收卫星数据的任务相关的业务服务,比如可以包括设备监控、接收任务获取、接收任务处理、接收任务执行、设备链路配置、任务参数配置等;非核心业务服务比如可以包括信息管理、系统标校等业务服务。
下面结合图1-图6对本发明的遥感卫星地面站监控系统进行描述。
图1示例性示出了本发明实施例提供的遥感卫星地面站监控系统的结构示意图之一,参照图1所示,该遥感卫星地面站监控系统可以包括业务监控模块110和与该业务监控模块110通信连接的虚拟机集群120。虚拟机集群120中可以包括多个虚拟机,该虚拟机集群120上部署有多个监控节点,比如如图1所示,部署了监控节点1、监控节点2……和监控节点n,共n个监控节点,其中的n为大于1的整数,这些监控节点可以分布部署到虚拟机集群120的多个虚拟机上。每个监控节点上部署至少一个业务服务,这些业务服务可以是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,其中的卫星数据接收系统运行在虚拟机集群120上。示例性的,虚拟机集群120和业务监控模块110可以部署在一台服务器上,也可以部署在多个服务器构成的服务器集群上。
其中,监控节点用于与至少一个接收站设备通信连接,采集接收站设备的运行状态数据,基于运行状态数据确定该监控节点上部署的业务服务的服务运行状态信息,并将获得的服务运行状态信息发送给业务监控模块110;业务监控模块110用于对虚拟机集群120中监控节点上部署的所有业务服务进行统一管理,响应于服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复服务该运行状态信息指示的出现异常的业务服务。比如,在图1中,设备组1、设备组2和设备组n中可以包括一个或多个接收站设备通信连接,监控节点1、监控节点2和监控节点n分别与设备组1、设备组2和设备组n中的这些接收站设备通信连接。
具体的,监控节点上可以配置设备配置信息,该设备配置信息中可以包括设备通信接口和设备访问权限等,监控节点可以基于该设备配置信息与对应的接收站设备通信连接,采集其连接的接收站设备上的运行状态数据,同时可以向其连接的接收站设备发送参数控制指令,控制接收站设备的运行。业务监控模块110可以负责宏配置管理、接收站任务的执行控制、控制监控节点完成配置信息的自动化下达等工作,对虚拟机集群120中监控节点上部署的所有业务服务进行统一管理。
示例性的,当遥感卫星地面站新增接收站设备时,遥感卫星地面站监控系统可以在已有的监控节点上扩充设备配置信息,添加新的设备通信接口。或者,遥感卫星地面站监控系统也可以增加新的监控节点,为新增的监控节点开放新增的接收站设备的访问权限,实现遥感卫星地面站监控系统对接收站设备监控能力的热扩充。具体的,业务监控模块110还用于接收请求新增接收站设备的请求信息,响应于该请求信息,在虚拟机集群120当前部署的监控节点中确定待绑定监控节点,在待绑定监控节点上添加请求信息请求新增的接收站设备的访问权限信息;或者,业务监控模块110可以响应于请求信息,在虚拟机集群120上新增监控节点,在新增的监控节点上添加请求信息请求新增的接收站设备的访问权限信息。
示例性的,业务监控模块110可以根据新增的接收站设备的功能、虚拟机集群120当前已部署的监控节点的性能、当前已部署的监控节点上的业务服务类型等其中至少之一选定待绑定监控节点。
示例性的,业务监控模块110可以设置服务注册功能,实现对业务服务提供者的名称及其所发布业务服务的注册登记,具有可根据需求动态扩展监控节点的能力。
示例性的,业务监控模块110可以设置服务管理功能,实现维护业务服务信息,更新业务服务状态,统一管理全部的监控节点,可动态配置接收站设备,比如添加或删除接收站设备,为客户端调用业务服务提供访问路径。
示例性的,业务监控模块110可以设置服务发现功能,实现业务服务的查找和定位,向业务服务调用者传递业务服务参数。比如,业务监控模块110可以接收各应用服务或客户端提交的业务服务查询指令,基于该查询指令查询相应的业务服务,然后将业务服务查询结果返回给查询请求方。
示例性的,业务监控模块110中可以包括显示单元,该显示单元可以用于显示监控界面,该监控界面中可以包括业务服务运行状态监控区、监控系统拓扑网络显示区、接收站设备工作状态监控区、接收站接收任务监控区等其中至少之一,但不限于此。管理员可以通过该监控界面查看遥感卫星地面站监控系统的概要信息和所有监控对象的工作状态及实时监测结果,能够为全部可监控设备提供独立的监控界面。
本发明实施例提供的遥感卫星地面站监控系统,通过将卫星数据接收系统的业务基于业务功能划分为多个业务服务部署到虚拟机集群的多个监控节点上运行,分离业务服务,监控节点可以对每个业务服务进行监测,当某个业务服务异常时,业务监控模块基于设定的故障分级处理机制对该业务服务进行恢复,保证该业务服务的正常运行。这样,通过分离业务服务可以解耦核心业务服务和非核心业务服务,实现遥感卫星地面站监控系统的分级运行和业务服务故障的隔离处理,当非核心业务服务出现故障时不会影响核心业务服务的正常运行,从而保证了核心业务服务的独立稳定运行,提高了遥感卫星地面站监控系统的可靠性。
基于图1对应实施例的遥感卫星地面站监控系统,在一种示例实施例中,业务监控模块110中可以包括分级监控单元和业务自启动单元。其中,分级监控单元可以用于接收服务运行状态信息,响应于服务运行状态信息指示业务服务异常,触发业务自启动单元重新启动服务运行状态信息指示的出现异常的业务服务,响应于重启出现异常的业务服务失败,从虚拟机集群120中部署的多个监控节点中确定第一目标监控节点,并将出现异常的业务服务迁移至第一目标监控节点运行。这样,当仅业务服务出现故障时,可以通过业务服务重启和业务服务迁移实现异常业务服务的快速恢复,保证业务服务的连续运行。
一种示例实施例中,业务监控模块110还可以包括虚拟机自动迁移单元;分级监控单元还可以响应于将出现异常的业务服务迁移至第一目标监控节点失败,触发虚拟机自动迁移单元从虚拟机集群120中确定出第一目标虚拟机,并将出现异常的业务服务从当前虚拟机迁移至第一目标虚拟机运行。
基于图1对应实施例的遥感卫星地面站监控系统,在一种示例实施例中,业务监控模块中可以包括分级监控单元和双机热备单元,在虚拟机集群120中,多个监控节点上部署的业务服务中的核心业务服务同时部署在两台虚拟机上并行运行,这两台虚拟机包括主虚拟机和备虚拟机;分级监控单元还可以获取主虚拟机的运行状态信息,得到第一运行状态信息,响应于第一运行状态信息指示主虚拟机出现故障或服务运行状态信息指示主虚拟机上运行的核心业务服务异常,触发双机热备单元进行主虚拟机到备虚拟机的切换。通过设置双机热备的运行方式,可以在核心业务服务出现异常时快速地切换到备虚拟机上运行,保证了核心业务服务不中断,提高了遥感卫星地面站监控系统的可靠性。
进一步的,在双机热备切换失败时,还可以采取重新启动监控节点的方式进一步保证核心业务服务的可靠运行。具体的,分级监控单元还可以用于响应于双机热备单元进行主虚拟机到备虚拟机的切换失败,重新启动主虚拟机上运行核心业务服务的监控节点,响应于重新启动主虚拟机上运行核心业务服务的监控节点失败,从多个监控节点中确定第二目标监控节点,并将核心业务服务迁移至第二目标监控节点运行。
一种示例实施例中,业务监控模块还可以包括虚拟机自动迁移单元。分级监控单元还可以用于响应于将核心业务服务迁移至第二目标监控节点失败,触发虚拟机自动迁移单元从虚拟机集群中确定第二目标虚拟机,并将核心业务服务从当前虚拟机迁移至第二目标虚拟机运行。
一种示例实施例中,遥感卫星地面站监控系统还可以包括与业务监控模块110通信连接的应急备份设备。应急备份设备与卫星数据接收系统通信连接,接收卫星数据接收系统的同步配置信息;分级监控单元还可以用于响应于将核心业务服务从当前虚拟机迁移至第二目标虚拟机失败,启动应急备份设备;应急备份设备启动后基于同步配置信息执行运行卫星数据接收系统的所有核心业务服务。其中应急备份设备可以是一台单独的物理机,可以与卫星数据接收系统通过网络相连,具备卫星数据接收系统的全部功能。通过建立应急备份功能,可以在整个虚拟机平台出现故障时保证业务服务的正常运行,提高遥感卫星地面站监控系统的可靠性。
基于图1对应实施例的遥感卫星地面站监控系统,在一种示例实施例中,业务监控模块110中可以包括分级监控单元和虚拟机自动迁移单元。分级监控单元可以用于获取虚拟机集群120中各虚拟机的运行状态,得到第二运行状态信息,响应于该第二运行状态信息指示第一虚拟机出现异常,触发虚拟机自动迁移单元从虚拟机集群中确定第二虚拟机,并将第一虚拟机上运行的业务服务迁移至第二虚拟机。通过对虚拟机集群120中各虚拟机进行监测和对异常虚拟机上业务服务的自动迁移,可以在部分虚拟机出现异常时快速实现业务服务的自动迁移,保证了业务服务运行环境的稳定,进而确保了业务服务的正常、连续运行。
基于图1对应实施例的遥感卫星地面站监控系统,在一种示例实施例中,可以为虚拟机集群120中部署的每个监控节点配置对应的热备监控节点,监控节点和该监控节点对应的热备监控节点上部署相同的业务服务。业务监控模块110还可以用于监测监控节点的节点运行状态信息,响应于该节点运行状态信息指示监控节点出现故障,启动该出现故障的监控节点对应的热备监控节点,并向该出现故障的监控节点对应的热备监控节点下发该出现故障的监控节点的配置信息,快速切换热备监控节点为主运行状态。具体的,虚拟机集群120中部署的监控节点均采用全局热备模式,监控节点之间无交互,监控节点之间的故障相互隔离,无信息交互。当某个监控节点出现运行故障时,业务监控模块110可以启动热备监控节点,获取发生故障的监控节点的配置信息,为热备监控节点加载该配置信息,将热备监控节点切换为主运行状态,实现监控节点的快速切换。通过为监控节点设置全局热备模式,可以在监控节点出现故障时快速切换至热备监控节点,保证遥感卫星地面站监控系统的稳定可靠运行。
基于上述各实施例,下面以遥感卫星地面站监控系统的虚拟机集群包括3个虚拟机为例对本发明实施例提供的遥感卫星地面站监控系统做进一步的举例说明。
图2示例性示出了本发明实施例提供的遥感卫星地面站监控系统的结构示意图之二,该遥感卫星地面站监控系统采用分布式监控系统架构进行设计,结合了虚拟化和微服务架构思想。参照图2所示,该遥感卫星地面站监控系统包括虚拟机A、虚拟机B、虚拟机C、业务监控模块210和应急备份设备230。虚拟机A、虚拟机B和虚拟机C构成虚拟机集群,可以运行遥感卫星地面站的卫星数据接收系统。其中,虚拟机A上部署了3个监控节点:监控节点1、监控节点2和监控节点3;虚拟机B上部署了1个监控节点:监控节点4;虚拟机C上部署了2个监控节点:监控节点5和监控节点6。每个监控节点连接一个接收站设备,图2中的设备a~设备f即代表接收站设备。
这里需要说明的是,各虚拟机上部署的监控节点的数量仅为举例说明,并不用于限定本发明,监控节点的数量可以是一个或多个。图2中以一个监控节点与一个接收站设备通信连接为例进行说明,但并不用于限定本发明,按照系统工作需要,每个监控节点可以与一个或多个接收站设备通信连接,负责监控一个或多个接收站设备,一个接收站设备也可以与多个监控节点均通信连接。
遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的分离后可以获得多个业务服务,将这些业务服务可以部署到虚拟机A、虚拟机B和虚拟机C的监控节点上运行,一个监控节点上可以部署至少一个业务服务。
业务监控模块210中可以包括分级监控单元211、业务自启动单元212、双机热备单元213和虚拟机自动迁移单元214。其中,分级监控单元211可以对监控节点上部署的所有业务服务进行统一管理,形成完整的业务能力,监视所有业务服务的运行状态,可以执行宏配置管理、控制遥感卫星数据接收任务的执行、控制业务服务完成配置的自动化下达、接收业务服务的注册请求并基于该注册请求注册业务服务、接收业务服务的查询请求并为请求方返回查询结果等工作。分级监控单元211可以接收监控节点发送的服务运行状态信息,基于该服务运行状态信息,利用故障分级处理机制控制业务自启动单元212、双机热备单元213和虚拟机自动迁移单元214工作,以恢复出现异常的业务服务。
具体的,业务监控模块210中设置故障分级处理机制,基于设定的故障分级处理机制建立故障分级处理单元,比如可以包括业务自启动单元212、双机热备单元213和虚拟机自动迁移单元214以及应急备份设备230等,可以针对业务服务的运行软件和硬件平台不同层次的故障,针对性地配置和执行相应的业务恢复方案。运行软件和硬件平台不同层次的故障比如可以包括非核心业务服务软件故障、监控节点故障、部分虚拟机故障、核心业务服务软件故障及整个虚拟化平台故障等。相应的业务恢复方案比如可以包括:
(1)针对仅有业务服务运行异常的情况,可以通过服务守护和业务服务迁移机制实现业务服务的快速自动启动和迁移,保证业务服务的连续运行;
(2)针对虚拟机故障,业务监控模块210可以与虚拟化平台建立通信连接,集中展示整个虚拟化平台运行状态,当部分虚拟机出现异常时,可以利用虚拟机自动迁移机制快速实现虚拟机的自动迁移;
(3)针对核心业务,可以采用双机热备的方式运行,保证核心业务服务的连续运行,提高遥感卫星地面站监控系统的可靠性;
(4)针对核心业务,可以建立应急备份机制,借助应急备份设备230实现核心业务服务的相关管理部件的应急备份。
基于图2对应实施例的遥感卫星地面站监控系统,针对业务服务异常或监控节点崩溃等故障,可以通过业务自启动单元212的服务监控守护进程实现业务服务的自动快速启动,或通过分级监控单元211的业务服务管理进程实现业务服务的自动迁移,保证业务服务的连续运行。具体的,针对仅业务服务的运行出现异常的情况,分级监控单元211触发业务自启动单元212启用服务监控守护进程,如看门狗等,通过服务监控守护进程对业务服务的主程序进行重启并对该主程序的运行状态进行监控,若服务监控守护进程重启该业务服务失败,可以由分级监控单元211的业务服务管理进程实现业务服务的迁移。
基于此,图3示例性示出了利用服务守护和业务服务迁移机制恢复业务服务的方法流程示意图,参照图3所示,该方法可以包括如下的步骤310~步骤330。
步骤310:获取监控节点发送的服务运行状态信息。
遥感卫星地面站监控系统运行后,分级监控单元211启用业务自启动单元212的守护进程计数器自动计数业务服务的运行进程。监控节点上部署的业务服务的运行软件定时向分级监控单元211发送服务运行状态信息,分级监控单元211获取该服务运行状态信息。
步骤320:响应于基于服务运行状态信息确定出现了业务服务异常,重新启动出现异常的业务服务。
分级监控单元211可以基于服务运行状态信息确定业务服务的运行进程是否出现故障,比如分级监控单元211能够正常获取到服务运行状态信息时,守护进程计数器会不断计数,直至到达阈值后清零,系统正常运行;若业务服务的运行进程出现异常,无法定时与分级监控单元211通信,则守护进程计数器的计数到达阈值而未被清零,守护进程计数器会溢出导致中断,触发业务自启动单元212的服务监控守护进程重新启动该出现异常的业务服务的运行进程。
步骤330:响应于重启出现异常的业务服务失败,将出现异常的业务服务迁移至备份监控节点运行。
服务监控守护进程自动监测重新启动的业务服务是否能够正常发送服务运行状态信息,若不能正常发送,则重启失败,此时,服务监控守护进程将异常信息上报至分级监控单元211,分级监控单元211启用备份监控节点,并将出现异常的业务服务从当前监控节点自动迁移至备份监控节点,保证业务服务的正常运行。
基于图2对应实施例的遥感卫星地面站监控系统,业务监控模块210中设置了虚拟机自动迁移单元214,用以提供虚拟机自动迁移机制,当部分虚拟机出现异常时,可以基于该虚拟机自动迁移机制快速实现业务服务的自动迁移,保证业务服务的连续稳定运行。具体的,业务监控模块210可以与虚拟机A、虚拟机B和虚拟机C构成的虚拟化平台建立通信连接,周期性地采集虚拟化平台信息和虚拟机信息,并整合采集到的信息在监控界面中进行集中展示,管理员可以通过该监控界面实时监视虚拟化平台与各虚拟机的运行状态。分级监控单元211中可以建立虚拟机监视节点来监测虚拟机的运行状态,或者通过虚拟中部署的监控节点对虚拟机的运行状态进行监测,当某个虚拟机出现故障时,可以触发虚拟机自动迁移单元快速实现虚拟机的自动迁移。自动迁移将断电或挂起的池化服务器和存储上部署的第一虚拟机迁移至另一个服务器或存储的第二虚拟机的过程中,将服务器的配置文件和磁盘文件重新定位到新的存储位置。其中,虚拟化平台信息可以包括虚拟化平台所有虚拟机的池化服务器的中央处理器(Central Processing Unit,CPU)、内存、硬盘等的资源使用率和交换机、存储器等设备的设备信息。虚拟机信息可以包括每虚拟机的CPU、内存、硬盘等资源的资源使用率。
基于此,图4示例性示出了利用虚拟机自动迁移机制迁移虚拟机以恢复业务服务的方法流程示意图,参照图4所示,该方法可以包括如下的步骤410~步骤450。
步骤410:实时监测虚拟机的运行状态,得到虚拟机运行状态信息。
分级监控单元211实时对虚拟机A、虚拟机B和虚拟机C的运行状态进行监测,获取虚拟机运行状态信息。
步骤420:响应于虚拟机运行状态信息指示第一虚拟机出现异常,确定第二虚拟机。
分级监控单元211对获取到的虚拟机运行状态信息进行分析,若分析出第一虚拟机出现异常,则触发虚拟机自动迁移单元214的虚拟机自动迁移机制,进行目标迁移的虚拟机的选择,即选定第二虚拟机,该第二虚拟机可以是一个虚拟机,也可以是多个虚拟机。示例性的,可以基于第一虚拟机的虚拟机系统资源或第一虚拟机上当前运行的业务服务的运行需求确定第二虚拟机。
步骤430:备份第一虚拟机的虚拟机系统。
步骤440:基于第一虚拟机的虚拟机系统在第二虚拟机中配置计算资源及存储资源。
步骤450:基于配置的计算资源及存储资源在第二虚拟机上运行第一虚拟机上的业务服务。
比如监测到虚拟机A出现运行故障,虚拟机自动迁移单元214根据虚拟机自动迁移机制选择目标迁移的虚拟机是虚拟机B和虚拟机C,则可以备份虚拟机A的虚拟机系统,在虚拟机B和虚拟机C中基于虚拟机A的虚拟机系统配置计算资源和存储资源,基于配置的该计算资源和存储资源运行虚拟机A中的业务服务。分级监控单元211监测该业务服务的运行状态,并更新虚拟机B和虚拟机C的业务服务监测对象及服务运行状态信息。
基于图2对应实施例的遥感卫星地面站监控系统,针对核心业务服务,比如接收站的接收任务和接收任务处理等业务服务,可以采用双机热备的方式运行,将核心业务服务同时部署在两台虚拟机(主虚拟机和备虚拟机)上,保证核心业务服务不中断,提高遥感卫星地面站监控系统的可靠性。具体的,将核心业务服务同时部署在两台虚拟机上,并行工作。主虚拟机和备虚拟机互相发送心跳信息监测对方的服务状态,进行信息同步。在业务服务运行过程中,当一台虚拟机出现故障或该虚拟机上的业务服务出现运行故障时,另一台虚拟机可以在短时间内接管故障虚拟机的业务服务,确保业务服务运行不间断。可以理解的是,将核心业务服务同时部署在两台虚拟机上可以是部署在两组虚拟机上,每组虚拟机中包括至少一个虚拟机。
示例性的,以虚拟机A和虚拟机C采用双机热备的方式运行为例,虚拟机A和虚拟机C的启动流程可以包括:虚拟机A启动时默认作为备虚拟机工作,并向虚拟机C发送第一心跳信息;若虚拟机C在设定周期内未收到虚拟机A的第一心跳信息,则虚拟机A自动切换为主虚拟机;若虚拟机C在设定周期内收到了虚拟机A的第一心跳信息,则虚拟机A保持备虚拟机;若启动时检测到虚拟机C为备虚拟机,则将虚拟机A切换为主虚拟机,若检测到虚拟机C为主虚拟机,则虚拟机A保持备虚拟机。在切换过程中,虚拟机A和虚拟机C均记录切换日志。
示例性的,业务服务运行过程中,虚拟机A和虚拟机C的切换流程可以包括:虚拟机A和虚拟机C定时向分级监控单元211发送各自的第二心跳信息;当分级监控单元211在设定时间内未收到虚拟机A的第二心跳信息或与虚拟机A的通信中断,若虚拟机A为主虚拟机,则检测到主虚拟机出现故障,分级监控单元211触发双机热备单元213执行虚拟机切换任务,将虚拟机C切换为主虚拟机状态,虚拟机A切换为备虚拟机状态,虚拟机C接替虚拟机A工作,执行最近阶段应执行的操作,接管后续任务;若虚拟机A已经是备虚拟机,分级监控单元211可以控制业务监控模块210的输出单元输出异常提醒信息,提示用户检查原因并重启软件。虚拟机A和虚拟机C均记录切换日志。示例性的,分级监控单元211还可以接收监控节点发送的服务运行状态信息,可以基于该服务运行状态信息确定主虚拟机上运行的核心业务服务是否发生异常,比如监测到主虚拟机A的服务运行状态信息,分级监控单元211对该服务运行状态信息进行分析,若分析出某个核心业务服务出现了异常,则触发双机热备单元213执行虚拟机切换任务。
基于图2对应实施例的遥感卫星地面站监控系统,针对核心业务服务,可以在一台独立的物理机上部署应急备份功能,当虚拟机A、虚拟机B和虚拟机C构成的整个虚拟化平台出现故障时,可以基于该应急备份功能实现主要业务管理部件的应急备份。具体的,针对核心业务服务,在虚拟化平台的软件和硬件出现故障时,比如无法运行,如虚拟机平台故障无法启动等,分级监控单元211可以启动应急备份设备230,利用应急备份设备230快速接管业务,实现遥感卫星地面站监控系统的分级运行,满足应急处理需求。该应急备份设备230可以是独立的物理机或物理机集群,与遥感卫星地面站的卫星数据接收系统通过网络相连,具备该卫星数据接收系统的全部功能。该应急备份设备230具备业务服务信息、配置参数、通讯参数和系统运行参数等业务服务软件参数信息的实时同步能力,被启动后可以执行应急任务计划,可以提供任务配置界面,用户可以通过该任务配置界面进行任务宏参数的配置和任务宏参数的应急下发等。
基于此,图5示例性示出了通过应急备份功能恢复业务服务的方法流程示意图,参照图5所示,该方法可以包括如下的步骤510~步骤530。
步骤510:配置信息自动同步。
监测节点或业务监控模块210可以定时检测卫星数据接收系统的配置信息文件的修改时间是否发生变化,若发生变化,则控制卫星数据接收系统向应急备份设备230发送配置文件,通过配置文件将卫星数据接收系统的同步配置信息发送给应急备份设备230,使应急备份设备230与卫星数据接收系统的配置信息同步。其中的配置信息文件中可以包括卫星轨道根数、卫星资源参数、接收站信息、接收站设备资源参数、跟踪接收机相位参数、通信参数、系统运行参数等配置信息。
步骤520:虚拟化平台监测。
分级监控单元211可以对虚拟化平台的整体运行状态进行监测,若监测到虚拟化平台整体无法运行,比如无法启动,则确定虚拟化平台整体出现了故障。
步骤530:响应于虚拟化平台整体故障,启动应急备份设备。
分级监控单元211监测到虚拟化平台整体出现故障时,可以启动应急备份设备230,由应急备份设备230接管虚拟化平台主运行系统的基本配置信息和数据接收任务。示例性的,分级监控单元211监测到虚拟化平台整体出现故障时,可以向应急备份设备230发送应急启动指令,启动应急备份设备230。示例性的,分级监控单元211监测到虚拟化平台整体出现故障时,可以控制业务监控模块210的输出单元输出启动应急备份设备的提示信息,比如报警,提醒管理员启动应急备份设备230。分级监控单元211或应急备份设备230接收到管理员启动应急备份设备230的操作时,启动应急备份设备230。可以实现应急备份设备的自动与手动切换。
应急备份设备230启动后可以迅速运行虚拟化平台的后续业务服务流程,包括但不限于应急远程接收任务、应急数据接收任务创建、应急任务流程控制、应急接收任务取消流程调度等。应急备份设备230启动后还可以获取及分析外部输入的信息。
基于图2~图5对应实施例描述的内容,针对核心业务服务,可以同时部署在主虚拟机和备虚拟机两台虚拟机上并行运行,同时可以提供应急备份功能,当核心业务服务出现故障时,可以通过故障分级处理的方式对出现故障的核心业务服务进行处理,使核心业务服务快速恢复正常运行。具体的,图6示例性示出了本发明实施例提供的核心业务服务故障处理方法的流程示意图,参照图6所示,该方法可以包括如下的步骤610~步骤670。
步骤610:接收监控节点发送的服务运行状态信息。
监控节点可以采集与其连接的接收站设备的运行状态数据,基于该运行状态数据确定监控节点上部署的业务服务的服务运行状态信息。当主虚拟机的监控节点上部署有核心业务服务时,分级监控单元211可以获取到该核心业务服务的服务运行状态信息。
步骤620:获取主虚拟机的运行状态信息,得到第一运行状态信息。
分级监控单元211可以直接与虚拟机平台通信,监测主虚拟机的运行状态,获得第一运行状态信息;或者,可以由主虚拟机上的监控节点监测主虚拟机的运行状态信息,然后发送给分级监控单元211。
步骤630:响应于第一运行状态信息指示主虚拟机出现故障或服务运行状态信息指示主虚拟机上运行的核心业务服务异常,进行主虚拟机到备虚拟机的切换。
当第一运行状态信息指示主虚拟机出现故障或服务运行状态信息指示主虚拟机上运行的核心业务服务异常,分级监控单元211可以触发双机热备单元213进行主虚拟机到备虚拟机的切换,将备虚拟机切换为主虚拟机状态,接替主虚拟机工作。若切换失败,则执行步骤640;若切换成功,则备虚拟机接替主虚拟机进行工作,并返回步骤610继续进行业务服务监测。
步骤640:重新启动主虚拟机上运行核心业务服务的监控节点。若重启失败,则执行步骤650;若重启成功,则核心业务服务恢复,继续在原监控节点上运行。
步骤650:将核心业务服务迁移至第二目标监控节点运行。
若重新启动主虚拟机上运行核心业务服务的监控节点失败,分级监控单元211可以从虚拟机平台中部署的其他监控节点中选定第二目标监控节点,将核心业务服务迁移至第二目标监控节点运行,通过监控节点的迁移恢复核心业务服务。若监控节点迁移失败,则执行步骤660。
步骤660:将核心业务服务从当前虚拟机迁移至第二目标虚拟机运行。
若将核心业务服务迁移至第二目标监控节点失败,分级监控单元211可以触发虚拟机自动迁移单元214从虚拟机集群中确定第二目标虚拟机,并将核心业务服务从当前虚拟机迁移至第二目标虚拟机运行,通过虚拟机迁移恢复核心业务服务。若迁移失败,则执行步骤670。
步骤670:启动应急备份设备。
应急备份设备230与卫星数据接收系统通信连接,可以接收卫星数据接收系统的同步配置信息。若将核心业务服务从当前虚拟机迁移至第二目标虚拟机失败,分级监控单元211可以启动应急备份设备230,应急备份设备230启动后可以基于卫星数据接收系统的同步配置信息执行运行卫星数据接收系统的所有核心业务服务,通过应急备份设备恢复核心业务服务,保证核心业务服务的正常运行。可以理解的是,在依次经过前述步骤的双机热备切换、监控节点重启、监控节点迁移和虚拟机迁移等业务恢复机制仍不能恢复核心业务服务,可以确定虚拟化平台出现了故障,此时可以启动应急备份设备保证核心业务服务的正常运行。
在本示例实施例中,通过故障分级处理的方式对出现故障的核心业务服务进行分层次的处理和恢复,能够从多角度恢复核心业务服务的运行,保证核心业务服务的独立稳定运行,自动化程度较高,在保证核心业务服务快速恢复的同时提高了遥感卫星地面站监控系统的可靠性和稳定性。
本发明实施例提供的遥感卫星地面站监控系统,一方面,可以通过业务服务分离实现故障的隔离,解耦核心业务服务和非核心业务服务,避免非核心业务服务故障影响核心业务服务的正常运行,能够保障核心业务服务的独立稳定可靠运行,提高了遥感卫星地面站监控系统的可靠性;另一方面,通过建立故障分级和相应的业务服务恢复机制,可以针对业务服务、虚拟机和硬件平台等不同层次的故障,分别通过业务服务自动重启、业务服务自动迁移、虚拟机自动迁移等故障分级恢复方案快速恢复监控系统的业务服务运行能力,进一步提高了遥感卫星地面站监控系统的可靠性,保障了遥感卫星地面站监控系统的连续可靠运行;再者,通过双机热备功能可以实现核心业务服务的实时故障切换,通过应急备份在虚拟化平台整体故障时实现核心业务服务的快速启动和接管,保证核心业务服务的正常和稳定运行。
基于上述各实施例的遥感卫星地面站监控系统,本发明实施例还提供了一种遥感卫星地面站监控方法,该遥感卫星地面站监控方法可以与上文描述的遥感卫星地面站监控系统相互对应参照。图7示例性示出了本发明实施例提供的遥感卫星地面站监控方法的流程示意图,该方法可以包括如下的步骤710~步骤720。
步骤710:获取多个监控节点发送的业务服务的服务运行状态信息。
多个监控节点中的每个监控节点上部署至少一个业务服务,该至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,这些监控节点部署在虚拟机集群上,虚拟机集群可以运行遥感卫星地面站的卫星数据接收系统。各监控节点用于与至少一个接收站设备通信连接,采集其连接的接收站设备的运行状态数据,基于该运行状态数据确定监控节点上部署的业务服务的服务运行状态信息。
步骤720:响应于服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务。
监控节点上运行的业务服务可以包括核心业务服务和非核心业务服务。针对仅业务服务出现异常的情况,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务可以包括:响应于服务运行状态信息指示业务服务异常,重新启动服务运行状态信息指示的出现异常的业务服务;响应于重启出现异常的业务服务失败,从多个监控节点中确定第一目标监控节点,并将出现异常的业务服务迁移至第一目标监控节点运行。进一步的,还可以包括:响应于将出现异常的业务服务迁移至第一目标监控节点失败,将出现异常的业务服务从当前虚拟机迁移至第一目标虚拟机运行。
针对核心业务服务出现异常的情况,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务可以包括:获取主虚拟机的运行状态信息,得到第一运行状态信息;响应于第一运行状态信息指示主虚拟机出现故障或服务运行状态信息指示主虚拟机上运行的核心业务服务异常,进行主虚拟机到备虚拟机的切换。
进一步的,还可以包括:响应于进行主虚拟机到备虚拟机的切换失败,重新启动主虚拟机上运行核心业务服务的监控节点;响应于重新启动主虚拟机上运行核心业务服务的监控节点失败,从多个监控节点中确定第二目标监控节点,并将核心业务服务迁移至第二目标监控节点运行。
进一步的,还可以包括:响应于将核心业务服务迁移至第二目标监控节点失败,从虚拟机集群中确定第二目标虚拟机,并将核心业务服务从当前虚拟机迁移至第二目标虚拟机运行。
进一步的,还可以包括:响应于将核心业务服务从当前虚拟机迁移至第二目标虚拟机失败,启动应急备份设备。该应急备份设备启动后基于同步配置信息执行运行卫星数据接收系统的所有核心业务服务。
一种示例实施例中,遥感卫星地面站监控方法还可以包括:获取虚拟机集群中各虚拟机的运行状态,得到第二运行状态信息;响应于第二运行状态信息指示第一虚拟机出现异常,从虚拟机集群中确定第二虚拟机,并将第一虚拟机上运行的业务服务迁移至第二虚拟机。
一种示例实施例中,遥感卫星地面站监控方法还可以包括:监测监控节点的节点运行状态信息;响应于节点运行状态信息指示监控节点出现故障,启动监控节点对应的热备监控节点,并向监控节点对应的热备监控节点下发监控节点的配置信息。
一种示例实施例中,遥感卫星地面站监控方法还可以包括:接收请求新增接收站设备的请求信息;响应于该请求信息,在虚拟机集群当前部署的监控节点中确定待绑定监控节点;在该待绑定监控节点上添加请求信息请求新增的接收站设备的访问权限信息。
一种示例实施例中,遥感卫星地面站监控方法还可以包括:接收请求新增接收站设备的请求信息;响应于该请求信息,在虚拟机集群上新增监控节点,在新增的监控节点上添加请求信息请求新增的接收站设备的访问权限信息。
本发明还提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,计算机程序被处理器执行时,计算机能够执行上述各方法实施例所提供的遥感卫星地面站监控方法的步骤,比如可以包括:获取多个监控节点发送的业务服务的服务运行状态信息;响应于服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务;其中,多个监控节点中的每个监控节点上部署至少一个业务服务,至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,多个监控节点部署在虚拟机集群上,虚拟机集群运行卫星数据接收系统。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例所提供的遥感卫星地面站监控方法的步骤,比如可以包括:获取多个监控节点发送的业务服务的服务运行状态信息;响应于服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复服务运行状态信息指示的出现异常的业务服务;其中,多个监控节点中的每个监控节点上部署至少一个业务服务,至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,多个监控节点部署在虚拟机集群上,虚拟机集群运行卫星数据接收系统。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台或多台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种遥感卫星地面站监控系统,其特征在于,包括业务监控模块和与所述业务监控模块通信连接的虚拟机集群,所述虚拟机集群上部署有多个监控节点,每个所述监控节点上部署至少一个业务服务,所述至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,所述卫星数据接收系统运行在所述虚拟机集群上;
所述监控节点用于与至少一个接收站设备通信连接,采集所述接收站设备的运行状态数据,基于所述运行状态数据确定所述监控节点上部署的业务服务的服务运行状态信息,并将所述服务运行状态信息发送给所述业务监控模块;
所述业务监控模块用于对所述多个监控节点上部署的所有业务服务进行统一管理,响应于所述服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复所述服务运行状态信息指示的出现异常的业务服务。
2.根据权利要求1所述的遥感卫星地面站监控系统,其特征在于,所述业务监控模块中包括分级监控单元和业务自启动单元;
所述分级监控单元用于接收所述服务运行状态信息,响应于所述服务运行状态信息指示业务服务异常,触发所述业务自启动单元重新启动所述服务运行状态信息指示的出现异常的业务服务,响应于重启所述出现异常的业务服务失败,从所述多个监控节点中确定第一目标监控节点,并将所述出现异常的业务服务迁移至所述第一目标监控节点运行。
3.根据权利要求2所述的遥感卫星地面站监控系统,其特征在于,所述业务监控模块还包括虚拟机自动迁移单元;
所述分级监控单元还用于响应于将所述出现异常的业务服务迁移至所述第一目标监控节点失败,触发所述虚拟机自动迁移单元将所述出现异常的业务服务从当前虚拟机迁移至第一目标虚拟机运行。
4.根据权利要求1所述的遥感卫星地面站监控系统,其特征在于,所述业务监控模块中包括分级监控单元和双机热备单元,所述多个监控节点上部署的业务服务中的核心业务服务同时部署在两台虚拟机上并行运行,所述两台虚拟机包括主虚拟机和备虚拟机;
所述分级监控单元还用于获取所述主虚拟机的运行状态信息,得到第一运行状态信息,响应于所述第一运行状态信息指示所述主虚拟机出现故障或所述服务运行状态信息指示所述主虚拟机上运行的核心业务服务异常,触发所述双机热备单元进行所述主虚拟机到所述备虚拟机的切换。
5.根据权利要求4所述的遥感卫星地面站监控系统,其特征在于,所述分级监控单元还用于响应于所述双机热备单元进行所述主虚拟机到所述备虚拟机的切换失败,重新启动所述主虚拟机上运行所述核心业务服务的监控节点,响应于重新启动所述主虚拟机上运行所述核心业务服务的监控节点失败,从所述多个监控节点中确定第二目标监控节点,并将所述核心业务服务迁移至所述第二目标监控节点运行。
6.根据权利要求5所述的遥感卫星地面站监控系统,其特征在于,所述业务监控模块还包括虚拟机自动迁移单元;
所述分级监控单元还用于响应于将所述核心业务服务迁移至所述第二目标监控节点失败,触发所述虚拟机自动迁移单元从所述虚拟机集群中确定第二目标虚拟机,并将所述核心业务服务从当前虚拟机迁移至所述第二目标虚拟机运行。
7.根据权利要求6所述的遥感卫星地面站监控系统,其特征在于,所述遥感卫星地面站监控系统还包括与所述业务监控模块通信连接的应急备份设备;
所述应急备份设备与所述卫星数据接收系统通信连接,接收所述卫星数据接收系统的同步配置信息;
所述分级监控单元还用于响应于将所述核心业务服务从当前虚拟机迁移至所述第二目标虚拟机失败,启动所述应急备份设备;所述应急备份设备启动后基于所述同步配置信息执行运行所述卫星数据接收系统的所有核心业务服务。
8.根据权利要求1所述的遥感卫星地面站监控系统,其特征在于,所述业务监控模块中包括分级监控单元和虚拟机自动迁移单元;
所述分级监控单元用于获取所述虚拟机集群中各虚拟机的运行状态,得到第二运行状态信息,响应于所述第二运行状态信息指示第一虚拟机出现异常,触发所述虚拟机自动迁移单元从所述虚拟机集群中确定第二虚拟机,并将所述第一虚拟机上运行的业务服务迁移至所述第二虚拟机。
9.根据权利要求1所述的遥感卫星地面站监控系统,其特征在于,所述监控节点配置有对应的热备监控节点,所述监控节点和所述监控节点对应的热备监控节点上部署相同的业务服务;
所述业务监控模块还用于监测所述监控节点的节点运行状态信息,响应于所述节点运行状态信息指示所述监控节点出现故障,启动所述监控节点对应的热备监控节点,并向所述监控节点对应的热备监控节点下发所述监控节点的配置信息。
10.根据权利要求1所述的遥感卫星地面站监控系统,其特征在于,所述业务监控模块还用于接收请求新增接收站设备的请求信息,响应于所述请求信息,在所述虚拟机集群当前部署的监控节点中确定待绑定监控节点,在所述待绑定监控节点上添加所述请求信息请求新增的接收站设备的访问权限信息;或者,所述业务监控模块响应于所述请求信息,在所述虚拟机集群上新增监控节点,在新增的监控节点上添加所述请求信息请求新增的接收站设备的访问权限信息。
11.一种遥感卫星地面站监控方法,其特征在于,包括:
获取多个监控节点发送的业务服务的服务运行状态信息,所述多个监控节点中的每个监控节点上部署至少一个业务服务,所述至少一个业务服务是对遥感卫星地面站的卫星数据接收系统的业务进行基于业务功能的划分确定的,所述多个监控节点部署在虚拟机集群上,所述虚拟机集群运行所述卫星数据接收系统;
响应于所述服务运行状态信息指示业务服务异常,基于设定的故障分级处理机制恢复所述服务运行状态信息指示的出现异常的业务服务。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求11所述的遥感卫星地面站监控方法。
CN202210975262.4A 2022-08-12 2022-08-12 遥感卫星地面站监控系统和方法 Active CN115549751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210975262.4A CN115549751B (zh) 2022-08-12 2022-08-12 遥感卫星地面站监控系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210975262.4A CN115549751B (zh) 2022-08-12 2022-08-12 遥感卫星地面站监控系统和方法

Publications (2)

Publication Number Publication Date
CN115549751A true CN115549751A (zh) 2022-12-30
CN115549751B CN115549751B (zh) 2024-05-24

Family

ID=84726276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210975262.4A Active CN115549751B (zh) 2022-08-12 2022-08-12 遥感卫星地面站监控系统和方法

Country Status (1)

Country Link
CN (1) CN115549751B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060094417A1 (en) * 2004-10-29 2006-05-04 Allen David L Systems and methods for handling information from wireless nodes, including nodes for communication with aircraft
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
US20190058629A1 (en) * 2017-08-18 2019-02-21 At&T Intellectual Property I, L.P. Facilitating beam recovery request for 5g or other next generation network
CN111026503A (zh) * 2019-11-26 2020-04-17 中国科学院遥感与数字地球研究所 一种基于虚拟化的遥感卫星地面站监控方法和系统
CN112787708A (zh) * 2021-01-25 2021-05-11 航天恒星科技有限公司 基于微服务的卫星地面站监控管理架构

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060094417A1 (en) * 2004-10-29 2006-05-04 Allen David L Systems and methods for handling information from wireless nodes, including nodes for communication with aircraft
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
US20190058629A1 (en) * 2017-08-18 2019-02-21 At&T Intellectual Property I, L.P. Facilitating beam recovery request for 5g or other next generation network
CN111026503A (zh) * 2019-11-26 2020-04-17 中国科学院遥感与数字地球研究所 一种基于虚拟化的遥感卫星地面站监控方法和系统
CN112787708A (zh) * 2021-01-25 2021-05-11 航天恒星科技有限公司 基于微服务的卫星地面站监控管理架构

Also Published As

Publication number Publication date
CN115549751B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
CN108632067B (zh) 容灾部署方法、装置及系统
CN107544839B (zh) 虚拟机迁移系统、方法及装置
EP3210367B1 (en) System and method for disaster recovery of cloud applications
WO2017067484A1 (zh) 一种虚拟化数据中心调度系统和方法
CN108270726B (zh) 应用实例部署方法及装置
US20080022148A1 (en) Method and an Apparatus for Controlling Executables Running on Blade Servers
CN111953566B (zh) 一种基于分布式故障监控的方法和虚拟机高可用系统
CN102394914A (zh) 集群脑裂处理方法和装置
CN102231681A (zh) 一种高可用集群计算机系统及其故障处理方法
CN108347339B (zh) 一种业务恢复方法及装置
CN112948063B (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
EP3671461A1 (en) Systems and methods of monitoring software application processes
CN103490914A (zh) 一种网络应用设备多机热备的切换系统及方法
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
CN109905275A (zh) 一种基于sdn分层架构的控制平面故障检测与处理方法
CN114064217B (zh) 一种基于OpenStack的节点虚拟机迁移方法及装置
US20050234919A1 (en) Cluster system and an error recovery method thereof
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
CN117240694A (zh) 一种基于keepalived的双机热备主备切换方法、装置及系统
CN113765690A (zh) 集群切换方法、系统、装置、终端、服务器及存储介质
JP5285044B2 (ja) クラスタシステム復旧方法及びサーバ及びプログラム
CN115549751B (zh) 遥感卫星地面站监控系统和方法
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN116723077A (zh) 一种分布式it自动化运维系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant