CN107071351B - 一种车站多级容灾架构及方法 - Google Patents

一种车站多级容灾架构及方法 Download PDF

Info

Publication number
CN107071351B
CN107071351B CN201710199707.3A CN201710199707A CN107071351B CN 107071351 B CN107071351 B CN 107071351B CN 201710199707 A CN201710199707 A CN 201710199707A CN 107071351 B CN107071351 B CN 107071351B
Authority
CN
China
Prior art keywords
station
group system
video
network
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710199707.3A
Other languages
English (en)
Other versions
CN107071351A (zh
Inventor
高欣
曹震洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU TRINET INFORMATION TECHNIQUE Co Ltd
Original Assignee
HANGZHOU TRINET INFORMATION TECHNIQUE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU TRINET INFORMATION TECHNIQUE Co Ltd filed Critical HANGZHOU TRINET INFORMATION TECHNIQUE Co Ltd
Priority to CN201710199707.3A priority Critical patent/CN107071351B/zh
Publication of CN107071351A publication Critical patent/CN107071351A/zh
Application granted granted Critical
Publication of CN107071351B publication Critical patent/CN107071351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种车站多级容灾架构及方法,该架构包括:多个车站集群系统,每一所述车站集群系统内均设置有预定比例冗余资源,以使得所述车站集群系统发生故障时能利用自身冗余资源正常工作;一个控制中心集群系统,与各车站集群系统连接,用于监控所有车站集群系统的运行状态,并在所述车站集群系统自身冗余资源不足以正常工作时,接收故障车站集群系统输出的音视频数据;环状干线IP网络,用于连接各车站集群系统以及所述控制中心集群系统。本发明可以减小干线带宽占用的多级容灾系统。

Description

一种车站多级容灾架构及方法
技术领域
本发明属于轨道交通视频监控技术领域,具体地说,尤其涉及一种车站多级容灾架构及方法。
背景技术
地铁、城市铁路等形式轨道交通的大力发展导致相关车站人员密集及情况复杂,这就使得对于专用于轨道交通的视频监控系统的可靠性要求尤为突出,通常都要求轨道交通的视频监控系统具有异地容灾功能。
网络视频录像机(NETWORK VIDEO RECORDER,简称NVR)是视频监控系统中的核心设备。前端监控点上的IP摄像机(简称IPC)产生的模拟视频和模拟音频信号,经过IPC内置的视频、音频编码器的数字化处理后,以IP数据包的形式在网络上传输。NVR在收到IP数据包后,可对IP数据包中的视频、音频进行录像、存储或转发,实现对网络摄像机IPC的管理。
针对大规模的视频监控项目,通常使用NVR集群进行管理。地铁车站采用典型的NVR集群部署方式。为了满足异地容灾的要求,通常在所有车站外单独设立容灾中心,对所有NVR集群进行监管。
当车站内的NVR节点出现故障时,由容灾中心的NVR节点接管车站内NVR节点的IPC继续录像。异地容灾方案是将本地数据中心的数据以1:1的投入比例在异地建立一个同步容灾中心,实现本地车站宕机时,异地容灾中心上线即可恢复服务。但是,异地容灾中心需要1:1的投入比,浪费巨大,也无法兼顾本地数据中心部分服务宕机的情况。
同时,由于高清视频流数据量大,集中式的容灾中心在大量IPC远程接入时,存在占用大量干线带宽的缺点。
发明内容
为解决以上问题,本发明提供了一种车站多级容灾架构及方法,用于减小干线带宽占用的多级容灾系统。
根据本发明的一个方面,提供了一种车站多级容灾架构,包括:
多个车站集群系统,每一所述车站集群系统内均设置有预定比例冗余资源,以使得所述车站集群系统发生故障时能利用自身冗余资源正常工作;
一个控制中心集群系统,与各车站集群系统连接,用于监控所有车站集群系统的运行状态,并在所述车站集群系统自身冗余资源不足以正常工作时,接收发生故障的车站集群系统输出的音视频数据;
环状干线IP网络,用于连接各车站集群系统以及所述控制中心集群系统。
根据本发明的一个实施例,沿所述环状干线IP网络,相邻若干所述车站集群系统为一组形成邻站集群,各车站集群系统监控并只接收所属邻站集群内部其他发生故障的车站集群系统输出的音视频数据,其中,
在所述控制中心集群系统接收发生故障的车站集群系统输出的音视频数据之前,同一邻站集群内的其他车站集群系统接收同一邻站集群内的发生故障的车站集群系统输出的音视频数据;
在所述邻站集群内的冗余资源不足以使得发生故障的车站集群系统正常工作时,由所述控制中心集群系统接收发生故障的车站集群系统输出的音视频数据。
根据本发明的一个实施例,所述车站集群系统设置于轨道交通车站内,所述车站集群系统进一步包括:
IP接入网络,用于接入所述环状干线IP网络;
多个网络视频录像节点,其相互连接构成网络视频录像集群,并通过所述IP接入网络接入所述环状干线IP网络;
多个IP摄像机,用于通过所述接入IP接入网络连接所述环状干线IP网络及所在车站集群系统的网络视频录像节点,用于产生音视频数据;
若干客户端,用于通过所述IP接入网络向所述网络视频录像集群查询音视频数据,
其中,每个所述网络视频录像节点正常工作时,接入预定数量IP摄像机,除正常工作IP摄像机占用的正常资源外,还预留所述预定比例的冗余资源用于接入发生故障的车站集群系统的网络视频录像节点的IP摄像机。
根据本发明的一个实施例,所述控制中心集群系统设置于轨道交通控制中心,所述控制中心集群系统进一步包括:
IP接入网络,用于接入所述环状干线IP网络;
多个网络视频录像节点,其相互连接构成网络视频录像集群,并通过所述IP接入网络接入所述环状干线IP网络。
根据本发明的一个实施例,所述控制中心集群系统的网络视频录像节点的资源全部为冗余资源。
根据本发明的一个实施例,所述控制中心集群系统的网络视频录像节点的数量不少于任一所述车站集群系统内部的网络视频录像节点的数量。
根据本发明的另一个方面,还提供了一种车站多级容灾方法,包括:
在车站集群系统发生故障时,该车站集群系统利用自身冗余资源正常工作;
控制中心集群系统监控所有车站集群系统的运行状态,并在车站集群系统自身冗余资源不足以正常工作时,接收发生故障的车站集群系统输出的音视频数据;
在发生故障的车站集群系统恢复正常时,控制中心集群系统主动放弃接收原发生故障的车站集群系统输出的音视频数据,并保存音视频数据以备客户端进行查询。
根据本发明的一个实施例,在沿环状干线IP网络将相邻若干车站集群系统分为一组以形成邻站集群情况下,进一步包括:
在所述控制中心集群系统接收发生故障的车站集群系统输出的音视频数据之前,
同一邻站集群内的其他车站集群系统接收同一邻站集群内的发生故障的车站集群系统输出的音视频数据;
在邻站集群内的冗余资源不足以使得发生故障的车站集群系统正常工作时,通过控制中心集群系统接收故障车站集群系统输出的音视频数据。
根据本发明的一个实施例,在车站集群系统内的网络视频录像节点发生故障,需对故障节点的IP摄像机接管时,基于最小负载比例节点优先算法,根据发生故障的网络视频录像节点的IP摄像机列表,采用车站集群系统和/或邻站集群和/或控制中心集群系统的冗余网络视频录像节点对故障节点的IP摄像机接管,其中,
车站集群系统内的正常网络视频录像节点依次接管发生故障的网络视频录像节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值;
在车站集群系统的自身的冗余网络视频录像节点不足以接管发生故障的网络视频录像节点的IP摄像机时,邻站集群内的冗余网络视频录像节点依次接管发生故障的网络视频录像节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值;
在车站集群系统和邻站集群的冗余网络视频录像节点已经耗尽或不足以接管发生故障的网络视频录像节点的IP摄像机时,控制中心集群系统依次接管发生故障的网络视频录像节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值。
根据本发明的一个实施例,还包括客户端查询音视频数据,包括:
客户端以起止时间为搜索条件发起查询IP摄像机音视频数据请求;
在该IP摄像机所在网络视频录像节点自身存储空间搜索并请求同一车站集群系统内的其他网络视频节点在各自存储空间搜索,以形成覆盖起止时间的音视频数据结果集并返回该IP摄像机所在网络视频录像节点;
如发现同一车站集群系统返回的音视频数据结果集不能覆盖起止时间,则该IP摄像机所在网络视频录像节点请求其所在邻站集群系统内的其他网络视频录像节点在各自存储空间搜索,以形成覆盖起止时间的音视频数据结果集并返回该IP摄像机所在网络视频录像节点;
如发现邻站集群系统内返回的音视频数据结果集不能覆盖起止时间,则该IP摄像机所在网络视频录像节点请求控制中心集群系统的网络视频录像节点在各自存储空间搜索,以形成音视频数据结果集并返回该IP摄像机所在网络视频录像节点。
本发明的有益效果:
本发明充分利用车站集群系统的冗余资源,实现资源利用最大化。在发生故障时,按照站内接管-邻站接管-控制中心接管的多级容灾顺序,采用优先就近接管原则,尽可能缩短了IP摄像机到接管地点的距离,减少对干线网络的占用。多级容灾相比集中式容灾提高了可靠性,即减小了集中式容灾中心自身故障时所带来的损失。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要的附图做简单的介绍:
图1是根据本发明的一个实施例的车站多级容灾系统结构图;
图2是根据本发明的一个实施例的车站多级容灾方法流程图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
本发明提供了一种车站多级容灾系统,用于减小干线带宽占用的基于网络视频录像集群的多级容灾系统。如图1所示为根据本发明的一个实施例的车站多级容灾系统结构图,以下参考图1来对本发明进行详细说明。
如图1所示,该车站多级容灾系统包括多个车站集群系统(A站、B站、C站)、一个控制中心集群系统(控制中心)和环状干线IP网络。其中,每一车站集群系统内均设置有预定比例的冗余资源,以使得该车站集群系统发生故障时能利用自身冗余资源正常工作。控制中心集群系统与各车站集群系统连接,用于监控所有车站集群系统的运行状态,并在车站集群系统自身冗余资源不足以正常工作下,接收故障车站集群系统输出的音视频数据。环状干线IP网络用于连接各车站集群系统和控制中心集群系统。具体的,车站集群系统和控制中心集群系统位于地理位置上分离的区域,并通过环状干线IP网络相连接。
本发明通过在每一车站集群系统内均设置有预定比例冗余资源,以使得车站集群系统发生故障时能首先利用自身冗余资源正常工作,就可以不必占用环状干线IP网络带宽,节约了干线带宽,还可以在本地车站集群系统部分服务宕机时继续正常工作。在车站集群自身冗余资源不足以正常工作时,由控制中心集群系统接收故障车站集群输出的音视频数据时,才占用环状干线IP网络带宽。
在本发明的一个实施例中,沿环状干线IP网络,相邻若干车站集群系统为一组形成邻站集群,本地车站集群监控并只接收邻站集群内部其他车站集群系统的音视频数据,并在控制中心集群系统接收故障车站集群系统输出的音视频数据之前,同一邻站集群内的其他车站集群系统接收同一邻站集群内的故障车站集群系统输出的音视频数据。在邻站集群冗余资源不足以使得故障车站集群系统正常工作下,由控制中心集群系统接收故障车站集群系统输出的音视频数据。
具体的,如图1所示,相邻的本地车站集群系统A站、B站和C站可构成一组邻站集群。这样,就可以实现车站的三级容灾功能,第一级容灾为在本地车站集群内部容灾,第二级容灾为邻站集群内部容灾,第三级容灾为控制中心集群容灾。第一级容灾在同一车站集群系统内完成,不占用环状干线IP网络的带宽。第二级容灾在邻站集群内部完成,在环状干线IP网络上仅占用邻站集群组所处的部分环状网络的带宽,而不影响邻站集群组外的环状网络带宽。第三级容灾才有可能占用较多的环状干线IP网络带宽。单纯的集中式容灾中心,所有故障都迁移到容灾中心,占用较多的环状干线IP网络带宽,与单纯的集中式容灾中心,本发明在干线带宽占用方面,有较大的优势。
在本发明的一个实施例中,车站集群系统设置于轨道交通车站内,进一步包括IP接入网络、多个网络视频录像节点、多个IP摄像机和若干客户端。其中,IP接入网络用于接入环状干线IP网络;多个网络视频录像节点相互连接构成网络视频录像集群,并通过IP接入网络接入环状干线IP网络;多个IP摄像机通过接入IP网络连接环状干线IP网络及所在车站集群系统的网络视频录像节点,用于产生音视频数据;若干客户端通过接入IP网络向网络视频录像集群查询音视频数据。其中,每个网络视频录像节点正常工作时,接入预定数量IP摄像机,除正常工作IP摄像机占用的正常资源外,还预留预定比例的冗余资源用于接入故障网络视频录像节点的IP摄像机。此处的冗余资源包括CPU、内存、存储空间、网口速率等。
具体的,如图1所示,车站集群系统包括多个网络视频录像节点(A站中表示为A1-A4,B站中表示为B1-B4,C站中表示为C1-C4),多个IP摄像机(可简称IPC),一个或多个客户端和IP接入网络。车站集群系统通过IP接入网络与环状干线IP网络连接。多个网络视频录像节点相互连接,构成一个网络视频录像集群(以下简称集群),接入IP接入网络,用于接收IP摄像机的音视频等相关数据,并为客户端提供音视频等相关数据。多个IP摄像机接入IP接入网络,用于产生音视频等相关数据。一个或多个客户端接入IP接入网络,用于向网络视频录像集群查询音视频等相关数据。
在本发明的一个实施例中,控制中心集群系统设置于轨道交通控制中心,进一步包括IP接入网络和多个网络视频录像节点。其中,IP接入网络用于接入环状干线IP网络;多个网络视频录像节点相互连接构成网络视频录像集群,并通过IP接入网络接入环状干线IP网络。
具体的,如图1所示,控制中心集群系统包括多个网络视频录像节点和IP接入网络。控制中心集群系统通过IP接入网络与环状干线IP网络连接。多个网络视频录像节点相互连接,构成一个网络视频录像集群D,接入IP接入网络,并通过环状干线网络,接收来自车站集群系统的IP摄像机的音视频等相关数据,并向车站集群系统的客户端提供音视频等相关数据。
在本发明的一个实施例中,该控制中心集群系统的网络视频录像节点的资源全部为冗余资源。也就是说,该控制中心集群系统的每个网络视频录像节点,全部资源为冗余资源,用于接入车站集群系统中发生故障的网络视频录像节点的IP摄像机,和车站集群系统中冗余资源已经耗尽的网络视频录像节点的IP摄像机。
在本发明的一个实施例中,该控制中心集群的网络视频录像节点的数量不少于任一本地车站集群内部的网络视频录像节点的数量。如图1所示,集群D的节点数量通常不少于车站集群系统的集群节点数4。集群D通过收集环状干线IP网络上的所有车站集群系统的集群的信息,掌握车站集群的运行状态。
本发明充分利用车站集群系统的冗余资源,实现资源利用最大化。在发生故障时,按照站内接管-邻站接管-控制中心接管的多级容灾顺序,采用优先就近接管原则,尽可能缩短了IP摄像机到接管地点的距离,减少对干线网络的占用。多级容灾相比集中式容灾提高了可靠性,即减小了集中式容灾中心自身故障时所带来的损失。
根据本发明的另一个方面,还提供了一种车站多级容灾方法,该方法包括以下几个步骤。首先,在步骤S110中,在车站集群系统发生故障时,该车站集群系统利用自身冗余资源正常工作。在步骤S120中,车站集群系统自身冗余资源不足以正常工作下,同一邻站集群内的其他车站集群系统接收同一邻站集群内的故障车站集群系统输出的音视频数据。在步骤S130中,在邻站集群系统的冗余资源不足以使得故障车站集群系统正常工作下,由控制中心集群系统接收故障车站集群系统输出的音视频数据。在步骤S140中,在发生故障的车站集群系统恢复正常时,控制中心集群系统和邻站集群系统主动放弃接收原发生故障的车站集群系统输出的音视频数据,并保存音视频数据以备客户端进行查询。
在车站集群系统内的网络视频录像节点发生故障,需对故障节点的IP摄像机接管时,基于最小负载比例节点优先算法,根据发生故障的网络视频录像节点的IP摄像机列表,采用车站集群系统和/或邻站集群系统和/或控制中心集群系统的冗余网络视频录像节点对故障节点的IP摄像机接管,其中,车站集群系统内的正常网络视频录像节点依次接管故障节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值;在车站集群系统的冗余网络视频录像节点不足以接管故障节点的IP摄像机时,邻站集群系统内的冗余网络视频录像节点依次接管故障节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值;在车站集群系统和邻站集群系统的冗余网络视频录像节点已经耗尽或不足以接管故障节点的IP摄像机时,控制中心集群系统依次接管故障节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值。
在本发明的一个实施例中,在客户端查询音视频数据时,具体包括以下过程。客户端以起止时间为搜索条件发起查询IP摄像机音视频数据请求,在该IP摄像机所在网络视频录像节点自身存储空间搜索并请求同一车站集群系统内的其他网络视频节点在各自存储空间搜索,以形成覆盖起止时间的音视频数据结果集并返回该IP摄像机所在网络视频录像节点。如发现同一车站集群系统返回的音视频数据结果集不能覆盖起止时间,则该IP摄像机所在网络视频录像节点请求其所在邻站集群系统内的其他网络视频录像节点在各自存储空间搜索,以形成覆盖起止时间的音视频数据结果集并返回该IP摄像机所在网络视频录像节点。如发现邻站集群系统内返回的音视频数据结果集不能覆盖起止时间,则该IP摄像机所在网络视频录像节点请求控制中心集群系统的网络视频录像节点在各自存储空间搜索,以形成音视频数据结果集并返回该IP摄像机所在网络视频录像节点。
以下结合图1和图2来对该车站容灾系统的过程进行详细说明。
车站集群系统正常工作时,车站内的集群接管车站内的IPC,接入IPC的音视频流,并对音视频流进行转发和录像。转发是指将接入IPC的音视频流转发给客户端,提供客户端查看实时音视频功能。录像是指将IPC的音视频流保存在节点的存储空间,当客户端请求回放历史音视频时,节点检索存储空间,向客户端提供查询结果。
各节点根据IPC视频流的占用的带宽为依据,计算所有IPC在节点上产生的未工作负载值、工作负载值和接入负载值。未工作负载是指节点已接入IPC并保存IPC配置信息,但未对IPC的音视频流进行转发和存储。工作负载是指节点已接入IPC并保存IPC配置信息,并对IPC的音视频流进行转发和存储。接入负载是指未工作负载和工作负载的总和。各节点根据自身硬件能力,包括CPU、内存、存储空间、网口速率等为依据,计算自身容量值,容量值是指保持正常工作状态的最大工作负载值。节点统计自身的未工作负载值、工作负载值、接入负载值,以及容量值,提供包括集群内其他节点和其他集群进行查询。集群根据各节点工作负载值和容量值动态分配IPC,使各节点的工作负载值与容量值的比值保持在相近的水平。
集群内各节点之间通过发送消息互相协调,保持集群一致性和完整性。一致性包括各节点协商对IPC的动态分配,保证每一个IPC分配到一个节点上,不存在未分配的或重复分配的IPC。完整性包括因动态分配导致IPC的音视频保存在不同节点的存储空间中,在查询录像时,所有节点检索各自存储空间,提供各自结果子集,集群将子集合并成完整的结果集,返回给客户端,该结果集中的录像是连续完整的。
在环状干线IP网络中,相邻的几个车站集群系统内的集群组成邻站集群。如图1所示,A站、B站和C站内的集群A、集群B和集群C组成邻站集群。邻站集群内的集群之间通过相互发送各自节点的存活状态、接入IPC列表、工作负载值、容量值等信息。
当车站集群系统的集群一个或多个节点发生故障时,集群容灾将进入集群内容灾阶段。同一集群内其他正常工作节点探测到故障节点后,正常节点对故障节点所接管IPC的进行接管。如果节点发生的故障不影响收发消息,例如存储异常,则正常节点仍可以获得故障节点的IPC列表,并据此IPC列表进行接管;如果节点发生的故障导致不能正常收发消息,如网络不通或节点宕机,则正常节点以最后一次收到的,由故障节点周期性发送的IPC列表为依据,进行接管。
故障节点的工作负载值和容量值都会置为0,工作负载值全部转为未工作负载值,接入负载值保持不变,此时未工作负载值等于接入负载值。当正常节点数量大于等于一个时,一个或多个正常节点将对待接管的IPC列表进行分配,分配过程按照最小负载比例节点优先的算法进行。对列表的一个IPC进行分配时,选择接入负载值与容量值比值最小的正常节点进行添加IPC操作,分配后更新正常节点的接入负载值(值增加)和未工作负载值(值增加),更新故障节点的接入负载值(值减小)和未工作负载值(值减小),再对下一个IPC进行分配,依次循环直到所有IPC分配完毕。
每次正常节点被分配一个IPC后,IPC仍处已接入但未工作状态,如果节点的工作负载值小于容量值,则对IPC进行录像和转发,对应该IPC的未工作负载值转为工作负载值。如果正常节点的工作负载值大于或等于容量值,则IPC保持已接入但未工作状态,不进行录像和转发。
由于故障节点的容量值变为0,因此故障节点所在的集群总容量值下降;故障节点的接入负载值转移到同一集群内其他正常节点,因此故障节点所在的集群总接入负载值不变。待故障节点的IPC在集群内正常节点上分配完毕,集群的总工作负载值等于总容量值。此时,如果集群总接入值小于等于集群总容量值,说明每个节点预留的冗余资源足以应对故障节点分摊过来的IPC,不存在未工作负载,容灾流程在车站集群系统内部已经完成。此时,如果集群总接入负载值大于集群总容量值,说明每个节点预留的冗余资源不足以应对故障节点分摊过来的IPC,存在未工作负载,容灾流程进入邻站集群组内的集群间动态分配阶段,这部分未工作负载将由邻站集群接管。
邻站集群是指同一个邻站集群组内的其他集群,地理位置相邻是划分邻站集群组的依据,但邻站集群组内的集群不一定地理位置两两相邻。如图1所示,将A站、B站、C站内的集群A、集群B、集群C划为一个邻站集群组,则集群A的邻站集群是集群B和集群C,但集群A和集群C在地理位置上不相邻。
每个集群对所有邻站集群进行周期性探测,发现目标集群发生下列情况之一,将目标集群标记为故障集群,开始进入邻站集群容灾阶段:一、目标集群无法通信,目标集群内所有节点均宕机,此时,将目标集群的总容量值总工作负载值和总容量值都置为0,总接入负载值和IPC列表根据最后一次正常探测结果为准,所有IPC均处于接入但未工作状态;二、目标集群部分节点故障,目标集群已完成集群内容灾,且目标集群总接入负载值大于总容量值,部分IPC处于接入但未工作状态。
邻站集群组内的正常集群数量大于等于一个时,一个或多个正常集群将对故障集群的接入但未工作的IPC列表进行分配,分配过程按照最小负载比例集群优先的算法进行。对列表的一个IPC进行分配时,选择总接入负载值与总容量值比值最小的正常集群进行添加IPC操作,分配后更新正常集群的接入负载值(值增加)和未工作负载值(值增加),更新故障集群的接入负载值(值减小)和未工作负载值(值减小),正常集群内部,按照最小负载比例节点优先的算法进行节点间分配,再对下一个IPC进行分配,依次循环直到所有IPC分配完毕。此时,如果每个正常集群的总接入值均小于等于总容量值,说明每个集群预留的冗余资源足以应对故障集群分摊过来的IPC,不存在未工作负载,容灾流程在邻站集群组内已经完成。此时,如果存在某个正常集群的总接入负载值大于总容量值,说明存在某个集群预留的冗余资源不足以应对故障集群分摊过来的IPC,存在未工作负载,容灾流程进入控制中心容灾阶段,这部分未工作负载将由容灾中心集群接管。
控制中心的集群系统,平时不接入IPC,接入负载值、未工作负载值、工作负载值为0,容量值根据控制中心集群系统的硬件配置而确定的常数。控制中心集群系统周期性探测所有车站集群系统的集群状态。如果发现目标集群所在的邻站集群组已经完成邻站集群组内的集群间动态分配阶段,且目标集群的总接入负载值大于总容量值,控制中心集群系统将按照最小负载比例节点优先的算法,将目标集群的所有已接入但未工作的IPC添加到自身节点上。至此,容灾流程完毕,故障节点上的IPC,将按照集群内其他节点——邻站集群组内其他集群——控制中心集群的顺序进行迁移,因车站集群的节点均冗余资源,IPC将首先占用冗余资源,冗余资源耗尽后,IPC向下一个目的地迁移,最后到达控制中心集群系统。
控制中心集群系统的接入负载值大于容量值,说明出现故障的节点数超出了容灾设计能力,控制中心集群系统将发出告警通知系统管理员。
故障节点在排除故障,恢复正常后,根据原有配置,将故障前的IPC列表在自身节点上进行录像和转发。同一集群内的其他节点发现故障节点恢复正常后,如果存在初始归属于故障节点、当前存在自身节点的IPC,现在已经在故障节点上恢复工作,则其他节点主动删除该IPC,但保留IPC在存储空间中的录像。同一邻站集群组内地其他集群发现故障集群恢复正常后,如果存在初始归属于故障集群、当前存在自身集群的IPC,现在已经在故障集群上恢复工作,则其他集群主动删除该IPC,但保留IPC在存储空间中的录像。控制中心集群系统周期性监控所有集群,任何时候发现存在已经在某个集群中工作,当前存在于控制中心集群系统的IPC,则主动删除该IPC,但保留IPC在存储空间的录像。
因此,故障节点恢复正常后,原本归属于该节点的IPC仍在该节点工作,并且在集群内其他节点、邻站集群组内其他集群、控制中心集群系统等可能在容灾流程中作为迁移IPC的目的地,删除IPC并保留存储空间的录像。
客户端以起止时间为搜索条件发起查询某个IPC录像的请求,收到请求的称为任务节点。任务节点在自身存储空间搜索录像,形成结果集,结果集包含起止时间内各录像片段。同时任务节点将请求向同一集群内其他节点广播,其他节点在各自存储空间搜索录像,并将结果集返回任务节点。任务节点聚合自身结果集和其他节点返回的结果集,聚合后的结果集内的每个元素包含节点IP、录像片段起止时间。任务节点如果发现所有录像片段时候已经覆盖搜索条件的起止时间,则将聚合结果集返回客户端。否则,任务节点将请求转发给邻站集群组内的其他集群。
邻站集群组内的其他集群的每个节点在各自存储空间搜索录像,并将结果集返回任务节点。任务节点按照上述相同的方法聚合邻站集群的结果集和自身集群的结果集。任务节点如果发现所有录像片段时候已经覆盖搜索条件的起止时间,则将聚合结果集返回客户端。否则,任务节点将请求转发给控制中心集群系统。
控制中心集群的每个节点在各自存储空间搜索录像,并将结果集返回任务节点。任务节点按照上述相同的方法聚合控制中心集群的结果集和自身集群的结果集。任务节点将聚合结果集返回客户端。
客户端根据收到的聚合结果集中每个录像片段和对应的节点IP,向相应的节点发起回放录像的请求,完成录像播放任务。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种车站多级容灾综合系统,包括:
多个车站集群系统,每一所述车站集群系统内均设置有预定比例冗余资源,以使得所述车站集群系统发生故障时能利用自身冗余资源正常工作;
一个控制中心集群系统,与各车站集群系统连接,用于监控所有车站集群系统的运行状态,并在所述车站集群系统自身冗余资源不足以正常工作时,接收发生故障的车站集群系统输出的音视频数据;
其中,车站集群系统和控制中心集群系统位于地理上分离的区域;
环状干线IP网络,用于连接各车站集群系统以及所述控制中心集群系统。
2.根据权利要求1所述的综合系统,其特征在于,沿所述环状干线IP网络,相邻若干所述车站集群系统为一组形成邻站集群,各车站集群系统监控并只接收所属邻站集群内部其他发生故障的车站集群系统输出的音视频数据,其中,
在所述控制中心集群系统接收发生故障的车站集群系统输出的音视频数据之前,同一邻站集群内的其他车站集群系统接收同一邻站集群内的发生故障的车站集群系统输出的音视频数据;
在所述邻站集群内的冗余资源不足以使得发生故障的车站集群系统正常工作时,由所述控制中心集群系统接收发生故障的车站集群系统输出的音视频数据。
3.根据权利要求2所述的综合系统,其特征在于,所述车站集群系统设置于轨道交通车站内,所述车站集群系统进一步包括:
IP接入网络,用于接入所述环状干线IP网络;
多个网络视频录像节点,其相互连接构成网络视频录像集群,并通过所述IP接入网络接入所述环状干线IP网络;
多个IP摄像机,用于通过所述IP接入网络连接所述环状干线IP网络及所在车站集群系统的网络视频录像节点,用于产生音视频数据;
若干客户端,用于通过所述IP接入网络向所述网络视频录像集群查询音视频数据,
其中,每个所述网络视频录像节点正常工作时,接入预定数量IP摄像机,除正常工作IP摄像机占用的正常资源外,还预留所述预定比例的冗余资源用于接入发生故障的车站集群系统的网络视频录像节点的IP摄像机。
4.根据权利要求2或3所述的综合系统,其特征在于,所述控制中心集群系统设置于轨道交通控制中心,所述控制中心集群系统进一步包括:
IP接入网络,用于接入所述环状干线IP网络;
多个网络视频录像节点,其相互连接构成网络视频录像集群,并通过所述IP接入网络接入所述环状干线IP网络。
5.根据权利要求4所述的综合系统,其特征在于,所述控制中心集群系统的网络视频录像节点的资源全部为冗余资源。
6.根据权利要求5所述的综合系统,其特征在于,所述控制中心集群系统的网络视频录像节点的数量不少于任一所述车站集群系统内部的网络视频录像节点的数量。
7.一种车站多级容灾方法,包括:
在车站集群系统发生故障时,该车站集群系统利用自身冗余资源正常工作;
控制中心集群系统监控所有车站集群系统的运行状态,并在车站集群系统自身冗余资源不足以正常工作时,接收发生故障的车站集群系统输出的音视频数据;
其中,车站集群系统和控制中心集群系统位于地理上分离的区域;
在发生故障的车站集群系统恢复正常时,控制中心集群系统和邻站集群系统主动放弃接收原发生故障的车站集群系统输出的音视频数据,并保存音视频数据以备客户端进行查询。
8.根据权利要求7所述的方法,其特征在于,在沿环状干线IP网络将相邻若干车站集群系统分为一组以形成邻站集群情况下,进一步包括:
在所述控制中心集群系统接收发生故障的车站集群系统输出的音视频数据之前,
同一邻站集群内的其他车站集群系统接收同一邻站集群内的发生故障的车站集群系统输出的音视频数据;
在邻站集群内的冗余资源不足以使得发生故障的车站集群系统正常工作时,通过控制中心集群系统接收故障车站集群系统输出的音视频数据。
9.根据权利要求8所述的方法,其特征在于,在车站集群系统内的网络视频录像节点发生故障,需对故障节点的IP摄像机接管时,基于最小负载比例节点优先算法,根据发生故障的网络视频录像节点的IP摄像机列表,采用车站集群系统和/或邻站集群和/或控制中心集群系统的冗余网络视频录像节点对故障节点的IP摄像机接管,其中,
车站集群系统内的正常网络视频录像节点依次接管发生故障的网络视频录像节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值;
在车站集群系统的自身的冗余网络视频录像节点不足以接管发生故障的网络视频录像节点的IP摄像机时,邻站集群内的冗余网络视频录像节点依次接管发生故障的网络视频录像节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值;
在车站集群系统和邻站集群的冗余网络视频录像节点已经耗尽或不足以接管发生故障的网络视频录像节点的IP摄像机时,控制中心集群系统依次接管发生故障的网络视频录像节点的IP摄像机,并及时更新正常网络视频录像节点的接入负载值和未工作负载值。
10.根据权利要求9所述的方法,其特征在于,还包括客户端查询音视频数据,包括:
客户端以起止时间为搜索条件发起查询IP摄像机音视频数据请求;
在该IP摄像机所在网络视频录像节点自身存储空间搜索并请求同一车站集群系统内的其他网络视频节点在各自存储空间搜索,以形成覆盖起止时间的音视频数据结果集并返回该IP摄像机所在网络视频录像节点;
如发现同一车站集群系统返回的音视频数据结果集不能覆盖起止时间,则该IP摄像机所在网络视频录像节点请求其所在邻站集群系统内的其他网络视频录像节点在各自存储空间搜索,以形成覆盖起止时间的音视频数据结果集并返回该IP摄像机所在网络视频录像节点;
如发现邻站集群系统内返回的音视频数据结果集不能覆盖起止时间,则该IP摄像机所在网络视频录像节点请求控制中心集群系统的网络视频录像节点在各自存储空间搜索,以形成音视频数据结果集并返回该IP摄像机所在网络视频录像节点。
CN201710199707.3A 2017-03-30 2017-03-30 一种车站多级容灾架构及方法 Active CN107071351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710199707.3A CN107071351B (zh) 2017-03-30 2017-03-30 一种车站多级容灾架构及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710199707.3A CN107071351B (zh) 2017-03-30 2017-03-30 一种车站多级容灾架构及方法

Publications (2)

Publication Number Publication Date
CN107071351A CN107071351A (zh) 2017-08-18
CN107071351B true CN107071351B (zh) 2019-11-05

Family

ID=59620765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710199707.3A Active CN107071351B (zh) 2017-03-30 2017-03-30 一种车站多级容灾架构及方法

Country Status (1)

Country Link
CN (1) CN107071351B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101483762A (zh) * 2008-12-31 2009-07-15 中兴通讯股份有限公司 一种平台录像方法、系统及客户端
CN101582787A (zh) * 2008-05-16 2009-11-18 中兴通讯股份有限公司 一种双机备份系统及备份方法
CN101667937A (zh) * 2008-09-02 2010-03-10 华为技术有限公司 实现数据业务设备容灾的方法、数据业务设备和系统
CN101873462A (zh) * 2009-08-07 2010-10-27 杭州海康威视数字技术股份有限公司 Dvr的数据备份恢复方法、系统及dvr
CN102227131A (zh) * 2011-05-12 2011-10-26 杭州海康威视数字技术股份有限公司 网络视频录像机的热备份系统及方法
CN102724323A (zh) * 2012-07-02 2012-10-10 鞠洪尧 一种基于多级容灾的高效物联网架构
CN103529806A (zh) * 2013-10-28 2014-01-22 国家电网公司 基于扩展cimxml的多系统容灾备用系统的实现方法
CN103559104A (zh) * 2013-11-07 2014-02-05 南京国电南自轨道交通工程有限公司 一种基于混合通信的分布式冗余实时数据库框架
CN104579765A (zh) * 2014-12-27 2015-04-29 北京奇虎科技有限公司 一种集群系统的容灾方法和装置
CN105430327A (zh) * 2015-11-05 2016-03-23 成都基业长青科技有限责任公司 一种nvr集群备份方法及装置
CN106254100A (zh) * 2016-07-27 2016-12-21 腾讯科技(深圳)有限公司 一种数据容灾方法、装置和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020049778A1 (en) * 2000-03-31 2002-04-25 Bell Peter W. System and method of information outsourcing
US20090231434A1 (en) * 2008-03-17 2009-09-17 The Chamberlain Group Inc. Method and Apparatus to Facilitate Communicating Operational Data As Pertains to a Self-Storage Facility

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582787A (zh) * 2008-05-16 2009-11-18 中兴通讯股份有限公司 一种双机备份系统及备份方法
CN101667937A (zh) * 2008-09-02 2010-03-10 华为技术有限公司 实现数据业务设备容灾的方法、数据业务设备和系统
CN101483762A (zh) * 2008-12-31 2009-07-15 中兴通讯股份有限公司 一种平台录像方法、系统及客户端
CN101873462A (zh) * 2009-08-07 2010-10-27 杭州海康威视数字技术股份有限公司 Dvr的数据备份恢复方法、系统及dvr
CN102227131A (zh) * 2011-05-12 2011-10-26 杭州海康威视数字技术股份有限公司 网络视频录像机的热备份系统及方法
CN102724323A (zh) * 2012-07-02 2012-10-10 鞠洪尧 一种基于多级容灾的高效物联网架构
CN103529806A (zh) * 2013-10-28 2014-01-22 国家电网公司 基于扩展cimxml的多系统容灾备用系统的实现方法
CN103559104A (zh) * 2013-11-07 2014-02-05 南京国电南自轨道交通工程有限公司 一种基于混合通信的分布式冗余实时数据库框架
CN104579765A (zh) * 2014-12-27 2015-04-29 北京奇虎科技有限公司 一种集群系统的容灾方法和装置
CN105430327A (zh) * 2015-11-05 2016-03-23 成都基业长青科技有限责任公司 一种nvr集群备份方法及装置
CN106254100A (zh) * 2016-07-27 2016-12-21 腾讯科技(深圳)有限公司 一种数据容灾方法、装置和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
容灾技术在医院信息化建设中的应用研究;韩爱华;《中国医学装备》;20120831;全文 *

Also Published As

Publication number Publication date
CN107071351A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
CN108521656B (zh) 一种Lora通信方法及系统
JP4836008B2 (ja) 通信システム、通信方法、ノード、およびノード用プログラム
US5101348A (en) Method of reducing the amount of information included in topology database update messages in a data communications network
CN102984501A (zh) 一种网络视频录像集群系统
CN102664747B (zh) 一种云计算平台系统
US20040221207A1 (en) Proxy response apparatus
CN108600322B (zh) 基于铁路视频技术规范的综合视频监控云服务系统及方法
CN106534328A (zh) 节点连接方法及分布式计算系统
CN104601363A (zh) 一种分轨分域的双层卫星网络系统及管理方法
CN106407011A (zh) 一种基于路由表的搜索系统集群服务管理的方法及系统
CN106953926A (zh) 一种路由方法及装置
CN112953625A (zh) 一种超大规模低轨卫星网络运维及资源管控方法
CN114050858B (zh) 一种双层递阶的巨型星座故障管理与响应方法
CN109657000B (zh) 一种轨道交通综合监控系统的实时数据同步方法及装置
CN110290163A (zh) 一种数据处理方法及装置
CN107071351B (zh) 一种车站多级容灾架构及方法
CN111800516A (zh) 一种基于p2p的物联网设备管理方法及装置
CN114338714B (zh) 一种区块同步方法、装置、电子设备和存储介质
CN114338670B (zh) 一种边缘云平台和具有其的网联交通三级云控平台
CN112822528B (zh) 直播列表服务系统、直播列表管理方法、服务器及介质
CN105991961A (zh) 视频会议录制系统及其方法
CN115514651A (zh) 基于软件定义层叠网的云边数据传输路径规划方法及系统
CN114338724A (zh) 一种区块同步方法、装置、电子设备和存储介质
CN113301086A (zh) Dns数据管理系统和管理方法
CN117596175B (zh) 一种交换机分层监控方法、装置、设备、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A multi-level disaster recovery architecture and method for station

Effective date of registration: 20211203

Granted publication date: 20191105

Pledgee: Hangzhou High-tech Financing Guarantee Co.,Ltd.

Pledgor: Hangzhou TriNet Information Technology Co.,Ltd.

Registration number: Y2021980014024

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220302

Granted publication date: 20191105

Pledgee: Hangzhou High-tech Financing Guarantee Co.,Ltd.

Pledgor: Hangzhou TriNet Information Technology Co.,Ltd.

Registration number: Y2021980014024

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A multi-level disaster recovery architecture and method for station

Effective date of registration: 20220302

Granted publication date: 20191105

Pledgee: Shanghai Guotai Junan Securities Asset Management Co.,Ltd.

Pledgor: Hangzhou TriNet Information Technology Co.,Ltd.

Registration number: Y2022990000116

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20221220

Granted publication date: 20191105

Pledgee: Shanghai Guotai Junan Securities Asset Management Co.,Ltd.

Pledgor: Hangzhou TriNet Information Technology Co.,Ltd.

Registration number: Y2022990000116

PC01 Cancellation of the registration of the contract for pledge of patent right
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20170818

Assignee: Hangzhou Jintou Finance Leasing Co.,Ltd.

Assignor: Hangzhou TriNet Information Technology Co.,Ltd.

Contract record no.: X2022980028711

Denomination of invention: A multi-level disaster tolerance architecture and method for stations

Granted publication date: 20191105

License type: Exclusive License

Record date: 20230112

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A multi-level disaster tolerance architecture and method for stations

Effective date of registration: 20230115

Granted publication date: 20191105

Pledgee: Hangzhou Jintou Finance Leasing Co.,Ltd.

Pledgor: Hangzhou TriNet Information Technology Co.,Ltd.

Registration number: Y2023980031388

EC01 Cancellation of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Hangzhou Jintou Finance Leasing Co.,Ltd.

Assignor: Hangzhou TriNet Information Technology Co.,Ltd.

Contract record no.: X2022980028711

Date of cancellation: 20240327

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20191105

Pledgee: Hangzhou Jintou Finance Leasing Co.,Ltd.

Pledgor: Hangzhou TriNet Information Technology Co.,Ltd.

Registration number: Y2023980031388