CN106371952A - 一种基于物理机应急的管理系统 - Google Patents

一种基于物理机应急的管理系统 Download PDF

Info

Publication number
CN106371952A
CN106371952A CN201610772589.6A CN201610772589A CN106371952A CN 106371952 A CN106371952 A CN 106371952A CN 201610772589 A CN201610772589 A CN 201610772589A CN 106371952 A CN106371952 A CN 106371952A
Authority
CN
China
Prior art keywords
data
management system
physical machine
protection
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610772589.6A
Other languages
English (en)
Inventor
邬玉良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEATSONE TECHNOLOGY Inc
Original Assignee
HEATSONE TECHNOLOGY Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HEATSONE TECHNOLOGY Inc filed Critical HEATSONE TECHNOLOGY Inc
Priority to CN201610772589.6A priority Critical patent/CN106371952A/zh
Publication of CN106371952A publication Critical patent/CN106371952A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

一种基于物理机应急的管理系统是指发生灾难后将物理机内的数据通过备份管理系统备份恢复的过程,由于各行业针对业务连续性的日益重视,运营中断的事件不断发生,而防御手段也日益丰富,其手段不仅有针对自然灾害的灾备系统的建设,在针对威胁运营的各类物理机的应急体系上,出现物理机应急管理系统,他可以实现生产机房内生产系统的物理机停机事件的业务持续,各类风险事件的恢复时间被控制在分钟级别,大幅提高了系统的安全性和恢复速度,应急系统成为灾备体系的有力补充。

Description

一种基于物理机应急的管理系统
技术领域
本发明涉及一种基于物理机应急的管理系统,属于计算机应急安全领域。
背景技术
由于各行业针对业务连续性的日益重视,运营中断事件的防御手段日益丰富,其手段不仅限于针对自然灾害的灾备系统的建设,在针对威胁运营类故障事件的应急体系上,中科同向生产了物理机应急的管理系统,物理机应急的管理系统,能够实现生产机房内生产系统的各类故障导致的停机事件的业务持续,各类风险事件的恢复时间被控制在分钟级别,大幅提高了系统的安全性和恢复速度,成为灾备体系的有力补充。
在现代社会各单位和企业越来越注重信息化的建设,信息系统成为企业、事业单位日常运作中不可或缺的重要组成部分。伴随着业务不断的拓展和关联,每年都会新增加各种应用系统,信息系统也越来越庞大,越来越复杂,风险产生的可能性也随之增加。
物理机应急的管理系统常用于以下重要场景:
业务应急:一台EP设备自身可随机应急机房内任何几台故障X86服务器,保护多达25台。系统和数据保持完全一致。5-10分钟完全顶替原机使用。是机房所有服务器立即可用的备机,防范任何软硬件故障造成的业务中断事故,降低运维管理成本节能环保。
备份容灾:一种独特的备份技术和容灾架构,弥补了快照与备份之间的空白地带。将服务器整机备份成虚拟机,磁盘块级实时复制比传统方式更快;最"傻瓜式"备份系统,支持OS+APP+DATA的实时虚拟化镜像,支持整机实时备份整机一体化恢复;支持任何应用数据类型瞬间验证和瞬间恢复,随机应急接管、完全顶替原机使用,可实现低成本应用级容灾。
运维支持:支持服务器"异机"在线迁移,应用于机房搬迁项目,保障搬迁过程中硬件不损坏、数据不丢失、业务不间断;应用于老旧服务器更新,保障整机一次性迁移立即可用、无须重新安装系统和配置应用、摆脱了应用厂商支持的依赖。
运维仿真:为系统测试提供"仿真平台",仿真系统能提供与原机一模一样的模拟环境;支持多个版本的仿真系统,对原业务无任何影响;减少搭建模拟测试环境的烦恼,模拟环能随时创建,随时删除。
虚拟化应用:提供"虚拟化"高效迁移工具,能确保P2V迁移99%成功率;优化"云计算"安全备份容灾方案,补充VM传统备份,实时备份虚拟机映像无须暂停I/O,备份格式与VMDK兼容立即可用,支持整个映像恢复和单个文件瞬间恢复;提供"逻辑错误漂移"虚拟化加固方案,防范硬件故障同时解决VM系统和数据等逻辑错误无法漂移问题。
发明内容
一台设备可以接管机房内任意故障服务器,物理机应急的管理系统接管设备自身,可快速应急机房内任何数台故障X86服务器,系统和数据保持一致,5-10分种完全顶替原机使用。
产品功能可以实现:
立体保护:立体保护应用、数据库、操作系统及文档,从容应对软硬件故障、人为失误、环境因素等各种原因造成的停机,保证恢复的系统完整可用。
应急接管:所有历史时间点快照数据完整在线,裸机一键挂载即可随时验证;故障后虚拟主机最快3分钟快速接管,保持业务在线运行,主机修复后支持平滑回迁;提供智能的灾难应急演练或接管。
灵活恢复:多种恢复方式:提供P2P、P2V,V2P或V2V等多种恢复方式,缩短恢复时间可达99%,同时满足传统用户操作习惯。确保核心应用7*24小时在线,对生产服务器和用户不会造成任何影响。
故障挂载恢复:支持P2P,P2V,V2P或V2V恢复的任意环境的自动化灾难恢复;支持通过内置KVM虚拟化平台的方式,实现外置虚拟化容灾;支持多站点集群适配。
快速回滚恢复,避免逻辑错误:
当生产数据出现由于物理或者逻辑原因导致的丢失时,通过数据回滚和反向同步操作,数据库系统进行恢复验证。数据或应用逻辑错误可快速回滚恢复。
跨平台系统迁移:安全P2P,P2V,V2P或V2V迁移,虚拟服务器转换,应用程序和块感知式数据保护,不依赖于硬件环境,支持SAN存储环境。
安全应急系统结构设计:
1、搭建双机环境,服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备;
2、在业务主机出现故障时,通过软件诊测程序激活备机;
3、备机接管业务,保证应用在短时间内完全恢复正常使用。
基于上述的用户现状以及需求分析、用户数据量考虑,建议部署物理机应急的管理系统。
附图说明
图1、一种基于物理机应急的管理系统流程图
具体实施方式
为了使本发明的目的,技术方案和可行性更加清楚明白,结合附图,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方案仅仅是用以解释本发明,并不用于限定本发明。
本发明提出了一种基于物理机应急的管理系统,保证了业务系统更安全可靠。
所述方法包括下述步骤:
首先:如上图1所示系统结构,所有6台服务器及EP均接入LAN网络中。针对6台服务器的实时数据及应用系统的不间断保护,保护数据存储于EP中。
其次:在不改变原有系统结构的前提下,将EP接入LAN中(和SAN中),持续数据保护的数据存储于EP中。EP设备部署完成后,系统自动将需要保护的服务器进行有效的持续数据保护,在数据写入被保护服务器自身存储的同时,写入EP中。保证EP中的数据与被保护的数据完全一致。
最后:利用截获每个写I/O功能,可进行连续的或基于时间点的快照工作,此功能能够在被保护服务器发生逻辑错误时,快速有效地进行每I/O节点或快照点的挂载,避免逻辑错误造成的数据损坏。

Claims (3)

1.一种基于物理机应急的管理系统,所述的方法包括下述步骤:
首先:将所有6台服务器及EP均接入LAN网络中。针对6台服务器的实时数据及应用系统的不间断保护,保护数据存储于EP中。
其次:在不改变原有系统结构的前提下,将EP接入LAN中(和SAN中),持续数据保护的数据存储于EP中。EP设备部署完成后,系统自动将需要保护的服务器进行有效的持续数据保护,在数据写入被保护服务器自身存储的同时写入EP中。
最后:利用截获每个写I/O功能,可进行连续的或基于时间点的快照工作,此功能能够在被保护服务器发生逻辑错误时,快速有效地进行每I/O节点或快照点的挂载,避免逻辑错误造成的数据损坏。保证EP中的数据与被保护的数据完全一致。
2.如权利要求1所述在业务主机出现故障时,将EP接入LAN中(和SAN中),持续数据保护的数据存储于EP中。
3.如权利要求1所述利用截获每个写I/O功能,运行存储中、避免逻辑错误造成的数据损坏,保证EP中的数据与被保护的数据完全一致。
CN201610772589.6A 2016-08-30 2016-08-30 一种基于物理机应急的管理系统 Pending CN106371952A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610772589.6A CN106371952A (zh) 2016-08-30 2016-08-30 一种基于物理机应急的管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610772589.6A CN106371952A (zh) 2016-08-30 2016-08-30 一种基于物理机应急的管理系统

Publications (1)

Publication Number Publication Date
CN106371952A true CN106371952A (zh) 2017-02-01

Family

ID=57902084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610772589.6A Pending CN106371952A (zh) 2016-08-30 2016-08-30 一种基于物理机应急的管理系统

Country Status (1)

Country Link
CN (1) CN106371952A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657457A (zh) * 2018-12-27 2019-04-19 北京联创信安科技股份有限公司 一种面向业务环境的智能化内外双层沙箱管理系统
CN112380055A (zh) * 2020-10-29 2021-02-19 中科热备(北京)云计算技术有限公司 基于灾备管理一体化的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984309A (zh) * 2014-05-09 2014-08-13 浙江中烟工业有限责任公司 一种具有容灾功能的卷烟生产系统及其容灾演练方法
CN105550062A (zh) * 2015-12-03 2016-05-04 上海爱数信息技术股份有限公司 基于持续数据保护与时间点浏览恢复的数据回流方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984309A (zh) * 2014-05-09 2014-08-13 浙江中烟工业有限责任公司 一种具有容灾功能的卷烟生产系统及其容灾演练方法
CN105550062A (zh) * 2015-12-03 2016-05-04 上海爱数信息技术股份有限公司 基于持续数据保护与时间点浏览恢复的数据回流方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佚名: "备份基础知识:CDP+SAN Boot快速恢复系统-DOIT", 《HTTPS://WWW.DOIT.COM.CN/P/AUTHOR/RENXINBO》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657457A (zh) * 2018-12-27 2019-04-19 北京联创信安科技股份有限公司 一种面向业务环境的智能化内外双层沙箱管理系统
CN109657457B (zh) * 2018-12-27 2021-11-19 北京联创信安科技股份有限公司 一种面向业务环境的智能化内外双层沙箱管理系统
CN112380055A (zh) * 2020-10-29 2021-02-19 中科热备(北京)云计算技术有限公司 基于灾备管理一体化的方法

Similar Documents

Publication Publication Date Title
US10552267B2 (en) Microcheckpointing with service processor
US10169173B2 (en) Preserving management services with distributed metadata through the disaster recovery life cycle
US8689047B2 (en) Virtual disk replication using log files
EP2721498B1 (en) Managing replicated virtual storage at recovery sites
US8949182B2 (en) Continuous and asynchronous replication of a consistent dataset
EP1907935B1 (en) System and method for virtualizing backup images
US9377964B2 (en) Systems and methods for improving snapshot performance
CN106528327B (zh) 一种数据处理方法以及备份服务器
EP3750066B1 (en) Protection of infrastructure-as-a-service workloads in public cloud
US20120150805A1 (en) Efficient Backup and Restore of a Cluster Aware Virtual Input/Output Server (VIOS) Within a VIOS Cluster
KR20230097184A (ko) 비동기적 교차-영역 블록 볼륨 복제
US11003362B2 (en) Disaster recovery practice mode for application virtualization infrastructure
CN105446826A (zh) 虚拟机备份、恢复的方法及设备
CN101770410A (zh) 基于客户操作系统的系统还原方法、虚拟机管理器及系统
US9262290B2 (en) Flash copy for disaster recovery (DR) testing
CN106815095A (zh) 一种云平台环境下虚拟机数据保护方法
CN105376329A (zh) 一种远程在线备份虚拟机的方法
US11829609B2 (en) Data loss recovery in a secondary storage controller from a primary storage controller
WO2017014814A1 (en) Replicating memory volumes
CN102495812A (zh) Linux平台硬盘数据保护与恢复方法
CN106293998A (zh) 一种基于快照技术的系统备份方法
CN106371952A (zh) 一种基于物理机应急的管理系统
CN104133742A (zh) 一种数据保护的方法及装置
CN106445729A (zh) 一种基于备份虚拟化的方法
CN106598787A (zh) 基于Xen的无代理备份还原方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170201

WD01 Invention patent application deemed withdrawn after publication