CN115408037A - 软件的升级投产方法及装置 - Google Patents

软件的升级投产方法及装置 Download PDF

Info

Publication number
CN115408037A
CN115408037A CN202211063592.2A CN202211063592A CN115408037A CN 115408037 A CN115408037 A CN 115408037A CN 202211063592 A CN202211063592 A CN 202211063592A CN 115408037 A CN115408037 A CN 115408037A
Authority
CN
China
Prior art keywords
virtual machines
batch
virtual machine
software
gateway
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211063592.2A
Other languages
English (en)
Inventor
曹杰瑞
王立新
闫继忠
滕腾
王璐璐
刘良琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202211063592.2A priority Critical patent/CN115408037A/zh
Publication of CN115408037A publication Critical patent/CN115408037A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • G06F8/656Updates while running
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45587Isolation or security of virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提供一种软件的升级投产方法及装置,所述软件的升级投产方法包括:首先,按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,虚机的功能类型分为业务、网络以及数据;然后,对第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;对新版本软件的第一批次虚机进行功能正确性验证;若新版本软件的第一批次虚机进行功能正确性验证通过,对第二批次虚机进行旧版本软件向新版本软件的投产切换。有效减少投产切换带来的影响,以不停机方式完成投产切换工作实施,提高用户的使用体验。

Description

软件的升级投产方法及装置
技术领域
本申请涉及计算机技术领域,特别涉及一种软件的升级投产方法及装置。
背景技术
主机平台基础软件升级是一个复杂的工程,主要过程含盖了软件介质安装、测试环境投产、新基础软件功能和非功能测试、投产演练及在生产环境的切换投产过程,项目持续周期长,变更内容多,项目干系人数量旁大,对项目管理有着极高的要求。同时,为了降低新版本软件投产过程所带来的可能影响系统交易提供能力的风险点,需提前制定详细的应急预案,且需对应急预案提前进行验证估计,以确保应急预案的可用性和准确性。
在生产环境投产切换过程中,系统维护者通常会选择在业务低峰时段进行,如在凌晨时段,实施过程中以新版本软件介质完成虚机的重启,完成新版本软件升级所需各项动作实施后才能恢复对外服务,同时升级的产品数据量多,每个产品的更新操作项也多,切换过程持续时间相对较长,每次操作都需要4~5个小时时间。而虚机升级过程中所涉及的隔离过程和并入过程,会对交易性能产生影响,包括交易响应时长增加而导致的交易性能抖动,以及可能导致在途交易的失败等情况。在传统的软件升级投产方案中,实施者会主动申请停机窗口进行投产切换,以避免对联机交易造成的不必要的影响。但对于银行核心业务系统而言,这种方式虽然稳妥,但每次投产切换的实施过程均需要申请停机4个小时以上的停机窗口,这种升级投产方案降低了系统的可用性时长,影响用户的使用体验。
发明内容
有鉴于此,本申请提供一种软件的升级投产方法及装置,有效减少投产切换带来的影响,提高用户的使用体验。
本申请第一方面提供了一种软件的升级投产方法,包括:
按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,所述虚机的功能类型分为业务、网络以及数据;
对所述第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,所述新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;
对所述新版本软件的第一批次虚机进行功能正确性验证;
若所述新版本软件的第一批次虚机进行功能正确性验证通过,对所述第二批次虚机进行旧版本软件向新版本软件的投产切换。
可选的,所述升级投产方法,还包括:
针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果;其中,所述操作方案分为隔离操作方案和并入操作方案;
对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进。
可选的,虚机的功能类型为业务虚机,所述针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果,包括:
若操作方案为隔离操作方案,则在主机侧将交易中间件应用程序控制器置为静止状态,并在交易中件间路由控制器中将网关至所述交易中件间路由控制器的路由策略关闭;
在网关侧,关闭与已关闭路由策略的交易路由控制器的主机平台网络协议层的逻辑单元;
在主机侧,关闭所述交易中间件路由控制器对应的进程;
在主机侧,关闭所述交易中间件应用程序控制器进程,隔离业务虚机的业务中间件;
关闭数据库进程,隔离业务虚机的数据库软件;
将多个业务虚机从并行耦合系统中逐个依次进行隔离;
若操作方案为并入操作方案,则以新版本介质启动业务虚机操作系统,不自动带起主机平台关系型数据库系统软件和交易中间件软件;
控制多个业务虚机逐个并入并行耦合系统;
控制多个业务虚机上的数据库实例启动的并发,串序启动。
可选的,虚机的功能类型为网络虚机,所述针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果,包括:
若操作方案为隔离操作方案,则将网络虚机中处于活跃状态的依赖型逻辑单元请求者连接切换至另一台网络虚机上运行;
将处于活跃状态的节点间控制点会话切换至另一台网络虚机上运行;
在主机侧将各网关节点对应的物理单元和逻辑单元依次激死;
在主机侧将各网关节点对应的控制点激死;
将多个网络虚机从并行耦合系统中逐个依次进行隔离;
若操作方案为并入操作方案,控制多个网络虚机逐个并入并行耦合系统。
可选的,虚机的功能类型为数据虚机,所述针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果,包括:
若操作方案为隔离操作方案,则将多个数据虚机从并行耦合系统中逐个依次进行隔离;
若操作方案为并入操作方案,控制多个数据虚机逐个并入并行耦合系统。
可选的,所述对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进,包括:
预留m台网关不进行重启操作以保证业务可用性,对其余n-m网关进行下机操作;其中,共有n台网关设备与网关主机以SNA协议进行连接,n和m属于正整数,且m<n/2;
启动已被下机的网关中的m台网关主机,新启动的m台网关主机重建逻辑单元;
启动处于关机状态的n-2m台网关主机,其中,所述n-2m台网关主机在重建逻辑单元过程中将向所有交易路由控制器发起均匀的逻辑单元新建请求;
对从未重启过的m台网关进行重启操作;
第二次重启已被启动过一次的m台网关主机。
可选的,所述升级投产方法,还包括:
在第一批次虚机投产切换过程中,若遇到不能马上定位根因,在较短时间内无法解决的问题,导致虚机无法正常启动,则马上停止升级投产实施,回退已升级部分虚机。
可选的,所述升级投产方法,还包括:
在已完成第一批次虚机中所有虚机的投产切换后,并行耦合系统处于混存状态对外运行时遇到不能马上定位根因,在较短时间内无法解决的问题,对交易产生影响,则马上隔离已投产虚机,回退第一批次已升级虚机。
可选的,所述升级投产方法,还包括:
若所有虚机投产切换已完成,在并行耦合系统以全量升级状态时对外试运行阶段内遇到不能马上定位根因,在较短时间内无法解决的问题,则马上隔离所有已投产虚机,回退全部已升级虚机。
本申请第二方面提供了一种软件的升级投产装置,包括:
拆分单元,用于按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,所述虚机的功能类型分为业务、网络以及数据;
第一投产切换单元,用于对所述第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,所述新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;
验证单元,用于对所述新版本软件的第一批次虚机进行功能正确性验证;
第二投产切换单元,用于若所述新版本软件的第一批次虚机进行功能正确性验证通过,对所述第二批次虚机进行旧版本软件向新版本软件的投产切换。
可选的,所述软件的升级投产装置,还包括:
第一分析单元,用于针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果;其中,所述操作方案分为隔离操作方案和并入操作方案;
第二分析单元,用于对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进。
可选的,虚机的功能类型为业务虚机,所述第一分析单元,包括:
第一关闭单元,用于若操作方案为隔离操作方案,则在主机侧将交易中间件应用程序控制器置为静止状态,并在交易中件间路由控制器中将网关至所述交易中件间路由控制器的路由策略关闭;
第二关闭单元,用于在网关侧,关闭与已关闭路由策略的交易路由控制器的主机平台网络协议层的逻辑单元;
第三关闭单元,用于在主机侧,关闭所述交易中间件路由控制器对应的进程;
第四关闭单元,用于在主机侧,关闭所述交易中间件应用程序控制器进程,隔离业务虚机的业务中间件;
第五关闭单元,用于关闭数据库进程,隔离业务虚机的数据库软件;
第一隔离单元,用于将多个业务虚机从并行耦合系统中逐个依次进行隔离;
带起单元,用于若操作方案为并入操作方案,则以新版本介质启动业务虚机操作系统,不自动带起主机平台关系型数据库系统软件和交易中间件软件;
第一控制单元,用于控制多个业务虚机逐个并入并行耦合系统;
第二控制单元,用于控制多个业务虚机上的数据库实例启动的并发,串序启动。
可选的,虚机的功能类型为网络虚机,所述第一分析单元,包括:
第一切换单元,用于若操作方案为隔离操作方案,则将网络虚机中处于活跃状态的依赖型逻辑单元请求者连接切换至另一台网络虚机上运行;
第二切换单元,用于将处于活跃状态的节点间控制点会话切换至另一台网络虚机上运行;
第一激死单元,用于在主机侧将各网关节点对应的物理单元和逻辑单元依次激死;
第二激死单元,用于在主机侧将各网关节点对应的控制点激死;
第二隔离单元,用于将多个网络虚机从并行耦合系统中逐个依次进行隔离;
第三控制单元,用于若操作方案为并入操作方案,控制多个网络虚机逐个并入并行耦合系统。
可选的,虚机的功能类型为数据虚机,所述第一分析单元,包括:
第三隔离单元,用于若操作方案为隔离操作方案,则将多个数据虚机从并行耦合系统中逐个依次进行隔离;
第四控制单元,用于若操作方案为并入操作方案,控制多个数据虚机逐个并入并行耦合系统。
可选的,所述第二分析单元,包括:
下机单元,用于预留m台网关不进行重启操作以保证业务可用性,对其余n-m网关进行下机操作;其中,共有n台网关设备与网关主机以SNA协议进行连接,n和m属于正整数,且m<n/2;
第一启动单元,用于启动已被下机的网关中的m台网关主机,新启动的m台网关主机重建逻辑单元;
第二启动单元,用于启动处于关机状态的n-2m台网关主机;其中,所述n-2m台网关主机在重建逻辑单元过程中将向所有交易路由控制器发起均匀的逻辑单元新建请求;
第一重启单元,用于对从未重启过的m台网关进行重启操作;
第二重启单元,用于第二次重启已被启动过一次的m台网关主机。
可选的,所述软件的升级投产方法,还包括:
第一回退单元,用于在第一批次虚机投产切换过程中,若遇到不能马上定位根因,在较短时间内无法解决的问题,导致虚机无法正常启动,则马上停止升级投产实施,回退已升级部分虚机。
可选的,所述软件的升级投产方法,还包括:
第二回退单元,用于在已完成第一批次虚机中所有虚机的投产切换后,并行耦合系统处于混存状态对外运行时遇到不能马上定位根因,在较短时间内无法解决的问题,对交易产生影响,则马上隔离已投产虚机,回退第一批次已升级虚机。
可选的,所述软件的升级投产方法,还包括:
第三回退单元,用于若所有虚机投产切换已完成,在并行耦合系统以全量升级状态时对外试运行阶段内遇到不能马上定位根因,在较短时间内无法解决的问题,则马上隔离所有已投产虚机,回退全部已升级虚机。
由以上方案可知,本申请提供一种软件的升级投产方法及装置,所述软件的升级投产方法包括:首先,按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,所述虚机的功能类型分为业务、网络以及数据;然后,对所述第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,所述新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;对所述新版本软件的第一批次虚机进行功能正确性验证;若所述新版本软件的第一批次虚机进行功能正确性验证通过,对所述第二批次虚机进行旧版本软件向新版本软件的投产切换。有效减少投产切换带来的影响,以不停机方式完成投产切换工作实施,提高用户的使用体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种软件的升级投产方法的具体流程图;
图2为本申请另一实施例提供的一种软件的升级投产方法的流程图;
图3为本申请另一实施例提供的一种软件的升级投产方法的流程图;
图4为本申请另一实施例提供的一种软件的升级投产方法的流程图;
图5为本申请另一实施例提供的一种软件的升级投产方法的流程图;
图6为本申请另一实施例提供的一种软件的升级投产方法的流程图;
图7为本申请另一实施例提供的一种软件的升级投产装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系,而术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种软件的升级投产方法,如图1所示,具体包括以下步骤:
S101、按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机。
其中,虚机的功能类型分为业务、网络以及数据。两个批次的实施窗口可以选择在业务最低峰时间段内,如在凌晨2:30-6:00。
具体的,对需要待升级投产的虚机按功能类型进行选取,每一批次中选取各类型虚机的50%完成投产切换动作,具体地,每一批次投产切换过程中各选择50%的业务虚机、50%的网络虚机、50%的数据虚机。
S102、对第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机。
其中,新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务。
需要说明的是,在第一批次虚机完成旧版本软件向新版本软件的投产切换后,当前并行耦合系统内就存在新版本软件的第一批次虚机和依旧为旧版本的第二批次虚机的混存状态,新旧版本虚机同时对外提供服务,在混存状态下对新升级投产的虚机功能进行对外服务能力的验证,可提前发现基础软件升级可能带来的问题,为快速回退提供决策依据,同时由于混存状态下需回退的虚机数量相对较少,可节约回退时间,系统可快速恢复全部服务能力,分两步走的投产切换方式可降低新版本基础软件升级实施带来的风险因素,将投产切换带来的影响程度降至最小;在混存版本下得到充分验证后进行全量升级切换动作,可规避项目实施中低概率大影响的整体回退的可能性。
在本申请的具体实现过程中,各批次投产切换虚机选取方式可以如下:
1、待投产切换虚机的选取,对于业务虚机,在第一批次投产切换时,方法一是可在4台物理主机上各选一路业务虚机,这样既达到在第一批次内完成50%业务虚机升级切换的任务,同时在遇到新版本虚机投产失败的情况下又可以通过分布在4台物理主机的旧版本虚机提供业务支撑,将4台物理主机的计算资源充分利用;
2、待投产切换虚机的选取,对于业务虚机,在第一批次投产切换时,方法二是,若4台物理主机安装部署在非同一机房模块内,或者安装部署在非同一楼宇的两个机房模块内,则可按机房模块或者从楼宇部署角度进行虚机的选取,本项目实施可为机房管理等其他工作实施提供难得的停机窗口;
3、对于网络虚机,优选备用网络虚机在第一批次内进行升级投产切换,可减少新版本软件对网络功能产生影响的风险;
4、对于数据虚机同样建议优选备用数据虚机优先实施投产切换,以解决新版本软件产品问题可能带来的对数据复制功能的影响。
在完成对混存状态下新版本虚机的验证后,进行第二批次的虚机投产切换动作,完成对剩余50%的虚机的切换。
可选的,在本申请的另一实施例中,软件的升级投产方法的一种实施方式,如图2所示,还包括:
S201、针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果。
其中,操作方案分为隔离操作方案和并入操作方案。
具体的,对于要进行软件升级投产切换的业务虚机进行隔离,需要对特别关注数据库进程的关闭过程,确保多个业务虚机中的多个数据库实例进程不发生同时隔离的情况,因同时隔离产生大量的数据库全局锁转移操作,期间会造成大量的主机计算资源消耗突增,对交易性能产生较大影响。
对于要进行软件升级投产切换的业务虚机进行隔离,关闭业务虚机操作系统,将业务虚机从并行耦合系统(集群)中隔离出去,为保证隔离虚机过程对业务影响降至最低,多个虚机隔离动作需要顺序执行,因多个虚机同时从并行耦合系统中离开易导致并行耦合系统全局锁GRS压力增大,可能会影响业务响应时间;
对于要进行软件升级投产切换的业务虚机进行隔离,关闭业务虚机操作系统,将业务虚机从并行耦合系统(集群)中隔离出去,为保证隔离虚机过程对业务影响降至最低,多个虚机隔离动作需要顺序执行,因多个虚机同时从并行耦合系统中离开易导致并行耦合系统全局锁GRS压力增大,可能会影响业务响应时间;
对于要进行软件升级投产的网络虚机进行隔离,需要将虚机正在负责的网络支持服务切换到另外一台网络虚机上运行。
由于,将交易中间件路由控制器CICS TOR进程关闭的操作过程将对在途交易产生影响;将多个数据库实例进程同时隔离将产生大量的数据库全局锁进行正常移交,会对交易性能的影响;关闭业务虚机操作系统后,将多个虚机从并行耦合系统(集群)中隔离出去时,易导致并行耦合系统全局锁GRS压力增大,可能会影响业务响应时间。因此,在本申请的另一实施例中,若虚机的功能类型为业务虚机,操作方案为隔离操作方案,那么步骤S201的一种实施方式,如图3所示,包括:
业务虚机业务中件间的具体隔离流程方法为:
S301、在主机侧将交易中间件应用程序控制器置为静止状态,并在交易中件间路由控制器中将网关至交易中件间路由控制器的路由策略关闭。
需要说明的是,在交易中间件应用程序控制器置为静止状态后,交易中间件应用程序控制器将不再接受新交易的请求,由其他处于工作状态的交易中间件应用程序控制器继续进行交易执行操作;此操作过程将对交易无影响,当本交易中间件应用程序控制器所有交易完成后才会进入预期的静止状态。在交易中件间路由控制器中将网关至交易中件间路由控制器的路由策略关闭,同样对在途交易不会产生影响,所有在途交易完成后才会完成路由策略的最终关闭操作;关闭后,网关会将新交易发送至路由策略处于开启状态的路由控制器。
S302、在网关侧,关闭与已关闭路由策略的交易路由控制器的主机平台网络协议层的逻辑单元。
需要说明的是,在网关侧,关闭与已关闭路由策略的交易路由控制器在主机平台网络协议层的逻辑单元,关闭过程中因没有交易使用此逻辑单元,因而对交易不产生影响。
S303、在主机侧,关闭交易中间件路由控制器对应的进程。
需要说明的是,因已无交易经此路由,关闭进程操作对交易无影响。
S304、在主机侧,关闭交易中间件应用程序控制器进程,隔离业务虚机的业务中间件。
需要说明的是,因中间件应用程序控制器处于静止状态未处理任何交易请求,关闭进程过程对交易无影响。
业务虚机数据库软件的具体隔离流程方法为:
S305、关闭数据库进程,隔离业务虚机的数据库软件。
具体的,人工干预数据库进程的关闭过程,确保多个业务虚机中的多个数据库实例进程不发生同时隔离的情况。
业务虚机从并行耦合系统(集群)中隔离出去的具体流程方法为:
S306、将多个业务虚机从并行耦合系统中逐个依次进行隔离。
由于,数据库软件或交易中间件软件在启动中处于未完全就绪的情况下就开启对外服务,影响并行耦合系统(集群)的整体服务能力;多个虚机操作系统并入并行耦合系统时,引发的对于并行耦合系统全局锁的争抢行为,影响连机交易性能;多个业务虚机的多个数据库实例同时启动过程中,会有全局共享锁的交互移交过程,数据库实例也处于较繁忙的状态,此过程要消耗大量的主机计算资源CPU,影响连机交易性能;因此,在本申请的另一实施例中,若虚机的功能类型为业务虚机,操作方案为并入操作方案,那么步骤S201的一种实施方式,如图4所示,包括:
S401、以新版本介质启动业务虚机操作系统,不自动带起主机平台关系型数据库系统软件和交易中间件软件。
需要说明的是,以新版本介质启动业务虚机操作系统,不自动带起主机平台关系型数据库系统软件、交易中间件软件的主机平台客户信息控制系统是为了防止数据库软件或交易中间件软件在启动中处于未完全就绪的情况下就开启对外服务,从而影响并行耦合系统(集群)的整体服务能力;同时,多个虚机操作系统并入并行耦合系统时,要控制并入的并发,以避免多个虚机同时加入并行耦合系统(集群)时引发的对于并行耦合系统全局锁的争抢行为,避免影响连机交易性能。
对于以新版本基础软件并入并行耦合系统的业务虚机,以手动方式启动数据库软件,在多个虚机的多个数据库实例启动过程中,要做到控制启动实例数的并发,串序启动,因多个数据库实例同时启动,均会有全局共享锁的交互移交过程,数据库实例也处于较繁忙的状态,此过程要消耗大量的主机计算资源CPU,因此对于数据库实例并入过程需严格控制并发,以免对联机交易产生影响。
S402、控制多个业务虚机逐个并入并行耦合系统。
从而避免多个虚机同时加入并行耦合系统(集群)时引发的对于并行耦合系统全局锁的争抢行为。
S403、控制多个业务虚机上的数据库实例启动的并发,串序启动。
从而减少数据库对全局共享锁争抢。
对于以新版本基础软件并入并行耦合系统的业务虚机,在启动交易中间件软件的过程中,具体的并入流程如下:
1)执行交易中间件升级所需动作,使新版本交易中间件可启动;
2)手动启动交易中间件应用程序控制器,并置为静止状态,防止在中间件应用程序控制器未正常启动情况下新版本应用程序控制器响应交易请求,引发交易异常;
3)对新版本启动的中间件各进程进行启动状态检查,确认进程启动正常,符合升级预期;
4)将中间件应用程序控制器状态由静止变为对外服务状态,等待交易请求接入;
5)启动交易中间件路由控制器,接收来自网关的交易请求。
由于,不主动激死控制点,则在关闭网络虚机的操作系统下掉虚拟远程通讯访问方法进程的过程中会发生网络切换,引起交易抖动,影响业务响应时长;关闭网络虚机操作系统后,将多个虚机从并行耦合系统(集群)中隔离出去时,易导致并行耦合系统全局锁压力增大,可能会影响业务响应时间。因此,在本申请的另一实施例中,若虚机的功能类型为网络虚机,操作方案为隔离操作方案,那么步骤S201的一种实施方式,如图5所示,包括:
S501、将网络虚机中处于活跃状态的依赖型逻辑单元请求者连接切换至另一台网络虚机上运行。
需要说明的是,此操作对业务无影响。
S502、将处于活跃状态的节点间控制点会话切换至另一台网络虚机上运行。
需要说明的是,此操作对业务无影响。
S503、在主机侧将各网关节点对应的物理单元和逻辑单元依次激死。
需要说明的是,此操作对业务无影响。
S504、在主机侧将各网关节点对应的控制点激死。
需要说明的是,此操作对业务无影响。但如果不主动激死控制点,则在关闭网络虚机的操作系统,下掉虚拟远程通讯访问方法(Virtual telecommunication AccessMethod,VTAM)进程的过程中会发生主机平台网络协议网络内部切换,引起交易抖动,影响业务响应时长。
S505、将多个网络虚机从并行耦合系统中逐个依次进行隔离。
需要说明的是,为保证隔离虚机对业务影响可降至最低,多个虚机隔离过程需要顺序执行,多个虚机同时从并行耦合系统中离开易导致并行耦合系统全局锁压力增大,可能会影响业务响应时间。
由于,多个虚机操作系统并入并行耦合系统时,引发的对于并行耦合系统全局锁的争抢行为,影响连机交易性能,因此,在本申请的另一实施例中,若虚机的功能类型为网络虚机,操作方案为并入操作方案,那么步骤S201的一种实施方式,包括:
控制多个网络虚机逐个并入并行耦合系统。
从而避免多个虚机同时加入并行耦合系统(集群)时引发的对于并行耦合系统全局锁的争抢行为。
在本申请的具体实现过程中,以新版本基础软件并入并行耦合系统的网络虚机,以新版本介质启动操作系统,网络功能自动恢复,无需人工额外干预;同时,多个虚机并入并行耦合系统时,要控制并入的并发,以避免多个虚机加入并行耦合系统(集群)时引发的对于并行耦合系统全局锁的争抢行为,避免影响连机交易性能。
由于,关闭数据虚机操作系统后,将多个虚机从并行耦合系统(集群)中隔离出去时,易导致并行耦合系统全局锁压力增大,可能会影响业务响应时间。因此,在本申请的另一实施例中,若虚机的功能类型为数据虚机,操作方案为隔离操作方案,那么步骤S201的一种实施方式,包括:
将多个数据虚机从并行耦合系统中逐个依次进行隔离。
需要说明的是,对数据虚机进行隔离,可直接关闭数据虚机操作系统,数据复制软件(Geographically Dispersed Parallel Sysplex peer-to-peer remote copy,GDPS)将会由自动化工具(System Automation,SA)管理,随操作系统一同关闭,为保证隔离虚机对业务的影响可降至最低,多个虚机隔离过程需要顺序执行,多个虚机同时从并行耦合系统中离开易导致并行耦合系统全局锁压力增大,可能会影响业务响应时间。
由于,多个虚机操作系统并入并行耦合系统时,引发的对于并行耦合系统全局锁的争抢行为,影响连机交易性能。因此,在本申请的另一实施例中,若虚机的功能类型为数据虚机,操作方案为隔离操作方案,那么步骤S201的一种实施方式,包括:
控制多个数据虚机逐个并入并行耦合系统。
从而避免多个虚机同时加入并行耦合系统(集群)时引发的对于并行耦合系统全局锁的争抢行为。
在本申请的具体实现过程中,对于以新版本基础软件并入并行耦合系统的数据虚机,以新版本介质启动操作系统,数据复制软件GDPS随自动化工具软件一并启动,数据复制管理功能自动恢复,无需人工额外干预;同时,多个虚机操作系统并入并行耦合系统时,要控制并入的并发,以避免多个虚机加入并行耦合系统(集群)时引发的对于并行耦合系统全局锁的争抢行为,避免影响连机交易性能。
S202、对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进。
需要说明的是,在交易中间件路由控制器进程发生重新启动的情况下,每台网关都需要进行重新启动以恢复其与主机交易中间件路由控制器的逻辑单元的重建;在重建逻辑单元过程中,网关会尝试该网关与每一个交易中间件路由控制器的逻辑单元个数尽量相同以实现均衡,对于新启动的中间件路由控制器,因其上暂无逻辑单元分布,网关重启操作将导致新建立的逻辑单元全部建立在新启动的交易路由控制器上;网关重启后所有中间件路由控制器上分布的逻辑单元在个数虽然相同,但并未达到每台网关与所有的中间件路由控制器的全连接的目标。
逻辑单元未与所有中间件路由控制器全连接保持连接的状态,将导致后台主机上各业务虚机承担的压力产生差异,物理主机计算资源也不能得到重分利用,最终引起交易性能下降,响应时间增长。
已有的解决方法是,在完成全部中间件路由控制器重启后,对所有网关进行全下全启操作,但这种方法在网关重启阶段内交易无法经过网关送到主机,此时段内系统无法对外提供服务,引起业务中断停机情况的发生。
为避免全下全启网关引起的停机问题,同时实现每台网关与主机所有中间件路由控制器以全连接、且在每个中间件路由控制器中逻辑单元数量相同分布均匀的目标,在本申请的另一实施例中,步骤S202的一种实施方式,如图6所示,包括:
S601、预留m台网关不进行重启操作以保证业务可用性,对其余n-m网关进行下机操作。
其中,共有n台网关设备与网关主机以SNA协议进行连接,n和m属于正整数,且m<n/2。
S602、启动已被下机的网关中的m台网关主机,新启动的m台网关主机重建逻辑单元。
需要说明的是,将使得主机端所有交易路由控制器上的逻辑单元个数相同,此时每台网关只连接到了主机一半的交易路由控制器上,全连接目标尚未满足。
S603、启动处于关机状态的n-2m台网关主机。
其中,n-2m台网关主机在重建逻辑单元过程中将向所有交易路由控制器发起均匀的逻辑单元新建请求。
因为当前每一个交易路由控制器上的逻辑单元个数已经相同,则n-2m台网关主机在重建逻辑单元过程中将向所有交易路由控制器发起均匀的逻辑单元新建请求,新启动的n-2m台网关启动后达到了与所有交易路由控制器的全连接状态,且在每一个交易路由控制器上分布的逻辑单元个数达到均衡。
S604、对从未重启过的m台网关进行重启操作。
需要说明的是,从未重启过的m台网关在重启后新建的逻辑单元也达到全连接状态,且在各交易路由控制器上的逻辑单元个数分布相同。
S605、第二次重启已被启动过一次的m台网关主机。
需要说明的是,第二次重启已被启动过一次的m台网关主机后,这m台网关在重启后新建的逻辑单元也达到全连接状态,且在各交易路由控制器上的逻辑单元个数相同。
当所有网关重启完成,在未采用全下全启的情况下,所有网关主机以全连接方式实现了与所有交易路由控制器的逻辑单元的重建,同时每台网关主机在每一个交易路由控制器的逻辑单元分布个数实现了均衡,网关未发生全下全启实现了业务连续性要求;为确保网关重启操作对交易影响最小,可选的,多台网关的下机过程可串序执行。
S103、对新版本软件的第一批次虚机进行功能正确性验证。
S104、若新版本软件的第一批次虚机进行功能正确性验证通过,对第二批次虚机进行旧版本软件向新版本软件的投产切换。
需要说明的是,本申请在实际的应用过程中,还会在投产各阶段制定灵活的决策方案和有针对性的应急回退方案,确保升级投产项目的正常实施,使得决策有依据,应急方案准确有效。
在第一批次虚机投产切换过程中,若遇到不能马上定位根因,在较短时间内无法解决的问题,导致虚机无法正常启动,则马上停止升级投产实施,回退已升级部分虚机。
在已完成第一批次虚机中所有虚机的投产切换后,并行耦合系统处于混存状态对外运行时遇到不能马上定位根因,在较短时间内无法解决的问题,对交易产生影响,则马上隔离已投产虚机,回退第一批次已升级虚机。
若所有虚机投产切换已完成,在并行耦合系统以全量升级状态时对外试运行阶段内遇到不能马上定位根因,在较短时间内无法解决的问题,则马上隔离所有已投产虚机,回退全部已升级虚机。
需要说明的是,在本申请的具体实现过程中,回退方案包括但不限于以下方案:
回退方案1:
1)关闭已新版本启动的业务虚机、网络虚机、数据虚机;
2)以旧版本软件启动虚机,并入新启动虚机;
3)网关重启。
回退方案2:
1)隔离第一批次已采用新版本软件投产的业务虚机、网络虚机、数据虚机;
2)以旧版本软件启动第一批次投产的所有虚机,并入新启动虚机;
3)网关重启。
回退方案3:
1)停止网关;
2)关闭第一个网络虚机;
3)以旧版本软件启动第一个网络虚机,完成第一个网络虚机并入;
4)关闭剩余全部虚机;
5)以旧版本软件启动除第一个网络虚机外的所有虚机,完成虚机并入;
6)网关重启。
由以上方案可知,本申请提供一种软件的升级投产方法:首先,按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,虚机的功能类型分为业务、网络以及数据;然后,对第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;对新版本软件的第一批次虚机进行功能正确性验证;若新版本软件的第一批次虚机进行功能正确性验证通过,对第二批次虚机进行旧版本软件向新版本软件的投产切换。有效减少投产切换带来的影响,提高用户的使用体验。
在本申请的另一实施例中,软件的升级投产装置的一种实施方式,如图7所示,包括:
拆分单元701,用于按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机。
其中,虚机的功能类型分为业务、网络以及数据。
第一投产切换单元702,用于对第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机。
其中,新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务。
验证单元703,用于对新版本软件的第一批次虚机进行功能正确性验证。
第二投产切换单元704,用于若新版本软件的第一批次虚机进行功能正确性验证通过,对第二批次虚机进行旧版本软件向新版本软件的投产切换。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图1所示,此处不再赘述。
可选的,在本申请的另一实施例中,软件的升级投产装置的一种实施方式,还包括:
第一分析单元,用于针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果。
其中,操作方案分为隔离操作方案和并入操作方案。
第二分析单元,用于对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图2所示,此处不再赘述。
可选的,在本申请的另一实施例中,虚机的功能类型为业务虚机,第一分析单元的一种实施方式,还包括:
第一关闭单元,用于若操作方案为隔离操作方案,则在主机侧将交易中间件应用程序控制器置为静止状态,并在交易中件间路由控制器中将网关至交易中件间路由控制器的路由策略关闭。
第二关闭单元,用于在网关侧,关闭与已关闭路由策略的交易路由控制器的主机平台网络协议层的逻辑单元。
第三关闭单元,用于在主机侧,关闭交易中间件路由控制器对应的进程。
第四关闭单元,用于在主机侧,关闭交易中间件应用程序控制器进程,隔离业务虚机的业务中间件。
第五关闭单元,用于关闭数据库进程,隔离业务虚机的数据库软件。
第一隔离单元,用于将多个业务虚机从并行耦合系统中逐个依次进行隔离。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图3所示,此处不再赘述。
可选的,在本申请的另一实施例中,第一分析单元的一种实施方式,还包括:
带起单元,用于若操作方案为并入操作方案,则以新版本介质启动业务虚机操作系统,不自动带起主机平台关系型数据库系统软件和交易中间件软件。
第一控制单元,用于控制多个业务虚机逐个并入并行耦合系统。
第二控制单元,用于控制多个业务虚机上的数据库实例启动的并发,串序启动。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图4所示,此处不再赘述。
可选的,在本申请的另一实施例中,虚机的功能类型为网络虚机,第一分析单元的一种实施方式,还包括:
第一切换单元,用于若操作方案为隔离操作方案,则将网络虚机中处于活跃状态的依赖型逻辑单元请求者连接切换至另一台网络虚机上运行。
第二切换单元,用于将处于活跃状态的节点间控制点会话切换至另一台网络虚机上运行。
第一激死单元,用于在主机侧将各网关节点对应的物理单元和逻辑单元依次激死。
第二激死单元,用于在主机侧将各网关节点对应的控制点激死。
第二隔离单元,用于将多个网络虚机从并行耦合系统中逐个依次进行隔离。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图5所示,此处不再赘述。
可选的,在本申请的另一实施例中,虚机的功能类型为网络虚机,第一分析单元的一种实施方式,还包括:
第三控制单元,用于若操作方案为并入操作方案,控制多个网络虚机逐个并入并行耦合系统。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,虚机的功能类型为数据虚机,第一分析单元的一种实施方式,还包括:
第三隔离单元,用于若操作方案为隔离操作方案,则将多个数据虚机从并行耦合系统中逐个依次进行隔离。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,虚机的功能类型为数据虚机,第一分析单元的一种实施方式,还包括:
第四控制单元,用于若操作方案为并入操作方案,控制多个数据虚机逐个并入并行耦合系统。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,第二分析单元的一种实施方式,还包括:
下机单元,用于预留m台网关不进行重启操作以保证业务可用性,对其余n-m网关进行下机操作。
其中,共有n台网关设备与网关主机以SNA协议进行连接,n和m属于正整数,且m<n/2。
第一启动单元,用于启动已被下机的网关中的m台网关主机,新启动的m台网关主机重建逻辑单元。
第二启动单元,用于启动处于关机状态的n-2m台网关主机。
其中,n-2m台网关主机在重建逻辑单元过程中将向所有交易路由控制器发起均匀的逻辑单元新建请求。
第一重启单元,用于对从未重启过的m台网关进行重启操作。
第二重启单元,用于第二次重启已被启动过一次的m台网关主机。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图6所示,此处不再赘述。
可选的,在本申请的另一实施例中,软件的升级投产装置的一种实施方式,还包括:
第一回退单元,用于在第一批次虚机投产切换过程中,若遇到不能马上定位根因,在较短时间内无法解决的问题,导致虚机无法正常启动,则马上停止升级投产实施,回退已升级部分虚机。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,软件的升级投产装置的一种实施方式,还包括:
第二回退单元,用于在已完成第一批次虚机中所有虚机的投产切换后,并行耦合系统处于混存状态对外运行时遇到不能马上定位根因,在较短时间内无法解决的问题,对交易产生影响,则马上隔离已投产虚机,回退第一批次已升级虚机。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,软件的升级投产装置的一种实施方式,还包括:
第三回退单元,用于若所有虚机投产切换已完成,在并行耦合系统以全量升级状态时对外试运行阶段内遇到不能马上定位根因,在较短时间内无法解决的问题,则马上隔离所有已投产虚机,回退全部已升级虚机。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
由以上方案可知,本申请提供一种软件的升级投产装置:首先,拆分单元701按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,虚机的功能类型分为业务、网络以及数据;然后,第一投产切换单元702对第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;验证单元703对新版本软件的第一批次虚机进行功能正确性验证;若新版本软件的第一批次虚机进行功能正确性验证通过,第二投产切换单元704对第二批次虚机进行旧版本软件向新版本软件的投产切换。有效减少投产切换带来的影响,提高用户的使用体验。
在本申请公开的上述实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,直播设备,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种软件的升级投产方法,其特征在于,包括:
按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,所述虚机的功能类型分为业务、网络以及数据;
对所述第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,所述新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;
对所述新版本软件的第一批次虚机进行功能正确性验证;
若所述新版本软件的第一批次虚机进行功能正确性验证通过,对所述第二批次虚机进行旧版本软件向新版本软件的投产切换。
2.根据权利要求1所述的升级投产方法,其特征在于,还包括:
针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果;其中,所述操作方案分为隔离操作方案和并入操作方案;
对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进。
3.根据权利要求2所述的升级投产方法,其特征在于,虚机的功能类型为业务虚机,所述针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果,包括:
若操作方案为隔离操作方案,则在主机侧将交易中间件应用程序控制器置为静止状态,并在交易中件间路由控制器中将网关至所述交易中件间路由控制器的路由策略关闭;
在网关侧,关闭与已关闭路由策略的交易路由控制器的主机平台网络协议层的逻辑单元;
在主机侧,关闭所述交易中间件路由控制器对应的进程;
在主机侧,关闭所述交易中间件应用程序控制器进程,隔离业务虚机的业务中间件;
关闭数据库进程,隔离业务虚机的数据库软件;
将多个业务虚机从并行耦合系统中逐个依次进行隔离;
若操作方案为并入操作方案,则以新版本介质启动业务虚机操作系统,不自动带起主机平台关系型数据库系统软件和交易中间件软件;
控制多个业务虚机逐个并入并行耦合系统;
控制多个业务虚机上的数据库实例启动的并发,串序启动。
4.根据权利要求2所述的升级投产方法,其特征在于,虚机的功能类型为网络虚机,所述针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果,包括:
若操作方案为隔离操作方案,则将网络虚机中处于活跃状态的依赖型逻辑单元请求者连接切换至另一台网络虚机上运行;
将处于活跃状态的节点间控制点会话切换至另一台网络虚机上运行;
在主机侧将各网关节点对应的物理单元和逻辑单元依次激死;
在主机侧将各网关节点对应的控制点激死;
将多个网络虚机从并行耦合系统中逐个依次进行隔离;
若操作方案为并入操作方案,控制多个网络虚机逐个并入并行耦合系统。
5.根据权利要求2所述的升级投产方法,其特征在于,虚机的功能类型为数据虚机,所述针对每一种功能类型的虚机在投产切换过程中的操作方案进行分析,分别得到每一种功能类型的虚机在投产切换过程中的操作方案优化调整结果,包括:
若操作方案为隔离操作方案,则将多个数据虚机从并行耦合系统中逐个依次进行隔离;
若操作方案为并入操作方案,控制多个数据虚机逐个并入并行耦合系统。
6.根据权利要求2所述的升级投产方法,其特征在于,所述对网关重启进行分析,得到网关重启影响程度,并对网关重启方法进行改进,包括:
预留m台网关不进行重启操作以保证业务可用性,对其余n-m网关进行下机操作;其中,共有n台网关设备与网关主机以SNA协议进行连接,n和m属于正整数,且m<n/2;
启动已被下机的网关中的m台网关主机,新启动的m台网关主机重建逻辑单元;
启动处于关机状态的n-2m台网关主机,其中,所述n-2m台网关主机在重建逻辑单元过程中将向所有交易路由控制器发起均匀的逻辑单元新建请求;
对从未重启过的m台网关进行重启操作;
第二次重启已被启动过一次的m台网关主机。
7.根据权利要求1所述的升级投产方法,其特征在于,包括:
在第一批次虚机投产切换过程中,若遇到不能马上定位根因,在较短时间内无法解决的问题,导致虚机无法正常启动,则马上停止升级投产实施,回退已升级部分虚机。
8.据权利要求1所述的升级投产方法,其特征在于,包括:
在已完成第一批次虚机中所有虚机的投产切换后,并行耦合系统处于混存状态对外运行时遇到不能马上定位根因,在较短时间内无法解决的问题,对交易产生影响,则马上隔离已投产虚机,回退第一批次已升级虚机。
9.据权利要求1所述的升级投产方法,其特征在于,包括:
若所有虚机投产切换已完成,在并行耦合系统以全量升级状态时对外试运行阶段内遇到不能马上定位根因,在较短时间内无法解决的问题,则马上隔离所有已投产虚机,回退全部已升级虚机。
10.一种软件的升级投产装置,其特征在于,包括:
拆分单元,用于按照虚机的功能类型将并行耦合系统内多个虚机进行拆分,得到第一批次虚机和第二批次虚机;其中,所述虚机的功能类型分为业务、网络以及数据;
第一投产切换单元,用于对所述第一批次虚机进行旧版本软件向新版本软件的投产切换,得到新版本软件的第一批次虚机;其中,所述新版本软件的第一批次虚机和第二批次的虚机同时对外提供服务;
验证单元,用于对所述新版本软件的第一批次虚机进行功能正确性验证;
第二投产切换单元,用于若所述新版本软件的第一批次虚机进行功能正确性验证通过,对所述第二批次虚机进行旧版本软件向新版本软件的投产切换。
CN202211063592.2A 2022-09-01 2022-09-01 软件的升级投产方法及装置 Pending CN115408037A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211063592.2A CN115408037A (zh) 2022-09-01 2022-09-01 软件的升级投产方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211063592.2A CN115408037A (zh) 2022-09-01 2022-09-01 软件的升级投产方法及装置

Publications (1)

Publication Number Publication Date
CN115408037A true CN115408037A (zh) 2022-11-29

Family

ID=84163640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211063592.2A Pending CN115408037A (zh) 2022-09-01 2022-09-01 软件的升级投产方法及装置

Country Status (1)

Country Link
CN (1) CN115408037A (zh)

Similar Documents

Publication Publication Date Title
EP2274673B9 (en) Methods and systems for embedding upgrade steps for layered architectures
US9960963B2 (en) Dynamic client fail-over during a rolling patch installation based on temporal server conditions
EP3459211B1 (en) High-availability network controller
US20070043972A1 (en) Systems and methods for split mode operation of fault-tolerant computer systems
US7953890B1 (en) System and method for switching to a new coordinator resource
US20190386893A1 (en) Fault Rectification Method, Device, and System
CN103176831B (zh) 一种虚拟机系统及其管理方法
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
CN110224871A (zh) 一种Redis集群的高可用方法及装置
US20030204772A1 (en) System and method for concurrent logical device swapping
US20080082630A1 (en) System and method of fault tolerant reconciliation for control card redundancy
JP3808874B2 (ja) 分散システム及び多重化制御方法
CN112380062A (zh) 一种基于系统备份点多次快速恢复系统的方法及系统
US7373542B2 (en) Automatic startup of a cluster system after occurrence of a recoverable error
CN113646749A (zh) Iot分区管理和负载平衡
CN101996083A (zh) 一种镜像升级的方法和装置
CN105915391A (zh) 基于单阶段提交并具备自恢复功能的分布式键值存储方法
CN114116144B (zh) 一种轻量级全局事务管理器及其控制方法
CN105959145A (zh) 一种适用高可用性集群的并行管理服务器的方法及系统
CN108984602B (zh) 一种数据库控制方法和数据库系统
CN115408037A (zh) 软件的升级投产方法及装置
CN104866380B (zh) 一种集群管理系统的状态转换的处理方法和装置
CN115408039A (zh) 一种超融合系统的虚拟机系统升级不中断控制方法及系统
CN101155061B (zh) 一种主备控制方法
CN106776997A (zh) 一种数据库的迁移方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination