CN103391212B - 一种资源管理的容错方法和装置 - Google Patents

一种资源管理的容错方法和装置 Download PDF

Info

Publication number
CN103391212B
CN103391212B CN201210146614.1A CN201210146614A CN103391212B CN 103391212 B CN103391212 B CN 103391212B CN 201210146614 A CN201210146614 A CN 201210146614A CN 103391212 B CN103391212 B CN 103391212B
Authority
CN
China
Prior art keywords
resource
abstract
resources
idle
actual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210146614.1A
Other languages
English (en)
Other versions
CN103391212A (zh
Inventor
尚海涛
王仁坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210146614.1A priority Critical patent/CN103391212B/zh
Publication of CN103391212A publication Critical patent/CN103391212A/zh
Application granted granted Critical
Publication of CN103391212B publication Critical patent/CN103391212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种资源管理的容错方法,包括:抽象资源申请失败时,判断是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值;向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。本发明还同时公开了一种资源管理的容错装置,运用该方法和装置可避免通过系统复位来解决资源申请失败、或资源挂死等问题,系统稳定性和用户体验均得到提高。

Description

一种资源管理的容错方法和装置
技术领域
本发明涉及通信系统中的资源管理技术,尤其涉及一种资源管理的容错方法和装置。
背景技术
在通信系统中,资源管理主要是指根据业务的建立和删除而引起的对资源的申请和释放操作。如果被管理的资源数据区出现异常,会造成资源管理的混乱,从而出现资源申请失败、或资源挂死等问题,最终导致业务失败。如果不能及时解决这些问题、或者资源挂死的数目逐渐增多,将造成通信系统无法继续提供服务的严重后果。所以,资源管理一直处于各个通信网络子系统中的核心位置,资源管理算法的稳定性是整个通信系统稳定性的保证。
目前,如果出现资源挂死、或申请资源失败的情况,通常只能通过系统复位的方式来解决,即:将系统中的所有资源进行初始化。但是,系统复位会导致用户终端掉线等问题,系统很不稳定,严重影响用户体验。
发明内容
有鉴于此,本发明的主要目的在于提供一种资源管理的容错方法和装置,可避免通过系统复位来解决资源申请失败、或资源挂死等问题,系统稳定性和用户体验均得到提高。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种资源管理的容错方法,该方法包括:
抽象资源申请失败时,判断是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值;向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。
该方法还包括:在申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息。
其中,所述向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复,为:
根据已损坏抽象资源的ID向实际资源区查询与所述抽象资源的ID相同的实际资源的状态,得到查询响应后,将抽象资源的状态信息更新为与实际资源相同的状态信息,并根据实际资源的相关参数重新计算抽象资源的校验信息。
该方法还包括:确定没有空闲抽象资源时,则提示资源不足,当前业务结束。
该方法还包括:如果空闲抽象资源未损坏,则将空闲抽象资源放入空闲抽象资源区。
其中,所述抽象资源申请前,该方法还包括:对抽象资源和实际资源进行初始化。
本发明还提供了一种资源管理的容错装置,该装置包括:判断处理模块、查询恢复模块和存储模块;其中,
所述存储模块,用于存储抽象资源和实际资源;
所述判断处理模块,用于抽象资源申请失败时,判断存储模块中是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值,并触发查询恢复模块;
所述查询恢复模块,用于被触发后,向存储模块中的实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。
其中,所述判断处理模块,还用于在申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息。
其中,所述判断处理模块,还用于确定没有空闲抽象资源时,提示资源不足,当前业务结束;
所述判断处理模块,还用于确定空闲抽象资源未损坏时,将空闲抽象资源放入空闲抽象资源区。
该装置还包括初始化模块,用于抽象资源申请前,对存储模块中的抽象资源和实际资源进行初始化。
本发明提供的资源管理的容错方法和装置,抽象资源申请失败时,判断是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值;向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。本发明在发现抽象资源区中的资源申请失败后,自动启动容错处理机制,先后通过异常检测、异常查询以及异常恢复的处理过程完成已损坏抽象资源的自动恢复。这种处理机制能及时、主动地发现资源管理中的数据异常信息,而不需采取系统复位的方式解决资源申请失败、或资源挂死等问题,因此可提高系统的稳定性,同时用户体验也得到提高。
附图说明
图1为本发明资源管理容错方法实施例的流程示意图;
图2为本发明资源管理容错装置实施例的结构示意图。
具体实施方式
本发明的基本思想是:抽象资源申请失败时,判断是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值;向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。
其中,所述资源申请前还包括:对抽象资源和实际资源进行初始化。
这里,如果已没有抽象资源,则提示资源不足,当前业务结束。
进一步地,申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息。
下面以静态单向链表式资源为例,并结合附图及具体实施例对本发明作进一步详细说明。
图1为本发明资源管理容错方法实施例的流程示意图,如图1所示,包括如下步骤:
步骤101:对抽象资源和实际资源进行初始化;
具体为:将抽象资源进行初始化,构建空闲资源区,并把抽象资源的状态信息和校验信息置为初始值;将实际资源进行初始化,并将其状态信息置为初始值。
这里需要说明的是,在现有通信系统的资源管理技术中,均通过与实际资源对应设置的抽象资源实现资源的管理。下面简要介绍设置方法:
设静态单向链表式资源共计N个,一次业务只消耗一个资源。为N个实际静态单向链表式资源对应设置N个抽象资源,实际资源和抽象资源通过数组下标ID值0~N-1直接映射。抽象资源携带状态信息和校验信息,实际资源携带状态信息。例如:如果资源已被占用,则状态信息为1;若资源空闲,则状态信息为0;所述校验信息值是根据资源的相关参数采用已有的算法计算所得的,每次处理,如占用抽象资源后,其对应的校验信息值都会变化。
进一步地,在申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息;
具体为:业务建立时,申请一个空闲资源,则从静态单向链表中取出资源,所述资源为抽象资源,并对应修改抽象资源的状态信息和校验信息,空闲资源个数,同时修改实际资源的状态信息;
业务删除时,抽象资源放回空闲链表,同时修改抽象资源的状态信息和校验信息,空闲资源个数,并修改实际资源的状态信息。
步骤102:抽象资源申请失败时,判断是否还有空闲抽象资源,如果有,则执行步骤103;否则,则执行步骤104;
具体为:抽象资源申请失败时,根据空闲抽象资源个数,即根据抽象资源的状态信息判断链表中是否还有空闲抽象资源,如果有,则执行步骤103;否则,则执行步骤104。
步骤103:根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则执行步骤105,并在之后执行步骤106;否则,执行步骤107;
具体为:根据抽象资源携带的校验信息判断链表中各未被占用的空闲的抽象资源是否已损坏,这里可根据已有算法,如循环冗余校验(CRC)算法依据资源的相关参数重新计算检验信息的值是否正确,例如:对于一个初始化后未被占用过的抽象资源,其对应的校验信息初始值为A,如果重新计算后其对应的校验信息值为C,则表明该抽象资源已损坏,则执行步骤105,将该抽象资源的状态信息置为无效值,之后执行步骤106;否则,执行步骤107。
步骤104:提示资源不足,当前业务结束;
步骤105:将空闲抽象资源的状态信息置为无效值;
步骤106:向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复;
具体为:根据已损坏抽象资源的ID向实际资源区查询与所述抽象资源的ID相同的实际资源的状态,得到查询响应之后,根据响应的状态信息对抽象资源进行恢复处理,即:将抽象资源的状态信息更新为与实际资源相同的状态信息,同时,根据实际资源的相关参数重新计算抽象资源的校验信息,至此,恢复过程结束。
这里,所述恢复处理操作之后,再次尝试分配抽象资源。
步骤107:将空闲抽象资源放入空闲抽象资源区。
结合上述方法,本发明还提供了一种资源管理容错装置,如图2所示,包括:判断处理模块、查询恢复模块和存储模块;其中,
所述存储模块,用于存储抽象资源和实际资源;
所述判断处理模块,用于抽象资源申请失败时,判断存储模块中是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值,并触发查询恢复模块;
所述查询恢复模块,用于被触发后,向存储模块中的实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。
所述判断处理模块,还用于在申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息。
所述判断处理模块,还用于确定没有空闲抽象资源时,提示资源不足,当前业务结束。
所述判断处理模块,还用于确定空闲抽象资源未损坏时,将空闲抽象资源放入空闲抽象资源区。
该装置还包括初始化模块,用于抽象资源申请前,对存储模块中的抽象资源和实际资源进行初始化。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种资源管理的容错方法,其特征在于,该方法包括:
抽象资源申请失败时,判断是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值;向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。
2.根据权利要求1所述的资源管理的容错方法,其特征在于,该方法还包括:在申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息。
3.根据权利要求1或2所述的资源管理的容错方法,其特征在于,所述向实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复,为:
根据已损坏抽象资源的标识码ID向实际资源区查询与所述抽象资源的ID相同的实际资源的状态,得到查询响应后,将抽象资源的状态信息更新为与实际资源相同的状态信息,并根据实际资源的相关参数重新计算抽象资源的校验信息。
4.根据权利要求1或2所述的资源管理的容错方法,其特征在于,该方法还包括:确定没有空闲抽象资源时,则提示资源不足,当前业务结束。
5.根据权利要求1或2所述的资源管理的容错方法,其特征在于,该方法还包括:如果空闲抽象资源未损坏,则将空闲抽象资源放入空闲抽象资源区。
6.根据权利要求1或2所述的资源管理的容错方法,其特征在于,所述抽象资源申请前,该方法还包括:对抽象资源和实际资源进行初始化。
7.一种资源管理的容错装置,其特征在于,该装置包括:判断处理模块、查询恢复模块和存储模块;其中,
所述存储模块,用于存储抽象资源和实际资源;
所述判断处理模块,用于抽象资源申请失败时,判断存储模块中是否还有空闲抽象资源,如果有,则根据已设置的校验信息判断所述空闲抽象资源是否已损坏,如果已损坏,则将空闲抽象资源的状态信息置为无效值,并触发查询恢复模块;
所述查询恢复模块,用于被触发后,向存储模块中的实际资源区查询所述已损坏抽象资源的实际状态,根据查询结果对已损坏抽象资源进行恢复。
8.根据权利要求7所述的资源管理的容错装置,其特征在于,所述判断处理模块,还用于在申请或释放抽象资源时,对应修改抽象资源的状态信息和校验信息,以及实际资源的状态信息。
9.根据权利要求7或8所述的资源管理的容错装置,其特征在于,所述判断处理模块,还用于确定没有空闲抽象资源时,提示资源不足,当前业务结束;
所述判断处理模块,还用于确定空闲抽象资源未损坏时,将空闲抽象资源放入空闲抽象资源区。
10.根据权利要求7或8所述的资源管理的容错装置,其特征在于,该装置还包括初始化模块,用于抽象资源申请前,对存储模块中的抽象资源和实际资源进行初始化。
CN201210146614.1A 2012-05-11 2012-05-11 一种资源管理的容错方法和装置 Active CN103391212B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210146614.1A CN103391212B (zh) 2012-05-11 2012-05-11 一种资源管理的容错方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210146614.1A CN103391212B (zh) 2012-05-11 2012-05-11 一种资源管理的容错方法和装置

Publications (2)

Publication Number Publication Date
CN103391212A CN103391212A (zh) 2013-11-13
CN103391212B true CN103391212B (zh) 2016-08-24

Family

ID=49535376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210146614.1A Active CN103391212B (zh) 2012-05-11 2012-05-11 一种资源管理的容错方法和装置

Country Status (1)

Country Link
CN (1) CN103391212B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1337623A (zh) * 2000-08-03 2002-02-27 国际商业机器公司 通过资源恢复得到系统最优可用性的方法和系统
CN1474275A (zh) * 2002-08-06 2004-02-11 中国科学院计算技术研究所 基于虚拟存储的智能网络存储设备的系统
US6768901B1 (en) * 2000-06-02 2004-07-27 General Dynamics Decision Systems, Inc. Dynamic hardware resource manager for software-defined communications system
CN101167307A (zh) * 2005-10-10 2008-04-23 中兴通讯股份有限公司 一种可动态自适应的分布式资源管理系统和方法
CN102123176A (zh) * 2011-03-17 2011-07-13 杭州宏杉科技有限公司 一种网络存储系统空间分配管理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6768901B1 (en) * 2000-06-02 2004-07-27 General Dynamics Decision Systems, Inc. Dynamic hardware resource manager for software-defined communications system
CN1337623A (zh) * 2000-08-03 2002-02-27 国际商业机器公司 通过资源恢复得到系统最优可用性的方法和系统
CN1474275A (zh) * 2002-08-06 2004-02-11 中国科学院计算技术研究所 基于虚拟存储的智能网络存储设备的系统
CN101167307A (zh) * 2005-10-10 2008-04-23 中兴通讯股份有限公司 一种可动态自适应的分布式资源管理系统和方法
CN102123176A (zh) * 2011-03-17 2011-07-13 杭州宏杉科技有限公司 一种网络存储系统空间分配管理方法及装置

Also Published As

Publication number Publication date
CN103391212A (zh) 2013-11-13

Similar Documents

Publication Publication Date Title
CN107493290B (zh) Android智能电视系统软件进行OTA升级的方法
CN104679534B (zh) 系统应用安装包加载处理方法、装置及终端
CN106533805B (zh) 一种微服务请求处理方法、微服务控制器及微服务架构
CN101977127B (zh) 基于snmp的设备配置回滚方法以及snmp网管设备
WO2013123829A1 (zh) 安装软件的方法、设备及系统
CN105607972B (zh) 一种异常修复的方法及装置
EP2600565B1 (en) Disaster tolerance service system and disaster tolerance method
CN107153571A (zh) 一种虚拟化管理节点的部署方法及装置
CN107508694B (zh) 一种集群内的节点管理方法及节点设备
CN109491698A (zh) 基于热补丁的系统更新方法及装置
CN102262574A (zh) 操作系统启动保护方法和装置
CN106775610A (zh) 一种电子设备启动方法及一种电子设备
US20170212815A1 (en) Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program
CN102214287A (zh) Windows系统注册表保护方法
CN106559267A (zh) Redis的主从切换方法、装置及redis系统
CN101996083A (zh) 一种镜像升级的方法和装置
EP2378434B1 (en) Mehtod and device of multiple disks grouping hot standby in distributed file system
CN102073523B (zh) 实现软件版本同步的方法及装置
CN104184614B (zh) 一种配置回滚方法及装置
CN105335244B (zh) 用于应用程序恢复的方法
WO2013167010A2 (zh) 一种移动终端及其开机方法
CN109670296A (zh) 一种移除iOS备份密码的方法和装置
CN103391212B (zh) 一种资源管理的容错方法和装置
CN101202671A (zh) 端口配置方法及装置
CN104504348B (zh) 一种基于高可用存储系统的数据保护方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant