CN105446818B - 一种业务处理的方法、相关装置以及系统 - Google Patents

一种业务处理的方法、相关装置以及系统 Download PDF

Info

Publication number
CN105446818B
CN105446818B CN201510964596.1A CN201510964596A CN105446818B CN 105446818 B CN105446818 B CN 105446818B CN 201510964596 A CN201510964596 A CN 201510964596A CN 105446818 B CN105446818 B CN 105446818B
Authority
CN
China
Prior art keywords
node device
parameter
dependability parameter
dependability
composer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510964596.1A
Other languages
English (en)
Other versions
CN105446818A (zh
Inventor
印杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510964596.1A priority Critical patent/CN105446818B/zh
Publication of CN105446818A publication Critical patent/CN105446818A/zh
Application granted granted Critical
Publication of CN105446818B publication Critical patent/CN105446818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5055Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering software capabilities, i.e. software resources associated or available to the machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/501Performance criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例公开了一种业务处理的方法,包括:获取节点设备的第一可靠性参数;接收节点设备发送的第二可靠性参数以及第三可靠性参数;根据第一可靠性参数、第二可靠性参数以及第三可靠性参数,计算节点设备的可靠性评估值,可靠性评估值用于确定目标业务的部署位置;根据可靠性评估值在至少一个所述节点设备上部署目标业务,以使至少一个节点设备执行目标业务。本发明实施例还提供一种编排器、节点设备以及系统。本发明实施例能够考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。

Description

一种业务处理的方法、相关装置以及系统
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种业务处理的方法、相关装置以及系统。
背景技术
目前,在云计算环境下,许多业务程序需要运行在虚拟机(英文全称:VirtualMachine,英文缩写:VM)里。请参阅图1,图1为本发明现有技术中云计算环境下的节点设备编排系统,当用户申请业务程序时,编排器需要决定在哪个节点设备上的VM中部署该业务,在决策过程中有一个重要的决策指标,即可靠性。每个节点设备的硬件和主机操作系统可能采用不同品牌的产品,而不同品牌的产品可靠性水平不一样,即使采用相同的产品,运行一段时间后,由于老化等问题,其可靠水平也不一样。编排器编排的过程中,应将重要业务部署在最可靠的节点设备。
现有技术中,可以通过节点设备生产厂商提供的原始可靠性水平参数来获取节点设备的可靠性;或者在节点设备运行过程中检测到故障信息,并根据故障信息确定节点设备的可靠性。编排器通过上述至少一种方式来评估节点设备的可靠性,从而将对可靠性要求较高的业务安排在高可靠性节点设备上。
然而,在现有技术中对节点设备可靠性评估还是依赖于节点设备自身对故障的检测。在实际应用中,节点设备可能无法检测出某些故障,故障却已经对在VM中运行的业务产生了影响。由于该节点设备无法检测出该故障,因此编排器依然可能分配信道业务到此节点设备,从而造成业务损失。
发明内容
本发明实施例提供了一种业务处理的方法、相关装置以及系统,能够考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
有鉴于此,本发明第一方面提供一种业务处理的方法,包括:
编排器获取节点设备的第一可靠性参数;
编排器接收节点设备发送的第二可靠性参数以及第三可靠性参数;
编排器根据第一可靠性参数、第二可靠性参数以及第三可靠性参数,计算节点设备的可靠性评估值,可靠性评估值用于确定目标业务的部署位置;
编排器根据可靠性评估值在至少一个节点设备上部署目标业务,以使至少一个节点设备执行所述目标业务。
其中,第一可靠性参数可以是预先获取的,也可以是用户直接通过产品说明书来确定的相关参数。
本发明实施例中,提供了一种业务处理的方法,编排器可以根据获取到的第一可靠性参数,和接收到的第二可靠性参数以及第三可靠性参数,来计算节点设备的可靠性评估值,并根据不同的可靠性评估值来决策不同的目标业务应该部署在哪些节点设备上。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
结合本发明实施例的第一方面,在第一种可能的实现方式中,第一可靠性参数包括节点设备的原始可靠性水平参数,第二可靠性参数包括节点设备发送的节点设备故障参数,第三可靠性参数包括节点设备发送的业务故障参数。
第二可靠性参数为节点设备发送的节点设备故障参数,具体地,节点设备故障参数是指节点设备在运行过程中检测到的故障信息,并根据该故障信息生成一个对应的节点设备故障参数。
其次,本发明实施例中,具体对第一可靠性参数、第二可靠性参数以及第三可靠性参数进行了介绍,第一可靠性参数即为节点设备的原始可靠性水平参数,第二可靠性参数为节点设备发送的节点设备故障参数,上述两种参数在现有技术中也可作为计算可靠性评估值的依据,然而第三可靠性参数,即业务故障参数,则是本发明实施例中所采用的另一个计算可靠性评估值的重要依据,综合而言,根据业务故障参数后可以更准确地了解各个节点设备上运行业务的能力,从而将其作为计算可靠性评估值的一个重要参数,可以更好的提升对节点可靠性评估的准确性,有利于更准确的部署业务,提升业务的使用效率,增强方案的可行性和灵活性。
本发明第二方面提供一种业务处理的方法,包括:
节点设备向编排器发送第二可靠性参数以及第三可靠性参数,以使编排器根据第一可靠性参数、第二可靠性参数以及第三可靠性参数计算可靠性评估值,可靠性评估值用于确定目标业务的部署位置;
节点设备根据编排器确定的目标业务的部署位置,执行目标业务。
本发明实施例中,提供了一种业务处理的方法,节点设备向编排器发送第二可靠性参数以及第三可靠性参数,以使编排器根据第一可靠性参数、第二可靠性参数以及第三可靠性参数计算可靠性评估值,可靠性评估值用于确定目标业务的部署位置,最后根据编排器确定的目标业务的部署位置,在部署位置对应的节点设备上执行目标业务。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
结合本发明实施例的第二方面,在第一种可能的实现方式中,第一可靠性参数包括节点设备的原始可靠性水平参数,第二可靠性参数包括节点设备发送的节点设备故障参数,第三可靠性参数包括所述节点设备发送的业务故障参数。
其次,本发明实施例中,具体对第一可靠性参数、第二可靠性参数以及第三可靠性参数进行了介绍,第一可靠性参数即为节点设备的原始可靠性水平参数,第二可靠性参数为节点设备发送的节点设备故障参数,上述两种参数在现有技术中也可作为计算可靠性评估值的依据,然而第三可靠性参数,即业务故障参数,则是本发明实施例中所采用的另一个计算可靠性评估值的重要依据,综合而言,根据业务故障参数后可以更准确地了解各个节点设备上运行业务的能力,从而将其作为计算可靠性评估值的一个重要参数,可以更好的提升对节点可靠性评估的准确性,有利于更准确的部署业务,提升业务的使用效率,增强方案的可行性和灵活性。
结合本发明实施例的第二方面或第二方面第一种可能实现方式,在第二种可能的实现方式中,节点设备向编排器发送第二可靠性参数之前,方法还包括:
当检测到节点设备出现故障时,节点设备生成故障信息对应的第二可靠性参数。
再次,本发明实施例中,具体说明了如何得到第二可靠性参数。第二可靠性参数为节点设备发送的节点设备故障参数,也就是在节点检测到自身出现故障时,生成一个节点设备故障参数,从而将该参数发送至编排器,使得编排器根据节点设备故障参数来评估节点设备的可靠性,由此,增强方案的可行性。
结合本发明实施例的第二方面或第二方面第一种可能实现方式,在第三种可能的实现方式中,向编排器发送第三可靠性参数之前,方法还包括:
节点设备获取节点设备上故障业务的数目以及节点设备上运行的总业务的数目;
节点设备根据节点设备上故障业务的数目以及节点设备上运行的总业务的数目,计算第三可靠性参数。
再次,本发明实施例中,具体说明了如何得到第三可靠性参数。第三可靠性参数为节点设备发送的业务故障参数。在现有技术中,并未考虑到利用该业务故障参数来评估节点设备的可靠性。由于某些节点设备自身无法检测是否存在业务故障,因此需要节点设备内部的VM做相应的业务故障检测,从而增强计算可靠性评估值的准确性。
本发明第三方面提供一种编排器,包括:
获取模块,用于获取节点设备的第一可靠性参数;
接收模块,用于接收所述节点设备发送的第二可靠性参数以及第三可靠性参数;
计算模块,用于根据所述获取模块获取的所述第一可靠性参数、所述接收模块接收的所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块,用于根据所述计算模块计算得到的所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务。
结合本发明实施例的第三方面,在第一种可能的实现方式中,第一可靠性参数包括节点设备的原始可靠性水平参数,第二可靠性参数包括节点设备发送的节点设备故障参数,第三可靠性参数包括节点设备发送的业务故障参数。
本发明第四方面提供一种节点设备,包括:
发送模块,用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块,用于根据所述编排器通过第一可靠性参数、所述发送模块发送的第二可靠性参数以及第三可靠性参数,确定的所述目标业务的部署位置,执行所述目标业务。
结合本发明实施例的第四方面,在第一种可能的实现方式中,第一可靠性参数包括节点设备的原始可靠性水平参数,第二可靠性参数包括节点设备发送的节点设备故障参数,第三可靠性参数包括节点设备发送的业务故障参数。
结合本发明实施例的第四方面或第四方面第一种可能实现方式,在第二种可能的实现方式中,节点设备还包括:
生成模块,用于发送模块向编排器发送第二可靠性参数之前,当检测到节点设备出现故障时,生成故障信息对应的第二可靠性参数。
结合本发明实施例的第四方面或第四方面第一种可能实现方式,在第三种可能的实现方式中,节点设备还包括:
获取模块,用于用于发送模块向编排器发送第三可靠性参数之前,获取节点设备上故障业务的数目以及节点设备上运行的总业务的数目;
计算模块,用于根据获取模块获取的节点设备上故障业务的数目以及节点设备上运行的总业务的数目,计算第三可靠性参数。
本发明第五方面提供一种编排器,包括:存储器、输入/输出设备、处理器以及总线系统;
所述总线系统用于连接所述存储器、所述输入/输出设备以及所述处理器,以使所述存储器、所述输入/输出设备以及所述处理器进行通信;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,具体如下步骤:
获取节点设备的第一可靠性参数;
根据所述第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
根据所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务;
所述输入/输出设备用于接收所述节点设备发送的第二可靠性参数以及第三可靠性参数。
可选地,结合本发明第五方面提供一种编排器,所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
本发明第六方面提供一种节点设备,包括:存储器、输入/输出设备、处理器以及总线系统;
所述总线系统用于连接所述存储器、所述输入/输出设备以及所述处理器,以使所述存储器、所述输入/输出设备以及所述处理器进行通信;
所述输入/输出设备用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
所述处理器用于执行所述存储器中的程序,具体如下步骤:
根据所述编排器确定的所述目标业务的部署位置,执行所述目标业务。
可选地,结合本发明第六方面提供一种节点设备,所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
可选地,结合本发明第六方面以及第六方面第一种可能实现方式,所述处理器还用于当检测到所述节点设备出现故障时,生成故障信息对应的所述第二可靠性参数。
可选地,结合本发明第六方面以及第六方面第一种可能实现方式,所述处理器还用于获取所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目;
根据所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目,计算所述第三可靠性参数。
本发明第七方面提供一种业务处理的系统,包括:编排器和节点设备,
所述编排器为上述上述第三方面或第三方面第一种可能的实现方式中的所述编排器;
所述节点设备为上述第四方面、第四方面第一种、第二种或第三种可能的实现方式中的所述节点设备。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,提供了一种业务处理的方法,编排器可以根据获取到的第一可靠性参数,和接收到的第二可靠性参数以及第三可靠性参数,来计算节点设备的可靠性评估值,并根据不同的可靠性评估值来决策不同的目标业务应该部署在哪些节点设备上。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
附图说明
图1为本发明现有技术中云计算环境下的节点设备编排系统;
图2为本发明实施例中业务处理方法的节点设备编排系统示意图;
图3为本发明实施例中业务处理的方法一个实施例示意图;
图4为本发明实施例中业务处理的方法另一个实施例示意图;
图5为本发明实施例中编排器一个实施例示意图;
图6为本发明实施例中节点设备一个实施例示意图;
图7为本发明实施例中节点设备另一个实施例示意图;
图8为本发明实施例中节点设备另一个实施例示意图;
图9为本发明实施例中编排器一个结构示意图;
图10为本发明实施例中节点设备一个结构示意图;
图11为本实施例中业务处理的系统一个实施例示意图。
具体实施方式
下面将结合本实施例中的附图,对本实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种业务处理的方法,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数用于共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
应理解,本实施例中提供的业务处理的方法可以应用于云计算环境,需要说明的是,在实际应用中,并不仅限于云计算环境,还可以在其他平台上实现本发明方案,故此处不作限定。
请参阅图2,图2为本发明实施例中业务处理方法的节点设备编排系统示意图,如图所示,编排器可以从外界获取到可靠性水平参数,节点设备中的硬件设备向编排器提供检测到的故障信息,节点设备中的VM向编排器上报VM故障信息,这里的VM故障信息即可理解为是业务故障的信息,因为业务是运行在VM上的。
云计算是基于互联网相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。“云”是指网络或者互联网的一种比喻说法。因此,云计算甚至可以体验每秒10万亿次的运算能力,拥有强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势等。用户通过电脑、笔记本或者手机等方式接入数据中心,按自己的需求进行运算。
云计算是分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡和热备份冗余等传统计算机和网络技术发展融合的产物。云计算需要进行网络访问,并进入可配置的计算资源共享池,其中,资源共享池中包括网络,服务器,存储,应用软件和服务等,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
由于在云计算环境下,各个业务之间的交互性比较强,因此对业务可靠性评估的需求会更大,不同类型的业务有着对不同可靠性的要求,本发明方案即针对不同业务的可靠性要求来准确部署在相应的节点上。
下面先介绍节点设备编排系统中的编排器,编排器可以通过内部和外部服务器获得业务逻辑和应用程序数据,开发者可以用可视的方式编排各种业务之间的交互关系。基于业务流程的应用程序优于传统的应用程序,这是因为具有这样的特性,例如并发性,如果一个进程包含若干并行的分支,那么中间件可以保证这些分支在并行的线程中(甚至可能在一个群集的不同节点设备上)并发地执行;可恢复性。如果系统在执行一个基于进程的应用程序时崩溃,那么该应用程序的执行就从它以前停止的地方继续;异构性。一个业务流程各种功能的执行可以分布在一个网络中、或者分布在异构的操作系统和硬件平台上。
接下来介绍节点设备编排系统中的节点设备,本实施例中的节点设备也可以理解为是云计算环境下的网络节点设备,网络节点设备是指一台电脑或其他设备与一个有独立地址和具有传送或接收数据功能的网络相连。网络节点设备可以是工作站、客户、网络用户或个人计算机,还可以是服务器、打印机和其他网络连接的设备。每一个工作站﹑服务器、终端设备以及网络设备,即拥有自己唯一网络地址的设备都是网络节点。整个网络就是由这许许多多的网络节点组成的,把许多的网络节点用通信线路连接起来,形成一定的几何关系,这就是计算机网络拓扑。
在节点设备中具有用于运行业务的VM,硬件和主机操作系统。
其中,VM指通过软件模拟的具有完整硬件系统功能,且运行在一个完全隔离环境中的完整计算机系统,即逻辑上的一台计算机。VM技术是虚拟化技术的一种,所谓虚拟化技术就是将事物从一种形式转变成另一种形式,最常用的虚拟化技术有操作系统中内存的虚拟化,实际运行时用户需要的内存空间可能远远大于物理机器的内存大小,利用内存的虚拟化技术,用户可以将一部分硬盘虚拟化为内存,而这对用户是透明的。
VM可同时在同一台个人电脑(英文全称:Personal Computer,英文缩写:PC)上运行多个操作系统,每个操作系统(英文全称:Operating System,英文缩写:OS)都有自己独立的一个虚拟机,就如同网络上一个独立的PC。在微软视窗操作系统(英文全称:MicrosoftWindows New Technology英文缩写:Windows NT)或Windows 2000上同时运行两个VM,相互之间可以进行对话,也可以在全屏方式下进行虚拟机之间对话,不过此时另一个虚拟机在后台运行。在VM上安装同一种操作系统的另一发行版,不需要重新对硬盘进行分区,且VM之间还可以共享文件、应用、网络资源等。
节点设备中的硬件是指计算机系统中由电子,机械和光电元件等组成的各种物理装置的总称。这些物理装置按系统结构的要求构成一个有机整体为计算机软件运行提供物质基础。简言之,硬件的功能是输入并存储程序和数据,以及执行程序把数据加工成可以利用的形式。从外观上来看,计算机由主机箱和外部设备组成。主机箱内主要包括中央处理器(英文全称:Central Processing Unit,英文缩写:CPU)、内存、主板、硬盘驱动器、光盘驱动器、各种扩展卡、连接线和电源等;外部设备包括鼠标、键盘等。
主机操作系统(英文全称:Host Operating System,英文缩写:Host OS)是一款计算机操作系统,主机操作系统是一款号称具有极高的可升级性和高可靠性的计算机操作系统。
请参阅图3,本发明实施例中业务处理的方法一个实施例包括:
101、获取节点设备的第一可靠性参数;
本实施例中,编排器可以获取到各个节点设备的第一可靠性参数,该第一可靠性参数可以用A来表示,A为一个数值或者一个数值区间。
具体地,当我们评价一个产品的可靠性时,需要对这个产品的可靠性水平进行定量评价,因此,需要建立科学的可靠性参数体系。一个产品的可靠性参数常常用可靠度、平均故障间隔时间(英文全称:Mean Time Between Failure,英文缩写:MTBF)和平均故障前工作时间(英文全称:Mean Time to Failure,英文缩写:MTTF)等参数来描述。其中可靠度表达了产品在规定时间内以及在规定的条件下完成规定功能的能力,例如,某产品在20000小时内的可靠度为0.95,则表示该产品能够在20000小时内不发生功能性故障的可能性为95%。又例如,某产品的MTBF为20000小时,则表示该产品平均每20000小时出现一次故障。这些可靠性参数可以是第一可靠性参数。
102、接收节点设备发送的第二可靠性参数以及第三可靠性参数;
本实施例中,编排器接收各个节点设备发送的第二可靠性参数以及第三可靠性参数,其中,第二可靠性参数来源于节点设备中的硬件,第三可靠性参数来源于节点设备中VM。
第二可靠性参数可以用B来表示,B为一个数值或者一个数值区间,第三可靠性参数可以用C来表示,C为一个数值或者一个数值区间。
103、根据第一可靠性参数、第二可靠性参数以及第三可靠性参数,计算节点设备的可靠性评估值,可靠性评估值用于确定目标业务的部署位置;
本实施例中,编排器根据获取到的第一可靠性参数,接收到的第二可靠性参数和第三可靠性参数,共同计算出各个节点设备的可靠性评估值,该可靠性评估值用于编排器确定目标业务应该部署在哪个或哪些节点设备上,不同的业务对可靠性评估值的要求不同,通常情况下,对可靠性要求高的业务部署在可靠性评估值较高的节点设备上,对可靠性要求低的业务部署在可靠性评估值较低的节点设备上,具体可以是部署在节点设备的VM上。
假设可靠性评估值为D,则D=f(A,B,C)。
需要说明的是,计算D的值可以为D=1/(A×B×C),也可以是其他的计算方式,例如D=1/(A+B+C),或者其他可行的计算方式,故此处不作限定。
104、根据可靠性评估值在至少一个节点设备上部署目标业务,以使至少一个节点设备执行目标业务。
本实施例中,编排器根据各个节点设备的可靠性评估值大小,来部署目标业务。假如目标业务对可靠性要求高,则将目标业务部署于高可靠性评估值对应的节点设备上,反之,假如目标业务对可靠性要求低,则将目标业务部署于低可靠性评估值对应的节点设备上。
在实际应用中,也可能需要将目标业务部署在多个节点设备上。
部署目标业务主要有部署模块完成,其中,部署模块可以位于编排器内部,也可以独立于编排器,作为外部设备来执行部署工作,然后部署模块需要与编排器进行通信连接才可以执行相应的操作。
本发明实施例中,提供了一种业务处理的方法,编排器可以根据获取到的第一可靠性参数,和接收到的第二可靠性参数以及第三可靠性参数,来计算节点设备的可靠性评估值,并根据不同的可靠性评估值来决策不同的目标业务应该部署在哪些节点设备上。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
可选地,在上述图3对应的实施例的基础上,本发明实施例提供的业务处理的方法第一个可选实施例中,第一可靠性参数包括节点设备的原始可靠性水平参数,第二可靠性参数包括节点设备发送的节点设备故障参数,第三可靠性参数包括节点设备发送的业务故障参数。
本实施例中,具体说明了第一可靠性参数为节点设备的原始可靠性水平参数,与上述图3对应的实施例中步骤101所描述的内容类似,该原始可靠性水平参数主要用于定量评价节点设备的可靠性水平。编排器通常可以从节点设备中获取原始可靠性水平参数,或者由节点设备通知编排器,还可以是参考生产该节点设备的厂商所提供的资料,比如硬件失效率或者是故障检测率等指标。厂商在计算原始可靠性水平参数的时候,需要考虑包括相关问题的参数估计,参数的区间估计,结构体系的相关系数矩阵计算等。
第二可靠性参数为节点设备发送的节点设备故障参数,具体地,节点设备故障参数是指节点设备在运行过程中检测到的故障信息,并根据该故障信息生成一个对应的节点设备故障参数。故障信息可以是,比如内存是否发生软失效,在大规模集成电路(英文全称:Large-scale integration,英文缩写:LSI)的半导体存储器中,使用时突然发生存储单元误动作的现象可以被称为是软失效。节点设备根据检测到的故障信息来生成对应的节点设备故障参数,并向编排器上报该节点设备故障参数。
第三可靠性参数为业务故障参数,顾名思义,业务故障参数即为业务在节点设备上运行时发生故障的比例值。一个节点设备上通常会有多个VM,每个VM上又相应地承担着运行业务的责任,但是并非所有VM都能正常运行所有业务,如果当某项业务在VM上出现故障,或者由于某个VM出现故障导致业务失效时,则认为是出现业务故障。在一个节点设备上,出现业务故障的VM与该节点设备上VM总数之间的比值即可作为业务故障参数。由节点设备先在VM上得到业务故障参数,继而将该业务故障参数发送至编排器。
其次,本发明实施例中,具体对第一可靠性参数、第二可靠性参数以及第三可靠性参数进行了介绍,第一可靠性参数即为节点设备的原始可靠性水平参数,第二可靠性参数为节点设备发送的节点设备故障参数,上述两种参数在现有技术中也可作为计算可靠性评估值的依据,然而第三可靠性参数,即业务故障参数,则是本发明实施例中所采用的另一个计算可靠性评估值的重要依据,综合而言,根据业务故障参数后可以更准确地了解各个节点设备上运行业务的能力,从而将其作为计算可靠性评估值的一个重要参数,可以更好的提升对节点可靠性评估的准确性,有利于更准确的部署业务,提升业务的使用效率,增强方案的可行性和灵活性。
上述图3以及图3对应的第一个可选实施例是从编排器角度对业务处理方法进行描述的,下面将从节点的角度对业务处理的方法进行描述,请参阅图4,本发明实施例中业务处理的方法另一个实施例包括:
201、向编排器发送第二可靠性参数以及第三可靠性参数,以使编排器根据第一可靠性参数、第二可靠性参数以及第三可靠性参数计算可靠性评估值,可靠性评估值用于确定目标业务的部署位置;
本实施例中,节点设备中的硬件可以向编排器发送第二可靠性参数,且节点设备中的VM可以向编排器发送第三可靠性参数。
编排器在获取到第一可靠性参数,以及接收到节点设备发送的第二可靠性参数和第三可靠性参数后,会采用一个计算可靠性评估值的公式来计算对应的可靠性评估值。可靠性评估值用于确定目标业务的部署位置。
202、根据编排器确定的目标业务的部署位置,执行目标业务。
本实施例中,节点设备根据编排器确定的目标业务的部署位置来执行相应的目标业务。其中,目标业务的部署位置是指,将要把目标业务部署在具体哪个或哪些节点设备上,这些被部署的节点设备就是目标业务的部署位置。
本发明实施例中,提供了一种业务处理的方法,节点设备向编排器发送第二可靠性参数以及第三可靠性参数,以使编排器根据第一可靠性参数、第二可靠性参数以及第三可靠性参数计算可靠性评估值,可靠性评估值用于确定目标业务的部署位置,最后根据编排器确定的目标业务的部署位置,在部署位置对应的节点设备上执行目标业务。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
可选地,在上述图4对应的实施例的基础上,本发明实施例提供的业务处理的方法第一个可选实施例中,第一可靠性参数包括节点设备的原始可靠性水平参数,第二可靠性参数包括节点设备发送的节点设备故障参数,第三可靠性参数包括节点设备发送的业务故障参数。
本实施例中,针对第一可靠性参数、第二可靠性参数和第三可靠性参数进行了具体的说明,且在本发明实施例中图3对应的第一个可选实施例中有相应的描述,故此处不作赘述。
需要说明的是,编排器获取节点设备的原始可靠性水平参数方式有多种,可以是直接获取节点设备上报的原始可靠性水平参数,可以从节点设备生产厂商提供的出厂参数中获取原始可靠性水平参数,还可以是通过编排器自身检测各个节点设备的硬件失效率来计算出原始可靠性水平参数,故此处不做限定。
其次,本发明实施例中,具体对第一可靠性参数、第二可靠性参数以及第三可靠性参数进行了介绍,第一可靠性参数即为节点设备的原始可靠性水平参数,第二可靠性参数为节点设备发送的节点设备故障参数,上述两种参数在现有技术中也可作为计算可靠性评估值的依据,然而第三可靠性参数,即业务故障参数,则是本发明实施例中所采用的另一个计算可靠性评估值的重要依据,综合而言,根据业务故障参数后可以更准确地了解各个节点设备上运行业务的能力,从而将其作为计算可靠性评估值的一个重要参数,可以更好的提升对节点可靠性评估的准确性,有利于更准确的部署业务,提升业务的使用效率,增强方案的可行性和灵活性。
可选地,在上述图4或图4对应的第一个可选实施例的基础上,本发明实施例提供的业务处理的方法第二个可选实施例中,向编排器发送第二可靠性参数之前,还可以包括:
当检测到节点设备出现故障时,生成故障信息对应的第二可靠性参数。
本实施例中,当节点设备检测到自身出现故障时,先获取到故障对应的节点设备故障信息,并根据该故障信息生成对应的第二可靠性参数。其中,故障信息与节点设备故障参数之间的对应关系可以是预先根据需求建立的,此处不做详细介绍。
检测节点设备是否发生故障的一种方式可以是,节点设备针对与自身相邻的另一个节点设备创建隧道组,隧道组与途径该节点设备和另一个节点设备的多协议标签交换(英文全称:Multi-Protocol Label Switching,英文缩写:MPLS)隧道具有绑定关系,MPLS隧道承载在该节点设备和另一个节点设备间的物理链路上。在该节点设备与另一个节点设备之间建立一个操作管理维护(英文全称:Operation Administration and Maintenance,英文缩写:OAM)检测会话,OAM检测会话是针对物理链路的,并判断是否在一个设定时长内接收到另一个节点设备发送的属于OAM检测会话的OAM报文。该节点设备在一个设定时长内没有接收到另一个节点设备发送的OAM报文时,从与隧道组绑定的MPLS隧道中选择至少一条MPLS隧道,并针对每条选择的MPLS隧道,向MPLS隧道的源节点发送携带有MPLS隧道的隧道标识的隧道故障通告报文。
再次,本发明实施例中,具体说明了如何得到第二可靠性参数。第二可靠性参数为节点设备发送的节点设备故障参数,也就是在节点检测到自身出现故障时,生成一个节点设备故障参数,从而将该参数发送至编排器,使得编排器根据节点设备故障参数来评估节点设备的可靠性,由此,增强方案的可行性。
可选地,在上述图4或图4对应的第一个可选实施例的基础上,本发明实施例提供的业务处理的方法第三个可选实施例中,向编排器发送第三可靠性参数之前,还可以包括:
获取节点设备上故障业务的数目以及节点设备上运行的总业务的数目;
根据节点设备上故障业务的数目以及节点设备上运行的总业务的数目,计算第三可靠性参数。
本实施例中,一个节点设备中的VM如果出现业务无法正常运行的情况,则可以向节点设备上报故障信息,而这时由于一部分节点设备是不能主动监测自身运行业务的情况,所以需要接受VM给它上报的故障信息,从而统计出故障业务的数目以及运行的总业务的数目。
加入节点设备共运行了X个VM,其中有Y个VM上报了故障信息,则该节点设备上第三可靠性参数,及业务故障参数为Y/X。且Y/X的值越大,其可靠性水平越低。
再次,本发明实施例中,具体说明了如何得到第三可靠性参数。第三可靠性参数为节点设备发送的业务故障参数。在现有技术中,并未考虑到利用该业务故障参数来评估节点设备的可靠性。由于某些节点设备自身无法检测是否存在业务故障,因此需要节点设备内部的VM做相应的业务故障检测,从而增强计算可靠性评估值的准确性。
为便于理解,下面以一个具体应用场景对本发明中一种业务处理方法进行详细描述,具体为:
目前,用户甲欲在云计算环境下申请一项业务,于是需要编排器将该业务部署于某个节点设备上来运行。
首先,编排器从节点设备生产厂商提供的硬件失效率和故障检测率中获取原始可靠性水平参数,其中,硬件失效率为20%,故障检测率为10%,采用下列公式计算原始可靠性水平参数:
原始可靠性水平参数=(硬件失效率+故障检测率)/2
即,原始可靠性水平参数为15%。
接下来,节点设备中的硬件如果检测到故障,先根据故障的信息生成节点设备故障参数,假设其中一个节点设备X检测到内存发生了软失效,则生成节点设备故障参数为1,当然,如果该故障后续被修复,则修复之后再计算一次节点设备故障参数。
节点设备中的VM根据一个节点设备上总共运行的VM总数与故障的VM数量来计算业务故障参数,假设一个节点设备上总共运行的VM数量为10,其中出现故障的VM数量为2,则业务故障参数为20%。
最后,采用下列公式计算可靠性评估值:
D=1/(A×B×C)
=1/(15%×1×20%)
=33.333
目标业务对可靠性的要求为可靠性评估值大于等于30,此时,说明上述计算得到的节点设备满足部署该目标业务的条件,从而由编排器内部的部署模块将目标业务部署在该节点设备中。
下面对本发明中的编排器进行详细描述,请参阅图5,本发明实施例中的编排器包括:
获取模块301,用于获取节点设备的第一可靠性参数;
接收模块302,用于接收所述节点设备发送的第二可靠性参数以及第三可靠性参数;
计算模块303,用于根据所述获取模块获取的所述第一可靠性参数、所述接收模块接收的所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块304,用于根据所述计算模块计算得到的所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务。
本实施例中,获取模块301获取节点设备的第一可靠性参数,接收模块302接收所述节点设备发送的第二可靠性参数以及第三可靠性参数,计算模块303根据所述获取模块获取的所述第一可靠性参数、所述接收模块接收的所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置,执行模块304根据所述计算模块计算得到的所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务。
本发明实施例中,提供了一种业务处理的方法,编排器可以根据获取到的第一可靠性参数,和接收到的第二可靠性参数以及第三可靠性参数,来计算节点设备的可靠性评估值,并根据不同的可靠性评估值来决策不同的目标业务应该部署在哪些节点设备上。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
可选地,在上述图3对应的实施例的基础上,本发明实施例提供的业务处理的方法第一个可选实施例中,所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
其次,本发明实施例中,具体对第一可靠性参数、第二可靠性参数以及第三可靠性参数进行了介绍,第一可靠性参数即为节点设备的原始可靠性水平参数,第二可靠性参数为节点设备发送的节点设备故障参数,上述两种参数在现有技术中也可作为计算可靠性评估值的依据,然而第三可靠性参数,即业务故障参数,则是本发明实施例中所采用的另一个计算可靠性评估值的重要依据,综合而言,根据业务故障参数后可以更准确地了解各个节点设备上运行业务的能力,从而将其作为计算可靠性评估值的一个重要参数,可以更好的提升对节点可靠性评估的准确性,有利于更准确的部署业务,提升业务的使用效率,增强方案的可行性和灵活性。
下面对本发明中的编排器进行详细描述,请参阅图6,本发明实施例中的节点设备包括:
发送模块401,用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块402,用于根据所述编排器通过第一可靠性参数、所述发送模块401发送的第二可靠性参数以及第三可靠性参数,确定的所述目标业务的部署位置,执行所述目标业务。
本实施例中,发送模块401向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置,执行模块402根据所述编排器通过第一可靠性参数、所述发送模块401发送的第二可靠性参数以及第三可靠性参数,确定的所述目标业务的部署位置,执行所述目标业务。
本发明实施例中,提供了一种业务处理的方法,节点设备向编排器发送第二可靠性参数以及第三可靠性参数,以使编排器根据第一可靠性参数、第二可靠性参数以及第三可靠性参数计算可靠性评估值,可靠性评估值用于确定目标业务的部署位置,最后根据编排器确定的目标业务的部署位置,在部署位置对应的节点设备上执行目标业务。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
可选地,在上述图6对应的实施例的基础上,本发明实施例提供的业务处理的方法第一个可选实施例中,所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
其次,本发明实施例中,具体对第一可靠性参数、第二可靠性参数以及第三可靠性参数进行了介绍,第一可靠性参数即为节点设备的原始可靠性水平参数,第二可靠性参数为节点设备发送的节点设备故障参数,上述两种参数在现有技术中也可作为计算可靠性评估值的依据,然而第三可靠性参数,即业务故障参数,则是本发明实施例中所采用的另一个计算可靠性评估值的重要依据,综合而言,根据业务故障参数后可以更准确地了解各个节点设备上运行业务的能力,从而将其作为计算可靠性评估值的一个重要参数,可以更好的提升对节点可靠性评估的准确性,有利于更准确的部署业务,提升业务的使用效率,增强方案的可行性和灵活性。
请参阅图7,本发明实施例中的节点设备包括:
生成模块403,用于所述发送模块401向编排器发送第二可靠性参数之前,当检测到所述节点设备出现故障时,生成故障信息对应的所述第二可靠性参数。
发送模块401,用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块402,用于根据所述编排器通过第一可靠性参数、所述发送模块401发送的第二可靠性参数以及第三可靠性参数,确定的所述目标业务的部署位置,执行所述目标业务。
再次,本发明实施例中,具体说明了如何得到第二可靠性参数。第二可靠性参数为节点设备发送的节点设备故障参数,也就是在节点检测到自身出现故障时,生成一个节点设备故障参数,从而将该参数发送至编排器,使得编排器根据节点设备故障参数来评估节点设备的可靠性,由此,增强方案的可行性。
请参阅图8,本发明实施例中的节点设备包括:
获取模块404,用于用于所述发送模块401向编排器发送第三可靠性参数之前,获取所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目;
计算模块405,用于根据所述获取模块404获取的所述节点设备上故障业务的数目以及节点设备上运行的总业务的数目,计算所述第三可靠性参数。
发送模块401,用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块402,用于根据所述编排器通过第一可靠性参数、所述发送模块401发送的第二可靠性参数以及第三可靠性参数,确定的所述目标业务的部署位置,执行所述目标业务。
再次,本发明实施例中,具体说明了如何得到第三可靠性参数。第三可靠性参数为节点设备发送的业务故障参数。在现有技术中,并未考虑到利用该业务故障参数来评估节点设备的可靠性。由于某些节点设备自身无法检测是否存在业务故障,因此需要节点设备内部的VM做相应的业务故障检测,从而增强计算可靠性评估值的准确性。
图9是本发明实施例编排器50的结构示意图。编排器50可包括输入/输出设备510、处理器520和存储器530。本发明实施例中的输出设备可以是显示设备。
存储器530可以包括只读存储器和随机存取存储器,并向处理器520提供指令和数据。存储器530的一部分还可以包括非易失性随机存取存储器(英文全称:Non-VolatileRandom Access Memory,英文缩写:NVRAM)。
存储器530存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
本发明实施例中处理器520用于:
获取节点设备的第一可靠性参数;
根据所述第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
根据所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务。
处理器520控制操作编排器50的操作,处理器520还可以称为中央处理单元(英文全称:Central Processing Unit,英文缩写:CPU)。存储器530可以包括只读存储器和随机存取存储器,并向处理器520提供指令和数据。存储器530的一部分还可以包括非易失性随机存取存储器(英文全称:Non-Volatile Random Access Memory,英文缩写:NVRAM)。具体的应用中,编排器50的各个组件通过总线系统540耦合在一起,其中总线系统540除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统540。
上述本发明实施例揭示的方法可以应用于处理器520中,或者由处理器520实现。处理器520可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器520中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器520可以是通用处理器、数字信号处理器(英文全称:digital signal processor,英文缩写:DSP)、专用集成电路(英文全称:Application Specific Integrated Circuit,英文缩写:ASIC)、现成可编程门阵列(英文全称:Field-Programmable Gate Array,英文缩写:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器530,处理器520读取存储器430中的信息,结合其硬件完成上述方法的步骤。
图9的相关描述可以参阅图1方法部分的相关描述和效果进行理解,本处不做过多赘述。
图10是本发明实施例提供的一种节点设备结构示意图,该节点设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(英文全称:central processing units,英文缩写:CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在节点设备600上执行存储介质630中的一系列指令操作。
节点设备600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
其中,本发明实施例中所述CPU622用于:
根据所述编排器确定的所述目标业务的部署位置,执行所述目标业务。
本发明实施例中所述CPU622还用于:
当检测到所述节点设备出现故障时,生成故障信息对应的所述第二可靠性参数。
本发明实施例中所述CPU622还用于:
获取所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目;
根据所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目,计算所述第三可靠性参数。
本发明实施例中所述输入输出接口658用于:
向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置。
上述实施例中由节点设备所执行的步骤可以基于该图10所示的节点设备结构。
下面对本发明实施例中的业务处理的系统进行描述,请参阅图11,本发明实施例中的业务处理的系统包括:
编排器701以及节点设备702;
编排器701获取节点设备702的第一可靠性参数,编排器701接收所述节点设备702发送的第二可靠性参数以及第三可靠性参数;编排器701根据所述第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备702的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;编排器701根据所述可靠性评估值在至少一个所述节点设备702上部署所述目标业务,以使至少一个所述节点设备702执行所述目标业务。
节点设备702向编排器701发送第二可靠性参数以及第三可靠性参数,以使所述编排器701根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置,节点设备702根据所述编排器701确定的所述目标业务的部署位置,执行所述目标业务。
本发明实施例中,提供了一种业务处理的方法,编排器可以根据获取到的第一可靠性参数,和接收到的第二可靠性参数以及第三可靠性参数,来计算节点设备的可靠性评估值,并根据不同的可靠性评估值来决策不同的目标业务应该部署在哪些节点设备上。通过上述方式来进行业务的部署,考虑到了更多的因素,不仅限于传统的方式,而是加入了第三种可靠性参数共同参与节点设备可靠性的评估,从而保障在虚拟机上部署业务的准确性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (11)

1.一种业务处理的方法,其特征在于,包括:
获取节点设备的第一可靠性参数;
接收所述节点设备发送的第二可靠性参数以及第三可靠性参数;
根据所述第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
根据所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务;
所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
2.一种业务处理的方法,其特征在于,包括:
向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
根据所述编排器确定的所述目标业务的部署位置,执行所述目标业务;
所述第一可靠性参数包括节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
3.根据权利要求2所述的方法,其特征在于,所述向编排器发送第二可靠性参数之前,所述方法还包括:
当检测到所述节点设备出现故障时,生成故障信息对应的所述第二可靠性参数。
4.根据权利要求2所述的方法,其特征在于,所述向编排器发送第三可靠性参数之前,所述方法还包括:
获取所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目;
根据所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目,计算所述第三可靠性参数。
5.一种编排器,其特征在于,包括:
获取模块,用于获取节点设备的第一可靠性参数;
接收模块,用于接收所述节点设备发送的第二可靠性参数以及第三可靠性参数;
计算模块,用于根据所述获取模块获取的所述第一可靠性参数、所述接收模块接收的所述第二可靠性参数以及所述第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块,用于根据所述计算模块计算得到的所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务;
所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
6.一种节点设备,其特征在于,包括:
发送模块,用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
执行模块,用于根据所述编排器通过第一可靠性参数、所述发送模块发送的第二可靠性参数以及第三可靠性参数,确定的所述目标业务的部署位置,执行所述目标业务;
所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
7.根据权利要求6所述的节点设备,其特征在于,所述节点设备还包括:
生成模块,用于所述发送模块向编排器发送第二可靠性参数之前,当检测到所述节点设备出现故障时,生成故障信息对应的所述第二可靠性参数。
8.根据权利要求6或7所述的节点设备,其特征在于,所述节点设备还包括:
获取模块,用于用于所述发送模块向编排器发送第三可靠性参数之前,获取所述节点设备上故障业务的数目以及所述节点设备上运行的总业务的数目;
计算模块,用于根据所述获取模块获取的所述节点设备上故障业务的数目以及节点设备上运行的总业务的数目,计算所述第三可靠性参数。
9.一种编排器,其特征在于,包括:存储器、输入/输出设备、处理器以及总线系统;
所述总线系统用于连接所述存储器、所述输入/输出设备以及所述处理器,以使所述存储器、所述输入/输出设备以及所述处理器进行通信;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,具体如下步骤:
获取节点设备的第一可靠性参数;
根据所述第一可靠性参数、第二可靠性参数以及第三可靠性参数,计算所述节点设备的可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
根据所述可靠性评估值在至少一个所述节点设备上部署所述目标业务,以使至少一个所述节点设备执行所述目标业务;
所述输入/输出设备用于接收所述节点设备发送的第二可靠性参数以及第三可靠性参数;
所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
10.一种节点设备,其特征在于,包括:存储器、输入/输出设备、处理器以及总线系统;
所述总线系统用于连接所述存储器、所述输入/输出设备以及所述处理器,以使所述存储器、所述输入/输出设备以及所述处理器进行通信;
所述输入/输出设备用于向编排器发送第二可靠性参数以及第三可靠性参数,以使所述编排器根据第一可靠性参数、所述第二可靠性参数以及所述第三可靠性参数计算可靠性评估值,所述可靠性评估值用于确定目标业务的部署位置;
所述处理器用于执行所述存储器中的程序,具体如下步骤:
根据所述编排器确定的所述目标业务的部署位置,执行所述目标业务;
所述第一可靠性参数包括所述节点设备的原始可靠性水平参数,所述第二可靠性参数包括所述节点设备发送的节点设备故障参数,所述第三可靠性参数包括所述节点设备发送的业务故障参数。
11.一种业务处理的系统,其特征在于,包括:编排器和节点设备,
所述编排器为上述权利要求5中所述的编排器;
所述节点设备为上述权利要求6至8任一项所述的节点设备。
CN201510964596.1A 2015-12-18 2015-12-18 一种业务处理的方法、相关装置以及系统 Active CN105446818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510964596.1A CN105446818B (zh) 2015-12-18 2015-12-18 一种业务处理的方法、相关装置以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510964596.1A CN105446818B (zh) 2015-12-18 2015-12-18 一种业务处理的方法、相关装置以及系统

Publications (2)

Publication Number Publication Date
CN105446818A CN105446818A (zh) 2016-03-30
CN105446818B true CN105446818B (zh) 2019-01-11

Family

ID=55557053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510964596.1A Active CN105446818B (zh) 2015-12-18 2015-12-18 一种业务处理的方法、相关装置以及系统

Country Status (1)

Country Link
CN (1) CN105446818B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108540302B (zh) * 2017-03-03 2020-08-04 腾讯科技(深圳)有限公司 一种大数据处理的方法及设备
CN109117243B (zh) * 2017-06-23 2023-07-07 中兴通讯股份有限公司 业务部署方法、装置、客户端设备及计算机可读存储介质
CN110308988B (zh) * 2019-05-17 2020-08-04 开放智能机器(上海)有限公司 一种应用于异构计算平台的动态调度方法及系统
CN111582628B (zh) * 2020-03-24 2024-04-09 网宿科技股份有限公司 质量评估方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026490A (zh) * 2007-01-26 2007-08-29 华为技术有限公司 实现业务分发与同步的设备、系统及方法
CN103413251A (zh) * 2013-08-22 2013-11-27 国家电网公司 一种评估电网可靠性的方法及系统
CN103875210A (zh) * 2011-10-14 2014-06-18 阿尔卡特朗讯公司 在通信环境中提供动态可靠性和安全性
CN104170323A (zh) * 2014-04-09 2014-11-26 华为技术有限公司 基于网络功能虚拟化的故障处理方法及装置、系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8763001B2 (en) * 2010-10-29 2014-06-24 Fujitsu Limited Technique for efficient parallelization of software analysis in a distributed computing environment through intelligent dynamic load balancing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026490A (zh) * 2007-01-26 2007-08-29 华为技术有限公司 实现业务分发与同步的设备、系统及方法
CN103875210A (zh) * 2011-10-14 2014-06-18 阿尔卡特朗讯公司 在通信环境中提供动态可靠性和安全性
CN103413251A (zh) * 2013-08-22 2013-11-27 国家电网公司 一种评估电网可靠性的方法及系统
CN104170323A (zh) * 2014-04-09 2014-11-26 华为技术有限公司 基于网络功能虚拟化的故障处理方法及装置、系统

Also Published As

Publication number Publication date
CN105446818A (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
JP6530774B2 (ja) ハードウェア障害回復システム
US10095559B2 (en) Interface for translating software commands and hardware commands for a distributed computing system
US10511485B2 (en) Dynamic virtual network topology discovery engine
US9507566B2 (en) Entropy generation for a distributed computing system
CN113475172B (zh) 通过增强现实与可用传感器数据对数据中心进行定位与导航的系统及方法
CN101589370B (zh) 一种并行计算机系统以及在其上进行故障恢复的方法
US8738968B2 (en) Configuration based service availability analysis of AMF managed systems
US8910172B2 (en) Application resource switchover systems and methods
US11599435B2 (en) Failure analysis system for a distributed storage system
CN105446818B (zh) 一种业务处理的方法、相关装置以及系统
US10146653B2 (en) Automated system-level failure and recovery
US10346263B2 (en) Host swap hypervisor that provides high availability for a host of virtual machines
CN106796540A (zh) 用于分布式计算的主动故障恢复模型
US20130268495A1 (en) Split brain protection in computer clusters
CN109901985B (zh) 分布式测试装置及方法、存储介质和电子设备
US11381451B2 (en) Methods, systems, and computer readable mediums for selecting and configuring a computing system to support a replicated application
CN115562911A (zh) 虚拟机数据备份方法及装置、系统、电子设备、存储介质
CN111625949A (zh) 一种仿真引擎系统、仿真处理方法、设备和介质
KR20210054480A (ko) 대규모 클라우드 데이터 센터 자율 운영을 위한 백업 복구 방법
US12020063B2 (en) Preflight checks for hardware accelerators in a distributed system
CN116955129A (zh) 代码功能和测试用例映射的自动生成
US9934113B2 (en) Enhanced console assisted recovery for a coordinated timing network
TW201328247A (zh) 系統錯誤處理方法與使用其之伺服器系統
US20200327026A1 (en) Circuit-cycle reproduction
CN104598211A (zh) 管理维护软件程序的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant