CN112328430A - 一种用于降低数据中心网络系统运行成本的方法 - Google Patents
一种用于降低数据中心网络系统运行成本的方法 Download PDFInfo
- Publication number
- CN112328430A CN112328430A CN202011212615.2A CN202011212615A CN112328430A CN 112328430 A CN112328430 A CN 112328430A CN 202011212615 A CN202011212615 A CN 202011212615A CN 112328430 A CN112328430 A CN 112328430A
- Authority
- CN
- China
- Prior art keywords
- data center
- eta
- data
- center network
- theta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供了一种用于降低数据中心网络系统运行成本的方法。基于网络数据中心数量和备份数据成功的数据中心数量拟定二维马氏过程的状态转移关系,通过在子状态空闲和修正状态空间下分别计算的第一无穷小生成元和第二无穷小生成元从而确定目标文件在数据中心网络中的寿命,将根据寿命的均值与文件备份数量的关系,计算文件的备份阈值,使文件备份数量等于该阈值,则能够精准确定备份冗余量,避免过多备份造成的资源浪费。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,尤其涉及一种用于降低数据中心网络系统运行成本的方法。
背景技术
数据中心网络是现代信息技术各种应用的重要基础设施,由于每个数据中心的生命周期有限,一旦数据中心发生故障,将丢失所有的存储文件和信息。将重要文件复制到其他数据中心,可延长其在数据中心网络中的使用寿命。但是,存有文件备份的数据中心数量越多,文件的使用寿命越长,同时需要维护运行的成本越高。
现有技术中提供了一种“基于分布式存储系统进行数据冗余处理方法”,见公开号为102857554B,公开日为2016-07-06,该发明在分布式存储系统上既实现了数据读取的高可靠性,又实现了数据写入的高可靠性。但不能实时在线计算合理的冗余数量,在保证文件使用寿命的前提下,最大限度的降低系统的运行成本。
发明内容
根据上述提出的不能实时在线计算合理的冗余数量,并最大限度的降低系统的运行成本的技术问题,而提供降低数据中心网络系统运行成本的方法。其能够在线计算合理的文件备份数量,保证文件使用寿命,同时降低运行成本。
本发明采用的技术手段如下:
一种用于降低数据中心网络系统运行成本的方法
S1、获取在t时刻数据中心网络中正常运行数据中心数量N(t),以及在该时刻对目标文件成功备份的数据中心数量M(t);
S2、基于所述正常运行数据中心数量N(t)和目标文件成功备份的数据中心数量M(t)构建二维马氏过程的状态转移关系{(N(t),M(t)):t≥0};
S3、基于所述二维马氏过程的状态转移关系{(N(t),M(t)):t≥0},得到状态空间表达式Θ,并定义:
水平1:Θ1={(1,1)},
水平k∈{2,3,...,d-1}:Θk={(k,1),(k,2),...,(k,k)},
水平l∈{d,d+1,d+2,...}:Θl={(l,1),(l,2),...,(l,d)},其中d为备份数量;
其中T0=-Te=(λ;λ,0;λ,0,0;λ,0,0,0;λ,0,0,0,0;...)',e是单位矩阵所有元素都为1的列向量,λ是数据中心的失效率;
S6、计算目标文件在数据中心网络中的寿命η;
S7、计算所述第一无穷小生成元T的逆矩阵T-1;
S8、计算所述目标文件在数据中心网络中的寿命η的k阶矩E[ηk],
S9、根据E[ηk]得到寿命η的均值E[η]:
S10、基于所述寿命η的均值E[η]得到所述寿命η的均值E[η]与文件备份数量d的关系,绘制E[η]-d曲线,同时根据曲线拐点得到阈值θ,将数据网络中心中备份的数量d控制在阈值θ。
较现有技术相比,本发明具有以下优点:
1.本发明算法能够实时在线确定数据中心网络中文件备份数量的阈值,精准确定备份冗余量,避免过多备份造成的资源浪费。
2.本发明算法将抽象的数据中心网络的状态转移关系用数学模型具体化,且所述数学模型更加贴合实际,使得备份冗余量的计算更加精准。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明算法的步骤流程图。
图2是所述二维马氏过程的状态转移关系图。
图3是在实例中应用本发明算法计算得到的所述寿命η的均值E[η]与文件备份数量d的关系图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,所述算法步骤如下:
步骤1,在数据中心网络中,为了表明正常运行数据中心的数量会对文件数据复制的数量影响较大,令N(t)表示在时刻t数据中心网络中正常运行数据中心的数量;M(t)表示在时刻一个文件成功备份的数据中心数量。
步骤2,结合图2可知,每个数据中心都可能发生故障或失效,并且它的寿命是服从参数为λ的指数分布;一些新的数据中心不断地加入到数据中心网络中,新数据中心加入到数据中心网络中是一个到达率为β的泊松过程;一个文件的数据从一个数据中心复制到另一个数据中心所需要的时间是服从参数为μ的指数分布。每个圆圈中第一个数字表示的是正常运行数据中心的数量,第二个数字表示的是一个文件成功备份的数据中心的数量。由此,可以得到二维马氏过程{(N(t),M(t)):t≥0}的状态转移关系。
步骤3,根据所述状态转移关系,得到二维马氏过程{(N(t),M(t)):t≥0}的状态空间表达式Θ,其中是二维马氏过程{(N(t),M(t)):t≥0}的子状态空间,Δ={(k,0):k=0,1,2,...}是一个所有吸收状态的集合,并且把二维马氏过程{(N(t),M(t)):t≥0}的状态空间按水平来划分为:
水平1:Θ1={(1,1)};
水平k∈{2,3,...,d-1}:Θk={(k,1),(k,2),...,(k,k)};
水平l∈{d,d+1,d+2,...}:Θl={(l,1),(l,2),...,(l,d)}。
各元素的计算过程如下,
A1,1=-(λ+β),A1,2=(β,0),
对于2≤k≤d,
对于l≥d+1,
其中,T0=-Te=(λ;λ,0;λ,0,0;λ,0,0,0;λ,0,0,0,0;K)',T是二维马氏过程{(N(t),M(t)):t≥0}的无穷小生成元,e是单位矩阵所有元素都为1的列向量,λ是数据中心的失效率。。
步骤6,得到一个文件在数据中心网络中的寿命η,
η=inf{t≥0:M(t)=0,N(t)∈{0,1,2,K}}。
步骤7,计算所述无穷小生成元T的逆矩阵T-1。为了计算所述逆矩阵T-1,利用RG–分解法,定义U–测度为
U0=A1,1,
Uk=Ak+1,k+1+Ak+1,k(-Uk-1)-1Ak,k+1,k=1,2,3,...;
定义R–测度为
Rk=Ak+1,k(-Uk-1)-1,k=1,2,3,...;
定义G–测度为
Gl=(-Ul)-1Al+1,l+2,l=0,1,2,....
依据U–测度、R–测度与G–测度,矩阵T存在RG–分解如下:
T=(I-RL)UD(I-GU),
其中
UD=diag(U0,U1,U2,...),
因此,可得
令
则
令
步骤8,计算所述寿命η的k阶矩E[ηk]。
步骤9,得到所述寿命η的均值E[η]。
步骤10,寿命η的均值E[η]表达式中,无穷小生成元Ti,j里包含文件备份数量d的矩阵,得到所述寿命η的均值E[η]与文件备份数量d的关系,绘制E[η]-d曲线,同时根据曲线拐点得到阈值θ,即当文件备份数量d超过阈值θ后,所述寿命η的均值E[η]将不再显著增大。将数据网络中心中备份的数量控制在阈值θ,即可在保证文件使用寿命的情况下,最大限度的降低数据中心运行成本。
图2是二维马氏过程的状态转移关系图。图中λ表示数据中心的生成率,β表示数据中心的失效率,μ表示复制数量,d表示数据中心的数量。
图3是在实例中应用本发明算法计算得到的所述寿命η的均值E[η]与文件备份数量d的关系图。
如图3所示,在数据中心网络中,令λ=1,β=4,当d增大时,数据中心在数据中心网络中寿命的均值E[η]增大。到当d增大到一定数值θ后,数据中心在数据中心网络中的寿命的均值E[η]将不再明显变化,即一个文件的数据在这个数据中心网络中最多保存相同的备份数量d存在一个阈值θ,当超过这个阈值θ后,一个数据在网络中的寿命的均值E[η]将不再明显变化。因此,可将数据网络中心中备份的数量控制在阈值θ,在保证文件使用寿命的情况下,最大限度的降低数据中心运行成本。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (4)
1.一种用于降低数据中心网络系统运行成本的方法,其特征在于,包括如下步骤:
S1、获取在t时刻数据中心网络中正常运行数据中心数量N(t),以及在该时刻对目标文件成功备份的数据中心数量M(t);
S2、基于所述正常运行数据中心数量N(t)和目标文件成功备份的数据中心数量M(t)构建二维马氏过程的状态转移关系{(N(t),M(t)):t≥0};
S3、基于所述二维马氏过程的状态转移关系{(N(t),M(t)):t≥0},得到状态空间表达式Θ,并定义:
水平1:Θ1={(1,1)},
水平k∈{2,3,...,d-1}:Θk={(k,1),(k,2),...,(k,k)},
水平l∈{d,d+1,d+2,...}:Θl={(l,1),(l,2),...,(l,d)},其中d为备份数量;
其中T0=-Te=(λ;λ,0;λ,0,0;λ,0,0,0;λ,0,0,0,0;...)',e是单位矩阵所有元素都为1的列向量,λ是数据中心的失效率;
S6、计算目标文件在数据中心网络中的寿命η;
S7、计算所述第一无穷小生成元T的逆矩阵T-1;
S8、计算所述目标文件在数据中心网络中的寿命η的k阶矩E[ηk],
S9、根据E[ηk]得到寿命η的均值E[η]:
其中,寿命η服从一个无穷维的PH分布(α,T),则表示初始概率向量,Δ*表示二维马氏过程转移状态里的吸收状态,e是单位矩阵所有元素都为1的列向量,T表示{(N(t),M(t)):t≥0}在子状态空间的无穷小生成元;
S10、基于所述寿命η的均值E[η]得到所述寿命η的均值E[η]与文件备份数量d的关系,绘制E[η]-d曲线,同时根据曲线拐点得到阈值θ,将数据网络中心中备份的数量d控制在阈值θ。
2.根据权利要求1所述的用于降低数据中心网络系统运行成本的方法,其特征在于,任意一个数据中心的寿命服从参数为λ的指数分布;数据中心加入到数据中心网络中为一个到达率为β的泊松过程;目标文件的数据从一个数据中心复制到另一个数据中心所需要的时间是服从参数为μ的指数分布。
3.根据权利要求2所述的用于降低数据中心网络系统运行成本的方法,其特征在于,目标数据在中心网络中的寿命η根据以下计算得出:
η=inf{t≥0:M(t)=0,N(t)∈{0,1,2,...}}
其中,N(t)表示正常运行数据中心数量,M(t)表示目标文件成功备份的数据中心数量。
4.根据权利要求1所述的用于降低数据中心网络系统运行成本的方法,其特征在于,所述第一无穷小生成元T的逆矩阵T-1根据以下步骤得出:
利用RG分解方法得到U-测度定义为
U0=A1,1,
Uk=Ak+1,k+1+Ak+1,k(-Uk-1)-1Ak,k+1,k=1,2,3,...;
R-测度定义为
Rk=Ak+1,k(-Uk-1)-1,k=1,2,3,...;
G-测度定义为
Gl=(-Ul)-1Al+1,l+2,l=0,1,2,....
依据U-测度、R-测度与G-测度,矩阵T存在RG-分解如下:
T=(I-RL)UD(I-GU),
其中
UD=diag(U0,U1,U2,...),
因此,无穷小生成元T的逆矩阵T-1
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011212615.2A CN112328430A (zh) | 2020-11-03 | 2020-11-03 | 一种用于降低数据中心网络系统运行成本的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011212615.2A CN112328430A (zh) | 2020-11-03 | 2020-11-03 | 一种用于降低数据中心网络系统运行成本的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112328430A true CN112328430A (zh) | 2021-02-05 |
Family
ID=74323340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011212615.2A Pending CN112328430A (zh) | 2020-11-03 | 2020-11-03 | 一种用于降低数据中心网络系统运行成本的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112328430A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101719013A (zh) * | 2009-11-19 | 2010-06-02 | 中兴通讯股份有限公司 | 一种降低有多个处理单元单板功耗的方法及装置 |
US20190188089A1 (en) * | 2017-12-18 | 2019-06-20 | International Business Machines Corporation | Forecast recommended backup destination |
CN110221909A (zh) * | 2019-06-13 | 2019-09-10 | 东北大学 | 一种基于负载预测的Hadoop计算任务推测执行方法 |
CN111291987A (zh) * | 2020-01-23 | 2020-06-16 | 广东电网有限责任公司计量中心 | 一种互感器寿命预测方法及装置 |
-
2020
- 2020-11-03 CN CN202011212615.2A patent/CN112328430A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101719013A (zh) * | 2009-11-19 | 2010-06-02 | 中兴通讯股份有限公司 | 一种降低有多个处理单元单板功耗的方法及装置 |
US20190188089A1 (en) * | 2017-12-18 | 2019-06-20 | International Business Machines Corporation | Forecast recommended backup destination |
CN110221909A (zh) * | 2019-06-13 | 2019-09-10 | 东北大学 | 一种基于负载预测的Hadoop计算任务推测执行方法 |
CN111291987A (zh) * | 2020-01-23 | 2020-06-16 | 广东电网有限责任公司计量中心 | 一种互感器寿命预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
马凡淇: "数据中心网络中数据复制安全及在智慧物流平台应用研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107844268B (zh) | 一种数据分发方法、数据存储方法、相关装置以及系统 | |
CN110750382B (zh) | 用于提高数据修复性能的最小存储再生码编码方法及系统 | |
CN108170555B (zh) | 一种数据恢复方法及设备 | |
CN111149093B (zh) | 分布式存储系统的数据编码、解码及修复方法 | |
US10949314B2 (en) | Method and apparatus for failure recovery of storage device | |
CN102981927A (zh) | 分布式独立冗余磁盘阵列存储方法及分布式集群存储系统 | |
CN111679939B (zh) | 数据备份方法及系统 | |
CN114281270B (zh) | 一种数据存储方法、系统、设备以及介质 | |
CN114153651B (zh) | 一种数据编码方法、装置、设备及介质 | |
Venkatesan et al. | Effect of codeword placement on the reliability of erasure coded data storage systems | |
CN115454712B (zh) | 一种校验码恢复方法、系统、电子设备及存储介质 | |
CN113505019A (zh) | 一种纠删码数据及校验恢复方法、装置、设备及可读介质 | |
CN115098295A (zh) | 数据局部恢复方法、设备及存储介质 | |
CN114968119A (zh) | 一种数据保护方法、装置、设备及存储介质 | |
CN108614749B (zh) | 一种数据处理方法及装置 | |
CN109947587B (zh) | 非均匀故障保护的分组修复码构造方法及故障修复方法 | |
CN112328430A (zh) | 一种用于降低数据中心网络系统运行成本的方法 | |
CN116501553A (zh) | 数据恢复方法、装置、系统、电子设备及存储介质 | |
CN115756955A (zh) | 一种数据备份、数据恢复的方法、装置及计算机设备 | |
CN114528139A (zh) | 数据处理和节点部署的方法、装置、电子设备及介质 | |
CN112015325B (zh) | 一种生成解码矩阵的方法、解码方法和对应装置 | |
CN112181974B (zh) | 标识信息分配方法、系统及存储设备 | |
CN116107797A (zh) | 数据存储方法及装置、电子设备和存储介质 | |
CN112463435A (zh) | 一种基于数据块访问频度的局部修复方法 | |
US20230341822A1 (en) | Redundant machine learning architecture for high-risk environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210205 |