CN106951675B - 一种最优点个数约束的数据流处理系统多目标优化方法 - Google Patents
一种最优点个数约束的数据流处理系统多目标优化方法 Download PDFInfo
- Publication number
- CN106951675B CN106951675B CN201710077717.XA CN201710077717A CN106951675B CN 106951675 B CN106951675 B CN 106951675B CN 201710077717 A CN201710077717 A CN 201710077717A CN 106951675 B CN106951675 B CN 106951675B
- Authority
- CN
- China
- Prior art keywords
- area
- throughput
- uncertain region
- current
- bound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种最优点个数约束的数据流处理系统多目标优化方法,属于计算机应用的实时大数据分析领域。根据用户所指定的响应延迟的上下界以及吞吐率的上下界,给出不确定区域面积;基于缩小不确定区域面积这一目标,将不确定区域一分为二,继续探测面积最大的不确定区域,直到迭代上限,进而高效地得到一组具有典型代表意义的帕累托最优解,且最大化的降低了整体的不确定区域面积,为用户在响应延迟和吞吐率上提供选择空间。针对数据流处理系统多目标优化问题,能够避免帕累托最优解随机的缺陷,高效地得到一组用户给定数量且具有典型代表意义的帕累托最优解,为用户在响应延迟和吞吐率上提供选择空间。
Description
技术领域
本发明涉及一种用于数据流处理系统的多目标优化方法,尤其涉及一种最优点个数约束的数据流处理系统多目标优化方法,属于计算机应用技术以及实时大数据分析领域。
背景技术
近年来涌现出大量实时性大数据分析应用,比如社交网络动态分析、智能交通数据分析、大规模数据中心监控、基因数据分析等。这类应用不但数据量大而且数据持续快速产生或更新,要求数据分析系统持续并实时的返回或更新分析结果,我们称之为实时大数据(Big&fast data)分析。此类应用对实时大数据分析系统具有迫切需求,需要系统对响应延迟、吞吐率方面给出量化保证。实时大数据分析系统的多目标优化对于提供有服务质量保障的实时大数据分析云服务、为国家关键行业及重要监控应用提供实时大数据分析平台及优化框架具有重要意义。
目前,实时大数据分析应用中用户对响应延迟以及吞吐率的要求,依赖于历史经验,由IT人员为数据流处理系统中的分析作业手工配置合适的执行计划,缺乏对实时大数据分析响应延迟和吞吐率的量化保证;即使经验丰富的IT人员也不能保证配置了较优的执行计划,从而导致分析作业运行效率低下,无法满足上层应用对实时性的要求。
已有的基于权重加和的多目标优化方法虽然解决了在一定条件约束下凸目标函数的响应延迟和吞吐率的帕累托最优问题,但不能解决凹目标函数情况的帕累托最优问题;另外基于权重加和的多目标优化方法返回给用户的解密度不等、难以解释且不具有代表性,用户实际上需要在帕累托曲线上有代表性的一组解。因此,基于权重加和的多目标优化方法不能满足IT人员交互场景下的多目标优化。实际应用中迫切需要一种在给定了帕累托最优点个数约束的情况下,选取给定数量的一组具有典型代表意义的帕累托最优解。
本方法针对实时大数据中两个重要的指标——响应延迟和吞吐率,而设计的多目标优化方法。基于给定的响应延迟和吞吐率模型,构建多目标优化方法,从而保证选取最优的执行计划。
发明内容
针对已有的基于权重加和的多目标优化方法中没有考虑用户在部署使用时在响应延迟和吞吐率上存在取舍的情况,而造成帕里托最优解随机的缺陷,提出了一种最优点个数约束的数据流处理系统多目标优化方法。
本发明要解决的技术问题是:针对数据流处理系统多目标优化问题,能够避免帕累托最优解随机的缺陷,高效地得到一组用户给定数量且具有典型代表意义的帕累托最优解,为用户在响应延迟和吞吐率上提供选择空间。
本发明的目的是通过下述技术方案实现的:
一种最优点个数约束的数据流处理系统多目标优化方法,根据用户所指定的响应延迟的上下界以及吞吐率的上下界,给出不确定区域面积;基于缩小不确定区域面积这一目标,将不确定区域一分为二,继续探测面积最大的不确定区域,直到迭代上限,进而高效地得到一组具有典型代表意义的帕累托最优解,且最大化的降低了整体的不确定区域面积,为用户在响应延迟和吞吐率上提供选择空间。
一种最优点个数约束的数据流处理系统多目标优化方法,包括如下步骤:
步骤1:输入当前响应延迟的上界、当前响应延迟的下界以及帕累托最优点个数上限,初始化当前迭代步数、不确定区域集合以及初始化最终探测结果组;
其中,当前响应延迟的上界,记为Lupper;当前响应延迟的下界,记为Llower;帕累托最优点个数上限,记为Stepmax;当前迭代步数,记为Stepnow,初始化为0,表达式为公式(1);不确定区域集合,记为Setarea,初始化为空集合,表达式为公式(2);最终探测结果组,记为plan,初始化为空集合,表达式为公式(3):
Stepnow=0; (1)
步骤2:分别根据步骤1的当前响应延迟的上界和当前延迟的下界计算当前吞吐率的上界和下界,具体为:
步骤2.1:根据当前响应延迟的上界计算当前吞吐率的上界,具体通过如下公式(4)计算:
其中,当前吞吐率的上界,即Tupper,s.t.代表约束;c代表具体系统配置;λ代表实时的输入数据率;Γ(c,λ)代表具体系统的参数配置c和实时的输入数据率λ条件下的吞吐率;ψ(c,λ)代表具体系统的参数配置c和实时的输入数据率λ条件下的响应延迟;公式(4)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于当前响应延迟的上界Lupper的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(4)中的代表此寻求过程,并记录最大吞吐率为Tupper,表示当前吞吐率的上界;
步骤2.2:根据当前响应延迟的下界计算当前吞吐率的下界,具体通过如下公式(5)计算如下:
其中,当前吞吐率的下界,记为Tlower,公式(5)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于当前响应延迟的下界Llower的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(5)中的代表此寻求过程,并记录最大吞吐率为Tlower,表示当前吞吐率的下界;
步骤3:分别根据当前响应延迟的上界和当前响应延迟的下界计算当前的探测响应延迟、最大探测吞吐率以及最大探测吞吐率的具体系统配置,具体为:
步骤3.1:根据Lupper和Llower,计算当前探测响应延迟,记为Lmiddle,具体通过如下公式(6)计算:
Lmiddle=(Llower+Lupper)/2; (6)
步骤3.2:根据步骤3.1计算出的当前探测响应延迟计算当前探测响应延迟的最大探测吞吐率和最大探测吞吐率的具体系统配置,分别记为Tmiddle、cmiddle,具体通过如下公式(7)计算:
其中,公式(7)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于等于当前探测延迟Lmiddle的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(7)中的代表此寻求过程,并记录探测响应的最大探测吞吐率为Tmiddle,以及最大化的具体系统配置cmiddle;
步骤4:计算当前探测结果组,并与最终探测结果组合并;
其中,最终探测结果组,记为plan;步骤4,具体为:
步骤4.1:根据当前的探测响应延迟Lmiddle、最大探测吞吐量Tmiddle以及最大探测吞吐率的具体系统配置cmiddle,计算当前探测结果组,记为planmiddle,具体通过如下公式(8)计算:
planmiddle={(Lmiddle,Tmiddle,cmiddle)}; (8)
步骤4.2:将当前探测结果组planmiddle与最终探测结果组plan合并,具体通过如下公式(9)计算:
plan=plan∪planmiddle; (9)
步骤5:根据当前的响应延迟的上界和当前的响应延迟的下界、吞吐率的上界和吞吐率的下界、探测响应延迟以及最大探测吞吐率Tmiddle,分别计算当前左半部分和右半部分的不确定区域面积;
其中,当前的响应延迟的上界,即Lupper;和当前的响应延迟的下界,记为Llower;吞吐率的上界,即Tupper;吞吐率的下界,即Tlower;探测响应延迟,即Lmiddle以及最大探测吞吐率,即Tmiddle;步骤5,具体为:
步骤5.1:根据当前的响应延迟的下界Llower和探测响应延迟Lmiddle以及当前的吞吐率的下界Tlower和最大探测吞吐率Tmiddle,计算当前左半部分的不确定区域面积,记为ualeft,具体通过如下公式(10)计算:
ualeft=(Lmiddle-Llower)×(Tmiddle-Tlower); (10)
步骤5.2:根据当前的响应延迟的上界Lupper和探测响应延迟Lmiddle以及当前的吞吐率的上界Tupper和最大探测吞吐率Tmiddle,计算当前右半部分的不确定区域面积,记为uaright,具体通过如下公式(11)计算:
uaright=(Lupper-Lmiddle)×(Tupper-Tmiddle); (11)
步骤6:根据步骤5输出的当前左半部分和右半部分的不确定区域面积计算所对应的不确定区域,并将不确定区域存储在不确定区域集合中;
其中,不确定区域集合,即Setarea;步骤6,具体为:
步骤6.1:通过如下公式(12)和(13)计算当前左半部分和右半部分的不确定区域面积所对应的不确定区域,分别记为arealeft和arearight:
arealeft={(Llower,Lmiddle,Tlower,Tmiddle,ualeft)}; (12)
arearight={(Lmiddle,Lupper,Tlower,Tmiddle,uaright)}; (13)
其中,在arealeft与arearight的一般结构体area中,第一个参数为不确定区域的响应延迟下界,记为area.Llower,第二个参数为不确定区域的响应延迟上界,记为area.Lupper,第三个参数为不确定区域的吞吐率下界,记为area.Tlower,第四个参数为不确定区域的吞吐率下界,记为area.Tupper,第五个参数为不确定区域的面积,记为area.ua;
步骤6.2:将左半部分不确定区域arealeft和arearight存储在不确定区域集合Setarea中,具体通过如下公式(14)计算:
Setarea=Setarea∪arealeft∪arearight; (14)
步骤7:在步骤6输出的不确定区域集合中,寻找不确定区域面积最大的不确定区域,并将此不确定区域面积最大的不确定区域从不确定区域集合中移除,具体为:
步骤7.1:在不确定区域集合Setarea中,寻找不确定区域面积最大的不确定区域,记为areamax,具体通过如下公式(15)计算:
其中,area代表不确定区域并属于不确定区域集合Setarea;上式反映的是,在不确定区域集合Setarea中,寻找不确定区域面积areaua最大的不确定区域areamax;
步骤7.2:将不确定区域面积最大的不确定区域areamax从不确定区域集合Setarea中移除,具体通过如下公式(16)计算:
Setarea=Setarea-areamax; (16)
步骤8:将当前迭代步数加1,即通过公式(17)修正:
Stepnow=Stepnow+1; (17)
其中,当前迭代步数,即Stepnow;
步骤9:判断是否达到帕累托最优点个数上限,决定是否继续进行迭代探测;
其中,帕累托最优点个数上限,即Stepmax;步骤9,具体为:
步骤9.1:若当前迭代步数Stepnow小于帕累托最优点个数上限Stepmax,则用不确定区域面积最大的不确定区域areamax来更新当前响应延迟的下界Llower和上界Lupper,当前吞吐率的下界Tlower和上界Tupper,具体通过公式(18)到公式(21)进行更新;再跳至步骤3:
Llower=areamax.Llower; (18)
Lupper=areamax.Lupper; (19)
Tlower=areamax.Tlower; (20)
Tupper=areamax.Tupper; (21)
步骤9.2:若当前迭代步数Stepnow大于或等于帕累托最优点个数上限Stepmax,则终止迭代,并返回最终探测结果组plan,即为数据流处理系统多目标优化的一组具有典型代表意义的帕累托最优解;
至此,从步骤1到步骤9,完成了一种最优点个数约束的数据流处理系统多目标优化方法。
有益效果
本发明一种最优点个数约束的数据流处理系统多目标优化方法,与其他多目标优化方法相比,具有如下有益效果:
1.本发明所提方法基于响应延迟的上下界,基于帕累托最优点与约束最优化解的关系,使用有限步数来确定探测深度;
2.本发明所述方法基于缩小不确定区域面积这一目标,通过贪心的方法每次探测不确定区域面积最大的部分,提高探测具有典型代表意义帕累托最优解的效率;
3.本发明所述方法能够在用户指定的响应延迟或吞吐率范围内,返回一系列有意义且具有代表性的帕里托最优解,确保用户能在该范围内接受想要的最优解;
4.本发明所述方法,适用于不同的实时大数据分析系统多目标优化场景中,应用范围广,实用性强,易于推广;
5.本发明所述方法,只针对数据本身进行处理,能够得到一组具有典型代表意义的帕累托最优解,而不受限于数据的来源,适用于对所有的工程应用中的数据的处理。
附图说明
图1为本发明“一种最优点个数约束的数据流处理系统多目标优化方法”中的本方法及实施例1中的流程示意图;
图2为本发明“一种最优点个数约束的数据流处理系统多目标优化方法”实施例1中的本方法与权重加和的实验对比图。
具体实施方式
下面根据附图及实施例对本发明进行详细说明,但本发明的具体实施形式并不局限于此。
实施例1
本实施例阐述了将本发明“一种最优点个数约束的数据流处理系统多目标优化方法”应用于具体的实时大数据分析系统Apache Spark Streaming场景下的流程。
图1为本方法的算法流程图以及本实施例的流程图。从图中可以看出,本方法包含如下步骤:
步骤A:当前响应延迟的上界Lupper被初始化为10.0,当前响应延迟的下界Llower被初始化为0.5,帕累托最优点个数上限Stepmax被初始化为20,当前迭代步数Stepnow被初始化为0,表达式为公式(1),不确定区域集合Setarea被初始化为空集合,表达式为公式(2);最终探测结果组plan被初始化为空集合,表达式为公式(3):
步骤B:分别根据步骤A的当前响应延迟的上界10.0和下界0.5,分别计算当前吞吐率的上界和下界,具体为:
步骤B.1:根据当前响应延迟的上界10.0,计算当前吞吐率的上界Tupper为1677367.1230139078,具体通过如下公式(22)计算:
其中,当前吞吐率的上界,即Tupper,s.t.代表约束;c代表具体系统配置;λ代表实时的输入数据率;Γ(c,λ)代表具体系统的参数配置c和实时的输入数据率λ条件下的吞吐率;ψ(c,λ)代表具体系统的参数配置c和实时的输入数据率λ条件下的响应延迟;公式(22)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于当前响应延迟的上界Lupper的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(22)中的代表此寻求过程,并记录最大吞吐率为Tupper,表示当前吞吐率的上界;
步骤B.2:根据当前响应延迟的下界0.5,计算当前吞吐率的下界Tlower为1288034.188034188,具体通过公式(23)计算如下:
其中,当前吞吐率的下界,记为Tlower,公式(23)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于当前响应延迟的下界Llower的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(23)中的代表此寻求过程,并记录最大吞吐率为Tlower,表示当前吞吐率的下界;
步骤C:分别根据当前响应延迟的上界10.0和下界0.5,计算当前的探测响应延迟Lmiddle、最大探测吞吐率Tmiddle以及最大探测吞吐率的具体系统配置cmiddle,具体为:
步骤C.1:根据当前响应延迟的上界10.0和下界0.5,计算当前探测响应延迟Lmiddle为5.25,具体通过如下公式(24)计算:
Lmiddle=(Llower+Lupper)/2=(10.0+0.5)/2=5.25; (24)
步骤C.2:根据步骤C.1计算出的当前探测响应延迟5.25,计算当前探测响应延迟的最大探测吞吐率Tmiddle和最大探测吞吐率的具体系统配置cmiddle,分别为1674561.0772396186、c1,具体通过如下公式(25)计算:
其中,公式(25)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于等于当前探测延迟Lmiddle的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(25)中的代表此寻求过程,并记录探测响应的最大探测吞吐率为Tmiddle,以及最大化的具体系统配置cmiddle;
步骤D:计算当前探测结果组planmiddle,并与最终探测结果组plan合并。
步骤D.1:根据当前的探测响应延迟5.25、最大探测吞吐量1674561.0772396186以及最大探测吞吐率的具体系统配置c1,计算当前探测结果组planmiddle为{(5.25,1674561.0772396186,c1)},具体通过如下公式(26)计算:
步骤D.2:将当前探测结果组{(5.25,1674561.0772396186,c1)}与最终探测结果组plan合并,具体通过如下公式(27)计算:
步骤E:根据当前的响应延迟的上界10.0和下界0.5、吞吐率的上界1677367.1230139078和下界1288034.188034188、探测响应延迟5.25以及最大探测吞吐率1674561.0772396186,分别计算当前左半部分和右半部分的不确定区域面积。
步骤E.1:根据当前的响应延迟的下界0.5和探测响应延迟5.25以及当前的吞吐率的下界1288034.188034188和最大探测吞吐率1674561.0772396186,计算当前左半部分的不确定区域面积ualeft为183600.2723725793,具体通过如下公式(28)计算:
步骤E.2:根据当前的响应延迟的上界10.0和探测响应延迟5.25以及当前的吞吐率的上界1677367.1230139078和最大探测吞吐率1674561.0772396186,计算当前右半部分的不确定区域面积uaright为13328.71742787275,具体通过如下公式(29)计算:
步骤F:根据步骤E输出的当前左半部分和右半部分的不确定区域面积计算所对应的不确定区域,并将不确定区域存储在不确定区域集合Setarea中。
步骤F.1:计算当前左半部分和右半部分的不确定区域面积所对应的不确定区域,分别为{(0.5,5.25,1288034.188034188,1674561.0772396186,183600.2723725793)}、{(5.25,10.0,1674561.0772396186,1677367.1230139078,13328.71742787275)},计算公式如下:
其中,在arealeft与arearight的一般结构体area中,第一个参数为不确定区域的响应延迟下界,记为area.Llower,第二个参数为不确定区域的响应延迟上界,记为area.Lupper,第三个参数为不确定区域的吞吐率下界,记为area.Tlower,第四个参数为不确定区域的吞吐率下界,记为area.Tupper,第五个参数为不确定区域的面积,记为area.ua。
步骤F.2:将左半部分不确定区域
{(0.5,5.25,1288034.188034188,1674561.0772396186,183600.2723725793)}和
{(5.25,10.0,1674561.0772396186,1677367.1230139078,13328.71742787275)}
存储在不确定区域集合Setarea中,通过如下公式(32)计算:
步骤G:在步骤F输出的不确定区域集合Setarea中,寻找不确定区域面积最大的不确定区域,并将其从不确定区域集合Setarea中移除。
步骤G.1:在不确定区域集合Setarea中,寻找不确定区域面积最大的不确定区域为areamax为{(0.5,5.25,1288034.188034188,1674561.0772396186,183600.2723725793)},具体通过公式(15)计算;
其中,area代表不确定区域并属于不确定区域集合Setarea;上式反映的是,在不确定区域集合Setarea中,寻找不确定区域面积areaua最大的不确定区域areamax。
步骤G.2:将不确定区域面积最大的不确定区域{(0.5,5.25,1288034.188034188,1674561.0772396186,183600.2723725793)}从不确定区域集合Setarea中移除,具体通过如下公式(33)计算:
步骤H:将当前迭代步数加1,即通过公式(34)修正:
步骤I:判断是否达到帕累托最优点个数上限20,决定是否继续进行迭代探测。
步骤I.1:若当前迭代步数1小于帕累托最优点个数上限20,则用不确定区域面积最大的不确定区域
{(0.5,5.25,1288034.188034188,1674561.0772396186,183600.2723725793)}
来更新当前响应延迟的下界Llower为0.5和上界Lupper为5.25,当前吞吐率的下界Tlower为1288034.188034188和上界Tupper为1674561.0772396186,具体通过公式(35)到公式(38)进行更新;再跳至步骤C:
步骤I.2:若当前迭代步数1大于或等于帕累托最优点个数上限20,则终止迭代,并返回最终探测结果组plan,即为数据流处理系统多目标优化的一组具有典型代表意义的帕累托最优解;
至此,从步骤A到步骤I,完成了本实施例一种最优点个数约束的数据流处理系统多目标优化方法。
本方法与权重加和的实验对比图如图2所示。其中,横坐标代表响应延迟(秒),纵坐标代表吞吐率(百万条/秒),图中的点代表某响应延迟下所能取得的最大吞吐率,即帕累托最优解。图2(a)表示,权重加和方法,图2(b)表示本方法。从图2中可以看出,权重加和的帕累托最优解集中于小部分的区域内,不能表示响应延迟与吞吐率在整个空间内的分布情况,不能提供给用户一组具有典型代表意义的帕累托最优解;本方法的解集在整个空间内分布均匀,能为用户提供响应延迟与吞吐率的多种最优选择,即能提供给用户一组具有典型代表意义的帕累托最优解。
实施例2
将实施例1中的具体的实时大数据分析系统Apache Spark Streaming改成其他实时大数据分析系统如Apache Storm、Google Dataflow等,即本发明所提出的多目标优化方法不受限于数据的来源,适用于对所有的工程应用中的数据的处理。
上述实施方式中未述及的有关技术内容采取或借鉴已有技术即可实现。
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。
Claims (10)
1.一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:要解决的技术问题是:针对数据流处理系统多目标优化问题,能够避免帕累托最优解随机的缺陷,高效地得到一组用户给定数量且具有典型代表意义的帕累托最优解,为用户在响应延迟和吞吐率上提供选择空间;具体根据用户所指定的响应延迟的上下界以及吞吐率的上下界,给出不确定区域面积;基于缩小不确定区域面积这一目标,将不确定区域一分为二,继续探测面积最大的不确定区域,直到迭代上限,进而高效地得到一组具有典型代表意义的帕累托最优解,且最大化的降低了整体的不确定区域面积,为用户在响应延迟和吞吐率上提供选择空间;包括如下步骤:
步骤1:输入当前响应延迟的上界、当前响应延迟的下界以及帕累托最优点个数上限,初始化当前迭代步数、不确定区域集合以及初始化最终探测结果组;
步骤2:分别根据步骤1的当前响应延迟的上界和当前延迟的下界计算当前吞吐率的上界和下界;
步骤3:分别根据当前响应延迟的上界和当前响应延迟的下界计算当前的探测响应延迟、最大探测吞吐率以及最大探测吞吐率的具体系统配置;
步骤4:计算当前探测结果组,并与最终探测结果组合并;
步骤5:根据当前的响应延迟的上界和当前的响应延迟的下界、吞吐率的上界和吞吐率的下界、探测响应延迟以及最大探测吞吐率分别计算当前左半部分和右半部分的不确定区域面积;
步骤6:根据步骤5输出的当前左半部分和右半部分的不确定区域面积计算所对应的不确定区域,并将不确定区域存储在不确定区域集合中;
步骤7:在步骤6输出的不确定区域集合中,寻找不确定区域面积最大的不确定区域,并将此不确定区域面积最大的不确定区域从不确定区域集合中移除;
步骤8:将当前迭代步数加1;
步骤9:判断是否达到帕累托最优点个数上限,决定是否继续进行迭代探测;
至此,从步骤1到步骤9,完成了一种最优点个数约束的数据流处理系统多目标优化方法。
2.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤1中,当前响应延迟的上界,记为Lupper;当前响应延迟的下界,记为Llower;帕累托最优点个数上限,记为Stepmax;当前迭代步数,记为Stepnow,初始化为0,表达式为公式(1);不确定区域集合,记为Setarea,初始化为空集合,表达式为公式(2);最终探测结果组,记为plan,初始化为空集合,表达式为公式(3):
Stepnow=0; (1)
3.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤2,具体为:
步骤2.1:根据当前响应延迟的上界计算当前吞吐率的上界,具体通过如下公式(4)计算:
其中,当前吞吐率的上界,即Tupper,s.t.代表约束;c代表具体系统配置;λ代表实时的输入数据率;Γ(c,λ)代表具体系统的参数配置c和实时的输入数据率λ条件下的吞吐率;ψ(c,λ)代表具体系统的参数配置c和实时的输入数据率λ条件下的响应延迟;公式(4)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于当前响应延迟的上界Lupper的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(4)中的代表此寻求过程,并记录最大吞吐率为Tupper,表示当前吞吐率的上界;
步骤2.2:根据当前响应延迟的下界计算当前吞吐率的下界,具体通过如下公式(5)计算如下:
其中,当前吞吐率的下界,记为Tlower,公式(5)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于当前响应延迟的下界Llower的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(5)中的代表此寻求过程,并记录最大吞吐率为Tlower,表示当前吞吐率的下界。
4.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤3,具体为:
步骤3.1:根据Lupper和Llower,计算当前探测响应延迟,记为Lmiddle,具体通过如下公式(6)计算:
Lmiddle=(Llower+Lupper)/2; (6)
步骤3.2:根据步骤3.1计算出的当前探测响应延迟计算当前探测响应延迟的最大探测吞吐率和最大探测吞吐率的具体系统配置,分别记为Tmiddle、cmiddle,具体通过如下公式(7)计算:
其中,公式(7)反映的是给定输入数据率λ,在满足响应延迟ψ(c,λ)小于等于当前探测延迟Lmiddle的一组具体系统的参数配置c中,寻求能使吞吐率Γ(c,λ)最大化的具体系统配置c,即公式(7)中的代表此寻求过程,并记录探测响应的最大探测吞吐率为Tmiddle,以及最大化的具体系统配置cmiddle。
5.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤4中,最终探测结果组,记为plan;步骤4,具体为:
步骤4.1:根据当前的探测响应延迟Lmiddle、最大探测吞吐量Tmiddle以及最大探测吞吐率的具体系统配置cmiddle,计算当前探测结果组,记为planmiddle,具体通过如下公式(8)计算:
planmiddle={(Lmiddle,Tmiddle,cmiddle)}; (8)
步骤4.2:将当前探测结果组planmiddle与最终探测结果组plan合并,具体通过如下公式(9)计算:
plan=plan∪planmiddle; (9)。
6.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤5中,当前的响应延迟的上界,即Lupper;和当前的响应延迟的下界,记为Llower;吞吐率的上界,即Tupper;吞吐率的下界,即Tlower;探测响应延迟,即Lmiddle以及最大探测吞吐率,即Tmiddle;步骤5,具体为:
步骤5.1:根据当前的响应延迟的下界Llower和探测响应延迟Lmiddle以及当前的吞吐率的下界Tlower和最大探测吞吐率Tmiddle,计算当前左半部分的不确定区域面积,记为ualeft,具体通过如下公式(10)计算:
ualeft=(Lmiddle-Llower)×(Tmiddle-Tlower); (10)
步骤5.2:根据当前的响应延迟的上界Lupper和探测响应延迟Lmiddle以及当前的吞吐率的上界Tupper和最大探测吞吐率Tmiddle,计算当前右半部分的不确定区域面积,记为uaright,具体通过如下公式(11)计算:
uaright=(Lupper-Lmiddle)×(Tupper-Tmiddle); (11)。
7.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤6中,不确定区域集合,即Setarea;步骤6,具体为:
步骤6.1:通过如下公式(12)和(13)计算当前左半部分和右半部分的不确定区域面积所对应的不确定区域,分别记为arealeft和arearight:
arealeft={(Llower,Lmiddle,Tlower,Tmiddle,ualeft)}; (12)
arearight={(Lmiddle,Lupper,Tlower,Tmiddle,uaright)}; (13)
其中,在arealeft与arearight的一般结构体area中,第一个参数为不确定区域的响应延迟下界,记为area.Llower,第二个参数为不确定区域的响应延迟上界,记为area.Lupper,第三个参数为不确定区域的吞吐率下界,记为area.Tlower,第四个参数为不确定区域的吞吐率下界,记为area.Tupper,第五个参数为不确定区域的面积,记为area.ua;
步骤6.2:将左半部分不确定区域arealeft和arearight存储在不确定区域集合Setarea中,具体通过如下公式(14)计算:
Setarea=Setarea∪arealeft∪arearight (14)。
8.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤7,具体为:
步骤7.1:在不确定区域集合Setarea中,寻找不确定区域面积最大的不确定区域,记为areamax,具体通过如下公式(15)计算:
其中,area代表不确定区域并属于不确定区域集合Setarea;上式反映的是,在不确定区域集合Setarea中,寻找不确定区域面积areaua最大的不确定区域areamax;
步骤7.2:将不确定区域面积最大的不确定区域areamax从不确定区域集合Setarea中移除,具体通过如下公式(16)计算:
Setarea=Setarea-areamax (16)。
9.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤8即通过公式(17)修正:
Stepnow=Stepnow+1; (17)
其中,当前迭代步数,即Stepnow。
10.根据权利要求1所述的一种最优点个数约束的数据流处理系统多目标优化方法,其特征在于:步骤9中,帕累托最优点个数上限,即Stepmax;步骤9,具体为:
步骤9.1:若当前迭代步数Stepnow小于帕累托最优点个数上限Stepmax,则用不确定区域面积最大的不确定区域areamax来更新当前响应延迟的下界Llower和上界Lupper,当前吞吐率的下界Tlower和上界Tupper,具体通过公式(18)到公式(21)进行更新;再跳至步骤3:
Llower=areamax.Llower; (18)
Lupper=areamax.Lupper; (19)
Tlower=areamax.Tlower; (20)
Tupper=areamax.Tupper; (21)
步骤9.2:若当前迭代步数Stepnow大于或等于帕累托最优点个数上限Stepmax,则终止迭代,并返回最终探测结果组plan,即为数据流处理系统多目标优化的一组具有典型代表意义的帕累托最优解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710077717.XA CN106951675B (zh) | 2017-02-14 | 2017-02-14 | 一种最优点个数约束的数据流处理系统多目标优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710077717.XA CN106951675B (zh) | 2017-02-14 | 2017-02-14 | 一种最优点个数约束的数据流处理系统多目标优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106951675A CN106951675A (zh) | 2017-07-14 |
CN106951675B true CN106951675B (zh) | 2019-07-23 |
Family
ID=59465855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710077717.XA Expired - Fee Related CN106951675B (zh) | 2017-02-14 | 2017-02-14 | 一种最优点个数约束的数据流处理系统多目标优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106951675B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1855141A (zh) * | 2005-04-28 | 2006-11-01 | 通用电气公司 | 用于执行基于模型的多目标资产优化和决策的方法和系统 |
CN104156483A (zh) * | 2014-08-26 | 2014-11-19 | 天津大学 | 基于蚁群算法的地理信息多目标帕累托解的可视化方法 |
CN104252383A (zh) * | 2014-09-16 | 2014-12-31 | 江苏科技大学 | 基于混沌粒子群算法的可重构计算的软硬件任务划分方法 |
CN104537432A (zh) * | 2014-12-16 | 2015-04-22 | 华南理工大学 | 基于证据推理的电力系统多目标优化调度的决策方法 |
CN104765967A (zh) * | 2015-04-20 | 2015-07-08 | 中国人民解放军国防科学技术大学 | 一种离网混合可再生能源系统的多目标优化设计方法 |
-
2017
- 2017-02-14 CN CN201710077717.XA patent/CN106951675B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1855141A (zh) * | 2005-04-28 | 2006-11-01 | 通用电气公司 | 用于执行基于模型的多目标资产优化和决策的方法和系统 |
CN104156483A (zh) * | 2014-08-26 | 2014-11-19 | 天津大学 | 基于蚁群算法的地理信息多目标帕累托解的可视化方法 |
CN104252383A (zh) * | 2014-09-16 | 2014-12-31 | 江苏科技大学 | 基于混沌粒子群算法的可重构计算的软硬件任务划分方法 |
CN104537432A (zh) * | 2014-12-16 | 2015-04-22 | 华南理工大学 | 基于证据推理的电力系统多目标优化调度的决策方法 |
CN104765967A (zh) * | 2015-04-20 | 2015-07-08 | 中国人民解放军国防科学技术大学 | 一种离网混合可再生能源系统的多目标优化设计方法 |
Non-Patent Citations (2)
Title |
---|
一种基于多目标协同策略的多学科集成设计数据流解耦方法及应用;肖飞等;《计算机集成制造系统》;20121231;第18卷(第12期);全文 |
混合分解和强度帕累托多目标进化算法;邱兴兴等;《计算机应用》;20141010;第34卷(第10期);全文 |
Also Published As
Publication number | Publication date |
---|---|
CN106951675A (zh) | 2017-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102929989B (zh) | 一种地理空间数据在云计算平台上的负载均衡方法 | |
CN106375120B (zh) | 一种it基础设施快速拓扑方法及装置 | |
CN114399227A (zh) | 一种基于数字孪生的生产调度方法、装置及计算机设备 | |
WO2017129033A1 (zh) | 一种问题推荐方法及设备 | |
WO2022247955A1 (zh) | 非正常账号识别方法、装置、设备和存储介质 | |
CN109543739A (zh) | 一种日志分类方法、装置、设备及可读存储介质 | |
CN105045806B (zh) | 一种面向分位数查询的概要数据动态分裂与维护方法 | |
CN109002928A (zh) | 一种基于贝叶斯网络模型的电力负荷峰值预测方法和装置 | |
CN108038734B (zh) | 基于点评数据的城市商业设施空间分布探测方法及系统 | |
CN111062511B (zh) | 基于决策树与神经网络的水产养殖病害预测方法及系统 | |
Yuan et al. | Edge-dual graph preserving sign prediction for signed social networks | |
TW202001611A (zh) | 多元流動網路之可靠度計算方法及其系統 | |
Hu et al. | Construction of digital twin system for cold chain logistics stereo warehouse | |
CN106951675B (zh) | 一种最优点个数约束的数据流处理系统多目标优化方法 | |
CN108037739A (zh) | Pcb产品的过程管控方法和系统 | |
CN105468726B (zh) | 基于本地计算和分布式计算的数据计算方法及系统 | |
Rui et al. | Context-based intelligent scheduling and knowledge push algorithms for ar-assist communication network maintenance | |
CN112182794A (zh) | 一种基于样条曲线的拓扑优化后几何模型建模方法 | |
CN107239343A (zh) | 数据处理方法及装置 | |
CN103793504B (zh) | 一种基于用户偏好与项目属性的聚类初始点选择方法 | |
CN111368060A (zh) | 对话机器人的自学习方法、装置、系统、电子设备及介质 | |
CN108924196A (zh) | 工业互联网绿色能源管理系统 | |
CN114625725A (zh) | 一种空气监测数据的可视化方法、系统、设备及介质 | |
CN107122485A (zh) | 一种车型数据拆分匹配方法及设备 | |
Jinyang | Application of data mining in logistics industry in the era of big data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190723 Termination date: 20200214 |