CN106909452B - 并行程序运行时参数优化方法 - Google Patents

并行程序运行时参数优化方法 Download PDF

Info

Publication number
CN106909452B
CN106909452B CN201710127844.6A CN201710127844A CN106909452B CN 106909452 B CN106909452 B CN 106909452B CN 201710127844 A CN201710127844 A CN 201710127844A CN 106909452 B CN106909452 B CN 106909452B
Authority
CN
China
Prior art keywords
parameter
parameters
program
experiment
experimental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710127844.6A
Other languages
English (en)
Other versions
CN106909452A (zh
Inventor
孙广中
史腾飞
周英华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201710127844.6A priority Critical patent/CN106909452B/zh
Publication of CN106909452A publication Critical patent/CN106909452A/zh
Application granted granted Critical
Publication of CN106909452B publication Critical patent/CN106909452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种并行程序运行时参数优化方法,包括:利用一次一因子实验方法进行预备实验,获得程序性能受单个参数变化的影响,从而筛选出对程序性能影响超出预定目标的参数及其参数值;利用均匀实验方法,从预备实验筛选出的参数中粗筛选出当前最优的参数组合;在粗筛选出最优的参数组合中的各参数取值附近再取一定量的参数值,并利用正交实验方法分析出各个参数及其参数值对实验指标的贡献大小,进而确定最终的最优参数组合。该方法,可以获得并行程序在具体硬件平台下最优的参数组合,可以将该参数组合推荐给超算用户,使超算用户作业在该参数组合下运行,优化应用程序执行效率,从而提高超算系统平台整体吞吐率。

Description

并行程序运行时参数优化方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种并行程序运行时参数优化方法。
背景技术
MPI(Message Passing Interface)是由全世界工业、科研和政府部门联合建立的一个消息传递编程标准,提供了大多数并行应用与硬件之间的接口,是高性能计算领域并行程序开发的事实标准,被广泛应用于分布式以及共享内存系统。OpenMPI是一个基于组件结构的MPI具体实现,实现了MPI-1和MPI-2标准,并且是开源的。OpenMPI设计集中在theModular Component Architecture(MCA),其是一个软件层,提供了对OpenMPI框架的管理服务。MCA提供的管理服务可以将从高层抽象(mpirun)接收的运行时参数传递到底层相应的框架。MCA运行时参数可以使系统管理员、终端用户以及开发者调优应用程序以及系统的性能,而不需要重新编译MPI应用程序。
在超算系统平台下的应用程序有很多,应用涉及多个领域,不同领域的用户利用相应的应用程序解决其研究问题。为了解决输入不同的问题,同一个应用程序会被用户反复执行。通过优化应用程序,可以提高其执行效率,从而提高超算系统平台的整体吞吐率。
集群计算环境,尽管成为了高性能计算平台的主要选择,但是其复杂性不断增加。在集群平台上MPI应用程序要获得很好的性能是很容易的,但是要获得最好的MPI性能仍然是一项异常困难的任务,需要对系统的软件、硬件的所有层次进行最大化调优。可调的运行时参数可以对MPI应用程序带来可观的性能提升,但同时运行时参数的配置集合以及相应的优化空间相当庞大,探索MPI应用程序的整个优化空间需要在大量参数组合下执行MPI应用程序,其执行次数随运行时参数的数量呈指数增长。目前,调优MPI应用程序运行时参数还没有较为完善的技术方案。
发明内容
本发明的目的是提供一种并行程序运行时参数优化方法,可以获得并行程序在具体硬件平台下最优的参数组合,可以将该参数组合推荐给超算用户,使超算用户作业在该参数组合下运行,优化应用程序执行效率,从而提高超算系统平台整体吞吐率。
本发明的目的是通过以下技术方案实现的:
一种并行程序运行时参数优化方法,包括:
利用一次一因子实验方法进行预备实验,获得程序性能受单个参数变化的影响,从而筛选出对程序性能影响超出预定目标的参数及其参数值;
利用均匀实验方法,从预备实验筛选出的参数中粗筛选出当前最优的参数组合;
在粗筛选出最优的参数组合中的各参数取值附近再取一定量的参数值,并利用正交实验方法分析出各个参数及其参数值对实验指标的贡献大小,进而确定最终的最优参数组合。
所述实验指标为程序运行时间,并行程序的各个参数作为实验因素,并行程序的各个参数的不同取值作为对应实验因素的水平,各个实验因素在某个水平上进行取值得到的一组搭配情况作为实验点,对每个实验点依次进行实验,研究实验因素对实验指标的影响,从而确定最优参数组合,使并行程序在该最优参数组合下运行时间最少。
筛选出对程序性能影响超出预定目标的参数的步骤包括:
对每个参数选择初始参数值,即为每个可调参数赋予一个初始值;
在保持其他参数在初始参数值不变的条件下,让每一个参数在其所允许的范围内进行连续变动;
当所有的实验都做完后,获得程序性能受单个参数的水平变化的影响,从而筛选出对程序性能影响超出预定目标的参数及其参数值。
所述利用均匀实验方法从预备实验筛选出的参数中粗筛选出当前最优的参数组合的步骤包括:
根据所选参数的个数与各参数的参数值个数,确定相应的均匀表,进而确定实验方案;
根据实验方案,在每组参数的不同参数值组合下运行程序;
将最优的实验结果对应的参数组及其参数值,作为粗筛选出的当前最优的参数组合。
所述确定最终的最优参数组合的步骤包括:
针对粗筛选出最优的参数组合,各参数分别再取一定数量的参数值,所取的参数值在当前最优的参数组合中对应参数的参数值附近,所取的参数值作为对应参数的水平,再根据粗筛选出最优的参数组合中参数的个数与调整后的各参数的水平个数,确定相应的正交表,进而确定实验方案;
根据实验方案,在每组参数的不同参数值组合下运行程序;
计算性能增量,以性能增量作为参数对程序性能的贡献率,统计各个参数的不同参数值的贡献率,筛选出每一参数贡献率最高的参数值,并作为最终的最优参数组合,其中性能增量记为S=(t1-t2)/t2,t1为默认参数组合下程序运行时间,t2为优化参数组合下程序运行时间。
由上述本发明提供的技术方案可以看出,利用均匀实验方法,作粗筛选,可以有效地减少实验次数,同时获得了程序的特征数据。利用正交实验方法,作细筛选,可以有效地简化均匀实验结果的分析工作,同时可以进一步优化并行程序运行时参数组合。此外,本发明中的实验是在具体硬件平台下,针对特定应用程序进行的,实验数据可以很好地反应硬件平台以及应用程序的特征。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种并行程序运行时参数优化方法的流程图;
图2为本发明实施例提供的通过预备实验筛选出对程序性能影响超出预定目标的参数的流程图;
图3为本发明实施例提供的通过均匀实验方法粗筛选出当前最优的参数组合的流程图;
图4为本发明实施例提供的通过正交实验方法确定最优参数组合的流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明的目的是提供一种并行程序运行时参数优化的方法,在集群平台上MPI应用程序要获得很好的性能是很容易的,但是要获得最好的MPI性能仍然是一项异常困难的任务,需要对系统的软件、硬件的所有层次进行最大化调优。本发明主要针对OpenMPI参数进行优化。虽然,超算系统下的应用程序有很多历史运行数据,但是这些数据并不涉及本发明所优化的OpenMPI参数,或者这些数据所涉及的OpenMPI参数并不全面,历史运行数据不能直接用于本发明。
如何在大量的参数组合中选择出可使并行程序运行时间最少的参数组合,既是一个理论问题,又是一个实际应用问题。这个问题其实是一个多因素实验问题,在本发明实施例中,程序运行时间可作为实验指标,OpenMPI各参数可作为实验因素,OpenMPI各参数的不同取值可作为对应因素的水平,各个实验因素在某个水平上进行取值得到的一组搭配情况可作为实验点,对每个实验点依次进行实验,研究实验因素对实验指标的影响,从而确定最优参数组合,使并行程序在该参数组合下运行时间最少。
该多因素实验问题满足如下特性:
1.实验因素的水平个数不等。
2.实验点有限,具有可操作性,即只能用有限的时间来完成实验。
本发明实施例提供的一种并行程序运行时参数优化方法如图1所示,其主要包括:
步骤11、利用一次一因子实验方法进行预备实验,获得程序性能受单个参数变化的影响,从而筛选出对程序性能影响超出预定目标的参数以及相应的参数值。
本发明实施例中,所述并行程序的MPI接口的具体实现为OpenMPI,由于OpenMPI参数有许多,在特定的硬件环境下,有些参数对并行程序性能有影响,有些参数没有影响。利用一次一因子实验方法进行预备实验,可以反映出程序性能如何受单个参数的水平(参数值)变化的影响,从而优选出一些对并行程序性能有较大影响(即对程序性能影响超出预定目标)的参数。
本步骤的具体过程如图2所示,主要过程如下:
对每个参数(实验因素)选择初始参数值(初始水平),即为每个可调参数赋予一个初始值;
在保持其他参数在初始参数值不变的条件下,让每一个参数在其所允许的范围内进行连续变动;
当所有的实验都做完后,获得程序性能受单个参数的参数值变化的影响,从而筛选出对程序性能影响超出预定目标的参数以及相应的参数值。
步骤12、利用均匀实验方法,从预备实验筛选出的参数中粗筛选出当前最优的参数组合。
对于预备实验选择的OpenMPI参数,部分参数取值连续,取值范围很大,从中可以取多个值作为该参数的水平,并行程序在这些参数的不同组合下可能会表现出更优的性能,由于一次一因子实验的实验点仅局限于局部区域,不能反映参数组合的全面情况,而要穷举出所有的参数组合会是指数时间,这又使得实验不具有可操作性。如果利用正交实验方法优化并行程序的OpenMPI参数,虽然其实验点代表性强,可以反映参数组合的全面情况,不过其实验次数为参数的水平个数的平方,对于参数的水平个数比较多且耗时较多的并行程序,完成实验所需的时间依然无法承受。而如果利用均匀实验方法优化并行程序的OpenMPI参数,其实验点分散均匀,可以反映参数组合的全面情况,同时其实验次数与参数的水平个数相同,大大减少了实验次数,缩短了实验时间。因此,本发明实施例中利用均匀实验在很大范围内进行筛选。
本步骤的具体过程如图3所示,主要过程如下:
根据所选参数的个数与各参数的参数值个数(水平个数),确定相应的均匀表,进而确定实验方案。
根据实验方案,在每组参数的不同参数值组合下运行程序;
将最优的实验结果对应的参数组及其参数值,作为粗筛选出的当前最优的参数组合。
通过上述均匀实验方法可以粗筛选出当前最优的参数组合,其包含了若干参数以及每一参数对应的参数值(即水平)。
均匀实验中所用到的均匀表是利用数论中的一致分布理论精心设计,而且应用数论方法使实验点在积分范围内散布得十分均匀,并使分布点离被积函数的各种值充分接近,便于计算机统计建模。均匀表具有如下性质:
1.每个实验因素的每个水平做一次且仅做一次实验。
2.任两个实验因素的实验点点在平面的格子点上,每行每列有且仅有一个实验点。
3.任两列组成的实验方案一般并不等价。
步骤13、针对粗筛选出最优的参数组合,各参数分别再取一定数量的参数值,所取的参数值在该最优参数组合中对应参数的参数值附近,所取的参数值作为对应参数的水平,并利用正交实验方法分析出各个参数及其参数值对实验指标的贡献大小,进而确定最终的最优参数组合。
均匀实验的结果分析要利用回归模型,对研究人员要求高,需要具备相当的数理统计知识,而回归模型到底好不好,还要看实际效果。为了简化均匀实验的分析工作,同时由于均匀实验的实验点分散均匀,实验中的最优参数组合离全局最优的参数组合不是很远,所以对粗筛选得到的实验中当前最优的参数组合,在其参数水平附近再取少量的水平,设计正交实验,作细筛选。通过简单的直观分析就可以分析出各参数及其参数值对实验指标的贡献大小,进而确定最终的最优参数组合。
本步骤的具体过程如图4所示,主要过程如下:
针对粗筛选出最优的参数组合,各参数分别再取一定数量的参数值,所取的参数值在当前最优参数组合中对应参数的参数值附近(即预定范围),所取的参数值作为对应参数的水平,再根据最优的参数组合中参数的个数与调整后的各参数的参数值个数,确定相应的正交表,进而确定实验方案;
根据实验方案,在每组参数的不同参数值组合下运行程序;
计算性能增量,以性能增量作为参数对程序性能的贡献率,统计各个参数的不同参数值的贡献率,筛选出每一参数贡献率最高的参数值,并作为最终的最优参数组合,其中性能增量记为S=(t1-t2)/t2,t1为默认参数组合下程序运行时间,t2为优化参数组合下程序运行时间。
正交实验中所用到的正交表满足如下性质:
1.任一因素占据一列位置。
2.正交性:任一列中不同水平个数相同,正交表中任意两列横向各数码搭配所出现的次数相同。
正交表的正交性使得正交实验具有如下特点:
1.均衡分散:实验点在实验范围内散布均匀,具有代表性。
2.整齐可比:实验点在实验范围内排列规律整齐,可以用数理统计方法对实验结果进行处理。
本发明实施例中,在前述步骤11处理后,参数的种类与数目已经确定,后续的粗筛选、细筛选过程主要是确定各参数的最优参数值,参数的种类与数目并不会发生变化。
本发明实施例上述方案,利用均匀实验方法,作粗筛选,可以有效地减少实验次数,同时获得了程序的特征数据。利用正交实验方法,作细筛选,可以有效地简化均匀实验结果的分析工作,同时可以进一步优化并行程序运行时参数组合。其中,本发明中的实验是在具体硬件平台下,针对特定应用程序进行的,实验数据可以很好地反应硬件平台以及应用程序的特征。
通过本发明的技术方案,可以获得并行程序在具体硬件平台下最优的参数组合,可以将该参数组合推荐给超算用户,使超算用户作业在该参数组合下运行,优化应用程序执行效率,从而提高超算系统平台整体吞吐率。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (5)

1.一种并行程序运行时参数优化方法,其特征在于,包括:
利用一次一因子实验方法进行预备实验,获得程序性能受单个参数变化的影响,从而筛选出对程序性能影响超出预定目标的参数及其参数值;
利用均匀实验方法,从预备实验筛选出的参数中粗筛选出当前最优的参数组合;其中,将最优的实验结果对应的参数组及其参数值,作为粗筛选出的当前最优的参数组合;
在粗筛选出最优的参数组合中的各参数取值附近再取一个或多个参数值,参数取值附近为预定范围;并利用正交实验方法分析出各个参数及其参数值对实验指标的贡献大小,进而确定最终的最优参数组合。
2.根据权利要求1所述的一种并行程序运行时参数优化方法,其特征在于,所述实验指标为程序运行时间,并行程序的各个参数作为实验因素,并行程序的各个参数的不同取值作为对应实验因素的水平,各个实验因素在某个水平上进行取值得到的一组搭配情况作为实验点,对每个实验点依次进行实验,研究实验因素对实验指标的影响,从而确定最优参数组合,使并行程序在该最优参数组合下运行时间最少。
3.根据权利要求1或2所述的一种并行程序运行时参数优化方法,其特征在于,筛选出对程序性能影响超出预定目标的参数的步骤包括:
对每个参数选择初始参数值,即为每个可调参数赋予一个初始值;
在保持其他参数在初始参数值不变的条件下,让每一个参数在其所允许的范围内进行连续变动;
当所有的实验都做完后,获得程序性能受单个参数的水平变化的影响,从而筛选出对程序性能影响超出预定目标的参数及其参数值。
4.根据权利要求1或2所述的一种并行程序运行时参数优化方法,其特征在于,所述利用均匀实验方法从预备实验筛选出的参数中粗筛选出当前最优的参数组合的步骤包括:
根据所选参数的个数与各参数的参数值个数,确定相应的均匀表,进而确定实验方案;
根据实验方案,在每组参数的不同参数值组合下运行程序;
将最优的实验结果对应的参数组及其参数值,作为粗筛选出的当前最优的参数组合。
5.根据权利要求1或2所述的一种并行程序运行时参数优化方法,其特征在于,所述确定最终的最优参数组合的步骤包括:
针对粗筛选出最优的参数组合,各参数分别再取一个或多个参数值,所取的参数值在当前最优的参数组合中对应参数的参数取值附近,所取的参数值作为对应参数的水平,再根据粗筛选出最优的参数组合中参数的个数与调整后的各参数的水平个数,确定相应的正交表,进而确定实验方案;
根据实验方案,在每组参数的不同参数值组合下运行程序;
计算性能增量,以性能增量作为参数对程序性能的贡献率,统计各个参数的不同参数值的贡献率,筛选出每一参数贡献率最高的参数值,并作为最终的最优参数组合,其中性能增量记为S=(t1-t2)/t2,t1为默认参数组合下程序运行时间,t2为优化参数组合下程序运行时间。
CN201710127844.6A 2017-03-06 2017-03-06 并行程序运行时参数优化方法 Active CN106909452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710127844.6A CN106909452B (zh) 2017-03-06 2017-03-06 并行程序运行时参数优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710127844.6A CN106909452B (zh) 2017-03-06 2017-03-06 并行程序运行时参数优化方法

Publications (2)

Publication Number Publication Date
CN106909452A CN106909452A (zh) 2017-06-30
CN106909452B true CN106909452B (zh) 2020-08-25

Family

ID=59186161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710127844.6A Active CN106909452B (zh) 2017-03-06 2017-03-06 并行程序运行时参数优化方法

Country Status (1)

Country Link
CN (1) CN106909452B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109088124B (zh) * 2018-08-01 2021-01-12 桑德新能源技术开发有限公司 电池液冷系统的控制策略确定方法及装置
CN109271312A (zh) * 2018-08-07 2019-01-25 Oppo广东移动通信有限公司 游戏测试方法及相关产品
CN109344328B (zh) * 2018-09-21 2021-01-05 百度在线网络技术(北京)有限公司 获取推荐系统最优参数组合的方法及装置
CN109710330B (zh) * 2018-12-20 2022-04-15 Oppo广东移动通信有限公司 应用程序的运行参数确定方法、装置、终端及存储介质
CN110971974B (zh) * 2019-12-06 2022-02-15 北京小米移动软件有限公司 配置参数创建方法、装置、终端及存储介质
CN111324532B (zh) * 2020-02-13 2022-06-07 苏州浪潮智能科技有限公司 一种并行计算软件的mpi参数确定方法、装置及设备
CN114048027B (zh) * 2021-10-21 2022-05-13 中国科学技术大学 一种应用于超算集群调度的作业运行参数优化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315424A (zh) * 2008-07-29 2008-12-03 中国科学院对地观测与数字地球科学中心 多卫星遥感数据一体化并行地面预处理系统
CN102708404A (zh) * 2012-02-23 2012-10-03 北京市计算中心 一种基于机器学习的多核下mpi最优运行时的参数预测方法
US8761318B2 (en) * 2009-06-17 2014-06-24 Coherent Logix, Incorporated Parallel execution of trellis-based methods
CN104199734A (zh) * 2014-09-12 2014-12-10 上海斐讯数据通信技术有限公司 一种基于安卓智能终端的应用程序多开管理方法和系统
CN105279079A (zh) * 2014-06-25 2016-01-27 腾讯科技(深圳)有限公司 应用程序性能估测方法、装置和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315424A (zh) * 2008-07-29 2008-12-03 中国科学院对地观测与数字地球科学中心 多卫星遥感数据一体化并行地面预处理系统
US8761318B2 (en) * 2009-06-17 2014-06-24 Coherent Logix, Incorporated Parallel execution of trellis-based methods
CN102708404A (zh) * 2012-02-23 2012-10-03 北京市计算中心 一种基于机器学习的多核下mpi最优运行时的参数预测方法
CN105279079A (zh) * 2014-06-25 2016-01-27 腾讯科技(深圳)有限公司 应用程序性能估测方法、装置和系统
CN104199734A (zh) * 2014-09-12 2014-12-10 上海斐讯数据通信技术有限公司 一种基于安卓智能终端的应用程序多开管理方法和系统

Also Published As

Publication number Publication date
CN106909452A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
CN106909452B (zh) 并行程序运行时参数优化方法
US11632422B2 (en) Automated server workload management using machine learning
US10769150B1 (en) Pruning indexes to enhance database query processing
Tang et al. Dynamic job ordering and slot configurations for MapReduce workloads
Litoiu A performance analysis method for autonomic computing systems
US10191947B2 (en) Partitioning advisor for online transaction processing workloads
US9984081B2 (en) Workload aware data placement for join-based query processing in a cluster
JP2019511773A (ja) サービス・パラメータ選択方法及び関連するデバイス
CN105488134A (zh) 大数据处理方法及大数据处理装置
US20160092134A1 (en) Scalable, multi-dimensional search for optimal configuration
Nasiri et al. A survey of distributed stream processing systems for smart city data analytics
Aljawarneh et al. Efficient spark-based framework for big geospatial data query processing and analysis
Sun et al. Solving interval multi-objective optimization problems using evolutionary algorithms with lower limit of possibility degree
CN109062867A (zh) 对象和属性同时增加的矩阵动态属性约简方法
US11573880B2 (en) Performance simulation for selected platforms for web products in database systems
CN108804224B (zh) 一种基于Spark框架的中间数据权重设置方法
WO2018219183A1 (en) Balancing cpu utilization in a massively parallel processing heterogeneous cluster
Hanczewski et al. A Multiparameter Analytical Model of the Physical Infrastructure of a Cloud-Based System
US9858551B2 (en) Ranking analysis results based on user perceived problems in a database system
CN108446383B (zh) 一种基于地理分布式数据查询的数据任务重分配方法
Cheng et al. Toward Network-Aware Query Execution Systems in Large Datacenters
CN112711588A (zh) 多表连接的方法和装置
EP3216167B1 (en) Orchestrator and method for virtual network embedding using offline feedback
CN109669930A (zh) 数据质量报告生成方法及系统
Montoya et al. Querying Linked Data: An Experimental Evaluation of State-of-the-Art Interfaces

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant