CN110347487B

CN110347487B - 一种面向数据库应用的数据搬移的能耗特征化方法及系统

Info

Publication number: CN110347487B
Application number: CN201910602391.7A
Authority: CN
Inventors: 孟小峰; 杨晨
Original assignee: Renmin University of China
Current assignee: Renmin University of China
Priority date: 2019-07-05
Filing date: 2019-07-05
Publication date: 2021-03-23
Anticipated expiration: 2039-07-05
Also published as: CN110347487A

Abstract

本发明涉及一种面向数据库应用的数据搬移的能耗特征化方法及系统，其特征在于，包括以下内容：1)特征化数据库的总能耗，得到数据库不同部件上的数据搬移事件发生次数与单位能耗之间的线性关系；2)根据基准测试集以及得到的线性关系，测量load指令仅访问单一缓存层的基础能耗；3)根据测量的基础能耗，量化数据库不同部件上的数据搬移事件的单位能耗，完成数据库数据搬移的能耗特征化，本发明可以广泛应用于数据库领域中。

Description

一种面向数据库应用的数据搬移的能耗特征化方法及系统

技术领域

本发明是关于一种面向数据库应用的数据搬移的能耗特征化方法及系统，属于数据库领域。

背景技术

能耗特征化是设计高能效系统的基础工作，已有工作从两方面进行研究：1)数据库的能耗评估，针对数据库的能耗评估，目前仅集中在主部件的能耗分析，即CPU、主存和硬盘。已有工作分析了不同CPU和硬盘类型对数据库能耗的影响，并没有考虑主存的影响，结论显示CPU是主要的能耗瓶颈。进一步的工作分析了内存数据库在更为细粒度部件上的能耗，考虑了主存、缓存和ALU(算术逻辑单元)等部件，结论显示主存是主要的能耗瓶颈，然而该分析的结论是建立在混合数据计算所消耗的能量和硬件部件固有的能耗上。事实上，数据计算所消耗的能量才是一个数据库应用真实的能耗，硬件部件固有的能耗即便不运行任何数据库应用也是要消耗的。然而上述方法均不能分析数据计算过程中数据在微部件搬移的能耗特点。2)数据搬移的能耗评估，量化数据在不同缓存层频繁移动的能耗。已有工作针对移动平台评估手机应用的不同缓存层的能耗，移动平台ARM的缓存层设计与x86平台完全不同，因此其量化和分析方法应用于标准的数据库应用不同。此外，针对科学计算任务在x86平台下的能耗特征化方法，使用外置电表测量基本的能耗数据，外置电表的测量极易引入很大的能耗误差，例如CPU风扇能耗和主板能耗等。另外，科学计算任务与数据库应用有本质差别，因此用于科学计算任务的能耗特征化方法不能准确地描述数据库应用的能耗特点。上述方法均不能用于准确分析数据库应用的能耗特点。

数据库作为一种需要长期运行的计算机软件服务，其能耗特征化对快速分析数据库应用的能耗瓶颈是非常必要的，有助于整个计算机系统的节能。然而，上述提出的方法均不能特征化数据库应用中计算能耗在不同微部件的能量消耗。

发明内容

针对上述问题，本发明的目的是提供一种能够特征化数据库应用中计算能耗在不同微部件的能量消耗的面向数据库应用的数据搬移的能耗特征化方法及系统。

为实现上述目的，本发明采取以下技术方案：一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，包括以下内容：1)特征化数据库的总能耗，得到数据库不同部件上的数据搬移事件发生次数与单位能耗之间的线性关系；2)根据基准测试集以及得到的线性关系，测量load指令仅访问单一缓存层的基础能耗；3)根据测量的基础能耗，量化数据库不同部件上的数据搬移事件的单位能耗，完成数据库数据搬移的能耗特征化。

进一步地，所述步骤1)的具体过程为：1.1)对于任意部件上的计算任务t，定义计算任务t的能耗特征向量E(t)：

E(t)＝(E_L1D,E_Reg→L1D,E_L2,E_L3,E_mem,E_pf,E_stall,E_other)

其中，E_L1D为L1D缓存向寄存器搬移数据的能耗；E_L2为L2缓存向寄存器搬移数据的能耗；E_L3为L3缓存向寄存器搬移数据的能耗；E_mem为主存向寄存器搬移数据的能耗；E_Reg→L1D为store指令执行导致的数据从寄存器向L1D缓存搬移的能耗；E_pf为数据预取的能耗；E_stall为CPU因数据搬移而停顿产生的能耗；E_other为除上述因数据搬移产生能耗的剩余能耗；1.2)对于任意部件上的计算任务t，定义计算任务t的性能特征向量P(t)：

P(t)＝(N_L1D,N_Reg→L1D,N_L2,N_L3,N_mem,N_pf,N_stall)

其中，N_L1D、N_L2、N_L3和N_mem分别为各级缓存和主存load指令的命中次数；N_Reg→L1D为store指令访问次数；N_pf包括

和

为单位数据行从L2缓存预取L1D缓存的访问次数，

为单位数据行从L3缓存预取到L2缓存的访问次数；N_stall为停顿周期数；1.3)假设集合components＝{L1D,L2,L3,mem}，对于

若x部件的速度大于y部件的速度，则记为x＞y，满足如下关系：

其中，E_x为x部件发生数据搬移的能耗；E_i为数据从i部件仅向更上一层移动的单位能耗；N_x为x部件上发生数据搬移的次数；1.4)假设集合events＝{Reg→L1D,pf,stall}为一个事件集合，包括三种类型的事件，若

则：

E_e＝ΔE_eN_e

其中，E_e为e事件发生的总能耗；ΔE_e为一个事件发生后的单位能耗；N_e为e事件的发生次数。

进一步地，所述步骤2)的具体过程为：2.1)建立基准测试集；2.2)根据建立的基准测试集以及得到的数据库不同部件上的数据搬移事件发生次数与单位能耗之间的线性关系，测量得到单位数据从L1D缓存向寄存器搬移的基础能耗E_L1D、CPU因数据搬移而停顿产生的基础能耗E_stall、数据从L2缓存、L3缓存和主存向寄存器搬移的基础能耗E_L2、E_L3、E_mem以及数据从寄存器向L1D缓存搬移的基础能耗E_Reg→L1D。

进一步地，所述基准测试集包括B_L1D基准测试集、B_L2基准测试集、B_L3基准测试集、B_Mem基准测试集和B_Reg2L1D基准测试集，其中，所述B_L1D基准测试集包括B_L1D_list基准测试集和B_L1D_array基准测试集。

进一步地，所述步骤2.1)的具体过程为：2.1.1)针对每一基准测试集，分别申请一块大小为s的内存空间，并设定对应的重复访问次数t；2.1.2)将每一内存空间均通过随机顺序采用链表进行连接；2.1.3)遍历链表，每次循环均利用指针追踪读取链表数据t次。

进一步地，所述B_L1D基准测试集中初始化的s值小于单个逻辑核心的L1D缓存大小；所述B_L2基准测试集、B_L3基准测试集和B_Mem基准测试集中初始化的s值大于L1D缓存容量而小于相应的L2缓存、L3缓存和主存容量；B_Reg2L1D基准测试集中初始化的s值小于单个逻辑核心的L1D缓存大小。

进一步地，所述步骤2.2)的具体过程为：2.2.1)对于B_L1D_array基准测试集，每一数组元素的地址均为已知的且仅访问L1D缓存，CPU以超标量流水线方式执行，每周期发射两条load指令，因此，B_L1D_array基准测试集的能耗全部为E_L1D；2.2.2)对于B_L1D_list基准测试集，采用链表遍历数组，能耗为E_L1D和E_stall；使用运行平均功率监控，观察核心域级别的能耗；2.2.3)对于B_L2基准测试集、B_L3基准测试集和B_Mem基准测试集，均采用链表随机遍历数组，通过调整内存空间的大小，使得B_L2基准测试集的能耗为E_L2和E_stall，B_L3基准测试集的能耗为E_L3和E_stall，B_Mem基准测试集的能耗为E_mem和E_stall；对于B_L2基准测试集，使用运行平均功率监控观察核心域级别的能耗；对于B_L3基准测试集，使用运行平均功率监控观察处理器域级别的能耗；对于B_Mem基准测试集，使用运行平均功率监控同时观察处理器域和主存域级别的能耗；2.2.4)对于B_Reg2L1D基准测试集，在B_L1D_list基准测试集的基础上加入L1缓存的写操作，使得B_Reg2L1D基准测试集的能耗为E_Reg→L1D、E_L1D和E_stall；使用运行平均功率监控观察核心域级别的能耗。

进一步地，所述步骤3)的具体过程为：3.1)根据测量的数据从L1D缓存向寄存器搬移的基础能耗E_L1D，量化数据从L1D缓存向寄存器搬移的单位能耗E_L1D为：

其中，E(B_L1D_array)为B_L1D_array基准测试程序的总能耗；3.2)根据测量的CPU因数据搬移而停顿产生的基础能耗E_stall以及数据从L1D缓存向寄存器搬移的基础能耗E_L1D，量化CPU因数据搬移而停顿产生的单位能耗E_stall为：

其中，E(B_L1D_list)为B_L1D_list基准测试程序的总能耗；3.3)根据测量的数据从L2缓存、L3缓存和主存向寄存器搬移的基础能耗E_L2、E_L3、E_mem以及CPU因数据搬移而停顿产生的基础能耗E_stall，当

且x≠L1D时，量化x部件的单位能耗ΔE_x为：

其中，E(B_x)为B_L2基准测试程序、B_L3基准测试程序和B_Mem基准测试程序的总能耗；3.4)根据测量的数据从寄存器向L1D缓存搬移的基础能耗E_Reg→L1D，量化数据从寄存器向L1D缓存搬移的单位能耗ΔE_Reg→L1D为：

其中，E(B_Reg2L1D)为B_Reg2L1D基准测试程序的总能耗。

一种面向数据库应用的数据搬移的能耗特征化系统，其特征在于，包括：线性关系确定模块，用于特征化数据库的总能耗，得到数据库不同部件上的数据搬移事件发生次数与单位能耗之间的线性关系；基础能耗测量模块，用于根据基准测试集以及得到的线性关系，测量load指令仅访问单一缓存层的基础能耗；单位能耗量化模块，用于根据测量的基础能耗，量化数据库不同部件上的数据搬移事件的单位能耗，完成数据库数据搬移的能耗特征化。

本发明由于采取以上技术方案，其具有以下优点：1、本发明针对数据库中查询操作能耗的完整特征向量表示和量化模型，将实际能耗转化为在不同微部件上的数据搬移事件发生次数与单位能耗的线性关系，进而能够特征化数据库应用中计算能耗在不同微部件的能量消耗。2、现有的处理器为提高执行效率，降低不必要的等待，引入流水线执行、指令和数据预取方法，线程切换、动态频率以及编译器的优化方法，然而，这些均给测量单一load操作能耗带来困难，本发明通过建立若干个基准测试集，每一基准测试集均具备特定且单一的访存模式，通过建立的基准测试集可以测量访问特定缓存层的基础能耗，并将测量的基础能耗转化为不同数据搬移事件的单位能耗，实现能够最小化预取、流水线执行影响的一系列基准测试集，以消除任务调度、动态频率和编译所造成的影响，可以广泛应用于数据库领域中。

附图说明

图1是本发明中内存层级间的数据搬移能耗关系示意图；

图2是本发明中数组与链表遍历下的CPU停顿对比示意图。

具体实施方式

以下结合附图来对本发明进行详细的描绘。然而应当理解，附图的提供仅为了更好地理解本发明，它们不应该理解成对本发明的限制。

本发明提供的面向数据库应用的数据搬移的能耗特征化方法，包括以下步骤：

1)特征化数据库的总能耗，将实际能耗转化为在数据库不同微部件上的数据搬移事件发生次数与单位能耗之间的线性关系，具体为：

1.1)对于任意微部件上的计算任务t，将E(t)定义为计算任务t的能耗特征向量：

E(t)＝(E_L1D,E_Reg→L1D,E_L2,E_L3,E_mem,E_pf,E_stall,E_other) (1)

其中，E_L1D、E_L2、E_L3和E_mem分别为load指令执行导致的数据从指定存储部件向寄存器搬移的能耗，例如E_L1D为L1D缓存向寄存器搬移数据的能耗，E_L2为L2缓存向寄存器搬移数据的能耗，E_L3为L3缓存向寄存器搬移数据的能耗，E_mem为主存向寄存器搬移数据的能耗；E_Reg→L1D为store(写操作)指令执行导致的数据从寄存器向L1D缓存搬移的能耗；E_pf为数据预取的能耗，主要量化L1D缓存和L2缓存的数据预取能耗分别为

和

E_stall为CPU因数据搬移而停顿产生的能耗；E_other为除上述因数据搬移产生能耗的剩余能耗，例如数据计算能耗、取指令能耗和测量误差等。

1.2)对于任意微部件上的计算任务t，将P(t)定义为计算任务t的性能特征向量：

P(t)＝(N_L1D,N_Reg→L1D,N_L2,N_L3,N_mem,N_pf,N_stall) (2)

其中，N_L1D、N_L2、N_L3和N_mem分别为各级缓存和主存load(取数)指令的命中次数；N_Reg→L1D为store指令访问次数；N_pf同样分为两部分，

为单位数据行从L2缓存预取L1D的访问次数，

为单位数据行从L3缓存预取到L2缓存的访问次数；N_stall为停顿周期数。

1.3)假设集合components＝{L1D,L2,L3,mem}，对于

若x部件的速度大于y部件的速度，则记为x＞y。如图1所示，由于数据在缓存层间的搬移是逐级复制的，满足如下关系：

其中，E_x为x部件发生数据搬移的能耗；E_i为数据从i部件仅向更上一层移动的单位能耗；N_x为x部件上发生数据搬移的次数。

1.4)假设集合events＝{Reg→L1D,pf,stall}为一个事件集合，包括三种类型的事件，若

则：

E_e＝ΔE_eN_e (4)

综上分析，能耗特征向量E(t)中的每一维均可以转化为单位能耗ΔE与事件发生次数N之间的线性函数关系，因此，量化单位能耗极其必要。

2)根据基准测试集以及数据库不同部件上的数据搬移事件发生次数与单位能耗之间的线性关系，测量load指令仅访问单一缓存层的基础能耗，具体为：

2.1)建立基准测试集，包括B_L1D基准测试集、B_L2基准测试集、B_L3基准测试集、B_Mem基准测试集和B_Reg2L1D基准测试集，其中，B_L1D基准测试集包括B_L1D_list基准测试集和B_L1D_array基准测试集，B_L1D基准测试集为链表遍历模式，B_L1D_array基准测试集为数组遍历模式。B_L1D基准测试集用于测量L1D缓存取数据和CPU停顿的单位能耗，B_L2基准测试集、B_L3基准测试集和B_Mem基准测试集分别用于测量E_L2、E_L3和E_mem，B_Reg2L1D基准测试集用于测量E_Reg→L1D。

2.1.1)针对每一基准测试集，分别申请一块内存空间，其大小为s，并设定对应的重复访问次数t。

B_L1D基准测试集中初始化的s值小于单个逻辑核心的L1D缓存大小，以保证所有数据仅能被加载到L1D缓存。

B_L2基准测试集、B_L3基准测试集和B_Mem基准测试集中初始化的s值大于L1D缓存容量而小于相应的L2缓存、L3缓存和主存容量。

B_Reg2L1D基准测试集中初始化的s值小于单个逻辑核心的L1D缓存大小。

2.1.2)将每一内存空间均通过随机顺序采用链表进行连接，链表项数据为单位大小(64bytes)，以保证一次load操作能够处理，避免预取能耗误差。采用链表能够使数据访问保持前后依赖，即下一次读取数据必须要等上一次数据读取完毕才能进行，而随机访问(例如数组)使处理器能够流水线式重叠执行程序，给CPU停顿测量带来误差。随机链表能最大化地使流水线执行失效。

2.1.3)遍历链表，每次循环均利用指针追踪读取链表数据t次，其中，链表长度N为s/128bytes，128bytes为单个链表项的大小，其中的64bytes用于存储数据，另外64bytes用于存储地址。值得注意的是，可以通过调节s值，保证数据仅在单一缓存层找到。

2.2)根据建立的基准测试集以及得到的数据库不同微部件上的数据搬移事件发生次数与单位能耗之间的线性关系，测量得到单位数据从L1D缓存向寄存器搬移的基础能耗E_L1D、CPU因数据搬移而停顿产生的基础能耗E_stall、数据从L2缓存、L3缓存和主存向寄存器搬移的基础能耗E_L2、E_L3、E_mem以及数据从寄存器向L1D缓存搬移的基础能耗E_Reg→L1D。

2.2.1)如图2所示，对于B_L1D_array基准测试集，每一数组元素的地址均为已知的且仅访问L1D缓存，访问模式简单，因此除开始阶段外，CPU能够以超标量流水线方式执行，引起几乎每个周期均不会停顿，每周期发射两条load指令。因此，B_L1D_array基准测试集的能耗全部为E_L1D。

2.2.2)对于B_L1D_list基准测试集，采用链表遍历数组，下个数据地址未知，因此CPU无法以流水线方式执行，产生停顿(如图2所示，一个L1D访问，CPU停顿三个周期)，因此，B_L1D_list基准测试集的能耗E_L1D和E_stall。使用RAPL(运行平均功率监控)，可以观察pp0(核心域)级别的能耗。

2.2.3)对于B_L2基准测试集，利用链表随机遍历数组，通过调整内存空间的大小达到几乎所有的数据不能在L1缓存中找到，但能在L2缓存中找到，最终能耗包括E_L2和E_stall。使用RAPL，可以观察pp0级别的能耗。对于B_L3基准测试集和B_Mem基准测试集的操作方法与B_L2基准测试集类似，B_L3基准测试集的能耗为E_L3和E_stall，B_Mem基准测试集的能耗为E_mem和E_stall。然而，对于B_L3基准测试集，使用RAPL观察Package级别的能耗；对于B_Mem基准测试集，使用RAPL同时观察Package(处理器域)和DRAM(主存域)级别的能耗。

2.2.4)对于B_Reg2L1D基准测试集，在B_L1D_list基准测试集的基础上加入L1缓存的store操作(写操作)，使得B_Reg2L1D基准测试集的能耗为E_Reg→L1D、E_L1D和E_stall，使用RAPL观察pp0级别的能耗。值得注意的是，此时的CPU停顿全部是由向L1D缓存取数据产生的。

3)根据测量的基础能耗，量化不同部件上的数据搬移事件的单位能耗，完成数据搬移的能耗特征化，具体为：

3.1)根据测量的数据从L1D缓存向寄存器搬移的基础能耗E_L1D，量化数据从L1D缓存向寄存器搬移的单位能耗E_L1D为：

其中，E(B_L1D_array)为B_L1D_array基准测试程序的总能耗。

3.2)根据测量的CPU因数据搬移而停顿产生的基础能耗E_stall以及数据从L1D缓存向寄存器搬移的基础能耗E_L1D，量化CPU因数据搬移而停顿产生的单位能耗E_stall为：

其中，E(B_L1D_list)为B_L1D_list基准测试程序的总能耗。

3.3)根据测量的数据从L2缓存、L3缓存和主存向寄存器搬移的基础能耗E_L2、E_L3、E_mem以及CPU因数据搬移而停顿产生的基础能耗E_stall，当

且x≠L1D时，可以量化x部件的单位能耗ΔE_x为：

其中，E(B_x)为B_L2基准测试程序、B_L3基准测试程序和B_Mem基准测试程序的总能耗。

通过公式(7)，可以依次求出L2缓存向寄存器搬移数据的单位能耗ΔE_L2、L3缓存向寄存器搬移数据的单位能耗ΔE_L3和主存向寄存器搬移数据的单位能耗ΔE_mem。

3.4)根据测量的数据从寄存器向L1D缓存搬移的基础能耗E_Reg→L1D，量化数据从寄存器向L1D缓存搬移的单位能耗ΔE_Reg→L1D为：

其中，E(B_Reg2L1D)为B_Reg2L1D基准测试程序的总能耗。

实际上，数据预取与普通取数据的操作相比，主要耗能的部分还是将数据从特定缓存层搬移到更高一层，因此这里假定

和

通过本发明的方法，可以通过基础能耗计算求得单位能耗。当测量得到一个数据库的总能耗后，可以根据单位能耗和数据搬移事件的发生次数将总能耗分解为不同数据搬移事件能耗的和。通过观察不同数据搬移事件能耗，能够容易的发现数据库应用的能耗瓶颈，为数据应用的能耗优化指明方向。

基于上述面向数据库应用的数据搬移的能耗特征化方法，本发明还提供一种面向数据库应用的数据搬移的能耗特征化系统，包括：

线性关系确定模块，用于特征化数据库的总能耗，得到数据库不同部件上的数据搬移事件发生次数与单位能耗之间的线性关系；基础能耗测量模块，用于根据基准测试集以及得到的线性关系，测量load指令仅访问单一缓存层的基础能耗；单位能耗量化模块，用于根据测量的基础能耗，量化数据库不同部件上的数据搬移事件的单位能耗，完成数据库数据搬移的能耗特征化。

上述各实施例仅用于说明本发明，其中各部件的结构、连接方式和制作工艺等都是可以有所变化的，凡是在本发明技术方案的基础上进行的等同变换和改进，均不应排除在本发明的保护范围之外。

Claims

1.一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，包括以下内容：

1)特征化数据库的总能耗，得到数据库不同微部件上的数据搬移事件发生次数与单位能耗之间的线性关系，具体过程为：

1.1)对于任意微部件上的计算任务t，定义计算任务t的能耗特征向量E(t)：

E(t)＝(E_L1D,E_Reg→L1D,E_L2,E_L3,E_mem,E_pf,E_stall,E_other)

其中，E_L1D为L1D缓存向寄存器搬移数据的能耗；E_L2为L2缓存向寄存器搬移数据的能耗；E_L3为L3缓存向寄存器搬移数据的能耗；E_mem为主存向寄存器搬移数据的能耗；E_Reg→L1D为store指令执行导致的数据从寄存器向L1D缓存搬移的能耗；E_pf为数据预取的能耗；E_stall为CPU因数据搬移而停顿产生的能耗；E_other为除上述因数据搬移产生能耗的剩余能耗；

1.2)对于任意微部件上的计算任务t，定义计算任务t的性能特征向量P(t)：

P(t)＝(N_L1D,N_Reg→L1D,N_L2,N_L3,N_mem,N_pf,N_stall)

和

为单位数据行从L2缓存预取L1D缓存的访问次数，

为单位数据行从L3缓存预取到L2缓存的访问次数；N_stall为停顿周期数；

1.3)假设集合components＝{L1D,L2,L3,mem}，对于

其中，E_x为x部件发生数据搬移的能耗；VE_i为数据从i部件仅向更上一层移动的单位能耗；N_x为x部件上发生数据搬移的次数；

则：

E_e＝ΔE_eN_e

其中，E_e为e事件发生的总能耗；ΔE_e为一个事件发生后的单位能耗；N_e为e事件的发生次数；

2)根据基准测试集以及得到的线性关系，测量load指令仅访问单一缓存层的基础能耗，所述基准测试集包括B_L1D基准测试集、B_L2基准测试集、B_L3基准测试集、B_Mem基准测试集和B_Reg2L1D基准测试集，其中，所述B_L1D基准测试集包括B_L1D_list基准测试集和B_L1D_array基准测试集；

3)根据测量的基础能耗，量化数据库不同微部件上的数据搬移事件的单位能耗，完成数据库数据搬移的能耗特征化。

2.如权利要求1所述的一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，所述步骤2)的具体过程为：

2.1)建立基准测试集；

3.如权利要求2 所述的一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，所述步骤2.1)的具体过程为：

2.1.1)针对每一基准测试集，分别申请一块大小为s的内存空间，并设定对应的重复访问次数t；

2.1.2)将每一内存空间均通过随机顺序采用链表进行连接；

2.1.3)遍历链表，每次循环均利用指针追踪读取链表数据t次。

4.如权利要求3所述的一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，所述B_L1D基准测试集中初始化的s值小于单个逻辑核心的L1D缓存大小；

所述B_L2基准测试集、B_L3基准测试集和B_Mem基准测试集中初始化的s值大于L1D缓存容量而小于相应的L2缓存、L3缓存和主存容量；

5.如权利要求4所述的一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，所述步骤2.2)的具体过程为：

2.2.1)对于B_L1D_array基准测试集，每一数组元素的地址均为已知的且仅访问L1D缓存，CPU以超标量流水线方式执行，每周期发射两条load指令，因此，B_L1D_array基准测试集的能耗全部为E_L1D；

2.2.2)对于B_L1D_list基准测试集，采用链表遍历数组，能耗为E_L1D和E_stall；使用运行平均功率监控，观察核心域级别的能耗；

2.2.3)对于B_L2基准测试集、B_L3基准测试集和B_Mem基准测试集，均采用链表随机遍历数组，通过调整内存空间的大小，使得B_L2基准测试集的能耗为E_L2和E_stall，B_L3基准测试集的能耗为E_L3和E_stall，B_Mem基准测试集的能耗为E_mem和E_stall；对于B_L2基准测试集，使用运行平均功率监控观察核心域级别的能耗；对于B_L3基准测试集，使用运行平均功率监控观察处理器域级别的能耗；对于B_Mem基准测试集，使用运行平均功率监控同时观察处理器域和主存域级别的能耗；

2.2.4)对于B_Reg2L1D基准测试集，在B_L1D_list基准测试集的基础上加入L1缓存的写操作，使得B_Reg2L1D基准测试集的能耗为E_Reg→L1D、E_L1D和E_stall；使用运行平均功率监控观察核心域级别的能耗。

6.如权利要求1所述的一种面向数据库应用的数据搬移的能耗特征化方法，其特征在于，所述步骤3)的具体过程为：

3.1)根据测量的数据从L1D缓存向寄存器搬移的基础能耗E_L1D，量化数据从L1D缓存向寄存器搬移的单位能耗VE_L1D为：

其中，E(B_L1D_array)为B_L1D_array基准测试程序的总能耗；

3.2)根据测量的CPU因数据搬移而停顿产生的基础能耗E_stall以及数据从L1D缓存向寄存器搬移的基础能耗E_L1D，量化CPU因数据搬移而停顿产生的单位能耗VE_stall为：

其中，E(B_L1D_list)为B_L1D_list基准测试程序的总能耗；

且x≠L1D时，量化x部件的单位能耗ΔE_x为：

其中，E(B_x)为B_L2基准测试程序、B_L3基准测试程序和B_Mem基准测试程序的总能耗；

其中，E(B_Reg2L1D)为B_Reg2L1D基准测试程序的总能耗。

7.一种面向数据库应用的数据搬移的能耗特征化系统，其特征在于，包括：

线性关系确定模块，用于特征化数据库的总能耗，得到数据库不同微部件上的数据搬移事件发生次数与单位能耗之间的线性关系，具体过程为：

E(t)＝(E_L1D,E_Reg→L1D,E_L2,E_L3,E_mem,E_pf,E_stall,E_other)

P(t)＝(N_L1D,N_Reg→L1D,N_L2,N_L3,N_mem,N_pf,N_stall)

和

为单位数据行从L2缓存预取L1D缓存的访问次数，

1.3)假设集合components＝{L1D,L2,L3,mem}，对于

则：

E_e＝ΔE_eN_e

基础能耗测量模块，用于根据基准测试集以及得到的线性关系，测量load指令仅访问单一缓存层的基础能耗，所述基准测试集包括B_L1D基准测试集、B_L2基准测试集、B_L3基准测试集、B_Mem基准测试集和B_Reg2L1D基准测试集，其中，所述B_L1D基准测试集包括B_L1D_list基准测试集和B_L1D_array基准测试集；

单位能耗量化模块，用于根据测量的基础能耗，量化数据库不同微部件上的数据搬移事件的单位能耗，完成数据库数据搬移的能耗特征化。