CN102521260A

CN102521260A - 数据预热方法及装置

Info

Publication number: CN102521260A
Application number: CN2011103693785A
Authority: CN
Inventors: 代坤; 李怀洲; 宋娇
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Cloud Computing Technologies Co Ltd
Priority date: 2011-11-18
Filing date: 2011-11-18
Publication date: 2012-06-27
Anticipated expiration: 2031-11-18
Also published as: EP2765522A4; EP2765522B1; US9569489B2; WO2013071726A1; US20140250102A1; CN102521260B; EP2765522A1

Abstract

本发明实施例公开了一种数据预热方法及装置，涉及数据库技术领域，提高了数据库系统的响应速度，减缓对磁盘的频繁IO，提高了数据库系统的整体性能。所述方法包括：当数据库启动时，分别从闪存设备上读取命中率信息和硬盘上读取用户配置信息；获取用户配置信息中的预设热点数据表和命中率信息中的热点数据表的并集；从并集中确定待加载热点数据块的总数；按照所述存储比例，确定将要存储到共享缓冲区和闪存设备中的待加载热点数据块；将待加载热点数据块分别存储到共享缓冲区和闪存设备中。本发明实施例适用于数据预热处理过程中。

Description

数据预热方法及装置

技术领域

本发明涉及数据库技术领域，尤其涉及一种数据预热方法及装置。

背景技术

随着数据库技术的快速发展，数据库存储系统呈现以下特点：

固态硬盘(Solid-State Drive，SSD)，相变存储器等新型存储设备和传统的磁盘设备构成混合存储环境。基于闪存的SSD同传统磁盘相比，具有性能高、能耗低等优势，价格和容量介于内存和传统磁盘之间。预计今后长时间内，各种类型的硬盘设备将同时存在，混合存储成为主流的存储配置；随着应用越来越多，用户数据量越来越大，传统的数据存储导致的输入输出(Input/Output，IO)瓶颈问题就会凸显出来；一些重要的应用需求要求数据库系统具有快速、及时、准确的响应。

在现有技术中，在主存和外部存储器之间提供一个带有缓存的控制器设备来实现预先加载下一个请求的数据，请求到来时将数据转移到主存。或者是把闪存设备用作二级缓存，在主存的缓冲区满时，将需要被替换出缓冲区的部分数据块写入闪存设备中，而且在数据库启动阶段没有根据用户的实际使用情况对一些热点数据进行预加载。

在现有技术中，在数据库启动后的初期，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低，IO非常繁忙，影响数据库系统的整体性能。

发明内容

本发明的实施例提供一种数据预热方法及装置，提高了数据库系统的响应速度，减缓对磁盘的频繁IO，提高了数据库系统的整体性能。

本发明实施例采用如下技术方案：

一种数据预热方法，包括：

当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享缓冲区和闪存设备中的存储比例，共享缓冲区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

根据存储比例、共享缓冲区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

按照所述存储比例，确定将要存储到所述共享缓冲区和闪存设备中的待加载热点数据块；

将所述待加载热点数据块分别存储到所述共享缓冲区和闪存设备中。

一种数据预热装置，包括：

读取单元，用于当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享缓冲区和闪存设备中的存储比例，共享缓冲区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

获取单元，用于获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

第一处理单元，用于根据存储比例、共享缓冲区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

第二处理单元，用于按照所述存储比例，确定将要存储到所述共享缓冲区和闪存设备中的待加载热点数据块；

存储单元，用于将所述待加载热点数据块分别存储到所述共享缓冲区和闪存设备中。

本发明实施例提供的一种数据预热方法及装置，在数据库启动时，根据用户的实际使用情况将一些热点数据块预先存储到共享缓冲区和闪存设备中。本发明实施例解决了现有技术中在数据库启动，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低，IO非常繁忙，影响数据库系统的整体性能的问题，提高了数据库系统的响应速度，减缓对磁盘的频繁IO，提高了数据库系统的整体性能。

附图说明

图1为本发明实施例一提供的一种数据预热方法的主要操作步骤流程图；

图2为本发明实施例一提供的一种数据预热方法的HDM在数据库系统中管理热点数据的示意图；

图3为本发明实施例一提供的一种数据预热方法的整体操作步骤流程图；

图4为本发明实施例二提供的一种数据预热装置的主要结构图；

图5为本发明实施例二提供的一种数据预热装置中处理单元的结构图；

图6为本发明实施例二提供的一种数据预热装置中第四处理子单元的主要结构图；

图7为本发明实施例二提供的一种数据预热装置中第四处理子单元的整体结构图；

图8为本发明实施例二提供的一种数据预热装置的整体结构图。

具体实施方式

下面结合附图对本发明实施例一种数据预热方法及装置进行详细描述。

实施例一

本发明实施例提供的一种数据预热方法，如图1所示，包括：

101、当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享缓冲区和闪存设备中的存储比例，共享缓冲区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

102、获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

103、根据存储比例、共享缓冲区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

104、按照所述存储比例，确定将要存储到所述共享缓冲区和闪存设备中的待加载热点数据块；

105、将所述待加载热点数据块分别存储到所述共享缓冲区和闪存设备中。

本发明实施例提供的一种数据预热方法，在数据库启动时，根据用户的实际使用情况对一些热点数据进行预热。本发明实施例解决了现有技术中在数据库启动后的初期，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低，IO非常繁忙，影响数据库系统的整体性能的问题，提高了数据库系统的响应速度，减缓对磁盘的频繁IO，提高了数据库系统的整体性能。

本发明主要是在数据库系统中增加一个热点数据管理模块(hotdata management，HDM)来进行数据预热处理。如图2所示，为HDM在数据库系统中管理热点数据的示意图。

具体应用时，如图3所示，操作流程如下：

301、当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享缓冲区和闪存设备中的存储比例，共享缓冲区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值。

所述命中率信息从闪存设备上读取，用户配置信息从硬盘上读取，并将所述命中率信息和用户配置信息存储在主存的共享缓冲区中。

所述命中率信息中包括热点数据表，以及热点数据表的命中次数及排名，热点数据块的命中率及排名。

当数据库启动，无法从闪存设备上读取所述命中率信息时，从硬盘上读取所述命中率信息。

302、获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集。

根据存储比例、共享缓冲区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数。具体包括如下子步骤3031-3034：

3031、根据存储比例、共享缓冲区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值。

具体是根据计算待加载热点数据块的总数的门限值，其中TDB为待加载热点数据块的总数的门限值，a₁为存储到所述共享缓冲区的待加载热点数据块的存储比例，a₂为存储到所述闪存设备的待加载热点数据块的存储比例，且0≤a₁≤1，0≤a₂≤1，BufCapacity为所述共享缓冲区的大小，Capacity为所述闪存设备的大小，BlockSize为热点数据块的大小。

3032、根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数TCT，其中所述候选热点数据表是所述并集中命中次数最高的前TCT个热点数据表。

具体是根据

计算候选热点数据表的个数TCT，其中TCT为候选热点数据表的个数，TT为所述并集中的热点数据表的总数，TDB为所述待加载热点数据块的总数的门限值，TB为所述并集中的热点数据块的总数。

3033、根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数。

具体是根据

计算每个候选热点数据表中的候选热点数据块的个数，其中BN为每个候选热点数据表中的候选热点数据块的个数，TBN为每个候选热点数据表中的热点数据块的总数，TDB为所述待加载热点数据块的总数的门限值，TB为所述并集中的热点数据块的总数。

3034、从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。具体包括步骤304-311：

304、根据FB＝THN_TCT/2×BR_BN计算每个候选热点数据表的筛选基数值，其中FB为每个候选热点数据表的筛选基数值，THN_TCT/2为第

个候选热点数据表的命中次数，BR_BN为每个候选热点数据表中的热点数据块命中率最高的第BN个热点数据块的命中率。

305、根据PB＝PT×QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中PB为每个候选热点数据表中的候选热点数据块的命中次数，PT为每个候选热点数据表的命中次数，QB为每个候选热点数据表中候选热点数据块的命中率。

306、将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数。

307、判断所述第一筛选热点数据块的总数是否在所述待加载热点数据块的总数的门限值加减偏差值的范围内。

308、当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

记录下每个候选热点数据表的筛选基数值。

309、当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值。

此处存在两种情况：

当所述第一筛选热点数据块的总数大于所述待加载热点数据块的总数的门限值与偏差值之和时，将所述筛选基数值加倍；

当所述第一筛选热点数据块的总数小于所述待加载热点数据块的总数的门限值与偏差值之差时，将所述筛选基数值减半。

例如，偏差值可设为1或2。

310、将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数。

311、当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

记录下每个所述热点数据表的新的筛选基数值。

最终得到的筛选基数值作为下一次数据库重启时的初步筛选基数值。

312、按照所述存储比例，确定将要存储到所述共享缓冲区和闪存设备中的待加载热点数据块；

313、将所述待加载热点数据块分别存储到所述共享缓冲区和闪存设备中。

为存储在所述闪存设备中的热点数据块在所述共享缓冲区中建立散表(HASH)索引，便于读取所述闪存设备中的热点数据块。

314、当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备。

更新存储到所述闪存设备上的命中率信息，是便于在下次数据库重启时读取利用。

315、将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。

将最近更新的命中率信息备份到所述硬盘上，是防止所述闪存设备损坏、脱落、更换等特殊情况发生时无法读取命中率信息。

本发明不仅限于SSD+HDD(hard disk drive，硬盘驱动器)方式的存储系统，还可以应用于各种混合存储系统。

对于热点数据预加载不仅限于加载热点数据表，也可适用于对索引数据表的热点统计。

实施例二

本发明实施例提供的一种数据预热装置40，如图4所示，包括读取单元401，获取单元402，第一处理单元403、第二处理单元404和存储单元405。

其中，读取单元401，用于当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享缓冲区和闪存设备中的存储比例，共享缓冲区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

获取单元402，用于获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

第一处理单元403，用于根据存储比例、共享缓冲区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

第二处理单元404，用于按照所述存储比例，确定将要存储到所述共享缓冲区和闪存设备中的待加载热点数据块；

存储单元405，于将所述待加载热点数据块分别存储到所述共享缓冲区和闪存设备中。

本发明实施例提供的一种数据预热装置，在数据库启动时，根据用户的实际使用情况对一些热点数据进行预热。本发明实施例解决了现有技术中在数据库启动后的初期，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低，IO非常繁忙，影响数据库系统的整体性能的问题，提高了数据库系统的响应速度，减缓对磁盘的频繁IO，提高了数据库系统的整体性能。

本发明实施例提供的一种数据预热装置，还包括：

本发明实施例提供的一种数据预热装置，如图5所示，其中，第一处理单元403包括：

第一处理子单元501，用于根据存储比例、共享缓冲区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值。

具体是根据

计算待加载热点数据块的总数的门限值，其中TDB为待加载热点数据块的总数的门限值，a₁为存储到所述共享缓冲区的待加载热点数据块的存储比例，a₂为存储到所述闪存设备的待加载热点数据块的存储比例，且0≤a₁≤1，0≤a₂≤1，BufCapacity为所述共享缓冲区的大小，Capacity为所述闪存设备的大小，BlockSize为热点数据块的大小。

第二处理子单元502，用于根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数TCT，其中所述候选热点数据表是所述并集中命中次数最高的前TCT个热点数据表。

具体是根据

第三处理子单元503，用于根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数。

具体是根据

第四处理子单元504，用于从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。

本发明实施例提供的一种数据预热装置，如图6所示，其中，第四处理子单元504包括：

基准模块601，用于根据FB＝THN_TCT/2×BR_BN计算每个候选热点数据表的筛选基数值，其中FB为每个候选热点数据表的筛选基数值，THN_TCT/2为第

个候选热点数据表的命中次数，BR_BN为每个候选热点数据表中的热点数据块命中率最高的第BN个热点数据块的命中率；

计算模块602，用于根据PB＝PT×QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中PB为每个候选热点数据表中的候选热点数据块的命中次数，PT为每个候选热点数据表的命中次数，QB为每个候选热点数据表中候选热点数据块的命中率；

第一获取模块603，用于将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数；

第二获取模块604，用于当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，，得到待加载热点数据块的总数。

本发明实施例提供的一种数据预热装置，如图7所示，其中，第四处理子单元504还包括：

处理模块701，用于当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值；

第三获取模块702，用于将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数；

第四获取模块703，用于当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

本发明实施例提供的一种数据预热装置80，如图8所示，还包括统计单元406和备份单元407。

其中，统计单元406，用于当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备；

备份单元407，用于将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。

本装置操作过程，参见上述数据预热方法的实现过程。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种数据预热方法，其特征在于，包括：

2.根据权利要求1所述的一种数据预热方法，其特征在于，所述根据存储比例、共享缓冲区的大小、闪存设备的大小、热点数据块的大小从所述并集中确定待加载热点数据块的总数，具体步骤包括：

根据存储比例、共享缓冲区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值；

根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数TCT，其中所述候选热点数据表是所述并集中命中次数最高的前TCT个热点数据表；

根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数；

从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。

3.根据权利要求2所述的一种数据预热方法，其特征在于，所述根据存储比例、共享缓冲区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值包括：

根据计算待加载热点数据块的总数的门限值，其中TDB为待加载热点数据块的总数的门限值，a₁为存储到所述共享缓冲区的待加载热点数据块的存储比例，a₂为存储到所述闪存设备的待加载热点数据块的存储比例，且0≤a₁≤1，0≤a₂≤1，BufCapacity为所述共享缓冲区的大小，Capacit y为所述闪存设备的大小，BlockSize为热点数据块的大小。

4.根据权利要求2所述的一种数据预热方法，其特征在于，所述根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数TCT，具体步骤包括：

根据

5.根据权利要求2所述的一种数据预热方法，其特征在于，所述根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数包括：

根据计算每个候选热点数据表中的候选热点数据块的个数，其中BN为每个候选热点数据表中的候选热点数据块的个数，TBN为每个候选热点数据表中的热点数据块的总数，TDB为所述待加载热点数据块的总数的门限值，TB为所述并集中的热点数据块的总数。

6.根据权利要求2所述的一种数据预热方法，其特征在于，所述从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数包括：

根据FB＝THN_TCT/2×BR_BN计算每个候选热点数据表的筛选基数值，其中FB为每个候选热点数据表的筛选基数值，THN_TCT/2为第

根据PB＝PT×QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中PB为每个候选热点数据表中的候选热点数据块的命中次数，PT为每个候选热点数据表的命中次数，QB为每个候选热点数据表中候选热点数据块的命中率；

将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数；

当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

7.根据权利要求6所述的一种数据预热方法，其特征在于，还包括：

当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值；

将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数；

当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

8.根据权利要求1所述的一种数据预热方法，其特征在于，所述方法还包括：

当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备；

将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。

9.一种数据预热装置，其特征在于，包括：

10.根据权利要求9所述的一种数据预热装置，其特征在于，第一处理单元包括：

第一处理子单元，用于根据存储比例、共享缓冲区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值；

第二处理子单元，用于根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数TCT，其中所述候选热点数据表是所述并集中命中次数最高的前TCT个热点数据表；

第三处理子单元，用于根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数；

第四处理子单元，用于从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。

11.根据权利要求9所述的一种数据预热装置，其特征在于，第一处理子单元具体用于根据

12.根据权利要求9所述的一种数据预热装置，其特征在于，第二处理子单元具体用于根据计算候选热点数据表的个数TCT，其中TCT为候选热点数据表的个数，TT为所述并集中的热点数据表的总数，TDB为所述待加载热点数据块的总数的门限值，TB为所述并集中的热点数据块的总数。

13.根据权利要求9所述的一种数据预热装置，其特征在于，第三处理子单元具体用于根据

14.根据权利要求9所述的一种数据预热装置，其特征在于，第四处理子单元包括：

基准模块，用于根据FB＝THN_TCT/2×BR_BN计算每个候选热点数据表的筛选基数值，其中FB为每个候选热点数据表的筛选基数值，THN_TCT/2为第

计算模块，用于根据PB＝PT×QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中PB为每个候选热点数据表中的候选热点数据块的命中次数，PT为每个候选热点数据表的命中次数，QB为每个候选热点数据表中候选热点数据块的命中率；

第一获取模块，用于将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数；

第二获取模块，用于当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

15.根据权利要求9所述的一种数据预热装置，其特征在于，第四处理子单元还包括：

处理模块，用于当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值；

第三获取模块，用于将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数；

第四获取模块，用于当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

16.根据权利要求9所述的一种数据预热装置，其特征在于，所述装置还包括：

统计单元，用于当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备；

备份单元，用于将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。