WO2013071726A1

WO2013071726A1 - 数据预热方法及装置

Info

Publication number: WO2013071726A1
Application number: PCT/CN2012/072863
Authority: WO
Inventors: 代坤; 李怀洲; 宋娇
Original assignee: 华为技术有限公司
Priority date: 2011-11-18
Filing date: 2012-03-23
Publication date: 2013-05-23
Also published as: CN102521260B; US9569489B2; CN102521260A; EP2765522B1; US20140250102A1; EP2765522A4; EP2765522A1

Abstract

本发明实施例公开了一种数据预热方法及装置，涉及数据库技术领域，提高了数据库系统的响应速度，减缓对磁盘的频繁IO，提高了数据库系统的整体性能。所述方法包括：当数据库启动时，分别从闪存设备上读取命中率信息和硬盘上读取用户配置信息；获取用户配置信息中的预设热点数据表和命中率信息中的热点数据表的并集；从并集中确定待加载热点数据块的总数；按照所述存储比例，确定将要存储到共享缓冲区和闪存设备中的待加载热点数据块；将待加载热点数据块分别存储到共享缓冲区和闪存设备中。本发明实施例适用于数据预热处理过程中。

Description

数据预热方法及装置技术领域

本发明涉及数据库技术领域，尤其涉及一种数据预热方法及装置。

背景技术随着数据库技术的快速发展，数据库存储系统呈现以下特点：固态硬盘 ( Solid-State Drive, SSD ), 相变存储器等新型存储设备和传统的磁盘设备构成混合存储环境。基于闪存的 SSD 同传统磁盘相比，具有性能高、能耗低等优势，价格和容量介于内存和传统磁盘之间。预计今后长时间内，各种类型的硬盘设备将同时存在，混合存储成为主流的存储配置；随着应用越来越多，用户数据量越来越大，传统的数据存储导致的输入输出（ Input/Output, 10 )瓶颈问题就会凸显出来；一些重要的应用需求要求数据库系统具有快速、及时、准确的响应。在现有技术中，在主存和外部存储器之间提供一个带有緩存的控制器设备来实现预先加载下一个请求的数据，请求到来时将数据转移到主存。或者是把闪存设备用作二级緩存，在主存的緩沖区满时，将需要被替换出緩沖区的部分

对一些热点数据进行预加载。在现有技术中，在数据库启动后的初期，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低， 10 非常繁忙，影响数据库系统的整体性能。发明内容

本发明的实施例提供一种数据预热方法及装置，提高了数据库系统的响应速度，减緩对磁盘的频繁 10, 提高了数据库系统的整体性能。

本发明实施例采用如下技术方案：

一种数据预热方法，包括：

当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享緩沖区和闪存设备中的存储比例，共享緩沖区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

根据存储比例、共享緩沖区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

按照所述存储比例，确定将要存储到所述共享緩沖区和闪存设备中的待加载热点数据块；

将所述待加载热点数据块分别存储到所述共享緩沖区和闪存设备中。

一种数据预热装置，包括：

读取单元，用于当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享緩沖区和闪存设备中的存储比例，共享緩沖区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；获取单元，用于获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

第一处理单元，用于根据存储比例、共享緩沖区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

第二处理单元，用于按照所述存储比例，确定将要存储到所述共享緩沖区和闪存设备中的待加载热点数据块；

存储单元，用于将所述待加载热点数据块分别存储到所述共享緩沖区和闪存设备中。

本发明实施例提供的一种数据预热方法及装置，在数据库启动时，根据用户的实际使用情况将一些热点数据块预先存储到共享緩沖区和闪存设备中。本发明实施例解决了现有技术中在数据库启动，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低， 10非常繁忙，影响数据库系统的整体性能的问题，提高了数据库系统的响应速度，减緩对磁盘的频繁

10, 提高了数据库系统的整体性能。

附图说明

图 1为本发明实施例一提供的一种数据预热方法的主要操作步骤流程图；图 2为本发明实施例一提供的一种数据预热方法的 HDM在数据库系统中管理热点数据的示意图；

图 3为本发明实施例一提供的一种数据预热方法的整体操作步骤流程图；图 4为本发明实施例二提供的一种数据预热装置的主要结构图；

图 5为本发明实施例二提供的一种数据预热装置中处理单元的结构图；图 6 为本发明实施例二提供的一种数据预热装置中第四处理子单元的主要结构图；

图 7 为本发明实施例二提供的一种数据预热装置中第四处理子单元的整体结构图；

图 8为本发明实施例二提供的一种数据预热装置的整体结构图。

具体实施方式

下面结合附图对本发明实施例一种数据预热方法及装置进行详细描述。实施例一

本发明实施例提供的一种数据预热方法，如图 1所示，包括：

101、当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享緩沖区和闪存设备中的存储比例，共享緩沖区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

102、获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；

103、根据存储比例、共享緩沖区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；

104、按照所述存储比例，确定将要存储到所述共享緩沖区和闪存设备中的待加载热点数据块；

105、将所述待加载热点数据块分别存储到所述共享緩沖区和闪存设备中。本发明实施例提供的一种数据预热方法，在数据库启动时，根据用户的实际使用情况对一些热点数据进行预热。本发明实施例解决了现有技术中在数据库启动后的初期，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低， 10非常繁忙，影响数据库系统的整体性能的问题，提高了数据库系统的响应速度，减緩对磁盘的频繁 10, 提高了数据库系统的整体性能。

本发明主要是在数据库系统中增加一个热点数据管理模块（ hot data management,HDM ) 来进行数据预热处理。如图 2所示，为 HDM在数据库系统中管理热点数据的示意图。

具体应用时，如图 3所示，操作流程如下：

301、当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享緩沖区和闪存设备中的存储比例，共享緩沖区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值。

所述命中率信息从闪存设备上读取，用户配置信息从硬盘上读取，并将所述命中率信息和用户配置信息存储在主存的共享緩沖区中。

所述命中率信息中包括热点数据表，以及热点数据表的命中次数及排名，热点数据块的命中率及排名。

当数据库启动，无法从闪存设备上读取所述命中率信息时，从硬盘上读取所述命中率信息。

302、获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集。

根据存储比例、共享緩沖区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数。具体包括如下子步骤 3031-3034:

3031、根据存储比例、共享緩沖区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值。

(<¾ X BufCapacity +<¾ x Capacity)

具体是根据 BlockSize 计算待加载热点数据块的总数的门限值，其中 TDB为待加载热点数据块的总数的门限值， ^Ωι为存储到所述共享緩沖区的待加载热点数据块的存储比例， "²为存储到所述闪存设备的待加载热点数据块的存储比例，且^{0≤ β}ι ^≤1 , ^0≤ί½^≤1 , BufCapacity为所述共享緩沖区的大小， Capacity为所述闪存设备的大小， BlockSize为热点数据块的大小。

3032、根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数 TCT, 其中所述候选热点数据表是所述并集中命中次数最高的前 TCT个热点数据表

TCT 腿

具体是根据 TB 计算候选热点数据表的个数 TCT, 其中 TCT为候选热点数据表的个数, TT为所述并集中的热点数据表的总数, TDB 为所述待加载热点数据块的总数的门限值， TB为所述并集中的热点数据块的总数。

3033、根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数。 TDB

BN = TBN x x l00

具体是根据 TB 计算每个候选热点数据表中的候选热点数据块的个数，其中 BN为每个候选热点数据表中的候选热点数据块的个数， TBN为每个候选热点数据表中的热点数据块的总数， TDB为所述待加载热点数据块的总数的门限值， TB为所述并集中的热点数据块的总数。

3034、从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。具体包括步骤 304-311 :

304、根据 ^{FB = THN}TCT,2 X ^BRBN计算每个候选热点数据表的筛选基数值，其中 ¾为每个候选热点数据表的筛选基数值， ^T丽 T_CT 为第 \^{TCT I 2} 个候选热点数据表的命中次数， ^BRBN为每个候选热点数据表中的热点数据块命中率最高的第 BN个热点数据块的命中率。

305、根据 ^{PB=PT x} QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中 PB为每个候选热点数据表中的候选热点数据块的命中次数，

PT为每个候选热点数据表的命中次数， QB为每个候选热点数据表中候选热点数据块的命中率。

306、将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数。

307、判断所述第一筛选热点数据块的总数是否在所述待加载热点数据块的总数的门限值加减偏差值的范围内。

308、当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。记录下每个候选热点数据表的筛选基数值。

309、当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值。

此处存在两种情况：

当所述第一筛选热点数据块的总数大于所述待加载热点数据块的总数的门限值与偏差值之和时，将所述筛选基数值加倍；

当所述第一筛选热点数据块的总数小于所述待加载热点数据块的总数的门限值与偏差值之差时，将所述筛选基数值减半。

例如，偏差值可设为 1或 2。

310、将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数。

311、当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

记录下每个所述热点数据表的新的筛选基数值。

最终得到的筛选基数值作为下一次数据库重启时的初步筛选基数值。

312、按照所述存储比例，确定将要存储到所述共享緩沖区和闪存设备中的待加载热点数据块；

313、将所述待加载热点数据块分别存储到所述共享緩沖区和闪存设备中。为存储在所述闪存设备中的热点数据块在所述共享緩沖区中建立散表

( HASH ) 索引，便于读取所述闪存设备中的热点数据块。 314、当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备。

更新存储到所述闪存设备上的命中率信息，是便于在下次数据库重启时读取利用。

315、将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。

将最近更新的命中率信息备份到所述硬盘上，是防止所述闪存设备损坏、脱落、更换等特殊情况发生时无法读取命中率信息。

本发明不仅限于 SSD+HDD ( hard disk drive, 硬盘驱动器）方式的存储系统，还可以应用于各种混合存储系统。

对于热点数据预加载不仅限于加载热点数据表，也可适用于对索引数据表的热点统计。

实施例二

本发明实施例提供的一种数据预热装置 40, 如图 4所示，包括读取单元 401 , 获取单元 402, 第一处理单元 403、第二处理单元 404和存储单元 405。

其中，读取单元 401 , 用于当数据库启动时，分别取命中率信息和读取用户配置信息，其中所述命中率信息包括：热点数据表，所述用户配置信息包括：预设热点数据表，将待加载热点数据块存储到共享緩沖区和闪存设备中的存储比例，共享緩沖区的大小，闪存设备的存储能力，待加载热点数据块的总数的偏差值；

获取单元 402, 用于获取所述用户配置信息中的预设热点数据表和所述命中率信息中的热点数据表的并集；第一处理单元 403 , 用于根据存储比例、共享緩沖区的大小、闪存设备的大小、热点数据块的大小、偏差值从所述并集中确定待加载热点数据块的总数；第二处理单元 404, 用于按照所述存储比例，确定将要存储到所述共享緩沖区和闪存设备中的待加载热点数据块；存储单元 405 , 于将所述待加载热点数据块分别存储到所述共享緩沖区和闪存设备中。本发明实施例提供的一种数据预热装置，在数据库启动时，根据用户的实际使用情况对一些热点数据进行预热。本发明实施例解决了现有技术中在数据库启动后的初期，客户端的请求数据量大而且业务非常繁忙时，会导致数据库系统的响应效率降低， 10非常繁忙，影响数据库系统的整体性能的问题，提高了数据库系统的响应速度，减緩对磁盘的频繁 10, 提高了数据库系统的整体性能。本发明实施例提供的一种数据预热装置，还包括：当数据库启动，无法从闪存设备上读取所述命中率信息时，从硬盘上读取所述命中率信息。本发明实施例提供的一种数据预热装置，如图 5所示，其中，第一处理单元 403包括：第一处理子单元 501 , 用于根据存储比例、共享緩沖区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值。

(<¾ X BufCapacity +a₂ x Capacity)

具体是根据 BlockSize 计算待加载热点数据块的总数的门限值，其中 TDB为待加载热点数据块的总数的门限值， ^Ωι为存储到所述共享緩沖区的待加载热点数据块的存储比例， "²为存储到所述闪存设备的待加载热点数据块的存储比例，且^{0≤ β}ι ^{≤ 1} , ^0≤ί½^≤1 , BufCapacity为所述共享緩沖区的大小， Capacity为所述闪存设备的大小， BlockSize为热点数据块的大小。

第二处理子单元 502, 用于根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数 TCT, 其中所述候选热点数据表是所述并集中命中次数最高的前 TCT个热点数据表。具体是根据

计算候选热点数据表的个数 TCT，其中 TCT为候选热点数据表的个数, TT为所述并集中的热点数据表的总数, TDB 为所述待加载热点数据块的总数的门限值， TB为所述并集中的热点数据块的总数。

第三处理子单元 503, 用于根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数。

TDB

BN = TBN x χ 100%

第四处理子单元 504, 用于从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。本发明实施例提供的一种数据预热装置，如图 6所示，其中，第四处理子单元 504包括：

基准模块 601 , 用于根据 ^{FB = THN}TCT,2 ^{X BR}BN计算每个候选热点数据表的筛选基数值，其中^ B为每个候选热点数据表的筛选基数值， ^THN_TCTI2为

「^TCT ' ² 个候选热点数据表的命中次数，为每个候选热点数据表中的热点数据块命中率最高的第 BN个热点数据块的命中率；

计算模块 602, 用于根据 ^{PB=PT x} QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中 PB为每个候选热点数据表中的候选热点数据块的命中次数， PT为每个候选热点数据表的命中次数， QB为每个候选热点数据表中候选热点数据块的命中率；

第一获取模块 603 , 用于将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数；

第二获取模块 604 , 用于当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，，得到待加载热点数据块的总数。

本发明实施例提供的一种数据预热装置，如图 7所示，其中，第四处理子单元 504还包括：

处理模块 701 , 用于当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值；

第三获取模块 702, 用于将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数；

第四获取模块 703 , 用于当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

本发明实施例提供的一种数据预热装置 80, 如图 8所示，还包括统计单元 406和备份单元 407。

其中，统计单元 406, 用于当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备；

备份单元 407, 用于将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。

本装置操作过程，参见上述数据预热方法的实现过程。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

权利要求

1、一种数据预热方法，其特征在于，包括：

2、根据权利要求 1所述的一种数据预热方法，其特征在于，所述根据存储比例、共享緩沖区的大小、闪存设备的大小、热点数据块的大小从所述并集中确定待加载热点数据块的总数，具体步骤包括：

根据存储比例、共享緩沖区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值；

根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数 TCT, 其中所述候选热点数据表是所述并集中命中次数最高的前 TCT 个热点数据表；根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数；

从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。

3、根据权利要求 2所述的一种数据预热方法，其特征在于，所述根据存储比例、共享緩沖区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值包括：

(<¾ X BufCapacity +a₂ x Capacity)

根据 BlockSize 计算待加载热点数据块的总数的门限值，其中 TDB为待加载热点数据块的总数的门限值，为存储到所述共享緩沖区的待加载热点数据块的存储比例， "²为存储到所述闪存设备的待加载热点数据块的存储比例，且^{0≤ β}ι ^{≤ 1} , ^0≤¾^≤1 , BufCapacity为所述共享緩沖区的大小， Capacity 为所述闪存设备的大小， BlockSize 为热点数据块的大小。

4、根据权利要求 2所述的一种数据预热方法，其特征在于，所述根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数 TCT, 具体步骤包括：

TCT 腿

根据 TB 计算候选热点数据表的个数 TCT, 其中 TCT 为候选热点数据表的个数， TT为所述并集中的热点数据表的总数， TDB为所述待加载热点数据块的总数的门限值，ΤΒ为所述并集中的热点数据块的总数。

5、根据权利要求 2所述的一种数据预热方法，其特征在于，所述根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数包括：根据

计算每个候选热点数据表中的候选热点数据块的个数，其中 BN 为每个候选热点数据表中的候选热点数据块的个数， TBN为每个候选热点数据表中的热点数据块的总数， TDB为所述待加载热点数据块的总数的门限值， TB为所述并集中的热点数据块的总数。

6、根据权利要求 2所述的一种数据预热方法，其特征在于，所述从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数包括：

根据 ^FB = ^THNTC_T/2 x ^BR _BN计算每个候选热点数据表的筛选基数值，其中 ¾为每个候选热点数据表的筛选基数值， ^THNT_CT 为 \^TCTI1 个候选热点数据表的命中次数，丽为每个候选热点数据表中的热点数据块命中率最高的第 ΒΝ个热点数据块的命中率；

根据 PB=PT x QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中 PB为每个候选热点数据表中的候选热点数据块的命中次数， PT为每个候选热点数据表的命中次数， ^QB为每个候选热点数据表中候选热点数据块的命中率；

将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数；当所述第一选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

7、根据权利要求 6所述的一种数据预热方法，其特征在于，还包括：当所述第一选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值；

将所述候选数据表中命中次数大于等于所述新的选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数；

当所述第二选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

8、根据权利要求 1所述的一种数据预热方法，其特征在于，所述方法还包括：

当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备；

将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。

9、一种数据预热装置，其特征在于，包括：

10、根据权利要求 9所述的一种数据预热装置，其特征在于，第一处理单元包括：

第一处理子单元，用于根据存储比例、共享緩沖区的大小、闪存设备的大小和热点数据块的大小，计算待加载热点数据块的总数的门限值；

第二处理子单元，用于根据所述待加载热点数据块的总数的门限值、所述并集中的热点数据表的总数、所述并集中的热点数据块的总数，计算候选热点数据表的个数 TCT, 其中所述候选热点数据表是所述并集中命中次数最高的前 TCT个热点数据表；

第三处理子单元，用于根据所述待加载热点数据块的总数的门限值、所述候选热点数据表中的热点数据块的总数、所述并集中的热点数据块的总数，计算每个候选热点数据表中的候选热点数据块的个数；

第四处理子单元，用于从所述候选热点数据表中的候选热点数据块中筛选出待加载热点数据块，得到待加载热点数据块的总数。

11、根据权利要求 9所述的一种数据预热装置，其特征在于，第一处理子 (<¾ x BufCapacity +a₂x Capacity)

单元具体用于根据 BlockSize 计算待加载热点数据块的总数的门限值，其中 TDB为待加载热点数据块的总数的门限值，为存储到所述共享緩沖区的待加载热点数据块的存储比例， "²为存储到所述闪存设备的待加载热点数据块的存储比例，且^{0≤ β}ι^{≤ 1}, ^{0≤ ί}½^{≤ 1} , BufCapacity为所述共享緩沖区的大小， Capacity 为所述闪存设备的大小， BlockSize 为热点数据块的大小。

12、根据权利要求 9所述的一种数据预热装置，其特征在于，第二处理子

TCT 腿

单元具体用于根据 TB 计算候选热点数据表的个数 TCT, 其中 TCT为候选热点数据表的个数， TT为所述并集中的热点数据表的总数，

TDB为所述待加载热点数据块的总数的门限值， TB为所述并集中的热点数据块的总数。

13、根据权利要求 9所述的一种数据预热装置，其特征在于，第三处理子

TDB

BN = TBNx χ100

单元具体用于根据 TB 计算每个候选热点数据表中的候选热点数据块的个数，其中 BN为每个候选热点数据表中的候选热点数据块的个数， TBN为每个候选热点数据表中的热点数据块的总数， TDB为所述待加载热点数据块的总数的门限值， TB为所述并集中的热点数据块的总数。

14、根据权利要求 9所述的一种数据预热装置，其特征在于，第四处理子单元包括：基准模块，用于根据 ^FB =

^X ^ 计算每个候选热点数据表的筛选基数值，其中^ B为每个候选热点数据表的筛选基数值， ^THNT_CTI2 ^ ^{TCT I 2}A 个候选热点数据表的命中次数，为每个候选热点数据表中的热点数据块命中率最高的第 BN个热点数据块的命中率；

计算模块，用于根据 ^PB=PT X QB计算每个候选热点数据表中的候选热点数据块的命中次数，其中 PB为每个候选热点数据表中的候选热点数据块的命中次数， PT为每个候选热点数据表的命中次数， QB为每个候选热点数据表中候选热点数据块的命中率；

第一获取模块，用于将所述候选数据表中命中次数大于等于所述候选热点数据表的所述筛选基数值的所有第一候选热点数据块相加，得到第一筛选热点数据块的总数；

第二获取模块，用于当所述第一筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第一候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

15、根据权利要求 9所述的一种数据预热装置，其特征在于，第四处理子单元还包括：

处理模块，用于当所述第一筛选热点数据块的总数不在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，将所述筛选基数值与预设倍数相乘，得到新的筛选基数值；

第三获取模块，用于将所述候选数据表中命中次数大于等于所述新的筛选基数值的所有第二候选热点数据块相加，得到第二筛选热点数据块的总数；第四获取模块，用于当所述第二筛选热点数据块的总数在所述待加载热点数据块的总数的门限值加减偏差值的范围内时，确定所述第二候选热点数据块为待加载热点数据块，得到待加载热点数据块的总数。

16、根据权利要求 9所述的一种数据预热装置，其特征在于，所述装置还包括：

统计单元，用于当数据库运行时，实时统计热点数据的命中率信息，并更新存储到所述闪存设备；

备份单元，用于将所述闪存设备上的数据备份到所述硬盘，其中所述备份数据包括更新的命中率信息。