WO2021073241A1

WO2021073241A1 - 一种基于磁盘存储的数据读取方法、装置及设备

Info

Publication number: WO2021073241A1
Application number: PCT/CN2020/109273
Authority: WO
Inventors: 杨新颖
Original assignee: 蚂蚁区块链科技(上海)有限公司
Priority date: 2019-10-18
Filing date: 2020-08-14
Publication date: 2021-04-22
Also published as: CN110879687A; US20220236910A1; CN110879687B

Abstract

公开了一种基于磁盘存储的数据读取方法、装置及设备。通过本说明书实施例所提供的方案，在数据库服务端从磁盘中读取数据时，首先将业务属性所对应的块高进行排序，得到块高序列，然后从块高序列中得到若干块高区间，从磁盘中连续读取这些块高区间所对的全量数据块，然后再从数据块中根据位置信息读取数据记录。

Description

一种基于磁盘存储的数据读取方法、装置及设备

技术领域

本说明书实施例涉及信息技术领域，尤其涉及一种基于磁盘存储的数据读取方法、装置及设备。

背景技术

在在以中心化的块链式账本对外提供服务的数据库服务端，账本本身是在磁盘中进行持久化存储的。那么在用户进行读取的时候，也需要从磁盘中进行读取，由于块链式账本的特征，用户的数据有可能是随机分布在磁盘中的各个扇区中，一般的读取方式效率较低。

基于此，需要一种在块链式账本提高效率的数据读取方案。

发明内容

本申请实施例的目的是提供一种基于磁盘存储的更为高效的数据读取方案。

为解决上述技术问题，本申请实施例是这样通过以下实现的。

一种基于磁盘存储的数据读取方法，包括：接收客户端所发送的数据读取指令，其中，所述读取指令中包含有业务属性；从预存的索引表中获取所述业务属性所对应的位置信息集合，其中，所述位置信息包含数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；对所述块高依序进行排列，生成块高序列，从所述块高序列中确定出M个互斥的块高连续的块高区间；针对任一块高区间，从磁盘中读取所述块高区间所对应的数据块；根据所述位置信息集合从所述块高区间所对应的数据块中查询获取的数据记录，并返回至客户端。

对应的，本说明书实施例还提供一种基于磁盘存储的数据读取装置，包括：接收模块，接收客户端所发送的数据读取指令，其中，所述读取指令中包含有业务属性；位置信息获取模块，从预存的索引表中获取所述业务属性所对应的位置信息集合，其中，所述位置信息包含数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；块高区间生成模块，对所述块高依序进行排列，生成块高序列，从所述块高序列中确定出M个互斥的块高连续的块高区间；数据块读取模块，针对任一块高区间，从磁盘中读取所述块高区间所对应的数据块；数据记录读取模块，根据所述位置信息集合从所述块高区间所对应的数据块中查询获取的数据记录，并返回至客户端。

通过本说明书实施例所提供的方案，在数据库服务端从磁盘中读取数据时，首先将业务属性所对应的块高进行排序，得到块高序列，然后从块高序列中得到若干块高区间，从磁盘中连续读取这些块高区间所对的全量数据块，然后再从数据块中根据位置信息读取数据记录，减少了磁盘读取是的换道次数，提高了磁盘的输入/输出(Input/Output，IO)效率，从而提高了块链式账本在磁盘存储时的读取效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书实施例。

此外，本说明书实施例中的任一实施例并不需要达到上述的全部效果。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本说明书实施例所涉及的系统架构示意图；

图2为本说明书实施例所提供的一种生成块链式账本的流程示意图；

图3为本说明书实施例提供的一种数据记录的索引创建方法的流程示意图；

图4是本说明书实施例提供的一种基于磁盘存储的数据读取方案的流程示意图；

图5是本说明书实施例提供的一种基于磁盘存储的数据读取装置的结构示意图；

图6是用于配置本说明书实施例方法的一种设备的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本说明书实施例中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行详细地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于保护的范围。

首先对本说明书实施例中所涉及的块链式账本进行说明。数据库服务端面向的常常为各种机构，各机构则可以将它们与第三方用户(包括其它机构或者个人)之间所产生的数据记录在数据库服务方进行存储。如图1所示，图1为本说明书实施例所涉及的系统架构示意图。在该示意图中，一个企业机构可以面向多名用户，而每个用户均可以通过其对应的企业机构向数据库服务提供方进行查询。

例如，数据库服务端对接的机构是某金融产品公司，数据记录可以是个人用户在该金融产品公司的理财记录；或者，对接的机构可以是政府部门，其中的数据记录是政府部门对于该部门所管理的公共项目的开销明细；或者，数据库服务方对接的机构是某个医院，其中的数据记录是病人的病历；或者，数据库服务方对接的机构是第三方支付机构，数据记录可以是个人用户通过该机构的支付记录，等等。

在中心化的数据库服务端，块链式的账本通过如下方式生成，如图2所示，图2为本说明书实施例所提供的一种生成块链式账本的流程示意图，包括S201至S203。

S201，接收待存储的数据记录，确定各数据记录的哈希值，其中，数据记录中包含业务属性。

此处的待存储的数据记录，可以是客户端个人用户的各种消费记录，也可以是应用服务器基于用户的指令，在执行业务逻辑时产生的业务结果、中间状态以及操作记录等等。具体的业务场景可以包括消费记录、审计日志、供应链条、政府监管记录、医疗记录等等。

在每个与数据库服务方对接的机构中，所述业务属性在所述对接机构中，一般而言是唯一存在的，业务属性基于不同的业务场景，可以包括用户名、用户身份证号、驾照编号、手机号、项目唯一编号、数据记录的类型(例如金融包编号)等等。

例如，对于第三方支付机构而言，数据记录是用户的消费记录，此时的业务属性即为用户标识(包括手机号、身份证号、用户名等等)，或者对该用户标识进行哈希算法所得到的哈希值；或者，对于政府机构而言，数据记录为多个公共项目的开销流水，则此时的业务属性可以为每个项目的唯一编号。

业务属性可以存储在数据记录中的指定位置，例如数据记录的头部或者尾部。

S203，当达到预设的成块条件时，确定待写入数据块中的各数据记录，生成包含数据块的哈希值和数据记录的第N个数据块。

所述预设的成块条件包括：待存储的数据记录数量达到数量阈值，例如，每接收到一千条数据记录时，生成一个新数据块，将一千条数据记录写入块中；或者，距离上一次成块时刻的时间间隔达到时间阈值，例如，每隔5分钟，生成一个新数据块，将在这5分钟内接收到的数据记录写入块中。

此处的N指的是数据块的序号，换言之，在本说明书实施例中，数据块是以块链的形式，基于成块时间的顺序先后排列，具有很强的时序特征。其中，数据块的块高基于成块时间的先后顺序单调递增。块高可以是序号，此时第N个数据块的块高即为N；块高也可以其它方式生成，例如，将成块时间对称加密转换为大整型数据(例如，12位或者15位的整数)作为块高。

当N＝1时，即此时的数据块为为初始数据块。初始数据块的哈希值和块高基于预设方式给定。例如，初始数据块中不包含数据记录，哈希值则为任一给定的哈希值，块高blknum＝0；又例如，初始数据块的生成触发条件与其它数据块的触发条件一致，但是初始数据块的哈希值由对初始数据块中的所有内容取哈希确定。

当N>1时，由于前一数据块的内容和哈希值已经确定，则此时，可以基于前一数据块(即第N－1个数据块)的哈希值生成当前数据块(第N个数据块)的哈希值，例如，一种可行的方式为，确定每一条将要写入第N个块中的数据记录的哈希值，按照在块中的排列顺序，生成一个默克尔树，将默克尔树的根哈希值和前一数据块的哈希值拼接在一起，再次采用哈希算法，生成当前块的哈希值。又例如，还可以按照块中数据记录的顺序进行拼接并取哈希得到整体数据记录的哈希值，拼接前一数据块的哈希值和整体数据记录的哈希值，并对拼接得到的字串进行哈希运算，生成数据块的哈希值。

用户在上传数据成功后，即可以得到对应的数据记录的哈希值以及所处的数据块的哈希值，并保存，并且可以基于该哈希值发起完整性验证。具体的验证方式即为在数据库中重新计算数据记录自身的哈希值以及所处的数据块的哈希值，与本地所保存的进行对比。

通过前述的数据块的生成方式，每一个数据块通过哈希值确定，数据块的哈希值由数据块中的数据记录的内容、顺序以及前一数据块的哈希值决定。用户可以随时基于数据块的哈希值发起验证，对于数据块中任何内容(包括对于数据块中数据记录内容或者顺序的修改)的修改都会造成在验证时计算得到的数据块的哈希值和数据块生成时的哈希值不一致，而导致验证失败，从而实现了中心化下的不可篡改。

在对于块链式的账本进行验证时，一般而言，即指定一段数据块进行连续的完整性验证，或者从初始数据块开始进行连续的完整性验证。验证的方式即为获取前一数据块的哈希值，并采用与生成数据块的哈希值时的同样算法，根据自身的数据记录和前一数据块的哈希值，重新计算一遍自身数据块的哈希值，以进行验证。

基于前述方式，可以得到一份难以篡改的块链式账本用于存储数据。为了查询数据更为便利，本说明书实施例还提供一种针对于块链式账本的索引创建方法。如图3所示，图3为本说明书实施例提供的一种数据记录的索引创建方法的流程示意图，该流程具体包括如下步骤S301至S305。

S301，在块链式账本中，针对任一数据记录，获取所述数据记录中所包含的业务属性。

业务属性的具体位置以及获取方式可以是数据库服务方和对接机构事先协商。例如，对接机构所提供的数据记录为标准结构化的数据记录时，业务属性可以从数据记录中指定偏移量获取，或者由特定字符标识起始位置和结束位置；又或者，对接机构所提供的数据记录为非结构化的数据时，在对接机构上传时可以直接在每条数据记录的开头拼接上包含业务属性的头部，数据库服务方可以直接从头部获取每条数据记录的业务属性。

S303，确定所述数据记录在账本中的位置信息，所述位置信息包括数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量。

如前所述，一个块链式的账本由多个数据块组成，同时，一个数据块中通常包含多个数据记录。因此，在本说明书实施例中，所述的位置信息具体指的是一条数据记录被保存时，处于账本中的哪个数据块上，以及，在该数据块中的什么位置。

在本说明书实施例所提供的数据块中，可以有多种方式用来标识不同的数据块，包括数据块的哈希值或者块高。

数据块的哈希值为根据前一区块哈希值和自身数据记录进行哈希计算而得到的哈希值，可以用于唯一、明确地标识一个数据块。在块链式的账本中，通常第一个数据块其块高为0，以后每增加一个数据块，块高加1；或者，还可以将数据块的成块时间转换为一个大的单调递增整型数据(一般为12至15位)序列，作为数据块的块高。因此，一个数据块通常有一个明确的块高。

又例如，在一个已经确定的要写入数据库的数据块，其中数据记录的排序也已经固定，因此一个数据记录在该数据块中的序号也是明确的，在数据记录的长度为固定单位时，序号同样可以用于明确该数据记录在其所处的数据块中的位置信息。即，序号同样也可以用于指示数据记录在数据块中的偏移量。

同时，在一个数据块中，由于通常包含了多个数据记录，因此，还可以用各数据记录在该数据块中的地址偏移量来分别标识数据块中的数据记录。显而易见，在同一个数据块中，各数据记录的地址偏移量并不相同。

当然，由于在本说明书实施例所提供的方式中，数据块的具体格式是可以自定义的(例如，数据块的块头中所包含的元数据信息和备注信息，数据块的块高所采取的形式等等)，在不同的格式下，位置信息的内容也会有所不同，这并不构成对本方案的限定。

S305，建立所述业务属性和位置信息的对应关系，写入以所述业务属性为主键的索引。

即，该索引是一个倒排索引。在该索引中，主键是数据记录中所包含的业务属性。具体的写入方式为，当索引中的主键不包含所述指定标识字段时，在索引表中创建以所述指定标识字段为主键的索引记录。

当所述索引中的主键包含所述指定标识字段时，将所述位置信息写入所述指定标识字段所处的索引记录。需要说明的是，此处的写入不是覆盖性的写入，而是将位置信息添加到该索引记录的值中，与其它位置信息并列存在与该索引记录中。

如表1所示，表1为本说明书实施例所提供的一种示例性索引表。其中Key即为业务属性的具体值，Value部分的每个数组即为一条位置信息，每个数组中的前部分块高，后部分为数据记录在该数据块中的序号，通过块高和序号即可以唯一的确定一条数据记录。容易理解，在索引表中，一个key可以对应于多个位置信息。

表1

Key	Value
0X123456	(2,08)，(2,10)，(300,89)，(300,999)
344X0001	(5,01)，(8,22)
……	……

通过本说明书实施例所提供的方案，对于写入账本的数据记录，确定出数据记录的业务属性，以及在账本中的存储位置，建立起二者的对应关系，创建以业务属性为主键的倒排索引，不必了解用户的业务详情，从索引中即可以基于业务属性对于数据记录进行相应统计，以及后续的查询和验证。

在该索引表中，由于一个业务属性可以对应于多个位置信息(即一条索引记录中可以包含多个位置信息，或者说一个业务属性可以对应于多个数据记录)，在将位置信息写入索引中时，还可以将位置信息按照数据记录在账本中的先后顺序依次进行排列，有利于用户的查询以及验证。数据记录在账本中的先后顺序即可以数据记录被写入账本的时间戳(即数据块的成块时间戳)来体现，以及，对于同一数据块中的数据记录的先后顺序，则可以通过在数据块中的排序先后来体现。通过对位置信息进行排序，可以便于在查询获取读取数据记录时依序获取得到相应的数据记录，提高用户体验。

在索引表被创建以后，即可以基于该索引表进行业务属性的状态查询以及统计。例如，接收包含业务属性具体值的查询请求(一般而言，查询请求可以以指令的形式予以发送)。

数据库服务端在接收到查询指令之后，即可以从根据指令从磁盘中进行数据读取。在本说明书实施例中，磁盘(disk)是指利用磁记录技术存储数据的存储器，包括软磁盘(soft disk，简称软盘)或者硬磁盘(hard disk，简称硬盘)。

在数据库服务端进行存储的过程中，读写数据的流程一般是首先发指令，通知磁盘开始扇区位置，然后给出需要从这个初始扇区往后读取的连续扇区个数(也可以是一个)，同时给出动作是读还是写。磁盘收到这条指令，就会按照指令的要求，读或者写数据。

那么在这个过程中，就会出现连续/随机IO。所谓的连续和随机是指本次IO给出的初始扇区地址，和上一次IO的结束扇区地址，是不是连续的，或者相隔不多的，如果是，则本次IO应该算是一个连续IO，否则视为一次随机IO。

一个IO所用的时间＝寻道时间+数据传输时间。由于寻道时间相对传输时间，大几个数量级，所以影响IOPS的关键因素，就是降底寻道时间，在连续IO的情况下，因为本次初始扇区和上次结束扇区相隔很近，则磁头几乎不用换道或换道时间极短；如果相差太大，则磁头需要很长的换道时间，如果随机IO很多，导致磁头不停换道，效率大大降低。

在本说明书实施例所涉及的账本中，账本中的数据块在磁盘中一般都是依据序号顺序存储的，假设账本中的一个数据块和磁盘中的一个扇区占用空间大小大致相当(或者占用了多个扇区)，则每次读取一个数据块则相当于从磁盘中读取一个扇区。如前所述，由于用户的数据往往是没有规律的，其可能在短期内存储了较多数据，写入了相邻的若干数据块；也有可能是隔一段时间存储一些数据记录，从而在账本内比较分散。

在这种情形下，如果完全按照查询得到的块高依次进行磁盘读取，则必然是随机IO，在数据量较大时，将会显著降低读取效率。基于此，本说明书实施例提供一种数据读取方案。如图4所示，图4是本说明书实施例提供的一种基于磁盘存储的数据读取方案的流程示意图，该流程具体包括如下步骤S401至S409。

S401，接收客户端所发送的数据读取指令，其中，所述读取指令中包含有业务属性。

数据读取可以来自于对接机构，也可以是来自于对接机构的服务用户。从而，数据库可以根据业务属性的具体值，从索引表中进行匹配。例如，在表1被创建之后，用户输入查询指令，Retrieve(0X123456，&v，FULL)。

S403，从预存的索引表中获取所述业务属性所对应的位置信息集合，其中，所述位置信息包含数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量。

数据库服务端即可以从索引表中取得用户“0X123456”相应的数据记录的位置信息(2,08)，(2,10)，(300,89)，(300,999)。

需要说明的是，表1中为了便于理解，给出的示例中位置信息的数量较少。但是在实际应用中，一条业务属性往往对应大量的位置信息。

S405，对所述块高依序进行排列，生成块高序列，从所述块高序列中确定出M个互斥的块高连续的块高区间。

块高序列即指将块高从小到大依次排列的序列。如对于位置信息(2,08)，(2,10)，(300,89)，(300,999)，得到的块高2和300，进行排序即得到块高序列“2，300”。

当然，在实际应用中，由于数据量较多，得到的块高序列往往是如下所示：“1，2，4，5，6，9，11，13，18，23，25，27，50，51，53，55，99，130，131，155……”，其中的块高数量可能会有数万条甚至更多。在这种情形下，如果对于每个块高依次进行读取，显然，就是随机IO，效率太低。

因此，需要针对块高序列得到若干个互斥的块高连续的块高区间。所述的互斥指的是各块高区间中不包含有相同的块高，即各块高区间不会重叠。

确定块高区间的原则是：块高区间中的无效块高(即不处于块高序列中的块高)不应太多。否则，读取无效数据块太多，同样影响了数据记录的读取效率。基于该原则，本说明书实施例提供一种示例性的块高区间确定方法，具体如下：

遍历所述块高系列，从还未确定所属块高区间的序号开始，依序确定两个块高的间隔，将间隔小于预设值时的前一块高作为区间起点S _M；以及，从块高S _M开始，依序确定两个块高的间隔，将当间隔大于预设值时的前一块高作为区间终点E _M，生成第M个块高区间[S _M，E _M]。

以前述的块高序列“1，2，4，5，6，9，11，13，18，23，25，27，50，51，53，55，99，130，131，155……”为例。

在确定第一个块高区间时，从序列中的第一个块高“1”开始，依次检验数组(1，2)、(2，4)、(4、5)，(5、6)……之间的间隔，如果预设的间隔距离是3，则可以知道，第一个数组(1，2)即满足该条件，从而该数组中的前一块高“1”将被作为一个区间起点S _M，而数组(13，18)超过了预设间隔距离，从而该数组中的前一块高“13”将被作为区间终点E _M，从而得到第一个块高区间[1,13]。

在得到第一个块高区间[1,13]之后，则可以确定13之前的所有块高都已经确定了所属块高，因此，下一个将从序号18开始，由于数组(18，23)的间隔超过了预设值3，因此，此处的“18”将不会被列入块高区间，第二个块高区间将会被确定为[23，27]，第三个块高区间为[50，55]，第四个块高区间为[130,131]，以此类推，直至块高序列中最后一个块高。

S407，针对任一块高区间，从磁盘中读取所述块高区间所对应的数据块。

对于得到的连续的块高区间，如前所述，没有与数据块的存储本身就是连续的，即数据块在磁盘中本身就是按照块高顺序存储的，因此可以从磁盘中根据顺序进行批量的连续读取，虽然其中会有一些无效数据块(即该数据块中不包含用户的数据记录)，但是基于前述的原则，块高区间中的无效数据块的数量并不多，通过连续读取降低了IO中磁盘中的磁头换道的次数，从而提高了读取数据块的效率。

读取得到的数据块将会放置于数据库服务端的缓存或者内存中，在缓存或者内存中，读写的效率比起磁盘中将要大为提高，换言之，读取得到的少量无效数据块对于内存的读写速度而言，基本不会有影响。

此外需要说明的是，块高序列中的块高并不一定完全可以被归纳至块高区间内，如前述的块高“18”以及“99”等等，对于这些不处于块高区间内的零散块高，不可丢弃不读，仍然进行单个的随机读取即可。

S409，根据所述位置信息集合从所述块高区间所对应的数据块中查询获取的数据记录，并返回至客户端。具体而言，即在内存中，根据步骤S402中所获得的块高和偏移量，从前述读取得到的数据块中逐条查询即可得到。

通过本说明书实施例所提供的方案，在数据库服务端从磁盘中读取数据时，首先将业务属性所对应的块高进行排序，得到块高序列，然后从块高序列中得到若干块高区间，从磁盘中连续读取这些块高区间所对的全量数据块，然后再从数据块中根据位置信息读取数据记录，减少了磁盘读取时的换道次数，提高了磁盘的IO效率，从而提高了块链式账本在磁盘存储时的读取效率。

在一种实施方式中，为了提高分组效率，还可以在生成块高区间的时候，通过预设条件滤除那些包含有效块高(即处于块高序列中的块高)的数量太少的块高区间。例如，预设有效块高的数量为4，则可以知道，对于块高区间[150,151]而言，由于其中仅包含两个块高，则没有必要作为一个连续区间进行读取。一种可变换的滤除方式还可以是设置条件：块高区间的长度不低于预设值。例如，块高区间的长度不低于4，从而同样可以滤除那些包含有效块高较少的块高区间。通过该方式，可以提高块高序列的分组效率，进而提高读取速度。

对应的，本说明书实施例还提供一种基于磁盘存储的数据读取装置，如图5所示，图5是本说明书实施例提供的一种基于磁盘存储的数据读取装置的结构示意图，包括以下模块。

接收模块501，接收客户端所发送的数据读取指令，其中，所述读取指令中包含有业务属性。

位置信息获取模块503，从预存的索引表中获取所述业务属性所对应的位置信息集合，其中，所述位置信息包含数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量。

块高区间生成模块505，对所述块高依序进行排列，生成块高序列，从所述块高序列中确定出M个互斥的块高连续的块高区间。

数据块读取模块507，针对任一块高区间，从磁盘中读取所述块高区间所对应的数据块。

数据记录读取模块509，根据所述位置信息集合从所述块高区间所对应的数据块中查询获取的数据记录，并返回至客户端。

进一步地，所述块高区间生成模块505，遍历所述块高系列，从还未确定所属块高区间的序号开始，依序确定两个块高的间隔，将间隔小于预设值时的前一块高作为区间起点S _M；以及，从块高S _M开始，依序确定两个块高的间隔，将当间隔大于预设值时的前一块高作为区间终点E _M，生成第M个块高区间[S _M，E _M]。

进一步地，所述块高区间生成模块505，确定块高序列在所述块高区间中的块高个数K，当所述块高个数K不低于预设值时，生成第M个块高区间[S _M，E _M]。

进一步地，所述装置还包括索引生成模块511，在块链式账本中，针对任一数据记录，获取所述数据记录中所包含的业务属性；确定所述数据记录在账本中的位置信息，所述位置信息包括数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；建立所述业务属性和位置信息的对应关系，写入以所述业务属性为主键的索引。

进一步地，所述索引生成模块511，确定数据记录的时间戳；在同一索引记录中按照时间戳的先后顺序，将数据记录的位置信息依序写入索引记录的值。

进一步地，所述装置还包括数据块生成模块513，接收待存储的数据记录，确定各数据记录的哈希值，其中，数据记录中包含业务属性。

当达到预设的成块条件时，确定待写入数据块中的各数据记录，生成包含数据块的哈希值和数据记录的第N个数据块，具体包括：当N＝1时，初始数据块的哈希值和块高基于预设方式给定；当N>1时，根据待写入数据块中的各数据记录和第N－1个数据块的哈希值确定第N个数据块的哈希值，生成包含第N个数据块的哈希值和各数据记录的第N个数据块，其中，数据块的块高基于成块时间的先后顺序单调递增。

进一步地，所述预设的成块条件包括：待存储的数据记录数量达到数量阈值；或者，距离上一次成块时刻的时间间隔达到时间阈值。

本说明书实施例还提供一种计算机设备，其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现图4所示的数据读取方法。

图6示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现图4所示的数据读取方法。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的系统、方法、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于方法实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的方法实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本说明书实施例原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本说明书实施例的保护范围。

Claims

一种基于磁盘存储的数据读取方法，包括：

接收客户端所发送的数据读取指令，其中，所述读取指令中包含有业务属性；

从预存的索引表中获取所述业务属性所对应的位置信息集合，其中，所述位置信息包含数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；

对所述块高依序进行排列，生成块高序列，从所述块高序列中确定出M个互斥的块高连续的块高区间；

针对任一块高区间，从磁盘中读取所述块高区间所对应的数据块；

根据所述位置信息集合从所述块高区间所对应的数据块中查询获取的数据记录，并返回至客户端。
如权利要求1所述的方法，从所述块高序列中确定出M个互斥的连续块高区间，包括：

遍历所述块高系列，从还未确定所属块高区间的序号开始，依序确定两个块高的间隔，将间隔小于预设值时的前一块高作为区间起点S _M；

以及，从块高S _M开始，依序确定两个块高的间隔，将当间隔大于预设值时的前一块高作为区间终点E _M，生成第M个块高区间[S _M，E _M]。
如权利要求2所述的方法，生成第M个块高区间[S _M，E _M]，还包括：

确定块高序列在所述块高区间中的块高个数K，当所述块高个数K不低于预设值时，生成第M个块高区间[S _M，E _M]。
如权利1所述的方法，所述预设的索引表基于如下方式预先生成：

在块链式账本中，针对任一数据记录，获取所述数据记录中所包含的业务属性；

确定所述数据记录在账本中的位置信息，所述位置信息包括数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；

建立所述业务属性和位置信息的对应关系，写入以所述业务属性为主键的索引。
如权利要求4所述的方法，写入以所述业务属性为主键的索引，包括：

确定数据记录的时间戳；

在同一索引记录中按照时间戳的先后顺序，将数据记录的位置信息依序写入索引记录的值。
如权利要求4所述的方法，所述块链式账本中的数据块通过如下方式预先生成：

接收待存储的数据记录，确定各数据记录的哈希值，其中，数据记录中包含业务属性；

当达到预设的成块条件时，确定待写入数据块中的各数据记录，生成包含数据块的哈希值和数据记录的第N个数据块，具体包括：

当N＝1时，初始数据块的哈希值和块高基于预设方式给定；

当N>1时，根据待写入数据块中的各数据记录和第N－1个数据块的哈希值确定第N个数据块的哈希值，生成包含第N个数据块的哈希值和各数据记录的第N个数据块，其中，数据块的块高基于成块时间的先后顺序单调递增。
如权利要求6所述的方法，所述预设的成块条件包括：

待存储的数据记录数量达到数量阈值；或者，距离上一次成块时刻的时间间隔达到时间阈值。
一种基于磁盘存储的数据读取装置，包括：

接收模块，接收客户端所发送的数据读取指令，其中，所述读取指令中包含有业务属性；

位置信息获取模块，从预存的索引表中获取所述业务属性所对应的位置信息集合，其中，所述位置信息包含数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；

块高区间生成模块，对所述块高依序进行排列，生成块高序列，从所述块高序列中确定出M个互斥的块高连续的块高区间；

数据块读取模块，针对任一块高区间，从磁盘中读取所述块高区间所对应的数据块；

数据记录读取模块，根据所述位置信息集合从所述块高区间所对应的数据块中查询获取的数据记录，并返回至客户端。
如权利要求8所述的装置，所述块高区间生成模块，遍历所述块高系列，从还未确定所属块高区间的序号开始，依序确定两个块高的间隔，将间隔小于预设值时的前一块高作为区间起点S _M；以及，从块高S _M开始，依序确定两个块高的间隔，将当间隔大于预设值时的前一块高作为区间终点E _M，生成第M个块高区间[S _M，E _M]。
如权利要求9所述的装置，所述块高区间生成模块，确定块高序列在所述块高区间中的块高个数K，当所述块高个数K不低于预设值时，生成第M个块高区间[S _M，E _M]。
如权利要求8所述的装置，还包括索引生成模块，在块链式账本中，针对任一数据记录，获取所述数据记录中所包含的业务属性；确定所述数据记录在账本中的位置信息，所述位置信息包括数据记录所处的数据块的块高，以及，在所处的数据块中的偏移量；建立所述业务属性和位置信息的对应关系，写入以所述业务属性为主键的索引。
如权利要求11所述的装置，所述索引生成模块，确定数据记录的时间戳；在同一索引记录中按照时间戳的先后顺序，将数据记录的位置信息依序写入索引记录的值。
如权利要求11所述的装置，还包括数据块生成模块，接收待存储的数据记录，确定各数据记录的哈希值，其中，数据记录中包含业务属性；

当达到预设的成块条件时，确定待写入数据块中的各数据记录，生成包含数据块的哈希值和数据记录的第N个数据块，具体包括：

当N＝1时，初始数据块的哈希值和块高基于预设方式给定；

当N>1时，根据待写入数据块中的各数据记录和第N－1个数据块的哈希值确定第N个数据块的哈希值，生成包含第N个数据块的哈希值和各数据记录的第N个数据块，其中，数据块的块高基于成块时间的先后顺序单调递增。
如权利要求13所述的装置，所述预设的成块条件包括：待存储的数据记录数量达到数量阈值；或者，距离上一次成块时刻的时间间隔达到时间阈值。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至7任一项所述的方法。