WO2016078259A1

WO2016078259A1 - 一种基于嵌入式文件系统的流式数据读取方法

Info

Publication number: WO2016078259A1
Application number: PCT/CN2015/074082
Authority: WO
Inventors: 陈君; 吴京洪; 李明哲; 樊皓; 叶晓舟
Original assignee: 中国科学院声学研究所; 北京中科智网科技有限公司
Priority date: 2014-11-17
Filing date: 2015-03-12
Publication date: 2016-05-26
Also published as: CN104331255A; CN104331255B; US20170322948A1

Abstract

一种基于嵌入式文件系统的流式数据读取方法，该方法包括：接收一个读取流式数据的请求，当被请求的流式数据存在于磁盘时，则为该请求新建一个读任务，并为新建的读任务分配存储空间并初始化相关参数（101）；将读任务分解成多个子任务，每个子任务负责读取一段物理上连续的数据，并进行缓存（102）；从子任务缓存中取出数据，按流式数据格式进行封装，每封装完一块数据就提交给本次读任务的调用方，提交完成后释放本次子任务并触发下一个子任务（103）；当所有子任务都成功完成时，向任务调用方报告任务正常完成，等待任务调用方结束当前读任务（104）。该方法有利于流式数据的高吞吐和大并发读取，有效地解决了在大量用户访问热点数据时服务器并发性能低下的问题。

Description

一种基于嵌入式文件系统的流式数据读取方法

技术领域

本发明涉及数据存储技术领域，尤其涉及一种基于嵌入式文件系统的流式数据读取方法。

背景技术

随着互联网及多媒体产业的迅猛发展，各种存储技术及存储系统也得到了飞速发展。这些存储系统为海量的互联网信息及多媒体数据信息提供了方便、快速、高效的存储及访问服务。

嵌入式系统资源有限，结构简单，介于其特殊性和专用性，很少在嵌入式系统中采用通用的操作系统和文件系统，而是针对特定应用场景为嵌入式系统定制文件系统；可嵌入式系统的应用范围非常广泛，不可能有一种文件系统在所有嵌入式系统中一统天下，适用于大到嵌入式服务器，小到嵌入式机顶盒等的所有情况，而是根据系统应用环境和目标等来选择构建合适的文件系统。不同文件系统管理磁盘的策略和读写数据的方法不一样，现有技术最亟待解决的就是数据读取的高吞吐、高并发问题。

文件系统读取数据的速率一方面取决于底层接口的IO性能，另一方面取决于文件系统自身的调度效率，文件系统读取数据的并发能力则与内部调度机制有关。

发明内容

本发明的目的在于，为嵌入式流服务提供高吞吐、高并发的数据读取服务，从而提出了一种基于嵌入式文件系统的流式数据读取方法。

为实现上述目的，本发明提出了一种基于嵌入式文件系统的流式数据读取方法，该方法包括以下步骤：

接收一个读取流式数据的请求，当被请求的流式数据存在于磁盘时，则为该请求新建一个读任务，并为新建的读任务分配存储空间并初始化相关参数；

将读任务分解成多个子任务，每个子任务负责读取一段物理上连续的数据，并进行缓存；

从子任务缓存中取出数据，按流式数据格式进行封装，每封装完一块数据就提交给本次读任务的调用方，提交完成后释放本次子任务并触发下一个子任务；

当所有子任务都成功完成时，向任务调用方报告任务正常完成，等待任务调用方结束当前读任务。

优选地，当收到一个读取流式数据的请求时，计算请求文件名的哈希值，通过对哈希值进行查找，进而判断被请求数据是否存在于磁盘。

优选地，一个读取流式数据的请求参数包括：文件名、读取数据的起始偏移和结束偏移，在为该请求新建一个读任务后，为读任务分配存储空间，将文件名哈希值、待读取数据的起始偏移、结束偏移信息存入读任务分配的存储空间，从而完成读任务初始化。

优选地，根据读任务的起始偏移和结束偏移，计算出任务长度，结合待读流式数据存放于磁盘中的位置信息，将所述读任务分解成多个子任务；所有子任务通过链表串联，按先后顺序依次触发子任务。

优选地，在每个子任务开始后，首先获取本次子任务欲读取流式数据的起始扇区和长度，根据欲读取流式数据长度为待读取流式数据申请内存空间，再根据起始扇区计算出将从哪一块磁盘中读流式数据，最后调用下层接口从指定磁盘中读取指定区段的流式数据。

优选地，在每个子任务完成后，底层接口发送消息通知文件系统当前子任务执行成功或失败，文件系统在收到子任务成功完成的消息后，从当前子任务缓存中取出数据。

优选地，在执行每个子任务时会为待读流式数据预分配内存空间，用于缓存从磁盘中读出的数据；每个子任务标识的待读流式数据长度须为磁盘扇区大小的整数倍，且子任务从磁盘中读取数据时采用异步非阻塞IO模式。

优选地，在上一次子任务成功结束后向文件系统发送消息，文件系统收到消息后从子任务的数据缓存区将数据拷贝到新申请的内存中，并按流式数据格式进行封装，封装好后提交给本次读取任务的调用方，进而触发下一个子任务，直到所有子任务均已结束。

优选地，对于尚未完成的读任务，通过向前调整任务结束位置提前结束任务，对于已经读取完成的任务，通过向后调整任务结束位置追加读取数据。

优选地，在每个子任务进行过程中，根据需要更改读任务结束偏移，当新任务结束偏移比当前子任务结束偏移小，则忽略本次更新；否则，用新任务结束偏移替换任务参数中的读数据结束偏移，并根据新任务结束偏移重新生成子任务。

与现有技术相比，本发明的优势在于：

1、高效性——本发明通过对任务进行分解，保障了每个子任务读取一段逻辑和物理上均连续的数据，同时限制单个子任务读取的数据长度，提高了读取数据的效率；

2、高并发——采用异步读机制，调用下层读接口后立即返回，无需阻塞在读数据过程中；还支持多核协作，子任务成功执行后下层接口发送消息报告子任务成功执行，此消息再去驱动下一子任务，下一子任务则可能由另一个核执行，这两点为流式数据读取的高并发性能提供了保障。

此外，本发明还允许用户在读取数据的过程中更改结束偏移，丰富了用户的操作方式，在流服务应用场景中具有较大优势。

附图说明

图1是本发明实施例提供的一种基于嵌入式文件系统的流式数据读取方法流程示意图；

图2是图1所示发明实施例消息驱动流程图；

图3是图1所示发明实施例读任务流程图；

图4是图1所示发明实施例子任务链表示意图。

具体实施方式

下面结合附图和实例对本发明进行详细说明，使得本发明的上述优点更加明确：

本发明实施例针对现有嵌入式流服务中存在的数据读取效率和并发能力不够高的问题，提出了一种基于嵌入式文件系统的流式数据读取方法，该方法通过对任务进行分解，提高了读取数据的效率，采用异步读机制保障了流式数据的高并发读取，还允许用户在读取数据的过程中更改结束偏移，丰富了用户的操作方式，在流服务应用场景中具有较大优势。

图1是本发明实施例提供的一种基于嵌入式文件系统的流式数据读取方法流程示意图，图2是消息驱动流程图，本发明实施例采用事件驱动机制，所有事件以消息为载体进行驱动，有关启动任务、更新任务、处理读出数据和结束任务都是由消息驱动。以下结合图1和图2对本发明实施例进行详细说明，如图1所示，该方法包括步骤101-104：

在步骤101，接收一个读取流式数据的请求，当被请求的流式数据存在磁盘时，则为该请求新建一个读任务，并为新建的读任务分配存储空间并初始化相关参数。

具体地，消息接收器负责接收所有消息，对收到的消息进行判断，根据消息类型进行响应，消息类型包括启动任务、更新任务、处理读出数据和结束任务。当用户调用文件系统提供的接口请求读取数据成功后，文件系统会发出一个启动消息，消息接收器收到启动消息后，由文件系统执行图2的第一个分支“启动任务”，启动任务即为新请求创建一个读任务。

优选地，当收到一个读取流式数据的请求时，首先判断被请求的流式数据是否存在，判断方法是：计算请求文件名的哈希值，对哈希值进行查找，若能找到，即被请求的流式数据存在于磁盘中，则立即为该请求新建一个读任务，为新任务分配存储空间并初始化相关参数；若被请求的流式数据不存在于磁盘中，则通知用户读请求失败。

一个流式数据读取请求参数包括文件名、读取数据的起始偏移和结束偏移等，新建一个读任务后，为新任务分配内存空间，将文件名哈希值、待读取数据的起始偏移、结束偏移等信息存入任务空间，从而完成任务初始化。

在步骤102，将读任务分解成多个子任务，每个子任务负责读取一段物理上连续的数据，并进行缓存；

具体地，在读任务创建成功后，文件系统获取被请求文件的元数据信息，结合被请求的流式数据存储在磁盘的的位置信息，依据待读流式数据的起始偏移和待读数据长度对读任务进行划分，划分后的子任务在逻辑上具有连续性，每个子任务负责读取一段逻辑上和物理上均连续的数据，而相邻子任务读出的数据在物理上不一定连续。

优选地，在读任务新建成功后，提取本次读任务的起始偏移和任务长度，查询待读流式数据对应的文件索引信息，可获取存放流式数据的磁盘位置信息，对任务长度和起始偏移进行计算，结合存放流式数据的磁盘位置信息，将该读任务分解成若干个子任务，每个子任务负责读取一段逻辑上和物理上均连续的数据，数据长度为扇区大小的整数倍；相邻子任务读出的数据在逻辑上具有连续性，但物理上却可能不连续，因为一个流式数据往往并非是连续存储在磁盘中，划分子任务的目的就是为了保证每次从磁盘中读出一段物理上连续的数据，同时，为了保障读取流式数据的效率，对子任务的数据长度进行限制，单个子任务读取的数据长度不宜太长。子任务信息以链表的方式存储，链表中每个节点中包含本次子任务读取数据的起始扇区和本次子任务读取数据的长度，该长度用扇区数表示。待任务分解结束后，主动触发第一个子任务。

在触发一个子任务后，首先获取本次子任务欲读取数据的起始扇区和欲读数据长度，其中，本次子任务欲读数据长度由扇区数和扇区大小算出，根据算出的长度为本次子任务申请内存空间，用于缓存从磁盘中读出的数据，再根据起始扇区编号找到存储本次子任务待读流式数据的磁盘，调用下层接口并传入磁盘编号、起始扇区编号、扇区数、待读流式数据的缓存地址等参数，便可从指定磁盘中读取指定数据。

在步骤103，从子任务缓存中取出数据，按流式数据格式进行封装，每封装完一块数据就提交给本次读任务的调用方，提交完成后释放本次子任务并触发下一个子任务；

具体地，在生成子任务后，由文件系统主动触发第一个子任务，开启子任务后，文件系统先获取子任务参数，包括读取数据的起始扇区号和本次待读扇区数目，通过扇区大小和待读扇区数计算出本次子任务待读数据量，根据此数据量申请内存空间，用于缓存待读数据，再通过计算得出本次子任务待读起始扇区所在磁盘编号，最后调用下层读接口从指定磁盘中读出数据，传入磁盘编号、起始扇区号、扇区数等参数，调用后立即返回而不是等数据完全读出后再返回，待数据完全读出子任务缓存后，下层接口会发送消息报告子任务成功完成，消息接收器收到消息后判断消息类型为子任务完成通知消息，文件系统则执行图1中第三个分支“处理读出数据”，该流程为整个读任务中最主要流程，每当收到上一子任务成功完成的消息后，即由此消息触发下一子任务，循环进行此流程直至所有子任务全部执行或某个子任务执行失败。

优选地，子任务从磁盘中读取数据时采用异步非阻塞IO模式，调用下层接口后立即返回而无需阻塞在IO过程中，该机制适用于多核协作，利于多任务的高并发实现和流式数据的高效读取。当本次子任务对应的数据被完全读出后，底层接口会发送消息报告子任务是否成功完成，文件系统收到子任务成功完成的消息后，从子任务缓存中取出数据，按流式数据格式进行封装，每封装完一块数据就提交给本次读任务的调用方，直到本次子任务读出的数据已全部提交或剩余数据暂不足提交，对于不足提交的剩余数据，将其暂时缓存，待下一子任务从磁盘读出数据后，再取出缓存数据进行封装并提交。

图3是图1所示发明实施例的读任务流程图，该流程对读出数据进行处理，即按流式数据格式对数据进行封装，封装后每块数据中的内容长度为某一固定值，此值与具体流服务应用场景有关，子任务读出的数据按流式数据根式封装后可能有剩余，剩余数据不足以封装成一块流式数据提交给用户，则将子任务剩余数据缓存，待下一子任务完成后再对数据进行封装，循环进行此流程直至所有子任务均已完成，当所有子任务均已完成后，按流式数据格式封装数据后剩余数据仍可能不足以封装成最后一块标准数据，由于此段数据是整个读任务的最后一段数据，已无后续数据存在，所以最后一块数据不足以封装成一块标准数据但仍然提交给用户。

读任务进行过程中，用户可以根据需要更改读任务结束偏移，如用户发现自己只需要读一部分数据而非整个文件，则可以向前调整任务结束偏移，则可以调用嵌入式文件系统为用户提供的更新任务参数的接口，调用接口后文件系统会发送一条更新任务的消息，消息接收器收到此消息后，文件系统执行图2中第二个分支“更新任务”，

比较原始任务结束偏移和新任务结束偏移的大小关系，若新任务结束偏移小于原始任务结束偏移则为向前更新，即提前结束任务。文件系统获取当前子任务读取的数据偏移，若新任务结束偏移比当前子任务读取的数据偏移小则更新不可能完成，直接忽略本次更新请求；若新任务结束偏移比当前子任务读取偏移大，则用新的任务结束偏移替换任务参数中的读数据结束偏移，并根据新的结束偏移重新生成子任务，更新子任务链表。

在步骤104，当所有子任务都成功完成时，向任务调用方报告任务正常完成，等待任务调用方结束当前读任务。

具体地，当子任务执行失败、处理读出数据出错或更新任务出错时，文件系统会主动向用户报告异常，当所有子任务都成功完成且处理读出数据正常时，文件系统会向用户报告读任务正常完成，用户收到文件系统的异常或完成报告后，主动结束任务，结束任务的接口也由文件系统实现，供用户调用。原则上，用户可以在任何时候主动结束一个读任务。

优选地，将读出的数据封装并提交完成后子任务才算结束，子任务结束时释放任务空间和数据空间，释放任务空间即删除子任务链表中的当前头结点，数据空间指的是子任务开始时申请的用于缓存读出数据的内存空间。只有当上一个子任务成功完成后，才能触发下一个子任务，若某个子任务执行失败，当文件系统收到失败消息时，会主动向任务调用方报告任务异常，当所有子任务都已成功完成时，文件系统也会向任务调用方报告任务正常完成，等待任务调用方结束当前读任务。

任务调用方收到文件系统报告异常或任务结束后可调用文件系统提供的接口函数主动结束任务，甚至在任务进行过程中任务调用方也可主动结束该任务，除此之外，本发明实施例还支持中途更新任务参数，对于尚未完成的任务，可以通过向前调整任务结束偏移来提前结束任务，对于已经读取完成的任务，还可以向后调整任务结束偏移来追加读取数据，该方法为用户提供了灵活多变的操作方式，适合于流式数据的多种应用场景中。

图4是图1所示本发明实施例子任务链表示意图，如图4所示，链表中每个节点表示一个子任务，节点中包含子任务参数，如起始扇区号、扇区数目、磁盘编号等，该任务链表在启动任务时生成，每当一个子任务执行完成后则释放链表头结点，将“当前子任务”指向下一子任务，图4中虚线框中节点即表示已经执行完成的子任务，每次触发一个子任务则通过“当前子任务”获取任务参数，“当前子任务”始终指向任务链表的头结点。当更新任务结束偏移后，先删除更新参数前的任务链表，再通过新任务结束偏移和当前任务状态重新计算并生成新的任务链表。

本发明实施例通过对读任务进行分解，保障了每个子任务读取一段逻辑和物理上均连续的数据，同时限制单个子任务读取的数据长度，提高了读取数据的效率；采用异步读机制，调用下层读接口后立即返回，无需阻塞在读数据过程中；还支持多核协作，子任务成功执行后下层接口发送消息报告子任务成功执行，此消息再去驱动下一子任务，下一子任务则可能由另一个核执行，这两点为流式数据读取的高并发性能提供了保障。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

一种基于嵌入式文件系统的流式数据读取方法，其特征在于：

接收一个读取流式数据的请求，当被请求的流式数据存在于磁盘时，则为该请求新建一个读任务，并为新建的读任务分配存储空间并初始化相关参数；

将所述读任务分解成多个子任务，每个子任务负责读取一段物理上连续的数据，并进行缓存；

从子任务缓存中取出数据，按流式数据格式进行封装，每封装完一块数据就提交给本次读任务的调用方，提交完成后释放本次子任务并触发下一个子任务；

当所有子任务都成功完成时，向任务调用方报告任务正常完成，等待任务调用方结束当前读任务。
根据权利要求1所述的方法，其特征在于：通过以下步骤判断所述被请求的流式数据是否存在磁盘：

当收到一个读取流式数据的请求时，计算请求文件名的哈希值，通过在文件系统元数据中对所述哈希值进行查找，进而判断被请求数据是否存在于磁盘。
根据权利要求1所述的方法，其特征在于：所述一个读取流式数据的请求参数包括：文件名、读取数据的起始偏移和结束偏移，在为该请求新建一个读任务后，为读任务分配存储空间，将文件名哈希值、待读流式取数据的起始偏移、结束偏移信息存入读任务分配的存储空间，从而完成读任务初始化。
根据权利要求1所述的方法，其特征在于：将所述读任务分解成多个子任务的步骤包括：

根据读任务的起始偏移和结束偏移，计算出任务长度，结合待读流式数据存放于磁盘中的位置信息，将所述读任务分解成多个子任务；

所有子任务通过链表串联，按先后顺序依次触发子任务。
根据权利要求1所述的方法，其特征在于：在所述每个子任务开始后，首先获取本次子任务欲读取流式数据的起始扇区和长度，根据欲读取流式数据长度为待读取流式数据申请内存空间，再根据起始扇区计算出将从哪一块磁盘读出流式数据，最后调用下层接口从指定磁盘中读取指定区段的流式数据。
根据权利要求1所述的方法，其特征在于：在执行每个子任务时会为待读流式数据预分配内存空间，用于缓存从磁盘中读出的数据；每个子任务标识的待读流式数据长度须为磁盘扇区大小的整数倍，且子任务从磁盘中读取数据时采用异步非阻塞IO模式。
根据权利要求1所述的方法，其特征在于：在所述每个子任务完成后，底层接口发送消息通知文件系统当前子任务执行成功或失败，文件系统在收到子任务成功完成的消息后，从当前子任务缓存中取出数据。
根据权利要求1所述的方法，其特征在于：在上一次子任务成功结束后向文件系统发送消息，文件系统在收到消息后从子任务的数据缓存区将数据拷贝到新申请的内存中，并按流式数据格式进行封装，封装好后提交给本次读取任务的调用方，进而触发下一个子任务，直到所有子任务均已结束。
根据权利要求1所述的方法，其特征在于，对于尚未完成的读任务，通过向前调整任务结束位置提前结束任务；对于已经读取完成的任务，通过向后调整任务结束位置追加读取数据。
根据权利要求1所述的方法，其特征在于：在所述每个子任务进行过程中，可根据需要更改读任务结束偏移，当新任务结束偏移比当前子任务结束偏移小，则忽略本次更新；否则，用新任务结束偏移替换任务参数中的读数据结束偏移，并根据新任务结束偏移重新生成子任务。