WO2019137321A1

WO2019137321A1 - 数据处理方法、装置及计算设备

Info

Publication number: WO2019137321A1
Application number: PCT/CN2019/070580
Authority: WO
Inventors: 刘金鑫; 董乘宇; 刘善阳
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2018-01-09
Filing date: 2019-01-07
Publication date: 2019-07-18
Also published as: JP7378403B2; EP3739450A4; US11354050B2; EP3739450A1; CN110018897A; JP2021510222A; CN110018897B; US20200341661A1

Abstract

本申请实施例提供一种数据处理方法、装置及移动终端。其中，请求端在待存储数据中添加预留字段，将待存储数据构造为目标数据；请求端将该目标数据发送至存储端，存储端分配内存以缓存该目标数据，并生成目标数据中待存储数据的数据元数据；将所述数据元数据写入分配的内存中所述预留字段对应的内存位置。本申请实施例实现了数据零拷贝，保证了数据存储效率，提高了系统性能。

Description

数据处理方法、装置及计算设备

本申请要求2018年01月09日递交的申请号为201810020121.0、发明名称为“数据处理方法、装置及计算设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及数据处理技术领域，尤其涉及一种数据处理方法、一种数据处理装置及一种计算设备。

背景技术

在存储系统中进行数据存储时，为了保证数据安全性，通常会在待存储数据的尾部添加用于描述待存储数据相关属性的元数据，也被称为数据元数据，从而可以将待存储数据以及数据元数据一次性写入存储设备中。

由于接收到请求端发送的待存储数据时，存储端会被动分配一块与待存储数据的数据大小一致的内存以缓存该待存储数据，为了保证待存储数据以及数据元数据可以一次性写入存储设备中，现有技术的一种实现方式是：重新申请一块写盘内存，该写盘内存的大小为待存储数据的数据大小加上数据元数据的数据大小，之后将待存储数据拷贝至写盘内存中，再在写盘内存中拼接上该数据元数据，使得待存储数据与数据元数据组织在一起，从而只需执行一次写操作，即可以将写盘内存中的待存储数据以及数据元数据作为一个整体写入存储设备中。

但是，由上述描述可知，现有技术中需要先采用数据拷贝的方式将待存储数据重新拷贝至写盘内存中，这就会影响数据存储效率。

发明内容

本申请实施例提供一种数据处理方法、装置及计算设备，用以解决现有技术中数据存储效率低的技术问题。

第一方面，本申请实施例中提供了一种数据处理方法，包括：

在待存储数据中添加预留字段，以获得目标数据；

发送所述目标数据至存储端；

其中，所述预留字段在所述存储端对应的内存位置用以写入所述待存储数据的数据元数据，以使得所述待存储数据以及所述数据元数据作为整体写入存储设备。

第二方面，本申请实施例中提供了一种数据处理方法，包括：

获取目标数据；所述目标数据由请求端在待存储数据中添加预留字段构成；

分配第二内存以缓存所述目标数据；

生成所述目标数据中所述待存储数据的数据元数据；

将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。

第三方面，本申请实施例中提供了一种数据处理装置，包括：

数据构造模块，用于在待存储数据中添加预留字段，以获得目标数据；

数据发送模块，用于发送所述目标数据至存储端；

第四方面，本申请实施例中提供了一种数据处理装置，包括：

数据获取模块，用于获取目标数据；所述目标数据由请求端在待存储数据中添加预留字段构成；

内存分配模块，用于分配第二内存以缓存所述目标数据；

数据生成模块，用于生成所述目标数据中所述待存储数据的数据元数据；

数据写入模块，用于将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。

第五方面，本申请实施例中提供了一种计算设备，包括存储组件以及处理组件，

所述存储组件用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行；

所述处理组件用于：

在待存储数据中添加预留字段，以获得目标数据；

发送所述目标数据至存储端；

第六方面，本申请实施例中提供了一种计算设备，包括存储组件以及处理组件，

所述处理组件用于：

在所述存储组件中分配第二内存以缓存所述目标数据；

生成所述目标数据中所述待存储数据的数据元数据；

本申请实施例中，请求端在待存储数据中添加预留字段，将待存储数据构造为目标数据；该目标数据的数据大小即为待存储数据的数据大小以及该预留字段占用的数据大小之和。请求端将该目标数据发送至存储端，存储端分配内存以缓存该目标数据，由于目标数据中预留了预留字段，预留字段对应的内存空间可以足够写入数据元数据，因此存储端无需额外分配新内存，既不会造成内存浪费，同时避免了数据拷贝，因此可以提高数据存储效率，提高系统性能。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请提供的一种数据处理方法一个实施例的流程图；

图2示出了本申请提供的一种数据处理方法又一个实施例的流程图；

图3示出了本申请提供的一种数据处理方法又一个实施例的流程图；

图4a示出了本申请实施例中的一种数据结构示意图；

图4b示出了本申请实施例中的另一种数据结构示意图；

图5示出了本申请提供的一种数据处理方法又一个实施例的流程图；

图6示出了本申请实施例在一个实际应用中数据处理的交互示意图；

图7示出了本申请提供的一种数据处理装置一个实施例的结构示意图；

图8示出了本申请提供的一种计算设备一个实施例的结构示意图；

图9示出了本申请提供的一种数据处理装置又一个实施例的结构示意图；

图10示出了本申请提供的一种计算设备又一个实施例的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

在本申请的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

本申请实施例的技术方案主要应用于存储系统中，该存储系统可以为传统存储系统或者分布式存储系统。

为了方便理解，下面首先对本申请实施例中可能出现的技术术语进行相应解释：

存储端：负责数据存取操作；传统存储系统采用集中的存储服务器存储数据，存储端即可以是指该存储服务器；分布式存储系统中数据分散存储在多个数据存储节点，存储端即可以是指该一个或多个数据存储节点；

数据存储节点：分布式存储系统中负责数据存储的节点，通常为一个物理服务器。

请求端：负责发送读/写请求，上层的业务系统即通过请求端向存储端存取数据或者更新数据等。

请求元数据：请求端发送至存储端的待存储数据的数据指引信息，其可以包括待存储数据的数据长度和/或数据位置、以及存盘指示信息，存盘指示信息也即是指指定待存储数据写入哪一个存储设备中，请求元数据并不会写入存储数据中。

数据元数据(DataMeta)：用于描述待存储数据相关属性的元数据，其可以包括数据长度、数据校验和、存储位置、所属文件名称等等，数据元数据会与待存储数据写入存储设备中。

多副本技术：分布式存储系统中一种数据冗余技术，为了防止某个数据存储节点故障而导致数据丢失，通常会将原始数据做几份拷贝，每个拷贝数据存储到不同的数据存储节点中，每个原始数据的拷贝数据即称为副本数据。

存储设备：存储系统中用以存储数据的硬件设备，数据最终需要写入存储设备中，可以是指诸如磁盘等的存储介质。

由于现有技术中为了将待存储数据以及数据元数据一块写入存储设备，存储端需要额外分配一块写盘内存，而存储端接收到待存储数据时，即会被动分配一块内存以缓存该待存储数据，因此需要将待存储数据重新拷贝至写盘内存，待存储数据需要进行一次拷贝，而数据拷贝会影响数据存储效率，影响系统性能。

为了提高系统性能，保证数据存储效率，发明人经过一系列研究提出了本申请的技术方案，在本申请实施例中，请求端在待存储数据中添加预留字段，将待存储数据构造为目标数据；该目标数据的数据大小即为待存储数据的数据大小以及该预留字段对应的数据大小之和。请求端将该目标数据发送至存储端，存储端分配一块内存以缓存该目标数据，由于目标数据中包括预留字段，预留字段对应的内存空间可以足够写入数据元数据，因此存储端无需额外分配新内存，既不会造成内存浪费，同时避免了数据拷贝，因此可以提高数据存储效率，提高系统性能。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1为本申请实施例提供的一种数据处理方法一个实施例的流程图，本实施例的技术方案应用于请求端，由请求端负责执行。

该方法可以包括以下几个步骤：

101：在待存储数据中添加预留字段，以获得目标数据。

本申请实施例中，请求端构造写请求时，在待存储数据中添加预留字段，该预留字段占用一定数据长度，待存储数据加上该预留字段，形成新的数据格式，构成目标数据，该目标数据的数据大小也即等于待存储数据的数据大小与该预留字段所占用的数据大小之和。

其中，预留字段可以位于待存储数据的尾部，其所占用的数据大小预先设定，可以结合数据元数据的数据大小设置，该预留字段所占用的数据大小需大于等于数据元数据的数据大小。

可选地，该预留字段所占用的数据大小可以等于数据元数据的数据大小。

其中，数据元数据也即是指待存储数据的数据元数据，基于待存储数据生成，由于数据元数据包含信息通常是固定，因此不同数据的数据元数据通常大小一致，可以据此设定预留字段所占用的数据大小。

需要说明的是，本申请实施例所涉及的数据大小以字节(英文：Byte，简称：B)或千字节为(英文：Kbytes，简称：K)单位表示，数据大小也可以称为数据长度。

作为一种可选方式，可以是在待存储数据尾部添加预设大小的预定字符串作为预留字段，以获得目标数据。

该预定字符串可以为空字符串或者约定字符串等。

102：发送所述目标数据至存储端。

请求端可以向存储端发送写请求，以携带该目标数据，该目标数据即作为待写入数据发送至存储端。

存储端获得该目标数据之后，会被动分配一块内存以缓存该目标数据，为了方便描述上的区分，将存储端被动分配的用于缓存目标数据的内存命名为“第二内存”，存储端可以从目标数据中读取该待存储数据，据此生成数据元数据。由于目标数据中预留了预留字段，该预留字段足够写入数据元数据，因此存储端即可以将数据元数据写入该第二内存中预留字段对应的内存位置处。

也即，所述预留字段在所述存储端对应的内存位置用以写入所述待存储数据的数据元数据。

本实施例中，请求端在待存储数据中添加预留字段，重新构造成目标数据，由于目标数据的数据大小等于待存储数据的数据大小与预留字段所占用的数据大小之和，使得存储端被动分配的第二内存足够写入数据元数据，因此无需额外申请写盘内存，无需进行数据拷贝，实现了零拷贝，因此可以提高系统性能，提高数据存储效率，不会造成内存浪费。

由于待存储数据发送之前，需要暂时存储至内存中。因此，在某些实施例中，所述发送所述目标数据至存储端可以包括：

分配与所述目标数据的数据大小一致的第一内存；

将所述目标数据填入所述第一内存；

从第一内存中将所述目标数据发送至存储端。

其中，本申请实施例中的所述的第一内存也即是指为了存储向存储端发送的目标数据而分配的内存，为了方便描述上的区分，命名为“第一内存”，本领域技术人员可以理解的是，“第一内存”以及“第二内存”中的“第一”以及“第二”仅仅是为了描述上的区分，并不表示具有例如递件、包含等关系。

其中，请求端与存储端可以约定目标数据中预留字段所在位置以及待存储数据所在位置，例如目标数据中最后32个字节为预留字段，因此存储端按照该约定规则，即可以从目标数据中读取待存储数据，并确定预留字段。

此外，请求端还可以向存储端发送请求元数据，存储端可以根据请求元数据中的待存储数据的数据长度和/或数据位置，确定目标数据中待存储数据。

该请求元数据还可以指示存储端将待存储数据存储至哪一个存储设备中等。

由于待存储数据发送之前，需要暂时存储至内存中，请求元数据也可以填入内存中，以使得待存储数据与请求元数据可以一起发送。

因此，所述发送所述目标数据至存储端可以包括：

计算所述目标数据以及所述请求元数据的总数据大小

分配与所述总数据大小一致的第一内存；

将所述目标数据以及所述请求元数据填入所述第一内存；

从第一内存中将所述目标数据发送至存储端。

在一个实际应用中，本申请的技术方案可以应用于分布式存储系统中，在分布式存储系统中，为了避免某个数据存储节点故障导致数据丢失，通常会采用多副本技术，将原始数据做几份拷贝，每个拷贝数据存储到不同的数据存储节点中，每个原始数据的拷贝数据即为副本数据。因此，该待存储数据可以即是指副本数据。

由于分布式存储系统由若干数据存储节点形成集群系统，存在将待存储数据发送至多个数据存储节点进行存储的需求，例如待存储数据为副本数据时，需要将副本数据分别发送至多个数据存储节点。

待存储数据如果需要发送至多个数据存储节点，请求端需要针对每个数据存储节点发送对应的请求元数据，分别发送至多个数据存储节点的请求元数据中除了可以包括待存储数据的数据长度以及数据位置等，还包括不同数据存储节点对应的差异化信息，例如存盘指示信息，待存储数据对不同数据存储节点存入的存储设备可能有不同要求。

在分布式存储系统中，本申请实施例中的存储端即可以包括多个数据存储节点。

因此，发送目标数据至存储端包括发送目标数据以及各自对应的请求元数据至多个数据存储节点。

目前，请求端发送目标数据以及各自对应的请求元数据至多个数据存储节点时，请求端可以首先计算目标数据与一个请求元数据的总数据大小，之后分配与该总数据大小一致的第一内存；将目标数据先填入该第一内存，如果需要向任一个数据存储节点发送待存储数据，即在第一内存中拼接上该任一个数据存储节点对应的请求元数据，再将目标数据以及该请求元数据发送至该任一数据存储节点，而如果需要向另一个数据存储节点发送待存储数据，则将该另一个数据存储节点对应的请求元数据拷贝至该第一内存中覆盖掉之前的请求元数据之后再发送。

由上述描述可知，目前这种方式，向多个数据存储节点发送待存储数据时，需要拷贝多次请求元数据操作繁琐，这也会影响发送效率，从而影响数据存储效率。

因此，发明人经过进一步思考提出了本申请技术方案又一个实施例。

图2为本申请实施例提供的一种数据处理方法又一个实施例的流程图，该方法可以包括以下几个步骤：

201：在待存储数据中添加预留字段，以获得目标数据。

202：确定所述待存储数据分别对应所多个数据存储节点的请求元数据。

203：计算所述目标数据与所述多个请求元数据的总数据大小。

204：分配与所述总数据大小一致的第一内存。

也即第一内存的内存大小可以等于总数据大小。

205：将所述目标数据以及所述多个请求元数据填入所述第一内存。

可以将目标数据先填入第一内存，之后再将多个请求元数据依次填入第一内存，拼接在目标数据的尾部。

206：向所述多个数据存储节点分别发送所述目标数据及各自对应的请求元数据。

请求端可以向多个数据存储节点分别发送写请求，以携带该目标数据以及该多个数据存储节点各自对应的请求元数据。

也即针对任一个数据存储节点，将第一内存中的目标数据、以及该任一个数据存储节点对应的请求数据发送至该任一个数据存储节点。

在第一内存中，多个请求元数据可以按照多个数据存储节点的发送顺序依次填入第一内存中，例如发送顺序第一的第一个数据存储节点的请求元数据位于目标数据尾部，发送顺序第二的第二个数据存储节点的请求数据位于第一个个数据存储节点的请求元数据的尾部，等依次类推，即可以将多个请求元数据依次填入第一内存中。在需要向任一个数据存储节点发送写请求时，由于请求元数据的数据大小已知，根据该任一个数据存储节点的发送顺序即可以找到其对应的请求元数据。

任一个数据存储节点获得请求端发送的接收数据之后，即可以从接收数据尾部读取其自身需要的请求元数据，并基于该请求元数据可以从目标数据中确定出待存储数据以及预留字段等。

本实施例中，分配的第一内存可以将多个请求元数据均写入，无需为每一个数据存储节点特例化请求数据，执行一次操作即可以向不同数据存储节点发送数据，操作更为简单，提高了发送效率，因此可以提高数据存储效率，提高系统性能。

此外，为了方便请求端以及每个数据存储节点的操作，作为又一个实施例，如图3中所示，该数据处理方法可以包括：

301：在待存储数据中添加预留字段，以获得目标数据。

302：确定所述待存储数据分别对应所多个数据存储节点的请求元数据。

303：计算所述目标数据与所述多个请求元数据的总数据大小。

304：分配与所述总数据大小一致的第一内存。

也即第一内存的内存大小可以等于总数据大小。

305：将所述目标数据填入所述第一内存，以及在所述目标数据的尾部依次填入多个请求元数据；

多个请求元数据可以按照多个数据存储节点的发送顺序依次填入第一内存中，例如发送顺序第一的第一个数据存储节点的请求元数据位于目标数据尾部，发送顺序第二的第二个数据存储节点的请求数据位于第一个个数据存储节点的请求元数据的尾部，等依次类推，即可以将多个请求元数据依次填入第一内存中。

因此，作为又一个实施例，所述在所述目标数据的尾部依次填入多个请求元数据包括：

按照所述多个数据存储节点的发送顺序，在所述目标数据的尾部依次填入所述多个数据存储节点各自对应的请求元数据。

306：针对任一数据存储节点，将所述第一内存中的所述目标数据、所述任一数据存储节点对应的请求元数据以及位于所述任一数据存储节点对应的请求元数据之前的请求元数据发送至所述任一存储节点。

请求端可以向任一个数据存储节点发送写请求，以携带该目标数据、、所述任一数据存储节点对应的请求元数据以及位于所述任一数据存储节点对应的请求元数据之前的请求元数据。

其中，所述任一数据存储节点用于从接收数据的尾部读取其对应的请求元数据。

其中，如果是按照所述多个数据存储节点的发送顺序，在所述目标数据的尾部依次填入所述多个数据存储节点各自对应的请求元数据。

可选地，该步骤306的操作可以包括：

针对任一数据存储节点，从所述第一内存中将所述目标数据、与所述任一数据存储节点的发送顺序对应的请求元数据以及位于与所述任一数据存储节点的发送顺序对应的请求元数据之前的请求元数据发送至所述任一存储节点。

采用本实施例的方式，基于请求元数据的数据大小，数据存储节点从接收数据的尾部即可以解析获得自身对应的请求元数据。

由于该请求元数据中包括待存储数据的数据大小和/或数据位置，因此基于请求元数据，可以从接收数据头部读取该请求元数据指示的数据大小的数据，即可以获得待存储数据，或者根据数据位置即可以定位获得接收数据中的待存储数据。

为了方便理解，下面以三个数据存储节点为例，图4a为目标数据的数据结构示意图，可知该目标数据由待存储数据401以及预留字段402构成。

图4b为第一内存中的数据结构示意图，其由目标数据403以及位于目标数据403尾部依次填入的三个请求元数据m1、m2以及m3，

该三个请求元数据可以按照三个数据存储节点的发送顺序依次填入，请求元数据m1对应第一个数据存储节点、请求元数据m2对应第二个数据存储节点、请求元数据m3对应第三个数据存储节点。

作为一种可选方式，请求端向第一个数据存储节点执行写操作时，可以将目标数据403以及请求元数据m1发送至第一数据存储节点，向第二个数据存储节点执行写操作，可以将目标数据303以及请求元数据m2发送至第二个数据存储节点，向第三个数据存储节点执行写操作时，可以将目标数据403以及请求元数据m3发送至第三个数据存储节点。

作为另一种可选方式，请求端向第一个数据存储节点执行写操作时，可以将目标数据403以及请求元数据m1发送至第一数据存储节点；向第二个数据存储节点执行写操作，可以将目标数据403、请求元数据m1以及请求元数据m2发送至第二个数据存储节点，向第三个数据存储节点执行写操作时，可以将目标数据403、请求元数据m1、请求元数据m2以及请求元数据m3发送至第三个数据存储节点。

图5为本申请实施例提供的一种数据处理方法又一个实施例的流程图，本实施例的技术方案应用于存储端，在传统存储系统中，可以是存储服务器执行所述方法，在分布式存储系统中，可以是任一个数据存储节点执行所述方法。

所述方法可以包括以下几个步骤：

501：获取目标数据。

其中，所述目标数据由请求端在待存储数据中添加预留字段构成。

其中，该目标数据可以携带在请求端的写请求中，存储端可以从该写请求端中获得该目标数据。

502：分配第二内存以缓存所述目标数据。

存储端获得目标数据之后，会被动分配一块第二内存以暂存该目标数据，该第二内存的内存大小即与目标数据的数据大小一致。

503：生成所述目标数据中所述待存储数据的数据元数据。

504：将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。

之后，存储端即可以将该第二内存的待存储数据以数据元数据一块写入存储设备中。

预留字段所占用的数据大小大于或等于数据元数据的数据大小，因此第二内存中留有足够空间可以写入数据元数据，存储端无需额外分配写盘内存，即可以将待存储数据以数据元数据写入存储设备，无需进行数据拷贝，实现了零拷贝，因此可以提高系统性能，提高数据存储效率，不会造成内存浪费。

其中，请求端与存储端可以约定目标数据中预留字段所在位置以及待存储数据所在位置，例如目标数据中最后32个字节为预留字段，存储端按照该约定规则，即可以从目标数据中读取待存储数据，并确定预留字段。

因此，在某些实施例中，所述预留字段可以位于所述待存储数据的尾部；

所述生成所述目标数据中所述待存储数据的数据元数据可以包括：

基于所述预留字段的预设大小，确定所述目标数据中的所述待存储数据以及所述预留字段；

生成所述待存储数据的数据元数据。

从而存储端即可以基于该待存储数据，生成数据元数据。

数据元数据可以基于该请求元数据以及待存储数据生成。

而在分布式存储系统中，存在待存储数据发送至多个数据存储节点进行存储的情况，例如待存储数据为副本数据时。基于上述实施例中的描述，请求端向存储端发送的发送数据中可以目标数据以及至少一个请求元数据。

因此，在某些实施例中，所述获取目标数据可以包括：

接收请求端发送的写请求；所述写请求包括所述目标数据以及至少一个请求元数据；

确定目标请求元数据；

所述生成所述目标数据中所述待存储数据的数据元数据包括：

基于所述目标请求元数据，读取所述待存储数据；

基于所述目标请求元数据以及所述待存储数据，生成数据元数据。

例如，目标请求元数据中可以包括待存储数据的数据大小，该待存储数据的数据大小可以作为数据元数据的信息。数据元数据中包括的其他信息，例如数据校验和，可以基于待存储数据生成，该数据校验和可以利用CRC(Cyclic Redundancy Check，循环冗余校验)算法实现，与现有技术相同，在此不再赘述。

其中，如果请求端按照图3所示实施例的方式发送目标数据，而请求端的写请求中即可以包括请求端从第一内存中请求发送的所述目标数据、所述目标请求元数据以及位于所述目标请求元数据之前的请求元数据

因此所述确定目标请求元数据可以包括：

基于所述请求元数据的数据大小，从所述写请求数据尾部读取所述目标请求元数据。

从而基于该目标请求元数据，即可以从发送数据中读取所述待存储数据。

下面以分布式存储系统中，待存储数据为副本数据为例，对本申请实施例技术方案进行描述。在分布式存储系统中，通常采用多副本技术以解决原始数据由于故障丢失的问题。

如图6中所示，请求端60首先构造目标数据601，在副本数据602尾部添加预留字段602。该预留字段可以通过在副本数据尾部添加预设大小的空字符串构成。

假设接收副本数据的数据存储节点包括3个，分别第一个数据存储节点61，第二个数据存储节点62以及第三个数据存储节点63，也即请求端需要向3个数据存储节点发送副本数据，请求端分别确定需要3个数据存储节点各自对应的请求元数据，假设第一个数据存储节点61对应的请求元数据为m1；第二个数据存储节点62对应的请求元数据为m2；第三个数据存储节点63对应的请求元数据为m3。

请求端申请一块第一内存，将目标数据601写入该第一内存中，并按照3个数据存储节点的发送顺序，假设发送顺序为：第一个数据存储节点61、第二个数据存储节点62、第三个数据存储节点63，则在目标数据601尾部依次填入3个请求元数据，3个请求元数据的排列顺序即为：m1、m2以及m3。

请求端针对任一个数据存储节点，即可以从第一内存中读取副本数据以及该任一个存储节点对应的请求元数据以及该任一个存储节点对应的请求元数据之前的请求元数据，向该任一个数据存储节点发送写请求。

如图6中所示，请求端60向第一个数据存储节点61发送目标数据601以及m1；向第二个数据存储节点发送目标数据601、m1以及m2；向第三个数据存储节点发送目标数据601、m1、m2以及m3。

从而任一个数据存储节点接收到写请求之后，即可以从写请求的尾部读取获得与其它数据存储节点差异化的目标请求元数据。

每一个数据存储节点基于请求元数据的数量以及请求元数据的数据大小，即可以从写请求中确定目标数据，并分配一块第二内存暂存该目标数据；

之后，每一个数据存储节点基于目标请求元数据，可以从目标数据中确定出副本数据，据此生成数据元数据，之后即将数据元数据可以写入第二内存中。

每一个数据存储节点即可以将第二内存中写入的副本数据以及数据元数据写入各自存储设备64中。

由上述描述可知，请求端申请了一块第一内存，一次将3个数据存储节点的请求元数据均填入第一内存中，从而可以简化操作，保证数据发送效率。且请求端在副本数据中增加预留字段，构成目标数据，使得数据存储节点为了暂存目标数据而被动分配的第二内存中留有足够空间写入数据元数据，从而无需重新申请写盘内存，无需进行数据拷贝操作，即可以实现数据存储，采用零拷贝方案提高了系统性能，提高数据存储效率。且无需额外申请内存，降低了内存浪费问题。

图7为本申请实施例提供的一种数据处理装置一个实施例的结构示意图，该数据处理装置可以配置于请求端，该装置可以包括：

数据构造模块701，用于在待存储数据中添加预留字段，以获得目标数据。

可选地，所述数据构造模块可以具体是在所述待存储数据尾部添加预设大小的预定字符串作为预留字段，以获得目标数据。

数据发送模块702，用于发送所述目标数据至存储端；

其中，所述预留字段在所述存储端对应的内存位置用以写入所述待存储数据的数据元数据。

本实施例中，在待存储数据中添加预留字段，重新构造成目标数据，由于目标数据的数据大小等于待存储数据的数据大小与预留字段所占用的数据大小之和，使得存储端被动分配的第二内存足够写入数据元数据，因此无需额外申请写盘内存，无需进行数据拷贝，实现了零拷贝，因此可以提高系统性能，提高数据存储效率，不会造成内存浪费。

由于待存储数据发送之前，需要暂时存储至内存中

因此，在某些实施例中，所述数据发送模块可以具体用于：分配与所述目标数据的数据大小一致的第一内存；将所述目标数据填入所述第一内存；从第一内存中将所述目标数据发送至存储端。

其中，还可以向存储端发送请求元数据，存储端可以根据请求元数据中的待存储数据的数据长度和/或数据位置，确定目标数据中待存储数据。

因此，在某些实施例中，所述数据发送模块可以具体用于：

计算所述目标数据以及所述请求元数据的总数据大小

分配与所述总数据大小一致的第一内存；

将所述目标数据以及所述请求元数据填入所述第一内存；

从第一内存中将所述目标数据发送至存储端。

因此，在某些实施例中，所述存储端可以包括多个数据存储节点。

作为一种可选方式，所述数据发送模块可以具体用于：

确定所述待存储数据分别对应所述多个数据存储节点的请求元数据；

计算所述目标数据与所述多个请求元数据的总数据大小；

分配与所述总数据大小一致的第一内存；

将所述目标数据以及所述多个请求元数据填入所述第一内存；

向所述多个数据存储节点分别发送所述目标数据及各自对应的请求元数据。

作为另一种可选方式，所述数据发送模块可以具体用于：

计算所述目标数据与所述多个请求元数据的总数据大小；

分配与所述总数据大小一致的第一内存；

将所述目标数据填入所述第一内存，以及在所述目标数据的尾部依次填入多个请求元数据；

针对任一数据存储节点，将所述第一内存中的所述目标数据、所述任一数据存储节点对应的请求元数据以及位于所述任一数据存储节点对应的请求元数据之前的请求元数据发送至所述任一存储节点；所述任一数据存储节点用于从接收数据的尾部读取其对应的请求元数据。

可选地，所述数据发送模块在所述目标数据的尾部依次填入多个请求元数据可以具体是：按照所述多个数据存储节点的发送顺序，在所述目标数据的尾部依次填入所述多个数据存储节点各自对应的请求元数据；

所述数据发送模块针对任一数据存储节点，将所述第一内存中的所述目标数据、所述任一数据存储节点对应的请求元数据以及位于所述任一数据存储节点对应的请求元数据之前的请求元数据发送至所述任一存储节点可以具体是：针对任一数据存储节点，从所述第一内存中将所述目标数据、与所述任一数据存储节点的发送顺序对应的请求元数据以及位于与所述任一数据存储节点的发送顺序对应的请求元数据之前的请求元数据发送至所述任一存储节点。

在一个可能的设计中，图7所示实施例的数据处理装置可以实现为一计算设备，该计算设备部署在请求端，其可以为一个请求服务器，如图8所示，该计算设备可以包括存储组件801以及处理组件802，

所述存储组件801用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行；

所述处理组件802用于：

在待存储数据中添加预留字段，以获得目标数据；

发送所述目标数据至存储端；

处理组件802可以在存储组件801中申请第一内存以缓存目标数据和/或请求元数据。

此外，该处理组件802还可以用于执行上述图1～图3任一实施例所述的数据处理方法。

其中，处理组件802可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件801被配置为存储各种类型的数据以支持在计算设备的操作。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

当然，计算设备必然还可以包括其他部件，例如输入/输出接口、通信组件等。

此外，本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图1～图3任一实施例所示的监控方法。

图9为本申请实施例提供的一种数据处理装置又一个实施例的结构示意图，该装置可以配置于存储端，该装置可以包括：

数据获取模块901，用于获取目标数据；所述目标数据由请求端在待存储数据中添加预留字段构成；

内存分配模块902，用于分配第二内存以缓存所述目标数据；

数据生成模块903，用于生成所述目标数据中所述待存储数据的数据元数据；

数据写入模块904，用于将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。

其中，在某些实施例中，可以与请求端约定目标数据中预留字段所在位置以及待存储数据所在位置，例如目标数据中最后32个字节为预留字段，存储端按照该约定规则，即可以从目标数据中读取待存储数据，并确定预留字段。

所述数据生成模块可以具体用于基于所述预留字段的预设大小，确定所述目标数据中的所述待存储数据以及所述预留字段；生成所述待存储数据的数据元数据。

此外，请求端还可以向存储端发送请求元数据，因此在某些实施例中，所述数据获取模块可以具体用于：

确定目标请求元数据；

所述数据生成模块可以具体用于：基于所述目标请求元数据，从所述发送数据中读取所述待存储数据；基于所述目标请求元数据以及所述待存储数据，生成数据元数据。

在某些实施例中，所述写请求中可以包括请求端从第一内存中请求发送的所述目标数据、所述目标请求元数据以及位于所述目标请求元数据之前的请求元数据；

所述数据获取模块确定目标请求元数据可以具体是：基于所述请求元数据的数据大小，从所述写请求的尾部读取目标请求元数据。

在一个可能的设计中，图9所示实施例的数据处理装置可以实现为一计算设备，该计算设备可以为传统存储系统中存储服务器或者分布式存储系统中的数据存储节点，其可以为一个物理服务器，如图10所示，该计算设备可以包括存储组件1001以及处理组件1002；

所述存储组件1001用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件1002调用执行；

所述处理组件1002用于：

在所述存储组件1001中分配第二内存以缓存所述目标数据；

生成所述目标数据中所述待存储数据的数据元数据；

此外，该处理组件1002还可以用于执行上述任一实施例所述的数据处理方法。

其中，处理组件1002可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件1001被配置为存储各种类型的数据以支持在计算设备的操作。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

此外，本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图4所示的监控方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种数据处理方法，其特征在于，包括：

在待存储数据中添加预留字段，以获得目标数据；

发送所述目标数据至存储端；

其中，所述预留字段在所述存储端对应的内存位置用以写入所述待存储数据的数据元数据，以使得所述待存储数据以及所述数据元数据作为整体写入存储设备。
根据权利要求1所述的方法，其特征在于，所述存储端包括多个数据存储节点；

所述发送所述目标数据至存储端包括：

确定所述待存储数据分别对应所述多个数据存储节点的请求元数据；

计算所述目标数据与所述多个请求元数据的总数据大小；

分配与所述总数据大小一致的第一内存；

将所述目标数据以及所述多个请求元数据填入所述第一内存；

向所述多个数据存储节点分别发送所述目标数据及各自对应的请求元数据。
根据权利要求1所述的方法，其特征在于，所述存储端包括多个数据存储节点；

所述发送所述目标数据至存储端包括：

确定所述待存储数据分别对应所述多个数据存储节点的请求元数据；

计算所述目标数据与所述多个请求元数据的总数据大小；

分配与所述总数据大小一致的第一内存；

将所述目标数据填入所述第一内存，以及在所述目标数据的尾部依次填入多个请求元数据；

针对任一数据存储节点，将所述第一内存中的所述目标数据、所述任一数据存储节点对应的请求元数据以及位于所述任一数据存储节点对应的请求元数据之前的请求元数据发送至所述任一存储节点；所述任一数据存储节点用于从接收数据的尾部读取其对应的请求元数据。
根据权利要求3所述的方法，其特征在于，所述在所述目标数据的尾部依次填入多个请求元数据包括：

按照所述多个数据存储节点的发送顺序，在所述目标数据的尾部依次填入所述多个数据存储节点各自对应的请求元数据；

所述针对任一数据存储节点，从所述第一内存中将所述目标数据、所述任一数据存储节点对应的请求元数据以及位于所述任一数据存储节点对应的请求元数据之前的请求元数据发送至所述任一存储节点包括：

针对任一数据存储节点，从所述第一内存中将所述目标数据、与所述任一数据存储节点的发送顺序对应的请求元数据以及位于与所述任一数据存储节点的发送顺序对应的请求元数据之前的请求元数据发送至所述任一存储节点。
根据权利要求1所述的方法，其特征在于，所述在待存储数据中添加预留字段，以获得目标数据包括：

在所述待存储数据尾部添加预设大小的预定字符串作为所述预留字段，以获得目标数据。
根据权利要求1所述的方法，其特征在于，所述发送所述目标数据至存储端包括：

分配与所述目标数据的数据大小一致的第一内存；

将所述目标数据填入所述第一内存；

从所述第一内存中将所述目标数据发送至存储端。
一种数据处理方法，其特征在于，包括：

获取目标数据；所述目标数据由请求端在待存储数据中添加预留字段构成；

分配第二内存以缓存所述目标数据；

生成所述目标数据中所述待存储数据的数据元数据；

将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。
根据权利要求7所述的方法，其特征在于，所述预留字段位于所述待存储数据的尾部；

所述生成所述目标数据中所述待存储数据的数据元数据包括：

基于所述预留字段的预设大小，确定所述目标数据中的所述待存储数据；

生成所述待存储数据的数据元数据。
根据权利要求7所述的方法，其特征在于，所述获取目标数据包括：

接收请求端发送的写请求；所述写请求包括所述目标数据以及至少一个请求元数据；

确定目标请求元数据；

所述生成所述目标数据中所述待存储数据的数据元数据包括：

基于所述目标请求元数据，从所述发送数据中读取所述待存储数据；

基于所述目标请求元数据以及所述待存储数据，生成数据元数据。
根据权利要求9所述的方法，其特征在于，所述写请求包括请求端从第一内存中请求发送的所述目标数据、所述目标请求元数据以及位于所述目标请求元数据之前的请求元数据；

所述确定目标请求元数据包括：

基于所述请求元数据的数据大小，从所述写请求的尾部读取目标请求元数据。
一种数据处理装置，其特征在于，包括：

数据构造模块，用于在待存储数据中添加预留字段，以获得目标数据；

数据发送模块，用于发送所述目标数据至存储端；

其中，所述预留字段在所述存储端对应的内存位置用以写入所述待存储数据的数据元数据，以使得所述待存储数据以及所述数据元数据作为整体写入存储设备。
一种数据处理装置，其特征在于，包括：

数据获取模块，用于获取目标数据；所述目标数据由请求端在待存储数据中添加预留字段构成；

内存分配模块，用于分配第二内存以缓存所述目标数据；

数据生成模块，用于生成所述目标数据中所述待存储数据的数据元数据；

数据写入模块，用于将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。
一种计算设备，其特征在于，包括存储组件以及处理组件，

所述存储组件用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行；

所述处理组件用于：

在待存储数据中添加预留字段，以获得目标数据；

发送所述目标数据至存储端；

其中，所述预留字段在所述存储端对应的内存位置用以写入所述待存储数据的数据元数据，以使得所述待存储数据以及所述数据元数据作为整体写入存储设备。
一种计算设备，其特征在于，包括存储组件以及处理组件，

所述存储组件用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行；

所述处理组件用于：

获取目标数据；所述目标数据由请求端在待存储数据中添加预留字段构成；

在所述存储组件中分配第二内存以缓存所述目标数据；

生成所述目标数据中所述待存储数据的数据元数据；

将所述数据元数据写入所述第二内存中所述预留字段对应的内存位置。