WO2023207492A1

WO2023207492A1 - 一种数据处理方法、装置、设备及可读存储介质

Info

Publication number: WO2023207492A1
Application number: PCT/CN2023/084830
Authority: WO
Inventors: 李雪生; 李辉; 张在贵
Original assignee: 济南浪潮数据技术有限公司
Priority date: 2022-04-29
Filing date: 2023-03-29
Publication date: 2023-11-02
Also published as: CN114827178A

Abstract

本申请公开了计算机技术领域内的一种数据处理方法、装置、设备及可读存储介质。本申请实现了控制流和数据流的分离，只需转发传输访问控制流，而数据流无需在各节点间转发，而是从客户端直接到达相应节点。并且，由于存储被访问数据的各节点可以共享客户端的内存地址，因此可实现客户端与节点间的数据直取，那么各节点可以直通客户端内存来得到数据流，从而快速完成被访问数据的读写，提升了数据访问效率和性能。相应地，本申请提供的一种数据处理装置、设备及可读存储介质，也同样具有上述技术效果。

Description

一种数据处理方法、装置、设备及可读存储介质

相关申请的交叉引用

本申请要求于2022年4月29日提交中国专利局，申请号为202210468189.1，申请名称为“一种数据处理方法、装置、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别涉及一种数据处理方法、装置、设备及可读存储介质。

背景技术

现有的数据传输路径较长，需要经过客户端应用程序、客户端系统接口、客户端网卡、存储节点网卡，才能到达节点的后端磁盘，限制了访问性能和访问效率。

发明内容

有鉴于此，本申请的目的在于提供一种数据处理方法、装置、设备及可读存储介质，以提高数据访问效率。其具体方案如下：

本申请提供了一种数据处理方法，应用于分布式存储系统中的任一目标节点，包括：

接收客户端发送的未携带被访问数据的访问控制流；被访问数据中的部分数据存储在目标节点中；

基于访问控制流确定被访问数据所存储的其他节点；

将访问控制流转发至其他节点，以使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。

本申请一些实施例中，其他节点和目标节点基于访问控制流确定客户端的共享内存地址，包括：

其他节点和目标节点从访问控制流中提取共享内存地址。

本申请一些实施例中，若访问控制流对应读操作，则其他节点和目标节点将被访问数据写入共享内存地址，以使客户端读取被访问数据。

本申请一些实施例中，若访问控制流对应写操作，则其他节点和目标节点从共享内存地址中读取被访问数据，并将读取到的数据写入相应NVMe(Non-Volatile Memory express)盘。

本申请一些实施例中，任一节点将读取到的数据写入相应NVMe盘，包括：

任一节点解析访问控制流，得到被访问数据中的部分数据在当前节点对应的磁盘全局统计标识；基于磁盘全局统计标识确定目标NVMe盘，并将读取到的数据写入目标NVMe盘。

本申请一些实施例中，完成被访问数据的读写之后，还包括：

更新被访问数据的元数据。

本申请一些实施例中，还包括：

任一节点统计自身所有NVMe盘的状态信息，并将状态信息同步至客户端。

本申请提供了一种数据处理装置，应用于分布式存储系统中的任一目标节点，包括：

接收模块，用于接收客户端发送的未携带被访问数据的访问控制流；被访问数据中的部分数据存储在目标节点中；

确定模块，用于基于访问控制流确定被访问数据所存储的其他节点；

转发模块，用于将访问控制流转发至其他节点，以使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。

本申请提供了一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序，以实现前述公开的数据处理方法。

本申请提供了一种非易失性可读存储介质，用于保存计算机程序，其中，计算机程序被处理器执行时实现前述公开的数据处理方法。

通过以上方案可知，本申请提供了一种数据处理方法，应用于分布式存储系统中的任一目标节点，包括：接收客户端发送的未携带被访问数据的访问控制流；被访问数据中的部分数据存储在目标节点中；基于访问控制流确定被访问数据所存储的其他节点；将访问控制流转发至其他节点，以使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。

可见，在本申请中，访问控制流不携带被访问数据，因此访问控制流的传输效率较快；在目标节点接收到访问控制流后，其可以基于访问控制流确定被访问数据所存储的其他节点，然后将访问控制流转发至其他节点，从而使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。可见，本申请实现了控制流和数据流的分离，只需转发传输访问控制流，而数据流无需在各节点间转发，而是从客户端直接到达相应节点。并且，由于存储被访问数据的各节点可以共享客户端的内存地址，因此可实现客户端与节点间的数据直取，那么各节点可以直通客户端内存来得到数据流，从而快速完成被访问数据的读写，提升了数据访问效率和性能。

相应地，本申请提供的一种数据处理装置、设备及可读存储介质，也同样具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种数据处理方法流程图；

图2为本申请公开的一种数据流传输路径示意图；

图3为本申请公开的另一种数据处理方法流程图；

图4为本申请公开的一种数据处理装置示意图；

图5为本申请公开的一种电子设备示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

目前，现有的数据传输路径较长，需要经过客户端应用程序、客户端系统接口、客户端网卡、存储节点网卡，才能到达节点的后端磁盘，限制了访问性能和访问效率。为此，本申请提供了一种数据处理方案，能够实现客户端与节点间的数据直取，提高数据访问效率。

参见图1所示，本申请实施例公开了一种数据处理方法，应用于分布式存储系统中的任一目标节点，包括：

S101、接收客户端发送的未携带被访问数据的访问控制流；被访问数据中的部分数据存储在目标节点中。

在分布式存储系统中，基于分布式存储的特性，数据被分布存储在不同节点上，因此被访问数据也分布存储在多个节点上。至于被访问数据被划分为几个数据块，这些数据块分布存储在哪几个节点上，这取决于当前分布式存储系统的分布存储算法及策略，具体参照现有相关技术即可，本实施例对此不再赘述。在此基础上，接收客户端发送的访问控制流的目标节点也由当前分布式存储系统的分布存储算法及策略确定，当然还可以随机确定。

本申请一些实施例中，访问控制流不携带具体的被访问数据，只记录有：客户端中可以被各个节点共享的内存地址、被访问数据分布存储的几个节点的节点信息以及在各个节点上所对应的磁盘全局统计标识。磁盘全局统计标识用于区分整个系统中的不同NVMe盘。

S102、基于访问控制流确定被访问数据所存储的其他节点。

由于访问控制流中记录有被访问数据分布存储的几个节点的节点信息，因此基于访问控制流可以确定被访问数据所存储的所有节点。其中，被访问数据所存储的其他节点可以是：当前分布式存储系统中除目标节点之外的任一个节点。

S103、将访问控制流转发至其他节点，以使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。

由于访问控制流中记录有客户端中可以被各个节点共享的内存地址，因此收到访问控制流的每个节点都可以基于访问控制流确定客户端的共享内存地址，从而直通客户端内存来得到数据流。

本申请一些实施例中，其他节点和目标节点基于访问控制流确定客户端的共享内存地址，包括：其他节点和目标节点从访问控制流中提取共享内存地址。

收到访问控制流的每个节点直通客户端内存，可以实现读和写操作。

本申请一些实施例中，若访问控制流对应读操作，则其他节点和目标节点将被访问数据写入共享内存地址，以使客户端读取被访问数据。具体的，其他节点和目标节点将自身中相应NVMe盘中的被访问数据写入共享内存地址。由于访问控制流中记录有磁盘全局统计标识，因此收到访问控制流的每个节点都可以基于访问控制流确定被访问数据在自身中对应的磁盘全局统计标识，因此在客户端执行读操作时，各节点可以从相应NVMe盘中读取数据并送入客户端内存。

本申请一些实施例中，若访问控制流对应写操作，则其他节点和目标节点从共享内存地址中读取被访问数据，并将读取到的数据写入相应NVMe盘。相应地，由于访问控制流中记录有磁盘全局统计标识，因此收到访问控制流的每个节点都可以基于访问控制流确定被访问数据在自身中对应的磁盘全局统计标识，因此在客户端执行写操作时，各节点可以从客户端的共享内存地址中读取客户端想要存储的数据，然后写入相应NVMe盘。

本申请一些实施例中，任一节点将读取到的数据写入相应NVMe盘，包括：任一节点解析访问控制流，得到被访问数据中的部分数据在当前节点对应的磁盘全局统计标识；基于磁盘全局统计标识确定目标NVMe盘，并将读取到的数据写入目标NVMe盘。

可见，本申请实现了控制流和数据流的分离，只需转发传输访问控制流，而数据流无需在各节点间转发，而是从客户端直接到达相应节点。并且，由于存储被访问数据的各节点可以共享客户端的内存地址，因此可实现客户端与节点间的数据直取，那么各节点可以直通客户端内存来得到数据流，从而快速完成被访问数据的读写，提升了数据访问效率和性能。

基于上述实施例，需要说明的是，数据被读或写之后，相应的元数据就需要更新，因此本申请一些实施例中，完成被访问数据的读写之后，还包括：更新被访问数据的元数据。

本申请一些实施例中，任一节点统计自身所有NVMe盘的状态信息，并将状态信息同步至客户端。具体的，NVMe盘的状态信息包括：上线、下线、硬件地址、使用情况以及全局统计标识等，状态信息可以以订阅的方式同步发送到客户端。

需要说明的是，本申请还可以实现：分布式IO的回滚、重存储等，从而保障数据的一致性。例如：写操作时，若个别节点写入失败，则使写入成功的节点进行回滚，以恢复数据。再如：若系统中某一节点故障，则使数据重新分布存储在其他未故障的节点上。

下述实施例采用数控分离的架构，将客户端与服务端间的数据请求分为控制流和数据流，控制流可控制客户端和存储节点间的互联路由，数据流从客户端直通存储节点。请参见图2，在图2中，数据流从各客户端直通存储节点。

本实施例提供的分布式存储系统能够管理全系统的NVMe盘的状态，包括，上线、下线、硬件地址、使用情况以及全局统计标识等。这些信息被收集汇总起来，并且以订阅的方式同步发送到各客户端。其中，客户端即：分布式存储系统的用户端，其可以安装在高性能计算机群的各个主机上。

需要说明的是，分布式存储系统除了存储具体数据，还存储这些数据的元数据。按照一般地访问逻辑，在访问具体的数据之前，需要获取相应文件锁并读取数据的元数据。本申请一些实施例中，文件锁的获取及元数据的读取和写入按照现有相关技术执行即可。

请参见图3，本实施例提供的数据访问流程包括：

第一步，客户端同步各NVMe磁盘的状态信息。

第二步，客户端获取分布式文件锁并访问数据的元数据。

第三步，客户端发送控制流至当前节点。

第四步，当前节点基于控制流确定其他节点，并传输控制流至其他节点。

第五步，收到控制流的各节点从控制流中提取客户端内存地址，并基于该客户端内存地址完成客户端的数据读写。

第六步，数据读写完成后，各节点修改数据的大小、修改时间等元数据信息。

可见，本实施例通过数控分离的方式，实现了客户端至各节点的直接数据传输，提升了数据访问效率，缩短数据流传输路径。

下面对本申请实施例提供的一种数据处理装置进行介绍，下文描述的一种数据处理装置与上文描述的一种数据处理方法可以相互参照。

参见图4所示，本申请实施例公开了一种数据处理装置，应用于分布式存储系统中的任一目标节点，包括：

接收模块401，用于接收客户端发送的未携带被访问数据的访问控制流；被访问数据中的部分数据存储在目标节点中；

确定模块402，用于基于访问控制流确定被访问数据所存储的其他节点；

转发模块403，用于将访问控制流转发至其他节点，以使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。

本申请一些实施例中，其他节点和目标节点从访问控制流中提取共享内存地址。

本申请一些实施例中，若访问控制流对应写操作，则其他节点和目标节点从共享内存地址中读取被访问数据，并将读取到的数据写入相应NVMe盘。

本申请一些实施例中，还包括：

元数据更新单元，用于更新被访问数据的元数据。

本申请一些实施例中，任一节点统计自身所有NVMe盘的状态信息，并将状态信息同步至客户端。

其中，关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容，在此不再进行赘述。

可见，本实施例提供了一种数据处理装置，能够实现客户端与节点间的数据直取，提高数据访问效率。

下面对本申请实施例提供的一种分布式存储系统进行介绍，下文描述的一种分布式存储系统与上文描述的一种数据处理方法及装置可以相互参照。

本实施例提供的分布式存储系统包括N个存储节点，每个存储节点插接有N个NVMe磁盘。其中，任一个存储节点可以执行以下步骤：接收客户端发送的未携带被访问数据的访问控制流；被访问数据中的部分数据存储在目标节点中；基于访问控制流确定被访问数据所存储的其他节点；将访问控制流转发至其他节点，以使其他节点和目标节点基于访问控制流确定客户端的共享内存地址后，通过共享内存地址完成被访问数据的读写。

下面对本申请实施例提供的一种电子设备进行介绍，下文描述的一种电子设备与上文描述的一种数据处理方法及装置可以相互参照。

参见图5所示，本申请实施例公开了一种电子设备，包括：

存储器501，用于保存计算机程序；

处理器502，用于执行计算机程序，以实现上述任意实施例公开的方法。

下面对本申请实施例提供的一种非易失性可读存储介质进行介绍，下文描述的一种非易失性可读存储介质与上文描述的一种数据处理方法、装置及设备可以相互参照。

一种非易失性可读存储介质，用于保存计算机程序，其中，计算机程序被处理器执行时实现前述实施例公开的数据处理方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容，在此不再进行赘述。

本申请涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。

需要说明的是，在本申请中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种数据处理方法，其特征在于，应用于分布式存储系统中的任一目标节点，包括：

接收客户端发送的未携带被访问数据的访问控制流；所述被访问数据中的部分数据存储在所述目标节点中；

基于所述访问控制流确定所述被访问数据所存储的其他节点；

将所述访问控制流转发至所述其他节点，以使所述其他节点和所述目标节点基于所述访问控制流确定所述客户端的共享内存地址后，通过所述共享内存地址完成所述被访问数据的读写。
根据权利要求1所述的方法，其特征在于，所述基于所述访问控制流确定所述被访问数据所存储的其他节点，包括：

基于所述访问控制流中记录的所述被访问数据分布存储的节点的节点信息，确定所述被访问数据所存储的所述其他节点。
根据权利要求1所述的方法，其特征在于，所述其他节点和所述目标节点基于所述访问控制流确定所述客户端的共享内存地址，包括：

所述其他节点和所述目标节点从所述访问控制流中提取所述共享内存地址。
根据权利要求1所述的方法，其特征在于，所述其他节点和所述目标节点基于所述访问控制流确定所述客户端的共享内存地址，包括：

所述其他节点和所述目标节点基于所述访问控制流中记录的所述客户端可被各个节点共享的内存地址，确定所述客户端的所述共享内存地址。
根据权利要求1所述的方法，其特征在于，

若所述访问控制流对应读操作，则所述其他节点和所述目标节点将所述被访问数据写入所述共享内存地址，以使所述客户端读取所述被访问数据。
根据权利要求5所述的方法，其特征在于，所述其他节点和所述目标节点将所述被访问数据写入所述共享内存地址，包括：

所述其他节点和所述目标节点将自身中相应NVMe盘中的所述被访问数据写入所述共享内存地址。
根据权利要求6所述的方法，其特征在于，所述其他节点和所述目标节点将自身中相应NVMe盘中的所述被访问数据写入所述共享内存地址，包括：

所述其他节点和所述目标节点基于所述访问控制流确定所述被访问数据在自身中对应的磁盘全局统计标识，从相应NVMe盘中读取所述被访问数据并写入所述共享内存地址。
根据权利要求1所述的方法，其特征在于，

若所述访问控制流对应写操作，则所述其他节点和所述目标节点从所述共享内存地址中读取所述被访问数据，并将读取到的数据写入相应NVMe盘。
根据权利要求8所述的方法，其特征在于，所述其他节点和所述目标节点从所述共享内存地址中读取所述被访问数据，并将读取到的数据写入相应NVMe盘，包括：

所述其他节点和所述目标节点基于所述访问控制流确定所述被访问数据在自身中对应的磁盘全局统计标识，从所述共享内存地址中读取所述被访问数据，并将读取到的数据写入相应NVMe盘。
根据权利要求8所述的方法，其特征在于，任一节点将读取到的数据写入相应NVMe盘，包括：

任一节点解析所述访问控制流，得到所述被访问数据中的部分数据在当前节点对应的磁盘全局统计标识；基于所述磁盘全局统计标识确定目标NVMe盘，并将读取到的数据写入所述目标NVMe盘。
根据权利要求1至10任一项所述的方法，其特征在于，所述完成所述被访问数据的读写之后，还包括：

更新所述被访问数据的元数据。
根据权利要求1至10任一项所述的方法，其特征在于，还包括：

任一节点统计自身所有NVMe盘的状态信息，并将所述状态信息同步至所述客户端。
根据权利要求12所述的方法，其特征在于，所述将所述状态信息同步至所述客户端，包括：

将所述状态信息以订阅的方式同步至所述客户端。
根据权利要求1至10任一项所述的方法，其特征在于，还包括：

若写操作时存在部分节点写入失败，则写入成功的节点回滚，以恢复数据。
根据权利要求1至10任一项所述的方法，其特征在于，还包括：

若所述分布式存储系统中存在节点故障，则将对应的数据重新分布存储在未故障的节点上。
根据权利要求1至10任一项所述的方法，其特征在于，还包括：

根据所述分布式存储系统的分布存储算法及策略确定所述目标节点。
根据权利要求1至10任一项所述的方法，其特征在于，所述访问数据流中只记录有：所述客户端中可被各个节点共享的内存地址、所述被访问数据分布存储的节点的节点信息以及在各个节点上所对应的磁盘全局统计标识。
一种数据处理装置，其特征在于，应用于分布式存储系统中的任一目标节点，包括：

接收模块，用于接收客户端发送的未携带被访问数据的访问控制流；所述被访问数据中的部分数据存储在所述目标节点中；

确定模块，用于基于所述访问控制流确定所述被访问数据所存储的其他节点；

转发模块，用于将所述访问控制流转发至所述其他节点，以使所述其他节点和所述目标节点基于所述访问控制流确定所述客户端的共享内存地址后，通过所述共享内存地址完成所述被访问数据的读写。
一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序，以实现如权利要求1至17任一项所述的方法。
一种非易失性可读存储介质，其特征在于，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至17任一项所述的方法。