CN104657115B - 一种集群文件系统客户端多核并发负载实现方法 - Google Patents

一种集群文件系统客户端多核并发负载实现方法 Download PDF

Info

Publication number
CN104657115B
CN104657115B CN201510109112.5A CN201510109112A CN104657115B CN 104657115 B CN104657115 B CN 104657115B CN 201510109112 A CN201510109112 A CN 201510109112A CN 104657115 B CN104657115 B CN 104657115B
Authority
CN
China
Prior art keywords
client
request
metadata
multinuclear
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510109112.5A
Other languages
English (en)
Other versions
CN104657115A (zh
Inventor
张延良
李雪生
张在贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Co Ltd filed Critical Inspur Group Co Ltd
Priority to CN201510109112.5A priority Critical patent/CN104657115B/zh
Publication of CN104657115A publication Critical patent/CN104657115A/zh
Application granted granted Critical
Publication of CN104657115B publication Critical patent/CN104657115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明特别涉及一种集群文件系统客户端多核并发负载实现方法。该集群文件系统客户端多核并发负载实现方法,包括客户端元数据请求模块,客户端元数据接收模块,客户端元数据处理模块,驱动扩展模块和网卡驱动。该集群文件系统客户端多核并发负载实现方法,通过用户进程请求分发表,将集群应答分发到请求等待核,减少或避免了核间的切换,有效的提高了客户端多核并发处理文件请求的效率,特别是大量文件请求的场景性能有明显的提高,实现了集群客户端大量文件情况的多核负载平衡。

Description

一种集群文件系统客户端多核并发负载实现方法
技术领域
本发明涉及集群文件系统客户端技术领域,更确切的说是文件系统的内核客户端,特别涉及一种集群文件系统客户端多核并发负载实现方法。
背景技术
集群技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益。
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。
采用集群技术的目的包括如下几点:
1 提高性能
一些计算密集型应用,如:天气预报、核试验模拟等,需要计算机要有很强的运算处理能力,现有的技术,即使普通的大型机其计算也很难胜任。这时,一般都使用计算机集群技术,集中几十台甚至上百台计算机的运算能力来满足要求。提高处理性能一直是集群技术研究的一个重要目标之一。
2 降低成本
通常一套较好的集群配置,其软硬件开销要超过100000美元。但与价值上百万美元的专用超级计算机相比已属相当便宜。在达到同样性能的条件下,采用计算机集群比采用同等运算能力的大型计算机具有更高的性价比。
3 提高可扩展性
用户若想扩展系统能力,不得不购买更高性能的服务器,才能获得额外所需的CPU和存储器。如果采用集群技术,则只需要将新的服务器加入集群中即可,对于客户来看,服务无论从连续性还是性能上都几乎没有变化,好像系统在不知不觉中完成了升级。
4 增强可靠性
集群技术使系统在故障发生时仍可以继续工作,将系统停运时间减到最小。集群系统在提高系统的可靠性的同时,也大大减小了故障损失。
随着互联网时代的到来,数据存储成为当前不可缺少的基础设施,集群文件系统的应用也越来越广泛。集群客户端大量的文件操作请求时,传统的用户态多线程并行处理方式,虽然实现比较简单且能够提升系统的批处理能力,但由于线程调度、核间切换、Cache性能、线程锁、多CPU内存等,造成CPU多核性能没能得到充分的发挥,客户端的硬件性能被浪费。为了提高集群文件系统客户端的处理性能,充分利用CPU资源,需要一种集群文件系统客户端多核并发负载实现方法,从而提高集群的客户端的处理性能且充分利用CPU多核性能。
目前,集群文件系统中的文件依据应用场景可分为大文件和小文件,针对文件系统中的大文件,其元数据操作少,主要性能瓶颈是数据网络带宽、存储磁盘性能等方面;对于文件系统中的大量小文件操作,元数据操作频繁,压力较大,用户态的客户端由于涉及用户态和内核态操作较多,导致用户态客户端处理小文件性能低,而内核客户端虽然较用户态客户端能大幅度提升小文件,但是还是成为整个集群文件系统的瓶颈。因此,急需对内核客户端小文件性能进行优化。
虽然集群系统的构建目前可以说是模块化的,从硬件角度来看可以分为节点机系统、通讯系统、存储系统等,软件角度则主要有操作系统、集群操作系统(COS)、并行环境、编译环境和用户应用软件等,目前高性能计算机的通讯、存储等硬件系统是伴随摩尔定律快速发展的,跟踪、测试、比较最新硬件设备构成的高性能计算机的可能方案也成了高性能计算机厂商的重要科研活动,而所有这些关键部件研发、系统方案科研以及厂商的自主部件研发的高度概括就是“整合计算”。整合硬件计算资源的同时,伴随着整合软件资源,其中集群操作系统COS是软件系统中连接节点机操作系统和用户并行应用的重要“黏合剂”,也是高性能计算机厂商的技术杀手锏。
为了提升集群文件系统内核客户端小文件性能,本发明提出了一种在集群文件系统内核客户端的环境下,利用服务器多核处理技术来提升客户端文件元数据读写性能的集群文件系统客户端多核并发负载实现方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单有效的集群文件系统客户端多核并发负载实现方法。
本发明是通过如下技术方案实现的:
一种集群文件系统客户端多核并发负载实现方法,其特征在于:包括客户端元数据请求模块,客户端元数据接收模块,客户端元数据处理模块,驱动扩展模块和网卡驱动,在文件系统内核客户端支持完整POSIX语义前提下,将文件创建处理分割成多个子处理过程,每个子处理过程的多个实例并发执行,整个处理过程采用流水作业并发执行,以达到整体处理性能的提升。
所述驱动扩展模块依据与客户端元数据请求模块相同的用户进程请求多核分发表,对集群服务端响应报文进行多核分发,将多用户进程的大量文件,按照用户进程标识分发到不同的核上进行集群文件操作请求,通过所述客户端元数据接收模块接收各用户进程的请求;相同用户进程的请求,可被分发在相同核上进行处理;不同用户进程的请求,可在不同核上并发处理。
所述集群文件系统客户端的IO请求必须先进行元数据操作,由元数据返回客户端数据存放位置进行读写操作。
所述客户端元数据请求模块下发用户进程请求多核分发表,即用户进程请求与核的对应关系映射,到驱动扩展模块。
所述客户端元数据处理模块,将元数据接收延后执行,目的是将一次请求应答的网络、元数据处理并行执行。
该集群文件系统客户端多核并发负载实现方法,包括以下步骤:
(1)接收用户进程文件操作请求,客户端元数据请求模块将用户请求分发到多个处理核,并生成用户进程请求多核分发表;
(2)将用户进程请求多核分发表下发到驱动扩展模块;
(3)多核处理用户进程文件操作请求发送;
(4)网卡接收报文进行上送,被驱动扩展模块接收,依据用户进程请求分发表,进行分核上送协议栈处理;
(5)报文进行网络协议处理后,通过所述客户端元数据接收模块接收各用户进程的请求,并调用客户端元数据处理模块;
(6)客户端元数据处理模块,通知用户进程。
本发明的有益效果是:该集群文件系统客户端多核并发负载实现方法,通过用户进程请求分发表,将集群应答分发到请求等待核,减少或避免了核间的切换,有效的提高了客户端多核并发处理文件请求的效率,特别是大量文件请求的场景性能有明显的提高,实现了集群客户端大量文件情况的多核负载平衡。
附图说明
附图1为本发明中集群文件系统客户端多核并发负载实现方法示意图。
具体实施方式
下面结合附图对本发明进行详细说明。
该集群文件系统客户端多核并发负载实现方法,包括客户端元数据请求模块,客户端元数据接收模块,客户端元数据处理模块,驱动扩展模块和网卡驱动,在文件系统内核客户端支持完整POSIX语义前提下,将文件创建处理分割成多个子处理过程,每个子处理过程的多个实例并发执行,整个处理过程采用流水作业并发执行,以达到整体处理性能的提升。
所述驱动扩展模块依据与客户端元数据请求模块相同的用户进程请求多核分发表,对集群服务端响应报文进行多核分发,将多用户进程的大量文件,按照用户进程标识分发到不同的核上进行集群文件操作请求,通过所述客户端元数据接收模块接收各用户进程的请求;相同用户进程的请求,可被分发在相同核上进行处理;不同用户进程的请求,可在不同核上并发处理。
所述集群文件系统客户端的IO请求必须先进行元数据操作,由元数据返回客户端数据存放位置进行读写操作。
所述客户端元数据请求模块下发用户进程请求多核分发表,即用户进程请求与核的对应关系映射,到驱动扩展模块。
所述客户端元数据处理模块,将元数据接收延后执行,目的是将一次请求应答的网络、元数据处理并行执行。
该集群文件系统客户端多核并发负载实现方法,包括以下步骤:
(1)接收用户进程文件操作请求,客户端元数据请求模块将用户请求分发到多个处理核,并生成用户进程请求多核分发表;
(2)将用户进程请求多核分发表下发到驱动扩展模块;
(3)多核处理用户进程文件操作请求发送;
(4)网卡接收报文进行上送,被驱动扩展模块接收,依据用户进程请求分发表,进行分核上送协议栈处理;
(5)报文进行网络协议处理后,通过所述客户端元数据接收模块接收各用户进程的请求,并调用客户端元数据处理模块;
(6)客户端元数据处理模块,通知用户进程。

Claims (5)

1.一种集群文件系统客户端多核并发负载实现方法,其特征在于:包括客户端元数据请求模块,客户端元数据接收模块,客户端元数据处理模块,驱动扩展模块和网卡驱动,在文件系统内核客户端支持完整POSIX语义前提下,将文件创建处理分割成多个子处理过程,每个子处理过程的多个实例并发执行,整个处理过程采用流水作业并发执行,以达到整体处理性能的提升;
所述驱动扩展模块依据与客户端元数据请求模块相同的用户进程请求多核分发表,对集群服务端响应报文进行多核分发,将多用户进程的大量文件,按照用户进程标识分发到不同的核上进行集群文件操作请求,通过所述客户端元数据接收模块接收各用户进程的请求;相同用户进程的请求,可被分发在相同核上进行处理;不同用户进程的请求,可在不同核上并发处理。
2.根据权利要求1所述的集群文件系统客户端多核并发负载实现方法,其特征在于:所述集群文件系统客户端的IO请求必须先进行元数据操作,由元数据返回客户端数据存放位置进行读写操作。
3.根据权利要求1所述的集群文件系统客户端多核并发负载实现方法,其特征在于:所述客户端元数据请求模块下发用户进程请求多核分发表,即用户进程请求与核的对应关系映射,到驱动扩展模块。
4.根据权利要求1所述的集群文件系统客户端多核并发负载实现方法,其特征在于:所述客户端元数据处理模块,将元数据接收延后执行,目的是将一次请求应答的网络、元数据处理并行执行。
5.根据权利要求1所述的集群文件系统客户端多核并发负载实现方法,其特征在于包括以下步骤:
(1)接收用户进程文件操作请求,客户端元数据请求模块将用户请求分发到多个处理核,并生成用户进程请求多核分发表;
(2)将用户进程请求多核分发表下发到驱动扩展模块;
(3)多核处理用户进程文件操作请求发送;
(4)网卡接收报文进行上送,被驱动扩展模块接收,依据用户进程请求分发表,进行分核上送协议栈处理;
(5)报文进行网络协议处理后,通过所述客户端元数据接收模块接收各用户进程的请求,并调用客户端元数据处理模块;
(6)客户端元数据处理模块,通知用户进程。
CN201510109112.5A 2015-03-12 2015-03-12 一种集群文件系统客户端多核并发负载实现方法 Active CN104657115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510109112.5A CN104657115B (zh) 2015-03-12 2015-03-12 一种集群文件系统客户端多核并发负载实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510109112.5A CN104657115B (zh) 2015-03-12 2015-03-12 一种集群文件系统客户端多核并发负载实现方法

Publications (2)

Publication Number Publication Date
CN104657115A CN104657115A (zh) 2015-05-27
CN104657115B true CN104657115B (zh) 2017-04-19

Family

ID=53248304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510109112.5A Active CN104657115B (zh) 2015-03-12 2015-03-12 一种集群文件系统客户端多核并发负载实现方法

Country Status (1)

Country Link
CN (1) CN104657115B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426117B (zh) * 2015-10-27 2018-11-16 浪潮(北京)电子信息产业有限公司 一种系统性能优化方法及装置
CN106127059B (zh) * 2016-06-30 2019-03-29 中国船舶重工集团公司第七0九研究所 一种arm平台上可信密码模块的实现和服务方法
CN110750356B (zh) * 2019-09-09 2022-03-29 华南师范大学 适用于非易失性内存的多核交互方法、系统及存储介质
CN113296908B (zh) * 2021-04-30 2022-07-29 重庆紫光华山智安科技有限公司 一种提高视频图像存取速度的方法、装置、设备及介质
CN114945023A (zh) * 2022-05-20 2022-08-26 济南浪潮数据技术有限公司 一种网络连接复用方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101563A (zh) * 2007-07-23 2008-01-09 清华大学 基于海量数据分级存储系统的迁移管理方法
CN102411637A (zh) * 2011-12-30 2012-04-11 创新科软件技术(深圳)有限公司 分布式文件系统的元数据管理方法
CN102523258A (zh) * 2011-11-30 2012-06-27 广东电子工业研究院有限公司 一种面向云操作系统的数据存储架构及其负载均衡方法
CN103150394A (zh) * 2013-03-25 2013-06-12 中国人民解放军国防科学技术大学 面向高性能计算的分布式文件系统元数据管理方法
CN104144150A (zh) * 2013-05-10 2014-11-12 中国电信股份有限公司 利用元数据访问信息的方法、装置和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9003021B2 (en) * 2011-12-27 2015-04-07 Solidfire, Inc. Management of storage system access based on client performance and cluser health
KR101694288B1 (ko) * 2012-06-08 2017-01-09 한국전자통신연구원 비대칭형 클러스터 파일 시스템의 데이터 관리 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101563A (zh) * 2007-07-23 2008-01-09 清华大学 基于海量数据分级存储系统的迁移管理方法
CN102523258A (zh) * 2011-11-30 2012-06-27 广东电子工业研究院有限公司 一种面向云操作系统的数据存储架构及其负载均衡方法
CN102411637A (zh) * 2011-12-30 2012-04-11 创新科软件技术(深圳)有限公司 分布式文件系统的元数据管理方法
CN103150394A (zh) * 2013-03-25 2013-06-12 中国人民解放军国防科学技术大学 面向高性能计算的分布式文件系统元数据管理方法
CN104144150A (zh) * 2013-05-10 2014-11-12 中国电信股份有限公司 利用元数据访问信息的方法、装置和系统

Also Published As

Publication number Publication date
CN104657115A (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
CN104657115B (zh) 一种集群文件系统客户端多核并发负载实现方法
US8200771B2 (en) Workload migration using on demand remote paging
US10572553B2 (en) Systems and methods for remote access to DB2 databases
CN102521063B (zh) 一种适用于虚拟机迁移和容错的共享存储方法
US11809901B2 (en) Migrating the runtime state of a container between two nodes
US8862538B2 (en) Maintaining a network connection of a workload during transfer
CN103617087A (zh) 一种适合迭代计算的MapReduce优化方法
US10019503B2 (en) Database transfers using constraint free data
CN106302628B (zh) Arm架构网络集群中计算资源的统一管理调度方法
US20220058076A1 (en) Optimizing logging of decision outcomes in distributed transactions
CN104754047A (zh) 一种集群存储系统用户跨平台统一管理的方法
CN115686875A (zh) 用于在多个进程之间传输数据的方法、设备和程序产品
US20150172369A1 (en) Method and system for iterative pipeline
CN112114983A (zh) 一种基于共享内存的通信方法、装置和设备
US11507512B2 (en) Fault tolerant cluster data handling
CN112637201B (zh) 一种web服务端的请求处理方法、装置、设备及系统
Yang et al. uNVMe-TCP: a user space approach to optimizing NVMe over fabrics TCP transport
CN107704618A (zh) 一种基于aufs文件系统的热迁徙方法和系统
JP2014041501A (ja) バッチ処理対象データの高速読込み方法及びバッチ管理システム
US8799318B2 (en) Function module leveraging fuzzy search capability
CN115543222B (zh) 一种存储优化方法、系统、设备及可读存储介质
US11681664B2 (en) Journal parsing for object event generation
CN114020353B (zh) 旁路卸载方法、装置、计算机设备及存储介质
CN111258748B (zh) 分布式文件系统及控制方法
CN110419026B (zh) 存储器内搜索技术

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180806

Address after: 250100 S06 tower, 1036, Chao Lu Road, hi tech Zone, Ji'nan, Shandong.

Patentee after: Shandong wave cloud Mdt InfoTech Ltd

Address before: No. 1036, Shandong high tech Zone wave road, Ji'nan, Shandong

Patentee before: Inspur Group Co., Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park

Patentee after: Inspur cloud Information Technology Co., Ltd

Address before: 250100 Ji'nan science and technology zone, Shandong high tide Road, No. 1036 wave of science and Technology Park, building S06

Patentee before: SHANDONG LANGCHAO YUNTOU INFORMATION TECHNOLOGY Co.,Ltd.