CN111209123A - 一种本地存储io协议栈数据交互方法和装置 - Google Patents

一种本地存储io协议栈数据交互方法和装置 Download PDF

Info

Publication number
CN111209123A
CN111209123A CN201911364059.8A CN201911364059A CN111209123A CN 111209123 A CN111209123 A CN 111209123A CN 201911364059 A CN201911364059 A CN 201911364059A CN 111209123 A CN111209123 A CN 111209123A
Authority
CN
China
Prior art keywords
ring buffer
data
thread
receipt message
kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911364059.8A
Other languages
English (en)
Inventor
胡振国
沈海嘉
杨浩
齐宇
沙方浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Shuguang Storage Technology Co Ltd
Original Assignee
Tianjin Zhongke Shuguang Storage Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhongke Shuguang Storage Technology Co Ltd filed Critical Tianjin Zhongke Shuguang Storage Technology Co Ltd
Priority to CN201911364059.8A priority Critical patent/CN111209123A/zh
Publication of CN111209123A publication Critical patent/CN111209123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues

Abstract

本发明提供了一种本地存储IO协议栈数据交互方法和装置,该方法包括:第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;用户处理线程从第一环形缓冲区中读取数据,并获取数据对应的回执消息,将回执消息写入第二环形缓冲区;第一内核线程从第二环形缓冲区中读取回执消息并进行处理,将处理后的回执消息返回第一类型的存储IO协议栈,其中,第一内核线程不与其他内核线程共用第一环形缓冲区和第二环形缓冲区。本发明在避免内存拷贝的同时,可以最大限度的提升数据交互的性能,使得在存储IO压力不大的场景,可以实时响应数据交互请求,保证性能和时延的前提下降低CPU开销;在存储IO压力大的场景,可以线性扩展数据交互性能。

Description

一种本地存储IO协议栈数据交互方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种本地存储IO协议栈数据交互方法和装置。
背景技术
Linux操作系统因其稳定、开源、免费、安全、高效的特点,被广泛的应用于电信、金融、政府、教育、银行、石油等各个行业,同时互联网、服务器、存储等各大型企业都在使用Linux系统作为其服务器端的程序运行平台,全球及国内排名前十的网站使用的几乎都是Linux系统,Linux已经逐步渗透到了各个领域。Linux操作系统是基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的开源操作系统。线程是Linux软件执行的最小单元。
当前的大型Linux存储系统,主流的IO协议栈包括:iscsi、FC、IB,对应驱动和协议的实现一般都是在Linux内核态,而存储系统核心部分都是工作在Linux用户态,这就涉及到大量的内核态和用户态的数据交互。存储系统对于整个IO通路上都要求保证高性能和低时延,因此内核态和用户态的数据交互也需要满足这两个要求。
但是从Linux操作系统的实现上看,内核软件独立于普通用户软件,运行在较高的特权级别上,它们驻留在被保护的内存空间上,拥有访问硬件设备的所有权限。用户软件,只能看到允许它们使用的部分系统资源,并且不能使用某些特定的系统功能,不能直接访问硬件,不能直接访问内核软件的资源。Linux操作系统使用这种非对称访问机制,主要为了抵御恶意用户的窥探,防止质量低劣的用户程序的侵害,从而使系统运行得更稳定可靠。
基于以上背景,存储系统中需要一种高性能和低延时的方案,解决本地设备上内核软件和用户软件的数据交互问题。目前主流的技术方案有三种:
1)系统调用机制
Linux操作系统提供了系统调用供用户软件进入内核,并操作内核的内存空间。Linux系统调用是linux内核提供的一系列接口,用于用户程序调用,访问内核空间的资源。用户程序调用ioctl/read/write等系统调用进入内核,通过copy_to_user从内核态向用户态传输数据,通过copy_from_user从用户态向内核态传输数据。该机制只能由用户态主动发起。
2)内核netlink机制
Netlink是Linux操作系统特有的内核和用户空间通信机制,基于socket实现。netlink机制可以自定义一种新的协议并加入协议族,内核/用户软件通过socket API使用netlink协议完成数据交互。该机制是双向通信机制,内核空间和用户空间程序均可发起,且该通信机制使用socket缓存队列,是一种异步通信机制。
3)共享内存机制
Linux操作系统提供了mmap系统调用,用于Linux内核态和用户态的内存共享。用户软件和内核软件可以通过创建一段共享内存,进行数据交互,该方案可以实现数据交互过程中的零拷贝。
表1:现有技术的优缺点
Figure BDA0002337949070000021
如表1所示,当前主流的三种方案均存在一些问题:
系统调用方案,只能由用户软件主动发起,内核软件无法向用户软件主动传输数据,该模型使用场景非常受限。系统调用是一个同步通信模型,无法满足高性能的需求,在数据交互频繁的场景,会影响操作系统的性能,因此该方案并不适用于存储系统的IO通路。
内核netlink方案,是一种双向异步通信模型,相对于系统调用方案,数据交互的性能和时延都有一定的优势,但是该方案存在一次用户软件和内核软件的数据拷贝,会对数据交互的性能有影响。
共享内存方案,用户软件和内核软件可以共享一段相同的内存,因此可以实现数据交互过程中的内存零拷贝。但是访问同一段内存,需要通过操作系统的锁机制进行互斥,保证内存访问的安全性,这样如果需要通过增加线程的方式扩展数据交互的性能,会导致锁竞争加剧,无法保证性能随着线程的增加而线性扩展。多个软件同时访问共享资源时,需要通过锁来互斥访问,软件加锁过程中带来的开销为锁竞争。共享内存方案,需要实现用户软件和内核软件写入数据后的通知机制,且要求尽可能减少通知机制的时延。目前主流的通知实现机制,是通过epoll模型轮询的方式实现,虽然可以保证通知的实时性,但是会一直占用CPU,导致系统CPU资源的浪费。
发明内容
针对相关技术中存在的问题,本发明的目的在于提供一种本地存储IO协议栈数据交互方法和装置,本发明基于mmap机制,避免内存拷贝,同时通过优化线程和共享内存的映射关系,以及内核线程和用户线程之间的唤醒机制,最大限度的提升数据交互的性能。本发明的方案使得在存储IO压力不大的场景,可以实时响应数据交互请求,保证性能和时延的前提下降低CPU开销;在存储IO压力大的场景,可以通过增加处理线程的方式,线性扩展数据交互性能。
根据本发明的实施例,一种本地存储IO协议栈数据交互方法,包括:第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;用户处理线程从第一环形缓冲区中读取数据,并获取数据对应的回执消息,将回执消息写入第二环形缓冲区;第一内核线程从第二环形缓冲区中读取回执消息并进行处理,将处理后的回执消息返回第一类型的存储IO协议栈,其中,第一内核线程不与其他内核线程共用第一环形缓冲区和第二环形缓冲区。
根据本发明的实施例,本地存储IO协议栈数据交互方法,还包括:在将数据写入第一环形缓冲区之后,唤醒阻塞在读模式(read)上的用户处理线程,其中,唤醒后的用户处理线程用于从第一环形缓冲区中读取数据;在将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒用户处理线程,其中,唤醒后的用户处理线程用于获取数据对应的回执消息;在将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒第一内核线程,唤醒后的第一内核线程用于从第二环形缓冲区中读取回执消息。
根据本发明的实施例,本地存储IO协议栈数据交互方法,还包括:当没有数据交互的时候,用户处理线程调用字符设备读模式(read)接口进行休眠并让出CPU资源。
根据本发明的实施例,本地存储IO协议栈数据交互方法,还包括:第二内核线程将第二类型的存储IO协议栈的数据写入第三环形缓冲区中。
根据本发明的实施例,本地存储IO协议栈数据交互方法,还包括:在用户处理线程从第一环形缓冲区中读取数据之后,将数据插入第一队列,并通过信号量唤醒工作(worker)线程;
唤醒后的工作(worker)线程从第一队列中获取数据,根据数据构建回执消息,将回执消息插入第二队列中,并调用字符设备写模式(write)接口唤醒用户处理线程;唤醒后的用户处理线程从第二队列中获取回执消息,并将回执消息写入第二环形缓冲区中。
根据本发明的实施例,一种本地存储IO协议栈数据交互装置,包括:内核软件写入模块,用于第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;用户软件读取与写入模块,用户处理线程从第一环形缓冲区中读取数据,并获取数据对应的回执消息,将回执消息写入第二环形缓冲区;内核软件读取模块,第一内核线程从第二环形缓冲区中读取回执消息并进行处理,将处理后的回执消息返回第一类型的存储IO协议栈;其中,第一内核线程不与其他内核线程共用第一环形缓冲区和第二环形缓冲区。
根据本发明的实施例,本地存储IO协议栈数据交互装置,还包括:第一唤醒模块,用于在将数据写入第一环形缓冲区之后,唤醒阻塞在读模式(read)上的用户处理线程,其中,唤醒后的用户处理线程用于从第一环形缓冲区中读取数据;
第二唤醒模块,用于在将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒用户处理线程,其中,唤醒后的用户处理线程用于获取数据对应的回执消息;第三唤醒模块,用于在将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒第一内核线程,唤醒后的第一内核线程用于从第二环形缓冲区中读取回执消息。
根据本发明的实施例,本地存储IO协议栈数据交互装置,还包括:休眠模块,用于当没有数据交互的时候,用户处理线程调用字符设备读模式(read)接口进行休眠并让出CPU资源。
根据本发明的实施例,本地存储IO协议栈数据交互装置,内核软件写入模块还包括:第二内核线程将第二类型的存储IO协议栈的数据写入第三环形缓冲区中。
根据本发明的实施例,本地存储IO协议栈数据交互装置,还包括:在用户处理线程从第一环形缓冲区中读取数据之后,将数据插入第一队列,并通过信号量唤醒工作(worker)线程;
唤醒后的工作线程从第一队列中获取数据,根据数据构建回执消息,将回执消息插入第二队列中,并调用字符设备write接口唤醒用户处理线程;唤醒后的用户处理线程从第二队列中获取回执消息,并将回执消息写入第二环形缓冲区中。
本发明的有益技术效果在于:本发明的方案可以避免内存拷贝,同时通过优化线程和共享内存的映射关系,以及内核线程和用户线程之间的唤醒机制,最大限度的提升数据交互的性能。在存储IO压力不大的场景,可以实时响应数据交互请求,保证性能和时延的前提下降低CPU开销;存储IO压力大的场景,可以通过增加处理线程的方式,线性扩展数据交互性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一个实施例的一种本地存储IO协议栈数据交互方法的流程图;
图2是根据本发明一个实施例的本地存储IO协议栈数据交互架构的示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种本地存储IO协议栈数据交互方法,包括:
S11,第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;
S12,用户处理线程从第一环形缓冲区中读取数据,并获取数据对应的回执消息,将回执消息写入第二环形缓冲区;
S13,第一内核线程从第二环形缓冲区中读取回执消息并进行处理,将处理后的回执消息返回第一类型的存储IO协议栈,其中,第一内核线程不与其他内核线程共用第一环形缓冲区和第二环形缓冲区。
通过本发明的上述技术方案,实现了通信过程中的免锁机制,通过将软件和共享内存绑定的方式,每个线程独占不同的环形缓冲区进行处理。
首先,第一内核线程不与其他内核线程共用第一环形缓冲区和第二环形缓冲区。也就是,每个内核线程独占一对环形缓冲区(ringbuffer),多个线程不共享环形缓冲区,这样可以避免多个线程操作同一段内存时的锁竞争,达到多线程可以线程扩展数据交互性能的效果。
其次,根据不同的数据流向使用不同的环形缓冲区,其中一个环形缓冲区,即第一环形缓冲区,用于记录内核软件(Kernel)向用户软件(User)发送的消息,另外一个环形缓冲区,即第二环形缓冲区,用于记录用户软件(User)向内核软件(Kernel)发送的消息。同时,第一内核线程将数据写入第一环形缓冲区中并从第二环形缓冲区中读取回执消息,使得同一个内核线程进行写入和读取操作也不需要通过加锁进行互斥。这样可以最大限度的减少内核软件的锁竞争。
另外,本发明的技术方案中,用户空间采用一个多级线程流水线处理的策略,其中环形缓冲区的接收和发送由一个轻量级的线程,即用户处理线程进行处理,这样可以完全避免用户态对环形缓冲区的并发操作,减少锁竞争。
图2为本发明一个实施例的本地存储IO协议栈数据交互架构的示意图,如图2所示,101-108代表一次IO的数据流向,数据交互包括以下步骤:
步骤101,内核线程1从iSCSI存储协议栈接收数据写入环形缓冲区。即,第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中。步骤101还包括:第二内核线程将第二类型的存储IO协议栈的数据写入第三环形缓冲区中。每个缓冲区具有缓冲区头(head)和缓冲区尾(tail)。在步骤101中,不同的存储IO协议栈(iSCSI、FC)由不同的内核线程进行处理,每个内核线程处理对应的存储IO协议栈,并将协议发送的数据直接写入环形缓冲区中,优化了线程和共享内存的关系,并且能够实现内存零拷贝的效果。
在步骤101将数据写入第一环形缓冲区之后,唤醒阻塞在读模式(read)上的用户处理线程,其中,唤醒后的用户处理线程用于从第一环形缓冲区中读取数据;
步骤102,用户处理线程唤醒后,通过接收工作(Recv worker)进行环形缓冲区的读取。
步骤103,将在步骤102中读取的数据插入队列(queue)中,通过信号量唤醒工作(worker)线程。
步骤104,工作线程(worker thread)唤醒后,从队列(queue)中获取数据并进行处理。
步骤105,根据步骤104中的数据构建回执消息,插入到队列(queue)中。
在步骤105之后之后,调用字符设备写模式(write)接口唤醒用户处理线程,其中,唤醒后的用户处理线程用于获取数据对应的回执消息。
步骤106,用户处理线程唤醒后,从队列(queue)中获取回执消息。
在上述步骤中,用户处理线程从所有环形缓冲区中读取消息并投递到多个队列(queue)中,由多个工作(worker)线程从队列中获取消息并处理,工作(worker)线程处理消息结束后的回执消息也加入队列(queue)中,通过用户处理线程将回执消息写入环形缓冲区。因此,在用户软件的处理流程中,唯一的锁开销只在多个队列的插入和获取,对性能影响并不大。
步骤107,将在步骤106中获取的回执消息通过发送工作(Send Worker)写入环形缓冲区中,调用字符设备write接口唤醒内核线程1。
在步骤107将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒内核线程1,唤醒后的第一内核线程用于从第二环形缓冲区中读取回执消息。
步骤108,内核线程1唤醒后,从环形缓冲区中读取回执消息。
内核线程1将读取的回执消息进行处理后,返回存储协议栈。
当系统没有数据交互的时候,用户处理线程调用字符设备read接口进行休眠,此时会让出CPU资源。
通过以上步骤,可以实时的唤醒内核软件和用户软件的线程,减少线程通知上的时间开销,同时IO压力小的时候,线程可以休眠让出CPU,降低系统开销。
在上述实施例中,本发明通过唤醒阻塞在读模式(read)上的用户处理线程、调用字符设备写模式(write)接口唤醒用户处理线程、以及调用字符设备写模式(write)接口唤醒第一内核线程,通过内核程序提供字符驱动,用read系统调用来实现用户态进程的阻塞,用write系统调用实现用户态线程唤醒、内核态线程唤醒和阻塞在read上的用户态线程唤醒。优化了内核线程和用户线程之间的唤醒机制,实现了实时的唤醒内核软件和用户软件的线程,减少线程通知上的时间开销的效果。同时,内核程序和用户程序的实时通信机制,可以极大的降低程序处理切换阶段的时延。
通过本发明的上述技术方案,在存储IO压力不大的场景,可以实时响应数据交互请求,保证性能和时延的前提下降低CPU开销,同时IO压力小的时候,线程可以休眠让出CPU,降低系统开销;存储IO压力大的场景,可以通过增加处理线程的方式,线性扩展数据交互性能。
本发明还提供了一种本地存储IO协议栈数据交互装置,包括:
内核软件写入模块,用于第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;
用户软件读取与写入模块,用户处理线程从第一环形缓冲区中读取数据,并获取数据对应的回执消息,将回执消息写入第二环形缓冲区;
内核软件读取模块,第一内核线程从第二环形缓冲区中读取回执消息并进行处理,将处理后的回执消息返回第一类型的存储IO协议栈,其中,第一内核线程不与其他内核线程共用第一环形缓冲区和第二环形缓冲区。
在一个实施例中,本地存储IO协议栈数据交互装置,还包括:第一唤醒模块,用于在将数据写入第一环形缓冲区之后,唤醒阻塞在读模式(read)上的用户处理线程,其中,唤醒后的用户处理线程用于从第一环形缓冲区中读取数据;第二唤醒模块,用于在将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒用户处理线程,其中,唤醒后的用户处理线程用于获取数据对应的回执消息;第三唤醒模块,用于在将回执消息写入第二环形缓冲区之后,调用字符设备写模式(write)接口唤醒第一内核线程,唤醒后的第一内核线程用于从第二环形缓冲区中读取回执消息。
在一个实施例中,本地存储IO协议栈数据交互装置,还包括:休眠模块,用于当没有数据交互的时候,用户处理线程调用字符设备读模式(read)接口进行休眠并让出CPU资源。
在一个实施例中,本地存储IO协议栈数据交互装置,内核软件写入模块还包括:第二内核线程将第二类型的存储IO协议栈的数据写入第三环形缓冲区中。
在一个实施例中,本地存储IO协议栈数据交互装置,还包括:在用户处理线程从第一环形缓冲区中读取数据之后,将数据插入第一队列,并通过信号量唤醒工作(worker)线程;唤醒后的工作线程从第一队列中获取数据,根据数据构建回执消息,将回执消息插入第二队列中,并调用字符设备write接口唤醒用户处理线程;唤醒后的用户处理线程从第二队列中获取回执消息,并将回执消息写入第二环形缓冲区中。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种本地存储IO协议栈数据交互方法,其特征在于,包括:
第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;
用户处理线程从所述第一环形缓冲区中读取所述数据,并获取所述数据对应的回执消息,将所述回执消息写入第二环形缓冲区;
所述第一内核线程从所述第二环形缓冲区中读取所述回执消息并进行处理,将处理后的所述回执消息返回所述第一类型的存储IO协议栈,其中,所述第一内核线程不与其他内核线程共用所述第一环形缓冲区和所述第二环形缓冲区。
2.根据权利要求1所述的本地存储IO协议栈数据交互方法,其特征在于,还包括:
在将所述数据写入第一环形缓冲区之后,唤醒阻塞在读模式上的用户处理线程,其中,唤醒后的所述用户处理线程用于从所述第一环形缓冲区中读取所述数据;
在将所述回执消息写入第二环形缓冲区之后,调用字符设备写模式接口唤醒所述用户处理线程,其中,唤醒后的所述用户处理线程用于获取所述数据对应的回执消息;
在将所述回执消息写入第二环形缓冲区之后,调用字符设备写模式接口唤醒所述第一内核线程,唤醒后的所述第一内核线程用于从所述第二环形缓冲区中读取所述回执消息。
3.根据权利要求1所述的本地存储IO协议栈数据交互方法,其特征在于,还包括:当没有数据交互的时候,所述用户处理线程调用字符设备读模式接口进行休眠并让出CPU资源。
4.根据权利要求1所述的本地存储IO协议栈数据交互方法,其特征在于,还包括:第二内核线程将第二类型的存储IO协议栈的数据写入第三环形缓冲区中。
5.根据权利要求1所述的本地存储IO协议栈数据交互方法,其特征在于,还包括:
在所述用户处理线程从所述第一环形缓冲区中读取所述数据之后,将所述数据插入第一队列,并通过信号量唤醒工作(worker)线程;
唤醒后的所述工作线程从所述第一队列中获取所述数据,根据所述数据构建回执消息,将所述回执消息插入第二队列中,并调用字符设备写模式接口唤醒所述用户处理线程;
唤醒后的所述用户处理线程从所述第二队列中获取回执消息,并将所述回执消息写入所述第二环形缓冲区中。
6.一种本地存储IO协议栈数据交互装置,其特征在于,包括:
内核软件写入模块,用于第一内核线程将第一类型的存储IO协议栈的数据写入第一环形缓冲区中;
用户软件读取与写入模块,用户处理线程从所述第一环形缓冲区中读取所述数据,并获取所述数据对应的回执消息,将所述回执消息写入第二环形缓冲区;
内核软件读取模块,所述第一内核线程从所述第二环形缓冲区中读取所述回执消息并进行处理,将处理后的所述回执消息返回所述第一类型的存储IO协议栈,其中,所述第一内核线程不与其他内核线程共用所述第一环形缓冲区和所述第二环形缓冲区。
7.根据权利要求6所述的本地存储IO协议栈数据交互装置,其特征在于,还包括:
第一唤醒模块,用于在将所述数据写入第一环形缓冲区之后,唤醒阻塞在读模式(read)上的用户处理线程,其中,唤醒后的所述用户处理线程用于从所述第一环形缓冲区中读取所述数据;
第二唤醒模块,用于在将所述回执消息写入第二环形缓冲区之后,调用字符设备写模式接口唤醒所述用户处理线程,其中,唤醒后的所述用户处理线程用于获取所述数据对应的回执消息;
第三唤醒模块,用于在将所述回执消息写入第二环形缓冲区之后,调用字符设备写模式接口唤醒所述第一内核线程,唤醒后的所述第一内核线程用于从所述第二环形缓冲区中读取所述回执消息。
8.根据权利要求6所述的本地存储IO协议栈数据交互装置,其特征在于,还包括:休眠模块,用于当没有数据交互的时候,所述用户处理线程调用字符设备读模式(read)接口进行休眠并让出CPU资源。
9.根据权利要求6所述的本地存储IO协议栈数据交互装置,其特征在于,内核软件写入模块还包括:第二内核线程将第二类型的存储IO协议栈的数据写入第三环形缓冲区中。
10.根据权利要求6所述的本地存储IO协议栈数据交互装置,其特征在于,还包括:
在所述用户处理线程从所述第一环形缓冲区中读取所述数据之后,将所述数据插入第一队列,并通过信号量唤醒工作(worker)线程;
唤醒后的所述工作线程从所述第一队列中获取所述数据,根据所述数据构建回执消息,将所述回执消息插入第二队列中,并调用字符设备write接口唤醒所述用户处理线程;
唤醒后的所述用户处理线程从所述第二队列中获取回执消息,并将所述回执消息写入所述第二环形缓冲区中。
CN201911364059.8A 2019-12-26 2019-12-26 一种本地存储io协议栈数据交互方法和装置 Pending CN111209123A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911364059.8A CN111209123A (zh) 2019-12-26 2019-12-26 一种本地存储io协议栈数据交互方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911364059.8A CN111209123A (zh) 2019-12-26 2019-12-26 一种本地存储io协议栈数据交互方法和装置

Publications (1)

Publication Number Publication Date
CN111209123A true CN111209123A (zh) 2020-05-29

Family

ID=70782572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911364059.8A Pending CN111209123A (zh) 2019-12-26 2019-12-26 一种本地存储io协议栈数据交互方法和装置

Country Status (1)

Country Link
CN (1) CN111209123A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113824777A (zh) * 2021-09-06 2021-12-21 武汉中科通达高新技术股份有限公司 数据管理方法和数据管理装置
CN114390098A (zh) * 2020-10-21 2022-04-22 北京金山云网络技术有限公司 一种数据传输方法、装置、电子设备及存储介质
WO2023134411A1 (zh) * 2022-01-17 2023-07-20 闻泰通讯股份有限公司 信息传输方法、终端设备及存储介质
CN116820801A (zh) * 2023-06-15 2023-09-29 中科驭数(北京)科技有限公司 Io多路复用机制的优化方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120120965A1 (en) * 2010-11-12 2012-05-17 Alcatel-Lucent Usa Inc. Lock-less and zero copy messaging scheme for telecommunication network applications
CN102541984A (zh) * 2011-10-25 2012-07-04 曙光信息产业(北京)有限公司 一种分布式文件系统客户端的文件系统
CN103020257A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 数据操作的实现方法和装置
CN104615490A (zh) * 2015-02-05 2015-05-13 浪潮集团有限公司 一种数据转换的方法及装置
CN110287023A (zh) * 2019-06-11 2019-09-27 广州海格通信集团股份有限公司 消息处理方法、装置、计算机设备和可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120120965A1 (en) * 2010-11-12 2012-05-17 Alcatel-Lucent Usa Inc. Lock-less and zero copy messaging scheme for telecommunication network applications
CN102541984A (zh) * 2011-10-25 2012-07-04 曙光信息产业(北京)有限公司 一种分布式文件系统客户端的文件系统
CN103020257A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 数据操作的实现方法和装置
CN104615490A (zh) * 2015-02-05 2015-05-13 浪潮集团有限公司 一种数据转换的方法及装置
CN110287023A (zh) * 2019-06-11 2019-09-27 广州海格通信集团股份有限公司 消息处理方法、装置、计算机设备和可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王磊;刘道福;陈云霁;陈天石;李玲;: "片上多核处理器共享资源分配与调度策略研究综述", 计算机研究与发展, vol. 50, no. 10, pages 1 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114390098A (zh) * 2020-10-21 2022-04-22 北京金山云网络技术有限公司 一种数据传输方法、装置、电子设备及存储介质
CN113824777A (zh) * 2021-09-06 2021-12-21 武汉中科通达高新技术股份有限公司 数据管理方法和数据管理装置
CN113824777B (zh) * 2021-09-06 2023-12-19 武汉中科通达高新技术股份有限公司 数据管理方法和数据管理装置
WO2023134411A1 (zh) * 2022-01-17 2023-07-20 闻泰通讯股份有限公司 信息传输方法、终端设备及存储介质
CN116820801A (zh) * 2023-06-15 2023-09-29 中科驭数(北京)科技有限公司 Io多路复用机制的优化方法、装置及设备

Similar Documents

Publication Publication Date Title
CN111209123A (zh) 一种本地存储io协议栈数据交互方法和装置
Liu et al. Design and evaluation of an rdma-aware data shuffling operator for parallel database systems
US20200387405A1 (en) Communication Method and Apparatus
US10365957B2 (en) Multicasting of event notifications using extended socket for inter-process communication
US8443377B2 (en) Parallel processing system running an OS for single processors and method thereof
US9286145B2 (en) Processing data communications events by awakening threads in parallel active messaging interface of a parallel computer
US8732229B2 (en) Completion processing for data communications instructions
CN102693162A (zh) 基于共享内存和核间中断的多核平台上多个虚拟机之间进程通信方法
EP1880289B1 (en) Transparent support for operating system services
KR20140069126A (ko) 미들웨어 머신 환경에서 다중노드 어플리케이션들을 위한 메시지 큐들을 제공 및 관리하는 시스템 및 방법
CN111182008B (zh) 在用户空间中建立套接字连接
CN108768884A (zh) 一种基于环形缓冲区的无线通信数据处理方法
WO2021022964A1 (zh) 一种基于多核系统的任务处理方法、装置及计算机可读存储介质
CN114756388A (zh) 一种基于rdma的集群系统节点间按需共享内存的方法
CN111176855B (zh) 在用户空间中建立线程之间的队列
CN111949422B (zh) 基于mq和异步io的数据多级缓存与高速传输记录方法
CN116257471A (zh) 一种业务处理方法及装置
WO2024007934A1 (zh) 中断处理方法、电子设备和存储介质
WO2023246236A1 (zh) 分布式数据库的节点配置方法、事务日志同步方法和节点
CN114697194B (zh) 阻塞式事件通知方法及装置
CN110018782B (zh) 一种数据读/写方法及相关装置
CA2382728A1 (en) Efficient event waiting
CN114371935A (zh) 网关处理方法、网关、设备及介质
CN116601616A (zh) 一种数据处理装置、方法及相关设备
Xu et al. PCIe P2P Communication for the High Performance Heterogeneous Computing System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination