CN105404597B - 数据传输的方法、设备及系统 - Google Patents

数据传输的方法、设备及系统 Download PDF

Info

Publication number
CN105404597B
CN105404597B CN201510694821.4A CN201510694821A CN105404597B CN 105404597 B CN105404597 B CN 105404597B CN 201510694821 A CN201510694821 A CN 201510694821A CN 105404597 B CN105404597 B CN 105404597B
Authority
CN
China
Prior art keywords
dma
host
memory address
address
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510694821.4A
Other languages
English (en)
Other versions
CN105404597A (zh
Inventor
王静
王一静
缪勰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510694821.4A priority Critical patent/CN105404597B/zh
Publication of CN105404597A publication Critical patent/CN105404597A/zh
Priority to EP16856851.7A priority patent/EP3361387B1/en
Priority to PCT/CN2016/102163 priority patent/WO2017067420A1/zh
Priority to KR1020187012924A priority patent/KR102209452B1/ko
Priority to US15/958,234 priority patent/US20180239726A1/en
Application granted granted Critical
Publication of CN105404597B publication Critical patent/CN105404597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/28Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/28Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
    • G06F13/282Cycle stealing DMA
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/0292User address space allocation, e.g. contiguous or non contiguous base addressing using tables or multilevel address translation means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0815Cache consistency protocols
    • G06F12/0831Cache consistency protocols using a bus scheme, e.g. with bus monitoring or watching means
    • G06F12/0835Cache consistency protocols using a bus scheme, e.g. with bus monitoring or watching means for main memory peripheral accesses (e.g. I/O or DMA)
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/10Address translation
    • G06F12/1081Address translation for peripheral access to main memory, e.g. direct memory access [DMA]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/10Address translation
    • G06F12/109Address translation for multiple virtual address spaces, e.g. segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1016Performance improvement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/62Details of cache specific to multiprocessor cache arrangements
    • G06F2212/621Coherency control relating to peripheral accessing, e.g. from DMA or I/O device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/65Details of virtual memory and virtual address translation
    • G06F2212/656Address space sharing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/65Details of virtual memory and virtual address translation
    • G06F2212/657Virtual address space management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/28DMA
    • G06F2213/2804Systems and methods for controlling the DMA frequency on an access bus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bus Control (AREA)

Abstract

本发明提供了数据传输的方法、设备和系统,用于I/O设备和多个主机设备之间进行DMA数据传输。将所述多个主机的DMA内存地址一一映射到全局虚拟地址空间的虚拟地址上,获取I/O设备发送的携带有DMA虚拟地址的DMA报文;根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机;将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;以及将修改后的所述DMA报文向所述目标主机发送。应用本发明技术方案,可以实现I/O设备与多个主机进行DMA数据传输,提高I/O设备的利用率,拓展网络传输的适用场景。

Description

数据传输的方法、设备及系统
技术领域
本发明涉及数据传输领域,具体涉及用于I/O设备和至少一个主机设备之间进行DMA数据传输方法、设备以及数据传输系统。
背景技术
在分布式环境中,为了提升I/O设备的可扩展性和利用率,往往存在多个主机共享I/O设备资源的场景。多个主机共享I/O资源,可以提升I/O资源的整体使用效率,主机可以按照需求动态的申请和释放资源。同时,主机间可以通过共享I/O资源,进行数据传输,以同步不同主机上的数据信息和状态。
I/O设备在进行数据传输时,一般使用直接内存存取(Direct Memory Access,简称DMA)技术传输I/O设备上的数据,从而实现独立于CPU的后台批量数据传输。在DMA操作中,主机为DMA操作分配DMA内存地址空间,I/O设备直接在DMA内存地址空间上进行数据读写,从而完成DMA方式数据传输。DMA操作通过DMA报文实现,I/O设备向主机发送DMA报文,DMA报文中包含DMA地址,DMA地址位于主机为DMA操作所分配的DMA内存地址空间上。通过DMA报文中的DMA地址,I/O设备可以直接对主机的DMA内存地址空间上的数据进行读写,具体的,例如,当主机对I/O设备进行写操作时,DMA报文为对内存的读报文,数据通过对该读报文所响应的一个或多个完成命令包携带,从内存拷贝到I/O设备上;当主机对I/O设备进行读操作时,根据需要拷贝的数据大小,I/O设备生成的DMA报文为一个或者多个写报文,报文携带拷贝的数据,写报文到达目标主机的DMA内存地址空间,将报文中的数据载荷复制到对应的内存空间中。由于DMA操作中,数据传输的过程无需主机CPU进行参与,从而实现了I/O设备对主机数据独立的高速读写。
当多个主机共享同一个I/O设备时,由于每个主机都拥有独立的DMA内存地址空间,对于I/O设备而言,会存在多个DMA内存地址空间的冲突,从而导致DMA操作无法进行。现有的多主机I/O资源共享技术不能有效的解决多个主机在高速连接下共同访问同一I/O设备的问题。例如在一种现有技术中,虽然能使得主机高速访问外部扩展的I/O资源,但是使用I/O设备的时候还是处于独占状态,即一个I/O设备只能同一时间被一个主机所访问。又如在令一种现有技术中,虽然可以通过IP技术来实现多个主机共享同一个网络I/O设备,但IP网络因为网络协议层处理导致了额外的性能开销损耗,且受到网络带宽所限,且存在较大的延时,因而不适合短距离的高性能I/O数据传输应用。
发明内容
有鉴于此,本发明提供了一种用于I/O设备和至少一个主机设备之间进行DMA数据传输方法、设备以及数据传输系统,以实现多个主机在通过DMA数据传输方式下共享同一I/O设备,从而使多个主机与共享的I/O设备之间实现高效的数据传输和同步。
第一方面,本发明实施例提供一种计算机系统,所述计算机系统包括多个主机、一个或多个输入/输出I/O设备、以及分别与所述多个主机和所述一个或多个I/O设备连接的数据传输设备。其中数据传输设备将所述多个主机的DMA内存地址一一映射到全局虚拟地址空间的虚拟地址上,并获取主机发送的带有DMA虚拟地址的DMA报文,将DMA报文中的DMA虚拟地址修改为所映射的DMA内存地址,以及将修改后的所述DMA报文向目标主机发送。可见,通过该计算机系统,I/O设备可以通过包含DMA虚拟地址的DMA报文,实现对多个主机进行DMA操作。由于DMA虚拟地址位于同一个全局虚拟地址空间上,因此相对于现有技术,不会发送DMA内存地址冲突,从而实现了多个主机共享同一个I/O设备。
在一种可能的设计中,主机各自的DMA内存地址组成一个或多个DMA内存地址区间,全局虚拟地址空间上有与各个主机的内存地址区间所一一对应的虚拟地址区间。获取带有DMA虚拟地址的DMA报文后,根据DMA虚拟地址所在的虚拟地址区间找到对应的内存地址区间,从而确定DMA内存地址以及内存地址所在的主机。由于通过内存地址区间和虚拟地址区间来实现虚拟地址、内存地址和主机之间的对应关系,从而简化了对应关系的复杂度。
在一种可能的设计中,主机可以根据目标主机DMA地址信息来发送DMA操作启动请求,从而指示I/O设备对目标主机发起DMA操作,进行数据传输。
在一种可能的设计中,系统中一个主机可以通过获取另一主机的DMA虚拟地址,从而向I/O设备发送以另一主机的DMA虚拟地址为DMA地址的DMA操作启动请求,从而实现主机可以通过该系统指示I/O设备与另一主机进行数据传输。
在一种可能的设计中,系统中的一个主机可以通过获取另一主机的DMA内存地址,并根据对应关系得到DMA内存地址对应的DMA虚拟地址,从而向I/O设备发送以另一主机的DMA虚拟地址为DMA地址的DMA操作启动请求,从而实现主机可以通过该系统指示I/O设备与另一主机进行数据传输。
在一种可能的设计中,系统中一个主机可以通过获取另一主机的DMA内存地址,从而向数据传输设备发送以另一主机的DMA内存地址为DMA地址的DMA操作启动请求,数据传输设备将DMA操作启动请求中的DMA内存地址转换为相对应的DMA虚拟地址,并转发给对应的另一主机从而实现主机可以通过该系统指示I/O设备与另一主机进行数据传输。从而实现根据另一主机的DMA内存地址通过该系统指示I/O设备与另一主机进行数据传输。
在一种可能的设计中,系统中I/O设备数据发生更新后,系统中的一个主机通过至少一条DMA写操作命令,使I/O设备向其他主机进行DMA写操作,从而将数据同步到其他主机。
在一种可能的设计中,数据传输设备根据DMA报文的操作类型和所述目标主机的权限要求确定对所述目标主机进行的DMA操作符合权限要求,当符合时才进行报文的修改和发送。
在一种可能的设计中,DMA报文还包含权限标识,根据所述DMA报文的操作类型、所述权限标识和所述目标主机的权限要求确定是否符合权限要求,当符合时才进行报文的修改和发送。通过权限控制,可以提高传输系统的安全性,并实现对特定的主机进行转发。
第二方面,本发明实施例提供一种数据传输方法,方法应用于多个主机共享一个或多个输入/输出I/O设备的计算机系统,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上。将所述多个主机的DMA内存地址一一映射到全局虚拟地址空间的虚拟地址上,并获取主机发送的带有DMA虚拟地址的DMA报文,将DMA报文中的DMA虚拟地址修改为所映射的DMA内存地址,以及将修改后的所述DMA报文向目标主机发送。可见,通过该计算机系统,I/O设备可以通过包含DMA虚拟地址的DMA报文,实现对多个主机进行DMA操作。由于DMA虚拟地址位于同一个全局虚拟地址空间上,因此相对于现有技术,不会发送DMA内存地址冲突,从而实现了多个主机共享同一个I/O设备。
在一种可能的设计中,主机各自的DMA内存地址组成一个或多个DMA内存地址区间,全局虚拟地址空间上有与各个主机的内存地址区间所一一对应的虚拟地址区间。获取带有DMA虚拟地址的DMA报文后,根据DMA虚拟地址所在的虚拟地址区间找到对应的内存地址区间,从而确定DMA内存地址以及内存地址所在的主机。由于通过内存地址区间和虚拟地址区间来实现虚拟地址、内存地址和主机之间的对应关系,从而简化了对应关系的复杂度。
在一种可能的设计中,获取所述多个主机中的一个或多个主机的包含相应主机的标识ID和DMA内存地址的注册信息,根据所述主机的DMA内存地址,为所述主机分配虚拟地址,并添加或更新到对应关系中。
在一种可能的设计中,获取所述多个主机中的一个或多个主机的包含相应主机的标识ID和DMA内存地址区间的注册信息,根据所述主机的一个或多个DMA内存地址区间,为所述主机分配一个或多个虚拟地址区间,并添加或更新到对应关系中。
在一种可能的设计中,当所述DMA虚拟地址、DMA内存地址和主机之间的对应关系发生更新后,向主机发送更新信息,从而指示所述主机同步更新存储在所述主机的所述DMA虚拟地址、DMA内存地址和主机之间的对应关系。
在一种可能的设计中,根据DMA报文的操作类型和所述目标主机的权限要求确定对所述目标主机进行的DMA操作符合权限要求,当符合时才进行报文的修改和发送。
在一种可能的设计中,DMA报文还包含权限标识,根据所述DMA报文的操作类型、所述权限标识和所述目标主机的权限要求确定是否符合权限要求,当符合时才进行报文的修改和发送。通过权限控制,可以提高传输系统的安全性,并实现对特定的主机进行转发。
在一种可能的设计中,可以接受主机所发送的包含DMA内存地址查询命令,并更根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取与所述主机的DMA内存地址相对应的所述全局虚拟地址空间上的DMA虚拟地址,然后将DMA虚拟地址通过返回报文发送给主机
在一种可能的设计中,可以获取任意一个主机向I/O设备发送的DMA操作启动请求,所述DMA操作启动请求包含另一主机的DMA内存地址,用于指示所述I/O设备向所述另一主机进行DMA操作。根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定与DMA内存地址对DMA虚拟地址,并将操作命令中的DMA内存地址修改为DMA虚拟地址,并发送给I/O设备。
第三方面,本发明提供了一种数据传输方法,其特征在于,所述方法应用于多个主机通过数据传输设备共享一个或多个输入/输出I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上。获取目标主机的DMA地址信息,根据所述目标主机的DMA地址信息,发送DMA操作启动请求,所述DMA操作启动请求包含DMA地址,用以指示所述I/O设备对在全局虚拟地址空间上的DMA虚拟地址进行DMA操作,所述DMA虚拟地址为目标主机的DMA内存地址映射到全局虚拟地址空间上的DMA虚拟地址。
在一种可能的设计中,DMA地址信息为DMA内存地址,将包含有目的主机的DMA内存地址的DMA操作启动请求发送给所述数据传输设备,指示数据传输设备将所述DMA操作启动请求中的DMA地址由目标主机的DMA内存地址修改为与之相对应的全局虚拟地址空间上的DMA虚拟地址,并将所述DMA操作启动请求转发给目标主机。
在一种可能的设计中,DMA地址信息为DMA内存地址,根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取目标主机的DMA的DMA虚拟地址,将所述包含DMA虚拟地址的DMA操作启动请求发送给I/O设备。
在一种可能的设计中,DMA地址信息为目的主机DMA虚拟地址,将包含有DMA虚拟地址的DMA操作启动请求发送给I/O设备,指示其对目标主机进行DMA操作。
在一种可能的设计中,主机分配DMA内存地址,并发送包含主机的识别ID和主机的DMA内存地址注册信息。
在一种可能的设计中,主机分配DMA内存地址区间,并发送注册信息,所述注册信息包含主机的识别ID和主机的DMA内存地址区间。
在一种可能的设计中,主机获取息包括需要更新的DMA虚拟地址、DMA内存地址和主机之间的对应关系的更新信息,并根据更新信息将对应关系添加或者更新到已经存在的DMA虚拟地址、DMA内存地址和主机之间的对应关系中。
第四方面,本发明实施例提供了一种数据传输设备,所述数据传输设备分别与所述多个主机和所述一个或多个输入/输出I/O设备相连接,所述多个主机共享一个或多个I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,该装置具有实现上述方法中第一方面中数据传输设备的相应功能和第二方面中的相应方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
第五方面,本发明实施例提供了一种数据传输设备,其特征在于,所述设备用于共享一个或多个输入/输出I/O设备,该装置具有实现上述方法中第一方面中主机的相应功能和第三方面中的相应方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
第六方面,本发明实施例提供了一种数据传输设备,所述数据传输设备分别与所述多个主机和所述一个或多个输入/输出I/O设备相连接,所述多个主机共享一个或多个I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,装置的结构中包括处理器,所述处理器被配置为支持装置执行上述第一方面中数据传输设备的相应功能和第二方面中的相应方法,装置的结构中还有发送器和接收器,用于实现发送或者接收上述第一方面中数据传输设备的相应功能和第二方面中的相应方法与其他设备交互的指令或者信息。所述装置还可以包括存储器,所述存储器用于与处理器耦合,其保存必要的程序指令和数据。
第七方面,本发明实施例提供了34一种数据传输设备,其特征在于,所述设备用于共享一个或多个输入/输出I/O设备,装置的结构中包括处理器,所述处理器被配置为支持装置执行上述第一方面中主机的相应功能和第三方面中的相应方法。装置的结构中还有发送器和接收器,用于实现发送或者接收上述第一方面中数据传输设备的相应功能和第二方面中的相应方法与其他设备交互的指令或者信息。所述装置还可以包括存储器,所述存储器用于与处理器耦合,其保存基站必要的程序指令和数据。
可见,本发明实施例通过获取I/O设备发送的DMA报文,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址,并将所述修改后的DMA报文发送给所述目标主机,I/O设备可以通过包含DMA虚拟地址的DMA报文,实现对多个主机进行DMA操作。由于DMA虚拟地址与主机上的DMA内存地址一一对应,且位于同一个全局虚拟地址空间上,因此相对于现有技术,不会发送DMA内存地址冲突。由于多个主机共享同一个I/O设备,因此,节省了I/O资源,提高了I/O设备的利用率。
此外,由于多个主机可以同时与同一I/O设备连接并进行数据传输,因此主机间的数据传输可以通过I/O设备的DMA操作实现,而不需在主机间直接进行数据传输。由于主机与I/O设备的链接总线具有高带宽和低延时的特点,且DMA操作中数据传输无需主机CPU进行干预,因此提高了网络传输传输性能和同步性能。
此外,由于通过DMA报文对DMA操作进行权限管理,提高整个网络数据传输的可靠性和安全性。此外,通过权限控制,还可以拓展网络使用的场景,对不同的DMA操作进行分类管理,实现更加复杂的网络部署和传输方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中DMA内存区间与虚拟地址区间的对应关系示意图;
图2是本发明实施例中数据传输设备的网络拓扑环境示意图;
图3是本发明实施例中网络传输设备的硬件互联构架示意图;
图4是本发明实施例中第一种数据传输方法的流程示意图;
图5是本发明实施例中一种数据传输方法具体的实现方式的流程示意图;
图6A是本发明实施例中第二种数据传输方法的流程示意图;
图6B是本发明实施例中第二种数据传输方法的又一流程示意图;
图7是本发明实施例中第三种数据传输方法的流程示意图;
图8是本发明实施例中对报文进行权限控制的一种实现过程的流程示意图;
图9是本发明实施例中第四种数据传输方法的流程示意图;
图10是本发明实施例中一种数据传输设备的结构示意图;
图11是本发明实施例中一种数据传输设备的另一结构示意图;
图12是本发明实施例中一种数据传输系统的流程示意图;
图13是本发明实施例中另一种数据传输系统的流程示意图。
图14是本发明实施例中另一种数据传输设备的结构示意图;
图15是本发明实施例中又一种数据传输设备的结构示意图。
具体实施方式
本发明实施例提供一种多个主机和I/O设备之间的数据传输方法,以实现多个主机与I/O设备之间通过DMA进行数据传输,降低多个主机之间以及主机与I/O设备时间的带宽占用和数据延迟,从而提高数据传输的性能和稳定性。
本发明实施例还提供了相应的设备及数据传输系统。以下分别进行详细说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了方便理解本发明实施例,首先在此介绍本发明实施例描述中会引入的术语。
全局虚拟地址空间:而本发明技术中,多个主机共享同一个I/O设备,正如在背景技术中所阐述的,这些主机的DMA内存地址在I/O设备上是冲突的。全局虚拟地址空间独立于所有主机,在这个空间内,使用者是外部I/O设备。全局虚拟地址空间的空间大小大于或等于所有与I/O设备相连接的主机的DMA内存地址的总和。因此,全局虚拟地址空间可以将不同主机的DMA内存地址映射到自己的地址空间中。由于不同主机的DMA内存地址映射到统一的全局虚拟地址空间中,这解决了不同主机的DMA地址在同一个I/O设备上使用的时候冲突的问题。
DMA虚拟地址:DMA虚拟地址是位于全局虚拟地址空间上某一内存地址,DMA虚拟地址与一台主机的DMA内存地址相对应。在本发明中,I/O设备对主机进行DMA操作时发送的DMA报文的DMA地址并不是主机上的DMA内存地址,而是DMA虚拟地址。I/O设备通过DMA虚拟地址对全局虚拟地址空间进行DMA操作,因此当I/O设备与多个主机连接时,也不会发生如背景技术中所介绍的DMA地址冲突。同时,本发明通过将DMA报文中的DMA虚拟地址转换为与之相对应的主机上的DMA内存地址,从而实现了I/O设备与多个主机进行DMA数据传输。
虚拟地址区间:在一种可能的场景下,主机中的DMA内存地址是连续的,即组成一个或多个DMA内存地址区间,不同主机的DMA内存地址区间被映射到全局虚拟地址空间中。每一个DMA内存地址区间对应到全局虚拟地址空间上即为一个虚拟地址区间。结合图1,可以更直观的理解主机的DMA内存区间与虚拟地址区间的对应关系:如图所示,主机1、主机2和主机3的DMA内存地址区间分别在全局虚拟地址空间上对应为主机1、主机2和主机3的虚拟地址区间。其中,主机1和主机2的DMA内存地址在一个连续的DMA内存地址区间中,因此在虚拟地址区间中所映射的也是连续的虚拟地址区间。主机3的DMA内存地址分布在三个DMA内存地址区间中,不同的DMA内存地址区间之间是不连续的,因此,三个DMA内存地址区间分别映射了三个虚拟地址区间。在虚拟地址
区间位于全局虚拟地址空间上,虚拟地址区间的大小为主机的DMA内存地址区间大小,使得虚拟地址区间中的DMA虚拟地址可以与DMA内存地址区间中的DMA内存地址一一对应,而全局虚拟地址空间大于或等于所有虚拟地址区间的总和。
本发明应用在I/O设备与至少一个主机设备相连接的分布式环境下,在分布式环境中,为了提升I/O设备的可扩展性和利用率,往往存在多个主机共享I/O设备资源的场景。多个主机共享I/O资源,可以提升I/O资源的整体使用效率,主机可以按照需求动态的申请和释放资源。图2描述了本发明的一种网络拓扑环境,主机1、主机2、主机3通过数据传输设备与I/O设备1、I/O设备2、I/O设备3相连接。图3描述了本发明实施的一种硬件互联架构,在该架构下,主机通过快捷外围部件互连标准(Peripheral ComponentInterconnectExpress,PCIe)链路直连到外部的PCIe硬件互联设备,PCIe硬件互联设备连接PCIe设备。在本发明实施例中,数据传输设备可以实现该PCIe硬件互联设备的功能。PCIe硬件互联架构是非PCIe规范实现,通过互联设备的PCIe数据包转发,可以实现多个主机访问同一个PCIe设备。如图中主机1和主机2以及主机3共享I/O设备。该硬件平台提供了一种能力,使得不同Host能访问到外部同一个PCIe设备。当然,基于本发明的思想,本发明所应用的网络拓扑环境和硬件互联构架可以有多种变化和拓展,以实现本发明中I/O设备与至少一个主机之间的数据传输。
由于本发明应用于I/O设备和至少一个主机设备之间进行DMA数据传输,为了方便对本发明的理解,现有技术中DMA操作的流程进行简要的介绍。
DMA操作包含DMA写操作和DMA读操作,DMA写操作可以实现将数据从I/O设备拷贝到目标主机的DMA内存地址中,而DMA读操作可以将数据从目标主机的DMA内存地址拷贝到I/O设备中。
DMA写操作包括如下步骤:
1、根据接收到的DMA操作启动请求,I/O设备驱动软件生成一个IO命令包,包含DMA拷贝I/O设备中的数据到内存的指令信息,IO设备上源数据地址和目标内存DMA地址;
2、IO设备接收到该命令包,根据需要拷贝的数据大小,生成一个或者多个DMA写报文,报文的目标地址为内存DMA地址,报文携带拷贝的数据;
3、将DMA写报文发送至对应的通道(一般为pcie链路);
4、DMA写报文到达主机的物理内存空间,将报文中的数据载荷复制到对应的目标内存DMA地址上;
DMA读操作包括如下步骤:
1、根据接收到的DMA操作启动请求,I/O设备驱动软件生成一个IO命令包,包含DMA拷贝内存数据到IO设备的指令信息,IO设备上目标地址和内存源数据的DMA地址(在本发明中,前述写操作中目标内存DMA地址和读操作中内存源数据的DMA地址统称为DMA地址);
2.IO设备接收到该命令包,生成一个内存读报文(在本发明中,将前述的DMA写报文和DMA读报文统称为DMA报文),报文的目标地址是内存源数据的DMA地址,并指明要读的数据的大小;
3.将内存读报文发送至目标主机对应的通道(一般pcie链路);
4.主机内存控制器接收到DMA读报文,生成完成报文,并将指定的内存数据填充到所述完成报文载荷,完成报文根据DMA读报文的IO设备ID,返回给IO设备,从而将数据拷贝至IO设备。(值得注意的是,完成报文并不是本发明所称的DMA报文)
参考图4,是本发明实施例提供的第一种数据传输方法的流程示意图,需要说明的是,所述方法应用于多个主机共享一个或多个输入/输出I/O设备的计算机系统,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上。该方法的实施主体可以在网络拓扑中可以有多种的实现方式。例如,实施主体可以使单独的数据传输设备,也可以是集成在I/O设备上的数据传输模块,或者是集成在某一主机上,与其他主机和I/O设备相连的数据传输设备。本发明实施例的方法可以包括如下步骤:
S401、获取I/O设备发送的DMA报文,所述DMA报文中携带DMA虚拟地址,所述DMA虚拟地址为在所述全局虚拟地址空间上的虚拟地址。
如背景技术所述,I/O设备对主机的DMA操作通过DMA报文来实现,即DMA报文中的DMA地址为目的主机的DMA内存地址,根据DMA地址对目标主机存储在DMA内存地址上的数据进行读写。在本发明实施例中,DMA报文的DMA地址为全局虚拟地址空间上的虚拟地址,如前所述,该虚拟地址与目标主机的DMA内存地址相对应。对于I/O设备而言,当通过DMA报文对目标主机的DMA内存地址进行DMA操作时,实际上是对目标主机DMA内存地址所对应的虚拟地址进行读写操作。由于虚拟地址区间位于同一个全局虚拟地址空间上,因此I/O设备对多个相连接的主机进行DMA操作时,不会出现DMA内存地址区间冲突的问题。
S402、根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,其中,所述DMA内存地址为映射到所述DMA虚拟地址上的DMA内存地址,所述目标主机为映射到所述DMA虚拟地址的所述DMA内存地址所在的主机
由于DMA虚拟地址与主机以及主机的DMA内存地址是一一对应关系,因此,可以根据DMA报文的DMA虚拟地址,确定所述DMA虚拟地址对应的DMA内存地址和目标主机。获取的方式可以有多种,包括但不限于如下方式:根据所述DMA报文的DMA虚拟地址,在地址转换表中查询,获得目标主机的DMA内存地址;或者,通过向其他设备发送查询指令,获取返回的目标主机的DMA内存地址;或者,通过预设的地址转换规则,将DMA虚拟地址转化为目标主机的DMA内存地址。
例如,可以向其他设备,如管理系统所在的主机,或者其他具有DMA地址转换功能的设备发送查询指令,所述查询指令中包含了带查询的DMA虚拟地址。设备接收到查询指令后,查询到所述DMA虚拟地址所对应的DMA内存地址,并将所述DMA内存地址通过指令返回。获取所述返回指令后,即可获得而所述DMA虚拟地址所对应的DMA内存地址。
又例如,可以通过预设的地址转换规则,将DMA虚拟地址转哈为目标主机的DMA内存地址。例如可列举的一种转换方式中,目标主机的DMA内存地址在一个区间中,该区间大小为统一大小,如1G,全局虚拟地址空间中也分配有对应的区间,所述区间中有与之对应的虚拟地址,从全局虚拟地址空间的起始地址开始依次按照主机编号连续排列,则DMA虚拟地址与全局虚拟地址空间的起始地址之间的差值的内存大小,除以内存区间大小,所得的商为目标主机的编号,余数为从目标主机的内存区间的起始地址起算到DMA内存地址的大小,从而可以得到目标主机的DMA内存地址。
在一种实现方式中,所述DMA虚拟地址、DMA内存地址和主机之间的对应关系包括:所述多个主机各自的DMA内存地址组成多个DMA内存地址区间,每个主机对应一个或多个DMA内存地址区间;所述全局虚拟地址空间包含不重叠的多个虚拟地址区间,所述多个虚拟地址区间与所述多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应。
结合图1以及前述对虚拟地址区间介绍,可以对本实现方式中的对应关系进行理解。
在一种实现方式中,根据对应关系确定确定所述DMA虚拟地址对应的DMA内存地址和目标主机可以通过查询对应关系表来实现。
在一种情况下,对应关系表中可以直接包含DMA内存地址、DMA虚拟地址以及所对应的主机三者之间的对应关系。从而通过三个元素中的任意一个,均可以查询到与之相对应的另外两个元素。
在一种实现方式中,地址转换表可以包含主机ID,主机的DMA内存地址,DMA虚拟地址等字段,查表时,可以直接通过DMA虚拟地址得到与之相相对应的DMA内存地址以及相对应的主机。此处的地址可以为一个具体的地址,也可以是一段地址区间。本实现方式中,DMA内存地址区间中的内存地址以及DMA虚拟地址区间中的虚拟地址均可以是非连续的。在另一种实现方式中,地址转换表可以包含主机ID,主机的DMA内存地址区间起始地址,虚拟地址区间起始地址,区间大小等字段。查表时,根据虚拟地址和虚拟地址区间的起始地址以及区间大小,可以得到虚拟地址与虚拟地址区间的起始地址之间的差值,根据所述差值和主机DMA内存地址区间起始地址,可以得到DMA内存地址。本实现方式用于虚拟地址区间与内存地址区间为连续的情况,可以有效的减小地址转换表的表项数量。
地址转换表位于地址转换模块硬件上,以私有的寄存器或者设备内存实现,也可以是位于管理系统内存中。当位于私有寄存器或者设备内存中时,通过直接访问地址转换表可进行查询;当位于管理系统内存中时,且管理系统位于非本地的设备上是,可以通过发送带有虚拟地址的查询指令,并接受反馈的带有DMA内存地址的返回指令,从而获取DMA内存地址。
地址转换表可以通过预先人工进行设定,或者通过位于网络中的其他设备进行同步从而获得地址转换表。在另一种实现方式中,地址转换表可以通过如下方式自动生成或者更新:获取主机的注册信息,所述注册信息包含主机的识别ID和主机的DMA内存地址区间;根据所述主机的DMA内存地址区间,为所述主机分配虚拟地址区间,所述虚拟地址区间位于全局虚拟地址空间上,所述虚拟地址区间内地址与所述主机的DMA内存地址区间内地址相对应;将所述主机ID、所述主机的DMA内存地址以及所述虚拟地址区间的对应关系添加到所述地址转换表中或者用所述对应关系更新所述地址转换表中所述主机已经存在的对应关系。主机的注册信息可以有主机在接入网络后,由主机发送给本方法的执行主体设备,或者可以通过管理系统将接入网络的主机的注册信息发送给本方法的执行主体设备。主机的内存地址区间可以是通过内存地址的起始地址和区间大小来表示,也可以通过具体的连续或非连续的地址或地址区间的集合来表示。为主机分配虚拟地址区间,即根据主机的内存地址区间大小,分配与之相应大小的虚拟地址区间,并将虚拟地址区间添加到全局虚拟地址空间上,或者用所述虚拟地址区间替换所属主机在全局虚拟地址空间上已存在的虚拟地址区间。可以理解的,在分配虚拟地址区间时,应当保证虚拟地址区间与主机的内存地址区间为一一对应关系。
在一种实现方式下,所述DMA虚拟地址、DMA内存地址和主机之间的对应关系通过如下方式添加或修改:获取所述多个主机中的一个或多个主机的注册信息,所述注册信息包含相应主机的标识ID和DMA内存地址;根据所述主机的DMA内存地址,为所述主机分配虚拟地址,所述虚拟地址位于全局虚拟地址空间上,所述虚拟地址与所述主机的DMA内存地址一一对应;将所述主机ID、以及所述主机的DMA内存地址和所述虚拟地址对应关系添加或更新到所述DMA虚拟地址、DMA内存地址和主机之间的对应关系中。
在另一种实现方式下,当对应关系中包含了虚拟地址区间或者内存地址区间时,所述DMA虚拟地址、DMA内存地址和主机之间的对应关系通过如下方式添加或修改获取所述多个主机中的一个或多个主机的注册信息,所述注册信息包含相应主机的标识ID和DMA内存地址区间;根据所述主机的一个或多个DMA内存地址区间,为所述主机分配一个或多个虚拟地址区间,所述虚拟地址区间位于全局虚拟地址空间上,所述一个或多个虚拟地址区间与所述主机的一个或多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应;将所述主机ID、以及所述主机的DMA内存地址区间和所述虚拟地址区间的对应关系添加或更新到所述DMA虚拟地址、DMA内存地址和主机之间的对应关系中。
在一种实现方式中,当所述DMA虚拟地址、DMA内存地址和主机之间的对应关系发生更新后,向主机发送更新信息,用以指示所述主机同步更新存储在所述主机的所述DMA虚拟地址、DMA内存地址和主机之间的对应关系。
可以理解的,更新信息可以在地址转换表更新后主动发送给主机,也可以接收主机发送的查询命令后,判断对应关系是否发生更新,若发生更新则向主机发送更新信息。可以向全部主机发送所述更新信息,也可以向部分特定主机发送,或者向管理系统所在主机发送。
可以理解的,对应关系的更新可以通过所述的数据传输设备来完成,也可以通过网络中的管理系统完成,或者通过任一主机完成。下面列举一种对应关系创建或者更新的具体实现方式,在本实现方式中,对应关系由地址转换表来进行存储,地址转换表的更新是由网络中的主机完成,并将更新后的地址转换表向其他设备进行同步。主机与数据传输设备以及I/O设备之间通过PCIe总线进行通信。本实现方式包含如下步骤:
a)主机枚举数据传输设备的PCIe设备对象;
b)主机枚举发现远端共享的PCIe设备;
c)通过访问数据传输设备获取本机ID;
d)主机将本机DMA地址和I/O设备ID作为输入,分配虚拟地址区间;
e)等待分配动作完成,获得新的全局虚拟地址空间;
f)根据上述信息,在主机本地内存创建或者更新地址转换表;
g)初始化数据传输设备的中断信息,后续地址转换表项如果有更新,通过中断通知当前主机,并更新本主机内的副本信息;
h)I/O设备的添加和删除,或者当前主机关机,都需要先向全局数据传输设备更新相关信息,并由数据传输设备通过中断的方式通知其他关心这些信息的主机;
S403、将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;以及,将修改后的所述DMA报文向所述目标主机发送。
在前述步骤中,获取DMA内存地址时,可以同时获得所述DMA内存地址所在的主机,从而将修改后的DMA报文发送给所述的主机。由于DMA操作由DMA报文所发起或者执行,当I/O设备所发送的DMA报文被发送到目标主机,I/O设备可实现对该目标主机进行DMA操作。
结合图5,是本实施例的一种具体的实现方式。数据传输设备503获取由I/O设备501发送的DMA报文502,DMA报文502的DMA地址为DMA虚拟地址0xabcd,该虚拟地址位于全局虚拟地址空间上。对应关系通过地址转换表进行存储,并通过前述的虚拟地址区间来来进行地址的分配和查询。数据传输设备503根据虚拟地址,在地址转换表中查询,可以定位到表项504,即所述虚拟地址位于起始地址为0xa000,大小为1G的虚拟地址区间上。从表项504可知,该虚拟地址区间与主机3上的的起始地址为0x0,大小为1G的DMA内存地址相对应。因此,根据虚拟地址区间的起始地址与虚拟地址的差值bcd,以及主机3的DMA内存地址的起始地址,可以得到该虚拟地址在主机3的DMA内存地址区间中所对应的DMA内存地址为0x0bcd。将DMA报文502中的DMA地址由虚拟地址0xabcd修改为主机3上的DMA内存地址0x0bcd,得到修改后的DMA报文505,。将DMA报文505发送给主机3,从而使I/O设备对主机3上的DMA内存地址发起或者执行DMA操作。
可见,在本发明实施例中,通过获取I/O设备发送的DMA报文,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址,并将所述修改后的DMA报文发送给所述目标主机,I/O设备可以通过包含DMA虚拟地址的DMA报文,实现对多个主机进行DMA操作。由于DMA虚拟地址位于同一个全局虚拟地址空间上,因此相对于现有技术,不会发送DMA内存地址冲突。由于多个主机与I/O设备之间可以同时进行数据传输,因此主机间的数据传输可以通过I/O设备的DMA操作实现,而不需主机间进行网络传输。由于主机与I/O设备的链接总线具有高带宽和低延时的特点,且无需主机CPU进行干预,因此提高了网络传输的及时性和高效性,拓展了网络应用的场景。
此外,在本发明实施例中,获取DMA虚拟地址以及目标主机可以DMA虚拟地址、DMA内存地址和主机之间的对应关系获得,当对应关系存储于本地时,可以高效的进行DMA虚拟地址的查询,提高修改DMA报文的DMA地址的执行效率;当对应关系存储于远端的管理系统中时,可以简化数据传输设备的硬件复杂度,拓展了和丰富了数据传输设备的具体实现方式。
此外,在本发明实施例中,通过当所述对应关系发生更新后,向主机发送更新信息,可以实现主机中的对应关系与数据传输设备中的地址转换表同步更新。因此,主机可以独立进行DMA虚拟地址和与之相对应的DMA内存地址之间的相互转化,从而扩展了本发明的应用场景。
结合图6A和图6B,是本发明实施例提供的第二种数据传输方法的流程示意图。本实施例将结合第一种实施例进行说明,本实施例的方法包含了第一种实施例中的S401、S402、S403步骤,因此与所述步奏相同或相似的描述,在本实施例中不再赘述。
由于DMA操作可以由主机通过向I/O设备发送DMA操作启动请求来发起,DMA操作启动请求中包含的DMA内存地址,从而指示I/O设备向所述的DMA内存地址发起DMA操作。在本发明中,结合第一种实施例所描述,I/O需要向DMA虚拟地址发起DMA操作,即发送以DMA虚拟地址为DMA地址的DMA报文。因此,I/O设备所接受到的DMA操作启动请求也应该为DMA虚拟地址。
主机向I/O设备发送的DMA操作启动请求可以直接为DMA虚拟地址,从而使I/O设备可以接收到包含DMA虚拟地址的DMA操作启动请求。在这种情况下,主机可以在通过第一种实施例中提供的方法,在本地存储与数据传输设备同步更新的对应关系,从而通过所述对应关系获取DMA操作启动请求中的DMA虚拟地址;也可以通过向存储有地址转换表的其他设备发送查询命令,来获取所述的DMA虚拟地址。主机向I/O设备发送的DMA操作启动请求还可以为目标主机的DMA内存地址,并通过将操作命令发送给数据传输设备,将所述操作命令中的DMA内存地址修改为相对应的DMA虚拟地址,并将修改后的DMA操作启动请求发送给I/O设备。
结合图6A,在本发明实施例的一种实现方式中,数据传输设备可以通过如下方法向主机反馈查询命令。所述数据传输方法还包括
S601:接收主机发送的查询命令,所述查询命令中包含需要查询的主机的DMA内存地址;
S602:根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取与所述主机的DMA内存地址相对应的所述全局虚拟地址空间上的DMA虚拟地址;
S603:向所述主机发送返回报文,所述返回报文中包含所述主机的DMA内存地址所对应的全局虚拟地址空间上的DMA虚拟地址。
获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址有多种实现方式,获取方式与前述通过DMA虚拟地址获取与之相对应的DMA内存地址的原理相同,此处不再赘述。
在一种实现具体的方式中,获取DMA内存地址相对应的DMA虚拟地址的方式可以通过查询地址转换表来实现。所述获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址包括:根据所述目标主机的DMA内存地址,在地址转换表中查询,获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址,所述地址转换表包含所述全局虚拟地址空间上的虚拟地址区间中的虚拟地址与与所述虚拟地址区间相对应的主机的DMA内存地址区间中的内存地址的对应关系;
所述地址转换表可以为前述第一种方法实施例中的地址转换表,也可以是针对根据DMA内存地址查询相对应DMA虚拟地址进行优化后的单独的地址转换表。在一种可列举的方式中,目标主机的DMA内存地址为0x0bcd,根据该地址,可以定位到内存起始地址为0x0,大小为1G的主机DMA内存地址。该表项所对应的DMA虚拟地址区间的起始地址为0xa000,因此,根据所述DMA内存地址与内存起始地址的差值,以及DMA虚拟地址区间的起始地址,可以得到相对应的DMA虚拟地址为0xabcd。
结合图6B,在另一种实现方式中,数据传输设备可以获取主机发送的DMA操作启动请求,将其修改后转发给I/O设备。所述数据传输方法还包括:
S604,获取主机向I/O设备发送的DMA操作启动请求,所述操作命令包含目标主机的DMA内存地址,用于指示I/O设备向目标主机进行DMA操作;
S605将所述DMA操作启动请求的目标主机的DMA内存地址修改为与之相对应的全局虚拟地址空间上的DMA虚拟地址;
S606将所述修改后的DMA操作启动请求发送给I/O设备。
同样的,根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定与所述DMA操作启动请求中的所述DMA内存地址对应的所述全局虚拟地址空间上的DMA虚拟地址的方式与前述通过DMA虚拟地址获取与之相对应的DMA内存地址的原理相同,此处不再赘述。
可见,在本发明实施例中,通过接收主机发送的查询命令,获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址,并向所述主机发送返回报文,使主机获得与DMA内存地址相对应的DMA虚拟地址,从而可以发送包含所述DMA虚拟地址的DMA操作启动请求,指示I/O设备对所述DMA虚拟地址所对应的DMA内存地址发起DMA操作。或者,通过获取主机向I/O设备发送的DMA操作启动请求,将所述DMA操作启动请求的目标主机的DMA内存地址修改为与之相对应的全局虚拟地址空间上的DMA虚拟地址;将所述修改后的DMA操作启动请求发送给I/O设备,从而使主机所发送的DMA操作启动请求可以用于指示I/O设备对所述DMA虚拟地址所对应的DMA内存地址发起DMA虚拟地址。
结合图7,是本发明实施例提供的第三种数据传输方法的流程示意图。本实施例将结合第一种实施例和第二种实施例进行说明,本实施例的方法包含了第一种实施例中的S401、S402、S403步骤,并可以包含第二种实施例中S601-S606步骤,因此与所述步奏相同或相似的描述,在本实施例中不再赘述。
本实施例可以实现对I/O设备发送的用于对目的主机进行DMA操作的DMA报文进行权限控制。即当数据传输设备接收到DMA报文后,会判断所述DMA报文对目的主机的的DMA操作是否符合权限要求,当所述DMA报文具有对目的主机的DMA操作的权限时,才对所述DMA报文的DMA地址进行修改。
结合图7,在本实施例的一种实现方式中,所述方法还包括:
S701、确定所述DMA虚拟地址对应的DMA内存地址和目标主机;
S702、根据所述DMA报文的权限信息和所述目标主机的权限要求确定对所述目标主机进行的DMA操作符合权限要求;
S703、如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
判断对目标主机进行的DMA操作是否符合权限要求可以通过多种方式实现,例如,可以通过查询单独的主机的标识和对应DMA操作类型的权限表来判断是否符合权限要求;或者,当前述的对应关系存储在地址转换表中,可以通过查询地址转换表来判断是否符合权限要求,所述地址转换表相比于前述地址转换表,增加操作类型一项。根据DMA虚拟地址定位到所述地址转换表中的表项时,可以获得对该DMA虚拟地址所在虚拟地址区间所对应的目的主机可进行的DMA操作类型。
在本实施例的另一种实现方式中,包括以下信息中的至少一种:所述DMA报文的类型、所述DMA报文的权限标识和发送所述DMA报文的主机的标识。
本实现方式中,在判断DMA操作是否具有权限时,增加了权限标识作为考虑因素。权限标识是是指用于识别所在报文与DMA操作权限相关的特征的标识。权限标识可以为一般DMA报文中已经存在的信息,例如,权限标识可以指发送所述DMA报文的I/O设备的识别ID,通过对权限标识的判断,可以实现特定的I/O设备具有权限对特定的主机进行特定的DMA操作;权限标识也可以是新增加的一般DMA报文中并不存在的信息,例如,权限标识可以是对DMA操作所要传输的数据种类的识别ID,从而I/O设备可以将实现特定的数据种类通过DMA方式与特定的主机进行传输,或者,权限标识可以是指示I/O设备发起DMA操作的主机的识别ID,从而实现特定的主机具有权限发起I/O设备对某一特定主机进行DMA操作。可以理解的是,权限标识可以如上述列举的为某一单一信息的识别ID,也可以是几种信息组合后的识别ID,例如,权限标识可以用于识别某一特定I/O设备发送的传输某一特定数据种类的DMA报文。
类似的,判断对目标主机进行的DMA操作是否符合权限要求可以通过多种方式实现,例如,可以通过查询单独的包含主机ID、权限标识和对应DMA操作类型的权限表来判断是否符合权限要求;或者,查询地址转换表来判断是否符合权限要求,所述地址转换表相比于前述地址转换表,增加操作类型以及权限标识两项内容。
结合图8,现列举一种在地址转换表中增加操作类型以及权限标识以后,对报文进行权限控制的例子:数据传输设备获取到I/O设备发送的DMA报文802,DMA报文802的DMA地址为DMA虚拟地址0xabcd,识别ID为0001。根据DMA虚拟地址,可以定位所述DMA虚拟地址所对应的虚拟地址区间的起始地址为0xa000,空间大小为1G,所对应的主机的内存区间为主机1的起始地址为0x0,大小为1G的内存空间。而根据识别ID0001,可知该识别ID对主机1的DMA操作权限为R,即识别ID为0001的DMA报文只可以对主机1的DMA内存区间发起读操作。因此,当DMA报文802的操作类型为写操作时,符合权限要求,数据传输设备将DMA报文802的DMA地址进行修改,并发送给主机1。
可见,在本实施例中,通过对DMA报文进行权限判断,可以实现对I/O设备对主机进行DMA操作时的权限控制。由于I/O设备同时与多个主机相连接,通过权限控制,可以提高整个网络数据传输的可靠性和安全性。此外,通过权限控制,还可以拓展网络使用的场景,实现更加复杂的网络部署和传输方式。
结合图9,是本发明实施例提供的第四种数据传输方法的流程示意图。本实施例将结合第一种、第二种以及第三种实施例进行说明,在本实施例中出现的前述实施例中已经出现,且含义相同或相近似的概念或者术语,在本实施例中不再进行赘述。本实施例的方法与前述实施例中方法的部分步骤相对应,因此,可以结合前述实施例中的相关步骤对本实施例进行理解和拓展。
本实施例所提供的数据传输方法的执行主体是图2所描述的网络拓扑中的主机,代表一个独立的物理主机,运行独立的OS,拥有独立的DMA地址空间。本方法用以实现主机指示I/O设备向目标主机进行DMA操作,所述方法包括如下步骤:
S901、获取目标主机的DMA地址信息;
目标主机是指执行本方法的主机所要指示I/O设备进行DMA操作的目标主机,即I/O设备进行DMA操作所发送的DMA报文中DMA虚拟地址所对应的DMA内存地址所在的主机。在一种可能的场景下,目标主机即为执行方法的主机本身,则主机指示I/O设备向所述主机发起DMA操作,从而实现主机与I/O设备之间的数据交换;在另一种可能的场景下,目标主机为与同一I/O设备相连接的本方法执行主机之外的其他主机,则主机指示I/O设备向其他主机发起DMA操作,从而实现I/O设备与其他主机之间进行数据交换。
DMA地址信息可以为目标主机的DMA内存地址信息,也可以为DMA虚拟地址信息。当目标主机为本方法执行主机时,通过分配DMA内存地址区间,即可获取DMA内存地址信息;当目标主机为其他主机时,可以通过在地址转换表中查询得到目标主机的DMA内存地址或者DMA虚拟地址,也可以通过接收有其他设备发送的请求指令中所包含的DMA内存地址或者DMA虚拟地址获得。
S902、根据所述目标主机的DMA地址信息,发送DMA操作启动请求,所述DMA操作启动请求包含DMA地址,用以指示所述I/O设备对在全局虚拟地址空间上的DMA虚拟地址进行DMA操作,所述DMA虚拟地址为目标主机的DMA内存地址映射到全局虚拟地址空间上的DMA虚拟地址。
正如背景技术中所介绍,I/O设备进行DMA操作可以由DMA操作启动请求所发起。在现有技术中,由于一个I/O设备只能与一个主机相连接进行DMA操作,因此,当主机需要与I/O设备进行数据交换时,可以向I/O设备发送DMA操作启动请求,DMA操作启动请求中包含用以I/O设备读取的数据所在内存地址或者用以存储I/O设备所发送的数据的内存地址。I/O设备接收DMA操作启动请求后,即向所述内存地址发起DMA操作,将数据读取或者写入,从而完成数据交换。在本发明中,由于多台主机同时与I/O设备相连,并可以进行DMA操作,因此,DMA操作启动请求不但可以用于指示I/O设备与本机进行DMA操作,还可以指示I/O设备与其他主机进行DMA操作。在分布式共享I/O设备的场景下,主机可以通过本实施例进行主机与I/O设备、以及主机与主机之间的DMA方式的数据交换。
当DMA地址信息包括目标主机的DMA内存地址时,在一种实现方式中,所述根据所述目标主机的DMA地址信息,发送DMA操作启动请求包括将所述DMA操作启动请求发送给所述数据传输设备,所述DMA操作启动请求的DMA地址为所述目标主机的DMA内存地址,用以指示数据传输设备将所述DMA操作启动请求中的DMA地址由目标主机的DMA内存地址修改为与之相对应的全局虚拟地址空间上的DMA虚拟地址,并将所述DMA操作启动请求转发给目标主机。。
结合前述第二种实施例中的步骤,在这种实现方式中,主机将DMA内存地址作为DMA操作启动请求所指示的DMA操作的DMA地址。由于I/O设备的进行DMA操作所发送DMA报文需要为DMA虚拟地址,因此,将所述DMA操作启动请求发送给数据传输设备,由数据传输设备将所述DMA操作启动请求中的DMA内存地址转化为与之相对应的DMA虚拟地址,并将转换后的DMA操作启动请求发送给I/O设备。
当DMA地址信息包括目标主机的DMA内存地址时,在另一种实现方式中,所述根据所述目标主机的DMA地址信息,发送DMA操作启动请求包括:所述根据所述目标主机的DMA地址信息,发送DMA操作启动请求包括:根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址,将所述DMA操作启动请求发送给I/O设备,所述DMA操作启动请求的DMA地址为所述DMA虚拟地址。
根据目标主机的内存地址,在地址转换表中进行查询获得与之相对应的虚拟地址,可以结合前述实施例中提供给的查询方法进行理解。具体的,例如,当目标主机的内存地址为0x0bcd时,在地址转换表中查询,可得到该内存地址所在内存地址区间为起始地址为0x0,大小为1G的内存地址空间,与之相对应的虚拟地址区间的起始地址为0xa000,因此,所述内存地址所对应的虚拟地址应为0xabcd。
当DMA操作启动请求发送给I/O设备,可以是直接将DMA操作启动请求发送到与之相连接的I/O设备上;或者通过其他设备,包括数据传输设备进行转发,将DMA操作启动请求发送到与之间接连接的I/O设备上。
当DMA地址信息包括目标主机的DMA虚拟地址,在一种实现方式中,所述根据所述目标主机的DMA地址信息,发送DMA操作启动请求包括:将所述DMA操作启动请求发送给I/O设备,所述DMA操作的DMA地址为所述目标主机的DMA内存地址所对应的全局虚拟地址空间上的DMA虚拟地址。
同样的,当DMA操作启动请求发送给I/O设备,可以是直接将DMA操作启动请求发送到与之相连接的I/O设备上;或者通过其他设备,包括数据传输设备进行转发,将DMA操作启动请求发送到与之间接连接的I/O设备上。
在本实施例的一种实现方式中,主机分配DMA内存地址,所述DMA内存地址用于一个或多个I/O设备通过直接内存访问DMA的方式访问所述DMA内存地址,并发送注册信息,所述注册信息包含主机的识别ID和主机的DMA内存地址。主机可以在接入网络或者重新分配了内存地址区间后发送注册信息,可以将注册信息发送给数据传输设备,或者发送给管理系统所在主机,用以更新数据传输设备或者其他主机所存储的对应关系。
在另一种实现方式中主机分配DMA内存地址区间,所述DMA内存地址区间由DMA内存地址组成,所述DMA内存地址用于一个或多个I/O设备通过直接内存访问DMA的方式访问所述DMA内存地址。并发送注册信息,所述注册信息包含主机的识别ID和主机的DMA内存地址区间。主机可以在接入网络或者重新分配了内存地址区间后发送注册信息,可以将注册信息发送给数据传输设备,或者发送给管理系统所在主机,用以更新数据传输设备或者其他主机所存储的对应关系
在本实施例的另一种实现方式中,主机还可以更新存储于本地的地址转换表,从而保持本地的地址转换表与数据传输设备的地址转换表同步。所述方法还包括:获取更新信息,所述更新信息包括需要更新的DMA虚拟地址、DMA内存地址和主机之间的对应关系;根据所述更新信息,将需要更新的DMA虚拟地址、DMA内存地址和主机之间的对应关系添加或更新到已经存在的DMA虚拟地址、DMA内存地址和主机之间的对应关系中。
根据对应关系的具体实现形式不同,更新信息中主机的DMA内存地址区间与虚拟地址区间的对应关系的具体表现形式应当与之对应。具体地址转换表的实现形式可以参考第一种实施例中所列举的方式。更新信息可以来自数据传输设备,也可以来自网络中的其他设备,如管理系统所在的主机,或者其他与主机相连接的主机。
可见,在本发明实施例中,通过获取目标主机的DMA地址信息,并根据所述目标主机的DMA地址信息,发送DMA操作启动请求,从而使I/O设备对目标主机发起DMA操作。在多主机共享I/O设备的环境下,可以对I/O设备与目标主机之间的数据传输进行管理。当I/O设备作为数据存储设备时,还可实现主机与目标主机之间通过I/O设备进行快速的数据同步,从而提高网络传输效率。
此外,通过发送更新信息,或者通过获取对应关系的更新信息,可以实现当网络拓扑发生变化,或者主机的DMA内存地址发送变化后,及时对对应关系进行更新,并将更新信息与其他设备同步。
结合图10,是本发明实施例提供的一种数据传输设备1001的结构示意图。本实施例中提供的数据传输设备可用于执行前述实施例中第一种、第二种以及第三种实施例的方法。因此,可以结合前述实施例对本实施例进行理解,在本实施例中出现的前述实施例中已经出现,且含义相同或相近似的概念或者术语,在本实施例中不再进行赘述。
本数据传输设备在图2所述的网络拓扑结构中作为数据传输设备。本设备可以为一个独立的设备,分别于主机以及I/O设备相连接;也可以是集成在I/O设备上的模块,或者是集成在某一主机上,与其他主机和I/O设备相连的模块,即只要满足在网络拓扑中与主机和I/O设法相连接即可。本设备可以通过高速总线,如PCIe总线与主机以及I/O设备连接,对于与设备相连接的主机而言,枚举到的是一个虚拟的PCIe设备,这个虚拟PCIe设备的硬件资源对应到共享的PCIe I/O设备。
数据传输设备1001分别与所述多个主机和所述一个或多个输入/输出I/O设备相连接,所述多个主机共享一个或多个I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上,所述设备包括:
接收模块1002,用于获取I/O设备发送的DMA报文,所述DMA报文中携带DMA虚拟地址,所述DMA虚拟地址为在所述全局虚拟地址空间上的虚拟地址;
转换模块1003,用于根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,其中,所述DMA内存地址为映射到所述DMA虚拟地址上的DMA内存地址,所述目标主机为映射到所述DMA虚拟地址的所述DMA内存地址所在的主机;以及将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;
发送模块1004,将修改后的所述DMA报文向所述目标主机发送。
在一种实施方式下,转换模块所述根据所述DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机时,所述DMA虚拟地址、DMA内存地址和主机之间的对应关系包括:所述多个主机各自的DMA内存地址组成多个DMA内存地址区间,每个主机对应一个或多个DMA内存地址区间;所述全局虚拟地址空间包含不重叠的多个虚拟地址区间,所述多个虚拟地址区间与所述多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应。
所述的所述DMA虚拟地址、DMA内存地址和主机之间的对应关系可以通过地址转换表来进行存储。地址转换表即为前述方法实施例中所描述的地址转换表,地址转换表可以存储在所述数据传输设备的内存或者寄存器中,由转换模块1003读取后进行查询;当数据传输设备不是网络拓扑中的一个独立节点,侧所述地址转换表也可以存储在所述数据传输设备所在的主机或者I/O设备的内存或寄存器中,并通过转换模块1003进行赌气和查询。
地址转换表可以通过预先人工进行设定,或者通过位于网络中的其他设备进行同步从而获得地址转换表。在另一种实现方式中,所述接收模块还用于,获取所述多个主机中的一个或多个主机的注册信息,所述注册信息包含相应主机的标识ID和DMA内存地址;所述设备还包括虚拟地址维护模块,用于根据所述主机的DMA内存地址,为所述主机分配虚拟地址,所述虚拟地址位于全局虚拟地址空间上,所述虚拟地址与所述主机的DMA内存地址一一对应;以及将所述主机ID、以及所述主机的DMA内存地址和所述虚拟地址对应关系添加或更新到所述DMA虚拟地址、DMA内存地址和主机之间的对应关系中。
在另一种实现方式中,所述接收模块还用于,获取所述多个主机中的一个或多个主机的注册信息,所述注册信息包含相应主机的标识ID和DMA内存地址区间;所述设备还包括虚拟地址维护模块,用于根据所述主机的一个或多个DMA内存地址区间,为所述主机分配一个或多个虚拟地址区间,所述虚拟地址区间位于全局虚拟地址空间上,所述一个或多个虚拟地址区间与所述主机的一个或多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应;以及将所述主机ID、以及所述主机的DMA内存地址区间和所述虚拟地址区间的对应关系添加或更新到所述DMA虚拟地址、DMA内存地址和主机之间的对应关系中。
主机的注册信息可以有主机在接入网络后,由主机发送给本方法的执行主体设备,或者可以通过管理系统将接入网络的主机的注册信息发送给本方法的执行主体设备。主机的内存地址区间可以是通过内存地址的起始地址和区间大小来表示,也可以通过具体的连续或非连续的地址或地址区间的集合来表示。为主机分配虚拟地址区间,即根据主机的内存地址区间大小,分配与之相应大小的虚拟地址区间,并将虚拟地址区间添加到全局虚拟地址空间上,或者用所述虚拟地址区间替换所属主机在全局虚拟地址空间上已存在的虚拟地址区间。可以理解的,在分配虚拟地址区间时,应当保证虚拟地址区间与主机的内存地址区间为一一对应关系。
在一种实施例中,可以将所述对应关系向主机进行同步更新:所述发送模块还用于,当所述DMA虚拟地址、DMA内存地址和主机之间的对应关系发生更新后,向主机发送更新信息,用以指示所述主机同步更新存储在所述主机的所述DMA虚拟地址、DMA内存地址和主机之间的对应关系。更新信息可以是对应关系中发生变化的部分信息,此种更新信息可用于已经存储了更新前的对应关系的设备的同步更新;或者,可以是完整的地址转换表。可以理解的,更新信息可以在地址转换表更新后主动发送给主机,也可以接收主机发送的查询命令后,判断地址转换表是否发生更新,若发生更新则向主机发送更新信息。可以向全部主机发送所述更新信息,也可以向部分特定主机发送,或者向管理系统所在主机发送。
结合图11,列举本实施例一种具体的实现方式。数据传输设备1108通过PCIe桥1102接收I/O设备发送的DMA报文1101,DMA报文1101的DMA地址为虚拟地址。PCIe桥将DMA报文1101传送给DMA地址转换逻辑模块1103,DMA地址转换逻辑模块包含处理芯片1104和寄存器1105,处理芯片1104访问寄存器1105中存储的地址转换表1106,根据DMA报文1101的DMA虚拟地址,得到与所述虚拟地址相对应的DMA内存地址,并将DMA报文1101的DMA地址由所述虚拟地址修改为所述内存地址,得到修改后的DMA报文1107。DMA地址转换逻辑模块1103将所述修改后的DMA报文1107传送给PCIeDMA引擎1108,由PCIeDMA引擎1108将所述DMA报文1101发送给目标主机,从而使I/O设备向目标主机发起DMA操作,在本实现方式中,PCIe桥和PCIeDMA引擎可实现前述实施例的接收模块和发送模块。
可见,在本实施例中,网络传输设备1001通过获取I/O设备发送的DMA报文,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址,并将所述修改后的DMA报文发送给所述目标主机,I/O设备可以通过包含DMA虚拟地址的DMA报文,实现对多个主机进行DMA操作。由于DMA虚拟地址位于同一个全局虚拟地址空间上,因此相对于现有技术,不会发送DMA内存地址冲突。由于多个主机与I/O设备之间可以同时进行数据传输,因此主机间的数据传输可以通过I/O设备的DMA操作实现,而不需主机间进行网络传输。由于主机与I/O设备的链接总线具有高带宽和低延时的特点,且无需主机CPU进行干预,因此提高了网络传输的及时性和高效性,拓展了网络应用的场景。
此外,在本发明实施例中,通过当所述对应关系发生更新后,向主机发送更新信息,可以实现主机中的地址转换表与数据传输设备中的对应关系同步更新。因此,主机可以独立进行DMA虚拟地址和与之相对应的DMA内存地址之间的相互转化,从而扩展了本发明的应用场景。
在一种实施例中,所述网络传输设备还可以反馈主机所发送的查询命令:所述接收模块还用于,接收主机发送的查询命令,将所述查询命令传输到虚拟地址查询模块,所述查询命令中包含需要查询的目标主机的DMA内存地址;
所述设备还包括虚拟地址查询模块,用于获取从接收模块传输的查询命令,根据所述目标主机的DMA内存地址查询与之相对应的全局虚拟地址空间上的DMA虚拟地址,将所述全局虚拟地址空间上的DMA虚拟地址传输到发送模块;
所述发送模块还用于,获取所述虚拟地址查询模块传输的所述全局虚拟地址空间上的DMA虚拟地址,向所述主机发送返回报文,所述返回报文中包含所述全局虚拟地址空间上的DMA虚拟地址。
获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址有多种实现方式,获取方式与前述通过DMA虚拟地址获取与之相对应的DMA内存地址的原理相同,此处不再赘述。
在一种实施例中,所述网络传输设备还可实现对主机发送的DMA操作启动请求进行修改和转发:
所述接收模块还用于,获取任意一个主机向I/O设备发送的DMA操作启动请求,所述DMA操作启动请求包含另一主机的DMA内存地址,所述DMA操作启动请求用于指示所述I/O设备向所述另一主机进行DMA操作;
所述转换模块还用于,根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定与所述DMA操作启动请求中的所述DMA内存地址对应的所述全局虚拟地址空间上的DMA虚拟地址;以及将所述DMA操作启动请求中的所述DMA内存地址修改为确定的所述DMA虚拟地址
所述发送模块还用于,将所述修改后的DMA操作启动请求向所述I/O设备设备。
同样的,获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址有多种实现方式,获取方式与前述通过DMA虚拟地址获取与之相对应的DMA内存地址的原理相同,此处不再赘述。
可见,在本发明实施例中,数据传输通过接收主机发送的查询命令,获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址,并向所述主机发送返回报文,使主机获得与DMA内存地址相对应的DMA虚拟地址,从而可以发送包含所述DMA虚拟地址的DMA操作启动请求,指示I/O设备对所述DMA虚拟地址所对应的DMA内存地址发起DMA操作。或者,通过获取主机向I/O设备发送的DMA操作启动请求,将所述DMA操作启动请求的目标主机的DMA内存地址修改为与之相对应的全局虚拟地址空间上的DMA虚拟地址;将所述修改后的DMA操作启动请求发送给I/O设备,从而使主机所发送的DMA操作启动请求可以用于指示I/O设备对所述DMA虚拟地址所对应的DMA内存地址发起DMA虚拟地址。
在一种实施例中,所述网络传输设备还可以实现对DMA报文的权限控制。在一种具体的实施方式,所述转换模块还用于,确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的操作类型和所述目标主机的权限要求确定对所述目标主机进行的DMA操作符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
判断对目标主机进行的DMA操作是否符合权限要求可以通过多种方式实现,例如,可以通过查询单独的包含主机ID和对应DMA操作类型的权限表来判断是否符合权限要求;或者,查询地址转换表来判断是否符合权限要求,所述地址转换表相比于前述地址转换表,增加操作类型一项。根据DMA虚拟地址定位到所述地址转换表中的表项时,可以获得对该DMA虚拟地址所在虚拟地址区间所对应的目的主机可进行的DMA操作类型。
在另一种具体的实施方式中,所述DMA报文还包含所述权限标识;所述转换模块还用于,确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的操作类型、所述权限标识和所述目标主机的权限要求确定所述包含所述权限标识的DMA报文对所述目标主机进行的所述DMA操作是否符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
本实现方式中,在判断DMA操作是否具有权限时,增加了权限标识作为考虑因素。权限标识是是指用于识别所在报文与DMA操作权限相关的特征的标识。权限标识可以为一般DMA报文中已经存在的信息,例如,权限标识可以指发送所述DMA报文的I/O设备的识别ID,通过对权限标识的判断,可以实现特定的I/O设备具有权限对特定的主机进行特定的DMA操作;权限标识也可以是新增加的一般DMA报文中并不存在的信息,例如,权限标识可以是对DMA操作所要传输的数据种类的识别ID,从而I/O设备可以将实现特定的数据种类通过DMA方式与特定的主机进行传输,或者,权限标识可以是指示I/O设备发起DMA操作的主机的识别ID,从而实现特定的主机具有权限发起I/O设备对某一特定主机进行DMA操作。可以理解的是,权限标识可以如上述列举的为某一单一信息的识别ID,也可以是几种信息组合后的识别ID,例如,权限标识可以用于识别某一特定I/O设备发送的传输某一特定数据种类的DMA报文。
可见,在本实施例中,通过对DMA报文进行权限判断,可以实现对I/O设备对主机进行DMA操作时的权限控制。由于I/O设备同时与多个主机相连接,通过权限控制,可以提高整个网络数据传输的可靠性和安全性。此外,通过权限控制,还可以拓展网络使用的场景,实现更加复杂的网络部署和传输方式。
本发明提供一种数据传输系统的实施例。本实施例中提供的数据传输系统包含可以执行前述第一种、第二种、第三种以及第四种方法实施例的设备因此,可以结合前述实施例对本实施例进行理解,在本实施例中出现的前述实施例中已经出现,且含义相同或相近似的概念或者术语,在本实施例中不再进行赘述。
在本实施例中,所述系统包括至少一个主机,所述计算机系统包括多个主机、一个或多个输入/输出I/O设备、以及分别与所述多个主机和所述一个或多个I/O设备连接的数据传输设备。
其中,所述数据传输设备用于将所述多个主机的DMA内存地址一一映射到全局虚拟地址空间的虚拟地址上;所述数据传输设备还用于获取I/O设备发送的携带有DMA虚拟地址的DMA报文,所述DMA虚拟地址为在所述全局虚拟地址空间上的虚拟地址;根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,所述DMA内存地址为映射到所述DMA虚拟地址上的DMA内存地址,所述目标主机为所述DMA内存地址所在的主机;将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;以及将修改后的所述DMA报文向所述目标主机发送。
在一种实现方式下,所述DMA虚拟地址、DMA内存地址和主机之间的对应关系包括:所述多个主机各自的DMA内存地址组成多个DMA内存地址区间,每个主机对应一个或多个DMA内存地址区间;所述全局虚拟地址空间包含不重叠的多个虚拟地址区间,所述多个虚拟地址区间与所述多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应;所述确定所述DMA虚拟地址对应的DMA内存地址和目标主机包括:根据所述DMA虚拟地址所述的虚拟地址区间确定与所述虚拟地址区间对应的DMA内存地址区间;根据所述DMA内存地址区间确定与所述DMA内存地址区间对应的主机以及与在所述DMA内存地址区间中映射到所述DMA虚拟地址的DMA内存地址。
本系统可以实现一个主机指示I/O设备向另一主机发起DMA操作,在一种实现方式中,所述多个主机包括第一主机和第二主机,所述第一主机用于获取所述第二主机的DMA虚拟地址,以及将所述第二主机的DMA内存地址所对应的DMA虚拟地址作为DMA地址,向所述I/O设备发送DMA操作启动请求,所述DMA操作启动请求用于指示I/O设备向所述第二主机进行DMA操作。
在本实现方式中,第一主机可以获取所述第二主机的DMA虚拟地址,可以是接收第二主机所发送的数据传输请求;或者,可以是由管理系统所在的主机发送的数据传输请求;或者,可以是第一主机通过查询地址转换表获得第二主机的虚拟地址区间,从而得到第二主机的DMA虚拟地址。第一主机向I/O设备发送DMA操作启动请求,当I/O设备与主机直接相连接时,可以直接发送所述DMA操作启动请求;当I/O设备与主机通过数据传输设备间接相连接时,可以通过数据传输设备将所述DMA操作启动请求转发给所述I/O设备。
在一种实现方式中,所述多个主机包括第一主机和第二主机,所述第一主机用于获取所述第二主机的DMA虚拟地址,以及将所述第二主机的DMA内存地址所对应的DMA虚拟地址作为DMA地址,向I/O设备发送DMA操作启动请求,所述DMA操作启动请求用于指示所述I/O设备向所述第二主机进行DMA操作。
或者,所述多个主机包括第一主机和第二主机,所述第一主机用于获取所述第二主机的DMA内存地址,以及根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取与所述目标主机的DMA内存地址相对应的全局虚拟地址空间上的DMA虚拟地址,将所述DMA操作启动请求发送给I/O设备,所述DMA操作启动请求的DMA地址为所述DMA虚拟地址。
本实现方式中,类似的,第一主机可以获取所述第二主机的DMA内存地址,可以是接收第二主机所发送的数据传输请求;或者,可以是由管理系统所在的主机发送的数据传输请求;或者,可以是第一主机通过查询地址转换表获得第二主机的内存地址区间,从而得到第二主机的DMA内存地址。第一主机向数据传输设备发送DMA操作启动请求,数据传输设备在获取所述DMA操作启动请求后,可以参考第一种方法实施例的方法,将DMA操作启动请求中的DMA内存地址转换为与之相对应的DMA虚拟地址,并将修改后的DMA操作启动请求发送给I/O设备。
在分布式系统中,多个主机共享I/O设备,并可以将I/O设备作为数据存储设备。当主机之间需要进行数据交换是,可以通过本实施例中的数据传输系统,通过DMA方式快速进行数据交换。结合图12,是本发明实施例的一种具体的实现方式:
在分布式文件系统场景中,主机1作为分布式文件系统主节点,存储文件系统元数据信息,主机2为普通主分布式文件系统节点。主机2请求主机1上的数据信息,进行本地文件系统信息的同步。该流程如下,如图7所示:
S1201、主机1和主机2共享I/O设备,主机2分配接收数据缓存空间,通过DMA地址转换表,获取全局虚拟地址空间的DMA虚拟地址区间。
S1202、主机2发起请求获取主机1上的数据,同时主机2发送DMA虚拟地址区间上的DMA虚拟地址给主机1。
S1203、主机1接收到请求并确认,在本地生成DMA操作启动请求,DMA操作启动请求的DMA地址为主机2虚拟地址区间上的DMA虚拟地址,并就DMA操作启动请求发送给I/O设备。
S1204、I/O设备接收到DMA操作启动请求后,对发起DMA操作,即发送DMA报文,所述报文的DMA地址为DMA虚拟地址。
S1205、数据传输设备获取DMA操作启动请求,根据DMA地址转换表确定DMA报文的目的主机为主机2,同时将DMA报文的DMA地址修改为为主机2的DMA内存地址。
S1206、数据传输设备把DMA报文发送给主机2,DMA报文访问主机2内存地址,I/O设备向主机2发起DMA操作。
在一种实现方式中,结合前述第三种方法实施例,本实施例还可以实现对DMA报文的权限控制。所述数据传输设备所包含的转换模块还用于,所述数据传输设备还用于,确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的操作类型和所述目标主机的权限要求确定对所述目标主机进行的DMA操作符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。或者,所述DMA报文还包含所述权限标识,所述数据传输设备还用于,确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的操作类型、所述权限标识和所述目标主机的权限要求确定所述包含所述权限标识的DMA报文对所述目标主机进行的所述DMA操作是否符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
可见,在本实施例中,在整一个交互过程中,主机之间仅进行了简单的信息交互,传递目标DMA地址信息,所有需要传输的数据都通过I/O设备和主机间的DMA方式进行了传输,同时由于I/O设备与主机之间总线的高带宽,低延时,这种方式下,数据传输性能得到了显著的提升。不仅省略了数据在主机间网络上的拷贝,同时DMA操作无需CPU介入,使得主机1和主机2的CPU性能在整个数据拷贝过程中得到了释放。
此外,通过对DMA报文的权限控制,可以只对符合权限的DMA报文进行转发,进而只有复核权限的DMA操作才能对第二主机发起。由此提高了DMA操作的安全性,且可以由此实现对DMA操作的过滤,拓展网络使用的场景,实现更加复杂的网络部署和传输方式。
本发明提供另一种数据传输系统的实施例。本实施例中提供的数据传输系统包含可以执行前述第一种、第二种、第三种以及第四种方法实施例的设备因此,可以结合前述实施例对本实施例进行理解,在本实施例中出现的前述实施例中已经出现,且含义相同或相近似的概念或者术语,在本实施例中不再进行赘述。
本实施例应用与在分布式协作的环境下,不同的主机需要访问位于公共I/O设备的热点数据,且这些数据需要在多个主机间实时同步。所述至少一个主机包括第一主机,所述第一主机用于当I/O设备中的数据更新后,向I/O设备发送至少一条DMA写操作命令,所述DMA操作启动请求用以指示I/O设备向除第一主机以外的其他主机进行DMA写操作,从而将数据同步到其他主机。
所述多个主机包括第一主机,所述第一主机用于当I/O设备中的数据更新后,向I/O设备发送至少一条DMA写操作命令,所述DMA操作启动请求用以指示I/O设备向除第一主机以外的其他主机进行DMA写操作,从而将数据同步到其他主机
I/O设备的数据更新可以参考前述实施例中的方法,I/O设备将位于主机DMA内存地址上的数据通过DMA读操作读取到I/O设备上,从而实现数据的更新。在一种具体的实现方式中,当I/O设备进行数据更新时,将需要更新的数据区域上锁,直到数据更新过程完毕后进行解锁,从而防止其他主机在更新过程中访问所述数据。
在一种实现方式中,所述数据传输系统中包含管理系统,管理系统位于所述第一主机上,用于负责热点数据在主机之间的同步管理。结合图13,在可列举的一种实施方式中,第二主机对I/O设备的热点数据进行更新,并在更新后将更新后的热点数据同步到其他主机上,所述数据同步过程包含如下步骤:
S1301,第二主机向第一主机发送数据同步请求,所述数据同步请求包含第二主机所要更新的数据所在的DMA内存地址。
S1302,位于第一主机上的管理系统接收到第二主机所发送的数据请求后,将I/O设备上要更新的热点数据区域进行上锁,并将上锁状态更新到其他主机上,其他主机暂时无法访问上锁热点数据。此外,管理系统通过查询地址转换表,获得与第二主机的DMA内存地址相对应的DMA虚拟地址,并向I/O设备发送DMA读操作命令,所述DMA读操作命令的DMA地址为所述DMA虚拟地址,用以指示I/O设备向第二主机发起DMA读操作。
S1303,I/O设备接收到所述DMA读操作命令,发送DMA报文,所述DMA报文的操作类型为读操作,DMA地址为第二主机的DMA虚拟地址。
S1304,DMA地址转换设备将所述DMA度操作命令的DMA地址修改为第二主机的DMA内存地址,并将修改后的DMA报文发送给第二主机,从而使I/O设备向第二主机的DMA内存地址发起DMA读操作,将热点数据更新到I/O设备上。
S1305,当DMA读操作完成后,第二主机通知第一主机上的管理系统,管理系统将I/O上的热点数据解锁。
S1306,第一主机上的管理系统向I/O设备发送至少一条DMA写操作命令,所述DMA操作启动请求用以指示I/O设备向除第一主机以外的其他主机进行DMA写操作。
S1307,I/O设备根据DMA写操作命令,分别发送DMA报文,所述DMA报文的DMA地址为其他主机的DMA虚拟地址,所述报文的操作类型为写操作,用于向其他主机发起DMA写操作。
S1308,数据传输设备获取所述的DMA报文,将DMA报文的DMA地址修改为其他主机的DMA内存地址,并分别发送给其他主机,使I/O设备分别向其他主机发送DMA写操作,从而将跟新后的热点数据写入其他主机。
在一种实现方式中,类似于上一种实现方式,也可以实现对DMA报文的权限控制,实现的具体方式不再赘述。对DMA报文的权限控制在具体的实现中,由于权限标识可能指代的多种类型的信息,因此,可以实现多种具体的权限控制方式,例如:可以是对特定的主机,只有特定的I/O设备可以进行DMA读和/或写;或者,对于特定的主机,只有特定类型的数据可以通过DMA方式进行读和/或写;或者,可以是对特定的主机,只有特定的主机或者管理系统所发起的DMA操作才能进行DMA读和/或写等。
可见,在本实施例中,管理系统可以主动去更新其他主机上的缓存数据,且通过DMA方式,比较现有技术的网络传输,提升了数据处理的性能。由于其他主机可以被动的更新本地的数据,即主机在未介入的情况下,本地缓存空间的数据得到实时更新,因而提升了整个网络的数据及时性以及可靠性。
此外,通过对DMA报文的权限控制,可以实现对DMA操作的筛选,提高整个网络数据传输的可靠性和安全性。此外,通过权限控制,还可以拓展网络使用的场景,实现更加复杂的网络部署和传输方式。
结合图14,本发明实施例还提供了一种数据传输设备1400,所述数据传输设备分别与所述多个主机和所述一个或多个输入/输出I/O设备相连接,所述多个主机共享一个或多个I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,装置的结构中包括处理器1401,所述处理器被配置为支持装置执行上述实施例中数据传输设备所执行的相应方法,装置的结构中还有发送器1402和接收器1403,用于实现发送或者接收上述实施例中数据传输设备与其他设备交互的指令或者信息。所述装置还可以包括存储器,所述存储器用于与处理器耦合,其保存必要的程序指令和数据。
结合图15,本发明实施例还提供了一种计算机装置1500,所述计算机系装置与所述的数据传输设备相连接,从而与其他多个计算机装置共享一个或多个I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,装置的结构中包括处理器1501,所述处理器被配置为支持装置执行上述实施例中主机所执行的相应方法,装置的结构中还有发送器1502和接收器1503,用于实现发送或者接收上述实施例中数据传输设备与其他设备交互的指令或者信息。所述装置还可以包括存储器,所述存储器用于与处理器耦合,其保存必要的程序指令和数据。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的数据传输方法、设备以及数据传输系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (25)

1.一种计算机系统,其特征在于,所述计算机系统包括多个主机、一个或多个输入/输出I/O设备、以及分别与所述多个主机和所述一个或多个I/O设备连接的数据传输设备,其中,
所述数据传输设备用于将所述多个主机的DMA内存地址一一映射到全局虚拟地址空间的虚拟地址上;
所述数据传输设备还用于获取I/O设备发送的携带有DMA虚拟地址的DMA报文,所述DMA虚拟地址为在所述全局虚拟地址空间上的虚拟地址;根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,所述DMA内存地址为映射到所述DMA虚拟地址上的DMA内存地址,所述目标主机为所述DMA内存地址所在的主机;将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;以及将修改后的所述DMA报文向所述目标主机发送。
2.根据权利要求1所述系统,其特征在于,
所述DMA虚拟地址、DMA内存地址和主机之间的对应关系包括:所述多个主机各自的DMA内存地址组成多个DMA内存地址区间,每个主机对应一个或多个DMA内存地址区间;所述全局虚拟地址空间包含不重叠的多个虚拟地址区间,所述多个虚拟地址区间与所述多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应;
所述确定所述DMA虚拟地址对应的DMA内存地址和目标主机,包括:根据所述DMA虚拟地址所属的虚拟地址区间确定与所述虚拟地址区间对应的DMA内存地址区间;根据所述DMA内存地址区间确定与所述DMA内存地址区间对应的主机以及在所述DMA内存地址区间中映射到所述DMA虚拟地址的DMA内存地址。
3.根据权利要求1所述系统,其特征在于,其中,
所述多个主机中的任意一个主机用于获取所述目标主机的DMA内存地址;向所述数据传输设备发送DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA内存地址;
所述数据传输设备用于接收所述DMA操作启动请求;根据DMA虚拟地址、DMA内存地址和主机之间的对应关系确定所述DMA操作启动请求中携带的所述DMA内存地址对应的DMA虚拟地址,并将所述DMA操作启动请求中携带的所述DMA内存地址修改为所述DMA虚拟地址;将修改后的所述DMA操作启动请求发送给所述I/O设备;
所述I/O设备用于接收所述数据传输设备发送的所述DMA操作启动请求,所述DMA操作启动请求用于指示所述I/O设备对所述目标主机发起DMA操作。
4.根据权利要求1所述系统,其特征在于,其中,
所述多个主机中的任意一个主机用于获取所述目标主机的DMA虚拟地址;向所述I/O设备发送DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA虚拟地址;
所述I/O设备用于接收所述任意一个主机发送的所述DMA操作启动请求,所述DMA操作启动命令用于指示所述I/O设备对所述目标主机发起DMA操作。
5.根据权利要求4所述系统,其特征在于,其中,
所述多个主机中的任意一个主机用于获取所述目标主机的DMA虚拟地址具体用于:
根据所述任意一个主机上存储的所述所述DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取所述目标主机所对应的DMA虚拟地址。
6.根据权利要求1-5中任一所述系统,其特征在于,
所述数据传输设备还用于,确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的权限信息和所述目标主机的权限要求确定对所述目标主机进行的DMA操作是否符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
7.根据权利要求6所述系统,其特征在于,所述DMA报文的权限信息包括以下信息中的至少一种:所述DMA报文的类型、所述DMA报文的权限标识和发送所述DMA报文的主机的标识。
8.一种数据传输方法,其特征在于,所述方法应用于多个主机共享一个或多个输入/输出I/O设备的计算机系统,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上,所述方法包括:
获取I/O设备发送的DMA报文,所述DMA报文中携带DMA虚拟地址,所述DMA虚拟地址为在所述全局虚拟地址空间上的虚拟地址;
根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,其中,所述DMA内存地址为映射到所述DMA虚拟地址上的DMA内存地址,所述目标主机为映射到所述DMA虚拟地址的所述DMA内存地址所在的主机;
将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;
将修改后的所述DMA报文向所述目标主机发送。
9.根据权利要求8所述方法,其特征在于,所述DMA虚拟地址、DMA内存地址和主机之间的对应关系包括:所述多个主机各自的DMA内存地址组成多个DMA内存地址区间,每个主机对应一个或多个DMA内存地址区间;所述全局虚拟地址空间包含不重叠的多个虚拟地址区间,所述多个虚拟地址区间与所述多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应;
所述根据所述DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,包括:
根据所述DMA虚拟地址所述的虚拟地址区间确定与所述虚拟地址区间对应的DMA内存地址区间;
根据所述DMA内存地址区间确定与所述DMA内存地址区间对应的主机以及与在所述DMA内存地址区间中映射到所述DMA虚拟地址的DMA内存地址。
10.根据权利要求8所述方法,其特征在于,所述方法还包括:确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的权限信息和所述目标主机的权限要求确定对所述目标主机进行的DMA操作是否符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
11.根据权利要求10所述方法,其特征在于,所述DMA报文的权限信息包括以下信息中的至少一种:所述DMA报文的类型、所述DMA报文的权限标识和发送所述DMA报文的主机的标识。
12.根据权利要求8-11中任意一项所述方法,其特征在于,所述方法还包括:接收DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA内存地址;根据DMA虚拟地址、DMA内存地址和主机之间的对应关系确定所述DMA操作启动请求中携带的所述DMA内存地址对应的DMA虚拟地址,并将所述DMA操作启动请求中携带的所述DMA内存地址修改为所述DMA虚拟地址;将修改后的所述DMA操作启动请求发送给所述I/O设备。
13.一种数据传输方法,其特征在于,所述方法应用于计算机系统中的任意一个主机,在所述计算机系统中,多个主机通过数据传输设备共享一个或多个输入/输出I/O设备;所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上,所述方法包括:
发送DMA操作启动请求,用以指示所述I/O设备对在全局虚拟地址空间上的DMA虚拟地址进行DMA操作,所述DMA虚拟地址为目标主机的DMA内存地址映射到全局虚拟地址空间上的DMA虚拟地址。
14.根据权利要求13所述方法,其特征在于,所述发送DMA操作启动请求具体包括:
获取所述目标主机的DMA内存地址;
向所述数据传输设备发送DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA内存地址,用以指示数据传输设备根据DMA虚拟地址、DMA内存地址和主机之间的对应关系确定所述DMA操作启动请求中携带的所述DMA内存地址对应的DMA虚拟地址,并将所述DMA操作启动请求中携带的所述DMA内存地址修改为所述DMA虚拟地址,以及将修改后的所述DMA操作启动请求发送给所述I/O设备。
15.根据权利要求13所述方法,其特征在于,所述发送DMA操作启动请求具体包括:
获取所述目标主机的DMA虚拟地址;向所述I/O设备发送DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA虚拟地址。
16.根据权利要求15所述方法,其特征在于,所述任意一个主机在获取所述目标主机的DMA虚拟地址方面具体用于:
根据所述任意一个主机上存储的所述所述DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取所述目标主机所对应的DMA虚拟地址。
17.一种数据传输设备,其特征在于,所述数据传输设备分别与多个主机和一个或多个输入/输出I/O设备相连接,所述多个主机共享一个或多个I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上,所述设备包括:
接收模块,用于获取I/O设备发送的DMA报文,所述DMA报文中携带DMA虚拟地址,所述DMA虚拟地址为在所述全局虚拟地址空间上的虚拟地址;
转换模块,用于根据DMA虚拟地址、DMA内存地址和主机之间的对应关系,确定所述DMA虚拟地址对应的DMA内存地址和目标主机,其中,所述DMA内存地址为映射到所述DMA虚拟地址上的DMA内存地址,所述目标主机为映射到所述DMA虚拟地址的所述DMA内存地址所在的主机;以及将所述DMA报文中的所述DMA虚拟地址修改为映射到所述DMA虚拟地址的所述DMA内存地址;
发送模块,将修改后的所述DMA报文向所述目标主机发送。
18.根据权利要求17所述设备,其特征在于,
所述DMA虚拟地址、DMA内存地址和主机之间的对应关系包括:所述多个主机各自的DMA内存地址组成多个DMA内存地址区间,每个主机对应一个或多个DMA内存地址区间;所述全局虚拟地址空间包含不重叠的多个虚拟地址区间,所述多个虚拟地址区间与所述多个DMA内存地址区间一一对应,且虚拟地址区间中的虚拟地址与对应的DMA内存地址区间中的DMA内存地址一一对应;
所述确定所述DMA虚拟地址对应的DMA内存地址和目标主机,包括:根据所述DMA虚拟地址所述的虚拟地址区间确定与所述虚拟地址区间对应的DMA内存地址区间;根据所述DMA内存地址区间确定与所述DMA内存地址区间对应的主机以及与在所述DMA内存地址区间中映射到所述DMA虚拟地址的DMA内存地址。
19.根据权利要求17所述设备,其特征在于,所述转换模块还用于,确定所述DMA虚拟地址对应的DMA内存地址和目标主机后,根据所述DMA报文的权限信息和所述目标主机的权限要求确定对所述目标主机进行的DMA操作是否符合权限要求,如果符合,将所述DMA报文的DMA虚拟地址修改为所述DMA操作的目标主机的DMA内存地址。
20.根据权利要求19中所述设备,其特征在于,所述DMA报文的权限信息包括以下信息中的至少一种:所述DMA报文的类型、所述DMA报文的权限标识和发送所述DMA报文的主机的标识。
21.根据权利要求19-20中任一所述设备,其特征在于,
所述接收模块还用于,接收DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA内存地址,所述DMA操作启动请求用于指示所述I/O设备向目标主机进行DMA操作;
所述转换模块还用于,根据DMA虚拟地址、DMA内存地址和主机之间的对应关系确定所述DMA操作启动请求中携带的所述DMA内存地址对应的DMA虚拟地址,并将所述DMA操作启动请求中携带的所述DMA内存地址修改为所述DMA虚拟地址;
所述发送模块还用于,将修改后的所述DMA操作启动请求发送给所述I/O设备。
22.一种数据传输设备,其特征在于,所述设备通过数据传输设备共享一个或多个输入/输出I/O设备,所述一个或多个I/O设备通过直接内存访问DMA的方式访问多个主机各自的DMA内存地址,所述DMA内存地址被一一映射到全局虚拟地址空间的虚拟地址上,所述设备包括:
DMA操作启动请求生成模块,用于生成DMA操作启动请求,所述DMA操作启动请求用以指示所述I/O设备对在全局虚拟地址空间上的DMA虚拟地址进行DMA操作,所述DMA虚拟地址为目标主机的DMA内存地址映射到全局虚拟地址空间上的DMA虚拟地址;
信息发送模块,用于发送所述DMA操作启动请求。
23.根据要求权利要求22所述设备,其特征在于,生成DMA操作启动请求时,所述DMA操作启动请求生成模块具体用于,
获取所述目标主机的DMA内存地址;向所述数据传输设备发送DMA操作启动请求,所述DMA操作启动请求中携带有所述目标主机的所述DMA内存地址,用以指示数据传输设备根据DMA虚拟地址、DMA内存地址和主机之间的对应关系确定所述DMA操作启动请求中携带的所述DMA内存地址对应的DMA虚拟地址,并将所述DMA操作启动请求中携带的所述DMA内存地址修改为所述DMA虚拟地址;
以及,所述信息发送模块具体用于,将修改后的所述DMA操作启动请求发送给所述I/O设备。
24.根据求权利要求22所述设备,其特征在于,生成DMA操作启动请求时,所述DMA操作启动请求生成模块具体用于,
获取所述目标主机的DMA虚拟地址,生成携带DMA虚拟地址的DMA操作启动请求;
以及,所述信息发送模块具体用于,将所述DMA操作启动请求发送给所述数据传输设备。
25.根据权利要求24所述设备,其特征在于,获取所述目标主机的DMA虚拟地址时,所述DMA操作启动请求生成模块具体用于,
根据所述任意一个主机上存储的所述所述DMA虚拟地址、DMA内存地址和主机之间的对应关系,获取所述目标主机所对应的DMA虚拟地址。
CN201510694821.4A 2015-10-21 2015-10-21 数据传输的方法、设备及系统 Active CN105404597B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201510694821.4A CN105404597B (zh) 2015-10-21 2015-10-21 数据传输的方法、设备及系统
EP16856851.7A EP3361387B1 (en) 2015-10-21 2016-10-14 Data transmission method, equipment and system
PCT/CN2016/102163 WO2017067420A1 (zh) 2015-10-21 2016-10-14 数据传输的方法、设备及系统
KR1020187012924A KR102209452B1 (ko) 2015-10-21 2016-10-14 데이터 전송 방법, 장치 및 시스템
US15/958,234 US20180239726A1 (en) 2015-10-21 2018-04-20 Data transmission method, device, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510694821.4A CN105404597B (zh) 2015-10-21 2015-10-21 数据传输的方法、设备及系统

Publications (2)

Publication Number Publication Date
CN105404597A CN105404597A (zh) 2016-03-16
CN105404597B true CN105404597B (zh) 2018-10-12

Family

ID=55470093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510694821.4A Active CN105404597B (zh) 2015-10-21 2015-10-21 数据传输的方法、设备及系统

Country Status (5)

Country Link
US (1) US20180239726A1 (zh)
EP (1) EP3361387B1 (zh)
KR (1) KR102209452B1 (zh)
CN (1) CN105404597B (zh)
WO (1) WO2017067420A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10936490B2 (en) * 2017-06-27 2021-03-02 Intel Corporation System and method for per-agent control and quality of service of shared resources in chip multiprocessor platforms
CN108021518B (zh) * 2017-11-17 2019-11-29 华为技术有限公司 一种数据交互方法和计算设备
WO2019161557A1 (zh) 2018-02-24 2019-08-29 华为技术有限公司 一种通信的方法及装置
US11874782B1 (en) * 2018-07-20 2024-01-16 Robert Gezelter Fast mass storage access for digital computers
US11294825B2 (en) * 2019-04-17 2022-04-05 SK Hynix Inc. Memory system for utilizing a memory included in an external device
KR20210001546A (ko) 2019-06-28 2021-01-06 에스케이하이닉스 주식회사 슬립모드에서 메모리 시스템의 내부데이터를 전송하는 장치 및 방법
KR20200122086A (ko) 2019-04-17 2020-10-27 에스케이하이닉스 주식회사 메모리 시스템에서 맵 세그먼트를 전송하는 방법 및 장치
KR20200139913A (ko) 2019-06-05 2020-12-15 에스케이하이닉스 주식회사 메모리 시스템, 메모리 컨트롤러 및 메타 정보 저장 장치
US11243714B2 (en) * 2019-06-11 2022-02-08 Samsung Electronics Co., Ltd. Efficient data movement method for in storage computation
CN110515860A (zh) * 2019-08-30 2019-11-29 苏州浪潮智能科技有限公司 一种内存中存储数据的地址标识方法、系统及装置
CN112540941B (zh) * 2019-09-21 2024-09-20 华为技术有限公司 一种数据转发芯片及服务器
EP4147135A1 (en) * 2020-05-28 2023-03-15 Huawei Technologies Co., Ltd. Method and system for direct memory access
CN111988394B (zh) * 2020-08-18 2022-11-01 北京金山云网络技术有限公司 一种虚拟化环境中优化p2p数据传输的方法、装置及设备
US20210075633A1 (en) * 2020-11-18 2021-03-11 Intel Corporation Packet multi-cast for memory pool replication
CN112765053B (zh) * 2021-01-04 2022-11-29 潍柴动力股份有限公司 数据处理方法及装置
CN115269174A (zh) * 2021-04-30 2022-11-01 华为技术有限公司 一种数据传输方法、数据处理方法及相关产品
CN114327865A (zh) * 2021-11-30 2022-04-12 浪潮电子信息产业股份有限公司 一种网卡通讯方法、系统、装置及计算机可读存储介质
CN114780466B (zh) * 2022-06-24 2022-09-02 沐曦科技(北京)有限公司 一种基于dma的数据复制延时的优化方法
CN116414568B (zh) * 2023-06-09 2023-10-31 阿里巴巴(中国)有限公司 针对虚拟无线接入网络的内存调整方法、设备及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101080701A (zh) * 2004-12-14 2007-11-28 索尼计算机娱乐公司 用于从外部设备到处理器的存储器的地址翻译的方法和装置
CN102521054A (zh) * 2011-12-15 2012-06-27 中国人民解放军国防科学技术大学 一种sun4v架构下的虚拟机DMA资源分配方法
CN103559075A (zh) * 2013-10-30 2014-02-05 华为技术有限公司 一种数据传输方法、装置和系统及内存装置
CN103946828A (zh) * 2013-10-29 2014-07-23 华为技术有限公司 数据处理系统和数据处理的方法
CN104199740A (zh) * 2014-08-28 2014-12-10 浪潮(北京)电子信息产业有限公司 共享系统地址空间的非紧耦合多节点多处理器系统和方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5940850A (en) * 1996-10-31 1999-08-17 International Business Machines Corporation System and method for selectively enabling load-on-write of dynamic ROM data to RAM
US5887134A (en) * 1997-06-30 1999-03-23 Sun Microsystems System and method for preserving message order while employing both programmed I/O and DMA operations
US20060085569A1 (en) * 2004-10-14 2006-04-20 International Business Machines Corporation Method for minimizing the translation overhead for large I/O transfers
CN100342360C (zh) * 2004-12-31 2007-10-10 北京中星微电子有限公司 一种直接存储器存取装置及方法
KR101002978B1 (ko) * 2005-12-09 2010-12-22 샌디스크 아이엘 엘티디 플래시 메모리 관리 시스템 및 방법
KR100755700B1 (ko) * 2005-12-27 2007-09-05 삼성전자주식회사 비휘발성 메모리가 캐쉬로 사용되는 저장 장치 및 그 관리방법
US7707383B2 (en) * 2006-11-21 2010-04-27 Intel Corporation Address translation performance in virtualized environments
US10303618B2 (en) * 2012-09-25 2019-05-28 International Business Machines Corporation Power savings via dynamic page type selection
US9727451B2 (en) * 2014-03-28 2017-08-08 Fortinet, Inc. Virtualization in a multi-host environment
US20160154756A1 (en) * 2014-03-31 2016-06-02 Avago Technologies General Ip (Singapore) Pte. Ltd Unordered multi-path routing in a pcie express fabric environment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101080701A (zh) * 2004-12-14 2007-11-28 索尼计算机娱乐公司 用于从外部设备到处理器的存储器的地址翻译的方法和装置
CN102521054A (zh) * 2011-12-15 2012-06-27 中国人民解放军国防科学技术大学 一种sun4v架构下的虚拟机DMA资源分配方法
CN103946828A (zh) * 2013-10-29 2014-07-23 华为技术有限公司 数据处理系统和数据处理的方法
CN103559075A (zh) * 2013-10-30 2014-02-05 华为技术有限公司 一种数据传输方法、装置和系统及内存装置
CN104199740A (zh) * 2014-08-28 2014-12-10 浪潮(北京)电子信息产业有限公司 共享系统地址空间的非紧耦合多节点多处理器系统和方法

Also Published As

Publication number Publication date
KR102209452B1 (ko) 2021-01-28
KR20180063292A (ko) 2018-06-11
WO2017067420A1 (zh) 2017-04-27
US20180239726A1 (en) 2018-08-23
EP3361387A1 (en) 2018-08-15
CN105404597A (zh) 2016-03-16
EP3361387A4 (en) 2018-10-17
EP3361387B1 (en) 2023-05-03

Similar Documents

Publication Publication Date Title
CN105404597B (zh) 数据传输的方法、设备及系统
US10389620B2 (en) System and apparatus of a software-service-defined-network (SSDN)
CN107690622B9 (zh) 实现硬件加速处理的方法、设备和系统
US10397132B2 (en) System and method for granting virtualized network function life cycle management
CN103346981A (zh) 虚拟交换方法、相关装置和计算机系统
JP5720324B2 (ja) シンクライアント環境提供システム、サーバ、シンクライアント環境管理方法、及びシンクライアント環境管理プログラム
CN105549904A (zh) 一种应用于存储系统中的数据迁移方法及存储设备
KR20150091843A (ko) 분산 처리 시스템 및 이의 동작 방법
JP6412708B2 (ja) プロセッシングシステムおよびマルチプロセッシングシステム
CN109639455A (zh) 一种容器云平台的网络管理方法及系统
CN104657308A (zh) 一种用fpga实现的服务器硬件加速的方法
CN110830574B (zh) 一种基于docker容器实现内网负载均衡的方法
JP2018537736A (ja) 分散ファイルシステムの複数のクラスタの管理
JP6373620B2 (ja) ゲーム提供システム
CN103377402A (zh) 一种多用户分析系统以及相应的装置和方法
CN110688230A (zh) 一种同步训练方法、装置、计算机设备和存储介质
CN107787483A (zh) 经由多租户链接的无缝地址再分配
JP2006079386A (ja) ストレージエリアネットワーク管理システム及び管理装置とボリューム割当て方法並びにコンピュータ・ソフトウエア
CN114500623A (zh) 网络靶场互联互通方法、装置、设备及可读存储介质
CN104571934B (zh) 一种内存访问的方法、设备和系统
CN105704098B (zh) 一种虚拟化网络的数据传输方法,节点控制器及系统
CN113626138A (zh) 一种应用程序访问方法和相关装置
CN109561127A (zh) 用于软件定义网络中的数据同步的方法、设备和计算机可读介质
CN113407306B (zh) 一种资源管理系统、方法、装置、设备及介质
Cherrueau et al. Geo-distribute cloud applications at the edge

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant