CN109923528B - 一种数据访问的方法和装置 - Google Patents
一种数据访问的方法和装置 Download PDFInfo
- Publication number
- CN109923528B CN109923528B CN201780040464.7A CN201780040464A CN109923528B CN 109923528 B CN109923528 B CN 109923528B CN 201780040464 A CN201780040464 A CN 201780040464A CN 109923528 B CN109923528 B CN 109923528B
- Authority
- CN
- China
- Prior art keywords
- physical
- descriptor
- queue
- virtual machine
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 20
- 230000006854 communication Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/10—Address translation
- G06F12/1081—Address translation for peripheral access to main memory, e.g. direct memory access [DMA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/0284—Multiple user address space allocation, e.g. using different base addresses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/10—Address translation
- G06F12/109—Address translation for multiple virtual address spaces, e.g. segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/20—Handling requests for interconnection or transfer for access to input/output bus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0661—Format or protocol conversion arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0662—Virtualisation aspects
- G06F3/0664—Virtualisation aspects at device level, e.g. emulation of a storage device or system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45579—I/O management, e.g. providing access to device drivers or storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/65—Details of virtual memory and virtual address translation
- G06F2212/657—Virtual address space management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
本发明实施例提供的数据访问方法应用于主机中,主机上运行虚拟机。主机的处理器将虚拟机的虚拟机接口卡识别的第一描述符转换为主机的物理接口卡识别的第二描述符,其中第一描述符包含虚拟机物理内存地址和可访问数据的数据长度;主机的物理接口卡根据第二描述符获得虚拟机物理内存地址映射到内存中的物理地址,根据内存中的物理地址访问可访问数据。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种数据访问的方法和装置。
背景技术
主机上运行的虚拟机具有虚拟机网卡,在虚拟机通信过程中,物理网卡需要使用虚拟机网卡的描述符,该描述符需由物理网卡的驱动程序生成。因此虚拟机中需要安装物理网卡的驱动程序。这就要求不同的物理网卡提供商需要针对不同的虚拟机操作系统开发不同的物理网卡驱动程序,用户需要根据虚拟机的操作系统为虚拟机安装对应的物理网卡驱动程序,否则物理网卡无法对虚拟机进行数据访问。
发明内容
本申请提供了一种数据访问的方法和设备,本申请中,主机的物理接口卡在主机上运行的虚拟机未安装物理接口卡的驱动程序的情况下,仍然能够对虚拟机进行数据访问。
本申请的第一方面提供一种数据访问的方法。该方法应用在主机中,该主机包括处理器、内存和物理接口卡,主机上运行有虚拟机,该虚拟机包括虚拟机接口卡。处理器从内存中获取包含虚拟机物理内存地址和可访问数据的数据长度的第一描述符,其中,该虚拟机物理内存地址指向该可访问数据在该虚拟机中的物理内存中存储的起始位置,同时,该第一描述符是按照该虚拟机接口卡可识别的编码方式编码的。该处理器还将该第一描述符转换为按照该物理接口卡可识别的编码方式编码的第二描述符。该物理接口卡根据该第二描述符获得该虚拟机物理内存地址映射到的该内存中的物理地址,根据该内存中的物理地址访问该可访问数据。
示例性的,物理接口卡可以为网络接口卡,或称为网卡,则对应的虚拟机接口卡为虚拟机网卡。物理接口卡也可以为主机总线适配(Host Bus Adaptor,HBA)卡,则对应的虚拟机接口卡为虚拟机HBA卡。第一描述符是按照虚拟机接口卡可识别的编码方式进行编码的,物理接口卡不能识别。主机的处理器将第一描述符转换成第二描述符。由于第二描述符是按照物理接口卡可识别的编码方式编码的,因此物理接口卡可以通过该第二描述符获得虚拟机物理内存地址映射到的内存中的物理地址,从而访问数据。可见,本申请无需在该虚拟机上安装该物理接口卡的驱动程序,也可以实现物理接口卡对虚拟机的数据访问,从而提高了创建虚拟机的效率。
结合第一方面,在第一方面的第一种可能实现方式中,该内存中存储有该虚拟机接口卡的虚拟队列以及该物理接口卡的物理队列,该第一描述符保存在该虚拟队列中,该虚拟队列与该物理队列之间具有对应关系。该处理器还根据该对应关系,将该第二描述符存入该物理队列。将第一描述符和第二描述符分别存入虚拟队列和物理队列,使得处理器能够通过队列获取第一描述符,物理接口卡能够通过物理队列获取第二描述符,方便主机对第一描述符和第二描述符进行管理,提高访问效率。
结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,该对应关系保存在该内存中的第一存储空间,该第一存储空间属于该内存中的系统内存。只有主机才具有内存中的该系统内存的访问权限,而主机上运行的虚拟机没有该系统内存的访问权限,该第一存储空间不可被该虚拟机访问。将对应关系存入内存中的系统内存,处理器即可快速访问该对应关系,提高数据访问的效率。
结合第一方面的第二种可能实现方式,在第一方面的第三种可能实现方式中,该第二描述符包括该虚拟机物理内存地址和该数据长度。在该方法中,该物理接口卡向内存管理单元发送查询消息,以查询该虚拟机物理内存地址映射到的该内存中的物理地址,该查询消息中包含该虚拟机物理内存地址。内存管理单元根据该查询消息中包含的该虚拟机物理内存地址,查询该虚拟机物理内存地址与该内存中的物理地址的映射关系,获得该内存中的物理地址,内存管理单元向物理接口卡发送该内存中的物理地址。通过内存管理单元物理接口卡可以地通过虚拟机物理内存地址访问数据,减少了处理器的参与,节省了计算资源。
结合第一方面、第一方面的第二种和第三种可能实现方式中的方法,在第一方面的第四种可能实现方式中,该处理器将该第一描述符转换为第二描述符,具体包括:该处理器根据该第一描述符获得该虚拟机物理内存地址。该处理器将该虚拟机物理内存地址映射为该内存中的物理地址;该处理器对该内存中的物理地址以及该数据长度进行编码得到该第二描述符,该第二描述符包含该内存中的物理地址和该数据长度。第二描述符包含该虚拟机物理内存地址映射的该内存中的物理地址,使得物理网卡可以直接根据第二描述符中的该内存中的物理地址访问数据。
结合第一方面的第一种可能实现方式,在第一方面的第五种可能实现方式中,该虚拟队列包括虚拟发送队列,该物理队列包括物理发送队列,该可访问数据为待发送的数据,该第一描述符保存在该虚拟发送队列中。该处理器将该第二描述符存入该物理队列包括将该第二描述符存入该物理发送队列。此时的第一描述符为第一待发送数据描述符,第二描述符为第二待接收数据描述符。
结合第一方面的第一种可能实现方式,在第一方面的第六种可能实现方式中,该虚拟队列包括虚拟接收队列,该物理队列包括物理接收队列,该可访问数据为待接收的数据,该第一描述符保存在该虚拟接收队列中,该处理器将该第二描述符存入该物理队列包括将该第二描述符存入该物理接收队列。此时的第一描述符为第一空闲描述符,第二描述符为第二空闲描述符。
本申请的第二方面提供一种主机,该主机包括处理器、存储设备和物理接口卡,该主机用于运行虚拟机,该虚拟机包括虚拟机接口卡。该处理器用于获取包含虚拟机物理内存地址和可访问数据的数据长度的第一描述符,其中,该虚拟机物理内存地址指向该可访问数据在该虚拟机中存储的起始位置,同时,该第一描述符是按照该虚拟机接口卡可识别的编码方式编码的。该处理器还用于将该第一描述符转换为按照该物理接口卡可识别的编码方式编码的第二描述符。该物理接口卡用于根据该第二描述符获得该虚拟机物理内存地址映射到的内存中的物理地址,根据该内存中的物理地址访问该虚拟机上的该可访问数据。
第一描述符是按照虚拟机接口卡可识别的编码方式进行编码的,物理接口卡不能识别。主机的处理器将第一描述符转换成第二描述符。由于第二描述符是按照物理接口卡可识别的编码方式编码的,因此物理接口卡可以通过该第二描述符获得虚拟机物理内存地址映射到的内存中的物理地址,从而访问数据。可见,本实施例无需在该虚拟机上安装该物理网卡的驱动程序,也可以实现物理网卡对虚拟机的数据访问。
结合第二方面,在第二方面的第一种可能实现方式中,该存储设备的内存中存储有该虚拟机接口卡的虚拟队列以及该物理接口卡的物理队列,该第一描述符保存在该虚拟队列中,该虚拟队列与该物理队列之间具有对应关系。该处理器还用于执行:根据该对应关系,将该第二描述符存入该物理队列。该物理接口卡用于从该物理队列中获得该第二描述符。虚拟队列和物理队列使得处理器和物理接口卡分别通过队列通信获取第一和第二描述符。
结合第二方面的第一种可能实现方式,在第二方面的第二种可能实现方式中,该对应关系保存在该内存中的第一存储空间即内存中的系统内存,该第一存储空间为不可被该虚拟机访问。将对应关系存入内存中的系统内存,处理器即可快速访问该对应关系,提高数据访问的效率。
结合第二方面的第二种可能实现方式,在第二方面的第三种可能实现方式中,该第二描述符包括该虚拟机物理内存地址和该数据长度。该物理接口卡用于执行如下操作:该物理接口卡用于向内存管理单元发送查询消息,以查询该虚拟机物理内存地址映射到的该内存中的物理地址,该查询消息中包含所述虚拟机物理内存地址。通过内存管理单元物理,接口卡可以迅速地通过虚拟机物理内存地址访问数据。
结合第二方面、第二方面的第二种和第三种可能实现方式中的方法,在第二方面的第四种可能实现方式中,该处理器用于执行将该第一描述符转换为第二描述符,具体包括:根据该第一描述符获得该虚拟机物理内存地址,将该虚拟机物理内存地址映射为该内存中的物理地址,对该内存中的物理地址以及该数据长度进行编码得到该第二描述符,该第二描述符包含该内存中的物理地址和该数据长度。第二描述符包含转换后的内存中的物理地址,使得物理网卡可以直接根据内存中的物理地址访问数据。
结合第二方面的第一种可能实现方式,在第二方面的第五种可能实现方式中,该虚拟队列包括虚拟发送队列,该物理队列包括物理发送队列,该可访问数据为待发送的数据,该第一描述符保存在该虚拟发送队列中。该处理器用于将该第二描述符存入该物理队列,具体包括将该第二描述符存入该物理发送队列。此时的第一描述符为第一待发送数据描述符,第二描述符为第二待接收数据描述符。
结合第二方面的第一种可能实现方式,在第二方面的第六种可能实现方式中,该虚拟队列包括虚拟接收队列,该物理队列包括物理接收队列,该可访问数据为待接收的数据,该第一描述符保存在该虚拟接收队列中。该处理器用于将该第二描述符存入该物理队列,具体包括将该第二描述符存入该物理接收队列。此时的第一描述符为第一待空闲描述符,第二描述符为第二待空闲描述符。
本申请的第三方面还提供一种数据访问的装置,该装置应用于主机,该主机包括处理器、内存和物理接口卡,虚拟机运行在所述主机上,该虚拟机包括虚拟机接口卡。该处理器获取包含虚拟机物理内存地址和可访问数据的数据长度的第一描述符,其中,该虚拟机物理内存地址指向该可访问数据在该虚拟机中存储的起始位置,同时,该第一描述符是按照该虚拟机接口卡可识别的编码方式编码的。该处理器还将该第一描述符转换为按照该物理接口卡可识别的编码方式编码的第二描述符,使得该物理接口卡根据该第二描述符获得该虚拟机物理内存地址映射到的内存中的物理地址,以访问该虚拟机上的该可访问数据。
同样地,第一描述符是按照虚拟机接口卡可识别的编码方式进行编码的,物理接口卡不能识别。主机的处理器将第一描述符转换成第二描述符。由于第二描述符是按照物理接口卡可识别的编码方式编码的,因此物理接口卡可以通过该第二描述符获得虚拟机物理内存地址映射到的内存中的物理地址,从而访问数据。可见,本实施例无需在该虚拟机上安装该物理网卡的驱动程序,也可以实现物理网卡对虚拟机的数据访问。因此本实施例中的装置解决了用户需要根据虚拟机的操作系统安装对应的物理网卡驱动程序才能使得物理网卡无实现数据访问的问题。
结合第三方面,在第三方面的第一种可能实现方式中,该存储设备的内存中存储有该虚拟机接口卡的虚拟队列以及该物理接口卡的物理队列,该第一描述符保存在该虚拟队列中,该虚拟队列与该物理队列之间具有对应关系。该装置还包括存储单元,该存储单元用于根据该对应关系,将该第二描述符存入该物理队列,使得该物理接口卡能够从该物理队列中获得该第二描述符。虚拟队列和物理队列使得处理器和物理接口卡分别通过队列通信获取第一和第二描述符。
结合第三方面的第一种可能实现方式,在第三方面的第二种可能实现方式中,该对应关系保存在该内存中的第一存储空间即内存中的系统内存,该第一存储空间为不可被该虚拟机访问。将对应关系存入内存中的系统内存,处理器即可快速访问该对应关系,提高数据访问的效率。
结合第三方面、第三方面的第二种和第三种可能实现方式中的装置,在第三方面的第三种可能实现方式中,该描述符转换单元用于将该第一描述符转换为第二描述符,具体包括:根据该第一描述符获得该虚拟机物理内存地址,将该虚拟机物理内存地址映射为该内存中的物理地址,对该内存中的物理地址以及该数据长度进行编码得到该第二描述符,该第二描述符包含该内存中的物理地址和该数据长度。第二描述符包含转换后的内存中的物理地址,使得物理网卡可以直接根据内存中的物理地址访问数据。
结合第三方面的第一种可能实现方式,在第三方面的第四种可能实现方式中,该可访问数据为待发送的数据,该虚拟队列包括虚拟发送队列,该第一描述符保存在该虚拟发送队列中,该物理队列包括物理发送队列。该存储单元用于将该第二描述符存入该物理队列,使得该物理接口卡能够从该物理队列中获得该第二描述符,具体包括:将该第二描述符存入该物理发送队列,使得该物理接口卡能够从该物理发送队列中获得该第二描述符。此时的第一描述符为第一待发送数据描述符,第二描述符为第二待接收数据描述符。
结合第三方面的第一种可能实现方式,在第三方面的第五种可能实现方式中,该虚拟队列包括虚拟接收队列,该物理队列包括物理接收队列,该可访问数据为待接收的数据,该第一描述符保存在该虚拟接收队列中。该物理接口卡用于将该第二描述符存入该物理队列,具体包括将该第二描述符存入该物理接收队列。此时的第一描述符为第一待空闲描述符,第二描述符为第二待空闲描述符。
本申请的第四方面还提供一种非易失性计算机可读存储介质,其中,该非易失性可读存储介质包含计算机指令,该计算机指令用于执行本实施例第一方面及第一方面的第一种及第七种可能实现方式中任一种实现方式中处理器执行的操作。
本申请的第五方面还提供了一种计算机程序产品,包含计算机指令,主机的处理器执行该计算机指令用于执行本实施例第一方面及第一方面的第一种及第七种可能实现方式中任一种实现方式中处理器执行的操作。
附图说明
图1为物理网卡对数据访问的应用场景的示意图;
图2为主机、物理接口卡与虚拟机的架构图;
图3A为Hypervisor为虚拟机分配物理网卡的示意图;
图3B为Hypervisor为虚拟机分配内存的示意图;
图4为描述符、虚拟队列、物理队列与可访问数据的示意图;
图5为数据访问方法的流程图;
图6A为描述符转换的第一种实现方式示意图;
图6B为描述符转换的第二种实现方式示意图;
图7为一种虚拟机与物理网卡通信的装置示意图。
具体实施方式
主机作为运行虚拟机的载体,通常包含处理器、内存和物理接口卡。虚拟机与主机外部设备进行通信时,物理接口卡对虚拟机进行访问,例如,获取虚拟机发送的数据,或将外部设备发送给虚拟机的数据发送给虚拟机。本发明实施例中的主机,也称为服务器。运行在主机上的虚拟机与外部设备通信,如图1所示,物理接口卡101通过网络120与外部设备130通信。图中网络120可以是有线网或无线网,外部设备130可以是服务器、终端设备以及网络设备等。物理接口卡101可以是物理网络接口卡(又称为网卡),也可以是主机总线适配(Host Bus Adapter,HBA)卡等。与物理网卡对应的虚拟机接口卡为虚拟机网卡。
图1中主机100、物理接口卡101与虚拟机110的架构如图2所示。主机100上运行多台虚拟机,主机100与多台虚拟机的架构可以是全虚拟化、半虚拟化与硬件虚拟化。下文以其中一台虚拟机110为例进行描述。主机100包括物理管理程序102和物理硬件资源103。物理硬件资源103包括处理器104、内存105和物理接口卡101等。本发明实施例中称虚拟机110的操作系统为用户操作系统111,称虚拟机的硬件为虚拟硬件112,其中虚拟硬件112包含但不限于虚拟机处理器113、虚拟机内存114和虚拟机接口卡115等。主机100的处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是专用集成电路(Application-Specific Integrated Circuit,ASIC),现场可编程门阵列(Field Programmable GateArray,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者上述任意合适的组合。管理程序201,也称为虚拟机监视器(Virtual Machine Monitor,VMM),如Hypervisor,也可以是内核虚拟机(Kernel-based Virtual Machine,KVM)、Xen和Denali等。
虚拟机110运行在主机100的管理程序102之上,管理程序102为虚拟机110的虚拟硬件112和主机100的物理硬件资源103提供调度。以下以Hypervisor为例,具体的,Hypervisor106将虚拟机110所需的部分物理硬件资源103虚拟化为虚拟硬件112,为虚拟机110的用户操作系统111提供运行的硬件环境。Hypervisor106协调各个虚拟机对物理硬件资源103的访问。
本发明实施例中物理接口卡以物理网卡为例。图3A和图3B分别为Hypervisor106为虚拟机分配物理网卡107和内存105的示意图。具体实现中,处理器104执行管理程序102,用于实现本发明实施例中相应的操作,因此本发明实施例在接下来的描述提到的管理程序102(如Hypervisor106)执行的操作与处理器104执行相应管理程序102的功能具有相同的含义。例如,Hypervisor106为虚拟机110分配物理网卡107和内存105,或者处理器104为虚拟机110分配物理网卡107和内存105,以上两种表述具有相同的含义。
Hypervisor106将物理网卡107虚拟化为一个或多个虚拟机网卡并分配给主机100上的虚拟机。以图3A中所示为例,Hypervisor106将物理网卡107虚拟化为虚拟机网卡116a、虚拟机网卡116b、……虚拟机网卡116n,并分配给对应的虚拟机110a、虚拟机110b、……虚拟机110n。本发明实施例以一台虚拟机包含一个虚拟机网卡为例,但具体实现中,一台虚拟机也可以包含多个虚拟机网卡,本发明实施例对此不作限定。物理网卡107虚拟化为虚拟机网卡116的一个实施方式如下:Hypervisor106通过单根虚拟化(Single Root-Input/Output Virtualization,SR-IOV)技术可将高速外设互联标准(Peripheral ComponentInterconnect Express,PCIE)网卡虚拟化为多个虚拟功能(Virtual Function,VF),并将VF分配给对应的虚拟机。
Hypervisor106将内存105虚拟化并分配给主机100上的一个或多个虚拟机。以图3B中所示为例,Hypervisor106将内存105的内存空间划分为系统内存108、主机内存空间109a、主机内存空间109b、……主机内存空间109n。其中,系统内存108为Hypvisor106等运行的内存空间,只有主机才具有访问系统内存108的访问权限,而主机上运行的虚拟机没有系统内存108的访问权限。因此,系统内存108不能被虚拟机110a、虚拟机110b、……虚拟机110n访问。Hypervisor106将主机内存空间109a映射为虚拟内存空间114a,将主机内存空间109b映射为虚拟内存空间114b、……将主机内存空间109n映射为虚拟内存空间114n,将虚拟内存空间114a分配给虚拟机110a,将虚拟内存空间114b分配给虚拟机110b、……将虚拟内存空间114n分配给虚拟机110n。虚拟机110通过虚拟机物理内存地址访问虚拟机内存空间117,主机100通过内存105中的物理地址访问内存105。由于虚拟存储空间117a-117n分别映射到主机存储空间109a-109n,Hypervisor106将虚拟机物理内存地址映射到内存105中的物理地址。
本实施例中,物理网卡107通过描述符实现数据访问。如图4所示,物理队列118由物理网卡107的驱动程序生成,用于存储描述符。物理网卡107从物理队列118中获取描述符,并根据描述符中的可访问数据的位置信息访问可访问数据的第一存储空间。图4中的第一描述符410由虚拟机网卡116的驱动程序生成,存储在虚拟机的虚拟队列117中。虚拟队列117亦由虚拟机网卡116的驱动程序生成,虚拟队列117位于Hypervisor106分配给虚拟机110的虚拟机内存空间114中。虚拟机网卡的驱动程序可以为VirtIO驱动程序。物理队列118与虚拟队列117对应,对应关系存储于内存105中,该对应关系的存储形式可以是一个数据表或其他数据结构,本实施例对此不作限制。物理网卡107对虚拟机110进行数据访问时能够访问的可访问数据存储在虚拟机内存空间114中的第一存储空间414。由上文所述可知,虚拟内存空间114为虚拟机110提供虚拟机物理内存,虚拟内存空间114映射到内存105的一部分存储空间。指向第一存储空间414的起始存储位置的虚拟机物理内存地址对应内存105中的物理地址,该内存105中的物理地址为第二存储空间415的起始存储位置。
图5中的数据访问的流程如图5所示,具体如下:
501,获取第一描述符410。
具体的,Hypervisor106获取虚拟队列117中的第一描述符410。第一描述符410包含在虚拟机内存空间114中存储可访问数据的第一存储空间414。第一存储空间414即虚拟机物理内存地址和可访问数据的数据长度,其中虚拟机物理内存地址指向可访问数据在第一存储空间414(虚拟机110的物理内存)中的起始存储位置。由于第一描述符410由虚拟机网卡116的驱动程序生成,第一描述符410是按照虚拟机网卡可识别的编码方式编码的,且物理网卡107不能识别第一描述符410的编码方式。虚拟机110的物理内存是指虚拟机110中供客户机操作系统使用的虚拟硬件内存,主机100内存105的物理内存是主机100中的实际物理内存,内存105中的物理地址是指是主机100中的实际物理内存。
502,Hypervisor106将第一描述符410转换为第二描述符411,并根据虚拟队列117与物理队列118的对应关系,将第二描述符411存入物理队列118,其中,第二描述符411是按照物理网卡107可识别的编码方式编码的。
此时,物理网卡107从物理队列118获取可识别的第二描述符411。即,无需在虚拟机110上安装物理网卡107的驱动程序,物理网卡107即可访问虚拟机110的第一存储空间414。由于虚拟机网卡116的驱动程序通常都集成在虚拟机110的用户操作系统111中,本实施例中,在创建虚拟机110通信的软硬件环境时,不需要为虚拟机110安装物理网卡107的驱动程序,解决了虚拟机110安装物理接口卡101的驱动程序给用户使用造成不便的问题,提高了创建虚拟机110的效率,提升了虚拟机110用户的体验。
当主机100具有内存管理单元(Input/Output Memory Management Unit,IOMMU),且物理网卡107具有直接内存访问(Direct Memory Access,DMA)功能,Hypervisor106将第一描述符410转换为第二描述符411,具体流程为,Hypervisor106根据第一描述符410和虚拟机网卡116的编码方式,得到该虚拟机物理内存地址和该可访问数据的数据长度,并按照物理网卡107可识别的编码方式,将该虚拟机物理内存地址和该可访问数据的数据长度编码为第二描述符411。具体的,物理网卡107可以为PCIE网卡。PCIE网卡具有DMA功能,结合 公司CPU的输入输出直通虚拟化技术(Virtualization Technology forDirected Input/Output,VT-d)以及管理程序中的IOMMU,可实现通过虚拟机物理内存地址,生成DMA命令,访问虚拟机内存空间,从而减少了处理器的参与,节约处理器的计算资源。
当主机100不具有IOMMU,或物理网卡107不具有DMA功能,Hypervisor106根据第一描述符410和虚拟机网卡116的编码方式得到该虚拟机物理内存地址和该可访问数据的数据长度后,将该虚拟机物理内存地址转换为对应的该内存105中的物理地址,并按照物理网卡107可识别的编码方式,将该内存105中的物理地址和该可访问数据的数据长度编码为第二描述符411,使得物理网卡107可以直接根据第二描述符411中的该内存107中的物理地址访问数据,提高了数据访问速度。物理网卡107可以为不具有DMA功能的非PCIE物理接口卡,外设互联标准(Peripheral Component Interconnect,PCI)卡为一种非PCIE卡的实施例。
图6A为当主机100具有IOMMU,且物理网卡107具有DMA功能时,第一描述符410转换为第二描述符411的过程的示意图。Hypervisor106按照物理网卡107可识别的编码方式编码该虚拟机物理内存地址和该可访问数据的数据长度。
图6B为当主机100不具有IOMMU,或物理网卡107不具有DMA功能时,第一描述符410转换为第二描述符411的过程的示意图。Hypervisor106将该虚拟机物理内存地址转换为对应的该内存105中的物理地址,并按照物理网卡107可识别的编码方式编码该内存105中的物理地址和该可访问数据的数据长度。
503,物理网卡107根据物理队列118中的第二描述符411,访问存储可访问数据的第二存储空间415。
当主机100具有IOMMU,且物理网卡107具有DMA功能时,物理网卡107从物理队列118获取的第二描述符411包含该虚拟机物理内存地址和该可访问数据的数据长度。物理网卡107根据其DMA功能,发送携带虚拟机物理内存地址的查询消息至主机100中的IOMMU,查询该虚拟机物理内存地址对应的该内存105中的物理地址。该IOMMU向物理网卡返回携带该内存105中的物理地址的消息,物理网卡107根据该内存105中的物理地址生成直接访问命令。该内存105中的物理地址指向第二存储空间415中的起始存储位置。物理网卡107根据该内存105中的物理地址和该可访问数据的数据长度,访问该可访问数据的存储空间,实现与虚拟机110的通信。同样,此时物理网卡107可以为PCIE网卡。
当主机100不具有IOMMU,或物理网卡107不具有DMA功能时,物理网卡107从物理队列118获取的第二描述符411包含该虚拟机物理内存地址映射的该内存105中的物理地址和该可访问数据的数据长度。该主机物理内存地址指向第二存储空间415中的起始存储位置。物理网卡107根据第二描述符411中的该内存105中的物理地址和该可访问数据的数据长度,访问该可访问数据的存储空间,实现与虚拟机110的通信。同样,物理网卡107可以为不具有DMA功能的非PCIE物理接口卡,外设互联标准(Peripheral Component Interconnect,PCI)卡为一种非PCIE卡的实施例。
可选地,物理网卡107可以通过轮询物理队列118,从物理队列118中读取第二描述符411;当第二描述符411存入物理队列118时,Hypervisor106也可以向物理网卡107发送中断,触发物理网卡107从物理队列118中读取第二描述符411。
在本发明的另一个实施例中,在图2、图3A及图3B中所示的主机100、虚拟机110及其他逻辑或物理部件上,物理网卡107创建图4中存储第二描述符411的物理队列118时,将物理队列118存储于虚拟内存空间114中,虚拟机110无法感知的存储空间,即Hypervisor106分配给虚拟机110,但不通知给虚拟机110的虚拟内存空间114的一部分,由于Hypervisor106并未把此内存空间通知给虚拟机110,虚拟机110不会占用这此内存空间,此内存空间即可用于存储物理队列118。此时物理网卡107对110进行数据访问的方法的流程同样依照上文所述流程401-403,在此不再赘述。虚拟内存空间114映射到内存105的一段空间,即物理队列118实际存储在该内存105的一段空间中。本发明实施例中,虚拟内存空间由虚拟机物理内存地址与一段地址长度构成,同样虚拟内存空间映射的内存105中的一段空间由虚拟机物理内存地址映射的105中的物理地址与该一段长度构成。
当虚拟机110向外部设备130发送待发送数据时,物理网卡107需要访问虚拟机110中的待发送数据。
此时,虚拟机网卡116的驱动程序生成的虚拟队列117为虚拟发送队列,虚拟发送队列中存储待发送数据描述符1。物理网卡107的驱动程序生成的物理队列118为物理发送队列,虚拟队列117与物理队列118的对应关系为虚拟发送队列与物理发送队列的对应关系。虚拟机110向物理网卡107发送待发送数据的流程如下:
第一步,Hypervisor106获取虚拟发送队列中的待发送数据描述符1。
待发送数据描述符1包含在虚拟机内存空间117中存储待发送数据的第三存储空间(虚拟机的物理内存)。第三存储空间即虚拟机物理内存地址1和待发送数据的数据长度,其中虚拟机物理内存地址1指向待发送数据在第三存储空间(虚拟机的物理内存)中的起始存储位置。由虚拟机网卡116的驱动生成的待发送数据描述符1是按照虚拟机网卡116可识别的编码方式编码的。
第二步,当主机100具有IOMMU,且物理网卡107具有DMA功能时,Hypervisor106根据待发送数据描述符1和虚拟机网卡116的编码方式,得到虚拟机物理内存地址1和该待发送数据的数据长度,并按照物理网卡107可识别的编码方式,将虚拟机物理内存地址1和该待发送数据的数据长度编码为待发送描述符2。
当主机100不具有IOMMU,或物理网卡107不具有DMA功能,Hypervisor106根据待发送数据描述符1和虚拟机网卡116的编码方式得到虚拟机物理内存地址1和该待发送数据的数据长度后,将虚拟机物理内存地址1转换为虚拟机物理内存地址1映射到的内存105中的物理地址1,并按照物理网卡107可识别的编码方式,将内存105中的物理地址1和该待发送数据的数据长度编码为待发送数据描述符2。
第三步,Hypervisor106根据虚拟发送队列与物理发送队列的对应关系,将待发送数据描述符2存入物理发送队列。
第四步,物理网卡107根据物理发送队列中的待发送数据描述符2,读取虚拟机110中的待发送数据。
当主机100具有IOMMU,且物理网卡107具有DMA功能时,待发送数据描述符2包含虚拟机物理内存地址1和该待发送数据的数据长度。物理网卡107根据其DMA功能和主机100中的IOMMU生成直接访问命令,将虚拟机物理内存地址1转换为虚拟机物理内存地址1映射到的内存105中的物理地址1,并根据内存105中物理地址1和该待发送数据的数据长度进行数据访问,获得待发送数据,实现与虚拟机110的通信。
当主机100不具有IOMMU,或物理网卡107不具有DMA功能时,待发送数据描述符2包含虚拟机物理内存地址1映射到的内存105中的物理地址1和该可访问数据的数据长度。物理网卡107根据内存105中物理地址1和该待发送数据的数据长度,访问该待发送数据,获得待发送数据,实现与虚拟机110的通信。
可选地,物理网卡107可以通过轮询物理发送队列,从物理发送队列中读取待发送数据描述符2;当待发送数据描述符2存入物理发送队列时,Hypervisor106也可以向物理网卡107发送中断,触发物理网卡107从物理发送队列中读取待发送数据描述符2。
虚拟机110接收外部设备130发送的数据时,外部设备130将该数据发送至物理网卡107,物理网卡107将该数据存入虚拟机110。
此时,虚拟机网卡116的驱动程序生成的虚拟队列117为虚拟接收队列。物理网卡107的驱动程序生成的物理队列118为物理接收队列,虚拟队列117与物理队列118的对应关系为虚拟接收队列与物理接收队列的对应关系。虚拟机110利用空闲描述符通知物理网卡107将外部设备103发送的存入虚拟机内存空间114。虚拟发送队列中存储空闲描述符1。物理网卡107向虚拟机110发送外部设备130发送的数据的具体流程如下:
第一步,Hypervisor106获取虚拟发送队列中的待发送数据描述符1。
空闲描述符1包含在虚拟机内存空间117中存储待接收数据的第四存储空间,第四存储空间即虚拟机物理内存地址2和最大存储的数据长度,其中虚拟机物理内存地址2指向第四存储空间(虚拟机的物理内存)中的存储该待接收数据的起始存储位置,该待接收数据的数据长度不大于该最大存储的数据长度。由虚拟机网卡116的驱动生成的空闲描述符1是按照虚拟机网卡116可识别的编码方式编码的。
第二步,当主机100具有IOMMU,且物理网卡107具有DMA功能时,Hypervisor106根据空闲描述符1和虚拟机网卡116的编码方式,得到虚拟机物理内存地址2和该最大存储的数据长度,并按照物理网卡107可识别的编码方式,将虚拟机物理内存地址2和该最大存储的数据长度编码为待发送描述符2。
当主机100不具有IOMMU,或物理网卡107不具有DMA功能,Hypervisor106根据空闲描述符1和虚拟机网卡116的编码方式得到虚拟机物理内存地址2和该最大存储的数据长度后,将虚拟机物理内存地址2转换为虚拟机物理内存地址2映射的内存105中的物理地址2,并按照物理网卡107可识别的编码方式,将虚拟机物理内存地址2映射的内存105中物理地址2和该最大存储的数据长度编码为空闲描述符2。
第三步,Hypervisor106根据虚拟接收队列与物理接收队列的对应关系,将空闲描述符2存入物理发送队列。
第四步,物理网卡107根据物理接收队列中的空闲描述符2,将该待接收数据存入虚拟机110。
当主机100具有IOMMU,且物理网卡107具有DMA功能时,空闲描述符2包含虚拟机物理内存地址2和该最大存储的数据长度。物理网卡107根据其DMA功能和主机100中的IOMMU生成直接访问命令,将虚拟机物理内存地址2转换为虚拟机物理内存地址2映射的内存105中的物理地址2,并根据虚拟机物理内存地址2映射的内存105中的物理地址2和该最大存储的数据长度,将该待接收数据存入虚拟机110。
当主机100不具有IOMMU,或物理网卡107不具有DMA功能时,空闲描述符2包含虚拟机物理内存地址2映射的内存105中的物理地址2和该最大存储的数据长度。物理网卡107根据虚拟机物理内存地址2映射的内存105中的物理地址2和该最大存储的数据长度,将该待接收数据存入虚拟机110。
可选地,物理网卡107可以通过轮询物理接收队列,从物理接收队列中读取空闲描述符2;当空闲描述符2存入物理接收队列时,Hypervisor106也可以向物理网卡107发送中断,触发物理网卡107从物理接收队列中读取空闲描述符2。
本实施例还提供一种数据访问的装置700应用于主机100中,主机100运行虚拟机,虚拟机包含虚拟机接口卡。如图7所示,通信装置700包括获取单元701和描述符转换单元702。其中,获取单元701用于从内存105中获取第一描述符,第一描述符包含虚拟机物理内存地址和可访问数据的数据长度。描述符转换单元702用于将所述第一描述符转换为第二描述符,其中,所述第二描述符是按照所述物理接口卡可识别的编码方式编码的,使得所述物理接口卡根据所述第二描述符获得所述虚拟机物理内存地址映射到所述内存中的物理地址以访问所述可访问数据。进一步的,通信装置700还包括存储单元703,所述内存中存储有所述虚拟机接口卡的虚拟队列以及所述物理接口卡的物理队列,所述第一描述符保存在所述虚拟队列中,所述虚拟队列与所述物理队列之间具有对应关系,存储单元703用于根据所述对应关系,将所述第二描述符存入所述物理队列,使得所述物理接口卡从所述物理队列中获得所述第二描述符。其中,所述对应关系保存在所述内存中的第一存储空间,所述第一存储空间不可被所述虚拟机访问。进一步的,描述符转换单元702具体用于:根据所述第一描述符获得所述虚拟机物理内存地址,将所述虚拟机物理内存地址映射为所述内存中的物理地址,对所述内存中的物理地址以及所述数据长度进行编码得到所述第二描述符,所述第二描述符包含所述内存中的物理地址和所述数据长度。另一种实现方式,在所述装置700中,所述可访问数据为待发送的数据,所述虚拟队列包括虚拟发送队列,所述第一描述符保存在所述虚拟发送队列中,所述物理队列包括物理发送队列;所述装置700还包括存储单元703,存储单元703具体用于将所述第二描述符存入所述物理发送队列。另一种实现方式,在所述装置700中,所述虚拟队列包括虚拟接收队列,所述物理队列包括物理接收队列,所述可访问数据为待接收的数据,所述第一描述符保存在所述虚拟接收队列中;所述装置700还包括存储单元703,所述存储单元具体用于将所述第二描述符存入所述物理接收队列。
示例性地,获取单元401可以通过图1所示的处理器104执行计算机指令实现,该计算机指令用于实现图5中步骤501。描述符转换单元702可以通过图1所示的处理器104执行计算机指令实现,该计算机指令用于实现图5中步骤502。存储单元703可以通过图1所示的处理器104执行计算机指令实现。如同图1部分的描述,处理器104可以是CPU,还可以是ASIC、FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者上述任意合适的组合。对于其中不具有指令存储装置的处理器,例如CPU,上述计算机指令存储于内存中,获取单元401、描述符转换单元702及存储单元703通过处理器104执行内存中的计算机指令实现。对于其中具有指令存储装置的处理器,例如FPGA,该指令存储于处理器中,获取单元401、描述符转换单元702及存储单元703通过处理器执行处理器中的计算机指令实现。
相应地,本实施例还提供一种包含计算机指令的非易失性可读存储介质。该非易失性可读存储介质中的计算机指令用于物理网卡对主机上的虚拟机的数据访问,主机的处理器执行计算机指令实现本发明实施例中主机的处理器实现的功能。非易失性可读存储介质中的计算机指令用于实现管理程序功能,本发明实施例中管理程序实现的功能在产品形态中可以为管理程序中的计算机程序模块,也可以为可独立安装在插件等,具体产品形态本发明实施例不作限定。相应的,本发明实施例还提供了一种计算机程序产品,包含计算机指令用于运行在主机上的虚拟机通信,主机的处理器执行计算机指令实现本发明实施例中主机的处理器实现的功能。
在本发明所提供的几个实施例中,应该理解到,所公开的装置、方法,可以通过其它的方式实现。所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的。所述计算机指令,可以是存储在一个或者多个分散的非易失性可读存储介质上。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (27)
1.一种数据访问的方法,其特征在于,所述方法应用于主机中,所述主机包括处理器、内存和物理接口卡,虚拟机运行在所述主机上,所述虚拟机包括虚拟机接口卡;
所述方法包括:
所述处理器获取所述内存中的第一描述符,所述第一描述符包含虚拟机物理内存地址和可访问数据的数据长度;所述虚拟机物理内存地址指向所述可访问数据在所述虚拟机的物理内存中存储的起始位置;所述第一描述符是按照所述虚拟机接口卡可识别的编码方式编码的;
所述处理器将所述第一描述符转换为第二描述符,其中,所述第二描述符是按照所述物理接口卡可识别的编码方式编码的;
所述物理接口卡根据所述第二描述符获得所述虚拟机物理内存地址映射到所述内存中的物理地址,根据所述内存中的物理地址访问所述可访问数据。
2.根据权利要求1中所述的方法,其特征在于,所述内存中存储有所述虚拟机接口卡的虚拟队列以及所述物理接口卡的物理队列,所述第一描述符保存在所述虚拟队列中,所述虚拟队列与所述物理队列之间具有对应关系;
所述方法还包括:
所述处理器根据所述对应关系,将所述第二描述符存入所述物理队列;
所述物理接口卡从所述物理队列中获得所述第二描述符。
3.根据权利要求2所述的方法,其特征在于,所述对应关系保存在所述内存中的第一存储空间,所述第一存储空间不可被所述虚拟机访问。
4.根据权利要求1-3任一所述的方法,其特征在于,所述第二描述符包括所述虚拟机物理内存地址和所述数据长度,所述物理接口卡根据所述第二描述符获得所述虚拟机物理内存地址映射到所述内存中的物理地址具体包括:
所述物理接口卡向内存管理单元发送查询消息,以查询所述虚拟机物理内存地址映射到的所述内存中的物理地址,所述查询消息中包含所述虚拟机物理内存地址;
所述物理接口卡接收所述内存管理单元发送的所述内存中的物理地址。
5.根据权利要求1-3中任一所述的方法,其特征在于,所述处理器将所述第一描述符转换为第二描述符,具体包括:
所述处理器根据所述第一描述符获得所述虚拟机物理内存地址;
所述处理器将所述虚拟机物理内存地址映射为所述内存中的物理地址;
所述处理器对所述内存中的物理地址以及所述数据长度进行编码得到所述第二描述符,所述第二描述符包含所述内存中的物理地址和所述数据长度。
6.根据权利要求2所述的方法,其特征在于,所述虚拟队列包括虚拟发送队列,所述物理队列包括物理发送队列,所述可访问数据为待发送的数据,所述第一描述符保存在所述虚拟发送队列中;
所述处理器根据所述对应关系,将所述第二描述符存入所述物理队列,具体包括:所述处理器将所述第二描述符存入所述物理发送队列。
7.根据权利要求2所述的方法,其特征在于,所述虚拟队列包括虚拟接收队列,所述物理队列包括物理接收队列,所述可访问数据为待接收的数据,所述第一描述符保存在所述虚拟接收队列中;
所述处理器根据所述对应关系,将所述第二描述符存入所述物理队列,具体包括:所述处理器将所述第二描述符存入所述物理接收队列。
8.一种主机,其特征在于,所述主机包括处理器、内存和物理接口卡,所述主机用于运行虚拟机,所述虚拟机包括虚拟机接口卡;
所述处理器用于:
从所述内存中获取第一描述符,所述第一描述符包含虚拟机物理内存地址和可访问数据的数据长度;所述虚拟机物理内存地址指向所述可访问数据在所述虚拟机的物理内存中存储的起始位置;所述第一描述符是按照所述虚拟机接口卡可识别的编码方式编码的;将所述第一描述符转换为第二描述符,其中,所述第二描述符是按照所述物理接口卡可识别的编码方式编码的;
所述物理接口卡用于:
根据所述第二描述符获得所述虚拟机物理内存地址映射到的所述内存中的物理地址,根据所述内存中的物理地址访问所述可访问数据。
9.根据权利要求8中所述的主机,其特征在于,所述内存中存储有所述虚拟机接口卡的虚拟队列以及所述物理接口卡的物理队列,所述第一描述符保存在所述虚拟队列中,所述虚拟队列与所述物理队列之间具有对应关系;
所述处理器还用于执行:根据所述对应关系,将所述第二描述符存入所述物理队列;
所述物理接口卡用于执行:从所述物理队列中获得所述第二描述符。
10.根据权利要求9所述的主机,其特征在于,所述对应关系保存在所述内存中的第一存储空间,所述第一存储空间不可被所述虚拟机访问。
11.根据权利要求10所述的主机,其特征在于,所述第二描述符包括所述虚拟机物理内存地址和所述数据长度,所述物理接口卡具体用于向内存管理单元发送查询消息,以查询所述虚拟机物理内存地址映射到的所述内存中的物理地址,所述查询消息中包含所述虚拟机物理内存地址;
所述物理接口卡接收所述内存管理单元发送的所述内存中的物理地址。
12.根据权利要求8-10中任一所述的主机,其特征在于,所述处理器具体用于:
根据所述第一描述符获得所述虚拟机物理内存地址;
将所述虚拟机物理内存地址映射为所述内存中的物理地址;
对所述内存中的物理地址以及所述数据长度进行编码得到所述第二描述符,所述第二描述符包含所述内存中的物理地址和所述数据长度。
13.根据权利要求9所述的主机,其特征在于,所述虚拟队列包括虚拟发送队列,所述物理队列包括物理发送队列,所述可访问数据为待发送的数据,所述第一描述符保存在所述虚拟发送队列中;
所述处理器具体用于将所述第二描述符存入所述物理发送队列。
14.根据权利要求9所述的主机,其特征在于,所述虚拟队列包括虚拟接收队列,所述物理队列包括物理接收队列,所述可访问数据为待接收的数据,所述第一描述符保存在所述虚拟接收队列中;
所述处理器具体用于将所述第二描述符存入所述物理接收队列。
15.一种非易失性计算机可读存储介质,其特征在于,所述非易失性可读存储介质包含计算机指令用于执行数据访问方法,所述方法应用于主机中,所述非易失性可读存储介质包含第一计算机指令,用于获取内存中的第一描述符,所述第一描述符包含虚拟机物理内存地址和可访问数据的数据长度;所述虚拟机物理内存地址指向所述可访问数据在所述虚拟机的物理内存中存储的起始位置;所述第一描述符是按照所述虚拟机接口卡可识别的编码方式编码的;
所述非易失性可读存储介质还包含第二计算机指令,用于将所述第一描述符转换为第二描述符,其中,所述第二描述符是按照所述物理接口卡可识别的编码方式编码的。
16.根据权利要求15所述的非易失性计算机可读存储介质,其特征在于,所述内存中存储有所述虚拟机接口卡的虚拟队列以及所述物理接口卡的物理队列,所述第一描述符保存在所述虚拟队列中,所述虚拟队列与所述物理队列之间具有对应关系;
所述非易失性可读存储介质还包含第三计算机指令,用于根据所述对应关系,将所述第二描述符存入所述物理队列。
17.根据权利要求16所述的非易失性计算机可读存储介质,其特征在于,所述对应关系保存在所述内存中的第一存储空间,所述第一存储空间不可被所述虚拟机访问。
18.根据权利要求16所述的非易失性计算机可读存储介质,其特征在于,所述第二描述符包括所述虚拟机物理内存地址和所述数据长度。
19.根据权利要求15-17中任一所述的非易失性计算机可读存储介质,其特征在于,所述第二计算机指令具体用于:
根据所述第一描述符获得所述虚拟机物理内存地址;
将所述虚拟机物理内存地址映射为所述内存中的物理地址;
对所述内存中的物理地址以及所述数据长度进行编码得到所述第二描述符,所述第二描述符包含所述内存中的物理地址和所述数据长度。
20.根据权利要求16所述的非易失性计算机可读存储介质,其特征在于,所述虚拟队列包括虚拟发送队列,所述物理队列包括物理发送队列,所述可访问数据为待发送的数据,所述第一描述符保存在所述虚拟发送队列中。
21.根据权利要求16所述的非易失性计算机可读存储介质,其特征在于,所述虚拟队列包括虚拟接收队列,所述物理队列包括物理接收队列,所述可访问数据为待接收的数据,所述第一描述符保存在所述虚拟接收队列中。
22.一种数据访问的装置,其特征在于,所述装置应用于主机,所述主机包括处理器、内存和物理接口卡,虚拟机运行在所述主机上,所述虚拟机包括虚拟机接口卡;
所述装置包括获取单元和描述符转换单元;其中,
所述获取单元用于从所述内存中获取第一描述符,所述第一描述符包含虚拟机物理内存地址和可访问数据的数据长度;所述虚拟机物理内存地址指向所述可访问数据在所述虚拟机的物理内存中存储的起始位置;所述第一描述符是按照所述虚拟机接口卡可识别的编码方式编码的;
所述描述符转换单元用于将所述第一描述符转换为第二描述符,其中,所述第二描述符是按照所述物理接口卡可识别的编码方式编码的,使得所述物理接口卡根据所述第二描述符获得所述虚拟机物理内存地址映射到所述内存中的物理地址以访问所述可访问数据。
23.根据权利要求22中所述装置,其特征在于,所述内存中存储有所述虚拟机接口卡的虚拟队列以及所述物理接口卡的物理队列,所述第一描述符保存在所述虚拟队列中,所述虚拟队列与所述物理队列之间具有对应关系;
所述装置还包括存储单元,所述存储单元用于根据所述对应关系,将所述第二描述符存入所述物理队列,使得所述物理接口卡从所述物理队列中获得所述第二描述符。
24.根据权利要求23所述的装置,其特征在于,所述对应关系保存在所述内存中的第一存储空间,所述第一存储空间不可被所述虚拟机访问。
25.根据权利要求22-24中任一所述的装置,其特征在于,所述描述符转换单元具体用于:
根据所述第一描述符获得所述虚拟机物理内存地址;
将所述虚拟机物理内存地址映射为所述内存中的物理地址;
对所述内存中的物理地址以及所述数据长度进行编码得到所述第二描述符,所述第二描述符包含所述内存中的物理地址和所述数据长度。
26.根据权利要求23所述的装置,其特征在于,所述可访问数据为待发送的数据,所述虚拟队列包括虚拟发送队列,所述第一描述符保存在所述虚拟发送队列中,所述物理队列包括物理发送队列;
所述存储单元具体用于将所述第二描述符存入所述物理发送队列。
27.根据权利要求23所述的装置,其特征在于,所述虚拟队列包括虚拟接收队列,所述物理队列包括物理接收队列,所述可访问数据为待接收的数据,所述第一描述符保存在所述虚拟接收队列中;
所述存储单元具体用于将所述第二描述符存入所述物理接收队列。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2017/103203 WO2019056380A1 (zh) | 2017-09-25 | 2017-09-25 | 一种数据访问的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109923528A CN109923528A (zh) | 2019-06-21 |
CN109923528B true CN109923528B (zh) | 2021-04-09 |
Family
ID=65810065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780040464.7A Active CN109923528B (zh) | 2017-09-25 | 2017-09-25 | 一种数据访问的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11249934B2 (zh) |
EP (1) | EP3671472B1 (zh) |
CN (1) | CN109923528B (zh) |
WO (1) | WO2019056380A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
LU101361B1 (en) * | 2019-08-26 | 2021-03-11 | Microsoft Technology Licensing Llc | Computer device including nested network interface controller switches |
CN113472571B (zh) * | 2021-06-28 | 2023-11-03 | 北京汇钧科技有限公司 | 一种智能网卡设备和智能网卡设备的旁路探测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6954806B2 (en) * | 2002-03-29 | 2005-10-11 | Fujitsu Limited | Data transfer apparatus and method |
CN1761222A (zh) * | 2005-11-22 | 2006-04-19 | 华中科技大学 | 一种支持虚拟接口的存储网络适配器 |
CN101068237A (zh) * | 2006-08-28 | 2007-11-07 | 腾讯科技(深圳)有限公司 | 数据访问系统以及数据访问方法 |
CN102124525A (zh) * | 2008-02-27 | 2011-07-13 | 密克罗奇普技术公司 | 虚拟存储器接口 |
CN102999610A (zh) * | 2012-11-22 | 2013-03-27 | 用友软件股份有限公司 | 数据访问系统和数据访问方法 |
CN104428793A (zh) * | 2012-07-09 | 2015-03-18 | 西斯维尔科技有限公司 | 用于转换基于梯度直方图的图像描述符的方法和相关图像处理设备 |
CN105765525A (zh) * | 2013-10-25 | 2016-07-13 | 超威半导体公司 | 加载和存储单元以及数据高速缓存的排序和带宽改进 |
CN106030526A (zh) * | 2013-12-13 | 2016-10-12 | 雷蛇(亚太)私人有限公司 | 装置、更新器、控制装置的方法、及控制更新器的方法 |
CN106663024A (zh) * | 2014-07-14 | 2017-05-10 | 甲骨文国际公司 | 变量句柄 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050144422A1 (en) * | 2003-12-30 | 2005-06-30 | Mcalpine Gary L. | Virtual to physical address translation |
JP5748349B2 (ja) * | 2012-03-16 | 2015-07-15 | 株式会社日立製作所 | 仮想計算機の制御方法及び仮想計算機システム |
US9477505B2 (en) * | 2012-08-14 | 2016-10-25 | Oracle International Corporation | Method for reducing the overhead associated with a virtual machine exit when handling instructions related to descriptor tables |
US9276942B2 (en) * | 2012-09-07 | 2016-03-01 | Oracle International Corporation | Multi-tenancy identity management system |
CN103414535B (zh) * | 2013-07-31 | 2017-04-19 | 华为技术有限公司 | 数据发送方法和数据接收方法及相关装置 |
WO2015130282A1 (en) * | 2014-02-27 | 2015-09-03 | Hewlett-Packard Development Company, L. P. | Communication between integrated graphics processing units |
KR101554633B1 (ko) * | 2014-03-04 | 2015-09-21 | 한국전자통신연구원 | 악성 코드 검출 장치 및 그 방법 |
JP2016167143A (ja) * | 2015-03-09 | 2016-09-15 | 富士通株式会社 | 情報処理システムおよび情報処理システムの制御方法 |
US9948579B1 (en) * | 2015-03-30 | 2018-04-17 | Juniper Networks, Inc. | NIC-based packet assignment for virtual networks |
CN106301859B (zh) * | 2015-06-09 | 2020-02-14 | 华为技术有限公司 | 一种管理网卡的方法、装置及系统 |
CN106612306A (zh) * | 2015-10-22 | 2017-05-03 | 中兴通讯股份有限公司 | 虚拟机的数据共享方法及装置 |
US10263832B1 (en) * | 2016-12-29 | 2019-04-16 | Juniper Networks, Inc. | Physical interface to virtual interface fault propagation |
US11178023B2 (en) * | 2017-06-30 | 2021-11-16 | Intel Corporation | Data plane interface network quality of service in multi-tenant data centers |
US20190158429A1 (en) * | 2019-01-29 | 2019-05-23 | Intel Corporation | Techniques to use descriptors for packet transmit scheduling |
-
2017
- 2017-09-25 EP EP17926182.1A patent/EP3671472B1/en active Active
- 2017-09-25 CN CN201780040464.7A patent/CN109923528B/zh active Active
- 2017-09-25 WO PCT/CN2017/103203 patent/WO2019056380A1/zh unknown
-
2020
- 2020-03-19 US US16/824,283 patent/US11249934B2/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6954806B2 (en) * | 2002-03-29 | 2005-10-11 | Fujitsu Limited | Data transfer apparatus and method |
CN1761222A (zh) * | 2005-11-22 | 2006-04-19 | 华中科技大学 | 一种支持虚拟接口的存储网络适配器 |
CN101068237A (zh) * | 2006-08-28 | 2007-11-07 | 腾讯科技(深圳)有限公司 | 数据访问系统以及数据访问方法 |
CN102124525A (zh) * | 2008-02-27 | 2011-07-13 | 密克罗奇普技术公司 | 虚拟存储器接口 |
CN104428793A (zh) * | 2012-07-09 | 2015-03-18 | 西斯维尔科技有限公司 | 用于转换基于梯度直方图的图像描述符的方法和相关图像处理设备 |
CN102999610A (zh) * | 2012-11-22 | 2013-03-27 | 用友软件股份有限公司 | 数据访问系统和数据访问方法 |
CN105765525A (zh) * | 2013-10-25 | 2016-07-13 | 超威半导体公司 | 加载和存储单元以及数据高速缓存的排序和带宽改进 |
CN106030526A (zh) * | 2013-12-13 | 2016-10-12 | 雷蛇(亚太)私人有限公司 | 装置、更新器、控制装置的方法、及控制更新器的方法 |
CN106663024A (zh) * | 2014-07-14 | 2017-05-10 | 甲骨文国际公司 | 变量句柄 |
Non-Patent Citations (1)
Title |
---|
一种低开销的面向节点内互连的网络接口控制器;苏勇;《计算机学报》;20140826;全文 * |
Also Published As
Publication number | Publication date |
---|---|
EP3671472B1 (en) | 2022-05-04 |
EP3671472A1 (en) | 2020-06-24 |
US11249934B2 (en) | 2022-02-15 |
WO2019056380A1 (zh) | 2019-03-28 |
CN109923528A (zh) | 2019-06-21 |
US20200218685A1 (en) | 2020-07-09 |
EP3671472A4 (en) | 2020-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109314726B (zh) | 操作系统容器之间通讯的系统和方法 | |
CN113296884B (zh) | 虚拟化方法、装置、电子设备、介质及资源虚拟化系统 | |
CN107209681B (zh) | 一种存储设备访问方法、装置和系统 | |
CN103870311B (zh) | 通过半虚拟化驱动访问硬件的方法、后端驱动及前端驱动 | |
EP3211530B1 (en) | Virtual machine memory management method, physical main machine, pcie device and configuration method therefor, and migration management device | |
EP4428684A1 (en) | Data access method and computing device | |
CN112148418A (zh) | 用于访问数据的方法、装置、设备和介质 | |
JP2013515983A (ja) | 仮想化環境においてi/o処理を行う方法および装置 | |
US11397697B2 (en) | Core-to-core communication | |
CN104951252A (zh) | 一种数据访问方法及PCIe存储设备 | |
US20240330199A1 (en) | Secure memory access in a virtualized computing environment | |
CN113032103B (zh) | 基于高速网卡sr-iov功能的vf资源动态调度方法 | |
CN109582435B (zh) | 用于灵活的虚拟功能队列分配的方法以及设备 | |
US8996774B2 (en) | Performing emulated message signaled interrupt handling | |
US11741039B2 (en) | Peripheral component interconnect express device and method of operating the same | |
US11249934B2 (en) | Data access method and apparatus | |
CN105677491B (zh) | 一种数据传输方法及装置 | |
US8984179B1 (en) | Determining a direct memory access data transfer mode | |
WO2023221847A1 (zh) | 基于虚拟机设备直通的数据访问方法、设备以及系统 | |
CN113419845A (zh) | 计算加速方法和装置、计算系统、电子设备及计算机可读存储介质 | |
CN118159951A (zh) | 一种处理请求的方法、装置及系统 | |
CN109857553B (zh) | 内存管理方法及装置 | |
US20180052700A1 (en) | Facilitation of guest application display from host operating system | |
CN113157624A (zh) | 一种串口通信方法、装置、设备及存储介质 | |
US20160026567A1 (en) | Direct memory access method, system and host module for virtual machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220223 Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province Patentee after: Huawei Cloud Computing Technologies Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TR01 | Transfer of patent right |