CN111367472A - 虚拟化方法和装置 - Google Patents

虚拟化方法和装置 Download PDF

Info

Publication number
CN111367472A
CN111367472A CN202010126834.2A CN202010126834A CN111367472A CN 111367472 A CN111367472 A CN 111367472A CN 202010126834 A CN202010126834 A CN 202010126834A CN 111367472 A CN111367472 A CN 111367472A
Authority
CN
China
Prior art keywords
data block
disk
block information
request
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010126834.2A
Other languages
English (en)
Inventor
谢永吉
柴稳
张宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010126834.2A priority Critical patent/CN111367472A/zh
Publication of CN111367472A publication Critical patent/CN111367472A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0664Virtualisation aspects at device level, e.g. emulation of a storage device or system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45579I/O management, e.g. providing access to device drivers or storage

Abstract

本发明涉及一种虚拟化方法和装置。本申请公开了语言模型预训练方法和装置。该方法的一具体实施方式包括:获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作。该实施方式使得虚拟机可根据获取到虚拟磁盘和物理磁盘的映射关系控制物理磁盘执行I/O请求所指示的操作,避免了虚拟机I/O请求经VMM、文件系统等中间模块转化访问物理磁盘所造成的虚拟化损耗,进而有效提升了虚拟机的存储性能。

Description

虚拟化方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及磁盘存储技术领域,尤其涉及一种虚拟化方法和装置。
背景技术
现有技术中,虚拟机对NVME(Non-Volatile Memory express,非易失性内存主机控制器接口规范)技术的利用主要有两类方案:
第一种则是利用virtio这个半虚拟化技术,在宿主机的NVME SSD(Solid StateDrive,固态驱动器)盘上创建一个文件,将这个文件通过virtio-blk技术虚拟成虚拟机中的一块virtio磁盘,虚拟机对该磁盘的访问将被VMM(Virtual Machine Monitor,虚拟机监视器)转换成对NVME SSD盘上该文件的访问,之后再通过宿主机文件系统,最终转换成对NVME SSD盘中数据块的访问。
第二种则是基于vfio直通设备机制,将宿主机的整块NVME SSD盘透传到虚拟机中,虚拟机具备对该块盘的完整访问权限。所以,虚拟机对该磁盘的访问将直接作用到真实的物理盘上,不需要经过VMM的转换。
发明内容
本申请实施例提出了虚拟化方法和装置。
第一方面,本申请提供了一种虚拟化方法,该方法包括:获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;基于虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作。
在一些实施例中,在获取虚拟机发送的I/O请求之前,该方法还包括:响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表。
在一些实施例中,在获取虚拟机发送的I/O请求之前,该方法还包括:获取与宿主机内存共享的I/O队列信息,队列信息包括与虚拟磁盘对应的物理磁盘分配给虚拟磁盘的队列的标识;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作,包括:基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,将I/O请求写入I/O队列信息所指示的队列,并通知物理磁盘执行I/O请求所指示的操作。
在一些实施例中,在获取与宿主机内存共享的I/O队列信息之前,该方法还包括:接收创建I/O队列的请求;将创建I/O队列的请求发送至虚拟化层,以使虚拟化层通知物理磁盘创建I/O队列并将队列信息存储在宿主机内存以共享,得到共享的I/O队列信息。
在一些实施例中,物理磁盘包括固态驱动器SSD磁盘,并且SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口,以及在获取虚拟机发送的I/O请求之前,该方法还包括:响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的DoorBell寄存器;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作包括:基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行所述I/O请求所指示的操作。
第二方面,本申请提供了一种虚拟化装置,该装置包括:获取模块,配置用于获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;查询模块,配置用于基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;控制模块,配置用于基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作。
在一些实施例中,在获取模块之前,该装置还包括:接收模块,配置用于响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表。
在一些实施例中,在获取模块之前,该装置还包括:共享模块,配置用于获取与宿主机内存共享的I/O队列信息,所述队列信息包括与所述虚拟磁盘对应的物理磁盘分配给虚拟磁盘的队列的标识;以及控制模块进一步配置用于基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,将I/O请求写入I/O队列信息所指示的队列,并通知物理磁盘执行所述I/O请求所指示的操作。
在一些实施例中,在共享模块之前,该装置还包括:创建模块,配置用于接收创建I/O队列的请求;发送模块,配置用于将创建I/O队列的请求发送至虚拟化层,以使虚拟化层通知物理磁盘创建I/O队列并将队列信息存储在宿主机内存以共享,得到共享的I/O队列信息。
在一些实施例中,物理磁盘包括固态驱动器SSD磁盘,并且SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口,以及在获取模块之前,所述装置还包括:响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取寄存器模块,获取与虚拟化层共享的DoorBell寄存器信息;以及控制模块,进一步配置用于基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行I/O请求所指示的操作。
第三方面,本申请提供了一种电子设备,该电子设备包括一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被该一个或多个处理器执行,使得一个或多个处理器实现语言模型预训练方法。
第四方面,本申请提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现语言模型预训练方法。
本申请提供的虚拟化方法和装置,通过获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作,使得虚拟机可根据获取到虚拟磁盘和物理磁盘的映射关系控制物理磁盘执行I/O请求所指示的操作,避免了虚拟机I/O请求经VMM、文件系统等中间模块转化访问物理磁盘所造成的虚拟化损耗,进而有效提升了虚拟机的存储性能。
附图说明
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的虚拟化方法的一个实施例的流程图;
图3是根据本申请的虚拟化方法的一个应用场景的示意图;
图4是根据本申请的虚拟化方法的又一个实施例的流程图;
图5是根据本申请的虚拟化装置的一个实施例的示意图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的虚拟化方法的实施例的示例性系统架构100。
如图1所示,系统架构包括宿主机101、虚拟机102、虚拟磁盘103、虚拟磁盘驱动104和物理磁盘105。
宿主机101可以理解为担当以“宿主”身份的物理机,用户可以在宿主机中创建相应的服务,该服务租用宿主机的内存、CPU、硬盘等资源,例如常见的虚拟机,虚拟机寄宿在宿主机内,其需要利用宿主机的内存、CPU(Central Processing Unit,中央处理器)、硬盘等资源才能运行。宿主机101可以实现成由多个宿主机组成的分布式宿主机集群,也可以实现成单个宿主机。
宿主机101上可以包括虚拟机102,虚拟机又可以包括虚拟磁盘103和虚拟磁盘驱动104。这里,虚拟磁盘103可以由物理磁盘105虚拟化得到。其中,物理磁盘105可以是宿主机101内的本地SAS盘、NVMe盘、内存等物理设备,也可以是远端的高速存储网络设备。
虚拟磁盘驱动104可以是半虚拟化驱动。半虚拟化是一种类似于全虚拟化的技术,它使用Hypervisor(虚拟机管理程序)分享存取底层的硬件,但是它的客户操作系统集成了虚拟化方面的代码。该方法无需重新编译或引起陷阱,因为操作系统自身能够与虚拟化进程进行很好的协作。
需要说明的是,本申请实施例所提供的虚拟化方法一般由虚拟磁盘驱动104执行。虚拟化的装置也一般设置于宿主机101中。
应该理解,图1中的宿主机101、虚拟机102、虚拟磁盘103、虚拟磁盘驱动104和物理磁盘105的数目仅仅是示意性的。根据实现需要,可以具有任意数目的宿主机、虚拟机、虚拟磁盘、虚拟磁盘驱动和物理磁盘。
图2示出了可以应用于本申请的虚拟化方法的实施例的流程示意图200。虚拟化方法包括以下步骤:
步骤201,获取虚拟机发送的I/O请求。
在本实施例中,执行主体(例如,图1中的虚拟磁盘驱动104)获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息。
其中,虚拟磁盘是在虚拟机建立过程中,VMM对物理磁盘进行虚拟化得到的。物理磁盘可以是现有技术或未来发展技术中的存储介质,例如,本地SAS盘、NVMe盘、内存等物理设备,也可以是远端的高速存储网络设备等,本申请对此不作限定。
这里,物理磁盘的最小存储单元为扇区,通常每个扇区的大小为512字节,但是操作系统不是直接管理每一个扇区,而是将若干个扇区组成一个更大的集合—数据块(通常一个物理磁盘的数据块=单个扇区大小×2n,n为整数)进行管理。相应地,虚拟磁盘也被划分许多数据块,即虚拟磁盘的数据块,虚拟磁盘的数据块与物理磁盘的数据块之间相互映射。
需要指出的是,物理磁盘的数据块可以称为块(Linux操作系统下),也可以称为簇(Windows操作系统下),本申请对此不作限定。
此外,虚拟磁盘的数据块信息通常包括偏移量和长度。其中,偏移量用于确定至少一个数据块中首个数据块的存储位置,具体地,虚拟磁盘的初始存储位置加上该偏移量即为首个数据块的存储位置,例如,虚拟磁盘的初始存储位置是12F80,偏移量是0100,那么至少一个数据块中首个数据块的存储位置为12F80+0010=13080H;长度用于确定至少一个数据块中最后一个数据块的存储位置。
步骤202,基于虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息。
在本实施例中,执行主体根据获取的虚拟磁盘的数据块信息,查询存储在虚拟化层以供虚拟化层与虚拟磁盘驱动共享的数据块信息映射表,得到虚拟磁盘的数据块信息对应的物理磁盘的数据块信息。
这里,共享数据块信息映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系。
其中,虚拟化层即hypervisor,是一种运行在基础物理服务器和操作系统之间的中间软件层,可允许多个操作系统和应用共享硬件。也可以叫做VMM,即虚拟机监视器,或虚拟机管理程序。Hypervisor是一种在虚拟环境中的“元”操作系统,可以访问服务器上包括磁盘和内存的所有物理设备。
此外,共享数据块信息映射表可以由宿主机从物理磁盘的文件系统处获得并上传至虚拟化层。
其中,文件系统是操作系统用于明确存储设备(常见的是磁盘,也有基于NANDFlash的固态硬盘)或分区上的文件的方法和数据结构;即在存储设备上组织文件的方法。操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,简称文件系统。常用的文件系统有FAT(File Allocation Table,文档分配表)、NTFS(New Technology FileSystem,新技术文件系统)等,本申请对此不做限定。通过文件系统对磁盘进行管理,可保证磁盘空间的有效利用。
步骤203,基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作。
在本实施例中,执行主体基于查询到的与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作,例如,读或写。
其中,执行主体可以采用现有技术或未来发展技术中的控制物理磁盘执行I/O请求所指示的操作的方式,例如,发送预设的指令以控制物理磁盘执行I/O请求所指示的操作,本申请对此不作限定。
继续参见图3,图3是根据本实施例的虚拟化方法的应用场景的一个示意图。
在图3的应用场景中,运行在宿主机301上的执行主体302获取虚拟机发送的I/O请求303,I/O请求303包括虚拟磁盘的数据块信息,例如,偏移地址、长度等。执行主体302基于得到的虚拟磁盘的数据块信息,获取与虚拟化层304共享的数据块信息映射表305,并根据虚拟磁盘的数据块信息进行查询。这里,共享的数据块映射表305用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系,例如,虚拟磁盘数据块1对应物理磁盘数据块2,虚拟磁盘数据块3对应物理磁盘数据块5等等。执行主体302在获取到虚拟磁盘数据块信息对应的物理磁盘的数据块信息后,控制物理磁盘执行I/O请求所指示的操作,例如,读取物理磁盘数据块所指示的地址中的数据,或将数据写入物理磁盘数据块所指示的地址。
本公开的实施例提供的虚拟化方法,具体包括:获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作。该实施方式使得虚拟机可根据获取到虚拟磁盘和物理磁盘的映射关系控制物理磁盘执行I/O请求所指示的操作,避免了虚拟机I/O请求经VMM、文件系统等中间模块转化访问物理磁盘所造成的虚拟化损耗,进而有效提升了虚拟机的存储性能。
进一步参考图4,其示出了虚拟化方法的又一个实施例的流程400。在本实施例中,物理磁盘包括固态驱动器SSD磁盘,并且SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口。本实施例的虚拟化方法的流程400,可包括以下步骤:
步骤401,响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的DoorBell寄存器信息。
在本实施例中,执行主体响应于接收到虚拟机发送的初始化采用NVMe接口的虚拟SSD磁盘的请求,获取与虚拟化层共享的Doorbell寄存器信息。
这里,NVMe接口采用NVMe协议,NVMe协议是专门为固态硬盘等高性能存储介质设计的存储协议,相比传统的存储协议,具有非常明显的优势,例如多队列、多核支持、高队列深度、低延时等。NVMe与SSD存储的组合,将使存储介质的访问速度提升一个层次。目前NVMe的SSD存储访问时延在20us以下,这相对于传统存储访问速度的ms级别,提升效果非常明显。
NVMe中含有多个I/O队列对,I/O队列对主要包括提交队列和完成队列。NVMe主要通过写门铃(Doorbell)寄存器来告知位于物理磁盘上控制器队列中是否有新增请求/命令。每个队列都对应一个门铃寄存器。
步骤402,获取虚拟机发送的I/O请求。
在本实施例中,步骤402的实现细节和技术效果,可以参考对步骤202的描述,在此不再赘述。
步骤403,基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息。
在本实施例中,步骤403的实现细节和技术效果,可以参考对步骤203的描述,在此不再赘述。
步骤404,基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行I/O请求所指示的操作。
在本实施例中,执行主体将I/O请求写入提交队列的尾部,并更新映射到位于物理磁盘寄存器空间中的门铃寄存器,此时,位于物理磁盘的控制器就知道有新的请求/命令到来,接下来就可以进行处理。
本实施例与实施例2的主要区别在于物理磁盘包括固态驱动器SSD磁盘,并且SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口,以及在获取虚拟机发送的I/O请求之前,还包括:响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的DoorBell寄存器信息;以及基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作包括:基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行所述I/O请求所指示的操作。该实现方式实现了NVMe设备的半虚拟化,可以让半虚拟化NVME驱动获取到虚拟磁盘和物理磁盘的映射关系,避免了虚拟机访问NVMe磁盘的虚拟化损耗。
可以理解的是,在不冲突的前提下,图2所示实施例中的各种可选的实现方式也适用于本实施例的虚拟化方法。例如,执行主体可以在获取I/O请求之前,响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表和Doorbell寄存器信息,以及获取与宿主机内存共享的I/O队列信息,之后基于查询到的与虚拟磁盘的数据块信息对应的物理磁盘的数据块的信息,将I/O请求写入I/O队列信息所指示的队列,并对Doorbell寄存器执行写操作以通知物理磁盘执行I/O请求所指示的操作,最终通过共享数据块信息映射表、Doorbell寄存器信息和I/O队列信息,实现NVMe设备的半虚拟化,同时进一步减少虚拟化损耗。
在上述任一实施例的一些可选的实现方式中,在获取虚拟机发送的I/O请求之前,该方法还可以包括:响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表。
在这些可选的实现方式中,执行主体可以响应于接收到虚拟机发送的初始化虚拟磁盘的请求,从虚拟化层获取共享的数据块信息映射表,以保证后续在获取到I/O请求后,可直接基于I/O请求中的数据块信息对共享数据块信息映射表进行查询。
在上述任一实施例的一些可选的实现方式中,在获取虚拟机发送的I/O请求之前,该方法还可以包括:获取与宿主机内存共享的I/O队列信息,以及基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作包括:基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,将I/O请求写入I/O队列信息所指示的队列,并通知物理磁盘执行I/O请求所指示的操作。
在这些可选的实现方式中,执行主体在获取虚拟机发送的I/O请求之前,获取与宿主机内存共享的I/O队列信息。
这里,队列信息例如可以包括与虚拟磁盘对应的物理磁盘分配给虚拟磁盘的队列的标识。
具体地,每个物理磁盘具有多个I/O队列,标识例如可以分别为1、2、3、4、5。物理磁盘可分配其中的标识为2和3的I/O队列给对应的虚拟磁盘,这样一来,I/O队列信息中包括的I/O队列的标识为2和3。
此外,由于执行主体可在宿主机内存获取到共享的I/O队列信息,因此,执行主体可通过将I/O请求I/O队列信息所指示的队列,并通知物理磁盘执行I/O请求所指示的操作的方式控制物理磁盘执行上述操作。
在上述任一实施例的一些可选的实现方式中,在获取与宿主机内存共享的I/O队列信息之前,该方法还包括:接收创建I/O队列的请求;将创建I/O队列的请求发送至虚拟化层,以使虚拟化层通知物理磁盘创建I/O队列并将队列信息存储在宿主机内存以共享。
在这些可选的实现方式中,执行主体可以在接收到虚拟机发送的创建I/O队列的请求后,将该请求发送至虚拟化层,由虚拟化层通过宿主机的控制模块通知虚拟磁盘对应的物理磁盘创建I/O队列信息。这里,宿主机中的控制模块用于维护与当前宿主机对应的所有虚拟机的I/O队列,从而有效避免I/O队列的冲突。宿主机中的控制模块在通知物理磁盘创建队列后,将队列信息存储在内存中,以共享给执行主体。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种虚拟化装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的虚拟化装置500包括:获取模块501、查询模块502、控制模块503。其中,获取模块501,配置用于获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;查询模块502,配置用于基于虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;控制模块503,配置用于基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作。
在本实施例中,虚拟化装置500中的获取模块501的虚拟磁盘是在虚拟机建立过程中,VMM对物理磁盘进行虚拟化得到的。
在本实施例中,上述查询模块502根据获取虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到虚拟磁盘的数据块信息对应的物理磁盘的数据块信息。
其中,虚拟化层即hypervisor,是一种运行在基础物理服务器和操作系统之间的中间软件层,可允许多个操作系统和应用共享硬件。也可以叫做VMM,即虚拟机监视器,或虚拟机管理程序。Hypervisor是一种在虚拟环境中的“元”操作系统,可以访问服务器上包括磁盘和内存的所有物理设备。
这里,共享数据块信息映射表可以由宿主机从物理磁盘的文件系统处获得并上传至虚拟化层。
其中,文件系统是操作系统用于明确存储设备(常见的是磁盘,也有基于NANDFlash的固态硬盘)或分区上的文件的方法和数据结构;即在存储设备上组织文件的方法。操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,简称文件系统。常用的文件系统有Ext、FAT、NTFS等,本申请对此不做限定。
在本实施例的一些可选的实现方式中,在所述获取模块之前,所述装置还包括:接收模块,配置用于响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表。
在本实施例中,上述控制模块503基于查询到的与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作,例如,读或写。
在一些可选的方式中,在获取模块之前,该装置还包括:共享模块,配置用于获取与宿主机内存共享的I/O队列信息,队列信息包括与虚拟磁盘对应的物理磁盘分配给虚拟磁盘的队列的标识;以及控制模块进一步配置用于基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,将I/O请求写入I/O队列信息所指示的队列,并通知物理磁盘执行I/O请求所指示的操作
在一些可选的方式中,在共享模块之前,该装置还包括:创建模块,配置用于接收创建I/O队列的请求;发送模块,配置用于将创建I/O队列的请求发送至虚拟化层,以使虚拟化层通知物理磁盘创建I/O队列并将队列信息存储在宿主机内存以共享,得到共享的I/O队列信息。
在一些可选的方式中,物理磁盘包括固态驱动器SSD磁盘,并且所述SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口,以及在获取模块之前,该装置还包括:获取寄存器模块,获取与虚拟化层共享的DoorBell寄存器;以及控制模块,进一步配置用于基于所述与虚拟磁盘的数据块信息对应的物理磁盘的据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行所述I/O请求所指示的操作。
下面参考图6,其示出了适于用来实现本申请实施例的客户端设备或服务器的计算机系统600的结构示意图。
如图6所示,计算机系统600包括处理器(例如,中央处理单元CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、查询模块、控制模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取虚拟机发送的I/O请求”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中的装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入客户端端设备中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当该一个或者多个程序被一个设备执行时,使得该设备:获取虚拟机发送的I/O请求,I/O请求包括虚拟磁盘的数据块信息;基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;基于与虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行I/O请求所指示的操作。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种虚拟化方法,所述方法包括:
获取虚拟机发送的输入/输出I/O请求,所述I/O请求包括虚拟磁盘的数据块信息;
基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,所述共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;
基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作。
2.根据权利要求1所述的方法,在所述获取虚拟机发送的I/O请求之前,所述方法还包括:
响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表。
3.根据权利要求1或2任一所述的方法,在所述获取虚拟机发送的I/O请求之前,所述方法还包括:
获取与宿主机内存共享的I/O队列信息,所述队列信息包括与所述虚拟磁盘对应的物理磁盘分配给所述虚拟磁盘的队列的标识;
所述基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作,包括:
基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,将I/O请求写入I/O队列信息所指示的队列,并通知物理磁盘执行所述I/O请求所指示的操作。
4.根据权利要求3所述的方法,在获取与宿主机内存共享的I/O队列信息之前,所述方法还包括:
接收创建I/O队列的请求;
将所述创建I/O队列的请求发送至虚拟化层,以使虚拟化层通知物理磁盘创建I/O队列并将队列信息存储在宿主机内存以共享。
5.根据权利要求1所述的方法,所述物理磁盘包括固态驱动器SSD磁盘,并且所述SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口,以及在所述获取虚拟机发送的I/O请求之前,所述方法还包括:
响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的DoorBell寄存器信息;
所述基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作包括:
基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行所述I/O请求所指示的操作。
6.一种虚拟化装置,所述装置包括:
获取模块,配置用于获取虚拟机发送的I/O请求,所述I/O请求包括虚拟磁盘的数据块信息;
查询模块,配置用于基于所述虚拟磁盘的数据块信息,查询与虚拟化层共享的数据块信息映射表,得到与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,所述共享的数据块映射表用于表征物理磁盘的数据块信息与虚拟磁盘的数据块信息的映射关系;
控制模块,配置用于基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,控制物理磁盘执行所述I/O请求所指示的操作。
7.根据权利要求6所述的装置,在所述获取模块之前,所述装置还包括:
接收模块,配置用于响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的数据块信息映射表。
8.根据权利要求6或7任一所述的装置,在所述获取模块之前,所述装置还包括:
共享模块,配置用于获取与宿主机内存共享的I/O队列信息,所述队列信息包括与所述虚拟磁盘对应的物理磁盘分配给所述虚拟磁盘的队列的标识;
所述控制模块进一步配置用于基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,将I/O请求写入I/O队列信息所指示的队列,并通知物理磁盘执行所述I/O请求所指示的操作。
9.根据权利要求8所述的装置,在所述共享模块之前,所述装置还包括:
创建模块,配置用于接收创建I/O队列的请求;
发送模块,配置用于将所述创建I/O队列的请求发送至虚拟化层,以使虚拟化层通知物理磁盘创建I/O队列并将队列信息存储在宿主机内存以共享。
10.根据权利要求6所述的装置,所述物理磁盘包括固态驱动器SSD磁盘,并且所述SSD磁盘采用到主机设备的非易失性存储器快速NVMe接口,以及在所述获取模块之前,所述装置还包括:
获取寄存器模块,配置用于响应于接收到虚拟机发送的初始化虚拟磁盘的请求,获取与虚拟化层共享的DoorBell寄存器信息;
以及所述控制模块,进一步配置用于基于所述与所述虚拟磁盘的数据块信息对应的物理磁盘的数据块信息,对Doorbell寄存器执行写操作,以通知物理磁盘执行所述I/O请求所指示的操作。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202010126834.2A 2020-02-28 2020-02-28 虚拟化方法和装置 Pending CN111367472A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010126834.2A CN111367472A (zh) 2020-02-28 2020-02-28 虚拟化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010126834.2A CN111367472A (zh) 2020-02-28 2020-02-28 虚拟化方法和装置

Publications (1)

Publication Number Publication Date
CN111367472A true CN111367472A (zh) 2020-07-03

Family

ID=71208217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010126834.2A Pending CN111367472A (zh) 2020-02-28 2020-02-28 虚拟化方法和装置

Country Status (1)

Country Link
CN (1) CN111367472A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114281252A (zh) * 2021-12-10 2022-04-05 阿里巴巴(中国)有限公司 非易失性高速传输总线NVMe设备的虚拟化方法及设备
CN114625481A (zh) * 2022-03-22 2022-06-14 北京有竹居网络技术有限公司 数据处理方法、装置、可读介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375695A (zh) * 2010-08-23 2012-03-14 联想(北京)有限公司 一种磁盘的访问方法及计算机系统
CN102467408A (zh) * 2010-11-12 2012-05-23 阿里巴巴集团控股有限公司 一种虚拟机数据的访问方法和设备
CN106201349A (zh) * 2015-12-31 2016-12-07 华为技术有限公司 一种在物理主机中处理读/写请求的方法和装置
CN108008911A (zh) * 2016-11-01 2018-05-08 阿里巴巴集团控股有限公司 读写请求处理方法及装置
CN108073352A (zh) * 2016-11-15 2018-05-25 华为技术有限公司 虚拟磁盘处理方法及装置
CN109597677A (zh) * 2018-12-07 2019-04-09 北京百度网讯科技有限公司 用于处理信息的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375695A (zh) * 2010-08-23 2012-03-14 联想(北京)有限公司 一种磁盘的访问方法及计算机系统
CN102467408A (zh) * 2010-11-12 2012-05-23 阿里巴巴集团控股有限公司 一种虚拟机数据的访问方法和设备
CN106201349A (zh) * 2015-12-31 2016-12-07 华为技术有限公司 一种在物理主机中处理读/写请求的方法和装置
CN108008911A (zh) * 2016-11-01 2018-05-08 阿里巴巴集团控股有限公司 读写请求处理方法及装置
CN108073352A (zh) * 2016-11-15 2018-05-25 华为技术有限公司 虚拟磁盘处理方法及装置
CN109597677A (zh) * 2018-12-07 2019-04-09 北京百度网讯科技有限公司 用于处理信息的方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114281252A (zh) * 2021-12-10 2022-04-05 阿里巴巴(中国)有限公司 非易失性高速传输总线NVMe设备的虚拟化方法及设备
CN114625481A (zh) * 2022-03-22 2022-06-14 北京有竹居网络技术有限公司 数据处理方法、装置、可读介质及电子设备
CN114625481B (zh) * 2022-03-22 2024-04-05 北京有竹居网络技术有限公司 数据处理方法、装置、可读介质及电子设备

Similar Documents

Publication Publication Date Title
US11093177B2 (en) Virtualized OCSSDs spanning physical OCSSD channels
US10817333B2 (en) Managing memory in devices that host virtual machines and have shared memory
US9448728B2 (en) Consistent unmapping of application data in presence of concurrent, unquiesced writers and readers
US11243707B2 (en) Method and system for implementing virtual machine images
JP5657121B2 (ja) 仮想マシンのオンデマンド型イメージ・ストリーミング
US9304804B2 (en) Replicating virtual machines across different virtualization platforms
US9697024B2 (en) Interrupt management method, and computer implementing the interrupt management method
US9612966B2 (en) Systems, methods and apparatus for a virtual machine cache
AU2007248886B2 (en) Converting machines to virtual machines
US9495172B2 (en) Method of controlling computer system and computer system
CN115413338A (zh) 在计算环境中提供加速器与存储装置之间的直接数据访问
EP3350700B1 (en) Multi root i/o virtualization system
CN111367472A (zh) 虚拟化方法和装置
CN107528871B (zh) 存储系统中的数据分析
US10169062B2 (en) Parallel mapping of client partition memory to multiple physical adapters
JP5492731B2 (ja) 仮想計算機のボリューム割当て方法およびその方法を用いた計算機システム
US11640311B2 (en) Providing non-volatile storage for permanent data to virtual machines
US20230185593A1 (en) Virtual device translation for nested virtual machines
US10599334B2 (en) Use of capi-attached storage as extended memory
CN117331704B (zh) 图形处理器gpu调度方法、装置和存储介质
WO2022222977A1 (zh) 用于运行云业务实例的物理服务器的内存管理方法和装置
WO2017113329A1 (zh) 一种主机集群中缓存管理方法及主机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination