CN109324755A - 一种i/o请求派发方法及装置 - Google Patents

一种i/o请求派发方法及装置 Download PDF

Info

Publication number
CN109324755A
CN109324755A CN201810897159.6A CN201810897159A CN109324755A CN 109324755 A CN109324755 A CN 109324755A CN 201810897159 A CN201810897159 A CN 201810897159A CN 109324755 A CN109324755 A CN 109324755A
Authority
CN
China
Prior art keywords
request
zone
lock
distribute
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810897159.6A
Other languages
English (en)
Inventor
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Huawei Technology Co Ltd
Original Assignee
Chengdu Huawei Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Huawei Technology Co Ltd filed Critical Chengdu Huawei Technology Co Ltd
Priority to CN201810897159.6A priority Critical patent/CN109324755A/zh
Publication of CN109324755A publication Critical patent/CN109324755A/zh
Priority to PCT/CN2019/095922 priority patent/WO2020029749A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0676Magnetic disk device

Abstract

本申请实施例提供一种I/O请求派发方法及装置,涉及计算机技术领域,实现顺序并发调度写I/O请求时避免寻道风暴,提高SMR盘的性能。具体包括:查询写I/O请求在SMR盘中的目标Zone的Zone锁状态;若该Zone锁处于锁定状态,监听该Zone锁的状态;在监听到该Zone锁解锁时,将该写I/O请求派发至该目标Zone。本申请用于派发I/O请求。

Description

一种I/O请求派发方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种输入/输出(Input/Output,I/O)请求派发方法及装置。
背景技术
大数据时代的数据量呈指数级增长,预计每两年就会翻一番。硬盘(Hard DiskDrive,HDD)作为一种经济高效的存储介质,在当今的存储数字世界中依然起着中流砥柱的作用。但是,传统硬盘即将达到其存储密度极限,存储业界引入了叠瓦式磁记录(ShingledMagnetic Recording,SMR)盘技术来克服限制提升容量。
如图1所示,示意了传统硬盘与SMR盘的结构。从图1内容可以看出,SMR盘采用叠瓦式记录,通过将一定区域内的磁道依次部分重叠,获得了更高的存储面密度、更大的磁盘容量、更低的单位容量价格。但是,SMR盘在带来上述好处的同时,对于上层应用的I/O行为提出了顺序性约束,即只支持顺序写入。SMR盘按照固定大小在逻辑上被分割成一个个区域(Zone),一个Zone包含了一段连续的逻辑区块地址(Logical Block Address,LBA)。Zone分为两类:允许随机写的传统区域(Conventional Zone,C-Zone)和只支持顺序写的顺序区域(Sequential Zone,S-Zone))。SMR盘读写I/O的顺序性约束体现在一个S-Zone内只能进行顺序写,多个S-Zone之间则可以进行并发写入。
在I/O栈中,I/O调度器管理块设备的请求队列,通过合并I/O请求、对I/O进行排序来于减少磁盘寻道次数,从而提高磁盘性能。I/O调度器在接收到I/O请求时,先将I/O请求添加到I/O调度队列,再按特定的调度算法将调度队列中的I/O请求转移到派发队列,最终提交执行。
为支持SMR盘S-Zone内的顺序写,I/O栈中的各个部分都需要支持保序。为了防止I/O乱序,对SMR盘的每一个S-Zone引入一个用于写I/O保序的锁,称为Zone锁(Zone Lock)。在写I/O下发时加锁,在写I/O返回时解锁,确保任何时刻对于一个S-Zone,最多只有一个写请求被下发到SMR盘上,确保SMR盘S-Zone内不会发生写I/O乱序。因此,I/O调度器对SMR盘的调度行为受到Zone锁状态的控制,跳过被Zone锁阻塞的写I/O请求的方式来对SMR盘进行调度,即将写I/O请求下发到SMR盘上时,将只允许向未锁定的目标S-Zone下发写I/O,如果目标S-Zone被锁定了,那么这个写请求将不被派发,放回调度队列,调度器将继续查找下一个能下发的写请求。
当SMR盘存在多个Zone并发顺序写时,若存在写I/O请求被Zone锁阻塞,调度器跳过被Zone锁阻塞的写I/O请求调度下一个写I/O请求,导致硬盘磁头寻道至另一个Zone;在多个写I/O请求被Zone锁阻塞的多Zone并发顺序写场景下,则会引起磁头的反复摆动,产生寻道风暴,增加大量不必要的随机I/O,引起性能下降。如果Zone与Zone间隔较远,对SMR盘性能影响更加显著。
发明内容
本申请实施例提供一种I/O请求派发方法及装置,顺序并发调度写I/O请求时避免寻道风暴,提高SMR盘的性能。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供一种I/O请求派发方法,该方法可以包括:查询写I/O请求在SMR盘中的目标Zone的Zone锁状态;若该Zone锁处于锁定状态,监听该Zone锁的状态;在监听到该Zone锁解锁时,将该写I/O请求派发至该目标Zone。
本申请提供的I/O请求派发方法,在目标Zone的Zone锁处于锁定状态时,等待监听其解锁后派发写I/O请求,即使多Zone并发顺序写场景下多个写I/O请求被Zone锁阻塞,等待解锁后再派发不会引起磁头的反复摆动,避免了寻道风暴,进而保证了SMR盘的性能。进一步的,由于SMR盘在S-Zone内顺序追加的特点,被Zone锁阻塞的写I/O请求一般是同一个Zone内顺序追加的写I/O,等待解锁后再派发会让I/O请求写入更加顺序化,最小化了磁头的移动距离,优化了寻道时间,提高了对SMR盘的I/O访问性能。
其中,上述写I/O请求为调度队列中顺序最优先的待派发的写I/O请求。调度队列中按序存储了至少一个I/O请求,调度队列中I/O请求的顺序可以根据各种调度算法排列,本申请对此不进行具体限定。
结合第一方面,在一种可能的实现方式中,在监听到Zone锁解锁时,将写I/O请求派发至目标Zone,具体可以实现为:在预设时长内监听到Zone锁解锁时,将写I/O请求派发至目标Zone。相应的,本申请提供的I/O请求派发方法还可以包括:若在预设时长内Zone锁一直锁定,跳过该写I/O请求派发其他I/O请求。在该实现方式中,通过预设时长限定最长等待时间,避免过长时间等待。跳过写I/O请求后,处理下一个待派发的I/O请求,其具体过程相同,此处不再进行赘述。
结合第一方面或上述任一方面可能的实现方式,在另一种可能的实现方式中,在查询写I/O请求在SMR盘中的目标Zone的Zone锁状态之后,本申请提供的I/O请求派发方法还可以包括:若该Zone锁处于解锁状态,将写I/O请求派发至目标Zone。
结合第一方面或上述任一方面可能的实现方式,在另一种可能的实现方式中,在将写I/O请求派发至目标Zone后,本申请提供的I/O请求派发方法还可以包括:锁定目标Zone的Zone锁。以实现采用Zone锁对I/O请求派发过程的保序。
第二方面,提供一种I/O请求派发装置,该装置可以包括查询单元、监听单元以及派发单元。其中,查询单元,用于查询写I/O请求在SMR盘中的目标Zone的Zone锁状态;监听单元,用于若查询单元查询Zone锁处于锁定状态,监听Zone锁的状态;派发单元,用于在监听单元监听到Zone锁解锁时,将写I/O请求派发至目标Zone。
本申请提供的I/O请求派发装置,在目标Zone的Zone锁处于锁定状态时,等待监听其解锁后派发写I/O请求,即使多Zone并发顺序写场景下多个写I/O请求被Zone锁阻塞,等待解锁后再派发不会引起磁头的反复摆动,避免了寻道风暴,进而保证了SMR盘的性能。进一步的,由于SMR盘在S-Zone内顺序追加的特点,被Zone锁阻塞的写I/O请求一般是同一个Zone内顺序追加的写I/O,等待解锁后再派发会让I/O请求写入更加顺序化,最小化了磁头的移动距离,优化了寻道时间,提高了对SMR盘的I/O访问性能。
结合第二方面,在一种可能的实现方式中,派发单元具体可以用于:在监听单元在预设时长内监听到Zone锁解锁时,将写I/O请求派发至目标Zone。若在预设时长内Zone锁一直锁定,跳过写I/O请求派发其他I/O请求。跳过写I/O请求后,处理下一个待派发的I/O请求,其具体过程相同,此处不再进行赘述。
结合第二方面或上述任一种可能的实现方式,在另一种可能的实现方式中,派发单元还可以用于:若查询单元查询Zone锁处于解锁状态,将写I/O请求派发至目标Zone。
结合第二方面或上述任一种可能的实现方式,在另一种可能的实现方式中,该装置还可以包括:锁定单元,用于在派发单元将写I/O请求派发至目标Zone后,锁定目标Zone的Zone锁。
需要说明的是,第二方面提供的I/O请求派发装置,用于实现上述第一方面或任一种可能的实现方式提供的I/O请求派发方法,其具体实现可以参考第一方面或第一方面的任一种可能的实现方式,此处不再一一赘述。
第三方面,本申请提供一种I/O请求派发装置,该I/O请求派发装置可以实现上述方法示例中的功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个上述功能相应的模块。
结合第三方面,在一种可能的实现方式中,该I/O请求派发装置的结构中包括处理器和收发器,该处理器被配置为支持该I/O请求派发装置执行上述方法中相应的功能。该收发器用于支持该I/O请求派发装置与其他设备之间的通信。该I/O请求派发装置还可以包括存储器,该存储器用于与处理器耦合,其保存该I/O请求派发装置必要的程序指令和数据。
需要说明的是,第三方面提供的I/O请求派发装置,用于实现上述第一方面或任一种可能的实现方式提供的I/O请求派发方法,其具体实现可以参考第一方面或第一方面的任一种可能的实现方式,此处不再一一赘述。
第四方面,提供一种I/O调度器,包括如上述第三方面提供的I/O请求派发装置。
第五方面,本申请实施例提供了一种计算机存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一种可能的实现方式所设计的程序。
第六方面,本申请实施例提供了一种计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或第一方任一种可能的实现方式所设计的程序。
上述第四方面至第六方面提供的方案,用于实现上述第一方面提供的I/O请求派发装置,因此可以与第一方面达到相同的有益效果,此处不再进行赘述。
附图说明
图1为传统硬盘与SMR盘的结构示意图;
图2为SMR盘Zone的划分以及WP指示的示意图;
图3为现有技术提供的基于SMR盘的系统I/O栈架构示意图;
图4为现有技术提供的一种I/O调度器的内部结构示意图;
图5为现有技术提供的一种最后期限调度算法中I/O调度器的内部结构示意图;
图6为一种SMR盘Zone锁与I/O调度器的交互场景示意图;
图7为现有技术中提供的一种I/O请求派发方法的流程示意图;
图8为现有技术提供的一种调度队列中I/O请求的派发顺序示意图;
图8a为一种I/O调度器的架构示意图;
图9为Linux通用块层中I/O请求的处理过程的流程示意图;
图10为I/O调度器工作的总体流程的示意图;
图11为本申请实施例提供的一种I/O请求派发装置的结构示意图;
图12为本申请实施例提供的一种I/O请求派发方法的流程示意图;
图13为本申请实施例提供的另一种I/O请求派发方法的流程示意图;
图14为本申请实施例提供的再一种I/O请求派发方法的流程示意图;
图15为本申请实施例提供的一种调度队列中I/O请求的派发顺序示意图;
图16为本申请实施例提供的另一种I/O请求派发装置的结构示意图;
图17为本申请实施例提供的再一种I/O请求派发装置的结构示意图;
图18为本申请实施例提供的又一种I/O请求派发装置的结构示意图。
具体实施方式
SMR盘主要应用在视频、归档、备份的场合,这些应用通常具有大文件、顺序写为主的特点。多Zone并发顺序写在SMR盘上是非常常见的场景。例如,视频监控场景中,多个摄像头录下的多路视频流通过文件系统写入到不同的Zone内;数据重构时为提升恢复速度,来自多块备份盘的数据并发地恢复写入到多个Zone等。
SMR盘对写入的顺序性约束可在硬件侧由硬盘本身来管理,亦可在主机侧由软件来进行。前者被称为“驱动器自管理的SMR盘”(Drive Managed SMR disk),后者被称为主机管理的SMR盘(Host Managed SMR,HM SMR盘)。HM SMR盘向上提供了新接口,不允许上层软件随机写,只允许上层进行顺序追加写,不符合SMR盘写入规则的I/O将会报错。
如前所述,SMR盘按照固定大小(例如256MB)在逻辑上被分割成一个个Zone,一个Zone包含了一段连续的LBA地址。C-Zone允许随机写,S-Zone只支持顺序写。每个S-Zone有一个写指针(Write Pointer,WP),WP定位了下一个顺序写可以发生的位置。SMR盘只能对WP所在位置的LBA进行写入操作,写入其他LBA则会报错。从WP位置开始的写操作将自动向后移动写指针。HM SMR盘可以使用REPORT ZONES命令获取有关Zone和WP的信息。图2示意了SMR盘Zone的划分以及WP指示。
图3展示了基于SMR盘的系统I/O栈架构图。如图3所示,在I/O栈中,包括文件系统、配置了I/O调度器的通用块层、小型计算机系统接口(Small Computer System Interface,SCSI)子系统、主机总线适配器(Host Bus Adapter,HBA)驱动、SMR盘。I/O调度器(I/OScheduler)是通用块层的一个重要组成部分。文件系统生成的块I/O(Block I/O)进入通用块层后,在派发给底层SMR盘之前,会经过I/O调度器的调度。I/O调度器管理块设备的队列,通过调整队列中的请求排列顺序,对SMR盘的I/O性能有着极大的影响。
在I/O栈中,I/O调度器(I/O Scheduler)是一个重要组成部分,它管理块设备的I/O请求队列,在接收到文件系统提交的I/O请求时,通过合并I/O请求、对I/O进行排序,调整队列中的请求排列顺序,决定在什么时刻派发请求到块设备,以减少磁盘寻道次数,从而提高磁盘性能。I/O调度器从文件系统接收到I/O请求时,生成调度队列,按照调度算法生成派发队列。
其中,合并是指将两个或多个I/O请求结合成一个新请求。当文件系统提交I/O请求到请求队列,如果此时队列中己经存在一个请求,它访问的磁盘扇区和当前请求访问的磁盘扇区相邻,那么这两个请求可以合并为一个对两个相邻磁盘扇区操作的新请求。合并请求显然能减少系统开销和磁盘寻址次数。排序则是将进入请求队列的所有I/O请求按扇区编号(LBA地址)递增方向有序排列,使得磁头可以按照磁盘的旋转顺序的完成I/O操作,减小磁盘的寻道次数。调度器的算法和电梯运行的策略相似,因此I/O调度器也被称作I/O电梯(I/O Elevator)。
图4为一种I/O调度器的内部结构示意图。如图4所示,引入I/O调度器后,请求队列就分为两种队列:一种为I/O调度队列,它蕴涵于I/O调度器中;另一种是派发队列(dispatch queue),即将派送至入磁盘的I/O请求队列。文件系统提交的I/O请求首先被添加到调度队列,然后,I/O调度器按特定的调度算法将它转移到派发队列,最终被提交执行。
在各类针对磁盘的I/O调度器中,根据请求磁盘扇区(LBA地址)的顺序在请求队列中进行排序的电梯算法都是其中重要的基础部分。电梯算法着重使I/O的吞吐最大化,各种调度器在其基础上,加入了读写优先级(priority)、I/O公平性(fairness)、避免I/O饿死(starvation)等其他因素方面的考虑,进一步调整I/O请求的顺序,形成了各自的特点和适用场景。
这里描述一种基于电梯算法的调度算法的最后期限调度算法。最后期限调度算法一方面以I/O请求的目的区域的扇区编号为次序来维护请求,组成排序队列(sortedqueue),另一方面也按请求到达的时间为次序来维护请求,组成先进先出(First InputFirst Output,FIFO)队列,用于先来先服务。
图5示意了最后期限调度算法中I/O调度器的内部结构。如图5所示,最后期限调度算法实际使用四个队列,以请求类型为依据区分。也就是说,写操作有一个排序队列和FIFO队列,读操作也有一个排序队列和FIFO队列。在最后期限调度器中,每个请求都有一个超时时间。默认情况下,读请求的超时时间是500毫秒,写请求的超时时间是5秒,读请求的优先级高于写请求。当新请求被提交,最后期限调度器将其加入到排序队列中进行合并和排序,同时将这个请求加入到FIFO队列中,读请求被加入至读FIFO队列,写请求被加入到写FIFO队列,这两个队列中,请求完全按照FIFO顺序排列,即新请求永远被放入到队列的末尾。
一般情况下,请求从排序队列中取下,再推入到派发队列;如果写FIFO队列或读FIFO队列头部有请求超时(也就是,当前时间超过了请求指定的超时时间),那么最后期限I/O调度器就不再使用排序队列,而是从FIFO队列中取出请求放入派发队列,直到队列中没有超时的请求。依靠这种方法,最后期限I/O调度器保证所有的请求都不会长时间超时。因此,最后期限调度器防止了请求饿死(starvation)的出现。
需要说明的是,调度算法的类型多种多样,上述描述了最后期限调度算法;但是,本申请可以应用于各种调度算法的场景中,本申请对于调度算法的类型不进行具体限定。
如前所述,为支持SMR盘S-Zone内的顺序写,I/O栈中的各个部分都需要支持保序,通过加Zone锁保护的方式实现。在SMR盘上,I/O调度器在Zone锁的以上,其行为受到Zone锁状态的控制。图6示意了SMR盘Zone锁与I/O调度器的交互场景,如图6所示,调度队列中的Wi表示目的地为Zone i的写I/O请求,Ri表示目的地为Zone i的读I/O请求。SMR盘上Zone 0、Zone 1上分别有一个写I/O正在进行中,因此Zone 0和Zone 1上的Zone锁处于锁定状态;Zone 2上有一个读I/O正在进行中,Zone n上则没有I/O,Zone 2和Zone n处于未锁定状态。在I/O调度器的调度队列中,第1个写I/O请求的标志为W0,对应的Zone 0处于上锁状态,因此无法继续往下派发。第4个写I/O请求的标志位W2,对应的Zone 0处于解锁状态,因此可以往下层驱动派发。
具体而言,对于处于一个调度批次的I/O调度队列,当一个写I/O请求被Zone锁阻塞,当前的处理方案是跳过被Zone锁阻塞的写I/O请求,将该被阻塞的写I/O请求放回调度队列处理下一个待派发I/O请求的方式来对SMR盘进行调度。
针对SMR盘,根据调度器的算法挑选出待派发的候选I/O请求后(加入派发队列前),现有技术的调度器根据以下原则实现了相应的调度策略:1)任何非写入请求始终允许向下派发;2)任何对C-Zone的写入都允许向下派发;3)对于对S-Zone的写入,首先检查Zone锁。如果该Zone未锁定,则允许在锁定目标Zone后继续写入操作;如果该Zone已锁定,则会跳过写入请求,并尝试调度队列中的下一个请求。也就是说,现有技术中将写I/O请求下发到SMR盘上时,将只允许向未锁定的目标S-Zone下发写I/O;如果目标S-Zone被锁定了,那么这个写请求将不被派发,放回调度队列,调度器将继续查找下一个能下发的写请求。如果在属于同一调度批次的写I/O调度队列内找不到能下发的写请求,那么允许读请求被下发,即使这时候这个写请求所在的写调度批次还没处理完。
现有技术中提供的I/O请求派发方法的具体流程示意如图7所示,该流程可以包括如下步骤:
S701、I/O调度器判断调度队列是否为空。
在S701中,若是,则结束派发流程;否则,执行S702和S703。
S702、I/O调度器挑选出待派发的I/O请求。
其中,待派发的I/O请求即调度队列中顺序最靠前的I/O请求。
S703、I/O调度器判断待派发的I/O请求是否为写请求。
在S703中,若是,则执行S704;否则,执行S708向下派发后执行S701。
S704、I/O调度器判断待派发的I/O请求的目标区域是否为S-Zone。
在S704中,若是,则执行S705;否则,执行S708向下派发后执行S701。
S705、I/O调度器判断待派发的I/O请求的目标区域的Zone锁是否锁定。
在S705中,若是,则执行S706后执行S701;否则,执行S707后执行S708向下派发后再执行S701。
S706、I/O调度器跳过该待派发的I/O请求,尝试处理调度队列中下一个I/O请求。
S707、I/O调度器锁定该待派发的I/O请求的目标区域。
S708、I/O调度器向下派发该待派发的I/O请求。
图8示意了一个调度队列中I/O请求的派发顺序。如图8所示,在一个写调度批次内,调度队列中共有19个写I/O请求等待调度,矩形中的数字代表现有技术的调度器的方案中写I/O请求的派发顺序。当写I/O被Zone锁阻塞时,现有技术的调度器在多Zone并发写时会造成磁头不断跳动,在下发Zone 1的一个写I/O后立即寻道至Zone 2,下发另一个写I/O,再跳到下一个Zone。如果Zone与Zone之间的间隔较远的话,其性能影响更加显著。
因此,当SMR盘存在多个Zone并发顺序写时,若存在写I/O请求被Zone锁阻塞,调度器跳过被Zone锁阻塞的写I/O请求调度下一个写I/O请求,导致硬盘磁头寻道至另一个Zone;在多个写I/O请求被Zone锁阻塞的多Zone并发顺序写场景下,则会引起磁头的反复摆动,产生寻道风暴,增加大量不必要的随机I/O,引起性能下降。如果Zone与Zone间隔较远,对SMR盘性能影响更加显著。
基于此,本申请提出一种I/O请求派送方法,其基本原理是:当写I/O请求被Zone锁阻塞时,等待解锁后派送,避免寻道风暴,提高性能。
本申请提供的I/O请求派送方法,应用于如图3所示的SMR盘的系统I/O栈架构中。具体的,应用于图3示意的SMR盘的系统I/O栈架构中I/O调度器向SMR盘派发I/O请求的过程中。
基于如图3所示的SMR盘的系统I/O栈架构,图8a示意了本申请提供的方案涉及的I/O调度器的架构。如图8a所示,本申请提供的方案涉及的I/O调度器的架构由若干组调度队列、派发队列、Zone锁表,以及电梯对象组成。
其中,调度队列是I/O调度器维护的一系列队列,这些队列用于对请求的排序,或者执行I/O合并;派发队列用于暂存下发给磁盘驱动的I/O请求,SMR盘依次处理派发队列中的I/O;电梯对象是I/O调度器的核心部分,负责从调度队列中依照一定的规则挑选出适当的I/O请求,插入到派发队列的尾部;Zone锁表则是SMR盘I/O调度器特有的组件,写I/O下发时上锁,写I/O完成时解锁,用于确保同一时刻每个S-Zone内最多只有一个写I/O正在执行。
需要说明的是,Zone锁表可以配置在I/O调度器内部,也可以配置在图3所示的SMR盘的系统I/O栈架构中的其他位置,本申请实施例对此不进行具体限定,图8a只是示意并不构成具体限定。
在详细介绍本申请提供的I/O请求派送方法之前,为了便于理解,此处先描述Linux通用块层中,I/O请求的处理过程。
Linux通用块层中,I/O请求的处理过程如图9所示,该过程可以包括:
S901、上层向块I/O子系统提交通用块层请求(bio)。
块I/O子系统向上层提供接收通用块层请求(bio)的接口,上层(文件系统等)在构造好bio后,提交给通用块层处理。
S902、从bio构造I/O请求队列(request queue),进行合并与排序。
在S902中,经过合并与排序,从bio构造请求队列(request queue)。合并将对磁盘连续扇区访问的多个I/O合并为一个I/O,排序是讲I/O按照对磁盘访问的扇区编号进行排序,尽量使磁头向一个方向移动。
S903、下层(SCSI子系统)逐个处理SCSI块设备请求队列(request queue)中的请求。
在S903中,块I/O子系统将请求队列(request queue)中的I/O请求派发到下层SCSI子系统中。
在图9示意的I/O请求的处理过程中,I/O调度器在S902及S903中发挥着重要作用。下面描述I/O调度器工作的总体流程。如图10所示,I/O调度器工作的总体流程具体可以包括:
S1001、调度器为请求队列(request queue)建立关联的I/O调度队列。
在确定好电梯对象后,为SCSI块设备请求队列(request queue)分配建立相关联的I/O调度队列。
S1002、调度器判断bio是否可以被合并到请求中。
在S1002中,接收到bio后,调度器尝试从request queue中选择一个可以合并这个bio的request,进行向后合并、向前合并。
S1003、调度器将合并后的请求添加到I/O调度队列并排序。
准备好request后,块层将其添加到I/O调度队列中,同时按电梯对象要求进行排序,保持I/O调度队列的有序性。
S1004、调度器从I/O调度队列派发请求到派发队列。
具体的,本申请提供的方案可以应用于S1004的过程中,下面详细描述本申请提供的方案。
本申请实施例的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一指示信息和第二指示信息等是用于区别不同的指示信息,而不是用于描述信息的特定顺序。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念,便于理解。
下面结合附图,对本申请的实施例进行具体阐述。
一方面,本申请实施例提供一种I/O请求派发装置。I/O请求派发装置可以配置在调度器中,因此,I/O请求派发装置可以为调度器中执行本申请提供的I/O请求派发方法的功能单元。当然,也可以将调度器称之为I/O请求派发装置,本申请实施例对此不进行具体限定。图11示出的是与本申请各实施例相关的一种I/O请求派发装置110。I/O请求派发装置110可以为图3所示的架构中的调度器的部分或全部。如图11所示,I/O请求派发装置110可以包括:处理器1101、存储器1102、收发器1103。
下面结合图11对I/O请求派发装置110的各个构成部件进行具体的介绍:
存储器1102,可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者上述种类的存储器的组合,用于存储可实现本申请方法的程序代码、以及配置文件。
处理器1101是I/O请求派发装置110的控制中心,可以是一个中央处理器(centralprocessing unit,CPU),也可以是特定集成电路(Application Specific IntegratedCircuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路,例如:一个或多个微处理器(digital singnal processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)。处理器1101可以通过运行或执行存储在存储器1102内的软件程序和/或模块,以及调用存储在存储器1102内的数据,执行I/O请求派发装置110的各种功能。
收发器1103用于I/O请求派发装置110与其他单元进行交互。示例性的,收发器1103可以为I/O请求派发装置110的收发端口。
具体的,处理器1101通过运行或执行存储在存储器1102内的软件程序和/或模块,以及调用存储在存储器1102内的数据,执行如下功能:
查询写I/O请求在SMR盘中的目标区域Zone的Zone锁状态;若Zone锁处于锁定状态,监听Zone锁的状态;在监听到Zone锁解锁时,将写I/O请求派发至目标Zone。
另一方面,本申请实施例提供一种I/O请求派发方法,应用于SMR盘的系统I/O栈向SMR盘派送写I/O请求的过程中。本申请实施例描述的I/O请求派发方法的过程,由I/O请求派发装置执行,I/O请求派发装置可以部署在调度器中作为功能单元或者芯片。文中描述的I/O请求派发装置执行某操作,对此可以理解为由I/O请求派发装置自身执行,也可以理解为由I/O请求派发装置所属的调度器执行,本申请实施例对此不进行具体限定,下文中仅描述为调度器执行某操作。
如图12所示,本申请实施例提供的I/O请求派发方法可以包括:
S1201、I/O请求派发装置查询写I/O请求在SMR盘中的目标Zone的Zone锁状态。
其中,该写I/O请求是调度队列中顺序最优先的待派发的写I/O请求。写I/O请求中携带了该写I/O请求访问的目标Zone的标识,
如前所述,调度队列是I/O请求派发装置所在的调度器,从文件系统接收I/O请求后配置请求队列后通过合并、排序等方式生成的。本申请实施例对于I/O调度器生成调度队列时的具体过程不进行限定。在生产调度队列后,I/O调度器使用调度算法将调度队列中的I/O请求发送到派送队列中,SMR盘依次执行派送队列中的I/O请求,本申请实施例对于I/O调度器所使用的调度算法不进行具体限定。
具体的,Zone锁表中存储了SMR盘中每个Zone的Zone锁状态,当对某个Zone派发写I/O请求进行写入操作,其对应的Zone锁则上锁,进入锁定状态,当写入操作结束接收到SMR盘反馈的I/O请求完成响应后,其对应的Zone锁解锁。写I/O请求中携带了该写I/O请求访问的目标Zone的标识,根据该标识查询Zone锁表,以查询写I/O请求在SMR盘中的目标Zone的Zone锁状态。
其中,Zone的标识是唯一识别SMR盘中Zone的信息,凡是可以用来唯一识别Zone的信息,均可以作为Zone的标识。例如,该标识可以为字符串、数字等,本申请实施例对于Zone的标识的内容不进行具体限定。
示例性的,如表1所示,示意了一种Zone锁表。
表1
Zone标识 Zone锁状态
1 锁定
2 解锁
3 解锁
4 解锁
…… ……
需要说明的是,表1只是对Zone锁表的示例说明,并不构成对Zone锁表的形式以及内容的具体限定。在实际应用中,可以根据需求配置Zone锁表的形式以及具体内容,本申请实施例对此不进行具体限定。
可选的,Zone锁表可以配置在调度器内部,当然,Zone锁表也可以配置在SMR盘的系统I/O栈中通用块层的其他位置,本申请实施例对此不进行具体限定。
具体的,可以为图11示意的I/O请求派发装置110中的处理器1101执行S1201的过程。在执行S1201之后,若查询的该写I/O请求的目标Zone的Zone锁处于锁定状态,则执行S1202。
S1202、若Zone锁处于锁定状态,I/O请求派发装置监听该Zone锁的状态。
具体的,在S1202中,监听该Zone锁的状态即实时查询Zone锁表,查询其状态。
S1203、在监听到该Zone锁解锁时,I/O请求派发装置将该写I/O请求派发至目标Zone。
具体的,当在S1202的监听过程中,监听到该Zone锁解锁时,说明该Zone已经结束写入操作,当前等待的写I/O请求可以向目标区域派发进行写入操作。
示例性的,派发过程可以参考图3示意的SMR盘的系统I/O栈架构示意,I/O调度器将派发的I/O请求发送至SCSI子系统,再经过HBA驱动派发到SMR盘中。当然,派发也可以有其他实现方式,本申请实施例对于派发过程不再进行赘述。
一种可能的实现中,I/O请求派发装置一直监听该Zone锁的状态,直到监听到该Zone锁解锁时执行S1203,将该写I/O请求派发至目标Zone。
另一种可能的实现中,I/O请求派发装置监听该Zone锁的状态,并在预设时长内监控到该Zone锁解锁时将该写I/O请求派发至目标Zone。对应的,S1203则具体实现为:在预设时长内监听到该Zone锁解锁时,I/O请求派发装置将该写I/O请求派发至目标Zone。
可选的,预设时长的长短可以根据实际需求配置,本申请实施例对此不进行具体限定。
进一步可选的,若S1203则具体实现为在预设时长内监听到该Zone锁解锁时,I/O请求派发装置将该写I/O请求派发至目标Zone,本申请实施例提供的I/O请求派发方法还可以包括:若在预设时长内Zone锁一直锁定,I/O请求派发装置跳过该写I/O请求,派发其他I/O请求。
需要说明的是,S1201至S1203的I/O请求派发方法是针对一个写I/O请求的派发过程,在实际应用中,I/O请求派发装置对于每一个写I/O请求均可以执行S1201至S1203的过程,并且执行过程相同,此处不再一一赘述。
本申请提供的I/O请求派发方法,在目标Zone的Zone锁处于锁定状态时,等待监听其解锁后派发写I/O请求,即使多Zone并发顺序写场景下多个写I/O请求被Zone锁阻塞,等待解锁后再派发不会引起磁头的反复摆动,避免了寻道风暴,进而保证了SMR盘的性能。进一步的,由于SMR盘在S-Zone内顺序追加的特点,被Zone锁阻塞的写I/O请求一般是同一个Zone内顺序追加的写I/O,等待解锁后再派发会让I/O请求写入更加顺序化,最小化了磁头的移动距离,优化了寻道时间,提高了对SMR盘的I/O访问性能。
进一步可选的,如图13所示,在S1201中I/O请求派发装置查询写I/O请求在SMR盘中的目标区域Zone的Zone锁状态之后,本申请实施例提供的I/O请求派发方法还可以包括S1204。
S1204、若Zone锁处于解锁状态,I/O请求派发装置将写I/O请求派发至目标Zone。
具体的,当查询到该Zone锁解锁时,说明该Zone没有写入操作,当前等待的写I/O请求可以直接向目标区域派发进行写入操作。
进一步的,如图13所示,在向目标区域派发进行写入操作之后,为了保序,本申请实施例提供的I/O请求派发方法还可以包括S1205。
S1205、I/O请求派发装置锁定目标Zone的Zone锁。
需要说明的是,图12及图13示意的本申请实施例提供的I/O请求派发方法,是I/O请求派发装置对调度队列中一个写I/O请求的处理过程,I/O请求派发装置对于调度队列中每个写I/O请求的处理过程相同,此处不再一一赘述。
进一步的,在实际应用中,调度队列中还可以包括读I/O请求,以及目标Zone为C-Zone的I/O请求,因此,在实际应用中,还可以在S1201之前包括其他步骤以实现所有I/O请求的派发。如图14所示,本申请提供的I/O请求派发方法在图12或图13基础上还可以包括其他步骤。其中,图14示意的I/O请求派发方法中包括的其他步骤可以为I/O请求派发装置执行,也可以为I/O请求派发装置所在的I/O调度器执行,本申请实施例对此不进行具体限定,此处仅描述为I/O请求派发装置所在的调度器执行(图14以及相关说明简写为I/O调度器执行)。
S1401、I/O调度器判断调度队列是否为空。
在S1401中,若是,则结束派发流程;否则,执行S1402和S1403。
S1402、I/O调度器挑选出待派发的I/O请求。
S1403、I/O调度器判断待派发的I/O请求是否为写请求。
在S1403中,若是,则执行S1404;否则,执行S1408向下派发。
S1404、I/O调度器判断待派发的I/O请求的目标区域是否为S-Zone。
在S1404中,若是,则执行S1405;否则,执行S1408向下派发。
S1405、I/O调度器判断待派发的I/O请求的目标区域的Zone锁是否锁定。
在S1405中,若是,则执行S1406;否则,执行S1407向下派发。
S1406、I/O调度器监听该Zone锁的状态。
可选的,在S1406中,在监听到该Zone锁解锁时,或者,在预设时长内监听到该Zone锁解锁时,I/O调度器执行S1407后执行S1401。
可选的,在S1406中,若监听到该Zone锁一直锁定或者在预设时长内一直锁定,I/O调度器跳过该写I/O请求执行S1401尝试下一个待派发I/O请求。
S1407、I/O调度器将写I/O请求派发至目标区域并锁定目标区域的Zone锁。
在S1407后,执行S1401以处理下一个I/O请求。
S1408、I/O调度器向下派发该待派发的I/O请求。
在S1408后,执行S1401以处理下一个I/O请求。
示例性的,图8示意的调度队列中I/O请求的派发顺序若采用本申请提供的I/O请求派发方法,其派发顺序则如图15所示,矩形中的数字代表现有技术的调度器的方案中写I/O请求的派发顺序。
上述主要从部署了本申请提供的I/O请求派发装置的I/O调度器工作过程的角度对本申请实施例提供的方案进行了介绍。可以理解的是,I/O调度器装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
需要说明的是,I/O调度器中执行本申请提供的I/O请求派发方法的功能部分称之为I/O请求派发装置,可以理解的是,I/O请求派发装置可以为I/O调度器的部分或全部,换言之,I/O请求派发装置可以与I/O调度器等价,或者,I/O请求派发装置也可以部署在I/O调度器内,以支持I/O调度器执行本申请提供的I/O请求派发方法。
本申请实施例可以根据上述方法示例对I/O调度器进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。当I/O请求派发装置为I/O调度器的部分或全部时,对I/O调度器进行功能模块的划分,就相当于对I/O请求派发装置进行功能模块的划分;或者,当I/O请求派发装置为I/O调度器的部分或全部时,对I/O请求派发装置进行功能模块的划分,就相当于对I/O调度器进行功能模块的划分。
在采用对应各个功能划分各个功能模块的情况下,图16示出了上述实施例中所涉及的I/O调度器中的I/O请求派发装置的一种可能的结构示意图。I/O请求派发装置160可以包括:查询单元1601,监听单元1602,派发单元1603。查询单元1601用于执行图12或图13中的过程S1201;监听单元1602用于执行图12或图13中的过程S1202;派发单元1603用于执行图12或图13中的过程S1203、S1204。其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
进一步的,如图17所示,I/O请求派发装置160还可以包括锁定单元1604。锁定单元1604用于执行图13中的过程S1205。
在采用集成的单元的情况下,图18示出了上述实施例中所涉及的I/O调度器中的I/O请求派发装置的一种可能的结构示意图。I/O请求派发装置180可以包括:处理模块1801、通信模块1802。处理模块1801用于对I/O请求派发装置180的动作进行控制管理。例如,处理模块1801用于支持I/O请求派发装置180通过通信模块1802支持I/O请求派发装置180执行图12或图13中的过程S1201至S1205。I/O请求派发装置180还可以包括存储模块1803,用于存储I/O请求派发装置180的程序代码和数据。
其中,处理模块1801可以为图11所示的I/O请求派发装置110的实体结构中的处理器1101,可以是处理器或控制器。例如可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器1801也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块1802可以为图11所示的I/O请求派发装置110的实体结构中的收发器1103,通信模块1802可以是通信端口,或者可以是收发器、收发电路或通信接口等。或者,上述通信接口可以通过上述具有收发功能的元件,实现与其他设备的通信。上述具有收发功能的元件可以由天线和/或射频装置实现。存储模块1803可以是图11所示的I/O请求派发装置110的实体结构中的存储器1102。
当处理模块1801为处理器,通信模块1802为收发器,存储模块1803为存储器时,本申请实施例图18所涉及的I/O请求派发装置可以为图11所示的I/O请求派发装置110。
如前述,本申请实施例提供的I/O请求派发装置160或I/O请求派发装置180可以用于实施上述本申请各实施例实现的方法中I/O调度器的功能,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请各实施例。
另一方面,本申请实施例还提供一种I/O调度器,包括上述任一实施例提供的I/O请求派发装置,具体技术细节请参照本申请各实施例。
结合本申请公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM、闪存、ROM、可擦除可编程只读存储器(Erasable Programmable ROM,EPROM)、电可擦可编程只读存储器(Electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于核心网接口设备中。当然,处理器和存储介质也可以作为分立组件存在于核心网接口设备中。或者,存储器可以与处理器耦合,例如存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。存储器可以用于存储执行本申请实施例提供的技术方案的应用程序代码,并由处理器来控制执行。处理器用于执行存储器中存储的应用程序代码,从而实现本申请实施例提供的技术方案。
本申请实施例再提供一种芯片系统,该芯片系统包括处理器,用于实现本发明实施例通信设备的技术方法。在一种可能的设计中,该芯片系统还包括存储器,用于保存本发明实施例通信设备必要的程序指令和/或数据。在一种可能的设计中,该芯片系统还包括存储器,用于处理器调用存储器中存储的应用程序代码。该芯片系统,可以由一个或多个芯片构成,也可以包含芯片和其他分立器件,本申请实施例对此不作具体限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (12)

1.一种输入/输出I/O请求派发方法,其特征在于,所述方法包括:
查询写I/O请求在SMR盘中的目标区域Zone的Zone锁状态;
若所述Zone锁处于锁定状态,监听所述Zone锁的状态;
在监听到所述Zone锁解锁时,将所述写I/O请求派发至所述目标Zone。
2.根据权利要求1所述的I/O请求派发方法,其特征在于,
所述在监听到所述Zone锁解锁时,将所述写I/O请求派发至所述目标Zone,包括:在预设时长内监听到所述Zone锁解锁时,将所述写I/O请求派发至所述目标Zone;
所述方法还包括:若在所述预设时长内所述Zone锁一直锁定,跳过所述写I/O请求派发其他I/O请求。
3.根据权利要求1或2所述的I/O请求派发方法,其特征在于,在所述查询写I/O请求在SMR盘中的目标区域Zone的Zone锁状态之后,所述方法还包括:
若所述Zone锁处于解锁状态,将所述写I/O请求派发至所述目标Zone。
4.根据权利要求1-3任一项所述的I/O请求派发方法,其特征在于,在所述将所述写I/O请求派发至所述目标Zone后,所述方法还包括:
锁定所述目标Zone的Zone锁。
5.一种输入/输出I/O请求派发装置,其特征在于,所述装置包括:
查询单元,用于查询写I/O请求在SMR盘中的目标区域Zone的Zone锁状态;
监听单元,用于若所述查询单元查询所述Zone锁处于锁定状态,监听所述Zone锁的状态;
派发单元,用于在所述监听单元监听到所述Zone锁解锁时,将所述写I/O请求派发至所述目标Zone。
6.根据权利要求5所述的I/O请求派发装置,其特征在于,所述派发单元具体用于:
在所述监听单元在预设时长内监听到所述Zone锁解锁时,将所述写I/O请求派发至所述目标Zone;
若在所述预设时长内所述Zone锁一直锁定,跳过所述写I/O请求派发其他I/O请求。
7.根据权利要求5或6所述的I/O请求派发装置,其特征在于,所述派发单元还用于:
若所述查询单元查询所述Zone锁处于解锁状态,将所述写I/O请求派发至所述目标Zone。
8.根据权利要求5-7任一项所述的I/O请求派发装置,其特征在于,所述装置还包括:
锁定单元,用于在所述派发单元将所述写I/O请求派发至所述目标Zone后,锁定所述目标Zone的Zone锁。
9.一种I/O请求派发装置,其特征在于,所述装置包括处理器、存储器以及存储在存储器上并可在处理器上运行的指令,当所述指令被运行时,使得所述装置执行如权利要求1至4任一项所述的I/O请求派发方法。
10.一种I/O调度器,其特征在于,包括如权利要求9所述的I/O请求派发装置。
11.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至4任一项所述的I/O请求派发方法。
12.一种计算机程序产品,当其在计算机上运行时,使得计算机执行权利要求1至4任一项所述的I/O请求派发方法。
CN201810897159.6A 2018-08-08 2018-08-08 一种i/o请求派发方法及装置 Pending CN109324755A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810897159.6A CN109324755A (zh) 2018-08-08 2018-08-08 一种i/o请求派发方法及装置
PCT/CN2019/095922 WO2020029749A1 (zh) 2018-08-08 2019-07-15 一种i/o请求派发方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810897159.6A CN109324755A (zh) 2018-08-08 2018-08-08 一种i/o请求派发方法及装置

Publications (1)

Publication Number Publication Date
CN109324755A true CN109324755A (zh) 2019-02-12

Family

ID=65264111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810897159.6A Pending CN109324755A (zh) 2018-08-08 2018-08-08 一种i/o请求派发方法及装置

Country Status (2)

Country Link
CN (1) CN109324755A (zh)
WO (1) WO2020029749A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020029749A1 (zh) * 2018-08-08 2020-02-13 华为技术有限公司 一种i/o请求派发方法及装置
CN113360077A (zh) * 2020-03-04 2021-09-07 华为技术有限公司 数据存储方法及计算节点
CN115186300A (zh) * 2022-09-08 2022-10-14 粤港澳大湾区数字经济研究院(福田) 文件安全处理系统及文件安全处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106201355A (zh) * 2016-07-12 2016-12-07 腾讯科技(深圳)有限公司 数据处理方法和装置以及存储系统
CN107562648A (zh) * 2016-07-01 2018-01-09 北京忆恒创源科技有限公司 无锁ftl访问方法与装置
CN107957852A (zh) * 2017-10-13 2018-04-24 记忆科技(深圳)有限公司 一种提升固态硬盘性能一致性的方法
CN108255408A (zh) * 2016-12-28 2018-07-06 中国电信股份有限公司 数据存储方法以及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9690793B2 (en) * 2015-02-06 2017-06-27 Western Digital Technologies, Inc. Indirection data structures to manage file system metadata
CN108021339B (zh) * 2017-11-03 2021-05-04 网宿科技股份有限公司 一种磁盘读写的方法、设备以及计算机可读存储介质
CN109324755A (zh) * 2018-08-08 2019-02-12 成都华为技术有限公司 一种i/o请求派发方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562648A (zh) * 2016-07-01 2018-01-09 北京忆恒创源科技有限公司 无锁ftl访问方法与装置
CN106201355A (zh) * 2016-07-12 2016-12-07 腾讯科技(深圳)有限公司 数据处理方法和装置以及存储系统
CN108255408A (zh) * 2016-12-28 2018-07-06 中国电信股份有限公司 数据存储方法以及系统
CN107957852A (zh) * 2017-10-13 2018-04-24 记忆科技(深圳)有限公司 一种提升固态硬盘性能一致性的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020029749A1 (zh) * 2018-08-08 2020-02-13 华为技术有限公司 一种i/o请求派发方法及装置
CN113360077A (zh) * 2020-03-04 2021-09-07 华为技术有限公司 数据存储方法及计算节点
CN113360077B (zh) * 2020-03-04 2023-03-03 华为技术有限公司 数据存储方法、计算节点及存储系统
CN115186300A (zh) * 2022-09-08 2022-10-14 粤港澳大湾区数字经济研究院(福田) 文件安全处理系统及文件安全处理方法

Also Published As

Publication number Publication date
WO2020029749A1 (zh) 2020-02-13

Similar Documents

Publication Publication Date Title
US11681614B1 (en) Storage device with subdivisions, subdivision query, and write operations
TWI734895B (zh) 聚集儲存方法、跨結構高速非揮發性記憶體固態硬碟用的容量聚集方法及聚集的乙太網路固態硬碟群組
US9710377B1 (en) Multi-array operation support and related devices, systems and software
TWI393150B (zh) 最佳化記憶體操作之方法、主機裝置及資料儲存系統
CN104866428B (zh) 数据存取方法和数据存取装置
KR101502896B1 (ko) 맵 리듀스를 이용한 분산 메모리 클러스터 제어 장치 및 방법
US7181571B2 (en) System and method for storage system
CN109324755A (zh) 一种i/o请求派发方法及装置
CN106775493B (zh) 一种存储控制器及io请求处理方法
JP2012523612A (ja) いくつかのコマンドを処理するためのメモリコントローラ、メモリシステム、ソリッドステートドライブ、および方法
CN105159841B (zh) 一种内存迁移方法及装置
CN106201355A (zh) 数据处理方法和装置以及存储系统
CN102165408A (zh) 用于确定数据的再调用顺序的装置、方法以及程序
CN108319496A (zh) 资源访问方法、业务服务器、分布式系统及存储介质
JP2007052812A (ja) 自動化されたデータ・ストレージ・ライブラリにおけるデータ・ストレージ・ドライブ
CN109582215A (zh) 硬盘操作命令的执行方法、硬盘及存储介质
CN109308269A (zh) 一种内存管理方法及装置
CN109359063A (zh) 面向存储系统软件的缓存置换方法、存储设备及存储介质
CN1637725A (zh) 用于保留存储器的方法、系统及产品
CN109766056A (zh) 一种存储阵列控制器io队列调度方法与装置
CN104462181B (zh) 一种ssd后端数据通路管理加速模块及ssd设备
CN108132759A (zh) 一种文件系统中管理数据的方法和装置
US20220283745A1 (en) Storage system, path management method, and recording medium
US7870334B2 (en) Distributed task queues in a multiple-port storage system
US8117419B2 (en) Storage apparatus and method for eliminating redundant data storage using storage apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190212