CN112306925A - 访问请求的处理方法、装置、设备及存储介质 - Google Patents

访问请求的处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112306925A
CN112306925A CN201910713053.0A CN201910713053A CN112306925A CN 112306925 A CN112306925 A CN 112306925A CN 201910713053 A CN201910713053 A CN 201910713053A CN 112306925 A CN112306925 A CN 112306925A
Authority
CN
China
Prior art keywords
model
lun
storage device
access request
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910713053.0A
Other languages
English (en)
Other versions
CN112306925B (zh
Inventor
鲁鹏
刘金虎
杜晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910713053.0A priority Critical patent/CN112306925B/zh
Priority to PCT/CN2020/088822 priority patent/WO2021022852A1/zh
Priority to MX2022001176A priority patent/MX2022001176A/es
Priority to EP20850639.4A priority patent/EP3995971A4/en
Publication of CN112306925A publication Critical patent/CN112306925A/zh
Priority to US17/590,167 priority patent/US20220155970A1/en
Application granted granted Critical
Publication of CN112306925B publication Critical patent/CN112306925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • G06F13/362Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control
    • G06F13/364Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control using independent requests or grants, e.g. using separated request and grant lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0656Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种访问请求的处理方法、装置、设备及存储介质,属于存储技术领域。本申请实施例中,在数据迁移的场景下,通过将旧的存储设备的数据以及旧的存储设备训练出的AI模型,均从旧的存储设备迁移到新的存储设备上,新的存储设备如果接收到访问请求,通过复用旧的存储设备训练好的AI模型,即可得到AI模型针对访问请求的预测结果,从而免去新的存储设备重新进行模型训练带来的时间开销,提高了新的存储设备利用AI模型提供功能的效率。

Description

访问请求的处理方法、装置、设备及存储介质
技术领域
本申请涉及存储技术领域,特别涉及一种访问请求的处理方法、装置、设备及存储介质。
背景技术
随着存储技术以及人工智能(artificial intelligence,AI)技术的发展,可以使用AI模型学习出上层应用对存储设备中存储的数据的访问模式,当存储设备接收到访问请求时,存储设备可以根据访问请求,利用AI模型来预测出将要使用的指令或数据,从而进行缓存(cache)预取,或者利用AI模型来预测出发送访问请求的工作负载(workload),从而实现工作负载识别功能,或者利用AI模型来预测出需要分配多少资源来处理访问请求,从而实现智能调度功能。
存储设备会在运行过程中,基于输入输出(input output,IO)请求进行模型训练,得到AI模型。具体而言,在存储设备初始化的过程中,存储设备会创建AI模型,将该AI模型的参数置为预设初始值,得到初始AI模型。之后,存储设备启动,每当接收到对存储的数据的IO请求,存储设备会根据IO请求,获取初始AI模型的预测结果,再根据预测结果的误差,对初始AI模型的参数进行调整,直至预测结果的误差小于误差阈值为止,将初始AI模型作为训练完成的AI模型。
相关技术中,在数据迁移的场景下,比如需要将数据从在旧的存储设备上存储,改为将数据在新的存储设备上存储时,旧的存储设备和新的存储设备均需要为数据执行模型训练流程。具体地,旧的存储设备在历史运行过程中,客户端会向旧的存储设备发送历史IO请求,旧的存储设备会接收到历史IO请求,历史IO请求用于请求读取数据或写入数据。旧的存储设备会根据历史IO请求进行模型训练,得到AI模型。当需要迁移数据时,旧的存储设备会向新的存储设备发送数据,新的存储设备会从旧的存储设备接收数据,存储数据,从而完成数据迁移。此后,客户端会向新的存储设备发送IO请求,新的存储设备接收到IO请求后,会基于IO请求,重新执行模型训练的流程,来重新得到AI模型。
采用上述方法时,新的存储设备需要重新进行模型训练,才能得到AI模型,而重新进行模型训练会耗费很长的时间,影响了新的存储设备利用AI模型来提供缓存预取、负载识别、智能调度等功能的效率。
发明内容
本申请实施例提供了一种访问请求的处理方法、装置、设备及存储介质,能够免去新的存储设备重新进行模型训练带来的时间开销,提高新的存储设备利用AI模型提供功能的效率。
第一方面,提供了一种访问请求的处理方法,应用于第一存储设备,所述方法包括:接收来自第二存储设备的数据以及人工智能AI模型,所述AI模型由所述第二存储设备在历史运行过程中,基于对所述数据的历史输入输出IO请求训练得到;存储所述数据以及所述AI模型;接收对所述数据的访问请求;根据所述访问请求,获取所述AI模型的预测结果。
在数据从第二存储设备迁移至第一存储设备的场景下,通过将AI模型也从第二存储设备迁移至第一存储设备,第一存储设备可以复用第二存储设备已训练的AI模型,来得到AI模型的预测结果,从而免去了第一存储设备重新进行模型训练的流程,进而免去了第一存储设备重新训练AI模型带来的时间开销。由于第一存储设备得到AI模型的速度更快,第一存储设备根据AI模型来得到预测结果的速度也就更快,因此根据预测结果来提供缓存预取、负载识别、智能调度等功能的速度也就更快,从而极大地提高了第一存储设备进行缓存预取、负载识别以及智能调度的效率。
可选地,所述数据属于所述第二存储设备的第一逻辑存储单元LUN,所述AI模型为所述第一LUN对应的目标AI模型。
考虑到同一存储设备的不同LUN通常会存储不同工作负载的数据,而不同工作负载对数据的访问模式通常不同,导致不同工作负载对相应的LUN发送的IO请求的规律也会产生区别。因此,通过以LUN为粒度,针对属于第一LUN的数据的IO请求,复用第一LUN对应的AI模型,来得到预测结果,灵活性高。并且,由于AI模型是根据属于第一LUN的数据的IO请求训练得到的,AI模型的参数能够与第一LUN匹配,因此AI模型的复用程度更加精细化,提高了AI模型的预测结果的精确性。
可选地,所述接收来自第二存储设备的数据以及人工智能AI模型之后,所述方法包括:创建第二LUN;根据所述第一LUN对应的AI模型,获取所述第二LUN对应的AI模型。
在存储设备新建LUN的场景下,通过复用已有的LUN对应的AI模型,来得到新建的LUN对应的AI模型,从而免去了为新建的LUN进行模型训练的流程,进而免去了为新建的LUN进行模型训练带来的时间成本。由于得到新建的LUN对应的AI模型的速度更快,根据AI模型得到预测结果的速度也就更快,因此根据预测结果来为新建的LUN提供缓存预取、负载识别、智能调度等功能的速度也就更快,从而极大地提高了为新建的LUN进行缓存预取、负载识别以及智能调度的效率。
可选地,所述根据所述第一LUN对应的AI模型,获取所述第二LUN对应的AI模型,包括下述任意一项:从一个或多个所述第一LUN对应的AI模型中,选择一个AI模型,作为所述第二LUN对应的AI模型;对一个或多个所述第一LUN对应的AI模型进行加权平均,得到所述第二LUN对应的AI模型。
通过这种可选方式,提供了多种复用历史创建的LUN对应的AI模型的方式,提高了灵活性。
可选地,每个第一LUN的权重相同;或者,每个第一LUN的权重与对应的应用标识在所有第一LUN对应的应用标识中所占的比例正相关,或者,每个第一LUN的权重与对应的用户标识在所有第一LUN对应的用户标识中所占的比例正相关。
通过这种可选方式,考虑到在所有的第一LUN中,针对应用标识或用户标识所占的比例较大的LUN的访问规律更具有普适性和代表性,因此这些LUN对应的AI模型能够更准确地反映出新建的LUN的访问规律,那么通过为这些LUN设置较高的权重,结合每个LUN的权重以及AI模型,来为新建的LUN获取AI模型,可以提高新建的LUN对应的AI模型的准确性。
可选地,所述创建第二LUN之前,所述方法还包括:分配共享存储空间,所述共享存储空间用于存储每个LUN对应的AI模型;所述存储所述数据以及所述AI模型,包括:将所述第一LUN对应的AI模型写入所述共享存储空间;所述根据历史创建的第二LUN的人工智能AI模型,获取所述第一LUN对应的AI模型之前,所述根据所述第一LUN对应的AI模型,获取所述第二LUN对应的AI模型之后,所述方法还包括:将所述第二LUN对应的AI模型写入所述共享存储空间。
通过这种可选方式,将每个LUN对应的AI模型均存储在共享存储空间,便于统一地管理每个LUN对应的AI模型。
可选地,所述根据所述访问请求,获取所述AI模型的预测结果之后,所述方法还包括:根据所述预测结果,对所述AI模型的参数进行调整。
通过这种可选方式,新的存储设备能够随着接收到的访问请求,对老的存储设备训练好的AI模型进行模型微调,从而结合自身的运行过程来优化AI模型,使得AI模型的参数在调整后,会与对新的存储设备执行的数据访问过程更加匹配,从而提高AI模型的准确性。
可选地,所述AI模型包括第一AI模型,所述根据所述访问请求,获取所述AI模型的预测结果,包括:将所述访问请求输入所述第一AI模型,输出目标访问请求,所述目标访问请求表示所述第一存储设备的处理器将要使用的指令或数据;所述根据所述访问请求,获取所述AI模型的预测结果之后,所述方法还包括:将所述指令或数据写入所述第一存储设备的缓存。
通过这种可选方式,利用AI模型实现了缓存预取的功能。通过第一AI模型,来学习出当前接收到的IO请求与将要接收到的IO请求之间的映射关系,当接收到IO请求时,能够通过第一AI模型,预测出将要接收的IO请求,从而确定出处理器将要使用哪些指令或数据,那么通过提前将这些指令或数据写入缓存,处理器需要使用指令或数据时,可以直接从缓存中读取指令或数据,因此提高了处理器的执行速度。
可选地,所述AI模型包括第二AI模型,所述根据所述访问请求,获取所述AI模型的预测结果,包括:对当前时间段的所述访问请求进行统计,得到访问特征;将所述访问特征输入所述第二AI模型,输出工作负载信息,所述工作负载信息表示发送所述访问请求的工作负载。
通过这种可选方式,利用AI模型实现了工作负载识别的功能。通过第二AI模型,来学习出访问请求与发送访问请求的工作负载之间的映射关系,当接收到访问请求时,能够通过第二AI模型,准确地预测出是哪个工作负载发送了该访问请求。
可选地,所述AI模型包括第三AI模型,所述根据所述访问请求,获取所述AI模型的预测结果,包括:将所述访问请求以及第一分配信息输入所述第三AI模型,输出第二分配信息,所述第一分配信息表示当前为每个任务分配的处理资源、存储资源或网络资源中的至少一项;所述根据所述访问请求,获取所述AI模型的预测结果之后,所述方法还包括:根据所述第二分配信息,为所述每个任务分配处理资源、存储资源或网络资源中的至少一项。
通过这种可选方式,利用AI模型实现了智能调度的功能。通过第三AI模型,来学习出访问请求以及资源分配情况与所需分配的资源之间的映射关系,当接收到访问请求时,能够通过第一AI模型,准确地预测出在当前的访问请求以及资源分配情况下,需要为每个任务分配的资源,从而基于预测结果,能够科学地为每个任务分配资源。
第二方面,提供了一种访问请求的处理装置,应用于第一存储设备,所述装置具有实现上述第一方面或第一方面任一种可选方式中访问请求的处理的功能。该装置包括至少一个模块,所述至少一个模块用于实现上述第一方面或第一方面任一种可选方式提供的方法。
第三方面,提供了一种第一存储设备,所述第一存储设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述指令由所述一个或多个处理器执行以实现上述第一方面或第一方面任一种可选方式提供的方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器执行以实现上述第一方面或第一方面任一种可选方式提供的方法。
第五方面,提供一种计算机程序,所述计算机程序包括用于执行上述第一方面或第一方面任意可选方式的指令。
第六方面,提供一种芯片,所述芯片用于执行上述第一方面或第一方面任一种可选方式提供的方法。
附图说明
图1是本申请实施例提供的一种访问请求的处理方法的实施环境的架构图;
图2是本申请实施例提供的一种第一存储设备或第二存储设备的结构示意图;
图3是本申请实施例提供的一种访问请求的处理方法的流程图;
图4是本申请实施例提供的一种数据迁移场景下复用AI模型的示意图;
图5是本申请实施例提供的一种数据迁移场景下复用AI模型的示意图;
图6是本申请实施例提供的一种数据迁移场景下复用AI模型的示意图;
图7是本申请实施例提供的一种访问请求的处理方法的流程图;
图8是本申请实施例提供的一种新建LUN场景下复用AI模型的示意图;
图9是本申请实施例提供的一种新建LUN场景下复用AI模型的示意图;
图10是本申请实施例提供的一种新建LUN场景下复用AI模型的示意图;
图11是本申请实施例提供的一种访问请求的处理装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中的字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请中术语“多个”的含义是指两个或两个以上,例如,多个数据包是指两个或两个以上的数据包。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
以下,对本申请涉及的术语进行解释。
IO请求:可以包括访问请求或写请求。访问请求用于请求从存储设备读取数据。写请求用于请求向存储设备写入数据。IO请求可以包括存储设备上的存储位置。例如,IO请求可以包括起始扇区标识以及扇区数量,根据该IO请求,可以从该起始扇区标识对应的起始扇区开始,向后连续读取该扇区数量个扇区,从读取的扇区中取出数据,或者向读取的扇区写入数据。
访问特征:一段时间内访问请求的特征。例如,访问特征可以包括而不限于一段时间内访问请求的大小、最大访问请求、最小访问请求、平均访问请求、连续访问、随机访问、串行访问、并行访问中的一项或多项。
访问请求的大小:可以通过访问请求携带的连续扇区数目表示,例如,如果访问请求携带的连续扇区的数量很大,比如为128、64等,可以将访问请求视为大访问请求。如果访问请求携带的连续读取扇区的数量很小,比如1、4、8等,可以将访问请求视为小访问请求。
连续访问:是指本次接收到的访问请求对应的起始存储位置和上一次接收到的访问请求对应的结束存储位置完全连续,或者本次接收到的访问请求对应的起始存储位置和上一次接收到的访问请求对应的结束存储位置虽然具有一定间隔,但间隔小于阈值。对于连续访问来说,由于本次访问的存储位置和上次访问的存储位置相隔很近,磁头几乎不用换道,或换道时间极短。
随机访问:是指本次访问请求的初始扇区地址和上一次访问请求的结束扇区地址相隔大于阈值。对于随机访问来说,由于本次初始扇区和上次结束扇区相隔很远,导致磁头需要换道,因此随机访问的读写效率较低。
串行访问:是指控制器每一次对多个硬盘发出的指令是一条还是多条。如果是一条,则控制器缓存的访问队列中的每个访问请求只能一个一个的处理,这种情况为串行访问。
并行访问:如果控制器同时对多块硬盘分别发送指令,则每次可以同时执行多个访问请求,这种情况为并行访问。
AI模型:本申请实施例中,AI模型用于基于存储设备接收到的历史IO请求,通过模型训练来学习出对该存储设备存储的数据的访问模式,当接收到对数据的访问请求时,AI模型能够给出预测结果。作为示例,AI模型可以为有监督的机器学习模型,AI模型的类型可以而不限于是神经网络模型、决策树模型、随机森林模型、逻辑回归模型、支持向量机、置信网络、强化学习模型、迁移学习模型、归纳学习模型中的一项或多项。
缓存(cache)预取:是指预测出处理器将要使用的指令和/或数据,在该指令和/或数据被真正使用之前,提前将指令和/或数据存放到缓存的技术。通过缓存预取,cache中的数据能够在发生失效之前,提前将被写入至缓存,因此处理器真正需要使用数据时,可以直接对缓存中的数据进行读写,因此可以避免缓存失效造成处理器访问缓存失败,也就避免处理器访问处理器失败带来的时钟周期开销,因此避免处理器停顿,从而加快处理器执行速度。
工作负载(workload):是指业务的运行载体。工作负载在处理业务的过程中,会通过向存储设备发送访问请求,来访问存储设备,从而从存储设备读取数据或写入数据。工作负载可以是物理的计算设备,比如服务器或主机,也可以是虚拟化设备,比如虚拟机、容器、pod(pod是指Kubernetes中运行、管理、编排容器化应用时的基本单位)等。
工作负载(workload)识别:是指识别出发送访问请求的工作负载的功能。通常来讲,相同的工作负载的访问行为具有规律性,本实施例中,可以在历史运行中,基于工作负载发送的历史访问请求,通过模型训练,让AI模型学习出该工作负载的访问行为的规律,得出访问请求与工作负载之间的映射关系,因此在模型训练完成后,如果将访问请求输入至AI模型,AI模型能够输出工作负载信息,从而通过工作负载信息,指明哪一个或哪多个工作负载发送了访问请求。
智能调度:是指为存储设备执行的每个任务,自动地分配处理资源、存储资源或网络资源中的至少一项。其中,处理资源可以为对处理器划分得到的资源,例如,处理资源可以是对中央处理器(Central Process Unit,简称:CPU)划分的资源,比如可以为CPU核心,又如,处理器可以是对现场可编程门阵列(Field-Programmable Gate Array,简称:FPGA)资源划分的资源,比如布线分区等。存储资源可以是对存储器划分得到的资源,例如可以是内存空间。网络资源可以是对收发器划分得到的资源,例如可以是带宽、端口数量等。本实施例中,可以利用AI模型来进行智能调度。具体地,可以由AI模型,学习出在当前接收到的访问请求以及分配的处理资源的情况下,需要为每个任务分配多少处理资源;和/或,由AI模型,学习出在当前接收到的访问请求以及分配的存储资源的情况下,需要为每个任务分配多少存储资源;和/或,由AI模型,学习出在当前接收到的访问请求以及分配的网络资源的情况下,需要为每个任务分配多少网络资源,根据AI模型的预测结果,可以分配相应地处理资源、存储资源、网络资源中的至少一项,从而实现更科学、更准确的资源调度功能。
LUN:是指通过存储硬件虚拟出的逻辑盘,存储设备的操作系统通常会将LUN视为一块可以使用的硬盘。
模型微调(fine-tuning):是指对已经训练完成的AI模型训练,来调整已经训练完成的AI模型的参数。模型微调的过程与模型训练的过程类似,相区别的是,模型训练时,会按照AI模型对应的预设方式,对模型参数进行初始化,例如进行高斯随机初始化。而模型微调时,会使用已训练的模型的参数进行初始化,即,将已训练的模型的参数作为微调前的模型的初始化参数。可选地,模型微调的学习率可以小于模型训练的学习率。可选地,模型微调时,可以只训练模型的部分层,比如只训练网络的最后一层或最后几层的权重。
以下,示例性介绍本申请的系统架构。
图1是本申请实施例提供的一种访问请求的处理方法的实施环境的架构图,该实施环境包括存储系统100以及客户端200,存储系统100和客户端200可以建立通信通路,通过该通信通路进行通信。
存储系统100包括第一存储设备以及第二存储设备,第一存储设备可以和第二存储设备建立有线或无线网络连接,从而通过网络连接进行通信,第一存储设备以及第二存储设备的结构可以如图2实施例所示,第一存储设备可以和第二存储设备进行交互来执行下述图3实施例中的方法,另外第一存储设备还可以执行下述图7实施例中的方法。
客户端200可以是能够访问数据的任意设备,例如,客户端200可以是应用服务器、主机或终端等。存储系统100可以为客户端200提供数据存储服务。具体来说,客户端200可以根据待存储的数据,生成IO请求,向存储系统100发送IO请求,该IO请求携带需要存储的数据,存储系统100可以从客户端200接收IO请求,从IO请求中获取数据,存储数据。
在一些可能的实施例中,存储系统100可以作为云存储服务提供给用户。具体来说,存储系统100可以运行在云环境中,例如可以运行在公有云、私有云或混合云上。用户可以使用客户端200,在云存储服务中申请一定容量的存储空间。云存储服务可以为用户分配一个或多个存储空间,从而在分配的存储空间中,存储用户所需存储的数据。作为示例,存储系统100可以提供为对象存储服务(object storage service,简称:OBS)、云硬盘、云数据库等。
本领域技术人员可以知晓,图1所示的实施环境中存储系统100中存储设备的数量和客户端200的数量可以更多或更少。例如,存储系统100中的存储设备可以为几十个或几百个或者更多数量,此时上述实施环境还包括第一存储设备以及第二存储设备之外的其他存储设备。此外,客户端200也可以仅为一个,或者客户端200为几十个或几百个或者更多数量,此时上述实施环境还包括其他客户端200。
以下,示例性介绍本申请的硬件结构。
图2是本申请实施例提供的一种第一存储设备或第二存储设备的结构示意图。示例性地,第一存储设备或第二存储设备可以为存储阵列,该存储阵列可以包括控制器101以及硬盘102。
控制器101可以是专用的存储阵列控制器,也可以是安装了控制软件的服务器或主机。控制器101可因配置或性能不同而产生比较大的差异。通常来讲,控制器101可以包括处理器1011、存储器1012、收发器1013以及总线1014。
处理器1011可以是中央处理器(central processing unit,简称:CPU)、AI芯片、现场可编程门阵列(field-programmable gate array,简称:FPGA)、专用集成电路(application specific integrated circuit,简称:ASIC)、可编程逻辑器件(programmable logic device,简称:PLD)、状态机、门逻辑、分立硬件部件或者任何其它适合的电路。处理器1011可以是一个或多个,本实施例对处理器1011的数量不做限定。
存储器1012中存储有至少一条指令,该至少一条指令由该处理器1011执行以实现下述方法实施例示出的访问请求的处理方法。存储器1012可以包括易失性存储器或非易失性存储器中的至少一项。例如,存储器1012可以包括随机存取存储器(random accessmemory,简称:RAM)、只读存储器(read-only memory,简称:ROM)、机械硬盘(hard diskdrive,简称:HDD)、固态硬盘(solid state drive,简称:SSD)、只读光盘(compact discread-only memory,简称:CD-ROM)、磁带、软盘、光数据存储设备、快闪存储器中的至少一项。
收发器1013可以是有线或无线网络接口,第一存储设备的收发器1013可以用于与第二存储设备进行通信,第二存储设备的收发器1013可以用于与第一存储设备进行通信。
总线1014与处理器1011、存储器1012、收发器1013连接,处理器1011、存储器1012、收发器1013可以通过总线1014通信。
硬盘102可以而不限于是HDD或SSD。硬盘102可以用于持久化存储数据以及AI模型。在一些可能的实施例中,硬盘102可以虚拟为一个或多个LUN,硬盘102可以存储每个LUN的数据以及每个LUN对应的AI模型。
控制器101可以与硬盘102通信连接。通信连接的方式可以而不限于总线、网络或交换设备中的任一项。其中,总线可以而不限于高速串行计算机扩展总线标准(peripheralcomponent interconnect express,简称:PCIe)总线、小型计算机系统接口(smallcomputer system interface,简称:SCSI)缓存一致性系统(Huawei ccache-coherentsystem,HCCS)、以太网、无限带宽(infiniband,IB)、光纤通道(fibre channel,FC)中的任意一种,网络可以是有线或无线网络,比如以太网,交换设备可以是交换机,比如光纤通道交换机。
需要说明的一点是,图2仅是以第一存储设备或第二存储设备包括一个控制器101为例,在一些可能的实施例中,第一存储设备或第二存储设备也可以包括两个或两个以上的控制器101,下述方法实施例中的各个步骤可以分散在不同的控制器101上执行,从而分担整体的计算量。
以下,示例性介绍本申请的方法流程。
图3是本申请实施例提供的一种访问请求的处理方法的流程图,如图3所示,该方法以第一存储设备以及第二存储设备交互执行为例进行说明,该方法包括下述步骤301至309:
步骤301、第二存储设备接收对数据的IO请求。
示例性地,参见图1,IO请求的发送端可以为图1中的客户端200,第二存储设备可以从客户端200接收IO请求。当然,也可以由客户端之外的其他设备向第二存储设备发送IO请求,本实施例对IO请求的发送端不做限定。
步骤302、第二存储设备基于IO请求进行模型训练,得到AI模型。
在一些可能的实施例中,模型训练的过程可以包括下述步骤(1)至步骤(5):
步骤(1)第二存储设备创建初始AI模型。
具体地,可以在模型训练之前,预先设置AI模型的超参数,该超参数可以用于确定AI模型的结构,比如说如果AI模型为神经网络模型,超参数可以包括神经网络模型的隐藏层数、卷积核大小,卷积操作的步长或卷积核个数等,如果AI模型为决策树,超参数可以包括叶子节点的数量或决策树的深度等,如果AI模型为随机森林,超参数可以包括决策树的数量等。第二存储设备可以存储超参数,根据超参数创建初始AI模型。另外,第二存储设备可以对初始AI模型中超参数之外的其他模型参数进行初始化,例如可以对模型参数进行随机初始化、高斯初始化等,又如可以将模型参数设置为预设数值。
在一些可能的实施例中,第二存储设备可以针对不同的应用场景创建不同的初始AI模型。示意性地,初始AI模型可以包括第一初始AI模型、第二初始AI模型、第三初始AI模型中的一项或多项。第一初始AI模型用于训练出用于缓存预取的AI模型(第一AI模型),第二初始AI模型用于训练出用于工作负载识别的AI模型(第二AI模型),第三初始AI模型用于训练出用于智能调度的AI模型(第三AI模型)。举例来说,第一初始AI模型可以是神经网络模型,比如可以是卷积神经网络或者循环神经网络,第二初始AI模型可以是决策树、随机森林或XGBOOST(将许多弱分类器集成在一起以形成强分类器的一种机器学习模型)等。
步骤(2)第二存储设备根据IO请求,获取初始AI模型的预测结果。
针对缓存预取的应用场景,第二存储设备可以将IO请求输入第一初始AI模型,第一初始AI模型可以根据IO请求,对第二存储设备的处理器将要使用的指令或数据进行预测,输出目标IO请求。其中,目标IO请求表示第二存储设备的处理器将要使用的指令或数据。例如,目标IO请求可以携带指令或数据的存储地址。
针对工作负载识别的应用场景,第二存储设备可以对当前时间段的IO请求进行统计,得到访问特征,将访问特征输入第二初始AI模型,输出工作负载信息。其中,当前时间段的结束点可以为当前时间点,当前时间段的时长可以为预设时长。工作负载信息表示发送IO请求的工作负载。例如,工作负载信息可以包括工作负载的标识,工作负载的标识可以而不限于是工作负载的身份标识号码(identity,简称:ID)、名称、编号等。
针对智能调度的应用场景,第二存储设备可以将IO请求以及第一分配信息输入第三初始AI模型,输出第二分配信息。其中,第一分配信息表示当前为每个任务分配的处理资源、存储资源或网络资源中的至少一项,第二分配信息表示AI模型预测出的需要为每个任务分配的处理资源、存储资源或网络资源中的至少一项。在一种可能的实现中,第三初始AI模型可以根据每个任务的优先级,为每个任务分配的处理资源、存储资源或网络资源中的至少一项,其中,任务的优先级越高,则为该任务分配的处理资源可以越多,为该任务分配的存储资源可以越多,为该任务分配的网络资源可以越多,以便提高该任务的处理速度。
步骤(3)第二存储设备获取预测结果的误差。
第二存储设备可以获取参考结果,对预测结果以及参考结果进行比较,得到预测结果的误差,该预测结果的误差表示预测结果的准确程度。作为示意,第二存储设备可以采用损失函数,对预测结果以及参考结果进行运算,得到预测结果的误差。其中,损失函数包括而不限于交叉熵损失函数、均方误差损失函数等。
在一种可能的实现中,如果预测结果是目标IO请求,参考结果可以为第二存储设备接收到IO请求后,第二存储设备的处理器实际使用的指令或数据。如果预测结果是工作负载信息,参考结果可以为发送IO请求的实际工作负载。如果预测结果是第二资源分配信息,参考结果可以为每个任务实际需要的处理资源、存储资源或网络资源中的至少一项。
步骤(4)第二存储设备根据预测结果的误差,对初始AI模型的参数进行调整。
以初始AI模型为神经网络模型为例,第二存储设备可以根据预测结果的误差,采用反向传播算法,对初始AI模型中的每个层的每个卷积核的权重进行调整。
步骤(5)第二存储设备重复执行上述步骤(2)至步骤(4),直至预测结果的误差小于误差阈值或者迭代次数达到预设次数为止。
第二存储设备可以每当接收到IO请求时,重复执行上述步骤(2)至步骤(4),来调整一次初始AI模型的参数,则初始AI模型会随着参数的不断调整而得到优化。在迭代的过程中,第二存储设备可以判断预测结果的误差是否小于误差阈值,如果预测结果的误差不小于误差阈值,则继续进行模型训练,如果预测结果的误差小于误差阈值,对初始AI模型训练完成,将初始AI模型作为已训练的AI模型。
在一些可能的实施例中,第二存储设备可以通过CPU,执行上述模型训练的过程。具体地,如果第二存储设备未安装AI芯片,比如,如果第二存储设备如图2所示,在控制器101的处理器1011中包括CPU而不包括AI芯片的情况下,参见图4,可以由CPU作为模型训练的执行主体,该CPU可以在内存中训练AI模型,例如,CPU可以收集训练AI模型所需的数据,比如接收到的IO请求等,将训练AI模型所需的数据缓存在内存中,在训练过程中,每当CPU计算出模型参数时,CPU可以将模型参数缓存至内存中,如果对模型参数进行调整,则CPU对缓存在内存的模型参数进行更新。
在另一些可能的实施例中,第二存储设备可以通过AI芯片,执行上述模型训练的过程。具体地,如果第二存储设备安装了AI芯片,比如,如果第二存储设备如图2所示,在控制器101的处理器1011中包括AI芯片的情况下,参见图5和图6,可以由AI芯片作为模型训练的执行主体。
参见图5,AI芯片可以在过第二存储设备自身的内存中训练AI模型。在一种可能的实现中,CPU可以收集训练AI模型所需的数据,将训练AI模型所需的数据发送至AI芯片,AI芯片根据训练AI模型所需的数据,计算出模型参数后,AI芯片可以将模型参数缓存至内存中,如果AI芯片对模型参数进行了调整,AI芯片可以对缓存在内存的模型参数进行更新。
参见图6,AI芯片可以在该AI芯片的内存中训练AI模型。在一种可能的实现中,CPU可以收集训练AI模型所需的数据,将训练AI模型所需的数据缓存在CPU对应的内存中,AI芯片可以从CPU对应的内存中,读取训练AI模型所需的数据,在AI芯片中进行模型训练。例如,每当AI芯片计算出模型参数后,AI芯片将模型参数缓存至AI芯片内的内存中,如果AI芯片对模型参数进行了调整,AI芯片可以对缓存在AI芯片的内存的模型参数进行更新。
需要说明的另一点是,在训练得到AI模型后,第二存储设备在运行过程中可以继续接收到IO请求,第二存储设备可以基于IO请求,对AI模型进行模型微调。具体地,第二存储设备可以基于IO请求,获取AI模型的预测结果,第二存储设备可以根据预测结果以及参考结果,对AI模型的参数进行调整。其中,对模型参数进行调整的方式还请参见上述步骤(4),在此不做赘述。
在一些可能的实施例中,第二存储设备可以包括一个或多个LUN,第二存储设备可以在每个LUN中分别存储数据,则第二存储设备的不同数据可以属于不同的LUN。例如,第二存储设备可以在不同的LUN存储不同工作负载的数据,比如说,在LUN1存储来自工作负载1的数据,在LUN2存储来自工作负载2的数据,那么在第二存储设备中,工作负载1的数据属于LUN1,工作负载2的数据属于LUN2。第二存储设备在运行过程中,可以接收到对不同LUN的IO请求,第二存储设备可以基于每个LUN对应的IO请求,为每个LUN分别进行模型训练,得到每个LUN对应的AI模型。其中,不同LUN对应的AI模型的超参数可以相同,而不同LUN对应的AI模型的超参数之外的其他参数,可以由于训练过程或微调过程的不同而产生差异。例如每个LUN对应的AI模型都是神经网络模型,且不同LUN的神经网络模型的层数和卷积核数量可以相同,而不同LUN的神经网络模型中卷积核的权重可以不同。
示意性地,如果第二存储设备包括LUN0、LUN1以及LUN2这3个LUN,第二存储设备可以基于对LUN0的IO请求,为LUN0进行模型训练,得到LUN0对应的AI模型0;基于对LUN1的IO请求,为LUN1进行模型训练,得到LUN1对应的AI模型1;基于对LUN2的IO请求,为LUN2进行模型训练,得到LUN2对应的AI模型2。在此例中,第二存储设备可以建立如下表1所示的对应关系。
表1
Figure BDA0002154430030000101
Figure BDA0002154430030000111
通过为每个LUN分别进行模型训练,由于同一存储设备中不同LUN可以存储不同工作负载的数据,而不同工作负载的数据访问模式在一定概率上不同,使得对不同LUN的IO请求的规律在一定概率上不同,进而使得不同LUN对应的AI模型所适用的模型参数在一定概率上也不同。因此,通过分别基于每个LUN对应的IO请求,为每个LUN分别模型训练,可以保证每个LUN对应的AI模型与对应的LUN更加匹配,因此可以提高AI模型的精确性。
在一些可能的实施例中,第二存储设备可以建立LUN与AI模型之间的对应关系,持久化存储LUN与AI模型之间的对应关系,以便基于对应关系管理每个LUN对应的AI模型。其中,第二存储设备可以分配硬盘空间,在硬盘空间中,存储LUN与AI模型之间的对应关系,从而对LUN与AI模型之间的对应关系持久化存储。另外,第二存储设备可以定期持久化存储LUN与AI模型之间的对应关系,也可以在掉电时持久化存储LUN与AI模型之间的对应关系,本实施例对持久化存储的时机不做限定。LUN与AI模型之间的对应关系可以包括LUN的标识以及AI模型的标识,LUN的标识用于确定对应的LUN,例如可以为LUN的ID、编号、名称等,AI模型的标识用于确定对应的AI模型,例如可以为AI模型的ID、编号、名称等。结合缓存预取、工作负载识别以及智能调度这三种应用场景,LUN与AI模型之间的对应关系可以包括LUN与第一AI模型之间的对应关系、LUN与第二AI模型之间的对应关系、LUN与第三AI模型之间的对应关系中的一项或多项。
步骤303、第二存储设备持久化存储AI模型。
在一些可能的实施例中,第二存储设备可以分配硬盘空间,将AI模型写入硬盘空间,从而通过硬盘对AI模型持久化存储。例如,参见图2,第二存储设备的处理器1011可以训练得到AI模型,为AI模型分配一个或多个硬盘102,将AI模型写入硬盘102。
在一些可能的实施例中,如果第二存储设备通过CPU执行模型训练的过程,参见图4,可以由CPU将AI模型从内存持久化存储至硬盘中。如果第二存储设备通过AI芯片执行模型训练的过程,参见图5,可以由AI芯片将AI模型从AI芯片持久化存储至硬盘中。或者,参见图6,可以由AI芯片将AI模型从CPU对应的内存持久化存储至硬盘中。
第二存储设备可以在任意时机下执行本步骤303。示例性地,第二存储设备可以而不限于在下述情况一至情况三中的任一项下执行步骤303。
情况一、定期存储。第二存储设备可以每隔预设时长,存储一次AI模型。该预设时长可以根据实验、经验或需求设置,本实施例对此不做限定。
情况二、内存不足时存储。具体地,第二存储设备可以判断内存是否小于内存阈值,如果内存小于内存阈值,则将内存中的AI模型写入硬盘空间。
情况三、掉电时存储。具体地,当第二存储设备掉电时,第二存储设备的备份电源可以提供电能,第二存储设备可以使用备份电源的电能,将内存中的AI模型写入硬盘空间。
需要说明的一点是,如果第二存储设备在训练得到AI模型后,基于继续接收到的IO请求,对AI模型进行模型微调,第二存储设备可以持久化存储微调后的AI模型。在一种可能的实现中,如果第二存储设备的硬盘空间已经存储了AI模型,第二存储设备可以删除已存储的AI模型,存储微调后的AI模型,从而对存储的AI模型进行更新。
在一些可能的实施例中,第二存储设备持久化存储AI模型后,第二存储设备可以在上电时从硬盘空间中读取AI模型,加载至内存中。另外,第二存储设备也可以在任意需要使用AI模型的情况下,比如要提供缓存预取、工作负载识别、智能调度等功能时,从硬盘空间中读取AI模型,加载至内存中,以便调用AI模型。
步骤304、第二存储设备向第一存储设备发送数据以及AI模型。
步骤305、第一存储设备接收来自第二存储设备的数据以及AI模型,该AI模型由该第二存储设备在历史运行过程中,基于对该数据的历史IO请求训练得到。
第一存储设备和第二存储设备为不同的设备。可选地,第二存储设备可以为旧设备,第一存储设备可以为新设备。通过将数据从第二存储设备迁移到第一存储设备,能够让数据的存储设备升级换代。
在一些可能的实施例中,第二存储设备可以接收发送指令,根据发送指令,向第一存储设备发送数据以及AI模型,第一存储设备可以从第一存储设备接收数据以及AI模型。其中,该发送指令用于指示第二存储设备发送数据以及AI模型,发送指令可以由用户在第二存储设备上的操作触发,发送指令可以包括第二存储设备的标识、数据在第一存储设备上的原存储位置、AI模型在第一存储设备上的原存储位置、数据在第二存储设备上的目标存储位置、AI模型在第二存储设备上的目标存储位置中的一项或多项。其中,数据在第二存储设备上的目标存储位置和/或AI模型在第二存储设备上的目标存储位置可以位于第二存储设备的硬盘上,以便将数据和/或AI模型迁移至第二存储设备的硬盘。
步骤306、第一存储设备存储数据以及AI模型。
第一存储设备可以持久化存储数据以及AI模型。例如,第一存储设备可以在硬盘空间上存储数据以及AI模型。
在一些可能的实施例中,第二存储设备可以向第一存储设备发送同一个LUN对应的数据以及AI模型,第一存储设备可以接收同一个LUN对应的数据以及AI模型,对应存储数据以及AI模型。示例性地,第二存储设备发送的数据可以属于第二存储设备的第一LUN,第二存储设备发送的AI模型可以为第一LUN对应的AI模型。其中,第一LUN可以为第二存储设备的一个或多个LUN中的任意LUN。示例性地,参见表1,如果第二存储设备发送的数据属于LUN0,第二存储设备发送的AI模型可以为LUN0对应的AI模型0,如果第二存储设备发送的数据属于LUN1,第二存储设备发送的AI模型可以为LUN1对应的AI模型1。
需要说明的一点是,上述仅是以发送属于第一LUN的数据以及第一LUN对应的AI模型为例进行说明,在一些可能的实施例中,第二存储设备可以包括多个LUN,第二存储设备可以为多个LUN中每个LUN的数据分别训练了对应的AI模型,则第二存储设备可以向第一存储设备发送每个LUN的数据以及每个LUN对应的AI模型。此外,第二存储设备可以向第一存储设备发送LUN与AI模型之间的对应关系,第一存储设备可以从第二存储设备接收LUN与AI模型之间的对应关系,存储LUN与AI模型之间的对应关系。
步骤307、第一存储设备接收对数据的访问请求。
步骤308、第一存储设备根据访问请求,获取AI模型的预测结果。
第一存储设备可以从硬盘空间中读取AI模型,将AI模型加载至内存中,调用AI模型,从而得到预测结果。需要说明的是,第一存储设备可以在接收到访问请求时,将AI模型从硬盘空间中加载至内存中,也可以在上电时,将AI模型从硬盘空间中加载至内存中,本实施例对加载AI模型的时机不做限定。
在一些可能的实施例中,第一存储设备可以根据访问请求,确定待访问的数据属于第一LUN,则获取第一LUN对应的AI模型的预测结果。在一种可能的实现中,第一存储设备可以根据访问请求中的存储地址,从一个或多个LUN中,查询数据所属的LUN,得到第一LUN;第一存储设备可以根据第一LUN,查询LUN与AI模型之间的对应关系,得到第一LUN对应的AI模型。如此,第一存储设备通过针对第一LUN来复用对应的AI模型,实现了LUN粒度的AI模型的复用,相对于整个存储设备粒度的AI模型的复用来说,可以提高预测结果的精确性。
针对缓存预取的应用场景,来自第二存储设备的AI模型可以包括第一AI模型,第一AI模型用于根据当前接收到的访问请求预测将要接收到的IO请求。第一存储设备可以将访问请求输入第一AI模型,输出目标访问请求,该目标访问请求即为第一AI模型的预测结果。其中,该目标访问请求为第一AI模型预测出的第一存储设备将要接收到的访问请求,该目标访问请求可以表示第一存储设备的处理器将要使用的指令或数据。例如,该目标访问请求可以携带该指令或数据的元数据、存储地址等。
在一些可能的实施例中,第一存储设备可以每当接收到一个访问请求时,将当前时间点接收到的访问请求输入第一AI模型;在另一些可能的实施例中,第一存储设备也可以当接收到多个访问请求时,将当前时间段接收到的多个访问请求输入第一AI模型。例如,第一存储设备可以每当接收到N个访问请求时,将N个访问请求输入第一AI模型,其中N为正整数。第一存储设备也可以每隔时长M,将时长M内接收到的访问请求输入第一AI模型,其中M为正整数。本实施例对向第一AI模型输入的访问请求的数量不做限定。
在一些可能的实施例中,第一AI模型可以对第一存储设备将要在下一时间点接收到的访问请求进行预测,输出一个目标访问请求;在另一些可能的实施例中,第一AI模型也可以对第一存储设备将要在下一时间段接收到的访问请求进行预测,输出多个目标访问请求,例如,第一AI模型可以对第一存储设备将要接收到的P个访问请求进行预测,输出P个目标访问请求,P为正整数,本实施例对第一AI模型输出的目标访问请求的数量不做限定。
针对工作负载识别的应用场景,来自第二存储设备的AI模型可以包括第二AI模型,第二AI模型用于根据当前时间段的访问请求的访问特征预测发送访问请求的工作负载。第一存储设备可以对当前时间段的访问请求进行统计,得到访问特征。第一存储设备可以将访问特征输入第二AI模型,输出工作负载信息,该工作负载信息即为第二AI模型的预测结果。工作负载信息表示发送访问请求的工作负载。
其中,统计得到访问特征的过程可以包括而不限于下述(1)至(6)中的一项或多项:
(1)获取当前时间段内每个访问请求的大小,根据每个访问请求的大小,从当前时间段的所有访问请求中选择最大访问请求,作为访问特征。
(2)获取当前时间段内每个访问请求的大小,从当前时间段内的所有访问请求中选择最小访问请求,作为访问特征。
(3)可以判断当前时间段的访问请求是否为连续访问,将判断结果作为访问特征。在一种可能的实现中,可以判断每个访问请求对应的起始存储位置和上一个访问请求对应的结束存储位置的间隔是否小于间隔阈值,如果间隔小于间隔阈值,则判断访问请求为连续访问。
(4)可以判断当前时间段的访问请求是否为随机访问,将判断结果作为访问特征。在一种可能的实现中,可以判断每个访问请求的起始扇区地址和上一个访问请求的结束扇区地址的间隔是否大于或等于间隔阈值,如果间隔大于或等于间隔阈值,则判断访问请求为随机访问。
(5)可以判断当前时间段的访问请求是否为串行访问,将判断结果作为访问特征。
(6)可以判断当前时间段的访问请求是否为并行访问,将判断结果作为访问特征。
针对智能调度的应用场景,来自第二存储设备的AI模型可以包括第三AI模型,第三AI模型用于根据当前接收到的访问请求以及资源分配情况预测每个任务所需分配的资源。第一存储设备可以将访问请求以及第一分配信息输入第三AI模型,第三AI模型可以对每个任务需要的处理资源、存储资源或网络资源中的至少一项进行预测,输出第二分配信息,该第二分配信息即为第三AI模型的预测结果。
在一些可能的实施例中,第一存储设备可以每当接收到一个访问请求时,将当前时间点接收到的访问请求以及当前时间点的第一分配信息输入第三AI模型;或者,第一存储设备也可以当接收到多个访问请求时,将当前时间段接收到的多个访问请求以及当前时间段内多个时间点的第一分配信息输入第三AI模型,本实施例对采用哪种实现方式不做限定。
在一些可能的实施例中,第三AI模型可以对下一时间点每个任务需要的处理资源、存储资源或网络资源中的至少一项进行预测,则输出的第二分配信息表示下一时间点每个任务需要的处理资源、存储资源或网络资源中的至少一项。或者,第三AI模型也可以对下一时间段每个任务需要的处理资源、存储资源或网络资源中的至少一项进行预测,则输出的第二分配信息表示下一时间段内多个时间点每个任务需要的处理资源、存储资源或网络资源中的至少一项,本实施例对采用哪种实现方式不做限定。
在一些可能的实施例中,第一存储设备可以完全复用来自第二存储设备的AI模型,也可以对来自第二存储设备的AI模型进行模型微调。完全复用AI模型是指第一存储设备不改变来自第二存储设备的AI模型的参数。对AI模型进行模型微调的过程可以包括:第一存储设备接收到IO请求后,可以基于IO请求,获取AI模型的预测结果,第一存储设备根据预测结果,对AI模型的参数进行调整。其中,IO请求可以包括对数据的访问请求以及对数据的写入请求。
在一些可能的实施例中,第一存储设备可以通过CPU,执行模型微调的过程。具体地,如果第一存储设备如图2所示,在控制器101的处理器1011中包括CPU而不包括AI芯片的情况下,参见图4,可以由CPU作为模型微调的执行主体,该CPU可以在内存中对AI模型进行微调,例如,CPU可以收集对AI模型微调所需的数据,比如接收到的IO请求等,将对AI模型微调所需的数据缓存在内存中,在微调过程中,每当CPU计算出模型参数时,CPU可以将模型参数缓存至内存中,如果对模型参数进行调整,则CPU对缓存在内存的模型参数进行更新。
在另一些可能的实施例中,第一存储设备可以通过AI芯片,执行上述模型微调的过程。具体地,如果第一存储设备安装了AI芯片,比如,如果第一存储设备如图2所示,在控制器101的处理器1011中包括AI芯片的情况下,参见图5和图6,可以由AI芯片作为模型微调的执行主体。
参见图5,AI芯片可以在内存中对AI模型进行模型微调。在一种可能的实现中,CPU可以收集对AI模型微调所需的数据,将对AI模型微调所需的数据发送至AI芯片,AI芯片根据微调AI模型所需的数据,计算出模型参数后,AI芯片可以将模型参数缓存至内存中,如果AI芯片对模型参数进行了调整,AI芯片可以对缓存在内存的模型参数进行更新。
参见图6,AI芯片可以在AI芯片内部对AI模型进行模型微调。在一种可能的实现中,CPU可以收集对AI模型进行微调所需的数据,将对AI模型进行微调所需的数据缓存在CPU对应的内存中,AI芯片可以从CPU对应的内存中读取对AI模型进行微调所需的数据,在AI芯片中进行模型微调,例如每当计算出模型参数后,AI芯片将模型参数缓存至AI芯片的内存中,如果AI芯片对模型参数进行了调整,AI芯片可以对缓存在AI芯片的内存的模型参数进行更新。
在一些可能的实施例中,第一存储设备可以基于每个LUN对应的IO请求,为每个LUN分别进行模型微调,从而更新每个LUN对应的AI模型。例如,如果第一存储设备包括LUN0、LUN1以及LUN2这3个LUN,第一存储设备可以基于对LUN0的IO请求,为LUN0的AI模型0进行模型微调,从而更新LUN0对应的AI模型0;基于对LUN1的IO请求,为LUN1的AI模型1进行模型微调,从而更新LUN1对应的AI模型1;基于对LUN2的IO请求,为LUN2的AI模型2进行模型微调,从而更新LUN2对应的AI模型2。
通过为每个LUN对应的AI模型分别进行模型微调,由于同一存储设备中不同LUN可以存储不同工作负载的数据,而不同工作负载的数据访问模式在一定概率上不同,使得对不同LUN的IO请求的规律在一定概率上不同,进而使得不同LUN对应的AI模型所适用的模型参数在一定概率上也不同。因此,通过分别基于每个LUN对应的IO请求,为每个LUN分别模型训练,可以保证每个LUN对应的AI模型的微调方式与对应的LUN更加匹配,因此可以提高微调后的AI模型的精确性。
在一些可能的实施例中,第一存储设备可以持久化存储微调后的AI模型,例如将微调后的AI模型写入硬盘空间,从而通过硬盘对AI模型持久化存储。当第一存储设备再次接收到IO请求时,第一存储设备可以读取已存储的微调后的AI模型,基于IO请求,获取微调后的AI模型的预测结果。
在一些可能的实施例中,如果第一存储设备通过CPU执行模型训练的过程,参见图4,可以由CPU将AI模型从内存持久化存储至硬盘中。如果第一存储设备通过AI芯片执行模型训练的过程,参见图5,可以由AI芯片将AI模型从AI芯片持久化存储至硬盘中。或者,参见图6,可以由AI芯片将AI模型从CPU对应的内存持久化存储至硬盘中。
第一存储设备可以在任意时机下持久化存储微调后的AI模型。示例性地,第一存储设备可以而不限于在下述情况一至情况三中的任一项下持久化存储微调后的AI模型。
情况一、定期存储。第一存储设备可以每隔预设时长,存储一次微调后的AI模型。该预设时长可以根据实验、经验或需求设置,本实施例对此不做限定。
情况二、内存不足时存储。具体地,第一存储设备可以判断内存是否小于内存阈值,如果内存小于内存阈值,则将内存中的微调后的AI模型写入硬盘空间。
情况三、掉电时存储。具体地,当第一存储设备掉电时,第一存储设备的备份电源可以提供电能,第一存储设备可以使用备份电源的电能,将内存中的微调后的AI模型写入硬盘空间。
步骤309、第一存储设备根据AI模型的预测结果,提供目标功能。
目标功能可以是能够通过AI模型的预测结果提供的任意功能。例如,目标功能可以而不限于缓存预取功能或智能调度功能。
例如,如果预测结果是目标IO请求,提供目标功能可以包括下述步骤一至步骤二:
步骤一、第一存储设备可以根据目标IO请求,读取指令或数据。例如,可以解析目标IO请求,得到目标IO请求携带的指令或数据的存储地址,根据该存储地址从主存储器或辅助存储器读取指令或数据。
步骤二、第一存储设备可以将该指令或数据写入该第一存储设备的缓存,从而提供缓存预取功能。
由于指令或数据在处理器使用之前,提前被写入至缓存中,使得处理器可以对缓存中的指令或数据进行读写,那么由于处理器对缓存的访问速度比对主存储器以及辅助存储器的访问速度更快,可以让处理器快速获取到数据,从而加快处理器处理数据的速度,提高处理器处理数据的效率。
例如,如果预测结果是工作负载信息,提供目标功能可以包括下述步骤一至步骤二:
步骤一、第一存储设备可以根据工作负载信息,查询工作负载与访问模式之间的对应关系,得到工作负载信息对应的访问模式。
其中,工作负载与访问模式之间的对应关系可以预存在第一存储设备中,工作负载与访问模式之间的对应关系用于指示每个工作负载对应的访问模式,例如,工作负载与访问模式之间的对应关系可以包括一个或多个工作负载的标识以及一种或多种访问模式的标识。作为示意,工作负载与访问模式之间的对应关系可以如下表2所示。
表2
工作负载 访问模式
工作负载1 顺序访问
工作负载2 随机访问
步骤二、第一存储设备根据访问模式,判断是否进行缓存预取。或者,第一存储设备根据访问模式,确定待预取的指令或数据。
例如,如果访问模式是顺序读,第一存储设备可以判定进行缓存预取,作为示例,第一存储设备可以从最近读取的扇区的下一个扇区读取数据,写入缓存。
例如,如果预测结果是第二分配信息,提供目标功能可以包括下述步骤一至步骤二:
步骤一、第一存储设备根据第二分配信息,为每个任务分配处理资源、存储资源或网络资源中的至少一项。
步骤二、第一存储设备通过每个任务对应的处理资源,处理每个任务;和/或,第一存储设备通过每个任务对应的存储资源,存储每个任务对应的数据;和/或,第一存储设备通过每个任务对应的网络资源,为每个任务进行网络通信。
在一些可能的实施例中,第一存储设备可以通过CPU来执行步骤308以及步骤309。在另一些可能的实施例中,第一存储设备也可以通过AI芯片来执行步骤308,AI芯片将预测结果发送至CPU,CPU从AI芯片接收预测结果,CPU执行步骤309。
需要说明的一点是,缓存预取、工作负载识别以及智能调度这三种功能仅是示例,在另一些可能的实施例中,也可以通过IO请求训练出AI模型,来实现除了缓存预取、工作负载识别以及智能调度之外的其他功能。例如,可以通过AI模型,来实现垃圾数据的智能清除功能。具体来讲,如果第二存储设备存储的数据包括应用A的数据、应用B的数据以及应用C的数据,其中应用B的数据被高频删除,当应用A的数据、应用B的数据以及应用C的数据从第二存储设备迁移至第一存储设备后,应用B的数据仍然需要被高频删除的概率很大。有鉴于此,可以由旧的存储设备,通过AI模型,学习出需要从存储的数据中删除哪些数据的规律,将AI模型和数据一起迁移至新的存储设备上。作为一种可能的实现方式,第二存储设备可以在历史运行中,基于对数据的删除请求,训练得到第四AI模型,第二存储设备可以向第一存储设备发送第四AI模型以及数据,第一存储设备可以存储数据以及第四AI模型,根据第四AI模型,确定待删除的数据,删除确定的数据。
相关技术中,在数据从原来的存储设备迁移到新的存储设备的场景下,AI模型不会随着数据的迁移而迁移,新的存储设备需要在运行过程中,重新收集大量的模型训练的数据,例如缓存大量的IO请求,并且,新的存储设备需要重新进行模型训练。由于重新进行模型训练的过程以及重新收集数据的过程会耗费巨大的处理资源,因此造成新的存储设备的性能产生下降,出现较大的爬坡时间。
而本实施例提供的方法,在数据从第二存储设备迁移至第一存储设备的场景下,通过将AI模型也从第二存储设备迁移至第一存储设备,第一存储设备可以复用第二存储设备已训练的AI模型,来得到AI模型的预测结果,从而免去了第一存储设备重新进行模型训练的流程,进而免去了第一存储设备重新训练AI模型带来的时间成本。由于第一存储设备得到AI模型的速度更快,根据AI模型来得到预测结果的速度也就更快,因此根据预测结果来提供缓存预取、负载识别、智能调度等功能的速度也就更快,从而极大地提高了进行缓存预取、负载识别以及智能调度的效率。
上述实施例描述了两个存储设备之间复用AI模型的流程,在本申请实施例中,同一存储设备中的不同LUN之间也可以复用AI模型,以下通过图7实施例进行描述。
图7是本申请实施例提供的一种访问请求的处理方法的流程图,如图7所示,该方法应用于第一存储设备。该方法可以包括下述步骤701至706:
步骤701、第一存储设备创建第二LUN。
第二LUN是指第一存储设备新建的LUN,第二LUN为空白的LUN,即,第二LUN中未存储数据。例如,参见图8至图10,第二LUN可以为LUN7。
步骤702、第一存储设备根据第一LUN对应的AI模型,获取第二LUN对应的AI模型。
本实施例中,同一存储设备中的各个LUN对应的AI模型的参数可以进行共享,当创建了第二LUN,第一存储设备可以复用第一LUN对应的AI模型,来得到第二LUN对应的AI模型,从而将已有的第一LUN对应的AI模型的参数分享给新建的第二LUN对应的AI模型。
在一些可能的实施例中,第一存储设备可以获取第一LUN对应的AI模型的参数,将第一LUN对应的AI模型的参数作为第二LUN对应的AI模型的初始化参数,创建第二LUN对应的AI模型。
在一些可能的实施例中,第一LUN的数量可以为一个或多个,步骤703可以包括而不限于下述实现方式一至实现方式二中的一项或多项的结合。
实现方式一、第一存储设备从一个或多个第一LUN对应的AI模型中,选择一个AI模型,作为第二LUN对应的AI模型。例如,可以从一个或多个第一LUN对应的AI模型中,随机选择一个AI模型,作为第二LUN对应的AI模型。示例性地,参见图8,创建LUN7后,可以从LUN1、LUN2至LUN6这6个LUN对应的6个AI模型中,随机选择一个AI模型,作为LUN7的AI模型。
实现方式二、第一存储设备对一个或多个第一LUN对应的AI模型进行加权平均,得到第二LUN对应的AI模型。具体地,可以对一个或多个第一LUN对应的AI模型的参数进行加权平均,将加权平均值作为第二LUN对应的AI模型的初始化参数,创建第二LUN对应的AI模型。其中,可以对每个第一LUN对应的AI模型中同一位置的模型参数进行加权平均。以对AI模型1与AI模型2进行加权平均为例,可以对AI模型1的第i层的卷积核的权重与AI模型2的第i层的卷积核的权重进行加权平均,作为AI模型3的第i层的卷积核的权重。其中i为正整数。
在一些可能的实施例中,实现方式二可以包括而不限于下述情况一至情况三中的一项或多项。
情况一、每个第一LUN的权重相同。具体地,可以获取一个或多个第一LUN对应的AI模型的平均值,作为第二LUN对应的AI模型。
情况二、每个第一LUN的权重与对应的应用标识在所有第一LUN对应的应用标识中所占的比例正相关。具体地,第一LUN对应的应用标识在所有第一LUN对应的应用标识中所占的比例越大,第一LUN的权重越大。例如,如果第一存储设备包括LUN1至LUN10这10个LUN,LUN1至LUN8这8个LUN均对应数据库1,LUN9至LUN10这2个LUN对应数据库2,则LUN1至LUN8对应的AI模型的权重可以高于LUN9至LUN10对应的AI模型的权重。
情况三、每个第一LUN的权重与对应的用户标识在所有第一LUN对应的用户标识中所占的比例正相关。具体地,第一LUN对应的用户标识在所有第一LUN对应的用户标识中所占的比例越大,第一LUN的权重越大。例如,如果第一存储设备包括LUN1至LUN10这10个LUN,LUN1至LUN8这8个LUN均对应用户1,LUN9至LUN10这2个LUN对应用户2,则LUN1至LUN8对应的AI模型的权重可以高于LUN9至LUN10对应的AI模型的权重。
在一些可能的实施例中,第一存储设备中可以有大量的LUN,如果对所有LUN对应的AI模型进行加权平均,可能会导致运算量较大。有鉴于此,第一存储设备可以从所有LUN中,选择N个AI模型,对选择的N个AI模型进行加权平均,作为第二LUN对应的AI模型。其中,选择的方式可以为随机选择。N为正整数,N的具体数值可以根据实验、经验或需求设置,本实施例对此不做限定。
在一些可能的实施例中,第一LUN对应的AI模型可以包括用于进行缓存预取的第一AI模型、用于识别工作负载的第二AI模型以及用于智能调度的第三AI模型中的一项或多项。相应地,步骤702可以包括以下(1)至(3)中的一项或多项:
(1)根据该第一LUN对应的第一AI模型,获取该第二LUN对应的第一AI模型。
(2)根据该第一LUN对应的第二AI模型,获取该第二LUN对应的第二AI模型。
(3)根据该第一LUN对应的第三AI模型,获取该第二LUN对应的第三AI模型。
需要说明的一点是,本实施例仅是以复用第一LUN对应的AI模型,来获取第二LUN对应的AI模型为例进行说明。在另一些可能的实施例中,第一存储设备也可以在历史运行过程中,创建第三LUN,基于对第三LUN的数据的历史IO请求,训练得到第三LUN对应的AI模型。如果创建了第二LUN,第一存储设备可以读取第三LUN对应的AI模型,根据该第三LUN对应的AI模型,获取该第二LUN对应的AI模型。
其中,第三LUN是指第一存储设备在创建第二LUN之前已创建的LUN。作为示例,第一存储设备可以创建第1个LUN后,基于对第1个LUN的IO请求进行模型训练,得到第1个LUN对应的AI模型。当第一存储设备创建第2个LUN时,可以根据第1个LUN对应的AI模型,获取第2个LUN对应的AI模型;第一存储设备在创建第3个LUN时,可以根据第1个LUN对应的AI模型以及第2个LUN对应的AI模型,获取第3个LUN对应的AI模型。
例如,参见图8至图10,如果第一存储设备已经创建了LUN1、LUN2、LUN3至LUN6,第一存储设备创建了LUN7时,可以根据LUN1、LUN2、LUN3至LUN6中的一项或多项对应的AI模型,获取LUN7对应的AI模型。在此例中,第二LUN即为LUN7,第三LUN可以包括LUN1、LUN2、LUN3至LUN6中的一项或多项。
在一种可能的实现中,第一存储设备可以预先分配共享存储空间,共享存储空间用于存储每个LUN对应的AI模型,在第一存储设备运行过程中,每当第一存储设备创建一个LUN,得到该LUN对应的AI模型后,可以将该AI模型写入共享存储空间。当第一存储设备创建第二LUN时,第一存储设备可以从共享存储空间,读取第一LUN对应的AI模型或者第三LUN对应的AI模型。共享存储空间可以为第一存储设备的硬盘空间。例如,参见图8,第一存储设备在创建LUN7时,硬盘空间中保存了LUN1的AI模型、LUN2的AI模型至LUN6的AI模型。
需要说明的一点是,将每个LUN对应的AI模型均写入共享存储空间仅是示例性实现方式。在另一些可能的实施例中,第一存储设备可以为每个LUN分配对应的存储空间,建立LUN与存储空间之间的对应关系,在每个LUN对应的存储空间,存储每个LUN对应的AI模型。
步骤703、第一存储设备持久化存储第二LUN对应的AI模型。
在一些可能的实施例中,第一存储设备可以分配硬盘空间,将第二LUN对应的AI模型写入硬盘空间,从而通过硬盘对AI模型持久化存储。其中,如果第一存储设备在共享存储空间存储每个LUN对应的AI模型,第一存储设备可以将第二LUN对应的AI模型写入共享存储空间。如果第一存储设备在每个LUN对应的存储空间存储每个LUN对应的AI模型,第一存储设备可以为第二LUN分配存储空间,在分配的存储空间存储第二LUN对应的AI模型,建立分配的存储空间与第二LUN之间的对应关系。
步骤704、第一存储设备接收对第二LUN的IO请求。
步骤705、第一存储设备根据IO请求,获取第二LUN对应的AI模型的预测结果。
对第二LUN的IO请求可以包括访问请求以及写入请求中的一项或多项,访问请求用于请求访问属于第二LUN的数据,写入请求用于请求向第二LUN写入数据。示例性的,应用在缓存预取的场景,第一存储设备将该IO请求输入该第二LUN对应的第一AI模型,输出目标访问请求,该目标访问请求表示该第一存储设备的处理器将要使用的指令或数据;应用在工作负载识别的场景,第一存储设备可以对当前时间段的该IO请求进行统计,得到访问特征;第一存储设备可以将该访问特征输入该第二LUN对应的第二AI模型,输出工作负载信息,该工作负载信息表示发送该访问请求的工作负载;应用在智能调度的场景,第一存储设备可以将该访问请求以及第一分配信息输入第二LUN对应的第三AI模型,输出第二分配信息,该第一分配信息表示当前为每个任务分配的处理资源、存储资源或网络资源中的至少一项。
其中,如果第一存储设备将第二LUN对应的AI模型写入共享存储空间,第一存储设备可以从共享存储空间中读取第二LUN对应的AI模型。如果第一存储设备将第二LUN对应的AI模型写入为第二LUN单独分配的存储空间,第一存储设备可以根据第二LUN与AI模型之间的对应关系,确定为第二LUN分配的存储空间,从该存储空间读取第二LUN对应的AI模型。
步骤706、第一存储设备根据AI模型的预测结果,提供目标功能。
步骤706与步骤309同理,在此不做赘述。
在一些可能的实施例中,第二LUN可以完全复用第一LUN对应的AI模型。完全复用AI模型是指不改变第一LUN对应的AI模型的参数,直接将第一LUN对应的AI模型作为第二LUN对应的AI模型。在另一些可能的实施例中,也可以对第一LUN对应的AI模型进行模型微调,将微调后的AI模型作为第二LUN对应的AI模型。对AI模型进行模型微调的过程可以包括:第一存储设备可以根据对第二LUN的IO请求,获取第一LUN对应的AI模型的预测结果,第一存储设备根据预测结果以及参考结果,对第一LUN对应的AI模型的参数进行调整。
在一些可能的实施例中,第一存储设备可以通过CPU,执行上述过程。具体地,如果第一存储设备未安装AI芯片,比如,如果第一存储设备如图2所示,在控制器101的处理器1011中包括CPU而不包括AI芯片的情况下,CPU可以是对第一LUN对应的AI模型进行模型训练的执行主体、对第一LUN对应的AI模型进行复用的执行主体以及对第二LUN对应的AI模型进行模型微调的执行主体,例如,参见图8,CPU可以分别收集训练LUN1至LUN6的AI模型所需的数据,例如对LUN1的IO请求、对LUN2的IO请求至对LUN6的IO请求,在内存中,训练LUN1至LUN6的AI模型,将LUN1至LUN6的AI模型持久化存储至硬盘空间,当CPU创建LUN7后,CPU可以将LUN1至LUN6的AI模型从硬盘空间载入至内存中,在内存中,复用LUN1至LUN6的AI模型,来得到LUN7的AI模型,对LUN7的AI模型进行微调。其中,CPU可以收集对LUN7的AI模型微调所需的数据,例如接收到对LUN7的IO请求,CPU可以将对LUN7的IO请求缓存在内存中,CPU可以基于IO请求以及LUN7的AI模型,获取推理结果以及参考结果,根据推理结果以及参考结果来计算出模型参数,将内存中LUN7的AI模型的参数更新为计算出的模型参数。
在另一些可能的实施例中,第一存储设备可以通过AI芯片,执行上述过程。具体地,如果第一存储设备安装了AI芯片,比如,如果第一存储设备如图2所示,在控制器101的处理器1011中包括AI芯片的情况下,AI芯片可以是对第一LUN对应的AI模型进行模型训练的执行主体、对第一LUN对应的AI模型进行复用的执行主体以及对第二LUN对应的AI模型进行模型微调的执行主体。而使用第二LUN对应的AI模型进行预测的执行主体可以是AI芯片,也可以是CPU。
参见图9,AI芯片可以在内存中进行模型训练以及模型微调。具体地,CPU可以分别收集训练LUN1至LUN6的AI模型所需的数据,例如对LUN1的IO请求、对LUN2的IO请求至对LUN6的IO请求,将训练LUN1至LUN6的AI模型所需的数据缓存在内存中,AI芯片可以从内存中读取训练LUN1至LUN6的AI模型所需的数据,训练LUN1至LUN6的AI模型,将LUN1至LUN6的AI模型持久化存储至硬盘空间,另外,AI芯片可以将训练好的AI模型发送至内存,以便CPU从内存中读取AI模型,从而使用AI模型进行预测。当CPU创建LUN7后,CPU可以将LUN1至LUN6的AI模型从硬盘空间载入至内存,AI芯片可以从内存中读取LUN1至LUN6的AI模型,复用LUN1至LUN6的AI模型,来得到LUN7的AI模型。另外,AI芯片可以对LUN7的AI模型进行微调,具体地,CPU可以收集对LUN7的AI模型微调所需的数据,例如接收到对LUN7的IO请求,CPU可以将对LUN7的IO请求缓存在内存中,AI芯片可以从内存中读取对LUN7的IO请求,AI芯片可以基于IO请求以及LUN7的AI模型,获取推理结果以及参考结果,根据推理结果以及参考结果来计算出模型参数,将内存中LUN7的AI模型的参数更新为计算出的模型参数。
参见图10,AI芯片可以在AI芯片内部进行模型训练以及模型微调。具体地,与图9相区别的是,当CPU创建LUN7后,CPU可以将LUN1至LUN6的AI模型从硬盘空间直接载入至AI芯片的内存,AI芯片可以从AI芯片的内存中读取LUN1至LUN6的AI模型,复用LUN1至LUN6的AI模型,来得到LUN7的AI模型。在模型微调的过程中,AI芯片计算出LU7的AI模型的微调后的模型参数后,可以将AI芯片的内存中的LUN7的AI模型的参数更新为计算出的模型参数。
其中,如果第一存储设备对AI模型进行了模型微调,第一存储设备可以持久化存储微调后的第二LUN对应的AI模型。其中,可以由CPU或AI芯片对第二LUN的微调后的AI模型持久化存储。例如,参见图8,CPU可以将LUN7的AI模型从内存持久化存储至硬盘空间,参见图9和图10,AI芯片可以将LUN7的AI模型,从内存或AI芯片持久化存储至硬盘空间。此外,第一存储设备可以在任意时机下持久化存储微调后的AI模型。示例性地,第一存储设备可以而不限于在下述情况一至情况三中的任一项下持久化存储微调后的AI模型。
情况一、定期存储。第一存储设备可以每隔预设时长,存储一次第二LUN的微调后的AI模型。该预设时长可以根据实验、经验或需求设置,本实施例对此不做限定。
情况二、内存不足时存储。具体地,第一存储设备可以判断内存是否小于内存阈值,如果内存小于内存阈值,则将内存中第二LUN的微调后的AI模型写入硬盘空间。
情况三、掉电时存储。具体地,当第一存储设备掉电时,第一存储设备的备份电源可以提供电能,第一存储设备可以使用备份电源的电能,将内存中的微调后的AI模型写入硬盘空间。
在一些可能的实施例中,第一存储设备持久化存储AI模型后,第一存储设备可以在上电时从硬盘空间中读取第二LUN对应的AI模型,加载至内存中。另外,第一存储设备也可以在任意需要使用AI模型的情况下,比如要提供缓存预取、工作负载识别、智能调度等功能时,从硬盘空间中读取第二LUN对应的AI模型,加载至内存中,以便调用AI模型。
相关技术中,每当存储设备新创建一个LUN,存储设备需要在运行过程中,为新建的LUN收集大量的模型训练的数据,例如缓存大量针对新建的LUN的IO请求,并且,存储设备需要为新建的LUN进行模型训练。由于进行模型训练的过程以及收集数据的过程会耗费巨大的处理资源,因此造成第一存储设备的性能产生下降,出现较大的爬坡时间,并且影响了利用AI模型为新建的LUN提供缓存预取、负载识别、智能调度等功能的效率。
本实施例提供的方法,在新建LUN的场景下,可以复用已有的LUN对应的AI模型,来得到新建的LUN对应的AI模型,从而免去了为新建的LUN进行模型训练的流程,进而免去了为新建的LUN进行模型训练带来的时间成本。由于得到新建的LUN对应的AI模型的速度更快,根据AI模型得到预测结果的速度也就更快,因此根据预测结果来为新建的LUN提供缓存预取、负载识别、智能调度等功能的速度也就更快,从而极大地提高了为新建的LUN进行缓存预取、负载识别以及智能调度的效率。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
以上介绍了本申请实施例的访问请求的处理方法,以下介绍本申请实施例的访问请求的处理装置,应理解,该访问请求的处理装置其具有上述方法中第一存储设备的任意功能。
图11是本申请实施例提供的一种访问请求的处理装置的结构示意图,如图11所示,该装置包括:接收模块1101,用于执行步骤305;存储模块1102,用于执行步骤306;该接收模块1101,还用于执行步骤307;获取模块1103,用于执行步骤308。
可选地,该数据属于该第二存储设备的第一逻辑存储单元LUN,该AI模型为该第一LUN对应的AI模型。
可选地,该装置还包括:创建模块,用于创建第二LUN;该获取模块1103,还用于根据该第一LUN对应的AI模型,获取该第二LUN对应的AI模型。
可选地,该获取模块1103,用于执行下述任意一项:从一个或多个该第一LUN对应的AI模型中,选择一个AI模型,作为该第二LUN对应的AI模型;对一个或多个该第一LUN对应的AI模型进行加权平均,得到该第二LUN对应的AI模型。
可选地,每个第一LUN的权重相同;或者,每个第一LUN的权重与对应的应用标识在所有第一LUN对应的应用标识中所占的比例正相关,或者,每个第一LUN的权重与对应的用户标识在所有第一LUN对应的用户标识中所占的比例正相关。
可选地,该AI模型包括第一AI模型,该获取模块1103,用于将该访问请求输入该第一AI模型,输出目标访问请求,该目标访问请求表示该第一存储设备的处理器将要使用的指令或数据;该存储模块1102,还用于将该指令或数据写入该第一存储设备的缓存。
可选地,该AI模型包括第二AI模型,该获取模块1103,包括:统计子模块,用于对当前时间段的该访问请求进行统计,得到访问特征;输入输出子模块,用于将该访问特征输入该第二AI模型,输出工作负载信息,该工作负载信息表示发送该访问请求的工作负载。
可选地,该AI模型包括第三AI模型,该获取模块1103,用于将该访问请求以及第一分配信息输入该第三AI模型,输出第二分配信息,该第一分配信息表示当前为每个任务分配的处理资源、存储资源或网络资源中的至少一项;该装置还包括:分配模块,用于根据该第二分配信息,为该每个任务分配处理资源、存储资源或网络资源中的至少一项。
需要说明的一点是,图11实施例提供的访问请求的处理装置在处理访问请求时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将访问请求的处理装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的访问请求的处理装置与访问请求的处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
以上介绍了本申请实施例的访问请求的处理装置,以下介绍访问请求的处理装置可能的产品形态。
作为一种可能的产品形态,上述访问请求的处理装置,可以由芯片来实现,该芯片可以为通用处理器。
示例性地,该芯片可以包括处理电路和与该处理电路内部连接通信的输入接口以及存储介质;该处理电路用于执行步骤308;该输入接口用于执行步骤305以及步骤307。该存储介质用于执行步骤306。可选地,该存储介质还用于存储处理电路执行的指令。
作为一种可能的产品形态,本申请实施例该的访问请求的处理装置,还可以使用下述来实现:一个或多个FPGA、PLD、复杂可编程逻辑器件(英文:Complex ProgrammableLogic Device,简称:CPLD)、控制器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、状态机、门逻辑、分立硬件部件、晶体管逻辑器件、网络处理器(NetworkProcessor,NP)、任何其它适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。
应理解,但凡具备上述方法实施例中第一存储设备的功能的任何形态的产品都落入本申请的保护范围。还应理解,以上介绍仅为举例,不限制本申请实施例的访问请求的处理装置的产品形态仅限于此。
本领域普通技术人员可以意识到,结合本文中所公开的实施例中描述的各方法步骤和模块,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参见前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或模块的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (18)

1.一种访问请求的处理方法,其特征在于,应用于第一存储设备,所述方法包括:
接收来自第二存储设备的数据以及人工智能AI模型,所述AI模型由所述第二存储设备在历史运行过程中,基于对所述数据的历史输入输出IO请求训练得到;
存储所述数据以及所述AI模型;
接收对所述数据的访问请求;
根据所述访问请求,获取所述AI模型的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述数据属于所述第二存储设备的第一逻辑存储单元LUN,所述AI模型为所述第一LUN对应的AI模型。
3.根据权利要求2所述的方法,其特征在于,所述接收来自第二存储设备的数据以及人工智能AI模型之后,所述方法还包括:
创建第二LUN;
根据所述第一LUN对应的AI模型,获取所述第二LUN对应的AI模型。
4.根据权利要求3所述的方法,其特征在于,所述第一LUN的数量为一个或多个,所述根据所述第一LUN对应的AI模型,获取所述第二LUN对应的AI模型,包括下述任意一项:
从一个或多个所述第一LUN对应的AI模型中,选择一个AI模型,作为所述第二LUN对应的AI模型;
对一个或多个所述第一LUN对应的AI模型进行加权平均,得到所述第二LUN对应的AI模型。
5.根据权利要求4所述的方法,其特征在于,
每个第一LUN的权重相同;或者,
每个第一LUN的权重与对应的应用标识在所有第一LUN对应的应用标识中所占的比例正相关,或者,
每个第一LUN的权重与对应的用户标识在所有第一LUN对应的用户标识中所占的比例正相关。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述AI模型包括第一AI模型,所述根据所述访问请求,获取所述AI模型的预测结果,包括:
将所述访问请求输入所述第一AI模型,输出目标访问请求,所述目标访问请求表示所述第一存储设备的处理器将要使用的指令或数据;
所述根据所述访问请求,获取所述AI模型的预测结果之后,所述方法还包括:
将所述指令或数据写入所述第一存储设备的缓存。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述AI模型包括第二AI模型,所述根据所述访问请求,获取所述AI模型的预测结果,包括:
对当前时间段的所述访问请求进行统计,得到访问特征;
将所述访问特征输入所述第二AI模型,输出工作负载信息,所述工作负载信息表示发送所述访问请求的工作负载。
8.根据权利要求1至5中任一项所述的方法,其特征在于,所述AI模型包括第三AI模型,所述根据所述访问请求,获取所述AI模型的预测结果,包括:
将所述访问请求以及第一分配信息输入所述第三AI模型,输出第二分配信息,所述第一分配信息表示当前为每个任务分配的处理资源、存储资源或网络资源中的至少一项;
所述根据所述访问请求,获取所述AI模型的预测结果之后,所述方法还包括:
根据所述第二分配信息,为所述每个任务分配处理资源、存储资源或网络资源中的至少一项。
9.一种访问请求的处理装置,其特征在于,应用于第一存储设备,所述装置包括:
接收模块,用于接收来自第二存储设备的数据以及人工智能AI模型,所述AI模型由所述第二存储设备在历史运行过程中,基于对所述数据的历史输入输出IO请求训练得到;
存储模块,用于存储所述数据以及所述AI模型;
所述接收模块,还用于接收对所述数据的访问请求;
获取模块,用于根据所述访问请求,获取所述AI模型的预测结果。
10.根据权利要求9所述的装置,其特征在于,所述数据属于所述第二存储设备的第一逻辑存储单元LUN,所述AI模型为所述第一LUN对应的AI模型。
11.根据权利要求10所述的装置,其特征在于,
所述装置还包括:创建模块,用于创建第二LUN;
所述获取模块,还用于根据所述第一LUN对应的AI模型,获取所述第二LUN对应的AI模型。
12.根据权利要求11所述的装置,其特征在于,所述第一LUN的数量为一个或多个,所述获取模块,用于执行下述任意一项:
从一个或多个所述第一LUN对应的AI模型中,选择一个AI模型,作为所述第二LUN对应的AI模型;
对一个或多个所述第一LUN对应的AI模型进行加权平均,得到所述第二LUN对应的AI模型。
13.根据权利要求12所述的装置,其特征在于,
每个第一LUN的权重相同;或者,
每个第一LUN的权重与对应的应用标识在所有第一LUN对应的应用标识中所占的比例正相关,或者,
每个第一LUN的权重与对应的用户标识在所有第一LUN对应的用户标识中所占的比例正相关。
14.根据权利要求9至13中任一项所述的装置,其特征在于,所述AI模型包括第一AI模型,所述获取模块,用于将所述访问请求输入所述第一AI模型,输出目标访问请求,所述目标访问请求表示所述第一存储设备的处理器将要使用的指令或数据;
所述存储模块,还用于将所述指令或数据写入所述第一存储设备的缓存。
15.根据权利要求9至13中任一项所述的装置,其特征在于,所述AI模型包括第二AI模型,所述获取模块,包括:
统计子模块,用于对当前时间段的所述访问请求进行统计,得到访问特征;
输入输出子模块,用于将所述访问特征输入所述第二AI模型,输出工作负载信息,所述工作负载信息表示发送所述访问请求的工作负载。
16.根据权利要求9至13中任一项所述的装置,其特征在于,所述AI模型包括第三AI模型,所述获取模块,用于将所述访问请求以及第一分配信息输入所述第三AI模型,输出第二分配信息,所述第一分配信息表示当前为每个任务分配的处理资源、存储资源或网络资源中的至少一项;
所述装置还包括:分配模块,用于根据所述第二分配信息,为所述每个任务分配处理资源、存储资源或网络资源中的至少一项。
17.一种第一存储设备,其特征在于,所述第一存储设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述指令由所述一个或多个处理器执行以实现如权利要求1至权利要求8任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器执行以实现如权利要求1至权利要求8任一项所述的方法。
CN201910713053.0A 2019-08-02 2019-08-02 访问请求的处理方法、装置、设备及存储介质 Active CN112306925B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201910713053.0A CN112306925B (zh) 2019-08-02 2019-08-02 访问请求的处理方法、装置、设备及存储介质
PCT/CN2020/088822 WO2021022852A1 (zh) 2019-08-02 2020-05-06 访问请求的处理方法、装置、设备及存储介质
MX2022001176A MX2022001176A (es) 2019-08-02 2020-05-06 Metodo y aparato de procesamiento de solicitud de acceso, dispositivo y medio de almacenamiento.
EP20850639.4A EP3995971A4 (en) 2019-08-02 2020-05-06 ACCESS REQUEST PROCESSING METHOD, APPARATUS, DEVICE AND STORAGE MEDIA
US17/590,167 US20220155970A1 (en) 2019-08-02 2022-02-01 Access request processing method and apparatus, device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910713053.0A CN112306925B (zh) 2019-08-02 2019-08-02 访问请求的处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112306925A true CN112306925A (zh) 2021-02-02
CN112306925B CN112306925B (zh) 2023-02-10

Family

ID=74486576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910713053.0A Active CN112306925B (zh) 2019-08-02 2019-08-02 访问请求的处理方法、装置、设备及存储介质

Country Status (5)

Country Link
US (1) US20220155970A1 (zh)
EP (1) EP3995971A4 (zh)
CN (1) CN112306925B (zh)
MX (1) MX2022001176A (zh)
WO (1) WO2021022852A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114546279A (zh) * 2022-02-24 2022-05-27 重庆紫光华山智安科技有限公司 Io请求预测方法、装置、存储节点及可读存储介质
WO2023198167A1 (zh) * 2022-04-15 2023-10-19 维沃移动通信有限公司 模型微调的方法、装置及设备

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111176565B (zh) * 2019-12-25 2024-04-19 三星(中国)半导体有限公司 确定应用的存储负载的方法和设备
CN116185307B (zh) * 2023-04-24 2023-07-04 之江实验室 一种模型数据的存储方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108718296A (zh) * 2018-04-27 2018-10-30 广州西麦科技股份有限公司 基于sdn网络的网络管控方法、装置与计算机可读存储介质
CN108875057A (zh) * 2018-06-29 2018-11-23 北京百度网讯科技有限公司 用于确定数据主题的方法、装置、设备和计算机可读介质
CN109564505A (zh) * 2016-01-27 2019-04-02 伯尼塞艾公司 被配置为使用教学编程语言进行工作以训练经训练的人工智能模型的人工智能引擎
US20190121566A1 (en) * 2017-10-19 2019-04-25 Pure Storage, Inc. Data transformation offloading in an artificial intelligence infrastructure

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10438112B2 (en) * 2015-05-26 2019-10-08 Samsung Electronics Co., Ltd. Method and apparatus of learning neural network via hierarchical ensemble learning
CN107844259B (zh) * 2016-09-18 2020-06-16 华为技术有限公司 数据访问方法、路由装置和存储系统
US11461635B2 (en) * 2017-10-09 2022-10-04 Nec Corporation Neural network transfer learning for quality of transmission prediction
US11269822B2 (en) * 2017-10-09 2022-03-08 Sap Se Generation of automated data migration model
CN110018970B (zh) * 2018-01-08 2023-07-21 腾讯科技(深圳)有限公司 缓存预取方法、装置、设备及计算机可读存储介质
CN108667850B (zh) * 2018-05-21 2020-10-27 浪潮集团有限公司 一种人工智能服务系统及其实现人工智能服务的方法
CN109581928A (zh) * 2018-12-07 2019-04-05 电子科技大学 一种面向高速公路场景的智能车端到端决策方法及系统
US20200192572A1 (en) * 2018-12-14 2020-06-18 Commvault Systems, Inc. Disk usage growth prediction system
US11663061B2 (en) * 2019-01-31 2023-05-30 H2O.Ai Inc. Anomalous behavior detection
CN109918752B (zh) * 2019-02-26 2022-12-16 华南理工大学 基于迁移卷积神经网络的机械故障诊断方法、设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109564505A (zh) * 2016-01-27 2019-04-02 伯尼塞艾公司 被配置为使用教学编程语言进行工作以训练经训练的人工智能模型的人工智能引擎
US20190121566A1 (en) * 2017-10-19 2019-04-25 Pure Storage, Inc. Data transformation offloading in an artificial intelligence infrastructure
CN108718296A (zh) * 2018-04-27 2018-10-30 广州西麦科技股份有限公司 基于sdn网络的网络管控方法、装置与计算机可读存储介质
CN108875057A (zh) * 2018-06-29 2018-11-23 北京百度网讯科技有限公司 用于确定数据主题的方法、装置、设备和计算机可读介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114546279A (zh) * 2022-02-24 2022-05-27 重庆紫光华山智安科技有限公司 Io请求预测方法、装置、存储节点及可读存储介质
CN114546279B (zh) * 2022-02-24 2023-11-14 重庆紫光华山智安科技有限公司 Io请求预测方法、装置、存储节点及可读存储介质
WO2023198167A1 (zh) * 2022-04-15 2023-10-19 维沃移动通信有限公司 模型微调的方法、装置及设备

Also Published As

Publication number Publication date
EP3995971A1 (en) 2022-05-11
US20220155970A1 (en) 2022-05-19
MX2022001176A (es) 2022-02-22
WO2021022852A1 (zh) 2021-02-11
EP3995971A4 (en) 2022-08-17
CN112306925B (zh) 2023-02-10

Similar Documents

Publication Publication Date Title
CN112306925B (zh) 访问请求的处理方法、装置、设备及存储介质
US11221886B2 (en) Optimizing dynamical resource allocations for cache-friendly workloads in disaggregated data centers
US11330042B2 (en) Optimizing dynamic resource allocations for storage-dependent workloads in disaggregated data centers
EP3640799B1 (en) Determining an allocation of computing resources for a job
US10601903B2 (en) Optimizing dynamical resource allocations based on locality of resources in disaggregated data centers
JP7462028B2 (ja) 分散ストレージシステム及びデータ処理方法
US10977085B2 (en) Optimizing dynamical resource allocations in disaggregated data centers
US10936374B2 (en) Optimizing dynamic resource allocations for memory-dependent workloads in disaggregated data centers
KR20170057826A (ko) 멀티-레벨 키-벨류 저장을 위한 시스템 및 그것의 동작 방법
US10893096B2 (en) Optimizing dynamical resource allocations using a data heat map in disaggregated data centers
KR20170085944A (ko) 멀티-레벨 키-벨류 저장을 위한 로직 및 그것의 동작 방법
US11409453B2 (en) Storage capacity forecasting for storage systems in an active tier of a storage environment
US20240036756A1 (en) Systems, methods, and devices for partition management of storage resources
US12067280B2 (en) Systems and methods of forecasting temperatures of storage objects using machine learning
US11836365B2 (en) Automatically adjusting storage system configurations in a storage-as-a-service environment using machine learning techniques
CN117235088B (zh) 一种存储系统的缓存更新方法、装置、设备、介质及平台
US11262917B2 (en) Storage system and SSD swapping method of storage system
US10841367B2 (en) Optimizing dynamical resource allocations for cache-dependent workloads in disaggregated data centers
US11416152B2 (en) Information processing device, information processing method, computer-readable storage medium, and information processing system
US11586964B2 (en) Device component management using deep learning techniques
CN117242459A (zh) 通过适配于计算设备来部署可并行化的深度学习模型
CN118502679B (zh) 存储器的数据访问调度方法及装置
US20240086369A1 (en) Automatic file system capacity management using file system utilization prediction
Jia Understanding and Optimizing Flash-Based Key-Value Systems in Data Centers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant