CN114205416B - 资源缓存方法、装置、电子设备和计算机可读介质 - Google Patents

资源缓存方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN114205416B
CN114205416B CN202111258634.3A CN202111258634A CN114205416B CN 114205416 B CN114205416 B CN 114205416B CN 202111258634 A CN202111258634 A CN 202111258634A CN 114205416 B CN114205416 B CN 114205416B
Authority
CN
China
Prior art keywords
cache
target resource
read
copies
cache device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111258634.3A
Other languages
English (en)
Other versions
CN114205416A (zh
Inventor
李天祥
王少辉
熊劲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kuangshi Technology Co Ltd
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Kuangshi Technology Co Ltd
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuangshi Technology Co Ltd, Beijing Megvii Technology Co Ltd filed Critical Beijing Kuangshi Technology Co Ltd
Priority to CN202111258634.3A priority Critical patent/CN114205416B/zh
Publication of CN114205416A publication Critical patent/CN114205416A/zh
Application granted granted Critical
Publication of CN114205416B publication Critical patent/CN114205416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本申请实施例公开了资源缓存方法、装置、电子设备和计算机可读介质。该方法的实施例包括:获取用户对目标资源的需求带宽;基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量;为目标资源创建副本数量的副本,并将所创建的副本缓存至缓存设备集群。该实施方式避免了部分资源的副本过量,节约了缓存设备集群的缓存空间。

Description

资源缓存方法、装置、电子设备和计算机可读介质
技术领域
本申请实施例涉及计算机技术领域,具体涉及资源缓存方法、装置、电子设备和计算机可读介质。
背景技术
在分布式缓存设备集群中,通常可对资源的多个副本进行缓存,以满足数据供给性能。
现有技术中,在缓存设备中的某一资源的访问流量大于阈值时,通常会在其他缓存设备中创建该资源的副本,以满足访问需求。这种方式易使热门资源的副本过量,且易使副本在其所在缓存设备中占据全部读带宽,导致缓存设备集群的缓存空间浪费。
发明内容
本申请实施例提出了资源缓存方法、装置、电子设备和计算机可读介质,以解决现有技术中缓存设备集群的缓存空间浪费的技术问题。
第一方面,本申请实施例提供了一种资源缓存方法,该方法包括:获取用户对目标资源的需求带宽;基于缓存设备集群中的缓存设备的参数、所述目标资源的数据量以及所述需求带宽,确定所述目标资源的副本数量;为所述目标资源创建所述副本数量的副本,并将所创建的副本缓存至所述缓存设备集群。
第二方面,本申请实施例提供了一种资源缓存装置,该装置包括:获取单元,被配置成获取用户对目标资源的需求带宽;确定单元,被配置成基于缓存设备集群中的缓存设备的参数、所述目标资源的数据量以及所述需求带宽,确定所述目标资源的副本数量;缓存单元,被配置成为所述目标资源创建所述副本数量的副本,并将所创建的副本缓存至所述缓存设备集群。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所描述的方法。
本申请实施例提供的资源缓存方法、装置、电子设备和计算机可读介质,通过获取用户对目标资源的需求带宽,而后基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量,最后为目标资源创建副本数量的副本,从而将所创建的副本缓存至缓存设备集群,由于能够基于设备参数、用户需求、资源的数据量多方面因素确定出合适的副本数量,相较于现有技术中被动创建副本的方式,有效控制了副本数量,避免了部分资源的副本过量。此外,直接创建合适数量的副本,相较于当访问流量大于阈值时再创建副本的方式,可降低副本在其所在缓存设备中的读带宽,避免了副本占据其所在缓存设备的全部读带宽的情况。由此,节约了缓存设备集群的缓存空间。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的资源缓存方法的一个实施例的流程图;
图3是根据本申请的资源缓存方法的又一个实施例的流程图;
图4是根据本申请的资源缓存装置的一个实施例的结构示意图;
图5是用于实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的资源缓存方法或资源缓存装置的示例性系统架构100。
如图1所示,系统架构100可以包括对象存储设备集群101、缓存设备集群102和计算设备集群103。
对象存储设备集群101可提供对象存储服务。对象存储设备集群101中可以包含若干对象存储设备。对象存储设备可用于进行对象存储(Object Storage Service,对象存储),如服务器等电子设备。对象存储设备集群中所存储的每一个对象为一个资源,资源可写入在缓存设备集群102,以通过缓存设备集群102中的缓存设备进行缓存,从而由计算设备集群103中的计算设备从缓存设备中读取。
缓存设备集群102可提供资源缓存服务。缓存设备集群102中可以包括若干缓存设备。缓存设备可以是SSD(Solid State Disk或Solid State Drive,固态硬盘)等具有缓存功能的设备。缓存设备可加载计算设备集群103中的资源以创建其副本,从而对副本进行缓存。缓存设备集群102还可以提供集中控制服务,用以获取资源的需求带宽、执行副本数量的计算逻辑以及分配逻辑等。需要说明的是,缓存设备集群中的缓存设备与对象存储设备集群中的存储设备可部署在相同或不同物理设备中。
计算设备集群103中可以包含若干计算设备,计算设备可作为客户端,从缓存设备集群102中读取数据。计算设备可以是服务器、台式计算机、膝上型便携计算机、智能手机、平板电脑等各种电子设备。
在一些场景中,对象存储设备集群101中所存储是资源可以包括数据集。数据集可用于机器学习模型的训练。数据集可作为不可拆分的资源放置单元,由缓存设备集群102进行缓存。计算设备集群103可读取缓存设备集群102中所缓存的数据集,并使用所读取的数据集进行模型训练。
应该理解,图1中的集群以及其中的设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的集群及设备。
请参考图2,其示出了根据本申请的资源缓存方法的一个实施例的流程200。该资源缓存方法,包括以下步骤:
步骤201,获取用户对目标资源的需求带宽。
在本实施例中,资源缓存方法的执行主体(例如图1所示的缓存设备集群102中提供集中控制服务的设备,或者独立的控制设备等)可以获取用户对目标资源的需求带宽。其中,目标资源可以是存储设备(如图1所示的对象存储设备集群101中的对象存储设备)所存储的任一资源。用户对目标资源的需求带宽可以是需要读取该目标资源的各计算设备对该目标资源的读带宽之和。例如,用户A所使用的计算设备对读取目标资源所需的带宽为100MB/s,用户B所使用的计算设备对读取目标资源所需的带宽为200MB/s,用户C所使用的计算设备对读取目标资源所需的带宽为200MB/s,则用户对此目标资源的需求带宽即为600MB/s。
以模型训练场景为例,目标资源可以包括用于训练模型的数据集,或者用于训练模型的数据集组。其中,数据集组中的数据集可具有相近的属性,如均为用于训练目标检测模型的图像集。在获取用户对目标资源的需求带宽时,可以首先基于采用目标资源训练模型的各用户所选用的批尺寸参数(即batch size)和训练时长,确定各用户对目标资源的局部需求带宽。例如,对于采用目标资源训练模型的每个用户,该用户所选取的批尺寸参数与训练时长的比值,可作为该用户对目标资源的局部需求带宽。之后,可以将所确定的局部需求带宽求和,得到用户对目标资源的需求带宽。
步骤202,基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量。
在本实施例中,上述执行主体可以基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及步骤201所确定出的需求带宽,确定目标资源的副本数量。此处,可采用多种方式进行副本数量的确定。
作为示例,可以预先训练一个副本数量预测模型。将缓存设备的参数、目标资源的数据量以及目标资源的需求带宽输入至该模型,得到副本数量。训练副本数量预测模型的样本集可从历史缓存记录中确定。样本集中的每个样本中可以包括历史缓存设备的参数、历史资源的数据量以及历史资源的需求带宽。每个样本可以标记有副本数量。训练副本数量预测模型所采用的基础模型可以是卷积神经网络等常用的模型结构。副本数量预测模型可采用机器学习方法(如有监督学习方法)训练得到。
作为又一示例,缓存设备的参数可以包括但不限于读带宽峰值、存储容量等。上述执行主体可以首先基于读带宽峰值(可记为R0)和存储容量(可记为S1),确定目标资源的读效率峰值(可记为F0)。如可将读带宽峰值和存储容量的比值作为读效率峰值,即F0=R0/S1。而后,可以基于需求带宽(可记为T)、目标资源的数据量(可记为S2)以及读效率峰值F0,确定目标资源的副本数量(可记为N)。例如,N=T/(F0×S2)
相较于现有技术中被动创建副本的方式,本实施例基于设备参数、用户需求、资源的数据量多方面因素主动确定出合适的副本数量,能够对副本数量进行有效控制,避免了部分资源的副本过量,节约了缓存设备集群的缓存空间。
步骤203,为目标资源创建副本数量的副本,并将所创建的副本缓存至缓存设备集群。
在本实施例中,在确定出目标资源的副本数量后,上述执行主体可以为目标资源创建该副本数量的副本,并将所创建的副本缓存至缓存设备集群。其中,该副本数量的副本可分别存储不同的缓存设备。例如,目标资源共有10个副本,可从缓存设备集群中选取10个缓存设备,使所选取的每个缓存设备存储目标资源的一个副本。相较于当访问流量大于阈值时再创建副本的方式,本实施例直接创建合适数量的副本,可使用户所使用的计算设备能够同时从多个副本中进行资源读取,降低了副本在其所在缓存设备中的读带宽,避免了副本占据其所在缓存设备的全部读带宽的情况,节约了缓存设备的缓存空间。
本申请的上述实施例提供的方法,通过获取用户对目标资源的需求带宽,而后基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量,最后为目标资源创建副本数量的副本,从而将所创建的副本缓存至缓存设备集群,由于能够基于设备参数、用户需求、资源的数据量多方面因素确定出合适的副本数量,相较于现有技术中被动创建副本的方式,有效控制了副本数量,避免了部分资源的副本过量。此外,直接创建合适数量的副本,相较于当访问流量大于阈值时再创建副本的方式,可降低副本在其所在缓存设备中的读带宽,避免了副本占据其所在缓存设备的全部读带宽的情况。由此,节约了缓存设备集群的缓存空间。
在一些可选的实施例中,在目标资源被读取的过程中,若检测目标资源的读带宽总量下降,可认为副本数量不足,此时需要对副本数量进行补偿,以提高用户对目标资源的读带宽总量。具体地,上述执行主体还可基于读取目标资源的计算设备的处理器成本和/或用户优先级,确定副本增量。从而基于副本增量增加副本,并将所增加的副本缓存至缓存设备集群。需要说明的是,基于副本增量增加副本的操作可以连续执行若干次,直至用户对目标资源的读带宽总量不再增加。此外,可以采用带宽小于设备峰值带宽的只读状态下的缓存设备缓存所增加的临时副本,作为性能补偿的缓冲。
以模型训练场景为例,目标副本为用于训练模型的数据集。在检测到用户对目标资源的读带宽总量下降且模型未训练结束时,可基于训练模型的设备的GPU(GraphicsProcessing Unit)的成本和/或用户优先级,确定所需增加的副本的数量,并在缓存设备集群中增加该数量的副本。例如,针对成本较低的GPU每次可增加1个副本,针对成本较高的GPU每次可增加2个副本。再例如,针对优先级较低的用户每次可增加1个副本,针对优先级较高的用户每次可增加2个副本。
通过在目标资源的读带宽总量下降且读取尚未结束时对目标资源的副本数量进行补偿,实现了副本数量的灵活调整,避免了副本不足的情况。
在一些可选的实施例中,上述执行主体还可以周期性地获取缓存设备集群中各缓存设备中的有效资源数据量和读带宽量,并基于所获取的有效资源数据量和读带宽量,确定各缓存设备的存储效率(如可将有效资源数据量与读带宽量的比值作为缓存设备的存储效率),从而从存储效率小于存储效率阈值的缓存设备中删除无效资源。其中,有效资源为具有访问流量的资源,无效资源为不具有访问流量的资源。由此,可在用户对某些资源的需求带宽降低后减少其副本数量,进一步节约了缓存设备集群的缓存空间。
进一步参考图3,其示出了资源缓存方法的又一个实施例的流程300。该资源缓存方法的流程300,包括以下步骤:
步骤301,获取用户对目标资源的需求带宽。
本实施例的步骤301可参见图2对应实施例的步骤201,此处不再赘述。
步骤302,基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量。
本实施例的步骤302可参见图2对应实施例的步骤202,此处不再赘述。
步骤303,基于缓存设备集群中各缓存设备的状态和/或磨损程度,从缓存设备集群中选取数量为副本数量的目标缓存设备。
在本实施例中,在将创建的副本缓存至缓存设备集群时,可以结合缓存设备的状态和/或磨损程度,进行目标缓存设备的选取,从而将副本存储于目标缓存设备。此处,目标缓存设备即为副本数量。
在一些可选的实现方式中,可以基于缓存设备的状态选取目标缓存设备。例如,缓存设备的状态可以包括只读状态和读写状态。可选取处于读写状态的副本数量的缓存设备的作为目标缓存设备。在可供选择的处于读写状态缓存设备的数量不足副本数量时,再从处于读写状态的缓存设备中补足。由此可使缓存设备集群中处于读写混合状态的缓存设备数量尽可能小,从而为用户提供更大的读带宽。
需要说明的是,在选取处于读写状态的缓存设备时,可对缓存设备的写入量进行限定,如可限定为min(读带宽的20%,总带宽20%)。其中min()表示取最小值。即,若写带宽占比为总带宽或读带宽的20%时,不接收新的副本写入。在当前正在写入的副本写入完成后,可切换为只读装状态。由此可避免写入操作对读带宽造成较大影响。
在一些可选的实现方式中,可以基于缓存设备的磨损程度选取目标缓存设备。例如,可按照磨损程度由低到高的次序选取副本数量的缓存设备,作为目标缓存设备。其中,磨损程度可以采用缓存设备的写入数据量来表征。写入数据量越大,磨损程度越大。由此可使缓存设备集群中的缓存设备的写入量均衡。
在一些可选的实现方式中,可以同时结合缓存设备的状态选取和磨损程度,选取目标缓存设备。例如,若处于读写状态的缓存设备的数量大于或等于副本数量,可以按照磨损程度由低到高的顺序,从处于读写状态的缓存设备中选取副本数量的缓存设备,作为目标缓存设备。再例如,若处于读写状态的缓存设备的数量小于副本数量,按照磨损程度由低到高的顺序,从处于只读状态的缓存设备中选取目标数量的缓存设备,将处于读写状态的缓存设备和所选取的处于只读状态的缓存设备作为目标缓存设备,目标数量为处于读写状态的缓存设备的数量与副本数量的差值。由此,可为用户提供更大的读带宽,同时使缓存设备集群中的缓存设备的写入量均衡。
步骤304,为目标资源创建副本数量的副本,并将所创建的副本缓存至缓存设备集群。
在本实施例中,上述执行主体可以为目标资源创建该副本数量的副本,并将所创建的副本缓存至目标缓存设备。其中,每个目标缓存设备可存储该目标资源的一个副本。
从图2中可以看出,与图1对应的实施例相比,本实施例中的资源缓存方法的流程200涉及了基于缓存设备集群中各缓存设备的状态和/或磨损程度,选取用于存储目标资源的副本的目标缓存设备的步骤。由此,本实施例描述的方案可使缓存设备集群中处于读写混合状态的缓存设备数量尽可能小,从而为用户提供更大的读带宽,还可使缓存设备集群中的缓存设备的写入量均衡,实现了负载均衡。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种资源缓存装置的一个实施例,该装置实施例与方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的资源缓存装置400包括:获取单元401,被配置成获取用户对目标资源的需求带宽;确定单元402,被配置成基于缓存设备集群中的缓存设备的参数、上述目标资源的数据量以及上述需求带宽,确定上述目标资源的副本数量;缓存单元403,被配置成为上述目标资源创建上述副本数量的副本,并将所创建的副本缓存至上述缓存设备集群。
在本实施例的一些可选的实现方式中,上述目标缓存设备的参数包括读带宽峰值和存储容量;上述确定单元402,进一步被配置成:基于上述读带宽峰值和上述存储容量,确定上述目标资源的读取效率峰值;基于上述需求带宽、上述目标资源的数据量以及上述读取效率峰值,确定上述目标资源的副本数量。
在本实施例的一些可选的实现方式中,上述缓存单元403,进一步被配置成:基于上述缓存设备集群中各缓存设备的状态和/或磨损程度,从上述缓存设备集群中选取数量为上述副本数量的目标缓存设备;将所创建的副本缓存至上述目标缓存设备。
在本实施例的一些可选的实现方式中,缓存设备的状态包括只读状态和读写状态;上述缓存单元403,进一步被配置成:若处于读写状态的缓存设备的数量大于或等于上述副本数量,按照磨损程度由低到高的顺序,从处于读写状态的缓存设备中选取上述副本数量的缓存设备,作为目标缓存设备。
在本实施例的一些可选的实现方式中,上述缓存单元403,进一步被配置成:若处于读写状态的缓存设备的数量小于上述副本数量,按照磨损程度由低到高的顺序,从处于只读状态的缓存设备中选取目标数量的缓存设备,将处于读写状态的缓存设备和所选取的处于只读状态的缓存设备作为目标缓存设备,上述目标数量为处于读写状态的缓存设备的数量与上述副本数量的差值。
在本实施例的一些可选的实现方式中,上述目标资源包括用于训练模型的数据集或数据集组;上述获取单元401,进一步被配置成:确定采用上述目标资源训练模型的各用户所选用的批尺寸参数和训练时长,确定各用户对上述目标资源的局部需求带宽;将所确定的局部需求带宽求和,得到用户对上述目标资源的需求带宽。
在本实施例的一些可选的实现方式中,上述装置还包括补偿单元,被配置成在上述目标资源被读取的过程中,若检测上述目标资源的读带宽总量下降,基于读取上述目标资源的计算设备的处理器成本和/或用户优先级,确定副本增量;基于上述副本增量增加副本,并将所增加的副本缓存至上述缓存设备集群。
在本实施例的一些可选的实现方式中,上述装置还包括回收单元,被配置成周期性地获取上述缓存设备集群中各缓存设备中的有效资源数据量和读带宽量,有效资源为具有访问流量的资源;基于所获取的有效资源数据量和读带宽量,确定各缓存设备的存储效率;从存储效率小于存储效率阈值的缓存设备中,删除无效资源,上述无效资源为不具有访问流量的资源。
在本实施例的一些可选的实现方式中,上述缓存设备集群包括固态硬盘缓存集群,上述缓存设备包括固态硬盘。
本申请的上述实施例提供的装置,通过获取用户对目标资源的需求带宽,而后基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量,最后为目标资源创建副本数量的副本,从而将所创建的副本缓存至缓存设备集群,由于能够基于设备参数、用户需求、资源的数据量多方面因素确定出合适的副本数量,相较于现有技术中被动创建副本的方式,有效控制了副本数量,避免了部分资源的副本过量。此外,直接创建合适数量的副本,相较于当访问流量大于阈值时再创建副本的方式,可降低副本在其所在缓存设备中的读带宽,避免了副本占据其所在缓存设备的全部读带宽的情况。由此,节约了缓存设备集群的缓存空间。
下面参考图5,其示出了用于实现本申请的一些实施例的电子设备的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁盘、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本申请的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本申请的一些实施例的方法中限定的上述功能。
需要说明的是,本申请的一些实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperTextTransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取用户对目标资源的需求带宽;基于缓存设备集群中的缓存设备的参数、目标资源的数据量以及需求带宽,确定目标资源的副本数量;为目标资源创建副本数量的副本,并将所创建的副本缓存至缓存设备集群。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的一些实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++;还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接),上述网络包括局域网(LAN)或广域网(WAN)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一确定单元、第二确定单元、选取单元和第三确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本申请的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (11)

1.一种资源缓存方法,其特征在于,所述方法包括:
获取用户对目标资源的需求带宽;
基于缓存设备集群中的缓存设备的参数、所述目标资源的数据量以及所述需求带宽,确定所述目标资源的副本数量;其中,所述缓存设备的参数包括读带宽峰值和存储容量;
为所述目标资源创建所述副本数量的副本,并将所创建的副本缓存至所述缓存设备集群;
其中,所述基于缓存设备集群中的缓存设备的参数、所述目标资源的数据量以及所述需求带宽,确定所述目标资源的副本数量,包括:
基于所述读带宽峰值和所述存储容量,确定所述目标资源的读取效率峰值;
基于所述需求带宽、所述目标资源的数据量以及所述读取效率峰值,确定所述目标资源的副本数量。
2.根据权利要求1所述的方法,其特征在于,所述将所创建的副本缓存至所述缓存设备集群,包括:
基于所述缓存设备集群中各缓存设备的状态和/或磨损程度,从所述缓存设备集群中选取数量为所述副本数量的目标缓存设备;
将所创建的副本缓存至所述目标缓存设备。
3.根据权利要求2所述的方法,其特征在于,缓存设备的状态包括只读状态和读写状态;
所述基于所述缓存设备集群中各缓存设备的状态和磨损程度,从所述缓存设备集群中选取数量为所述副本数量的目标缓存设备,包括:
若处于读写状态的缓存设备的数量大于或等于所述副本数量,按照磨损程度由低到高的顺序,从处于读写状态的缓存设备中选取所述副本数量的缓存设备,作为目标缓存设备。
4.根据权利要求3所述的方法,其特征在于,所述基于所述缓存设备集群中各缓存设备的状态和磨损程度,从所述缓存设备集群中选取数量为所述副本数量的目标缓存设备,还包括:
若处于读写状态的缓存设备的数量小于所述副本数量,按照磨损程度由低到高的顺序,从处于只读状态的缓存设备中选取目标数量的缓存设备,将处于读写状态的缓存设备和所选取的处于只读状态的缓存设备作为目标缓存设备,所述目标数量为处于读写状态的缓存设备的数量与所述副本数量的差值。
5.根据权利要求1所述的方法,其特征在于,所述目标资源包括用于训练模型的数据集或数据集组;
所述获取用户对目标资源的需求带宽,包括:
确定采用所述目标资源训练模型的各用户所选用的批尺寸参数和训练时长,确定各用户对所述目标资源的局部需求带宽;
将所确定的局部需求带宽求和,得到用户对所述目标资源的需求带宽。
6.根据权利要求1所述的方法,其特征在于,在将所创建的副本缓存至所述缓存设备集群后,所述方法还包括:
在所述目标资源被读取的过程中,若检测所述目标资源的读带宽总量下降,基于读取所述目标资源的计算设备的处理器成本和/或用户优先级,确定副本增量;
基于所述副本增量增加副本,并将所增加的副本缓存至所述缓存设备集群。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
周期性地获取所述缓存设备集群中各缓存设备中的有效资源数据量和读带宽量,有效资源为具有访问流量的资源;
基于所获取的有效资源数据量和读带宽量,确定各缓存设备的存储效率;
从存储效率小于存储效率阈值的缓存设备中,删除无效资源,所述无效资源为不具有访问流量的资源。
8.根据权利要求1所述的方法,其特征在于,所述缓存设备集群包括固态硬盘缓存集群,所述缓存设备包括固态硬盘。
9.一种资源缓存装置,其特征在于,所述装置包括:
获取单元,被配置成获取用户对目标资源的需求带宽;
确定单元,被配置成基于缓存设备集群中的缓存设备的参数、所述目标资源的数据量以及所述需求带宽,确定所述目标资源的副本数量;其中,所述缓存设备的参数包括读带宽峰值和存储容量;
缓存单元,被配置成为所述目标资源创建所述副本数量的副本,并将所创建的副本缓存至所述缓存设备集群;
所述确定单元包括:
第一确定子单元,用于基于所述读带宽峰值和所述存储容量,确定所述目标资源的读取效率峰值;
第二确定子单元,用于基于所述需求带宽、所述目标资源的数据量以及所述读取效率峰值,确定所述目标资源的副本数量。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法。
CN202111258634.3A 2021-10-27 2021-10-27 资源缓存方法、装置、电子设备和计算机可读介质 Active CN114205416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111258634.3A CN114205416B (zh) 2021-10-27 2021-10-27 资源缓存方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111258634.3A CN114205416B (zh) 2021-10-27 2021-10-27 资源缓存方法、装置、电子设备和计算机可读介质

Publications (2)

Publication Number Publication Date
CN114205416A CN114205416A (zh) 2022-03-18
CN114205416B true CN114205416B (zh) 2024-03-12

Family

ID=80646428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111258634.3A Active CN114205416B (zh) 2021-10-27 2021-10-27 资源缓存方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN114205416B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179494A (zh) * 2007-12-03 2008-05-14 浙江大学 面向网络多媒体传输服务的资源分发方法
CN101916289A (zh) * 2010-08-20 2010-12-15 浙江大学 支持海量小文件和动态备份数的数字图书馆存储系统的构建方法
EP2595123A3 (en) * 2011-11-17 2013-05-29 Igt Showing mobile device display on a electronic gaming machine
CN104731528A (zh) * 2015-03-17 2015-06-24 清华大学 一种云计算块存储服务的构建方法及系统
CN105574153A (zh) * 2015-12-16 2016-05-11 南京信息工程大学 一种基于文件热度分析和K-means的副本放置方法
CN107977159A (zh) * 2016-10-21 2018-05-01 华为技术有限公司 一种数据存储方法以及装置
CN109697018A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 调整存储节点副本数量的方法和装置
CN111124762A (zh) * 2019-12-30 2020-05-08 航天科工网络信息发展有限公司 一种基于改进粒子群算法的动态副本放置方法
WO2021012785A1 (zh) * 2019-07-22 2021-01-28 平安科技(深圳)有限公司 基于云存储的云磁盘挂载方法、装置、设备和存储介质
CN113468456A (zh) * 2021-07-12 2021-10-01 工银科技有限公司 网页渲染方法及装置、电子设备和计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080298276A1 (en) * 2007-05-31 2008-12-04 Microsoft Corporation Analytical Framework for Multinode Storage Reliability Analysis
US7962447B2 (en) * 2008-12-30 2011-06-14 International Business Machines Corporation Accessing a hierarchical database using service data objects (SDO) via a data access service (DAS)
US11010476B2 (en) * 2018-12-04 2021-05-18 Palantir Technologies Inc. Security-aware caching of resources
CN112685220A (zh) * 2019-10-17 2021-04-20 伊姆西Ip控股有限责任公司 用于备份数据的方法、电子设备和计算机程序产品

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179494A (zh) * 2007-12-03 2008-05-14 浙江大学 面向网络多媒体传输服务的资源分发方法
CN101916289A (zh) * 2010-08-20 2010-12-15 浙江大学 支持海量小文件和动态备份数的数字图书馆存储系统的构建方法
EP2595123A3 (en) * 2011-11-17 2013-05-29 Igt Showing mobile device display on a electronic gaming machine
CN104731528A (zh) * 2015-03-17 2015-06-24 清华大学 一种云计算块存储服务的构建方法及系统
CN105574153A (zh) * 2015-12-16 2016-05-11 南京信息工程大学 一种基于文件热度分析和K-means的副本放置方法
CN107977159A (zh) * 2016-10-21 2018-05-01 华为技术有限公司 一种数据存储方法以及装置
CN109697018A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 调整存储节点副本数量的方法和装置
WO2021012785A1 (zh) * 2019-07-22 2021-01-28 平安科技(深圳)有限公司 基于云存储的云磁盘挂载方法、装置、设备和存储介质
CN111124762A (zh) * 2019-12-30 2020-05-08 航天科工网络信息发展有限公司 一种基于改进粒子群算法的动态副本放置方法
CN113468456A (zh) * 2021-07-12 2021-10-01 工银科技有限公司 网页渲染方法及装置、电子设备和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
教育资源网格模型及副本创建策略;邢长明等;软件学报;全文 *

Also Published As

Publication number Publication date
CN114205416A (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
US11146502B2 (en) Method and apparatus for allocating resource
US12019652B2 (en) Method and device for synchronizing node data
CN114020470B (zh) 资源分配方法、装置、可读介质及电子设备
CN113391765A (zh) 基于分布式存储系统的数据存储方法、装置、设备及介质
CN110058936B (zh) 用于确定专用处理资源的资源量的方法、设备和计算机程序产品
CN110933140B (zh) Cdn存储分配方法、系统及电子设备
CN112068765A (zh) 管理存储系统的方法、设备和计算机程序产品
CN115543965A (zh) 跨机房数据处理方法、设备、存储介质及程序产品
CN109918381B (zh) 用于存储数据的方法和装置
CN113127438B (zh) 用于存储数据的方法、装置、服务器和介质
CN113448770B (zh) 用于恢复数据的方法、电子设备和计算机程序产品
CN114205416B (zh) 资源缓存方法、装置、电子设备和计算机可读介质
US9619397B2 (en) Cost sensitive browser cache cleanup based on weighted probabilistic cached item usage
CN117056123A (zh) 数据恢复方法、装置、介质及电子设备
CN111158907A (zh) 数据处理方法及装置、电子设备和存储介质
CN112148448B (zh) 资源分配方法、装置、设备和计算机可读介质
CN111459893B (zh) 文件处理方法、装置和电子设备
CN117992410A (zh) 小文件数据的处理方法、装置、电子设备及存储介质
CN111756833B (zh) 节点处理方法、装置、电子设备及计算机可读介质
CN111213130B (zh) 基于分散位置的去重的性能改进
CN111404824B (zh) 用于转发请求的方法、装置、电子设备和计算机可读介质
CN116820354B (zh) 数据存储方法、数据存储装置和数据存储系统
CN109741026A (zh) 基于活动对的流程引擎处理方法及装置
CN111694755B (zh) 应用程序测试方法、装置、电子设备及介质
CN115993942B (zh) 数据缓存方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant