CN111176565B

CN111176565B - 确定应用的存储负载的方法和设备

Info

Publication number: CN111176565B
Application number: CN201911355595.1A
Authority: CN
Inventors: 夏巍
Original assignee: Samsung China Semiconductor Co Ltd; Samsung Electronics Co Ltd
Current assignee: Samsung China Semiconductor Co Ltd; Samsung Electronics Co Ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2024-04-19
Anticipated expiration: 2039-12-25
Also published as: US20210201201A1; KR20210082349A; CN111176565A

Abstract

提供一种确定应用的存储负载的方法和设备，所述方法包括：获取应用在预定时间段内产生的存储负载的统计数据；将统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，其中，统计数据是指应用在预定时间段内产生的所有读/写请求的全局统计信息，读/写请求跟踪数据是指应用在预定时间段内产生的每个读/写请求的请求描述信息。根据所述方法和设备，可以在保证应用的性能且不占用较多资源的情况下，最大程度地重现用于分析存储负载的时/空分布特征，为更加深入地研究存储负载提供依据。

Description

确定应用的存储负载的方法和设备

技术领域

本发明总体来说涉及存储负载的优化领域，更具体地讲，涉及一种确定应用的存储负载的方法和设备。

背景技术

物联网的快速发展，给其应用的存储负载带来了极大的挑战。例如，如果应用的存储负载过大，会导致应用的性能的大幅度下降，例如，时间延迟、数据丢失等。及时获悉应用的历史存储负载情况，有利于对下一时间段的存储负载进行预测和调整，保证应用的稳定。

目前，可利用实时获取的存储负载的读/写请求跟踪数据或者统计数据分析存储负载的情况，但是，上述两种方法分别具有以下弊端：虽然读/写请求跟踪数据记录有每一条读/写请求的描述信息，能够全面地分析存储负载的时/空分布特征，可以作为分析应用的存储负载的依据，但是，每一条读/写请求的描述信息是通过解析接收的存储负载的读/写请求，记录并存储解析后的数据而得来的，这个过程需要占用较多的资源，影响了应用处理其他业务的性能。另一方面，虽然统计数据较易获取，对应用性能的影响不大，但是统计数据仅能宏观地体现存储负载在预定时间段内产生的所有读/写请求的统计情况，无法得到存储负载在预定时间段内产生的每一条读/写请求的描述信息，例如，每一条读/写请求所请求的存储容量的大小、每一条读/写请求所属的进程、每一条读/写请求的请求时间戳等，因此，统计数据仅能体现出存储负载的整体情况，而无法提供存储负载的细节信息，也就是说，统计数据无法提供完整的分析存储负载情况的有效信息。

综上所述，现有的获取应用的存储负载的历史情况的方式均具有局限性，无法满足人们的需求。

发明内容

本发明的示例性实施例在于提供一种确定应用的存储负载的方法和设备，其能够克服无法保证应用的性能且不占用较多资源的情况下获悉应用的存储负载的压力情况的缺陷。

根据本发明的示例性实施例的一方面，提供一种确定应用的存储负载的方法，包括：获取应用在预定时间段内产生的存储负载的统计数据；将所述统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，其中，所述统计数据是指应用在预定时间段内产生的所有读/写请求的全局统计信息，所述读/写请求跟踪数据是指应用在预定时间段内产生的每个读/写请求的请求描述信息，通过这种方式，可以在保证应用的性能且不占用较多资源的情况下，获悉应用的存储负载的压力情况。

可选地，全局统计信息是指对所有读/写请求解析获得的描述数据进行统计处理得到的统计特征值，任一读/写请求的请求描述信息是指对所述任一读/写请求解析获得的描述数据。

可选地，通过以下方式训练机器学习模型：获取应用在至少一个业务处理周期内产生的存储负载的历史统计数据和历史读/写请求跟踪数据，其中，获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，所述业务处理周期是指应用处理一个预定时间单位产生的读/写请求花费的时间；利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型。

可选地，利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型的步骤包括：将获取的历史统计数据输入机器学习模型，确定机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度；比较所述相似度与预定阈值的大小；当所述相似度小于预定阈值时，基于所述相似度调整机器学习模型的超参数或者权重；当所述相似度大于或者等于预定阈值时，将当前的机器学习模型作为训练好的机器学习模型。这里，由于训练机器学习模型时需要将至少一个业务处理周期内应用产生的历史统计数据和历史读写请求跟踪数据作为训练样本，因此，可以使得训练好的机器学习模型更加准确。此外，对超参数或者权重进行调整，有利用提高机器学习的性能和效果。

可选地，所述统计数据包括以下项中的至少一项：在预定时间段内产生的读请求的数量、在预定时间段内产生的写请求的数量、在预定时间段内产生的读请求和写请求的总数量、在预定时间段内产生的读/写请求的数量各占读请求和写请求的总数量的比例、在预定时间段内产生的读/写请求所请求的总存储容量、在预定时间段内产生的读/写请求所请求的存储容量的分布、在预定时间段内产生的读/写请求的请求时间戳的分布、在预定时间段内产生的读/写请求所请求的逻辑地址的分布、在预定时间段内产生的读/写请求所属的进程的分布，所述读/写请求跟踪数据包括以下项中的至少一项：在预定时间段内产生的每一条读/写请求所请求的存储容量的大小、在预定时间段内产生的每一条读/写请求的类型、在预定时间段内产生的每一条读/写请求所属的进程、在预定时间段内产生的每一条读/写请求的请求时间戳、在预定时间段内产生的每一条读/写请求所请求的逻辑地址。

根据本发明示例性实施例的另一方面，提供一种确定应用的存储负载的设备，包括：获取单元，获取应用在预定时间段内产生的存储负载的统计数据；处理单元，将所述统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，其中，所述统计数据是指应用在预定时间段内产生的所有读/写请求的全局统计信息，所述读/写请求跟踪数据是指应用在预定时间段内产生的每个读/写请求的请求描述信息。通过这种方式，可以在保证应用的性能且不占用较多资源的情况下，获悉应用的存储负载的压力情况。

可选地，处理单元通过以下方式训练机器学习模型：获取应用在至少一个业务处理周期内产生的存储负载的历史统计数据和历史读/写请求跟踪数据，利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型，其中，获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，所述业务处理周期是指应用处理一个预定时间单位产生的读/写请求花费的时间。由于训练机器学习模型时需要将至少一个业务处理周期内应用产生的历史统计数据和历史读写请求跟踪数据作为训练样本，因此，可以使得训练好的机器学习模型更加准确。此外，对超参数或者权重进行调整，有利用提高机器学习的性能和效果。

可选地，利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型的处理包括：将获取的历史统计数据输入机器学习模型，确定机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度；比较所述相似度与预定阈值的大小；当所述相似度小于预定阈值时，基于所述相似度调整机器学习模型的超参数或者权重；当所述相似度大于或者等于预定阈值时，将当前的机器学习模型作为训练好的机器学习模型。这里，对超参数或者权重进行调整，有利用提高学习的性能和效果。

根据本发明示例性实施例的另一方面，提供一种电子设备，其中，所述电子设备包括：处理器；存储器，存储有计算机程序，当所述计算机程序被处理器执行时，实现根据本发明的确定应用的存储负载的方法。

根据本发明示例性实施例的另一方面，提供一种存储有计算机程序的计算机可读存储介质，当所述计算机程序在被处理器执行时实现根据本发明的确定应用的存储负载的方法。

根据本发明示例性实施例的确定应用的存储负载的方法和设备，能够利用存储负载的历史统计数据在一定程度上还原出存储负载当时的读/写请求跟踪数据，通过这种方式，可以在保证应用的性能且不占用较多资源的情况下，最大程度地重现用于分析存储负载的时/空分布特征，为更加深入地研究存储负载提供依据。

将在接下来的描述中部分阐述本发明总体构思另外的方面和/或优点，还有一部分通过描述将是清楚的，或者可以经过本发明总体构思的实施而得知。

附图说明

通过下面结合示例性地示出实施例的附图进行的详细描述，本发明示例性实施例的上述和其他目的将会变得更加清楚，其中：

图1示出根据本发明示例性实施例的确定应用的存储负载的方法的流程图；

图2示出根据本发明示例性实施例的训练机器学习模型的步骤的流程图；

图3示出根据本发明示例性实施例的确定应用的存储负载的设备的框图。

具体实施方式

现将详细参照本发明的示例性实施例，所述实施例的示例在附图中示出，其中，相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例，以便解释本发明。

图1示出根据本发明示例性实施例的确定应用的存储负载的方法的流程图。这里，所述方法可由用于在电子设备中确定应用的存储负载的设备来实现，也可完全通过计算机程序来实现，例如，所述方法可通过安装在电子设备中的用于确定应用的存储负载的应用来执行，或者通过电子设备的操作系统中实现的功能程序来执行。作为示例，所述电子设备可以是个人计算机、服务器、平板电脑、智能手机等具有人工智能运算功能的电子设备。

如图1所示，在步骤S100，获取应用在预定时间段内产生的存储负载的统计数据，其中，所述统计数据是指应用在预定时间段内产生的所有读/写请求的全局统计信息。作为示例，全局统计信息是指对所有读/写请求解析获得的描述数据进行统计处理得到的统计特征值。

具体说来，可通过在应用的读/写请求下发到存储设备的路径上设置的至少一个监测点来获取应用在预定时间段内流经所述至少一个监测点的每一个读/写请求，解析获取的每一个读/写请求，利用对每一个读/写请求解析后得到的描述数据进行统计处理(例如，求和、求比重、求分布等)，以得到应用在预定时间段内产生的存储负载的统计数据。

作为示例，所述统计数据可包括以下项中的至少一项：在预定时间段内产生的读请求的数量、在预定时间段内产生的写请求的数量、在预定时间段内产生的读请求和写请求的总数量、在预定时间段内产生的读/写请求的数量各占读请求和写请求的总数量的比例、在预定时间段内产生的读/写请求所请求的总存储容量、在预定时间段内产生的读/写请求所请求的存储容量的分布、在预定时间段内产生的读/写请求的请求时间戳的分布、在预定时间段内产生的读/写请求所请求的逻辑地址的分布、在预定时间段内产生的读/写请求所属的进程的分布。

另一方面，虽然获取统计数据的过程中涉及获取流经上述至少一个监测点的读/写请求的描述数据，但是获取统计数据仅涉及对读/写请求的描述数据的统计，并未涉及对读/写请求的描述数据的记录和存储。因此，获取统计数据的方式对无需占用大量的资源，对应用的性能的影响不大。然而，在现有技术中，如果获取可全面分析存储负载的时/空分布特征的每一条读/写请求的描述数据，需要将每一条读/写请求的描述数据进行记录和存储，将会占用大量资源，为了克服这一缺陷，在本发明中，可基于预先训练好的机器学习模型来预测存储负载在预定时间段内的读/写请求跟踪数据，从而在在保证应用的性能且不占用较多资源的情况下，为更加深入地研究存储负载提供依据。

具体说来，在步骤S200，可将所述统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，这里，所述读/写请求跟踪数据是指应用在预定时间段内产生的每个读/写请求的请求描述信息。作为示例，任一读/写请求的请求描述信息是指对所述任一读/写请求解析获得的描述数据。

作为示例，所述读/写请求跟踪数据可包括以下项中的至少一项：在预定时间段内产生的每一条读/写请求所请求的存储容量的大小、在预定时间段内产生的每一条读/写请求的类型、在预定时间段内产生的每一条读/写请求所属的进程、在预定时间段内产生的每一条读/写请求的请求时间戳、在预定时间段内产生的每一条读/写请求所请求的逻辑地址。

作为示例，上述机器学习模型可通过以下方式进行训练：

首先：获取应用在至少一个业务处理周期内产生的存储负载的历史统计数据和历史读/写请求跟踪数据，其中，获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，这里，业务处理周期是指应用处理一个预定时间单位产生的读/写请求花费的时间。

具体说来，可抽取在至少一个业务处理周期内(例如，45分钟内、一天内、一周内、一个月内等)应用产生的存储负载的历史统计数据和历史读/写请求跟踪数据。这里，由于历史统计数据和历史读/写请求跟踪数据的数据格式与时间信息格式并不一致，因此，在获取历史统计数据和历史读/写请求跟踪数据之前，历史统计数据和历史读/写请求跟踪数据已被整理，从而使得获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，例如，在2019年3月5日的5：30分-5点40分获取的存储负载的统计数据和在在2019年3月5日的5：30分-5点40分存储负载产生的读/写请求跟踪数据对应。这里，由于训练机器学习模型时需要将至少一个业务处理周期内应用产生的历史统计数据和历史读写请求跟踪数据作为训练样本，因此，可以使得训练好的机器学习模型更加准确。

然后：利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型。

下面，将结合图2来详细描述利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型的步骤。

具体说来，如图2所示，当在步骤S210获取应用产生的存储负载的历史统计数据和历史读/写请求跟踪数据之后，在步骤S220，将获取的历史统计数据输入机器学习模型，确定机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度。这里，可用现有的任何方式确定相似度，本发明在此不做任何限定。

在步骤S230，比较相似度与预定阈值的大小，例如，确定相似度是否大于或者等于预定阈值。

当相似度大于或者等于预定阈值时，在步骤S240，将当前的机器学习模型作为训练好的机器学习模型。

当相似度小于预定阈值时，在步骤S250，基于相似度调整机器学习模型的超参数或者权重。作为示例，相似度可表示逻辑值和标准值之间的差异程度。在训练过程中，相似度越大，机器学习模型越稳定。

这里，超参数是指在机器学习的上下文中，在开始学习过程之前设置的参数。例如，学习率、深层神经网络隐藏层数，K均值聚类中的簇数等，通常情况下，可根据机器学习模型的相似度情况对超参数进行优化，以提高学习的性能和效果。例如，当相似度小于预定阈值时，可基于相似度确定机器学习模型的损失函数的输出：损失值loss value，当损失值小于损失值阈值并且在一个数值上下反复震荡时，可以通过减小机器学习模型的学习率，来使机器学习模型训练过程更加平滑，从而加快得到训练好的机器学习模型。

同样，也可使用现有的可选方式来根据相似度来调整机器学习模型的权重以提高学习的性能和效果，相应地，机器学习模型的权重的准确度随着训练机器学习模型的次数的增多而增大。

接下来，在用现有的方式调整了机器学习模型的超参数或者权重之后，可以返回执行步骤S220，继续将获取的历史统计数据(例如，之前输入过机器学习模型的历史统计数据或者未曾输入过机器学习模型的历史统计数据)输入机器学习模型，继续确定从机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度。重复上述步骤直至相似度大于或者等于预定阈值，直到得到训练好的机器学习模型为止。

另一方面，在利用所述统计数据预测出所述存储负载在预定时间段内的读/写请求跟踪数据之后，可以将得到的读/写请求跟踪数据作为估计预定时间段内的存储负载情况的依据，为调整应用的存储负载提供可参考的数据。

根据本发明示例性实施例的确定应用的存储负载的方法，能够利用存储负载的历史统计数据在一定程度上还原出存储负载当时的读/写请求跟踪数据，通过这种方式，可以在保证应用的性能且不占用较多资源的情况下，最大程度地重现用于分析存储负载的时/空分布特征，为更加深入地研究存储负载提供依据。

图3示出根据本发明示例性实施例的确定应用的存储负载的设备的框图。作为示例，所述电子设备可以是个人计算机、服务器、平板电脑、智能手机等具有人工智能运算功能的电子设备。

如图3所示，根据本发明示例性实施例的确定应用的存储负载的设备包括获取单元100和处理单元200。

获取单元100获取应用在预定时间段内产生的存储负载的统计数据，其中，所述统计数据是指应用在预定时间段内产生的所有读/写请求的全局统计信息。作为示例，全局统计信息是指对所有读/写请求解析获得的描述数据进行统计处理得到的统计特征值。

具体说来，获取单元100可通过在应用的读/写请求下发到存储设备的路径上设置的至少一个监测点来获取应用在预定时间段内流经所述至少一个监测点的每一个读/写请求，解析获取的每一个读/写请求，利用对每一个读/写请求解析后得到的描述数据进行统计处理(例如，求和、求比重、求分布等)，以得到应用在预定时间段内产生的存储负载的统计数据。

另一方面，虽然获取单元100获取统计数据的过程中涉及获取流经上述至少一个监测点的读/写请求的描述数据，但是获取统计数据仅涉及对读/写请求的描述数据的统计，并未涉及对读/写请求的描述数据的记录和存储，因此，获取统计数据的方式对无需占用大量的资源，对应用的性能的影响不大。然而，在现有技术中，如果获取可全面分析存储负载的时/空分布特征的每一条读/写请求的描述数据，需要将每一条读/写请求的描述数据进行记录和存储，导致占用大量资源，为了克服这一缺陷，在本发明中，可基于预先训练好的机器学习模型来预测存储负载在预定时间段内的读/写请求跟踪数据，从而在在保证应用的性能且不占用较多资源的情况下，为更加深入地研究存储负载的细节和压力回放提供依据。

具体说来，处理单元200可将所述统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，这里，所述读/写请求跟踪数据是指应用在预定时间段内产生的每个读/写请求的请求描述信息。作为示例，任一读/写请求的请求描述信息是指对所述任一读/写请求解析获得的描述数据。

作为示例，处理单元200可通过以下方式训练机器学习模型。

具体说来，首先，处理单元200获取应用在至少一个业务处理周期内产生的存储负载的历史统计数据和历史读/写请求跟踪数据，其中，获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，这里，业务处理周期是指应用处理一个预定时间单位产生的读/写请求花费的时间。

具体说来，处理单元200可抽取在至少一个业务处理周期内(例如，45分钟内、一天内、一周内、一个月内等)应用产生的存储负载的历史统计数据和历史读/写请求跟踪数据。这里，由于历史统计数据和历史读/写请求跟踪数据的数据格式与时间信息格式并不一致，因此，在获取历史统计数据和历史读/写请求跟踪数据之前，历史统计数据和历史读/写请求跟踪数据已被整理，从而使得获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，例如，在X年X月X日的5：30分-5点40分获取的存储负载的统计数据和在在X年X月X日的5：30分-5点40分存储负载产生的读/写请求跟踪数据对应。这里，由于训练机器学习模型时需要将至少一个业务处理周期内应用产生的历史统计数据和历史读写请求跟踪数据作为训练样本，因此，可以使得训练好的机器学习模型更加准确。

然后，处理单元200利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型。

这里，关于利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型的处理，作为示例，首先，可将获取的历史统计数据输入机器学习模型，确定机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度。

然后，比较相似度与预定阈值的大小，例如，确定相似度是否大于或者等于预定阈值。

当相似度大于或者等于预定阈值时，将当前的机器学习模型作为训练好的机器学习模型。当相似度小于预定阈值时，基于所述相似度调整机器学习模型的超参数或者权重。作为示例，相似度可表示逻辑值和标准值之间的差异程度。在训练过程中，相似度越大，机器学习模型越稳定。

接下来，在用现有的方式调整了机器学习模型的超参数或者权重之后，处理单元200可继续将获取的历史统计数据(例如，之前输入过机器学习模型的历史统计数据或者未曾输入过机器学习模型的历史统计数据)输入机器学习模型，继续确定从机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度。重复上述处理直至相似度大于或者等于预定阈值，得到训练好的机器学习模型为止。

此外，应该理解，根据本发明示例性实施例的确定应用的存储负载的设备中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理，可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个单元。

根据本发明的示例性实施例的计算机可读存储介质，存储有当被处理器执行时使得处理器执行上述示例性实施例的确定应用的存储负载的方法的计算机程序。该计算机可读存储介质是可存储由计算机系统读出的数据的任意数据存储装置。计算机可读存储介质的示例包括：只读存储器、随机存取存储器、只读光盘、磁带、软盘、光数据存储装置和载波(诸如经有线或无线传输路径通过互联网的数据传输)。

根据本发明的示例性实施例的电子设备包括：处理器(未示出)和存储器(未示出)，其中，存储器存储有计算机程序，当所述计算机程序被处理器执行时，实现如上述示例性实施例的确定应用的存储负载的方法。这里，存储器可以是非易失性存储器，作为示例，非易失性存储器的示例包括但不限于：英特尔非易失性内存IntelDCPMM、英特尔傲腾混合固态盘IntelH10和美光3D固态硬盘Micron 3DXpoint X100和固态硬盘SSD。

综上所述，在根据本发明示例性实施例的确定应用的存储负载的方法和设备中，能够利用存储负载的历史统计数据在一定程度上还原出存储负载当时的读/写请求跟踪数据，通过这种方式，可以在保证应用的性能且不占用较多资源的情况下，最大程度地重现用于分析存储负载的时/空分布特征，为更加深入地研究存储负载提供依据。

尽管已经参照其示例性实施例具体显示和描述了本发明，但是本领域的技术人员应该理解，在不脱离权利要求所限定的本发明的精神和范围的情况下，可以对其进行形式和细节上的各种改变。

Claims

1.一种确定应用的存储负载的方法，包括：

获取应用在预定时间段内产生的存储负载的统计数据；

将所述统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，

其中，所述统计数据是指应用在预定时间段内产生的所有读/写请求的全局统计信息，所述读/写请求跟踪数据是指应用在预定时间段内产生的每个读/写请求的请求描述信息，

其中，所述预先训练好的机器学习模型是基于存储负载的历史统计数据和与历史统计数据对应的历史读/写请求跟踪数据训练获得的。

2.如权利要求1所述的方法，其中，全局统计信息是指对所有读/写请求解析获得的描述数据进行统计处理得到的统计特征值，任一读/写请求的请求描述信息是指对所述任一读/写请求解析获得的描述数据。

3.如权利要求1所述的方法，其中，通过以下方式训练机器学习模型：

获取应用在至少一个业务处理周期内产生的存储负载的历史统计数据和历史读/写请求跟踪数据，其中，获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，所述业务处理周期是指应用处理一个预定时间单位产生的读/写请求花费的时间；

利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型。

4.如权利要求3所述的方法，其中，利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型的步骤包括：

将获取的历史统计数据输入机器学习模型，确定机器学习模型输出的读/写请求跟踪数据与对应于输入的历史统计数据的历史读/写请求跟踪数据之间的相似度；

比较所述相似度与预定阈值的大小；

当所述相似度小于预定阈值时，基于所述相似度调整机器学习模型的超参数或者权重；

当所述相似度大于或者等于预定阈值时，将当前的机器学习模型作为训练好的机器学习模型。

5.如权利要求1所述的方法，其中，所述统计数据包括以下项中的至少一项：

在预定时间段内产生的读请求的数量、在预定时间段内产生的写请求的数量、在预定时间段内产生的读请求和写请求的总数量、在预定时间段内产生的读/写请求的数量各占读请求和写请求的总数量的比例、在预定时间段内产生的读/写请求所请求的总存储容量、在预定时间段内产生的读/写请求所请求的存储容量的分布、在预定时间段内产生的读/写请求的请求时间戳的分布、在预定时间段内产生的读/写请求所请求的逻辑地址的分布、在预定时间段内产生的读/写请求所属的进程的分布，

所述读/写请求跟踪数据包括以下项中的至少一项：在预定时间段内产生的每一条读/写请求所请求的存储容量的大小、在预定时间段内产生的每一条读/写请求的类型、在预定时间段内产生的每一条读/写请求所属的进程、在预定时间段内产生的每一条读/写请求的请求时间戳、在预定时间段内产生的每一条读/写请求所请求的逻辑地址。

6.一种确定应用的存储负载的设备，包括：

获取单元，获取应用在预定时间段内产生的存储负载的统计数据；

处理单元，将所述统计数据输入到预先训练好的机器学习模型，通过预先训练好的机器学习模型确定所述存储负载在预定时间段内的读/写请求跟踪数据，

7.如权利要求6所述的设备，其中，全局统计信息是指对所有读/写请求解析获得的描述数据进行统计处理得到的统计特征值，任一读/写请求的请求描述信息是指对所述任一读/写请求解析获得的描述数据。

8.如权利要求6所述的设备，其中，处理单元通过以下方式训练机器学习模型：

获取应用在至少一个业务处理周期内产生的存储负载的历史统计数据和历史读/写请求跟踪数据，利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型，其中，获取的历史统计数据和历史读/写请求跟踪数据在时间顺序上保持对应，所述业务处理周期是指应用处理一个预定时间单位产生的读/写请求花费的时间。

9.如权利要求8所述的设备，其中，利用获取的历史统计数据和历史读/写请求跟踪数据训练机器学习模型的处理包括：

比较所述相似度与预定阈值的大小；

10.如权利要求6所述的设备，其中，所述统计数据包括以下项中的至少一项：

11.一种电子设备，其中，所述电子设备包括：

处理器；

存储器，存储有计算机程序，当所述计算机程序被处理器执行时，实现如权利要求1至5中的任意一项所述的确定应用的存储负载的方法。

12.一种存储有计算机程序的计算机可读存储介质，当所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述的确定应用的存储负载的方法。