CN111352812A - 基于朴素贝叶斯机器学习模型预测存储设备性能方法系统 - Google Patents

基于朴素贝叶斯机器学习模型预测存储设备性能方法系统 Download PDF

Info

Publication number
CN111352812A
CN111352812A CN202010109744.2A CN202010109744A CN111352812A CN 111352812 A CN111352812 A CN 111352812A CN 202010109744 A CN202010109744 A CN 202010109744A CN 111352812 A CN111352812 A CN 111352812A
Authority
CN
China
Prior art keywords
naive bayes
storage device
performance
machine learning
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010109744.2A
Other languages
English (en)
Inventor
李闯
李玲侠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010109744.2A priority Critical patent/CN111352812A/zh
Publication of CN111352812A publication Critical patent/CN111352812A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法系统,包括如下步骤:S1.创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;S2.构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;S3.通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;S4.输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测。

Description

基于朴素贝叶斯机器学习模型预测存储设备性能方法系统
技术领域
本发明属于计算机存储设备技术领域,具体涉及一种基于朴素贝叶斯机器学习模型预测存储设备性能方法系统。
背景技术
随着科学计算和各种网络应用的快速发展,人类产生的信息量越来越多,这使的数据的存储越来越被人们所关注,从而使得存储部件在整个计算机体系中所处的地位越来越重要,存储已经由单一的磁盘、磁带转向磁盘阵列,进而发展到当前流行的存储网络。大规模的数据应用需求不断涌现,海量数据及其应用也成为一个新的发展方向,数据存储已经对人们的工作和生活产生了巨大的影响,而其中对于使用的存储设备的各项性能提高也自然越来越需要关注。
单台存储设备的性能高低在硬件配置不做更改的前提下,对于不同的管理软件层面配置,得到的输入输出性能高低差异很大,如何判断配置存储设备在固定的硬件环境条件性能高低,是客户使用存储设备重点关注的问题,也是存储设备在性能测试时要达到的目标。
存储设备要关注性能指标主要为IOPS,不同的配置方案在硬件不变条件下,不同配置的条件参数都会影响存储设备性能的高低,实际使用或测试时为了确定的性能结果,通常要反复组合各种条件参数调试,并结合一定的经验才能够确定结果,费时费力且结论误差不能保障。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法系统,是非常有必要的。
发明内容
针对现有技术的上述现有的存储设备IOPS性能通常要反复组合各种条件参数调试,并结合一定的经验才能够确定结果,费时费力且结论误差不能保障的缺陷,本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法系统,以解决上述技术问题。
第一方面,本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法,包括如下步骤:
S1.创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;
S2.构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;
S3.自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;
S4.输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测。
进一步地,步骤S1具体步骤如下:
S11.创建存储设备测试环境;
S12.设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
S13.将测试数据集合分成第一测试数据集合和第二测试数据集合。测试数据集合分组,一部分用于对朴素贝叶斯算法模型进行训练,另一部分用于对训练过的朴素贝叶斯算法模型进行测试,验证训练的效果。
进一步地,步骤S2具体步骤如下:
S21.构造存储设备各配置参数对应的数据样本特征空间向量;
S22.构造存储设备IOPS性能级别对应的数据样本特征空间向量;
S23.根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
S24.设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别。数据样本的输入输出接口即是朴素贝叶斯算法模型训练的接口。
进一步地,步骤S3具体步骤如下:
S31.自动通过第一测试数据集合对朴素贝叶斯算法模型进行训练;
S32.自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
S33.判断朴素贝叶斯算法模型的准确率是否达到预期;
若否,返回步骤S31;
若是,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型。训练与测试不断重复进行,保证朴素贝叶斯算法模型的准确率。
进一步地,步骤S4具体步骤如下:
S41.获取存储设备的设定配置对应配置参数;
S42.将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
S43.通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率。通过朴素贝叶斯机器学习模型不需再进行实际的测试,只用输入配置信息到朴素贝叶斯机器学习模型中,即可得到不同配置参数组合搭配的IOPS性能高低预测结论。
第二方面,本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能系统,包括:
测试环境创建模块,用于创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;
朴素贝叶斯算法模型搭建模块,用于构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;
朴素贝叶斯机器学习模型训练模块,用于自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;
IOPS性能预测模块,用于输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测。
进一步地,测试环境创建模块包括:
测试环境创建单元,用于创建存储设备测试环境;
测试数据集合生成单元,用于设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
测试数据集合分组单元,用于将测试数据集合分成第一测试数据集合和第二测试数据集合。
进一步地,朴素贝叶斯算法模型搭建模块包括:
配置参数数据样本特征空间向量构造单元,用于构造存储设备各配置参数对应的数据样本特征空间向量;
IOPS性能级别数据样本特征空间向量构造单元,用于构造存储设备IOPS性能级别对应的数据样本特征空间向量;
朴素贝叶斯算法模型搭建单元,用于根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
输入输出接口设置单元,用于设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别。
进一步地,朴素贝叶斯机器学习模型训练模块包括:
模型训练单元,用于自动通过第一测试数据集合对朴素贝叶斯算法模型进行训练;
模型测试单元,用于自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
模型准确率预期单元,用于判断朴素贝叶斯算法模型的准确率是否达到预期;
机器学习模型设定单元,用于朴素贝叶斯算法模型准确率未达到准确率时,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型。
进一步地,IOPS性能预测模块包括:
设定配置参数获取单元,用于获取存储设备的设定配置对应配置参数;
设定配置参数输入单元,用于将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
IOPS级别概率预测单元,用于通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率。
本发明的有益效果在于,
本发明提供的基于朴素贝叶斯机器学习模型预测存储设备性能方法系统,实现用户使用存储设备即可获得优化的配置方案、减少开发测试人员调优存储设备的工作量;本发明操作便利,不需要复杂处理和人为干预,只用不断的进行存储设备不同配置数据样本输入,朴素贝叶斯算法模型自动学习完善,直至生成朴素贝叶斯机器学习模型,可操作性很强;本发明使得在不同的需求场景下要确定配置的IOPS性能级别结果,不用再进行实际的测试,只用输入配置信息到朴素贝叶斯机器学习模型中,即可得到不同配置参数组合搭配的IOPS性能高低预测结论。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的方法流程示意图一;
图2是本发明的方法流程示意图二;
图3为本发明的系统示意图;
图中,1-测试环境创建模块;1.1-测试环境创建单元;1.2-测试数据集合生成单元;1.3-测试数据集合分组单元;2-朴素贝叶斯算法模型搭建模块;2.1-配置参数数据样本特征空间向量构造单元;2.2-IOPS性能级别数据样本特征空间向量构造单元;2.3-朴素贝叶斯算法模型搭建单元;2.4-输入输出接口设置单元;3-朴素贝叶斯机器学习模型训练模块;3.1-模型训练单元;3.2-模型测试单元;3.3-模型准确率预期单元;3.4-机器学习模型设定单元;4-IOPS性能预测模块;4.1-设定配置参数获取单元;4.2-设定配置参数输入单元;4.3-IOPS级别概率预测单元。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1:
如图1所示,本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法,包括如下步骤:
S1.创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;
S2.构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;
S3.自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;
S4.输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测。
实施例2:
如图2所示,本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法,包括如下步骤:
S1.创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;具体步骤如下:
S11.创建存储设备测试环境;
S12.设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
S13.将测试数据集合分成第一测试数据集合和第二测试数据集合;
S2.构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;具体步骤如下:
S21.构造存储设备各配置参数对应的数据样本特征空间向量;
S22.构造存储设备IOPS性能级别对应的数据样本特征空间向量;
S23.根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
S24.设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别;
S3.自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;具体步骤如下:
S31.自动通过第一测试数据集合对朴素贝叶斯算法模型进行训练;
S32.自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
S33.判断朴素贝叶斯算法模型的准确率是否达到预期;
若否,返回步骤S31;
若是,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型;
S4.输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测;具体步骤如下:
S41.获取存储设备的设定配置对应配置参数;
S42.将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
S43.通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率。
实施例3:
存储设备的IOPS性能即是存储设备的性能高低数据指标为I/Opersecond,即每秒最大I/O数。
本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能方法,包括如下步骤:
S11.创建存储设备测试环境;
S12.设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
存储设备的RAID级别参数包括RAID0、RAID10、RAID5、RAID6,数据用x1={1,2,3,4}分别表示4种RAID级别;
RAID包含的磁盘数量多少会影响IOPS性能的高低,所以RAID磁盘数量参数用x2={1,2,3……24}表示,其中最大的元素24表示当前存储设备最大支持24块磁盘数量;
存储的输出链路数量参数根据存储设备的特性,用x3={1,2,3……8}表示,其中最大的元素8表示当前存储设备最大支持8条链路;
因为AID下LUN的划分按照场景可划分多个,所以每个RAID创建LUN数量参数用x4={1,2,3……10}表示,其中最大的元素10表示当前测试性能最大划分10个LUN;
按照实际场景并发数,测试性能的并发数参数用x5={1,2,3……64}表示,其中最大的元素64表示实际测试场景最大并发数为64;
用y表示不同配置下测试IOPS结果,定义IOPS性能结果y<1000时Yi=-1表示IOPS性能基本差;IOPS性能结果1000≤y<10000时Yi=0表示性能级别合格;IOPS性能结果y≥10000时,Yi=+1表示性能级别优;
S13.将测试数据集合分成第一测试数据集合和第二测试数据集合;
S21.构造存储设备各配置参数对应的数据样本特征空间向量;
S22.构造存储设备IOPS性能级别对应的数据样本特征空间向量;
S23.根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
S24.设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别;
根据不同的性能测试场景得到的结果以及存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型:
T={(X1,Y1),(X2,Y2),…,(XN,YN)}
其中:N=1,2,……,表示性能测试的次数;
Xi,i=1,2,……N,表示第i次不同配置组合的特征向量,即由配置x1、x2、x3、x4、x5组成的5维特征向量。如X1=(1,2,3,4,5)表示配置存储RAID0、2块磁盘、3条链路、4个LUN、并发数5;
Yi={+1,0,-1},i=1,2,……N,表示第i次由特征向量Xi对应的测试结果y的标记,Yi=-1表示IOPS性能基本差,Yi=0表示性能级别合格,Yi=+1表示性能级别优;
S31.自动通过第一测试数据集合对朴素贝叶斯算法模型T={(X1,Y1),(X2,Y2),…,(XN,YN)}进行训练;
S32.自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
S33.判断朴素贝叶斯算法模型的准确率是否达到预期;
若否,返回步骤S31;
若是,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型;
S41.获取存储设备的设定配置对应配置参数Xi;
S42.将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
S43.通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率;
P(Yi│Xi)=(P(Xi│Yi)P(Yi))/(P(Xi))=(P(Yi)∏P(xi│Yi))/(P(Xi))
其中:
P(Xi)表示待确定的预测配置自身的概率,是一个常数,此处值为1;
P(Yi)表示每个预测结果Yi的先验概率,根据数据样本中结果可以分别计算得到;
P(Yi│Xi)表示给定的特征向量Xi条件下,要求得的Yi的后验概率,即要求的性能高低的预测结果;
P(Xi│Yi)表示某个结果类别Yi条件下特征向量Xi的概率;
P(xi│Yi)表示某个结果类别Yi条件下特征向量Xi中的特征xi的概率,根据数据样本中的结果可以计算得到;
S41.获取存储设备的设定配置对应配置参数;
S42.将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
S43.通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率;
把特征空间向量T作为可持续学习的数据样本,带入上述的朴素贝叶斯模型预测的IOPS性能级别的预测概率公式中,可以得到求解过程中的判断函数记为:F(X),预测存储设备性能IOPS高低时只用代入存储配置Xi到F(X),得到最大概率的Yi数值,即预测的IOPS性能高低结果。
实施例4:
如图3所示,本发明提供一种基于朴素贝叶斯机器学习模型预测存储设备性能系统,包括:
测试环境创建模块1,用于创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;测试环境创建模块1包括:
测试环境创建单元1.1,用于创建存储设备测试环境;
测试数据集合生成单元1.2,用于设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
测试数据集合分组单元1.3,用于将测试数据集合分成第一测试数据集合和第二测试数据集合;
朴素贝叶斯算法模型搭建模块2,用于构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;朴素贝叶斯算法模型搭建模块2包括:
配置参数数据样本特征空间向量构造单元2.1,用于构造存储设备各配置参数对应的数据样本特征空间向量;
IOPS性能级别数据样本特征空间向量构造单元2.2,用于构造存储设备IOPS性能级别对应的数据样本特征空间向量;
朴素贝叶斯算法模型搭建单元2.3,用于根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
输入输出接口设置单元2.4,用于设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别;
朴素贝叶斯机器学习模型训练模块3,用于自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;朴素贝叶斯机器学习模型训练模块3包括:
模型训练单元3.1,用于自动通过第一测试数据集合对朴素贝叶斯算法模型进行训练;
模型测试单元3.2,用于自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
模型准确率预期单元3.3,用于判断朴素贝叶斯算法模型的准确率是否达到预期;
机器学习模型设定单元3.4,用于朴素贝叶斯算法模型准确率未达到准确率时,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型;
IOPS性能预测模块4,用于输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测;IOPS性能预测模块4包括:
设定配置参数获取单元4.1,用于获取存储设备的设定配置对应配置参数;
设定配置参数输入单元4.2,用于将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
IOPS级别概率预测单元4.3,用于通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于朴素贝叶斯机器学习模型预测存储设备性能方法,其特征在于,包括如下步骤:
S1.创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;
S2.构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;
S3.自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;
S4.输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测。
2.如权利要求1所述的基于朴素贝叶斯机器学习模型预测存储设备性能方法,其特征在于,步骤S1具体步骤如下:
S11.创建存储设备测试环境;
S12.设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
S13.将测试数据集合分成第一测试数据集合和第二测试数据集合。
3.如权利要求2所述的基于朴素贝叶斯机器学习模型预测存储设备性能方法,其特征在于,步骤S2具体步骤如下:
S21.构造存储设备各配置参数对应的数据样本特征空间向量;
S22.构造存储设备IOPS性能级别对应的数据样本特征空间向量;
S23.根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
S24.设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别。
4.如权利要求3所述的基于朴素贝叶斯机器学习模型预测存储设备性能方法,其特征在于,步骤S3具体步骤如下:
S31.自动通过第一测试数据集合对朴素贝叶斯算法模型进行训练;
S32.自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
S33.判断朴素贝叶斯算法模型的准确率是否达到预期;
若否,返回步骤S31;
若是,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型。
5.如权利要求4所述的基于朴素贝叶斯机器学习模型预测存储设备性能方法,其特征在于,步骤S4具体步骤如下:
S41.获取存储设备的设定配置对应配置参数;
S42.将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
S43.通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率。
6.一种基于朴素贝叶斯机器学习模型预测存储设备性能系统,其特征在于,包括:
测试环境创建模块(1),用于创建存储设备测试环境,设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,生成测试数据集合;
朴素贝叶斯算法模型搭建模块(2),用于构造配置信息及IOPS性能值的数据样本特征空间向量,根据数据样本特征空间向量搭建朴素贝叶斯算法模型,并设置数据样本输入输出接口;
朴素贝叶斯机器学习模型训练模块(3),用于自动通过测试数据集合对朴素贝叶斯算法模型反复进行训练及测试,直至朴素贝叶斯算法模型的准确率达到预期,生成朴素贝叶斯机器学习模型;
IOPS性能预测模块(4),用于输入存储设备的配置,通过朴素贝叶斯机器学习模型对输入的存储设备模型对应的IOPS性能进行预测。
7.如权利要求6所述的基于朴素贝叶斯机器学习模型预测存储设备性能系统,其特征在于,测试环境创建模块(1)包括:
测试环境创建单元(1.1),用于创建存储设备测试环境;
测试数据集合生成单元(1.2),用于设置存储设备处于不同配置,并收集不同配置对应的IOPS性能值,设置不同IOPS性能值对应IOPS性能级别,生成测试数据集合;所述存储设备的配置包括RAID级别参数、RAID磁盘数量参数、存储的输出链路数量参数、每个RAID创建LUN数量参数以及测试性能的并发数参数;所述IOPS性能级别包括性能级别差、性能级别合格以及性能级别优;
测试数据集合分组单元(1.3),用于将测试数据集合分成第一测试数据集合和第二测试数据集合。
8.如权利要求7所述的基于朴素贝叶斯机器学习模型预测存储设备性能系统,其特征在于,朴素贝叶斯算法模型搭建模块(2)包括:
配置参数数据样本特征空间向量构造单元(2.1),用于构造存储设备各配置参数对应的数据样本特征空间向量;
IOPS性能级别数据样本特征空间向量构造单元(2.2),用于构造存储设备IOPS性能级别对应的数据样本特征空间向量;
朴素贝叶斯算法模型搭建单元(2.3),用于根据存储设备各配置参数及IOPS性能级别对应的数据样本特征空间向量搭建朴素贝叶斯算法模型;
输入输出接口设置单元(2.4),用于设置数据样本输入接口为存储设备各配置参数,设置数据样本输出接口为存储设备IOPS性能级别。
9.如权利要求8所述的基于朴素贝叶斯机器学习模型预测存储设备性能系统,其特征在于,朴素贝叶斯机器学习模型训练模块(3)包括:
模型训练单元(3.1),用于自动通过第一测试数据集合对朴素贝叶斯算法模型进行训练;
模型测试单元(3.2),用于自动通过第二测试数据集合对经过训练的朴素贝叶斯算法模型进行测试;
模型准确率预期单元(3.3),用于判断朴素贝叶斯算法模型的准确率是否达到预期;
机器学习模型设定单元(3.4),用于朴素贝叶斯算法模型准确率未达到准确率时,设定经过训练的朴素贝叶斯算法模型为朴素贝叶斯机器学习模型。
10.如权利要求9所述的基于朴素贝叶斯机器学习模型预测存储设备性能系统,其特征在于,IOPS性能预测模块(4)包括:
设定配置参数获取单元(4.1),用于获取存储设备的设定配置对应配置参数;
设定配置参数输入单元(4.2),用于将获取的存储设备设定配置参数输入到朴素贝叶斯机器学习模型;
IOPS级别概率预测单元(4.3),用于通过朴素贝叶斯机器学习模型对存储设备处于各IOPS性能级别的概率分别进行预测,输出各IOPS性能级别的预测概率。
CN202010109744.2A 2020-02-22 2020-02-22 基于朴素贝叶斯机器学习模型预测存储设备性能方法系统 Pending CN111352812A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010109744.2A CN111352812A (zh) 2020-02-22 2020-02-22 基于朴素贝叶斯机器学习模型预测存储设备性能方法系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010109744.2A CN111352812A (zh) 2020-02-22 2020-02-22 基于朴素贝叶斯机器学习模型预测存储设备性能方法系统

Publications (1)

Publication Number Publication Date
CN111352812A true CN111352812A (zh) 2020-06-30

Family

ID=71195782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010109744.2A Pending CN111352812A (zh) 2020-02-22 2020-02-22 基于朴素贝叶斯机器学习模型预测存储设备性能方法系统

Country Status (1)

Country Link
CN (1) CN111352812A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463558A (zh) * 2020-11-13 2021-03-09 苏州浪潮智能科技有限公司 一种存储性能参数统计方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062331A (zh) * 2016-11-08 2018-05-22 南京理工大学 基于终生学习的增量式朴素贝叶斯文本分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062331A (zh) * 2016-11-08 2018-05-22 南京理工大学 基于终生学习的增量式朴素贝叶斯文本分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李祥等: "一种基于朴素贝叶斯分类的性能预测方法", 《计算机应用与软件》 *
陈禹等: "基于随机森林和遗传算法的Ceph参数自动调优", 《计算机应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463558A (zh) * 2020-11-13 2021-03-09 苏州浪潮智能科技有限公司 一种存储性能参数统计方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US7035970B1 (en) System and method for determining workload characteristics for one or more applications operating in a data storage environment
US11443194B2 (en) Anomaly detection using a dimensional-reduction model
TWI433035B (zh) 按比例調整指令間隔以識別用於代表性指令追蹤的收集點
CN110471820B (zh) 一种基于循环神经网络的云存储系统磁盘故障预测方法
US20200026502A1 (en) Method and system for determining inefficiencies in a user interface
Duan et al. Guided problem diagnosis through active learning
CN114862656A (zh) 基于多gpu的分布式深度学习模型训练代价的获取方法
WO2022088632A1 (zh) 用户数据监控分析方法、装置、设备及介质
JP7057761B2 (ja) 計算機システム及び情報の提示方法
JP7285977B2 (ja) ニューラルネットワークトレーニング方法、装置、電子機器、媒体及びプログラム製品
US20230252346A1 (en) Machine learning system to predict causal treatment effects of actions performed on websites or applications
CN111352812A (zh) 基于朴素贝叶斯机器学习模型预测存储设备性能方法系统
CN109196458A (zh) 存储系统可用容量计算方法及装置
CN115373879A (zh) 一种面向大规模云数据中心智能运维的磁盘故障预测方法
Jain et al. Know your action set: Learning action relations for reinforcement learning
TW201400842A (zh) 挑選基地台以定位行動裝置之方法及系統
CN105354346A (zh) 一种风电机组参数辨识方法
CN116108697B (zh) 基于多元性能退化的加速试验数据处理方法、装置和设备
CN107133072A (zh) 一种操作执行方法和装置
CN112416746A (zh) 一种测试用例生成方法、装置、设备及介质
CN110413504A (zh) 一种软件测试方法、装置、设备和存储介质
CN110515758A (zh) 一种故障定位方法、装置、计算机设备及存储介质
CN113688202B (zh) 情感极性分析方法、装置、电子设备以及计算机存储介质
Zhou et al. A disk failure prediction method based on active semi-supervised learning
CN111242163B (zh) 一种存储设备性能的预测方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200630

RJ01 Rejection of invention patent application after publication