CN111752481A - 一种基于spd的内存监控及寿命预测方法和系统 - Google Patents

一种基于spd的内存监控及寿命预测方法和系统 Download PDF

Info

Publication number
CN111752481A
CN111752481A CN202010463689.7A CN202010463689A CN111752481A CN 111752481 A CN111752481 A CN 111752481A CN 202010463689 A CN202010463689 A CN 202010463689A CN 111752481 A CN111752481 A CN 111752481A
Authority
CN
China
Prior art keywords
memory bank
information
memory
calculating
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010463689.7A
Other languages
English (en)
Other versions
CN111752481B (zh
Inventor
张芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010463689.7A priority Critical patent/CN111752481B/zh
Publication of CN111752481A publication Critical patent/CN111752481A/zh
Priority to PCT/CN2021/073439 priority patent/WO2021238257A1/zh
Priority to US17/928,118 priority patent/US11714557B2/en
Application granted granted Critical
Publication of CN111752481B publication Critical patent/CN111752481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C16/00Erasable programmable read-only memories
    • G11C16/02Erasable programmable read-only memories electrically programmable
    • G11C16/06Auxiliary circuits, e.g. for writing into memory
    • G11C16/34Determination of programming status, e.g. threshold voltage, overprogramming or underprogramming, retention
    • G11C16/349Arrangements for evaluating degradation, retention or wearout, e.g. by counting erase cycles
    • G11C16/3495Circuits or methods to detect or delay wearout of nonvolatile EPROM or EEPROM memory devices, e.g. by counting numbers of erase or reprogram cycles, by using multiple memory areas serially or cyclically
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
    • G11C7/1051Data output circuits, e.g. read-out amplifiers, data output buffers, data output registers, data output level conversion circuits
    • G11C7/1063Control signal output circuits, e.g. status or busy flags, feedback command signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/22Read-write [R-W] timing or clocking circuits; Read-write [R-W] control signal generators or management 

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提出了一种基于SPD的内存监控及寿命预测方法和系统,该方法获取服务器中每个内存条的参数信息,并给参数信息设置权重;读取每个内存条的配置信息,根据配置信息与参数信息计算内存条参数的占比信息;根据权重和占比信息计算内存条的状态信息;根据服务器中CPU的数量,以及CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。基于该方法,还提出了预测系统。本发明基于SPD的内存监控和寿命预测方法能够提供服务器内存的总健康状态概览,以及剩余寿命预测,可查看各个内存条的参数情况。

Description

一种基于SPD的内存监控及寿命预测方法和系统
技术领域
本发明属于软件开发领域,特别涉及一种基于SPD的内存监控及寿命预测方法和系统。
背景技术
目前,服务器的使用者对内存无论是在容量还是效率上均有较高的需求,一旦内存损坏会造成服务器无法开机或者其他严重的损失,所以对内存的监控和寿命预测的需求早已成为重点需求。
当前可以通过带外BMC界面查看每个内存条的信息概况,也可以通过Linux自带的某些命令进行内存信息的获取;但是这些都是仅能查看服务器器的内存信息概览,无法进行信息的内存健康状态的总结和寿命的预测,也无法自动的进行内存信息的监控和寿命的预测。当前也已经有很多的开发人员做出了内存监控的策略,但很少有人提出详细的监控方法和内存寿命预测方法。
发明内容
本发明提出了一种基于SPD的内存监控及寿命预测方法和系统,能够根据需求进行内存监控和寿命预测。
为了实现上述目的,本发明提出了一种基于SPD的内存监控及寿命预测方法和系统,该方法包括以下步骤:
获取服务器中每个内存条的参数信息,并给参数信息设置权重;
读取服务器中每个内存条的配置信息,根据配置信息与参数信息计算每个内存条参数的占比信息;根据权重和占比信息计算每个内存条的状态信息;
根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,并对状态值进行分级;
根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。
进一步的,所述方法还包括设置待执行时间,进行定时执行监控和内存条寿命预测;
设置cron表达式,进行周期执行监控和内存条寿命预测。
进一步的,所述服务器中每个内存条的参数信息包括:擦写速度vi、、存取数据延迟时间ti、运行时最大频率fi、运行时平均温度tei和平均电压voi
进一步的,所述根据配置信息与参数信息计算每个内存条参数的占比信息的公式为:
Figure BDA0002511925160000021
其中,rvi为擦写速度的占比信息;rti为存取数据延迟时间的占比信息;rfi为运行时最大频率的占比信息;rtei为运行时平均温度的占比信息;rvoi为平均电压的占比信息;Vi为内存条的配置信息擦写速度;Ti为内存条的配置信息存取数据的延迟时间;Fi为内存条的配置信息运行的最大频率;TEi为内存条的配置信息运行时平均温度;VOi内存条的配置信息运行时平均电压。
进一步的,所述根据权重和占比信息计算每个内存条的状态信息的公式为:每个内存条的状态信息si=ωv*rvit*rtif*rfite*rteivo*rvoi;其中ωv为擦写速度的权重;ωt为存取数据延迟时间的权重;ωf为运行时最大频率的权重;ωte为运行时平均温度的权重;ωvo为运行时平均电压的权重。
进一步的,所述根据影响因子和状态信息计算最终内存状态值的公式为:所述内存状态
Figure BDA0002511925160000022
其中,ωi为影响因子;εi表示均值为0,方差为0.1的随机误差;c为常数项。
进一步的,所述根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命的方法为:
对每个内存条对应的离散数据,进行数据的插值和分段最小二乘拟合,得到每个内存条对应的误差平方和最小的拟合函数f(si,td);
令si趋于0,获得预测的内存条的总寿命,进而获得内存条剩余寿命TLi
本发明还提出了一种基于SPD的内存监控及寿命预测系统,包括获取设置模块、读取计算模块、确定计算模块和拟合计算模块;
所述获取设置模块用于获取服务器中每个内存条的参数信息,并给参数信息设置权重;
所述读取计算模块用于读取服务器中每个内存条的配置信息,根据配置信息与参数信息计算每个内存条参数的占比信息;根据权重和占比信息计算每个内存条的状态信息;
所述确定计算模块用于根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,并对状态值进行分级;
所述拟合计算模块用于根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。
进一步的,所述系统还包括执行模块;
所述执行模块用于设置待执行时间,进行定时执行监控和内存条寿命预测;或者设置cron表达式,进行周期执行监控和内存条寿命预测。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明实施例提出了一种基于SPD的内存监控及寿命预测方法和系统,该方法包括以下步骤:获取服务器中每个内存条的参数信息,并给参数信息设置权重;读取服务器中每个内存条的配置信息,根据配置信息与参数信息计算每个内存条参数的占比信息;根据权重和占比信息计算每个内存条的状态信息;根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,并对状态值进行分级;根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。方法还包括设置待执行时间,进行定时执行监控和内存条寿命预测;设置cron表达式,进行周期执行监控和内存条寿命预测。基于本发明提出的一种基于SPD的内存监控及寿命预测方法,本发明还提出了一种基于SPD的内存监控及寿命预测系统。本发明基于SPD的内存监控和寿命预测方法能够提供服务器内存的总健康状态概览,以及剩余寿命预测,可查看各个内存条的参数情况。可根据需要即时、定时或周期性动态监测内存使用情况和健康状态,可根据健康状态或剩余寿命提前预防内存故障的发生,也可在内存故障后根据生成的日志进行内存问题检查,定位是哪个内存条的故障及故障原因。
附图说明
如图1给出了基于本发明实施例1提出的一种基于SPD的内存监控及寿命预测方法流程图;
如图2给出了基于本发明实施例1提出的一种基于SPD的内存监控及寿命预测系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例1
本发明提出了一种基于SPD的内存监控及寿命预测方法和系统,其中SPD(SerialPresence Detect)串行存在检测,是一组关于内存模组的配置信息。如图1给出了基于本发明实施例1提出的一种基于SPD的内存监控及寿命预测方法流程图。
在步骤S101中,开始处理该流程;
在步骤S102中,获取服务器中每个内存条的参数信息,并给参数信息设置权重;其中,服务器中每个内存条的参数信息包括:擦写速度vi、存取数据延迟时间ti、运行时最大频率fi、运行时平均温度tei和平均电压voi。其中表示i为内存条的编号。基于行业的使用经验,对内存的每个参数信息设置经验值权重,在本发明实施例1中,设置ωv=0.3,ωt=0.3,ωf=0.2,ωte=0.1,ωvo=0.1,其中ωv为擦写速度的权重;ωt为存取数据延迟时间的权重;ωf为运行时最大频率的权重;ωte为运行时平均温度的权重;ωvo为运行时平均电压的权重。本技术方案中保护的范围,不局限于实施例1中。
在步骤S103中,基于内存SPD,读取各个内存条对应的配置信息,其中,Vi为内存条的配置信息擦写速度;Ti为内存条的配置信息存取数据的延迟时间;Fi为内存条的配置信息运行的最大频率;TEi为内存条的配置信息运行时平均温度;VOi内存条的配置信息运行时平均电压。
根据配置信息与参数信息计算每个内存条参数的占比信息的公式为:
Figure BDA0002511925160000051
其中,rvi为擦写速度的占比信息;rti为存取数据延迟时间的占比信息;rfi为运行时最大频率的占比信息;rtei为运行时平均温度的占比信息;rvoi为平均电压的占比信息。
根据权重和占比信息计算每个内存条的状态信息;每个内存条的状态信息si=ωv*rvit*rtif*rfite*rteivo*rvoi
在步骤S104中,根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子。一个服务器中存在多个cpu,每个cpu均可管控多根内存条,插在不位置的插槽上。在此根据当前服务器中总的cpu个数,内存条所受管控的cpu,以及内存的插槽位置确定每根内存条的影响因子ωi
根据影响因子和状态信息计算最终内存状态值,内存状态
Figure BDA0002511925160000061
Figure BDA0002511925160000062
εi表示均值为0,方差为0.1的随机误差;c为常数项。在本发明实施例1中c设为0.05。
在步骤S105中,根据预设的分段函数将内存状态S进行分级处理,展示出对应的健康状态:
Figure BDA0002511925160000063
在步骤S106中,根据内存条已使用时间td和内存状态si计算出剩余寿命Ti。不同的内存条的离散数据不同,通过观察每一根内存条对应的离散数据的分布首先对其进行Henmiter插值,得到更多样本的数据,以便于后续使用,考虑到内存使用的衰减速度,进行分段最小二乘拟合,此拟合方式能够得到误差平方和最小的拟合函数f(si,td),令si趋于0,能够获得预测的内存条的总寿命,进而获得内存条剩余寿命TLi
在步骤S107中,设置是否即时执行监控和寿命预测,如果需要定时执行,输入待执行时间,如果需要周期执行,输入cron表达式。
在步骤S108中,输出最终的内存监控信息、健康状态结果、剩余寿命预测TLi
在步骤S109中,将每次监控的结果存成日志,保存本地或转发至专门的日志服务器,便于统计和查看。
在步骤S110中,整个流程结束。
本发明还提出了一种基于SPD的内存监控及寿命预测系统,该系统包括获取设置模块、读取计算模块、确定计算模块和拟合计算模块。
获取设置模块用于获取服务器中每个内存条的参数信息,并给参数信息设置权重。服务器中每个内存条的参数信息包括:擦写速度vi、存取数据延迟时间ti、运行时最大频率fi、运行时平均温度tei和平均电压voi。其中表示i为内存条的编号。基于行业的使用经验,对内存的每个参数信息设置经验值权重。
读取计算模块用于读取服务器中每个内存条的配置信息,根据配置信息与参数信息计算每个内存条参数的占比信息;根据权重和占比信息计算每个内存条的状态信息;其中,Vi为内存条的配置信息擦写速度;Ti为内存条的配置信息存取数据的延迟时间;Fi为内存条的配置信息运行的最大频率;TEi为内存条的配置信息运行时平均温度;VOi内存条的配置信息运行时平均电压。
根据配置信息与参数信息计算每个内存条参数的占比信息的公式为:
Figure BDA0002511925160000071
其中,rvi为擦写速度的占比信息;rti为存取数据延迟时间的占比信息;rfi为运行时最大频率的占比信息;rtei为运行时平均温度的占比信息;rvoi为平均电压的占比信息。
根据权重和占比信息计算每个内存条的状态信息;每个内存条的状态信息si=ωv*rvit*rtif*rfite*rteivo*rvoi
确定计算模块用于根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,并对状态值进行分级。根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子。一个服务器中存在多个cpu,每个cpu均可管控多根内存条,插在不位置的插槽上。在此根据当前服务器中总的cpu个数,内存条所受管控的cpu,以及内存的插槽位置确定每根内存条的影响因子ωi
根据影响因子和状态信息计算最终内存状态值,内存状态
Figure BDA0002511925160000081
Figure BDA0002511925160000082
εi表示均值为0,方差为0.1的随机误差;c为常数项。在本发明实施例1中c设为0.05。
根据预设的分段函数将内存状态S进行分级处理,展示出对应的健康状态:
Figure BDA0002511925160000083
拟合计算模块用于根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。根据内存条已使用时间td和内存状态si计算出剩余寿命Ti。不同的内存条的离散数据不同,通过观察每一根内存条对应的离散数据的分布首先对其进行Henmiter插值,得到更多样本的数据,以便于后续使用,考虑到内存使用的衰减速度,进行分段最小二乘拟合,此拟合方式能够得到误差平方和最小的拟合函数f(si,td),令si趋于0,能够获得预测的内存条的总寿命,进而获得内存条剩余寿命TLi
系统还包括执行模块;执行模块用于设置待执行时间,进行定时执行监控和内存条寿命预测;或者设置cron表达式,进行周期执行监控和内存条寿命预测。
以上内容仅仅是对本发明的结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (9)

1.一种基于SPD的内存监控及寿命预测方法,其特征在于,包括以下步骤:
获取服务器中每个内存条的参数信息,并给参数信息设置权重;
读取服务器中每个内存条的配置信息,根据配置信息与参数信息计算每个内存条参数的占比信息;根据权重和占比信息计算每个内存条的状态信息;
根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,并对状态值进行分级;
根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。
2.根据权利要求1所述的一种基于SPD的内存监控及寿命预测方法,其特征在于,所述方法还包括:
设置待执行时间,进行定时执行监控和内存条寿命预测;
设置cron表达式,进行周期执行监控和内存条寿命预测。
3.根据权利要求1所述的一种基于SPD的内存监控及寿命预测方法,其特征在于,所述服务器中每个内存条的参数信息包括:擦写速度vi、、存取数据延迟时间ti、运行时最大频率fi、运行时平均温度tei和平均电压voi;其中表示i为内存条的编号。
4.根据权利要去3所述的一种基于SPD的内存监控及寿命预测方法,其特征在于,所述根据配置信息与参数信息计算每个内存条参数的占比信息的公式为:
Figure FDA0002511925150000021
其中,rvi为擦写速度的占比信息;rti为存取数据延迟时间的占比信息;rfi为运行时最大频率的占比信息;rtei为运行时平均温度的占比信息;rvoi为平均电压的占比信息;Vi为内存条的配置信息擦写速度;Ti为内存条的配置信息存取数据的延迟时间;Fi为内存条的配置信息运行的最大频率;TEi为内存条的配置信息运行时平均温度;VOi内存条的配置信息运行时平均电压。
5.根据权利要求4所述的一种基于SPD的内存监控及寿命预测方法,其特征在于,所述根据权重和占比信息计算每个内存条的状态信息的公式为:每个内存条的状态信息si=ωv*rvit*rtif*rfite*rteivo*rvoi
其中ωv为擦写速度的权重;ωt为存取数据延迟时间的权重;ωf为运行时最大频率的权重;ωte为运行时平均温度的权重;ωvo为运行时平均电压的权重。
6.根据权利要求5所述的一种基于SPD的内存监控及寿命预测方法,其特征在于,所述根据影响因子和状态信息计算最终内存状态值的公式为:所述内存状态
Figure FDA0002511925150000022
其中,ωi为影响因子;εi表示均值为0,方差为0.1的随机误差;c为常数项。
7.根据权利要求6所述的一种基于SPD的内存监控及寿命预测方法,其特征在于,所述根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命的方法为:
对每个内存条对应的离散数据,进行数据的插值和分段最小二乘拟合,得到每个内存条对应的误差平方和最小的拟合函数f(si,td);
令si趋于0,获得预测的内存条的总寿命,进而获得内存条剩余寿命TLi
8.一种基于SPD的内存监控及寿命预测系统,其特征在于,包括获取设置模块、读取计算模块、确定计算模块和拟合计算模块;
所述获取设置模块用于获取服务器中每个内存条的参数信息,并给参数信息设置权重;
所述读取计算模块用于读取服务器中每个内存条的配置信息,根据配置信息与参数信息计算每个内存条参数的占比信息;根据权重和占比信息计算每个内存条的状态信息;
所述确定计算模块用于根据服务器中CPU的数量,以及每个CPU中内存条的个数及位置,确定影响因子;根据影响因子和状态信息计算最终内存状态值,并对状态值进行分级;
所述拟合计算模块用于根据每个内存条已使用时间和状态信息,采用最小二乘法分段拟合的方式计算每个内存条的剩余寿命。
9.根据权利要求8所述的一种基于SPD的内存监控及寿命预测系统,其特征在于,所述系统还包括执行模块;
所述执行模块用于设置待执行时间,进行定时执行监控和内存条寿命预测;或者设置cron表达式,进行周期执行监控和内存条寿命预测。
CN202010463689.7A 2020-05-27 2020-05-27 一种基于spd的内存监控及寿命预测方法和系统 Active CN111752481B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010463689.7A CN111752481B (zh) 2020-05-27 2020-05-27 一种基于spd的内存监控及寿命预测方法和系统
PCT/CN2021/073439 WO2021238257A1 (zh) 2020-05-27 2021-01-23 一种基于spd的内存监控及寿命预测方法和系统
US17/928,118 US11714557B2 (en) 2020-05-27 2021-01-23 SPD-based memory monitoring and service life prediction method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010463689.7A CN111752481B (zh) 2020-05-27 2020-05-27 一种基于spd的内存监控及寿命预测方法和系统

Publications (2)

Publication Number Publication Date
CN111752481A true CN111752481A (zh) 2020-10-09
CN111752481B CN111752481B (zh) 2022-08-02

Family

ID=72674028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010463689.7A Active CN111752481B (zh) 2020-05-27 2020-05-27 一种基于spd的内存监控及寿命预测方法和系统

Country Status (3)

Country Link
US (1) US11714557B2 (zh)
CN (1) CN111752481B (zh)
WO (1) WO2021238257A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463565A (zh) * 2020-11-30 2021-03-09 苏州浪潮智能科技有限公司 一种服务器寿命预测方法及相关设备
WO2021238257A1 (zh) * 2020-05-27 2021-12-02 苏州浪潮智能科技有限公司 一种基于spd的内存监控及寿命预测方法和系统
CN117407264A (zh) * 2023-12-13 2024-01-16 苏州元脑智能科技有限公司 内存老化剩余时间的预测方法、装置、计算机设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727556A (zh) * 2019-09-21 2020-01-24 苏州浪潮智能科技有限公司 一种bmc健康状态监控方法、系统、终端及存储介质
CN110781027A (zh) * 2019-10-29 2020-02-11 苏州浪潮智能科技有限公司 内存ecc报错阈值的确定方法、确定装置及确定设备
CN111198764A (zh) * 2019-12-31 2020-05-26 江苏省未来网络创新研究院 一种基于sdn的负载均衡实现系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778077B2 (en) * 2006-05-15 2010-08-17 Sandisk Corporation Non-volatile memory system with end of life calculation
US20170131947A1 (en) 2015-11-06 2017-05-11 Pho Hoang Data and collection methods to analyze life acceleration of SSD with real usages
CN109032807A (zh) 2018-08-08 2018-12-18 郑州云海信息技术有限公司 一种批量监控内存状态及限制内存功耗的方法及系统
CN111752481B (zh) 2020-05-27 2022-08-02 苏州浪潮智能科技有限公司 一种基于spd的内存监控及寿命预测方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727556A (zh) * 2019-09-21 2020-01-24 苏州浪潮智能科技有限公司 一种bmc健康状态监控方法、系统、终端及存储介质
CN110781027A (zh) * 2019-10-29 2020-02-11 苏州浪潮智能科技有限公司 内存ecc报错阈值的确定方法、确定装置及确定设备
CN111198764A (zh) * 2019-12-31 2020-05-26 江苏省未来网络创新研究院 一种基于sdn的负载均衡实现系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021238257A1 (zh) * 2020-05-27 2021-12-02 苏州浪潮智能科技有限公司 一种基于spd的内存监控及寿命预测方法和系统
US11714557B2 (en) 2020-05-27 2023-08-01 Inspur Suzhou Intelligent Technology Co., Ltd. SPD-based memory monitoring and service life prediction method and system
CN112463565A (zh) * 2020-11-30 2021-03-09 苏州浪潮智能科技有限公司 一种服务器寿命预测方法及相关设备
CN117407264A (zh) * 2023-12-13 2024-01-16 苏州元脑智能科技有限公司 内存老化剩余时间的预测方法、装置、计算机设备及介质
CN117407264B (zh) * 2023-12-13 2024-02-23 苏州元脑智能科技有限公司 内存老化剩余时间的预测方法、装置、计算机设备及介质

Also Published As

Publication number Publication date
WO2021238257A1 (zh) 2021-12-02
CN111752481B (zh) 2022-08-02
US20230195322A1 (en) 2023-06-22
US11714557B2 (en) 2023-08-01

Similar Documents

Publication Publication Date Title
CN111752481B (zh) 一种基于spd的内存监控及寿命预测方法和系统
CN108923952B (zh) 基于服务监控指标的故障诊断方法、设备及存储介质
US9280436B2 (en) Modeling a computing entity
CN109376139A (zh) 数据库集中监控方法、计算机装置及存储介质
CN106776288B (zh) 一种基于Hadoop的分布式系统的健康度量方法
CN110262959B (zh) 底层服务压力测试方法、装置、电子设备及存储介质
CN109933504B (zh) 一种硬盘延迟测试方法、装置、终端及存储介质
CN113411269B (zh) 限流控制方法、限流控制装置、存储介质及电子设备
CN110633893A (zh) 一种策略效能监控方法、装置以及计算机设备
CN106021054A (zh) 一种对bmc升降级稳定性进行测试的方法及装置
US20190369165A1 (en) Management device, management method, and non-transitory storage medium
CN112381272A (zh) 一种电网负荷预测方法、系统、终端及存储介质
CN116125300A (zh) 一种电池包异常监测方法、装置、电子设备及存储介质
US8214693B2 (en) Damaged software system detection
CN113946983A (zh) 产品可靠性薄弱环节评估方法、装置和计算机设备
US20210397508A1 (en) Localization of potential issues to objects
CN114021302A (zh) 输电线路的寿命评估方法、装置、系统及存储介质
CN113032999A (zh) 医疗设备使用寿命的预测方法及装置
CN112395167A (zh) 一种作业故障预测方法、装置及电子设备
CN116719480B (zh) 一种基于数据孪生的电能表数据存储方法、装置及介质
US8780471B2 (en) Linking errors to particular tapes or particular tape drives
CN112306823B (zh) 磁盘管理方法、系统、设备及计算机可读存储介质
CN115511123A (zh) 一种备品备件数量的确定方法、装置及介质
CN115221066A (zh) 基于版本的代码测试方法、装置、计算机设备及存储介质
CN117130861A (zh) 性能数据处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant