CN116755978A - 内存运行状态评估方法、电子设备及可读存储介质 - Google Patents
内存运行状态评估方法、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN116755978A CN116755978A CN202311052424.8A CN202311052424A CN116755978A CN 116755978 A CN116755978 A CN 116755978A CN 202311052424 A CN202311052424 A CN 202311052424A CN 116755978 A CN116755978 A CN 116755978A
- Authority
- CN
- China
- Prior art keywords
- memory
- data
- safety
- performance
- security
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015654 memory Effects 0.000 title claims abstract description 277
- 238000011156 evaluation Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 62
- 231100000279 safety data Toxicity 0.000 claims abstract description 30
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000012544 monitoring process Methods 0.000 claims abstract description 17
- 238000011234 economic evaluation Methods 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 2
- 238000012423 maintenance Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000011217 control strategy Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请公开了内存运行状态评估方法、电子设备及可读存储介质。该方法包括:利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估。通过上述方式,能够综合考虑内存的安全性和性能,全面评估内存的风险等级,准确度更高。
Description
技术领域
本申请涉及存储技术领域,特别是涉及内存运行状态评估方法、电子设备及可读存储介质。
背景技术
从1946年首台计算机出现至今,计算机系统一直采用存储指令的冯.诺依曼结构。在冯·诺依曼结构下,指令作为数据存储在内存中,处理器从内存中获取指令并逐条译码执行。进入后CMOS(Complementary Metal Oxide Semiconductor,互补金属氧化物半导体)时代后,由于芯片中晶体管密度持续增加,芯片老化和放射性引发单粒子翻转(singleevent updates,SEU)等内存软故障(soft error)的情况日益增多,容易导致存储指令的内存出现故障,极可能引发严重的逻辑错误,给计算机用户带来灾难性后果。
为增加计算机系统中内存的可靠性,硬件设计者目前一般采用奇偶校验、ECC纠错、Chipkill技术来提高计算机系统对内存单位错、多位错的查错和纠错能力。但是,由于ECC较验和Chipkill技术对计算机性能的影响较大并且其技术实现代价昂贵,这些先进的硬件纠容错技术目前主要应用于高档服务器系统中;另一方面,即便是采用上述纠错方法,硬件内存故障仍然是无法完全避免的,目前大量商用计算机系统中硬件内存故障仍然是影响系统可靠运行的主要因素。
因此,需要更合理全面的内存运行状态评估方法,对内存进行全方面的监控,达到运行风险可控的功能目的。
发明内容
本申请提供了内存运行状态评估方法、电子设备及可读存储介质,能够综合考虑内存的安全性和性能,全面评估内存的风险等级,准确度更高。
第一方面,本申请提供一种内存运行状态评估方法,该方法包括:利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估。
其中,将安全数据输入至安全失效模型,得到安全评分,包括:结合大数据与历史数据构建与目标内存对应的安全失效模型;将安全数据输入至安全失效模型,得到安全评分。
其中,结合大数据与历史数据构建与目标内存对应的安全失效模型,包括:利用大数据平台查询与目标内存同类型的内存的运行参数,构建内存数据库;记录目标内存历史运行过程的所有运行参数,作为历史数据;利用内存数据库和历史数据构建与目标内存对应的安全失效模型。
其中,将安全数据输入至安全失效模型,得到安全评分,包括:利用安全失效模型确定目标内存当前的安全数据对应的失效概率,并将失效概率与概率平均值的比值作为安全评分。
其中,概率平均值采用以下方式计算得到:筛选内存数据库中存在安全故障的典型案例;利用安全失效模型分别计算每个典型案例中与目标内存同使用时长前提下的失效概率,并求取概率平均值。
其中,利用内存数据库和历史数据构建与目标内存对应的安全失效模型,包括:收集内存数据库中存在安全故障的典型案例中的安全数据作为样本数据;提取样本数据中内存的使用时长数据,并将各个典型案例中的使用时长及其对应的安全数据进行时间同步;获取样本数据中的平均故障率,以及样本数据中的多样本间差异的标准偏差,构建安全失效模型,其中安全失效模型用于计算内存的安全失效概率。
其中,在样本数据中,内存发生安全失效故障的总数服从以下公式:
;
安全失效模型的安全失效概率采用以下公式得到:
;/>表示安全失效概率,/>表示内存出现安全失效的数量,/>表示样本数据中的平均故障率,/>表示样本数据中的多样本间差异的标准偏差,/>表示内存的累计使用时长;/>表示/>的阶乘。
其中,将性能数据输入至性能失效模型,得到性能评分,包括:结合大数据与历史数据构建与目标内存对应的性能失效模型;将性能数据输入至性能失效模型,得到性能评分。
第二方面,本申请提供一种电子设备,该电子设备包括处理器以及与处理器耦接的存储器;其中,存储器用于存储计算机程序,处理器用于执行计算机程序,以实现如第一方面提供的方法。
第三方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序在被处理器执行时,实现如第一方面提供的方法。
本申请的有益效果是:区别于现有技术的情况,本申请提供的内存运行状态评估方法、电子设备及可读存储介质,通过利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估的方式,能够综合考虑内存的安全性和性能,全面评估内存的风险等级,准确度更高;基于大数据的内存运行参数数据,能够建立更加准确的模型,进而提高评估结果的精度,能够在内存的整个使用寿命中进行动态评估,及时发现潜在的风险,减少意外事故的发生。通过设计不同等级的评估结果及设定可接受风险准则,能够根据评估结果,对内存进行有效的维护和管理,降低维护成本和经济损失,优化内存的使用策略、控制策略及更换维护策略,提高内存的使用效率和使用寿命。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请提供的内存运行状态评估方法一实施例的流程示意图;
图2是本申请提供的内存运行状态评估方法另一实施例的流程示意图;
图3是本申请提供的步骤23一实施例的流程示意图;
图4是本申请提供的步骤233示意图;
图5是本申请提供的电子设备一实施例的结构示意图;
图6是本申请提供的电子设备另一实施例的结构示意图;
图7是本申请提供的计算机可读存储介质一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
计算机系统中内存硬件纠错机制仍然无法避免的内存故障统称为“硬件不可恢复内存故障”。硬件不可恢复内存故障对计算机系统产生的影响表现为两类:一类为同步感知故障(一类故障),即可被同步感知到的机器异常(Exception)。例如,当内存出现奇偶校验错误时,会引发一个不可屏蔽中断(NMI,Non-Maskable Interrupt),将一个机器检测故障(MCE,Machine Check Error)报告给操作系统进行处理;另一类是异步感知故障,即异步的硬件不可见故障(二类故障)。例如,在奇偶校验等硬件纠错机制无法处理甚至无法感知到的内存故障发生时,由于硬件不具备发现内存故障的能力,因此不会报告异常,但是内存中的数据已经发生了改变,处理器会取得被修改后的指令执行,运行将会持续、直到产生可见的逻辑错误:如非法指令或是内存地址访问异常,此时计算机才会获得错误的提示。这种硬件故障引发的程序错误,因和果是异步的,因此隐蔽性很强。操作系统内核代码是计算机系统中运行频度最高的代码之一,内核代码出现错误将会影响到整个系统的正常运行,由于硬件不可恢复的内存故障的存在,直接对操作系统内核代码运行产生影响,影响计算机系统的稳定性和可靠性。因此,需要更合理全面的内存运行状态评估方法,对内存进行全方面的监控,达到运行风险可控的功能目的。基于此,本申请提出以下任一技术方案进行内存运行状态评估。
参阅图1,图1是本申请提供的内存运行状态评估方法一实施例的流程示意图。该方法包括:
步骤11:利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数。
存储器状态监控系统是一种用于监测、控制和保护内存的设备或软件系统。存储器状态监控系统可以对内存的容量、工作电压、温度、tCK时钟周期、CAS延迟、SPD芯片、内存线数、ECC校验、总线频率、数据带宽、粒子翻转、中断信号等运行参数进行实时监测和控制,从而提高内存的可靠性、安全性和使用寿命。
在一些实施例中,数据中心可以设置至少一个内存。如,设置容量为第一容量的一个内存。又如,设置多个容量为第二容量的内存。其中,第二容量小于第一容量。
即存储器状态监控系统可以获取每一内存的运行过程中的运行参数。如,数据中心可以设置有内存A、内存B和内存C。存储器状态监控系统可以分别获取内存A的运行过程中的运行参数、内存B的运行过程中的运行参数和内存C的运行过程中的运行参数。
在一些实施例中,目标内存运行过程中的运行参数可以包括容量、工作电压、温度、tCK时钟周期、CAS延迟、SPD芯片、内存线数、ECC校验、总线频率以及数据带宽、短路、数据读取异常次数、存储单元的擦除次数中的至少一种。
步骤12:对运行参数中的参数数据进行分类,划分为安全数据与性能数据。
根据运行参数的性质和用途,可以将其划分为安全数据和性能数据。
安全数据主要与内存的安全性相关,包括内存内部短路、断路、电子元器件被击穿失效、存储单元的擦除次数等情况。这些数据对于内存的安全性非常关键,如果内存出现这些情况,可能会导致内存损坏,造成数据中心异常。
性能数据主要与内存的性能相关,包括容量、工作电压、温度、tCK时钟周期、CAS延迟、SPD芯片、内存线数、ECC校验、总线频率以及数据带宽等参数。这些数据对于内存的性能表现非常重要,能够反映内存的使用寿命、可靠性、稳定性等方面。
步骤13:将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分。
在一些实施例中,安全失效模型可以基于大数据和目标内存的历史数据进行构建。性能失效模型可以基于大数据和目标内存的历史数据进行构建。
可以理解,因每一内存均可以构建一个对应的安全失效模型和性能失效模型。利用各自对应的安全失效模型和性能失效模型进行评分,得到相应的安全评分和性能评分。
步骤14:综合安全评分与性能评分确定目标内存的风险等级。
在一些实施例中,可以分别确定出安全评分对应的安全级别和以及性能评分对应的性能级别,然后加权求和,得到最终的风险等级。
在一应用场景中,考虑到安全的重要性高于性能的重要性,因此,可以将安全级别对应的权重设置为大于性能级别对应的权重。以此使得风险等级更加倾向于内存的安全性。
在一些实施例中,若安全评分对应的安全级别高于预设级别,则可以直接将内存的风险等级确定为最高等级。可以理解,在安全级别高于预设级别时,内存存在较高的安全性问题,需要及时进行处理。
步骤15:根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估。
在一些实施例中,根据风险等级与用户需求设定内存的可接受风险准则。如依据可接受风险准则对目标内存进行实时监测。根据实时监测结果判定是否需要对目标内存进行维护更换。
具体地,获取目标内存的成本参数,对目标内存维护更换进行经济性评估。如。获取目标内存的购买成本、使用成本及残值成本,计算当前风险等级下目标内存的综合成本。将目标内存的购买成本按照其使用寿命分摊到每个计费周期,计算出目标内存每个周期的折旧值。获取更换目标内存的成本、人工成本和维护成本,计算更换目标内存的平均年化成本,并与目标内存成本进行比较,选择最优维护更换方案。
在一些实施例中,因数据中心中存在多个内存,可以根据每一内存的风险等级进行综合的经济性评估。
在一些实施例中,若单个内存的风险等级较高,则数据中心停止对该内存的使用,利用其余内存辅助,以完成数据中心对内存的使用要求。在数据中心暂停使用时,进行内存更换提醒。
在一些实施例中,若多个内存的风险等级较高,且多个内存的已经影响数据中心的使用要求,则数据中心暂停使用时,进行内存更换提醒。
在本实施例中,通过利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估的方式,能够综合考虑内存的安全性和性能,全面评估内存的风险等级,准确度更高;基于大数据的内存运行参数数据,能够建立更加准确的模型,进而提高评估结果的精度,能够在内存的整个使用寿命中进行动态评估,及时发现潜在的风险,减少意外事故的发生。通过设计不同等级的评估结果及设定可接受风险准则,能够根据评估结果,对内存进行有效的维护和管理,降低维护成本和经济损失,优化内存的使用策略、控制策略及更换维护策略,提高内存的使用效率和使用寿命。
参阅图2,图2是本申请提供的内存运行状态评估方法另一实施例的流程示意图。该方法包括:
步骤21:利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数。
步骤22:对运行参数中的参数数据进行分类,划分为安全数据与性能数据。
步骤21至步骤22与本申请的其余实施例具有相同或相似的技术方案,这里不做赘述。
步骤23:结合大数据与历史数据构建与目标内存对应的安全失效模型。
在一些实施例中,可以结合大数据和目标内存的历史数据构建与目标内存对应的安全失效模型。目标内存的历史数据可以是当前运行过程中之前的运行参数。基于此,实质安全失效模型不是固定不变的,会随着目标内存的历史数据的增加进行改变。因此,安全失效模型会更加符合目标内存的当前状态。
在一些实施例中,参阅图3,步骤23可以是以下流程:
步骤231:利用大数据平台查询与目标内存同类型的内存的运行参数,构建内存数据库。
同类型的内存因具有相似的特征,所以可以利用同类型的内存的运行参数,构建内存数据库。
在一些实施例中,还可以同步获取相似类型的内存的运行参数,作为辅助数据,一同构建内存数据库。其中,用于辅助数据的相似类型的内存的运行参数的所占权重小于同类型的内存的运行参数的所占权重。
步骤232:记录目标内存历史运行过程的所有运行参数,作为历史数据。
在一些实施例中,目标内存的历史运行过程中的运行参数同样可以从大数据平台查询进行查询得到。在一应用场景中,提供一搜索界面,通过在搜索界面进行相应数据的输入,按照输入的数据从大数据平台查询得到对应的数据。如,输入目标内存的唯一标识,则可以从大数据平台查询得到目标内存历史运行过程的所有运行参数。输入目标内存的类型,则可以从大数据平台查询得到同类型的内存的运行参数。
步骤233:利用内存数据库和历史数据构建与目标内存对应的安全失效模型。
在一些实施例中,参阅图4,步骤233可以是以下流程:
步骤2331:收集内存数据库中存在安全故障的典型案例中的安全数据作为样本数据。
存在安全故障的典型案例可以通过故障事件标记确定。如数据库中的同类型的内存的运行参数对应有时长,以及该运行参数也被标记了故障事件标记。即标记了故障事件标记的运行参数,表明该内存在出现该运行参数时,发生了安全故障。以此可以通过查询故障事件标记快速确定出存在安全故障的典型案例中的安全数据。将其作为样本数据。
其中,在样本数据中,内存发生安全失效故障的总数服从以下公式:
。其中,/>表示安全失效概率,/>表示内存出现安全失效的数量,/>表示内存的累计使用时长;/>表示/>的阶乘。
步骤2332:提取样本数据中内存的使用时长数据,并将各个典型案例中的使用时长及其对应的安全数据进行时间同步。
通过将各个典型案例中的使用时长及其对应的安全数据进行时间同步,以使各个典型案例之间具有可比性。
步骤2333:获取样本数据中的平均故障率,以及样本数据中的多样本间差异的标准偏差,构建安全失效模型。
其中安全失效模型用于计算内存的安全失效概率。
其中,安全失效模型的安全失效概率采用以下公式得到:;/>表示安全失效概率,/>表示内存出现安全失效的数量,/>表示样本数据中的平均故障率,/>表示样本数据中的多样本间差异的标准偏差,/>表示内存的累计使用时长。
步骤24:将安全数据输入至安全失效模型,得到安全评分。
利用安全失效模型确定目标内存当前的安全数据对应的失效概率,并将失效概率与概率平均值的比值作为安全评分。
其中,概率平均值采用以下方式计算得到:
首先,筛选内存数据库中存在安全故障的典型案例。存在安全故障的典型案例可以通过故障事件标记确定。如数据库中的同类型的内存的运行参数对应有时长,以及该运行参数也被标记了故障事件标记。即标记了故障事件标记的运行参数,表明该内存在出现该运行参数时,发生了安全故障。
利用安全失效模型分别计算每个典型案例中与目标内存同使用时长前提下的失效概率,并求取概率平均值。
步骤25:结合大数据与历史数据构建与目标内存对应的性能失效模型。
在一些实施例中,利用大数据平台查询与目标内存同类型的内存的运行参数,构建内存数据库。从内存数据库中区分出性能数据。以及从目标内存中分类出性能数据。
如设定若干等距的时间节点,对内存数据库中的每组性能数据中目标内存的使用时长进行计算与划分,确定每个时间节点内存数据库各自的性能参数。
选取内存数据库和历史数据中90%的性能数据作为训练数据集,选取内存数据库和历史数据中剩余10%的性能数据作为测试数据集。其中,用于训练的性能数据既包括性能失效的性能数据,也包括性能未失效的性能数据。
利用训练数据集并构建性能失效模型,并利用测数据集对性能失效模型进行测试。结合目标内存的历史数据进行性能失效模型的构建,能够使性能失效模型能加符合目标内存所要表征的相关特性。
步骤26:将性能数据输入至性能失效模型,得到性能评分。
在性能失效模型构建后,可以直接将目标内存的当前性能数据输入至性能失效模型,得到性能评分。
在一些实施例中,性能失效模型构建之后,可以利用新的历史数据对性能失效模型进行辅助训练。如,将目标内存的当前性能数据输入至性能失效模型,得到性能评分后。目标内存的当前性能数据将被作为历史数据(即新的历史数据)进行保留。此时,可以利用其对性能失效模型进行辅助训练,以使性能失效模型符合目标内存的当前状态。通过此方式,无需利用大量的样本数据重新对性能失效模型进行训练,也能保持性能失效模型与目标内存时刻保持对应,精度不会降低,能够持续学习到目标内存的变化,提供更准确的性能评分。
在一些实施例中,通过对性能失效模型进行训练,性能失效模型可以对不同的性能数据标记不同的权重。
步骤27:综合安全评分与性能评分确定目标内存的风险等级。
步骤28:根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估。
步骤27至步骤28与本申请的其余实施例具有相同或相似的技术方案,这里不做赘述。
在本实施例中,通过利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估的方式,能够综合考虑内存的安全性和性能,全面评估内存的风险等级,准确度更高;基于大数据的内存运行参数数据,能够建立更加准确的模型,进而提高评估结果的精度,能够在内存的整个使用寿命中进行动态评估,及时发现潜在的风险,减少意外事故的发生。通过设计不同等级的评估结果及设定可接受风险准则,能够根据评估结果,对内存进行有效的维护和管理,降低维护成本和经济损失,优化内存的使用策略、控制策略及更换维护策略,提高内存的使用效率和使用寿命。
参阅图5,图5是本申请提供的电子设备一实施例的结构示意图。该电子设备110包括处理器111以及与处理器111耦接的存储器112;其中,存储器112用于存储计算机程序,处理器111用于执行计算机程序,以实现以下方法:
利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估。
可以理解,处理器111用于执行计算机程序,以实现上述任一实施例的方法。
参阅图6,图6是本申请提供的电子设备另一实施例的结构示意图。该电子设备110例如可以是移动电子设备,该电子设备110可以包括:存储器112、处理器(CentralProcessing Unit,CPU)111、电路板(图中未示出)、电源电路和麦克风123。电路板安置在壳体围成的空间内部;处理器111和存储器112设置在电路板上;电源电路用于为电子设备的各个电路或器件供电;存储器112用于存储可执行程序代码;处理器111通过读取存储器112中存储的可执行程序代码来运行与可执行程序代码对应的计算机程序,以实现上述任一实施例的方法。
电子设备还可包括:外设接口114、RF(Radio Frequency,射频)电路116、音频电路117、扬声器122、电源管理芯片119、输入/输出(I/O)子系统120、其他输入控制设备121、显示器113以及外部端口115,这些部件通过一个或多个通信总线或信号线118来通信。
存储器112可以被处理器111、外设接口114等访问,存储器112可以包括高速随机存取存储器,还可以包括非易失性存储器,例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。外设接口114可以将设备的输入和输出外设连接到处理器111和存储器112。
I/O子系统120可以将设备上的输入输出外设,例如显示器113和其他输入控制设备121,连接到外设接口114。I/O子系统120可包括显示控制器1201和用于控制其他输入控制设备121的一个或多个输入控制器1202。其中,一个或多个输入控制器1202从其他输入控制设备121接收电信号或者向其他输入控制设备121发送电信号,其他输入控制设备121可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是,输入控制器1202可以与以下任一个连接:键盘、红外端口、USB接口以及诸如鼠标的指示设备。
显示器113是用户电子设备与用户之间的输入接口和输出接口,将可视输出显示给用户,可视输出可以包括图形、文本、图标、视频等。
I/O子系统120中的显示控制器1201从显示器113接收电信号或者向显示器113发送电信号。显示器113检测触摸屏上的接触,显示控制器1201将检测到的接触转换为与显示在显示器113上的用户界面对象的交互,即实现人机交互,显示在显示器113上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。
RF电路116主要用于建立手机与无线网络(即网络侧)的通信,实现手机与无线网络的数据接收和发送。例如收发短信息、电子邮件等。具体地,RF电路116接收并发送RF信号,RF信号也称为电磁信号,RF电路116将电信号转换为电磁信号或将电磁信号转换为电信号,并且通过该电磁信号与通信网络以及其他设备进行通信。RF电路116可以包括用于执行这些功能的已知电路,其包括但不限于天线系统、RF收发机、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC(COder-DECoder,编译码器)芯片组、用户标识模块(Subscriber Identity Module,SIM)等等。
音频电路117,主要用于从外设接口114接收音频数据,将该音频数据转换为电信号,并且将该电信号发送给扬声器122。扬声器122,用于将手机通过RF电路116从无线网络接收的语音信号,还原为声音并向用户播放该声音。电源管理芯片119,用于为处理器111、I/O子系统120及外设接口114所连接的硬件进行供电及电源管理。
上述的电子设备可以是移动终端,如智能手机、平板等移动设备,也可以是终端设备,如个人计算机。
参阅图7,图7是本申请提供的计算机可读存储介质一实施例的结构示意图。该计算机可读存储介质150存储有计算机程序151,计算机程序151在被处理器执行时,实现以下方法:
利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估。
可以理解,计算机程序151在被处理器执行时,还能够实现上述任一实施例的方法。
综上所述,本申请提供的内存运行状态评估方法、电子设备及可读存储介质,通过利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;对运行参数中的参数数据进行分类,划分为安全数据与性能数据;将安全数据输入至安全失效模型,得到安全评分;以及将性能数据输入至性能失效模型,得到性能评分;综合安全评分与性能评分确定目标内存的风险等级;根据风险等级设定可接受风险准则,并对更换目标内存进行经济性评估的方式,能够综合考虑内存的安全性和性能,全面评估内存的风险等级,准确度更高;基于大数据的内存运行参数数据,能够建立更加准确的模型,进而提高评估结果的精度,能够在内存的整个使用寿命中进行动态评估,及时发现潜在的风险,减少意外事故的发生。通过设计不同等级的评估结果及设定可接受风险准则,能够根据评估结果,对内存进行有效的维护和管理,降低维护成本和经济损失,优化内存的使用策略、控制策略及更换维护策略,提高内存的使用效率和使用寿命。
在本申请所提供的几个实施方式中,应该理解到,所揭露的方法以及设备,可以通过其它的方式实现。例如,以上所描述的设备实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
上述其他实施方式中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种内存运行状态评估方法,其特征在于,所述方法包括:
利用存储器状态监控系统获取数据中心中目标内存运行过程中的运行参数;
对运行参数中的参数数据进行分类,划分为安全数据与性能数据;
将所述安全数据输入至安全失效模型,得到安全评分;以及将所述性能数据输入至性能失效模型,得到性能评分;
综合所述安全评分与所述性能评分确定所述目标内存的风险等级;
根据所述风险等级设定可接受风险准则,并对更换所述目标内存进行经济性评估。
2.根据权利要求1所述的方法,其特征在于,所述将所述安全数据输入至安全失效模型,得到安全评分,包括:
结合大数据与历史数据构建与所述目标内存对应的安全失效模型;
将所述安全数据输入至所述安全失效模型,得到安全评分。
3.根据权利要求2所述的方法,其特征在于,所述结合大数据与历史数据构建与所述目标内存对应的安全失效模型,包括:
利用大数据平台查询与所述目标内存同类型的内存的运行参数,构建内存数据库;
记录所述目标内存历史运行过程的所有运行参数,作为历史数据;
利用所述内存数据库和所述历史数据构建与所述目标内存对应的安全失效模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述安全数据输入至安全失效模型,得到安全评分,包括:
利用所述安全失效模型确定所述目标内存当前的安全数据对应的失效概率,并将所述失效概率与概率平均值的比值作为安全评分。
5.根据权利要求4所述的方法,其特征在于,所述概率平均值采用以下方式计算得到:
筛选所述内存数据库中存在安全故障的典型案例;
利用所述安全失效模型分别计算每个所述典型案例中与所述目标内存同使用时长前提下的失效概率,并求取概率平均值。
6.根据权利要求3所述的方法,其特征在于,所述利用所述内存数据库和所述历史数据构建与所述目标内存对应的安全失效模型,包括:
收集所述内存数据库中存在安全故障的典型案例中的安全数据作为样本数据;
提取所述样本数据中内存的使用时长数据,并将各个所述典型案例中的使用时长及其对应的安全数据进行时间同步;
获取所述样本数据中的平均故障率,以及所述样本数据中的多样本间差异的标准偏差,构建所述安全失效模型,其中所述安全失效模型用于计算内存的安全失效概率。
7.根据权利要求6所述的方法,其特征在于,其中,在样本数据中,内存发生安全失效故障的总数服从以下公式:
;
安全失效模型的安全失效概率采用以下公式得到:
;/>表示安全失效概率,/>表示内存出现安全失效的数量,/>表示样本数据中的平均故障率,/>表示样本数据中的多样本间差异的标准偏差,/>表示内存的累计使用时长;/>表示/>的阶乘。
8.根据权利要求1所述的方法,其特征在于,所述将所述性能数据输入至性能失效模型,得到性能评分,包括:
结合大数据与历史数据构建与所述目标内存对应的性能失效模型;
将所述性能数据输入至所述性能失效模型,得到性能评分。
9.一种电子设备,其特征在于,所述电子设备包括处理器以及与所述处理器耦接的存储器;
其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序在被处理器执行时,实现如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311052424.8A CN116755978A (zh) | 2023-08-21 | 2023-08-21 | 内存运行状态评估方法、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311052424.8A CN116755978A (zh) | 2023-08-21 | 2023-08-21 | 内存运行状态评估方法、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116755978A true CN116755978A (zh) | 2023-09-15 |
Family
ID=87953747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311052424.8A Pending CN116755978A (zh) | 2023-08-21 | 2023-08-21 | 内存运行状态评估方法、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116755978A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522175A (zh) * | 2017-09-18 | 2019-03-26 | 华为技术有限公司 | 一种内存评估的方法及装置 |
WO2020087830A1 (zh) * | 2018-11-02 | 2020-05-07 | 深圳壹账通智能科技有限公司 | 数据分析方法、装置、服务器及存储介质 |
CN112700817A (zh) * | 2021-01-18 | 2021-04-23 | 皇虎测试科技(深圳)有限公司 | 一种内存设备质量评估方法、装置及计算机可读存储介质 |
CN114037184A (zh) * | 2021-12-01 | 2022-02-11 | 国网江苏省电力有限公司经济技术研究院 | 收益评价指标的预测方法、装置、介质、设备及程序产品 |
CN115543665A (zh) * | 2022-09-23 | 2022-12-30 | 超聚变数字技术有限公司 | 一种内存可靠性评估方法、装置及存储介质 |
CN116401585A (zh) * | 2023-04-19 | 2023-07-07 | 江苏果下科技有限公司 | 一种基于大数据的储能电池失效风险评估方法 |
-
2023
- 2023-08-21 CN CN202311052424.8A patent/CN116755978A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522175A (zh) * | 2017-09-18 | 2019-03-26 | 华为技术有限公司 | 一种内存评估的方法及装置 |
WO2020087830A1 (zh) * | 2018-11-02 | 2020-05-07 | 深圳壹账通智能科技有限公司 | 数据分析方法、装置、服务器及存储介质 |
CN112700817A (zh) * | 2021-01-18 | 2021-04-23 | 皇虎测试科技(深圳)有限公司 | 一种内存设备质量评估方法、装置及计算机可读存储介质 |
CN114037184A (zh) * | 2021-12-01 | 2022-02-11 | 国网江苏省电力有限公司经济技术研究院 | 收益评价指标的预测方法、装置、介质、设备及程序产品 |
CN115543665A (zh) * | 2022-09-23 | 2022-12-30 | 超聚变数字技术有限公司 | 一种内存可靠性评估方法、装置及存储介质 |
CN116401585A (zh) * | 2023-04-19 | 2023-07-07 | 江苏果下科技有限公司 | 一种基于大数据的储能电池失效风险评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111078479B (zh) | 一种内存检测模型训练的方法、内存检测的方法及装置 | |
CN108573355B (zh) | 模型更新后替换运行的方法、装置、及业务服务器 | |
CN106027577A (zh) | 一种异常访问行为检测方法及装置 | |
CN107203450A (zh) | 故障的分类方法和设备 | |
CN110399237A (zh) | 一种磁盘故障预测方法、系统、终端及存储介质 | |
CN112308126A (zh) | 故障识别模型训练方法、故障识别方法、装置及电子设备 | |
CN105912599A (zh) | 终端应用程序的排名方法及终端 | |
CN105335653A (zh) | 一种异常数据检测方法及装置 | |
CN107579861A (zh) | 基于多线路监测的网站可用性告警方法、装置及电子设备 | |
CN116502166B (zh) | 一种对目标设备故障预测的方法、装置、设备和介质 | |
US20180225195A1 (en) | Selective application testing | |
CN110908880A (zh) | 埋点代码注入方法、事件上报方法及其相关设备 | |
CN114282169A (zh) | 一种异常数据的检测方法以及相关装置 | |
CN111626498A (zh) | 设备运行状态预测方法、装置、设备及存储介质 | |
CN117668692A (zh) | 基于故障检测的智能化电能监控方法、装置、设备和介质 | |
CN111506455B (zh) | 服务发布结果的查验方法及装置 | |
CN116755978A (zh) | 内存运行状态评估方法、电子设备及可读存储介质 | |
CN109669836B (zh) | 智能it运维分析方法、装置、设备及可读存储介质 | |
CN115734143A (zh) | 耳机可靠性评估方法、装置、可读存储介质及电子设备 | |
CN113886192B (zh) | 日志数据的获取方法、装置、终端设备及可读存储介质 | |
CN115330522A (zh) | 基于聚类的信用卡审批方法、装置、电子设备和介质 | |
CN115080412A (zh) | 软件更新质量评估方法、装置、设备及计算机存储介质 | |
CN109343985A (zh) | 一种数据处理方法、装置及存储介质 | |
CN108014500A (zh) | 属性异常发现方法及装置 | |
CN114219486A (zh) | 批次交易处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |