CN110781027B - 内存ecc报错阈值的确定方法、确定装置及确定设备 - Google Patents
内存ecc报错阈值的确定方法、确定装置及确定设备 Download PDFInfo
- Publication number
- CN110781027B CN110781027B CN201911037924.8A CN201911037924A CN110781027B CN 110781027 B CN110781027 B CN 110781027B CN 201911037924 A CN201911037924 A CN 201911037924A CN 110781027 B CN110781027 B CN 110781027B
- Authority
- CN
- China
- Prior art keywords
- memory bank
- ecc
- memory
- information
- error reporting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012937 correction Methods 0.000 title description 5
- 238000009826 distribution Methods 0.000 claims abstract description 37
- 238000003860 storage Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1044—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices with specific ECC/EDC distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1048—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using arrangements adapted for a specific error detection or correction feature
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明公开了一种内存ECC报错阈值的确定方法,区分运行状态信息为正常运行信息或故障信息,通过获取各内存条的ECC报错数量和运行状态信息,生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值,最后输出内存条的ECC报错阈值,以ECC报错数量和运行状态信息的分布情况为依据,形成一种自动生成ECC报错阈值的方案,无需技术人员根据经验设置ECC报错阈值,能够方便快捷的得到ECC报错阈值,具有较高的实用性。本发明还公开了一种内存ECC报错阈值的确定装置、确定设备及计算机可读存储介质,具有上述有益效果。
Description
技术领域
本发明涉及服务器技术领域,特别是涉及一种内存ECC报错阈值的确定方法、确定装置、确定设备及计算机可读存储介质。
背景技术
ECC(Error Correcting Code,错误检查和纠正)是一种能够实现“错误检查和纠正”的技术,ECC内存就是应用了这种技术的内存,一般多应用在服务器及图形工作站上,这将使整个电脑系统在工作时更趋于安全稳定。在服务器上,通过设置内存ECC报错阈值来管控内存条的更换,当内存条的ECC报错数量达到ECC报错阈值时,服务器发出告警提示用户进行内存条的更换,保障产品性能和稳定性。
内存保存数据的原理是由内存颗粒中每个cell电容保持的电荷水平高低来表征0/1数据,当读取的数据与写入内存cell的数据不一致时,就会发生ECC错误。内存ECC错误分为两种:一是硬错误,由内存条本身故障导致比如cell电荷保持能力低、物理损伤等,较易复现;二是软错误,由一些干扰,比如主板SI影响、噪声、高温、像电、磁场甚至宇宙射线的干扰导致,比较随机不容易复现。针对内存条本身的故障,需要更换内存条;但是针对随机偶发的软错误则不必过度反应导致内存频繁更换。
因此,设置合适的ECC报错阈值非常重要,阈值过低导致频繁更换内存条,阈值过高又导致ECC错误影响产品质量。现有技术中设置ECC报错阈值需要借助有经验的技术人员进行大量的实验来实现,这不利于产品的高效生产。
提供一种方便实用的ECC报错阈值的确定方法,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种内存ECC报错阈值的确定方法、确定装置、确定设备及计算机可读存储介质,相较于现有技术降低了对人工经验的依赖,能够方便快捷的得到合适的ECC报错阈值,具有较高的实用性。
为解决上述技术问题,本发明提供一种内存ECC报错阈值的确定方法,包括:
获取各内存条的ECC报错数量和运行状态信息;
生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值;
输出所述内存条的ECC报错阈值;
其中,所述运行状态信息为正常运行信息或故障信息。
可选的,所述获取各内存条的ECC报错数量,具体包括:
接收预定时间段内各所述内存条的ECC报错信息;
根据各所述ECC报错信息统计得到各所述内存条的ECC报错数量。
可选的,所述获取各内存条的运行状态信息,具体包括:
接收输入的对所述内存条的检测信息;
根据所述检测信息确定所述内存条的运行状态信息。
可选的,所述根据所述检测信息确定所述内存条的运行状态信息,具体包括:
判断所述检测信息是否为ECC硬错误信息;
如果否,则将所述内存条的运行状态信息置为正常运行信息。
可选的,所述生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值,具体包括:
计算所述ECC报错数量大于等于1且小于等于n的内存条的统计组中,所述运行状态信息为故障信息的内存条的数量占所述统计组全体的内存条的数量的第一百分比;
当所述第一百分比大于预设的第一阈值时,确定n为所述内存条的ECC报错阈值;
其中,n为正整数。
可选的,所述生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值,具体包括:
计算所述ECC报错数量为n的内存条中,所述运行状态信息为故障信息的内存条的数量占全体所述ECC报错数量为n的内存条的数量的第二百分比;
当所述第二百分比大于预设的第二阈值时,确定n为所述内存条的ECC报错阈值;
其中,n为正整数。
可选的,还包括:
按预设规则生成所述分布情况的统计图或统计表;
输出所述统计图或所述统计表。
为解决上述技术问题,本发明还提供一种内存ECC报错阈值的确定装置,包括:
获取单元,用于获取各内存条的ECC报错数量和运行状态信息;
计算单元,用于生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值;
输出单元,用于输出所述内存条的ECC报错阈值;
其中,所述运行状态信息为正常运行信息或故障信息。
为解决上述技术问题,本发明还提供一种内存ECC报错阈值的确定设备,包括:
存储器,用于存储指令,所述指令包括上述任意一项所述内存ECC报错阈值的确定方法的步骤;
处理器,用于执行所述指令。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述内存ECC报错阈值的确定方法的步骤。
本发明所提供的内存ECC报错阈值的确定方法,区分运行状态信息为正常运行信息或故障信息,通过获取各内存条的ECC报错数量和运行状态信息,生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值,最后输出内存条的ECC报错阈值,以ECC报错数量和运行状态信息的分布情况为依据,形成一种自动生成ECC报错阈值的方案,无需技术人员根据经验设置ECC报错阈值,能够方便快捷的得到ECC报错阈值,具有较高的实用性。本发明还提供一种内存ECC报错阈值的确定装置、确定设备及计算机可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种内存ECC报错阈值的确定方法的流程图;
图2为本发明实施例提供的一种图1中步骤S102的具体实施方式的流程图;
图3为本发明实施例提供的另一种图1中步骤S102的具体实施方式的流程图;
图4为本发明实施例提供的一种内存ECC报错阈值的确定装置的结构示意图;
图5为本发明实施例提供的一种内存ECC报错阈值的确定设备的结构示意图。
具体实施方式
本发明的核心是提供一种内存ECC报错阈值的确定方法、确定装置、确定设备及计算机可读存储介质,相较于现有技术降低了对人工经验的依赖,能够方便快捷的得到合适的ECC报错阈值,具有较高的实用性。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种内存ECC报错阈值的确定方法的流程图。
如图1所示, 本发明实施例提供的内存ECC报错阈值的确定方法包括:
S101:获取各内存条的ECC报错数量和运行状态信息。
其中,运行状态信息为正常运行信息或故障信息。
需要说明的是,本发明实施例提供的内存ECC报错阈值的确定方法涉及到的ECC报错数量和运行状态信息等参数均是针对同一类型的内存条而言的,即是说,一次确定ECC报错阈值的流程只针对同一型号(同一批次、同一厂家等)的内存条,当然,对于不同类型的内存条可以应用本发明实施例提供的方案进行并行处理。
在具体实施中,ECC报错数量可以为由技术人员统计后上传到指定地址,通过脚本获取ECC报错数量,也可以为通过仪器统计上报的ECC报错信息。因此,步骤S101中的获取各内存条的ECC报错数量,具体可以包括:
接收预定时间段内各内存条的ECC报错信息;
根据各ECC报错信息统计得到各内存条的ECC报错数量。
对于发生ECC报错数量的内存条,需要技术人员进行长时间加严测试以确定内存条是否发生了需要进行更换该内存条的故障。在程序运行过程中,该测试过程可以与上述示意的仪器对ECC报错信息的统计过程同步进行,技术人员完成测试后上传测试数据,以此更新内存条的运行状态信息。因此,步骤S101中的获取各内存条的运行状态信息,具体可以包括:
接收输入的对内存条的检测信息;
根据检测信息确定所述内存条的运行状态信息。
由于ECC错误包括硬错误和软错误,而软错误对内存条的影响不必作为判断内存条的故障程度的依据,因此上述的根据检测信息确定所述内存条的运行状态信息,具体可以包括:
判断检测信息是否为ECC硬错误信息;
如果否,则将内存条的运行状态信息置为正常运行信息。
S102:生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值。
根据预设的统计处理规则,生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,如在全体发生过ECC报错的内存条中,以ECC报错数量相同的内存条为一组,各组对应组中运行状态信息为故障信息的内存条的数量,依次统计得到ECC报错数量从1到n的内存条的故障信息的分布情况。同理,也可以得到各内存条的ECC报错数量和各内存条的正常状态信息的分布情况。
根据预设的算法从分布情况中确定内存条的ECC报错阈值。
为增强ECC报错阈值的合理性,还可以将ECC报错数量和各内存条的分布情况呈现给用户,以供有经验的技术人员对仪器计算的ECC报错阈值进行校验。
因此,本发明实施例提供的内存ECC报错阈值的确定方法还可以包括:
按预设规则生成分布情况的统计图或统计表;
输出统计图或统计表。
S103:输出内存条的ECC报错阈值。
通过预设的路径、窗口,输出内存条的ECC报错阈值。
本发明实施例提供的内存ECC报错阈值的确定方法,区分运行状态信息为正常运行信息或故障信息,通过获取各内存条的ECC报错数量和运行状态信息,生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值,最后输出内存条的ECC报错阈值,以ECC报错数量和运行状态信息的分布情况为依据,形成一种自动生成ECC报错阈值的方案,无需技术人员根据经验设置ECC报错阈值,能够方便快捷的得到ECC报错阈值,具有较高的实用性。
图2为本发明实施例提供的一种图1中步骤S102的具体实施方式的流程图。
如图2所示,在上述实施例的基础上,在本发明实施例提供的内存ECC报错阈值的确定方法中,步骤S102具体包括:
S201:计算ECC报错数量大于等于1且小于等于n的内存条的统计组中,运行状态信息为故障信息的内存条的数量占统计组全体内存条的数量的第一百分比。
S202:当第一百分比大于预设的第一阈值时,确定n为内存条的ECC报错阈值。
其中,n为正整数。
在具体实施中,按ECC报错数量将内存条进行分组后,按ECC报错数量从小到大排列。而后,从ECC报错数量为1开始,此时ECC报错数量为1的内存条为一个统计组,判断运行状态信息为故障信息的内存条的数量占统计组全体内存条的数量的第一百分比是否超出预设的第一阈值;以此类推,以ECC报错数量为1到n的内存条为一个统计组,判断判断运行状态信息为故障信息的内存条的数量占统计组全体内存条的数量的第一百分比是否超出预设的第一阈值……直至第一次确定符合第一百分比大于预设的第一阈值的n(即符合第一百分比大于预设的第一阈值的最小的n)为ECC报错阈值。
图3为本发明实施例提供的另一种图1中步骤S102的具体实施方式的流程图。
如图3所示,在上述实施例的基础上,在本发明实施例提供的内存ECC报错阈值的确定方法中,步骤S102具体包括:
S301:计算ECC报错数量为n的内存条中,运行状态信息为故障信息的内存条的数量占全体ECC报错数量为n的内存条的数量的第二百分比。
S302:当第二百分比大于预设的第二阈值时,确定n为内存条的ECC报错阈值。
其中,n为正整数。
一般情况下,ECC报错数量越多,内存条出现实际故障的可能性越大。因此在每个ECC报错数量等级都对应较多数量的内存条时,可以采用本发明实施例提供的方式,从ECC报错数量为1对应的内存条开始,以ECC报错数量递增的方式计算每个ECC报错数量等等级对应的第二百分比,直至得到第二百分比大于预设的第二阈值的最小n值,作为内存条的ECC报错阈值。
当然,除了上述两种步骤S102的具体实施方式外,还有其他的生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值的方式。而基于上述两种实施方式,还可以不以满足条件的最小n值为最终的ECC报错阈值,如可以在首次满足条件的n值上下进行补充计算,如ECC报错数量为n+1的内存条是否满足故障率要求,以避免n值的选择不当。另外,通过制定对应的故障率阈值范围,还可以给出ECC报错阈值的范围,以供用户灵活选择。
上文详述了内存ECC报错阈值的确定方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的内存ECC报错阈值的确定装置、确定设备及计算机可读存储介质。
图4为本发明实施例提供的一种内存ECC报错阈值的确定装置的结构示意图。
如图4所示,本发明实施例提供的内存ECC报错阈值的确定装置包括:
获取单元401,用于获取各内存条的ECC报错数量和运行状态信息;
计算单元402,用于生成各内存条的ECC报错数量和各内存条的运行状态信息的分布情况,并根据分布情况确定内存条的ECC报错阈值;
输出单元403,用于输出内存条的ECC报错阈值;
其中,运行状态信息为正常运行信息或故障信息。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图5为本发明实施例提供的一种内存ECC报错阈值的确定设备的结构示意图。
如图5所示,本发明实施例提供的内存ECC报错阈值的确定设备包括:
存储器501,用于存储指令,所述指令包括上述任意一项实施例所述内存ECC报错阈值的确定方法的步骤;
处理器502,用于执行所述指令。
本发明实施例提供的内存ECC报错阈值的确定设备,由于可以通过处理器调用存储器存储的计算机程序,实现如上述任一实施例提供的内存ECC报错阈值的确定方法的步骤,所以本内存ECC报错阈值的确定设备具有同上述内存ECC报错阈值的确定方法同样的实际效果。
为了更好地理解本方案,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上任一实施例提到的内存ECC报错阈值的确定方法的步骤。
本发明实施例提供的计算机可读存储介质,由于可以通过处理器调用计算机可读存储介质存储的计算机程序,实现如上述任一实施例提供的内存ECC报错阈值的确定方法的步骤,所以本计算机可读存储介质具有同上述内存ECC报错阈值的确定方法同样的实际效果。
需要说明的是,以上所描述的装置、设备或计算机可读存储介质实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory ,ROM)、随机存取存储器(Random Access Memory ,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种内存ECC报错阈值的确定方法、装置、设备及计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (8)
1.一种内存ECC报错阈值的确定方法,其特征在于,包括:
获取各内存条的ECC报错数量和运行状态信息;
生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值;
输出所述内存条的ECC报错阈值;
其中,所述运行状态信息为正常运行信息或故障信息;
所述获取各内存条的运行状态信息,具体包括:接收输入的对所述内存条的检测信息;根据所述检测信息确定所述内存条的运行状态信息;
所述根据所述检测信息确定所述内存条的运行状态信息,具体包括:判断所述检测信息是否为ECC硬错误信息;如果否,则将所述内存条的运行状态信息置为正常运行信息。
2.根据权利要求1所述的确定方法,其特征在于,所述获取各内存条的ECC报错数量,具体包括:
接收预定时间段内各所述内存条的ECC报错信息;
根据各所述ECC报错信息统计得到各所述内存条的ECC报错数量。
3.根据权利要求1所述的确定方法,其特征在于,所述生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值,具体包括:
计算所述ECC报错数量大于等于1且小于等于n的内存条的统计组中,所述运行状态信息为故障信息的内存条的数量占所述统计组的全体内存条的数量的第一百分比;
当所述第一百分比大于预设的第一阈值时,确定n为所述内存条的ECC报错阈值;
其中,n为正整数。
4.根据权利要求1所述的确定方法,其特征在于,所述生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值,具体包括:
计算所述ECC报错数量为n的内存条中,所述运行状态信息为故障信息的内存条的数量占全体所述ECC报错数量为n的内存条的数量的第二百分比;
当所述第二百分比大于预设的第二阈值时,确定n为所述内存条的ECC报错阈值;
其中,n为正整数。
5.根据权利要求1所述的确定方法,其特征在于,还包括:
按预设规则生成所述分布情况的统计图或统计表;
输出所述统计图或所述统计表。
6.一种内存ECC报错阈值的确定装置,其特征在于,包括:
获取单元,用于获取各内存条的ECC报错数量和运行状态信息;
计算单元,用于生成各所述内存条的ECC报错数量和各所述内存条的运行状态信息的分布情况,并根据所述分布情况确定所述内存条的ECC报错阈值;
输出单元,用于输出所述内存条的ECC报错阈值;
其中,所述运行状态信息为正常运行信息或故障信息;
所述获取各内存条的运行状态信息,具体包括:接收输入的对所述内存条的检测信息;根据所述检测信息确定所述内存条的运行状态信息;
所述根据所述检测信息确定所述内存条的运行状态信息,具体包括:判断所述检测信息是否为ECC硬错误信息;如果否,则将所述内存条的运行状态信息置为正常运行信息。
7.一种内存ECC报错阈值的确定设备,其特征在于,包括:
存储器,用于存储指令,所述指令包括权利要求1至5任意一项所述内存ECC报错阈值的确定方法的步骤;
处理器,用于执行所述指令。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任意一项所述内存ECC报错阈值的确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911037924.8A CN110781027B (zh) | 2019-10-29 | 2019-10-29 | 内存ecc报错阈值的确定方法、确定装置及确定设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911037924.8A CN110781027B (zh) | 2019-10-29 | 2019-10-29 | 内存ecc报错阈值的确定方法、确定装置及确定设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110781027A CN110781027A (zh) | 2020-02-11 |
CN110781027B true CN110781027B (zh) | 2023-01-10 |
Family
ID=69387457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911037924.8A Active CN110781027B (zh) | 2019-10-29 | 2019-10-29 | 内存ecc报错阈值的确定方法、确定装置及确定设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110781027B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111752481B (zh) * | 2020-05-27 | 2022-08-02 | 苏州浪潮智能科技有限公司 | 一种基于spd的内存监控及寿命预测方法和系统 |
CN114611862A (zh) * | 2020-12-09 | 2022-06-10 | 中兴通讯股份有限公司 | 性能指标至差值的生成方法、装置、电子设备及存储介质 |
CN113010338B (zh) * | 2021-02-19 | 2022-11-15 | 山东英信计算机技术有限公司 | 一种内存ce的漏错阈值调整方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102272731A (zh) * | 2008-11-10 | 2011-12-07 | 弗森-艾奥公司 | 用于预测固态存储装置中的故障的设备、系统和方法 |
CN103092739A (zh) * | 2013-01-18 | 2013-05-08 | 浪潮电子信息产业股份有限公司 | 一种内存ecc报错报警机制 |
CN105453049A (zh) * | 2013-09-24 | 2016-03-30 | 英特尔公司 | 使用纠错指针处置存储器中的错误 |
-
2019
- 2019-10-29 CN CN201911037924.8A patent/CN110781027B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102272731A (zh) * | 2008-11-10 | 2011-12-07 | 弗森-艾奥公司 | 用于预测固态存储装置中的故障的设备、系统和方法 |
CN103092739A (zh) * | 2013-01-18 | 2013-05-08 | 浪潮电子信息产业股份有限公司 | 一种内存ecc报错报警机制 |
CN105453049A (zh) * | 2013-09-24 | 2016-03-30 | 英特尔公司 | 使用纠错指针处置存储器中的错误 |
Also Published As
Publication number | Publication date |
---|---|
CN110781027A (zh) | 2020-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781027B (zh) | 内存ecc报错阈值的确定方法、确定装置及确定设备 | |
CN106685752A (zh) | 一种信息处理方法及终端 | |
CN102904685A (zh) | 一种硬件表项校验错误的处理方法及装置 | |
CN110413492B (zh) | 存储盘的健康评估方法、电子设备和计算机程序产品 | |
CN110825620B (zh) | 回归测试中测试用例优先级计算方法 | |
CN111626498A (zh) | 设备运行状态预测方法、装置、设备及存储介质 | |
CN109213476B (zh) | 一种安装包的生成方法、计算机可读存储介质及终端设备 | |
JP2012208644A (ja) | リスク管理装置 | |
CN112131039A (zh) | 一种内存ecc信息上报控制方法、装置、设备及介质 | |
CN111159169B (zh) | 数据治理方法及设备 | |
CN107402970B (zh) | 信息生成方法及装置 | |
CN116756129A (zh) | 数据补录方法、装置、存储介质及电子设备 | |
CN107896232B (zh) | 一种ip地址评估方法及装置 | |
CN108763023A (zh) | 一种磁盘的分级方法、装置、设备及可读存储介质 | |
CN115080412A (zh) | 软件更新质量评估方法、装置、设备及计算机存储介质 | |
CN108712284B (zh) | 一种故障业务的定位方法、装置、及业务服务器 | |
CN113836204A (zh) | 接口异常检测方法、装置、电子设备和存储介质 | |
CN109344049B (zh) | 测试数据处理系统的方法和装置 | |
CN110597703A (zh) | 一种回归测试方法及装置 | |
CN113568769A (zh) | 异常处理方法、装置、服务器及存储介质 | |
CN112597046A (zh) | 测试方法、装置、计算机设备及存储介质 | |
CN116701236B (zh) | 一种app应用测试方法、系统和可读存储介质 | |
JP7402932B1 (ja) | 障害検知装置、障害検知方法、及び障害検知プログラム | |
CN109358968B (zh) | 一种服务器资源配置方法及装置 | |
CN110247477B (zh) | 一种设备在线情况的监测方法及监控装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |