CN117648216B

CN117648216B - 调整内存可纠正错误阈值的方法、装置、服务器及介质

Info

Publication number: CN117648216B
Application number: CN202410124568.8A
Authority: CN
Inventors: 李盛新; 李道童; 贾帅帅; 陈衍东; 艾山彬; 孙秀强; 韩红瑞
Original assignee: Suzhou Metabrain Intelligent Technology Co Ltd
Current assignee: Suzhou Metabrain Intelligent Technology Co Ltd
Priority date: 2024-01-30
Filing date: 2024-01-30
Publication date: 2024-04-23
Anticipated expiration: 2044-01-30
Also published as: CN117648216A

Abstract

本发明涉及服务器技术领域，公开了调整内存可纠正错误阈值的方法、装置、服务器及介质，该方法包括：设置模糊控制规则；对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息；根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，确定与所述当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值。本发明可以比较准确地确定连续平滑的内存CE阈值，不仅可以降低人为经验的影响，也可以动态调整内存CE阈值；利用内存CE数量和系统中断次数可以简单准确地表示系统的稳定性和性能，从而能够确定能够平衡系统稳定性和性能的内存CE阈值。

Description

调整内存可纠正错误阈值的方法、装置、服务器及介质

技术领域

本发明涉及服务器技术领域，具体涉及调整内存可纠正错误阈值的方法、装置、服务器及介质。

背景技术

可纠正错误（Correctable Error，CE）是指内存中出现的一些临时性错误，可以通过纠正机制进行修复，而不会导致系统崩溃或数据丢失。服务器的内存CE阈值是指在服务器运行过程中，当内存中出现CE的数量超过设定的阈值时，系统会触发修复机制。设置内存CE阈值的目的是为了及时发现并修复内存中的错误，保证系统的稳定性和可靠性。

目前，内存CE阈值大多为固定值，固定的内存CE阈值难以适应系统变化，导致系统稳定性和性能较差。

发明内容

有鉴于此，本发明提供了一种调整内存可纠正错误阈值的方法、装置、服务器及介质，以解决系统稳定性和性能较差的问题。

第一方面，本发明提供了一种调整内存可纠正错误阈值的方法，包括：

设置模糊控制规则；所述模糊控制规则包括内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系；

对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息；所述当前内存可纠正错误信息包括当前内存可纠正错误数量，以及因内存可纠正错误而引发的当前系统中断次数；

根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，确定与所述当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值。

第二方面，本发明提供了一种调整内存可纠正错误阈值的装置，包括：

规则设置模块，用于设置模糊控制规则；所述模糊控制规则包括内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系；

统计模块，用于对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息；所述当前内存可纠正错误信息包括当前内存可纠正错误数量，以及因内存可纠正错误而引发的当前系统中断次数；

模糊处理模块，用于根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，确定与所述当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值。

第三方面，本发明提供了一种服务器，包括：内存、阈值寄存器、计数寄存器、存储器和处理器；所述阈值寄存器用于存储内存可纠正错误阈值；所述计数寄存器用于对所述内存产生的内存可纠正错误进行计数，并在计数达到所述阈值寄存器中的内存可纠正错误阈值时，触发系统中断；存储器和处理器之间互相通信连接，存储器中存储有计算机指令，处理器通过执行计算机指令，从而执行上述第一方面或其对应的任一实施方式的调整内存可纠正错误阈值的方法。

第四方面，本发明提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机指令，计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的调整内存可纠正错误阈值的方法。

本发明基于模糊控制规则，可以确定与当前内存CE信息所属的目标模糊集相对应的当前内存CE阈值所属的阈值模糊集，进而基于该阈值模糊集可以确定精确的当前内存CE阈值。对于任意当前内存CE信息，均可确定相对应的当前内存CE阈值，即可以比较准确地确定连续平滑的内存CE阈值；本发明不仅可以降低人为经验的影响，也可以动态确定内存CE阈值，可以更好地优化内存管理和资源分配，提高系统的准确性和可靠性，从而提升系统的性能；利用内存CE数量和系统中断次数可以简单准确地表示系统的稳定性和性能，从而能够确定能够平衡系统稳定性和性能的内存CE阈值。

附图说明

为了更清楚地说明本发明具体实施方式或相关技术中的技术方案，下面将对具体实施方式或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的调整内存可纠正错误阈值的方法的流程示意图；

图2是根据本发明实施例的动态调整服务器内存CE阈值的一种示意图；

图3是根据本发明实施例的另一调整内存可纠正错误阈值的方法的流程示意图；

图4是根据本发明实施例的三角形隶属函数的一种示意图；

图5是根据本发明实施例的梯形隶属函数的一种示意图；

图6是根据本发明实施例的内存CE数量的隶属函数的一种示意图；

图7是根据本发明实施例的系统中断次数的隶属函数的一种示意图；

图8是根据本发明实施例的内存CE阈值的隶属函数的一种示意图；

图9是根据本发明实施例的内存CE数量为4500时确定隶属度的示意图；

图10是根据本发明实施例的系统中断次数为750时确定隶属度的示意图；

图11是根据本发明实施例的形成叠加区域的示意图；

图12是根据本发明实施例的内存CE信息与内存CE阈值之间对应关系的一种函数示意图；

图13是根据本发明实施例的模糊控制的一种流程示意图；

图14是根据本发明实施例的再一调整内存可纠正错误阈值的方法的流程示意图；

图15是根据本发明实施例的内存CE数量的隶属函数的另一种示意图；

图16是根据本发明实施例的系统中断次数的隶属函数的另一种示意图；

图17是根据本发明实施例的内存CE阈值的隶属函数的另一种示意图；

图18是根据本发明实施例的内存CE信息与内存CE阈值之间对应关系的另一种函数示意图；

图19是根据本发明实施例的调整内存可纠正错误阈值的装置的结构框图；

图20是本发明实施例的服务器的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

内存CE阈值的具体数值可以根据系统的需求和硬件的性能来设定。一般来说，较低的内存CE阈值可以更早地发现和处理内存错误，但可能会增加系统的开销和处理负担；而较高的内存CE阈值则可以减少系统开销，但可能会延迟错误的检测和处理。在实际应用中，内存CE阈值通常由系统管理员或硬件厂商根据系统的需求和硬件的性能进行设置。一般来说，建议根据系统的负载和可用资源来选择一个合适的阈值，以保证系统的稳定性和可靠性。合适的阈值可以保证系统及时检测和处理内存错误，同时又不会对系统的性能和稳定性产生过大的影响。

而固定不变的内存CE阈值（例如，漏斗阈值）设置可能会导致系统无法适应负载、硬件和应用需求的变化。首先，系统负载可能会随时间变化，如果内存CE阈值设置得过高，系统可能会忽略内存错误，导致稳定性下降；如果内存CE阈值设置得过低，系统可能频繁处理内存错误，导致性能下降。其次，系统硬件配置可能会变化，如果内存CE阈值固定不变，可能无法适应新硬件的内存错误。最后，应用需求可能变化，固定的内存CE阈值可能无法满足新应用程序的内存错误处理需求。

因此，为了适应负载、硬件和应用需求的变化，动态调整内存CE阈值是更好的选择。定期评估和调整内存CE阈值，可以确保系统及时检测和处理内存错误，保持稳定性和性能。

目前的部分方案，可以根据目标内存容量、温度信息、内存CE数量等信息设置几个内存CE阈值，基于多个内存CE阈值实现动态变化调节。但这种动态方案主要基于人为经验设置阈值，受经验影响较大；且所设置的内存CE阈值数量较少，无法做到内存CE阈值连续平滑变化，不能很好的提高内存CE问题的检测和处理的准确性和实时性。

本发明实施例提供的调整内存可纠正错误阈值的方法，采用模糊控制的方式，基于内存CE信息可以确定合适的内存CE阈值，不仅可以降低人为经验的影响，也可以动态确定内存CE阈值，且内存CE阈值是连续平滑的，能够很好地解决因内存CE阈值不合适所带来的问题。

根据本发明实施例，提供了一种调整内存可纠正错误阈值的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在本实施例中提供了一种调整内存可纠正错误阈值的方法，可用于存在可纠正错误的设备，例如服务器等。图1是根据本发明实施例的调整内存可纠正错误阈值的方法的流程图，如图1所示，该流程包括以下步骤。

步骤S101，设置模糊控制规则；该模糊控制规则包括内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系。

其中，在确定内存可纠正错误阈值时，可以确定与可纠正错误相关的信息，即内存可纠正错误信息，将该内存可纠正错误信息作为模糊控制的输入变量，将内存可纠正错误阈值作为输出变量，以能够基于模糊控制的方式确定相应的内存可纠正错误阈值。为简化指代方式，该内存可纠正错误阈值也可表示为内存CE阈值；相应地，内存可纠正错误信息也可表示为内存CE信息。

本实施例中，可以设置内存CE信息的模糊集，并设置内存CE阈值的模糊集；一般情况下，内存CE信息的模糊集，以及内存CE阈值的模糊集，其数量均是多个。对于这两种模糊集，可以构建两种模糊集之间的对应关系，从而形成相应的模糊控制规则。

该模糊控制规则具体可基于人为经验设置。由于基于人为经验可以大体上确定内存CE信息与内存CE阈值之间的对应关系，即可以保证该模糊控制规则基本符合用户需求；后续基于该模糊控制规则所确定的内存CE阈值，更主要地是基于模糊控制算法、使用模糊推理方法确定的，可以自适应确定合适的内存CE阈值，能够有效降低人为经验的影响。

由于内存CE阈值的设置会影响系统的稳定性和性能，合适的内存CE阈值可以保证系统能够及时检测和处理内存错误，同时又不会对系统的性能和稳定性产生过大的影响。本实施例中，为能够比较准确地表征系统的稳定性和性能，将在单位周期内的内存CE数量（即内存可纠正错误数量）、以及因内存可纠正错误而引发的系统中断次数作为统计得到的内存CE信息，换句话说，模糊控制的输入变量包括两个维度的参数：内存CE数量和系统中断次数。为方便描述，后续除非有特殊说明，统一将在单位周期内的内存CE数量简称为“内存CE数量”，将在单位周期内因内存可纠正错误而引发的系统中断次数简称为“系统中断次数”。

通常情况，当某一内存产生CE的数量超过内存CE阈值，则需进入系统中断，对产生CE的内存单元进行隔离或修复操纵。频繁的进入系统中断会导致系统频繁触发错误处理机制，影响系统的性能。内存CE阈值设置过低会频繁触发处理CE的系统中断，影响系统性能；而内存CE阈值设置过高则可能会导致问题的延迟发现和处理。因此，需要在系统的稳定性和性能之间进行权衡，选择一个合适的阈值。

本实施例中，内存CE数量和系统中断次数分别能够表示系统的稳定性和性能。

具体地，在单位周期内，若内存CE数量较少，为能够及时地发现CE，需要设置较小的内存CE阈值；相反地，若内存CE数量越多，说明系统运行过程中容易产生CE，此时即使设置较大的内存CE阈值，也可及时地发现CE，从而能够保证系统稳定性。

并且，在单位周期内，每次内存CE数量超过目前设置的内存CE阈值时（例如，上一次确定的内存CE阈值），即会触发一次系统中断，该单位周期内的系统中断次数越多，则表示需要频繁地进入系统中断，从而会导致系统频繁触发错误处理机制，影响系统的性能，故此时可以适当地设置较大的内存CE阈值。

本实施例基于内存CE数量和系统中断次数确定合适的内存CE阈值，可以有效平衡系统可靠性和性能。

并且，若内存CE信息包括内存CE数量和系统中断次数，则在设置模糊控制规则时，也需要设置内存CE数量和系统中断次数的模糊集与相应内存CE阈值的模糊集之间的对应关系。该模糊控制规则包括：内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系。

步骤S102，对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息。该当前内存可纠正错误信息包括当前内存可纠正错误数量，以及因内存可纠正错误而引发的当前系统中断次数。

本实施例中，服务器等设备在运行过程中，会生成可纠正错误，通过对这些可纠正错误进行统计，可以得到与可纠正错误相关的信息。具体地，本实施例中，可以只对单位周期内的可纠正错误进行统计，统计得到的内存可纠正错误信息称为当前内存可纠正错误信息，或者也可表示为当前内存CE信息。

其中，需要统计的内存CE信息包括内存CE数量和系统中断次数，故所生成的当前内存CE信息，也需要包括相应的内存CE数量和系统中断次数，即：当前内存可纠正错误信息包括当前内存可纠正错误数量，以及因内存可纠正错误而引发的当前系统中断次数。

系统工作时，由系统管理软件基本输入输出系统（Basic Input/output System，BIOS）设置内存CE阈值，同时由基板管理控制器（Baseboard Management Controller，BMC）周期性读取内存错误检查和纠正技术（Error Checking and Correcting，ECC）报告进行获取内存CE在周期内数量，并统计由于内存CE引发系统中断的次数，从而得到所需的当前内存CE数量和当前系统中断次数。

其中，该单位周期具体可以是更新内存CE阈值的周期。例如，该单位周期可以为30分钟、1小时、2小时等，具体可基于实际情况而定。

步骤S103，根据模糊控制规则对当前内存可纠正错误信息进行模糊推理，确定与当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值。

本实施例中，采用模糊控制的方式确定当前需要设置的内存CE阈值，即当前内存CE阈值。利用模糊控制规则进行模糊推理，可以确定与该当前内存CE信息相对应的当前内存CE阈值；并且，基于该模糊控制规则，以及模糊推理中是使用的模糊化方式、解模糊化方式，最终的到的当前内存CE阈值与输入的当前内存CE信息之间是非线性的映射关系。

例如，可以确定该当前内存CE信息所对应的模糊集（后续称为目标模糊集），实现对其模糊化；之后基于模糊控制规则确定与该当前内存CE阈值相对应的模糊集（后续称为阈值模糊集），并对其进行解模糊化，从而可以确定具体的当前内存CE阈值。

本实施例中，可以每间隔单位周期，周期性统计当前内存CE信息，进而可以周期性地对内存CE阈值进行更新。例如，单位周期为30分钟，则可以每隔30分钟，确定最近30分钟内的当前内存CE信息，进而通过模糊控制规则可以确定与该当前内存CE信息相对应的精确的内存CE阈值，即当前内存CE阈值，从而实现对内存CE阈值的动态更新，可以动态设置内存CE阈值。

本实施例提供的调整内存可纠正错误阈值的方法，可实现动态更新服务器的内存CE阈值。

图2示出了对服务器的内存CE阈值进行动态更新的一种示意图。如图2所示，服务器200中设有内存201，在内存201的工作过程中，其可能产生内存可纠正错误，即内存CE；此时，可以由计数寄存器202对产生的内存CE进行计数，从而可以周期性统计在单位周期内的内存CE数量，即当前内存CE数量。并且，阈值寄存器203中存有所设置的内存CE阈值；每当计数寄存器202所统计的内存CE的数量达到该内存CE阈值，则产生一次系统中断，通过检测单位周期内的系统中断，即可确定该单位周期内系统中断次数，即当前系统中断次数。

将由此确定的当前内存CE数量以及当前系统中断次数的输入变量，输入至模糊控制器204，由模糊控制器204进行模糊推理，即可确定更新后的内存CE阈值，即当前内存CE阈值，并更新后的当前内存CE阈值保存至阈值寄存器203，并替代之前存储的内存CE阈值。如此循环，实现对服务器200内存CE阈值的动态更新。

本实施例提供的调整内存可纠正错误阈值的方法，基于模糊控制规则，可以确定与当前内存CE信息所属的目标模糊集相对应的当前内存CE阈值所属的阈值模糊集，进而基于该阈值模糊集可以确定精确的当前内存CE阈值。对于任意当前内存CE信息，均可确定相对应的当前内存CE阈值，即可以比较准确地确定连续平滑的内存CE阈值；该方法不仅可以降低人为经验的影响，也可以动态确定内存CE阈值，可以更好地优化内存管理和资源分配，提高系统的准确性和可靠性，从而提升系统的性能；利用内存CE数量和系统中断次数可以简单准确地表示系统的稳定性和性能，从而能够确定能够平衡系统稳定性和性能的内存CE阈值。

在本实施例中提供了一种调整内存可纠正错误阈值的方法，可用于存在可纠正错误的设备，例如服务器等。图3是根据本发明实施例的调整内存可纠正错误阈值的方法的流程图，如图3所示，该流程包括以下步骤。

步骤S301，设置模糊控制规则；该模糊控制规则包括内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系。

具体地，内存CE数量具有一定的论域，即内存CE数量具有一定的取值范围；可以将该内存CE数量的论域换分为多个范围，每个范围对应一个模糊集，并为每个模糊集设置相应的隶属函数。同样的，系统中断次数也具有一定的论域，对系统中断次数的论域进行划分，也可确定系统中断次数的多个模糊集；对内存CE阈值的论域进行划分，也可确定内存CE阈值的多个模糊集。

其中，可以基于专家经验或大量的历史数据分析，确定内存CE数量、系统中断次数、内存CE阈值的论域。

例如，内存CE数量的论域为[0, 10000]，因CE引发的系统中断次数的论域为[0,1500]，内存CE阈值的论域为[1, 2000]。

在确定内存CE数量的论域后，可以将其分为多个模糊集。例如，将内存CE数量的论域分为5个模糊集：非常低（Very Low），低（Low），中（Medium），高（High），非常高（VeryHigh）；这5个模糊集所对应的范围可以是均匀间隔的，也可以是非均匀的，具体可基于实际需求而定。并且，可以对这些模糊集定义相应的隶属函数，该隶属函数可以包括多种，例如三角形隶属函数、梯形隶属函数、高斯隶属函数等；并且，每种隶属函数一般又可分为三种类型：偏小型、中间型和偏大型。

例如，三角形隶属函数的示意图可参见图4所示。如图4所示，偏小型、中间型、偏大型的三角形隶属函数可分别表示为：

，/>，。

梯形隶属函数的示意图可参见图5所示。如图5所示，偏小型、中间型、偏大型的梯形隶属函数可分别表示为：

，/>，。

为便于理解，本实施例中采用平均间隔的方式划分多个模糊集，并使用三角形隶属函数。其中，内存CE数量的5个模糊集（非常低、低、中、高、非常高）的范围分别为：[0 02000]、[0 2000 4000]、[2000 4000 6000]、[4000 6000 8000]、[6000 10000 10000]，上述中括号中三个数字对应图4中三角形隶属函数的a、b、c三个点。内存CE数量的隶属函数具体可参见图6所示。

类似地，将系统中断次数也分为5个模糊集：非常低（Very Low），低（Low），中（Medium），高（High），非常高（Very High）；这5个模糊集所对应的范围也可以是均匀间隔或非均匀间隔的。

其中，采用平均间隔的方式划分系统中断次数的多个模糊集，并使用三角形隶属函数。系统中断次数的5个模糊集（非常低、低、中、高、非常高）的范围分别为：[0 0 300]、[0300 600]、[300 600 900]、[600 900 1200]、[900 1500 1500]。系统中断次数的隶属函数具体可参见图7所示。

同样地，可以将内存CE阈值的论域分为多个模糊集。其中，为能够更精确地表示内存CE阈值，该内存CE阈值的模糊集的数量大于内存CE数量的模糊集数量、系统中断次数的模糊集数量。

例如，将内存CE阈值的论域分为7个模糊集：非常低（Very Low），低（Low），中低（Medium Low），中（Medium），中高（Medium High），高（High），非常高（Very High）。相应地，这7个模糊集的范围分别为：[1 1 300]、[1 300 600]、[300 600 900]、[600 900 1200]、[900 1200 1500]、[1200 1500 1800]、[1500 2000 2000]。仍然以三角形隶属函数为例，该内存CE阈值的隶属函数具体可参见图8所示。

并且，在确定内存CE数量、系统中断次数、内存CE阈值各自的模糊集之后，可以基于人为经验确定内存CE数量、系统中断次数的模糊集与内存CE阈值的模糊集之间的对应关系，从而可以建立相应的模糊控制规则。

可选地，该模糊控制规则包括模糊控制规则表。仍然以图6至图8所示的例子为例，该模糊控制规则表可以如下表1所示。

表1

或者，该模糊控制规则也包括用于表示内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间对应关系的模糊条件语句。

例如，上述表1对应25条模糊条件语句，其具体如下：

If “内存CE数量=Very Low”and “系统中断次数=Very Low”，Then “内存CE阈值=Very Low”；

If “内存CE数量=Very Low” and “系统中断次数= Low”，Then “内存CE阈值=Low”；

If “内存CE数量=Very Low” and “系统中断次数= Medium”，Then “内存CE阈值=Medium Low”；

…

If “内存CE数量= Medium” and “系统中断次数= Medium”，Then “内存CE阈值=Medium High”；

…

If “内存CE数量= Very High” and “系统中断次数= High”，Then “内存CE阈值=Very High”；

If “内存CE数量= Very High” and “系统中断次数= Very High”，Then “内存CE阈值= Very High”。

步骤S302，对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息。该当前内存可纠正错误信息包括当前内存可纠正错误数量，以及因内存可纠正错误而引发的当前系统中断次数。

其中，详情可参见图1所示实施例的步骤S102，在此不再赘述。

步骤S303，确定当前内存可纠正错误信息所对应的目标模糊集，并确定当前内存可纠正错误信息属于目标模糊集的隶属度。

本实施例中，由于对内存CE信息的整个论域划分为多个模糊集，而对于某个特定的当前内存CE信息，其一般只对应部分模糊集，例如只对应其中的两个模糊集；将当前内存CE信息所对应的模糊集称为目标模糊集。

并且，可以确定该当前内存CE信息属于相应目标模糊集的程度，即隶属度。其中，内存CE信息的每个模糊集均设有用于计算隶属度的函数，即隶属函数，也称为隶属度函数，可以基于目标模糊集的隶属函数，确定该当前内存CE信息的隶属度。

例如，当前内存CE信息属于两个目标模糊集，分别为目标模糊集1和目标模糊集2，目标模糊集1对应有隶属函数A₁(x)，目标模糊集2对应有隶属函数A₂(x)；则，基于该隶属函数A₁(x)，可以确定该当前内存CE信息的隶属度a1，该隶属度a1表示当前内存CE信息隶属于该目标模糊集1的隶属度；同样地，基于该隶属函数A₂(x)，可以确定该当前内存CE信息的隶属度a2，该隶属度a2表示当前内存CE信息隶属于该目标模糊集2的隶属度。

具体地，由于当前内存CE信息包括当前内存CE数量和当前系统中断次数，故可以分别确定当前内存CE数量和当前系统中断次数的目标模糊集。上述步骤S303“确定当前内存可纠正错误信息所对应的目标模糊集，并确定当前内存可纠正错误信息属于目标模糊集的隶属度”包括以下步骤S3031至步骤S3032。

步骤S3031，确定当前内存可纠正错误数量所对应的至少一个第一模糊集，并根据第一模糊集的第一隶属函数确定当前内存可纠正错误数量属于第一模糊集的第一隶属度。

本实施例中，当前内存CE数量是内存CE数量论域中的一个数值，该当前内存CE数量可以对应内存CE数量的至少一个模糊集；为方便描述，将当前内存CE数量对应的内存CE数量的模糊集称为第一模糊集，该第一模糊集的数量至少为一个。并且，由于内存CE数量的每个模糊集设有相应的隶属函数，故该第一模糊集也设有相应的隶属函数，即第一隶属函数，基于该第一隶属函数可以确定当前内存CE数量隶属于相应第一模糊集的隶属度，即第一隶属度。

以图6所示的内存CE数量模糊集为例。若当前内存CE数量为4500，参见图9所示，该当前内存CE数量与模糊集“中”以及模糊集“高”相对应，其可能属于这两个模糊集，而属于其他模糊集的隶属度均为0；因此，该当前内存CE数量4500对应两个第一模糊集：模糊集“中”、模糊集“高”。

并且，基于模糊集“中”的隶属函数可得，该当前内存CE数量4500对应的隶属度为0.75；如图9所示，对于第一模糊集“中”，该当前内存CE数量4500对应的第一隶属度A=0.75。类似地，对于第一模糊集“高”，该当前内存CE数量4500对应的第一隶属度B=0.25。

步骤S3032，确定当前系统中断次数所对应的至少一个第二模糊集，并根据第二模糊集的第二隶属函数确定当前系统中断次数属于第二模糊集的第二隶属度。

本实施例中，与上述步骤S3031相似，当前系统中断次数是系统中断次数论域中的一个数值，该当前系统中断次数可以对应系统中断次数的至少一个模糊集；为方便描述，将当前系统中断次数对应的系统中断次数的模糊集称为第二模糊集，该第二模糊集的数量至少为一个。并且，由于系统中断次数的每个模糊集设有相应的隶属函数，故该第二模糊集也设有相应的隶属函数，即第二隶属函数，基于该第二隶属函数可以确定当前系统中断次数隶属于相应第二模糊集的隶属度，即第二隶属度。

以图7所示的系统中断次数模糊集为例。若当前系统中断次数为750，参见图10所示，该当前系统中断次数与模糊集“中”以及模糊集“高”相对应，其可能属于这两个模糊集，而属于其他模糊集的隶属度均为0；因此，该当前系统中断次数750对应两个第二模糊集：模糊集“中”、模糊集“高”。

并且，基于模糊集“中”的隶属函数可得，该当前系统中断次数750对应的隶属度为0.5；如图10所示，对于第二模糊集“中”，该当前系统中断次数750对应的第二隶属度C=0.5。类似地，对于第二模糊集“高”，该当前系统中断次数750对应的第二隶属度D=0.5。

步骤S304，根据模糊控制规则，确定与目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据当前内存可纠正错误信息的隶属度确定当前内存可纠正错误阈值属于阈值模糊集的隶属度。

本实施例中，模糊控制规则可以表示内存CE信息的所有模糊集与内存CE阈值的所有模糊集之间的对应关系，而由于当前内存CE信息只所对应其中的部分模糊集，即目标模糊集是其中的一部分，故基于该模糊控制规则，可以确定与目标模糊集具有对应关系的内存CE阈值的模糊集，为方便描述，将这些内存CE阈值的模糊集称为“阈值模糊集”，该阈值模糊集也是需要确定的当前内存CE阈值（即当前内存可纠正错误阈值）所对应的模糊集。

并且，基于当前内存CE信息属于相应目标模糊集的隶属度，可以确定当前内存CE阈值属于相应阈值模糊集的隶属度。

例如，当前内存CE信息属于目标模糊集1，且基于模糊控制规则可以确定该目标模糊集1与内存CE阈值的某个阈值模糊集3之间具有对应关系；若该当前内存CE信息隶属于该目标模糊集1的隶属度为隶属度a1，则可基于该隶属度a1，确定当前内存CE阈值属于该阈值模糊集3的隶属度；例如，可以将该隶属度a1直接作为该当前内存CE阈值属于该阈值模糊集3的隶属度。

具体地，在确定当前内存CE数量对应的第一模糊集以及当前系统中断次数对应的第二模糊集，即可确定当前内存CE阈值对应的模糊集，即阈值模糊集，进而可以基于上述确定的第一隶属度和第二隶属度，确定当前内存CE阈值的隶属度。

可选地，上述步骤S304“根据模糊控制规则，确定与目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据当前内存可纠正错误信息的隶属度确定当前内存可纠正错误阈值属于阈值模糊集的隶属度”可以包括以下步骤A1至步骤A2。

步骤A1，根据模糊控制规则，确定与第一模糊集以及第二模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集。

本实施例中，模糊控制规则包括预先设定的输入变量与输出变量之间的对应关系，该输入变量为内存CE数量的模糊集和系统中断次数的模糊集，输出变量为内存CE阈值的模糊集。因此，在确定当前内存CE数量的第一模糊集和当前系统中断次数的第二模糊集，即可确定当前内存CE阈值所对应的阈值模糊集。

例如，该模糊控制规则如上述表1所示，当前内存CE数量为4500、当前系统中断次数为750，基于图9和图10可知，第一模糊集包括：模糊集“中”、模糊集“高”，第二模糊集也包括：模糊集“中”、模糊集“高”。

基于上述表1可知，若当前内存CE数量的模糊集为“中”、当前系统中断次数的模糊集为“中”，二者对应内存CE阈值的模糊集“中高”，故此时当前内存CE阈值的阈值模糊集为“中高”。具体地，基于第一模糊集以及第二模糊集确定的当前内存CE阈值的阈值模糊集可参见下表2所示。

表2

步骤A2，将当前内存可纠正错误数量的第一隶属度，与当前系统中断次数的第二隶属度中的较小值，作为当前内存可纠正错误阈值属于相应阈值模糊集的隶属度。

本实施例中，对于基于模糊控制规则确定的每一条对应关系，可以基于相应的第一隶属度和第二隶属度，计算得到该当前内存CE阈值的隶属度。其中，为便于计算，也为了能够使得所确定的内存CE阈值能够适用于实际情况，将第一隶属度与第二隶属度中的较小值，作为当前内存CE阈值属于相应阈值模糊集的隶属度。

继续以上述表2为例。当前内存CE数量的模糊集为“中”，其第一隶属度A=0.75，当前系统中断次数的模糊集为“中”，其第二隶属度C=0.5，此时对应的当前内存CE阈值的阈值模糊集为“中高”，并且，当前内存CE阈值属于该阈值模糊集“中高”的隶属度为第一隶属度A=0.75、第二隶属度C=0.5中的较小值，即0.5。具体地，当前内存CE阈值的隶属度可参见下表3所示。

表3

步骤S305，根据当前内存可纠正错误阈值的隶属度进行解模糊化，确定当前内存可纠正错误阈值。

本实施例中，在确定当前内存CE阈值的隶属度后，基于相应阈值模糊集的隶属函数进行解模糊化，从而可以确定精确的数值，该数值即可作为当前内存CE阈值。

在一些可选的实施方式中，上述步骤S305“根据当前内存可纠正错误阈值的隶属度进行解模糊化，确定当前内存可纠正错误阈值”具体可以包括以下步骤B1至步骤B3。

步骤B1，根据当前内存可纠正错误阈值的隶属度确定相应阈值模糊集的隶属函数中的有效区域。

本实施例中，可以确定当前内存CE阈值对应的多个阈值模糊集，且每个阈值模糊集对应有相应的隶属度。对于每一个阈值模糊集，可以根据当前内存CE阈值的隶属度，选取隶属函数所对应的有效区域。

由于该隶属度表示当前内存CE阈值隶属于阈值模糊集的程度，故可以将隶属函数所对应区域中，小于该当前内存可纠正错误阈值的隶属度的区域，作为相应的有效区域。

步骤B2，对多个阈值模糊集的隶属函数所对应的有效区域进行叠加，形成叠加区域。

步骤B3，根据叠加区域确定当前内存可纠正错误阈值。

在确定每个阈值模糊集对应的有效区域后，本实施例对这些有效区域进行叠加，形成用于计算当前内存CE阈值具体数值的区域，即叠加区域。该叠加区域可以表示当前内存CE阈值的隶属度分布情况，基于该叠加区域即可确定合适的当前内存CE阈值。

可选地，可以将上述步骤B3“根据叠加区域确定当前内存可纠正错误阈值”可以包括以下步骤B31。

步骤B31，将叠加区域的面积中位值，作为相应的当前内存可纠正错误阈值。

本实施例中，叠加区域的面积中位值对应内存CE阈值论域中的某个值，该中位值可以比较平衡地表示当前内存CE阈值，使得确定的当前内存CE阈值能够比较好地平衡系统稳定性和性能。

例如，继续以表2和表3所示的实施例为例。如上所述，当前内存CE阈值的阈值模糊集包括：模糊集“中高”、“高”、“非常高”，且三个阈值模糊集的隶属度分别为0.5、0.25、0.25。对于每一阈值模糊集的隶属函数，可以将小于相应隶属度的区域作为有效区域，并将三个有效区域叠加，最终形成叠加区域。

图11示出了形成叠加区域的示意图。其中，三个阈值模糊集“中高”、“高”、“非常高”的有效区域分别为图11左侧的阴影部分区域所示，将这三个有效区域进行合并，可以形成相应的叠加区域，该叠加区域可参见图11右侧的阴影部分区域所示。

之后，计算该叠加区域的面积中位值，可以确定该面积中位值为1400，故当前内存CE阈值可以设为1400。

本实施例中，在动态确定内存CE阈值时，可以每次均执行一次模糊控制。或者，也可基于模糊控制预先确定内存CE信息与内存CE阈值之间的对应关系，在更新内存CE阈值时，利用该对应关系可以直接确定合适的内存CE阈值。

具体地，该方法还可以包括：根据当前内存可纠正错误信息和相对应的当前内存可纠正错误阈值，建立内存可纠正错误信息与内存可纠正错误阈值之间的对应关系；内存可纠正错误信息与内存可纠正错误阈值之间的对应关系用于在之后更新内存可纠正错误阈值时，根据内存可纠正错误信息与内存可纠正错误阈值之间的对应关系确定更新后的内存可纠正错误阈值。

本实施例中，在确定当前内存CE阈值后，即可建立相应的内存CE信息与内存CE阈值之间的一条对应关系，例如，可以建立内存CE数量、系统中断次数与内存CE阈值之间的对应关系。利用不同的内存CE信息，可以确定相应的内存CE阈值，从而建立多条对应关系。可以预存内存CE信息与内存CE阈值之间的这些对应关系，在后续需要更新内存CE阈值时，在确定内存CE信息后，可以直接基于该对应关系确定相应的内存CE阈值。

例如，以上述图6至图8，以及表1为例，内存CE数量、系统中断次数与内存CE阈值之间的对应关系参见图12所示。

在一些可选的实施方式中，动态设置内存CE阈值的单位周期可以是固定，也可以是可变的。可选地，该方法还可以确定单位周期的过程，该过程具体包括以下步骤C1至步骤C2。

步骤C1，在阈值变化值大于第一阈值的情况下，减小单位周期；该单位周期的减小值与阈值变化值之间为正相关关系。

步骤C2，在阈值变化值小于第二阈值的情况下，增大单位周期；该单位周期的增大值与阈值变化值之间为负相关关系。

其中，阈值变化值为当前内存可纠正错误阈值与之前确定的历史内存可纠正错误阈值之间的差值。

本实施例中，在动态确定内存CE阈值的过程中，可以确定多个内存CE阈值，此时，当前内存CE阈值与之前确定的历史内存CE阈值之间的差值，可以表示内存CE阈值的变化情况；为方便描述，将该差值称为阈值变化值。其中，该历史内存CE阈值具体可以是上一次确定的内存CE阈值。

其中，若该阈值变化值较大，例如阈值变化值大于第一阈值，说明当前时间段设置的内存CE阈值可能不是很合适，需要较大幅度地对其进行调整，故此时为了能够及时调整内存CE阈值，可以减小单位周期。并且，该阈值变化值越大，该单位周期的减小值也越大，即单位周期的减小值与阈值变化值之间为正相关关系。

若该阈值变化值较小，例如阈值变化值小于第二阈值，说明当前时间段设置的内存CE阈值比较合适，此时基本不需要调整内存CE阈值，故此时可以适当地增大单位周期。并且，该阈值变化值越小，该单位周期的增大值可以越大，即单位周期的增大值与阈值变化值之间为负相关关系。

此外，为了能够避免变化的单位周期会影响内存CE数量、系统中断次数的论域，可以对统计到的内存CE数量、系统中断次数归一化至统一的时间段，例如将不同单位周期的内存CE数量、系统中断次数统一归一化为1个小时内的内存CE数量、系统中断次数。相应地，本实施例中模糊控制的输入变量也是归一化后的参数，即当前内存CE数量、当前系统中断次数是归一化后的参数。

图13示出了模糊控制的一种流程示意图。如图13所示，可以设置实现模糊控制的模糊控制器，该模糊控制器设有知识库，该知识库包括模糊控制规则，还可以包括与划分模糊集、隶属函数等相关的数据。在确定内存CE信息后，基于该模糊控制器可以对内存CE信息进行模糊化，即确定内存CE信息所属的模糊集，并利用知识库进行模糊推理；最后通过解模糊化确定相应的内存CE阈值。并且，还可以统计反馈信息，实现反馈控制。

在本实施例中提供了一种调整内存可纠正错误阈值的方法，可用于存在可纠正错误的设备，例如服务器等。图14是根据本发明实施例的调整内存可纠正错误阈值的方法的流程图，如图14所示，该流程包括以下步骤。

步骤S141，设置模糊控制规则；该模糊控制规则包括内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系。

具体地，该步骤S141“设置模糊控制规则”具体可以包括以下步骤S1411至步骤S1412。

步骤S1411，确定用于处理可纠正错误的当前资源剩余量。

步骤S1412，设置与当前资源剩余量相匹配的模糊控制规则。

本实施例中，模糊控制规则可以具有多种，可以基于当前实际环境确定合适的模糊控制规则。例如，可以预先设置多种模糊控制规则，在更新内存CE阈值时，基于当前环境选取其中合适的模糊控制规则。

其中，处理CE需要使用一定的资源。随着内存系统的长时间运行，处理内存CE的资源户会呈现单调性减小，内存CE出现的频率也呈现单调性增加，为了及时检测内存错误并保障内存性能，应综合考虑系统实际情况、稳定性和性能的需求，设置合理的模糊规则。具体地，可以确定用于处理CE的当前资源剩余量，基于该当前资源剩余量设置合适的模糊控制规则；依据资源剩余量选取当前合适的模糊控制规则，可以有效平衡系统稳定性和性能。

在一些可选的实施方式中，上述步骤S1412“设置与当前资源剩余量相匹配的模糊控制规则”包括步骤D1至步骤D2。

步骤D1，根据当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系。

步骤D2，生成与当前资源剩余量相匹配的模糊控制规则。

本实施例中，对于同一内存CE信息的模糊集，通过改变其所对应的内存CE阈值的模糊集，即改变二者之间的对应关系，即可实现对模糊控制规则的调整。因此，在确定当前资源剩余量之后，可以通过设置内存CE信息的模糊集与内存CE阈值的模糊集之间更合适的对应关系，从而可以生成相匹配的模糊控制规则。

在这种情况下，可以不改变内存CE信息的模糊集以及内存CE阈值的模糊集，只是改变二者之间的对应关系。

例如，上述表1示出了一种模糊控制规则。通过改变其中的对应关系，即可形成新的模糊控制规则。例如，另一种模糊控制规则可参见下表4所示。

表4

例如，可以预先设置多种上述表1、表4所示的对应不同严格程度的模糊控制规则，在确定当前资源剩余量后，即可选取并使用与当前资源剩余量相匹配的一种模糊控制规则。其中，表4所示的模糊控制规则比较适用于资源剩余量较少的情况。

可选地，上述步骤D1“根据当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系”可以包括以下步骤D11至步骤D13。

步骤D11，根据当前资源剩余量确定需要调整内存可纠正错误阈值变化速率的第一论域范围。

本实施例中，在某些情况下，需要调整内存CE阈值的变化速率，以能够更快地将内存CE阈值调整为所需的数值。例如，当处理内存CE的剩余资源仅剩余50%或30%时，可以可根据实际情况进行模糊控制规则的变化；例如，当剩余资源量仅剩30%，为能够及时检测内存CE，并保障内存性能，可以设置更大的内存CE阈值变化率。

具体地，根据当前资源剩余量可以确定需要调整内存CE阈值变化速率对应的部分论域范围，即第一论域范围。

例如，在当前资源剩余量较小时，可以调整偏小内存CE阈值对应的论域范围，例如，将前半部分论域范围作为需要调整内存CE阈值变化速率的第一论域范围。

步骤D12，确定内存可纠正错误信息的第一有效模糊集；该第一有效模糊集为第一论域范围所对应的内存可纠正错误信息的模糊集。

本实施例中，将与第一论域范围对应的内存CE信息的模糊集，称为第一有效模糊集。

例如，可以预先确定多种资源剩余量对应的内存CE信息的第一有效模糊集。或者，也可以设置一个基准的模糊控制规则，在确定第一论域范围后，可以确定内存CE阈值对应的属于该第一论域范围的模糊集，进而根据该基准的模糊控制规则中的对应关系，可以确定与该第一论域范围对应的内存CE信息的模糊集，即第一有效模糊集。

步骤D13，调整第一有效模糊集所对应的内存可纠正错误阈值的模糊集；并且，在需要增大内存可纠正错误阈值变化速率的情况下，增大多个第一有效模糊集所对应的内存可纠正错误阈值的模糊集的数量。

本实施例中，由于第一有效模糊集与需要调整的第一论域范围相对应，故调整第一有效模糊集所对应的内存可纠正错误阈值的模糊集，即调整二者之间的对应关系，即可调整在该第一论域范围内，输入变量的模糊集与输出变量的模糊集之间的对应关系，从而可以调整该第一论域范围内输出变量的变化速率，即内存CE阈值的变化速率。

具体地，若需要增大内存CE阈值的变化速率，则可以增大第一有效模糊集所对应的内存可纠正错误阈值的模糊集的数量。

例如，在该第一论域范围内，内存CE阈值只具有一个模糊集“中高”；若该第一论域范围对应内存CE信息的两个模糊集：“高”、“非常高”（这两个模糊集即为第一有效模糊集）；由于内存CE信息的模糊集“高”、“非常高”对应内存CE阈值的同一个模糊集“中高”，随着内存CE信息的变化，内存CE阈值的变化速率相对较小。本实施例中，增大两个模糊集对应的内存CE阈值模糊集的数量，例如增大为模糊集“中高”和“高”；此时，内存CE信息的模糊集“高”仍然对应内存CE阈值的模糊集“中高”，但将内存CE信息的模糊集“非常高”调整为对应内存CE阈值的模糊集“高”，使得当内存CE信息变化时，变化的内存CE阈值的模糊集可以增大内存CE阈值的变化速率。

此外可选地，上述步骤D1“根据当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系”可以包括以下步骤D14至步骤D15。

步骤D14，在内存可纠正错误阈值的模糊集固定不变的情况下，调整内存可纠正错误信息的模糊集所对应的内存可纠正错误阈值的模糊集，以确定不同的模糊控制规则。

步骤D15，在内存可纠正错误阈值的模糊集可变的情况下，调整内存可纠正错误阈值的模糊集数量，并设置内存可纠正错误信息的模糊集与调整后的内存可纠正错误阈值的模糊集之间的对应关系，以确定不同的模糊控制规则。

本实施例中，该内存CE阈值的模糊集可以是固定的，在这种情况下，通过调整内存CE信息对应哪一内存CE阈值的模糊集，从而可以生成不同的模糊控制规则。例如，内存CE阈值的模糊集始终保持为7个，通过调整内存CE信息与内存CE阈值之间模糊集的对应关系，可以基于表1生成表4所示的模糊控制规则。

或者，该内存CE阈值的模糊集也可以是可变的，即内存CE阈值的模糊集数量是可变的。在这种情况下，可以增大或减小内存CE阈值的模糊集的数量，并重新确定内存CE信息模糊集与内存CE阈值模糊集之间的对应关系。例如，将内存CE阈值的论域分为更多数量的模糊集，可以更精细地确定内存CE信息的模糊集与内存CE阈值的模糊集之间的对应关系，也能够改变局部内存CE阈值的变化速率。

在一些可选的实施方式中，上述步骤S1412“设置与当前资源剩余量相匹配的模糊控制规则”包括步骤E1。

步骤E1。根据当前资源剩余量，调整内存可纠正错误信息的至少部分模糊集的隶属函数，以生成与当前资源剩余量相匹配的模糊控制规则。

本实施例中，基于不同的隶属函数也可生成不同的模糊控制规则。例如，对于同一论域范围的模糊集，若改变其使用的隶属函数，例如从三角形隶属函数调整为梯形隶属函数，或者改变三角形隶属函数的形状等，即可形成不同的模糊控制规则，这些不同的模糊控制规则也对应内存CE阈值不同的变化速率。

其中，可以保持内存CE信息的模糊集与内存CE阈值的模糊集之间的对应关系不变，只改变模糊集的隶属函数；例如，保持表1所示的对应关系不变，通过改变模糊集的隶属函数，即可形成不同的模糊控制规则。或者，也可改变内存CE信息的模糊集与内存CE阈值的模糊集之间的对应关系，并同时改变模糊集的隶属函数；例如，可以基于上述步骤D1至步骤D2改变模糊集之间的对应关系，并基于上述步骤E1调整模糊集的隶属函数。

可选地，上述步骤E1“根据当前资源剩余量，调整内存可纠正错误信息的至少部分模糊集的隶属函数”可以包括以下步骤E11至步骤E13。

步骤E11，根据当前资源剩余量确定需要调整内存可纠正错误阈值变化速率的第二论域范围。

步骤E12，确定内存可纠正错误信息的第二有效模糊集；第二有效模糊集为第二论域范围所对应的内存可纠正错误信息的模糊集。

本实施例中，确定第二有效模糊集的过程，与上述步骤D11至步骤D12确定第一有效模糊集的过程相似，此处不作赘述。

可以理解，该第一论域范围与该第二论域范围可以相同，此时确定的第一有效模糊集与第二有效模糊集也是相同的。

步骤E13，至少调整第二有效模糊集的隶属函数中的上升段和/或下降段的斜率；并且，在需要增大内存可纠正错误阈值变化速率的情况下，增大斜率。

本实施例中，在确定第二有效模糊集后，通过调整其隶属函数实现对内存CE阈值变化速率的调整。其中，隶属函数包括上升段和/或下降段；顾名思义，该上升段是隶属函数中随着自变量增大，隶属度也增大所对应的部分，该下降段是隶属函数中随着自变量增大，隶属度减小所对应的部分。

若需要增大内存CE阈值变化速率，则可以增大相应的斜率，例如增大上升段、下降段的斜率。隶属函数更大的斜率，可以使得在内存CE信息较小变化的情况下，也可以确定较大范围的内存CE阈值，即可以增大内存CE阈值的变化速率。

可选地，上述步骤E13“至少调整有效模糊集的隶属函数中的上升段和/或下降段的斜率”可以包括以下步骤E131和/或步骤E132。

步骤E131，调整有效模糊集的隶属函数中的左侧界点与中间点之间的差值，以调整上升段的斜率。

步骤E132，调整有效模糊集的隶属函数中的中间点与右侧界点之间的差值，以调整下降段的斜率。

本实施例中，按照隶属函数的形式，可以确定其中的几个关键点，基于这些关键点可以确定上升段和下降段。具体地，隶属函数具有左侧界点和右侧节点，并且在二者之间还存在至少一个中间点。可以理解，左侧界点与中间点之间的区域为上升段，中间点与右侧界点之间的区域为下降段。

由于左侧界点、右侧节点对应的隶属度为0，而中间点对应的隶属度为1；故在调整上升段的斜率时，通过调整左侧界点与中间点之间的差值，既可以调整上升段的斜率。例如，减小左侧界点与中间点之间的差值，可以增大上升段的斜率。类似地，通过调整中间点与右侧界点之间的差值，可以调整下降段的斜率。

例如，对于图4所示的中间型的三角形隶属函数，其中的点a对应左侧界点，点c对应右侧节点，点b对应中间点。可以理解，对于三角形隶属函数，通过调整点a与点b之间的差值，即可调整上升段的斜率；通过调整点b与点c之间的差值，即可调整下降段的斜率。对于图4所示的中间型的三角形隶属函数，其中的点a对应左侧界点，点d对应右侧节点，点b、c均可作为中间点；其中，点a至点b之间为上升段，点c至点d之间为下降段。调整斜率的方式与三角形隶属函数相似，此处不作赘述。

并且，在调整隶属函数的斜率是，也可调整其对应的论域范围，即调整其左侧界点和/或右侧界点，以适应其他隶属函数的变化。

对比图6至图8所示的隶属度函数，保持模糊集数量不变的情况下，调整其中至少部分隶属函数的斜率，可以形成新的隶属函数，调整后的隶属函数具体可参见图15至图17。其中，图15表示内存CE数量的隶属函数，图16表示系统中断次数的隶属函数，图17表示内存CE阈值的隶属函数。基于这些新的隶属函数，即可形成新的模糊控制规则。

仍然以当前内存CE数量为4500、当前系统中断次数为750为例，对于基于图15至图17所示的隶属函数所构建的模糊控制规则，可以计算得到当前内存CE阈值为1270，该计算过程与图11所示的计算方式相同，此处不作赘述。

并且，对于任意当前内存CE信息，基于图15至图17所示的隶属函数所构建的模糊控制规则可以确定相应的当前内存CE阈值，即建立内存CE信息与内存CE阈值之间的对应关系，该对应关系具体可参见图18所示。

对比图12和图18所示的两种对应关系，也可以确定通过调整模糊集的隶属函数，可以实现对模糊控制规则的调整，从而可以调整内存CE阈值的变化速率。

可选地，上述步骤S1412“设置与当前资源剩余量相匹配的模糊控制规则”可以包括步骤E2。

步骤E2，调整内存可纠正错误信息的模糊集数量，并设置调整后的内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系，以确定不同的模糊控制规则。

本实施例中，除了可以调整隶属函数的斜率之外，还可以调整输入变量的模糊集数量，即调整内存CE信息的模糊集数量；例如，调整内存CE数量的模糊集数量，和/或系统中断次数的模糊集数量。与上述调整内存CE阈值模糊集数量相似，通过调整内存CE信息的模糊集数量，也可形成新的模糊控制规则，进而能够使用与当前资源剩余量相匹配的模糊控制规则。

步骤S142，对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息。

其中，详细请参见图1所示实施例的步骤S102，在此不再赘述。

步骤S143，确定当前内存可纠正错误信息所对应的目标模糊集，并确定当前内存可纠正错误信息属于目标模糊集的隶属度。

其中，详细请参见图1所示实施例的步骤S103，在此不再赘述。

步骤S144，根据模糊控制规则，确定与目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据当前内存可纠正错误信息的隶属度确定当前内存可纠正错误阈值属于阈值模糊集的隶属度。

其中，详细请参见图1所示实施例的步骤S104，在此不再赘述。

步骤S145，根据当前内存可纠正错误阈值的隶属度进行解模糊化，确定当前内存可纠正错误阈值。

其中，详细请参见图1所示实施例的步骤S105，在此不再赘述。

本实施例提供的调整内存可纠正错误阈值的方法，设置多套内存CE阈值变化的模糊控制规则，根据可处理内存CE的剩余资源合理选择合适的模糊控制规则，进一步加强了内存CE问题的检测和处理的准确性，自适应性强，能够有效平衡系统的稳定性和性能。

在本实施例中还提供了一种调整内存可纠正错误阈值的装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

本实施例提供一种调整内存可纠正错误阈值的装置，如图19所示，包括：

规则设置模块1901，用于设置模糊控制规则；所述模糊控制规则包括内存可纠正错误数量的模糊集以及系统中断次数的模糊集，与内存可纠正错误阈值的模糊集之间的对应关系；

统计模块1902，用于对在单位周期内与可纠正错误相关的信息进行统计，生成当前内存可纠正错误信息；所述当前内存可纠正错误信息包括当前内存可纠正错误数量，以及因内存可纠正错误而引发的当前系统中断次数；

模糊处理模块1903，用于根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，确定与所述当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值。

在一些可选的实施方式中，模糊处理模块1903根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，包括：确定所述当前内存可纠正错误信息所对应的目标模糊集，并确定所述当前内存可纠正错误信息属于所述目标模糊集的隶属度；根据所述模糊控制规则，确定与所述目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据所述当前内存可纠正错误信息的隶属度确定所述当前内存可纠正错误阈值属于所述阈值模糊集的隶属度；根据所述当前内存可纠正错误阈值的隶属度进行解模糊化，以确定相应的当前内存可纠正错误阈值。

在一些可选的实施方式中，所述模糊处理模块1903确定所述当前内存可纠正错误信息所对应的目标模糊集，并确定所述当前内存可纠正错误信息属于所述目标模糊集的隶属度，包括：

确定所述当前内存可纠正错误数量所对应的至少一个第一模糊集，并根据所述第一模糊集的第一隶属函数确定所述当前内存可纠正错误数量属于所述第一模糊集的第一隶属度；

确定所述当前系统中断次数所对应的至少一个第二模糊集，并根据所述第二模糊集的第二隶属函数确定所述当前系统中断次数属于所述第二模糊集的第二隶属度。

在一些可选的实施方式中，所述模糊处理模块1903根据所述模糊控制规则，确定与所述目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据所述当前内存可纠正错误信息的隶属度确定所述当前内存可纠正错误阈值属于所述阈值模糊集的隶属度，包括：

根据所述模糊控制规则，确定与所述第一模糊集以及所述第二模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集；

将所述当前内存可纠正错误数量的第一隶属度，与所述当前系统中断次数的第二隶属度中的较小值，作为所述当前内存可纠正错误阈值属于相应阈值模糊集的隶属度。

在一些可选的实施方式中，所述模糊处理模块1903根据所述当前内存可纠正错误阈值的隶属度进行解模糊化，以确定所述当前内存可纠正错误阈值，包括：

根据所述当前内存可纠正错误阈值的隶属度确定相应阈值模糊集的隶属函数中的有效区域；

对多个所述阈值模糊集的隶属函数所对应的所述有效区域进行叠加，形成叠加区域；

根据所述叠加区域确定当前内存可纠正错误阈值。

在一些可选的实施方式中，所述模糊处理模块1903根据所述叠加区域确定当前内存可纠正错误阈值，包括：

将所述叠加区域的面积中位值，作为相应的当前内存可纠正错误阈值。

在一些可选的实施方式中，该装置还包括周期确定模块，用于：在阈值变化值大于第一阈值的情况下，减小所述单位周期；所述单位周期的减小值与所述阈值变化值之间为正相关关系；在阈值变化值小于第二阈值的情况下，增大所述单位周期；所述单位周期的增大值与所述阈值变化值之间为负相关关系；其中，所述阈值变化值为所述当前内存可纠正错误阈值与之前确定的历史内存可纠正错误阈值之间的差值。

在一些可选的实施方式中，所述规则设置模块1901设置模糊控制规则，包括：

确定用于处理可纠正错误的当前资源剩余量；

设置与所述当前资源剩余量相匹配的模糊控制规则。

在一些可选的实施方式中，所述规则设置模块1901设置与所述当前资源剩余量相匹配的模糊控制规则，包括：

根据所述当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系；

生成与所述当前资源剩余量相匹配的模糊控制规则。

在一些可选的实施方式中，所述规则设置模块1901根据所述当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系，包括：

根据所述当前资源剩余量确定需要调整内存可纠正错误阈值变化速率的第一论域范围；

确定内存可纠正错误信息的第一有效模糊集；所述第一有效模糊集为所述第一论域范围所对应的内存可纠正错误信息的模糊集；

调整所述第一有效模糊集所对应的内存可纠正错误阈值的模糊集；并且，在需要增大内存可纠正错误阈值变化速率的情况下，增大多个所述第一有效模糊集所对应的内存可纠正错误阈值的模糊集的数量。

在内存可纠正错误阈值的模糊集固定不变的情况下，调整内存可纠正错误信息的模糊集所对应的内存可纠正错误阈值的模糊集，以确定不同的模糊控制规则；

在内存可纠正错误阈值的模糊集可变的情况下，调整内存可纠正错误阈值的模糊集数量，并设置内存可纠正错误信息的模糊集与调整后的内存可纠正错误阈值的模糊集之间的对应关系，以确定不同的模糊控制规则。

根据所述当前资源剩余量，调整内存可纠正错误信息的至少部分模糊集的隶属函数，以生成与所述当前资源剩余量相匹配的模糊控制规则。

在一些可选的实施方式中，所述规则设置模块1901根据所述当前资源剩余量，调整内存可纠正错误信息的至少部分模糊集的隶属函数，包括：

根据所述当前资源剩余量确定需要调整内存可纠正错误阈值变化速率的第二论域范围；

确定内存可纠正错误信息的第二有效模糊集；所述第二有效模糊集为所述第二论域范围所对应的内存可纠正错误信息的模糊集；

至少调整所述第二有效模糊集的隶属函数中的上升段和/或下降段的斜率；并且，在需要增大内存可纠正错误阈值变化速率的情况下，增大所述斜率。

在一些可选的实施方式中，所述规则设置模块1901至少调整所述有效模糊集的隶属函数中的上升段和/或下降段的斜率，包括：

调整所述有效模糊集的隶属函数中的左侧界点与中间点之间的差值，以调整上升段的斜率；

和/或，调整所述有效模糊集的隶属函数中的中间点与右侧界点之间的差值，以调整下降段的斜率。

在一些可选的实施方式中，所述规则设置模块1901设置与所述当前资源剩余量相匹配的模糊控制规则，还包括：

调整内存可纠正错误信息的模糊集数量，并设置调整后的内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系，以确定不同的模糊控制规则。

在一些可选的实施方式中，该装置还包括建立模块，用于：根据所述当前内存可纠正错误信息和相对应的所述当前内存可纠正错误阈值，建立内存可纠正错误信息与内存可纠正错误阈值之间的对应关系；所述内存可纠正错误信息与内存可纠正错误阈值之间的对应关系用于在之后更新内存可纠正错误阈值时，根据所述内存可纠正错误信息与内存可纠正错误阈值之间的对应关系确定更新后的内存可纠正错误阈值。

在一些可选的实施方式中，所述模糊控制规则包括模糊控制规则表，或者所述模糊控制规则包括用于表示内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间对应关系的模糊条件语句。

上述各个模块和单元的更进一步的功能描述与上述对应实施例相同，在此不再赘述。

本实施例中的调整内存可纠正错误阈值的装置是以功能单元的形式来呈现，这里的单元是指ASIC（Application Specific Integrated Circuit，专用集成电路）电路，包括执行一个或多个软件或固定程序的处理器和存储器，和/或其他可以提供上述功能的器件。

本发明实施例还提供一种服务器，该服务器可以包括内存、阈值寄存器、计数寄存器、存储器和处理器。该阈值寄存器用于存储内存可纠正错误阈值；该计数寄存器用于对内存产生的内存可纠正错误进行计数，并在计数达到阈值寄存器中的内存可纠正错误阈值时，触发系统中断。其工作原理可参见图2所示的相关描述。

或者，请参阅图20，图20是本发明可选实施例提供的一种服务器的结构示意图，如图20所示，该服务器包括：一个或多个处理器10、存储器20，以及用于连接各部件的接口，包括高速接口和低速接口。

处理器10可以是中央处理器，网络处理器或其组合。存储器20可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据服务器的使用所创建的数据等。

该服务器还包括输入装置30和输出装置40。处理器10、存储器20、输入装置30和输出装置40可以通过总线或者其他方式连接，图20中以通过总线连接为例。

本发明实施例还提供了一种计算机可读存储介质，上述根据本发明实施例的方法可在硬件、固件中实现，或者被实现为可记录在存储介质，或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中，存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等；进一步地，存储介质还可以包括上述种类的存储器的组合。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件，当软件或计算机代码被计算机、处理器或硬件访问且执行时，实现上述实施例示出的方法。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种调整内存可纠正错误阈值的方法，其特征在于，所述方法包括：

根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，确定与所述当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值；

其中，所述根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，包括：

确定所述当前内存可纠正错误信息所对应的目标模糊集，并确定所述当前内存可纠正错误信息属于所述目标模糊集的隶属度；

根据所述模糊控制规则，确定与所述目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据所述当前内存可纠正错误信息的隶属度确定所述当前内存可纠正错误阈值属于所述阈值模糊集的隶属度；

根据所述当前内存可纠正错误阈值的隶属度进行解模糊化，以确定相应的当前内存可纠正错误阈值。

2.根据权利要求1所述的方法，其特征在于，所述确定所述当前内存可纠正错误信息所对应的目标模糊集，并确定所述当前内存可纠正错误信息属于所述目标模糊集的隶属度，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述模糊控制规则，确定与所述目标模糊集具有对应关系的当前内存可纠正错误阈值的阈值模糊集，并根据所述当前内存可纠正错误信息的隶属度确定所述当前内存可纠正错误阈值属于所述阈值模糊集的隶属度，包括：

4.根据权利要求1至3任意一项所述的方法，其特征在于，所述根据所述当前内存可纠正错误阈值的隶属度进行解模糊化，以确定相应的当前内存可纠正错误阈值，包括：

根据所述叠加区域确定当前内存可纠正错误阈值。

5.根据权利要求4所述的方法，其特征在于，所述根据所述叠加区域确定当前内存可纠正错误阈值，包括：

6.根据权利要求1所述的方法，其特征在于，还包括：

在阈值变化值大于第一阈值的情况下，减小所述单位周期；所述单位周期的减小值与所述阈值变化值之间为正相关关系；

在阈值变化值小于第二阈值的情况下，增大所述单位周期；所述单位周期的增大值与所述阈值变化值之间为负相关关系；

其中，所述阈值变化值为所述当前内存可纠正错误阈值与之前确定的历史内存可纠正错误阈值之间的差值。

7.根据权利要求1所述的方法，其特征在于，所述设置模糊控制规则，包括：

确定用于处理可纠正错误的当前资源剩余量；

设置与所述当前资源剩余量相匹配的模糊控制规则。

8.根据权利要求7所述的方法，其特征在于，所述设置与所述当前资源剩余量相匹配的模糊控制规则，包括：

生成与所述当前资源剩余量相匹配的模糊控制规则。

9.根据权利要求8所述的方法，其特征在于，所述根据所述当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系，包括：

10.根据权利要求8所述的方法，其特征在于，所述根据所述当前资源剩余量设置内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间的对应关系，包括：

11.根据权利要求7所述的方法，其特征在于，所述设置与所述当前资源剩余量相匹配的模糊控制规则，包括：

12.根据权利要求11所述的方法，其特征在于，所述根据所述当前资源剩余量，调整内存可纠正错误信息的至少部分模糊集的隶属函数，包括：

13.根据权利要求12所述的方法，其特征在于，所述至少调整所述有效模糊集的隶属函数中的上升段和/或下降段的斜率，包括：

14.根据权利要求11所述的方法，其特征在于，所述设置与所述当前资源剩余量相匹配的模糊控制规则，还包括：

15.根据权利要求1所述的方法，其特征在于，还包括：

根据所述当前内存可纠正错误信息和相对应的所述当前内存可纠正错误阈值，建立内存可纠正错误信息与内存可纠正错误阈值之间的对应关系；所述内存可纠正错误信息与内存可纠正错误阈值之间的对应关系用于在之后更新内存可纠正错误阈值时，根据所述内存可纠正错误信息与内存可纠正错误阈值之间的对应关系确定更新后的内存可纠正错误阈值。

16.根据权利要求1所述的方法，其特征在于，所述模糊控制规则包括模糊控制规则表，或者所述模糊控制规则包括用于表示内存可纠正错误信息的模糊集与内存可纠正错误阈值的模糊集之间对应关系的模糊条件语句。

17.一种调整内存可纠正错误阈值的装置，其特征在于，所述装置包括：

模糊处理模块，用于根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，确定与所述当前内存可纠正错误信息之间具有非线性映射关系的当前内存可纠正错误阈值；

其中，所述模糊处理模块根据所述模糊控制规则对所述当前内存可纠正错误信息进行模糊推理，包括：

18.一种服务器，其特征在于，包括：内存、阈值寄存器、计数寄存器、存储器和处理器；

所述阈值寄存器用于存储内存可纠正错误阈值；

所述计数寄存器用于对所述内存产生的内存可纠正错误进行计数，并在计数达到所述阈值寄存器中的内存可纠正错误阈值时，触发系统中断；

所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行权利要求1至16中任一项所述的调整内存可纠正错误阈值的方法。

19.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机指令，所述计算机指令用于使计算机执行权利要求1至16中任一项所述的调整内存可纠正错误阈值的方法。