WO2023208231A1

WO2023208231A1 - 一种内存数据读写方法、系统以及内存控制器

Info

Publication number: WO2023208231A1
Application number: PCT/CN2023/091842
Authority: WO
Inventors: 陈智勇; 焦慧芳
Original assignee: 华为技术有限公司
Priority date: 2022-04-29
Filing date: 2023-04-28
Publication date: 2023-11-02

Abstract

一种内存数据读写方法、系统以及内存控制器，本申请中，内存控制器需要将数据写入到通道组时，内存控制器获取目标数据；调用ECC算法生成目标数据的校验码，校验码用于对目标数据进行校验以及纠错。内存控制器将目标数据以及校验码写入到通道组中，该目标数据分散存储在通道组的通道中。校验码分散存储在通道组的各个通道中。每个通道组中存在能够存储校验码的内存颗粒，该目标数据的校验码分散存储在各个通道中存储校验码的内存颗粒上，存储该目标数据的校验码的内存颗粒数量较多，校验码的数据量更大，保证该内存具备较强的纠错能力。另以通道组为粒度实现ECC，不需要变更内存中存储校验码的内存颗粒的数目，无需额外增加内存成本。

Description

一种内存数据读写方法、系统以及内存控制器

相关申请的交叉引用

本申请要求于2022年4月29日提交中国专利局、申请号为202210475855.4、发明名称为“一种内存系统和内存纠错方法”的中国专利申请的优先权，以及于2022年07月18日提交的申请号为202210841487.0、发明名称为“一种内存数据读写方法、系统以及内存控制器”的中国专利申请的优先权，前述两件专利申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及存储技术领域，尤其涉及一种内存数据读写方法、系统以及内存控制器。

背景技术

与双倍速率同步动态随机存储器(double data rate synchronous dynamic random access memory，DDR)DDR4 JEDEC标准相比，DDR5 JEDEC标准中在内存中引入了子通道(Sub-channel)的概念，DDR5标准下的内存中包括两个子通道，每个子通道包括多个内存颗粒。这两个子通道相互独立，每个子通道独立实现错误检测和纠错(error checking and correcting，ECC)，也即内存控制器需要独立的对每个子通道内部存储的数据进行校验、以及纠错。

每个子通道独立的实现ECC，每个子通道中设置有用于存储校验码的内存颗粒，在实际应用中，每个子通道中这类用于存储校验码的内存颗粒的数量较少，限制了内存的纠错能力。

发明内容

本申请提供一种内存数据读写方法、系统以及内存控制器，用以提升内存纠错能力。

第一方面，本申请实施例提供了一种内存数据读写方法，方法可以由内存控制器或集成有内存控制器的处理器执行，该方法用于实现对内存的数据读写。在本申请中，内存包括一个或多个通道组，每个通道组包括多个通道。在该方法中，当内存控制器需要将数据写入到通道组时，内存控制器获取需要写入通道组的目标数据；调用ECC算法生成目标数据的校验码，校验码用于对目标数据进行校验以及纠错。内存控制器在生成该目标数据的校验码之后，可以将目标数据以及校验码写入到通道组中，其中，该目标数据分散存储在通道组的通道中。校验码分散存储在通道组的各个通道中。

通过上述方法，每个通道组中存在能够存储校验码的内存颗粒，该目标数据的校验码可以分散存储在各个通道中存储校验码的内存颗粒上，能够存储该目标数据的校验码的内存颗粒数量较多，说明在生成校验码时，可以生成数据量更大的校验码。数据量较大的校验码能够保证该内存具备较强的纠错能力。另外，采用该方法仅需以通道组为粒度实现ECC，并不需要变更内存中存储校验码的内存颗粒的数目，无需额外增加内存成本。

在一种可能的实施方式中，每个通道包括一个或多个RANK，每个RANK中包括多个内存颗粒。也就是说，一个通道组里有可以包括多个RANK，使得保证该通道组具备较大的存储空间，以实现大粒度数据存储。

在一种可能的实施方式中，内存控制器在生成该目标数据的校验码之后，将目标数据以及校验码写入到通道组时，可以将目标数据拆分为多个目标数据段，其中，该多个目标数据段的数据长度可以相同，也可以不同。内存控制器将校验码拆分为多个校验码段，其中，该多个校验码段的数据长度可以相同，也可以不同。之后，内存控制器可以将多个目标数据段分别写入通道组中的各个通道，将多个校验码段分别写入通道组中的各个通道。

在一种可能的实施方式中，内存控制器还可以从通道组中读取数据，内存控制器在处理器的指示下，可以从通道组中读取目标数据以及校验码，并利用校验码对目标数据进行纠错。在纠错成功后，将纠错后的目标数据反馈至处理器。

通过上述方法，内存控制器以通道组粒度从内存中读取数据并实现数据纠错，以通道组粒度的数据读取能够提升数据读取效率。

在一种可能的实施方式中，内存控制器还可以对通道组中的数据进行更新，内存控制器在处理器的指示下，可以从通道组中读取目标数据以及校验码，在对目标数据更新后，生成更新后的目标数据的校验码。内存控制器将更新后的目标数据以及更新后的目标数据的校验码写入到通道组中。其中，该更新后的目标数据分散存储在通道组的通道中。更新后的目标数据的校验码分散存储在通道组的各个通道中。

通过上述方法，内存控制器对内存中数据的更新也是以通道组为粒度，更新后的目标数据的校验码可以分散存储在通道组的各个通道中，也就是说，更新前后，校验码的数据量并为发生变化，依旧可以保证内存具备较强的纠错能力。

在一种可能的实施方式中，为了便于内存控制器与处理器之间的交互，内存控制器一次写入到内存的通道组中的数据等于内存控制器与处理器之间一次交互的数据量，也就是说，内存控制器一次写入到内存的通道组中的数据可以等于处理器中缓存的位宽。在一些场景中，内存控制器一次写入到内存的通道组中的数据也可以等于处理器之间一次交互的数据量的倍数。这样，能够保证内存控制器与内存之间实现大粒度的数据读写，提升内存控制器与内存之间的交互效率。

在一种可能的实施方式中，为了便于内存控制器与处理器之间的交互，内存控制器一次写入到通道组中一个通道的数据等于处理器中缓存的位宽。也就是说，内存控制器一次写入到通道组的数据可以等于处理器中缓存的位宽的倍数。这样，内存控制器一次能够向通道组中写入的数据较多，保证了内存控制器与内存之间的交互效率。

在一种可能的实施方式中，本申请实施例并不限定该通道组中通道的数量。例如，通道组中通道的数量等于2、3、4、6、8、12、或16。

通过上述方法，通道组中通道的数量存在多种设置方式，适用于不同场景。

在一种可能的实施方式中，内存控制器在生成目标数据的校验码时可以调用不同的ECC算法，也可以调用多种ECC算法。例如，内存控制器可以调用RS编码算法、循环冗余校验(cyclic redundancy check，CRC)算法、BCH(bose ray-chaudhuri hocquenghem)算法、哈希(HASH)算法、或独立磁盘冗余阵列(redundant array of independent disks，RAID)算法(如RAID 5算法、RAID 6算法)中的任一种算法生成目标数据的校验码。又例如，内存控制器可以调用RS编码算法、CRC算法、BCH算法、HASH算法、或RAID算法(中的任多种算法形成两级或者多级ECC算法生成目标数据的校验码。

通过上述方法，内存控制器在生成目标数据的校验码时能够灵活的调用一种或多种ECC算法，使得该方法能够适用于多种不同的应用场景。

在一种可能的实施方式中，每个通道中设置有用于存储校验码的内存颗粒，在每个通道中存储校验码的内存颗粒一定的情况下，内存控制器一次向该通道组中写入的校验码的最大数据量与该类内存颗粒的位宽成倍数(该倍数的取值与内存颗粒的数量以及一个时钟周期内对内存颗粒读写次数有关)关系。内存控制器生成校验码的数据量可以等于该最大数据量，这样该第一校验码可以分布在通道组中的每个存储校验码的内存颗粒上。内存控制器生成第一校验码的数据量也可以小于该最大数据量，这样该第一校验码可以分布在通道组中的部分存储校验码的内存颗粒上或该校验码只占用存储校验码的内存颗粒的部分存储空间。

通过上述方法，校验码的分布方式较为灵活，有效扩展了应用场景。

第二方面，本申请实施例提供了一种内存系统，该内存系统中包括内存和内存控制器，有益效果可以参见第一方面的相关说明，此处不再赘述。该内存系统中包括内存和内存控制器。

内存包括一个或多个通道组，每个通道组包括多个通道，每个通道包括一个或多个RANK，每个RANK中包括多个内存颗粒，方法由内存控制器执行，方法包括：

内存控制器可以获取需要写入通道组的目标数据；生成目标数据的校验码，校验码用于对目标数据进行校验以及纠错；将目标数据以及校验码写入到通道组中，校验码分散存储在通道组的各个通道中，目标数据分散存储在通道组的通道中。

在一种可能的实施方式中，内存控制器还可以从内存中读取数据。例如，内存控制器可以在处理器的指示下，从通道组中读取目标数据以及校验码；利用校验码对目标数据进行纠错；将纠错后的目标数据反馈至处理器。

在一种可能的实施方式中，一次写入到通道组中的数据等于处理器中缓存的位宽。

在一种可能的实施方式中，一次写入到通道组中一个通道的数据等于处理器中缓存的位宽。

在一种可能的实施方式中，通道组中通道的数量等于2、3、4、6、8、12或16。

在一种可能的实施方式中，内存控制器在生成目标数据的第一校验码时，可以调用RS8编码算法或RS16编码算法生成目标数据的校验码。也可以调用其他ECC算法生成目标数据的校验码。

在一种可能的实施方式中，每个通道包括一个或多个RANK，每个RANK中包括多个内存颗粒。

在一种可能的实施方式中，内存控制器在将目标数据以及校验码写入到通道组中时，可以将目标数据拆分为多个目标数据段，将校验码拆分为多个校验码段；将多个目标数据段分别写入通道组中的各个通道，将多个校验码段分别写入通道组中的各个通道。

第三方面，本申请实施例还提供了一种内存控制器，该内存控制器包括处理单元以及缓存单元，缓存单元用于缓存数据，如缓存需要写入到通道组的数据，还可以缓存该数据的校验码。处理单元可以运行烧写在其上的计算机程序执行或运行获取的计算机程序指令执行上述第一方面以及第一方面的各个可能的实施方式中所述的方法。

第四方面，本申请实施例还提供了一种计算设备，该计算设备包括第二方面所提及的内存系统。

第五方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面以及第一方面的各个可能的实施方式中所述的方法。

第六方面，本申请还提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面以及第一方面的各个可能的实施方式中所述的方法。

第七方面，本申请还提供一种计算机芯片，所述芯片与存储器相连，所述芯片用于读取并执行所述存储器中存储的软件程序，执行上述第一方面以及第一方面的各个可能的实施方式中所述的方法。

附图说明

图1A为一种内存结构示意图；

图1B为一种内存中数据分布示意图；

图2为一种本申请实施例提供的一种内存结构示意图；

图3A～3B为一种本申请实施例提供的一种内存系统结构示意图；

图4为一种本申请实施例提供的一种内存数据读写方法示意图；

图5A～5B为一种本申请实施例提供的一种数据写入示意图；

图6A～6B为一种本申请实施例提供的一种数据读取示意图。

具体实施方式

如图1A所示，为一种DDR5 JEDEC标准下的内存的结构示意图，DDR5 JEDEC标准下的内存包括两个子通道(sub-channel)，每个通道上包括一个或者多个RANK。每个RANK中包括多个内存颗粒(chip)。

相较于DDR4 JEDEC标准，DDR5 JEDEC标准下的内存引入了子通道的概念，DDR5 JEDEC标准下的内存中允许包括两个子通道，这两个子通道之间彼此独立，内存控制器可以与每个子通道分别进行数据交互。

DDR5 JEDEC标准下的内存同样需要保证内存的可靠性、可实用性以及可服务性(reliability，availability，serviceability，RAS)。DDR5 JEDEC标准下的内存需支持错误检测和纠错(Error Checking and Correcting，ECC)，以使得内存中的数据发生错误时，能够及时进行定位、以及纠错。

这里介绍下内存实现ECC的方式：

当内存控制器需要将数据写入到内存中，在将数据写入时，内存控制器调用ECC算法为该数据生成该数据的校验码，内存控制器将数据以及该数据的校验码写入到内存中。

需要说明的是，ECC算法并不特指某一个算法或某一种算法，在本申请实施例中ECC算法用于表征一类用于生成校验码的算法。

当内存控制器在处理器的指示下读取数据时，内存控制器除了从内存中读取数据，还会从内存中读取该数据的校验码，利用该校验码对所读取的数据进行校验，确定该数据中是否出错，若读取的数据存在错误数据，内存控制器会利用校验码对所读取的数据进行纠错，若纠错成功，将纠错后的数据反馈至处理器。

校验码的数据量越大，该校验码具备的纠错能力越强。纠错能力较强的纠错码能够对数据中较多的出错数据进行纠错。考虑到内存内有限的存储空间，在实际应用在中，并不允许校验码占用较多存储空间，校验码只能集中在少量的内存颗粒中。这样限制了内存本身的纠错能力。

内存中数据的校验码通常对数据中存在的单个比特的错误数据可进行纠错，当数据中存在多个比特的出错数据时，内存控制器能够检测到多个比特的出错数据，但并不一定能够对该多个比特的出错数据进行纠错，尤其是该多个比特的出错数据集中在一个内存颗粒。

通常，将能够修正一个内存颗粒中的多比特错误的纠错能力称为芯片删除(chipkill)能力。能够纠正一个X4颗粒(X4颗粒为位宽为4比特的内存颗粒)，称为X4 chipkill能力。类似的，能够纠正一个X8颗粒(X8颗粒为位宽为8比特的内存颗粒)，称为X8 chipkill能力。内存颗粒的位宽不同，内存的芯片删除(Chipkill)能力也不同。

如1B所示，为一种DDR5 JEDEC标准下的内存中通道中数据与校验码的分布示意图。图1B中，为内存控制器一次向通道写入数据时，通道中数据与校验码的大小分别为256比特、64比特。也就是说，内存控制器一次能够向该通道中写入256比特的数据，校验码的大小可以达到64比特。

但DDR5 JEDEC标准下的内存，每个通道独立实现ECC。也就是说，一个通道中数据的校验码存储在该通道中，一个通道中存储的校验码只用于对该通道内的数据进行校验以及纠错。一个通道的内存颗粒分为存储数据的内存颗粒以及存储校验码的内存颗粒。

若DDR5JEDEC标准下的内存中的内存颗粒为X4颗粒，每个颗粒的位宽为4比特。一个子通道有10个X4颗粒，相应的冗余比为4:1。也就是说，当设置8个存储数据的X4颗粒，同时配置2个X4颗粒存储校验码，这样2个X4颗粒中存储的校验码可以对8个存储数据的X4颗粒中任一内存颗粒出现的多比特错误进行纠错，该纠错能力称为X4 chipkill能力。

若内存中的内存颗粒为X8颗粒，DDR5内存相应的冗余比为4:1。也就是说，当设置4个存储数据的X8颗粒，同时配置1个X8颗粒存储校验码，这样1个X8颗粒中存储的校验码并不能对8个存储数据的X8颗粒中任一内存颗粒出现的多比特错误进行纠错，内存的纠错能力无法达到X8 chipkill能力。

若内存颗粒为X8颗粒，常见的，一个DDR5JEDEC标准下的通道中存储数据的颗粒数与存储校验码的颗粒数的比例为4:1，无法对单个内存颗粒中的出现的多比特错误进行纠错，纠错能力较差。为了将内存的纠错能力提升到X8 chipkill能力，则需要在一个通道中再增加一个存储校验码的X8颗粒，以保证存储数据的内存颗粒的数量与存储校验码的内存颗粒的数量比例与X8 chipkill能力要求比例(也即2:1)，这样无疑会增加内存的成本。

可见，在DDR5 JEDEC标准下甚至后续同样引入子通道或类似子通道的概念的DDR标准下的内存，亟需一种既能够保证内存成本，又能提升纠错能力的内存纠错方法。

为此，本申请实施例提供了一种内存纠错方法，在本申请实施例中，内存控制器可以对内存中多个通道构成的通道组中存储的数据计算校验码，所生成的校验码分散存储到该通道组的各个通道中。由于该校验码能够分散存储在多个通道中，校验码的数据量能够得到有效提升，在这种方式中，无需增加新的用于存储校验码的内存颗粒，在提升内存纠错能力的同时避免了内存成本的提高。

如图2所示，为本申请实施例提供的一种内存的结构示意图，该内存100中包括一个或多个通道组，每个通道组包括多个通道。一个通道组中的多个通道可以为内存100中位置靠近的多个通道。

每个通道包括一个或多个RANK，每个RANK包括多个内存颗粒。每个通道所包括多个内存颗粒可以分为两种，一种为存储数据的内存颗粒，另一种为存储校验码的内存颗粒。

在本申请实施例，将内存控制器200一次从通道中写入或读取的数据(此处的数据不包括校验码)的大小称为通道的大小。本申请实施例并不限定通道的具体大小，通道的具体大小与通道中RANK的数量、每个RANK中内存颗粒的数量、以及内存颗粒的类型有关。例如，通道的大小可以等于处理器中缓存(cacheline)的宽度，如通道的大小可以为64字节。

在本申请实施例中，将内存控制器200一次从通道组中写入或读取的数据(此处的数据不包括校验码)的大小称为通道组的大小。通道组的大小与通道组中通道的数量有关，通道组的具体大小与内存控制器200的处理能力以及期望内存100所具备的纠错能力有关。本申请实施例并不限定通道组的具体大小。

例如，若期望内存100所具备较强的纠错能力、且内存控制器200具备较佳的性能，那么，一个通道组需要在包括较多的用于存储校验码的内存颗粒，这种情况下，可以设置较大的通道组，通道组中包括较多的通道。

在本申请实施例中以通道组为粒度实现ECC。也就是说，在计算数据的校验码时，内存控制器200将该通道组中各个通道中所存储的数据作为一个整体数据，基于该整体数据生成该校验码。生成的校验码可以分散存储在该通道组中各个通道中。

例如，一个通道组中的每个通道中设置K个用于存储校验码的内存颗粒，若该通道组中包括N个通道，那么，该通道组包括N个用于存储校验码的内存颗粒。与DDR5 JEDEC标准下的内存中，一个通道中数据的校验码只能存储在该通道中用于存储校验码的内存颗粒，本申请实施例中，基于将该通道组中各个通道中所存储的数据生成的校验码可以分散地存储在该N*K个内存颗粒中(K和N均为正整数)。

基于如图2所示的内存100，本申请实施例提供两种内存系统，下面分别介绍这两种内存系统。

如图3A所示，为本申请实施例提供的一种内存系统，该内存系统包括内存100以及内存控制器200。

内存100的结构与图2所示的结构相同，内存100的结构可以参见前述说明。此处不再赘述。

内存控制器200用于在处理器的指示下对该内存100进行读取以及写入。内存控制器200在将数据写入到内存100中时，生成该数据的校验码。内存控制器200将该数据存储在通道组中，将该数据的校验码分散存储在该通道组中的各个通道中。内存控制器200在从内存100中读取数据时，内存控制器200读取通道组中所存储的数据以及数据的校验码，利用该校验码对该数据进行校验、纠错。

内存控制器200包括处理单元210以及缓存单元220。处理单元210用于接收处理器的指示，并在处理器的指示下对内存100进行读取以及写入，该处理单元210是内存控制器200的主要执行单元。缓存单元220具备缓存功能，用于缓存数据。缓存单元220中能够缓存的数据量可以等于内存控制器200一次从通道组读取的数据以及该数据的校验码的总大小。也就是说，缓存单元220能够同时缓存一个通道组中所存储的数据以及该数据的校验码。

缓存单元220包括两个数据存储区域，其中一个数据存储区域为数据区域，该数据区域用于存储数据，另一个数据存储区域为校验码区域，该校验码区域用于存储校验码。数据区域能够存储通道组中所存储的数据，也就是说，该数据区域可以能够存储数据本身，数据区域的大小等于通道组的大小。校验码区域能够存储通道组中数据的校验码。校验码区域的大小等于该数据的校验码的数据量。

例如，若内存100中一个通道的大小为64字节，内存控制器200基于64字节的数据生成的校验码为4字节，一个通道组中包括2个通道，内存控制器200中的缓存单元220的大小为136字节。

处理单元210可以为数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件、人工智能芯片、片上芯片等。

缓存单元220可以为是易失性存储器，例如随机存取存储器；存储器也可以是非易失性存储器，例如只读存储器，快闪存储器。

在图3A所示的内存100纠错系统中，内存控制器200负责整个内存100的数据读取以及写入。由于本申请实施例中引入了通道组的概念，在一些场景中，可以为每个通道组设置一个对应的内存子控制器300，该内存子控制器300只负责对应的通道组的数据读取以及写入。由此形成如图3B所示的内存100纠错系统。

如图3B所示，为本申请实施例提供的一种内存系统，该内存系统包括内存100以及多个内存子控制器300。

内存子控制器300负责对内存100中的一个通道组进行数据的读取以及写入，也即，一个内存子控制器300与一个通道组对应。对于任一内存子控制器300，内存子控制器300在将数据写入到对应的通道组中时，生成该数据的校验码。内存子控制器300将该数据存储在对应的通道组中，将该数据的校验码分散存储在该通道组中的各个通道中。内存子控制器300在从通道组中读取数据时，内存子控制器300读取通道组中所存储的数据以及数据的校验码，利用该校验码对该数据进行校验、纠错。

内存子控制器300包括处理子单元310以及缓存子单元320。处理子单元310的功能与前述说明中处理单元210的功能类似，区别在于，处理子单元310对所述对应的通道组进行数据读取以及写入。具体可以参见前述关于处理单元210的说明，此处不再赘述。

缓存子单元320的功能与前述说明中处理单元210的功能类似，区别在于，缓存子单元320仅用于存储对应的通道组中的数据以及数据校验码。具体可以参见前述关于缓存单元220的说明，此处不再赘述。

处理子单元310以及缓存子单元320的具体形态与前述说明中处理单元210以及缓存单元220的具体形态类似，具体可参见前述说明，此处不再赘述。

硬件形态上，图3A所示的内存系统中，采用一个内存控制器200实现内存100的数据读写。图3B所示的内存系统，可以看做将内存控制器200分离成为多个独立的内存子控制器300。多个独立的内存子控制器300共同实现的功能与内存控制器200所实现的功能是相同的。

此外，一些常见的内存，内存控制器内针对每个通道会设置单独的ECC接口电路，该ECC接口电路主要用于对所对应的通道内的数据实现ECC，如计算校验码、更新校验码等。而在本申请实施例中，如前述所示的内存系统，由于是以通道组为粒度实现ECC，无需针对每个通道设置单独的ECC接口电路，只需针对每个通道组设置的ECC接口电路，用于针对所对应的通道组内的数据实现ECC，该ECC接口电路可以位于内存子控制器300中。或者针对所有通道组设置统一的ECC接口电路，用于针对所有通道组内的数据实现ECC，该ECC接口电路可以位于内存控制器200中。这样能够有效减少内存控制器中ECC接口电路，降低ECC接口电路的复杂度，进一步减少内存控制器的面积，节约成本。

下面以图3A所示的内存系统为例，对本申请实施例提供的内存数据读写方法进行说明，如图4所示，为本申请实施例提供的一种内存数据读写示意图，本申请实施例提供的内存数据读写方法分为数据写入(步骤401～步骤406)、以及数据读取(步骤407～步骤408)两个阶段。数据写入阶段可以分为两种场景，一种场景为数据首次写入(步骤401～步骤404)，一种场景为数据更新(步骤404～步骤406)。

由于内存控制器200在将数据写入到内存100中时，内存控制器200是分次将数据写入到内存100中，每次写入到内存100的数据量是固定的。在本申请实施例中，内存控制器200每次写入到内存100中的数据量可以等于通道组的大小。若内存控制器200需要写入到内存100的数据量小于通道组的大小，内存控制器200可以将需要写入到内存100的数据暂时缓存在缓存单元220中，采用读修改回写(read modify write，RMW)方式进行数据写入。也即，内存控制器200根据该数据在内存100中的地址读取该地址所属的通道组中的数据。内存控制器200利用该数据更新读取的数据，获得需要写入到通道组的数据，该数据的数据量等于通道组大小的数据，再将数据写入到通道组中。若内存控制器200需要写入到内存100的数据量大于通道组的大小，且数据量与通道组的大小呈倍数关系，内存控制器200可以分次将数据写入到内存100中，每次将数据写入到一个通道组中。

下面以内存控制器200需要写入的数据量等于通道组大小为例进行说明，具体参见如下说明：

步骤401：内存控制器200获取需要写入到内存100的数据。

当存在需要存储至内存100的数据中时，内存控制器200可以获取该数据，本申请实施例并不限定该内存控制器200获取该数据的方式。例如，内存控制器200可以从处理器获取该数据，也可以从其他组件(如网卡、硬盘)获取该数据。

内存控制器200在获取该数据后，可以将该数据缓存在该内存控制器200中缓存单元220中。例如，内存控制器200可以将该数据写入到该缓存单元220的数据区域中。

步骤402：内存控制器200调用ECC算法生成该数据的第一校验码。

由于在一个通道组中每个通道中均设置有能够存储校验码的内存颗粒，允许该第一校验码的数据量更大。故而，在本申请实施例中，内存控制器200生成该第一校验码时，可以调用更加复杂的ECC算法，以生成具备较强纠错能力的第一校验码。例如，内存控制器200可以调用德所罗门(Reed-Solomon，RS)编码算法生成该数据的第一校验码。在内存控制器200内部，生成的第一校验码可以写入到缓存单元220的校验码区域中。

例如，内存控制器200调用RS8编码算法对512比特的数据生成的第一校验码的大小为32比特。以通道大小为128比特为例，若一个通道组中包括4个通道，那么，该512比特的数据以及32比特的第一校验码可以存储在一个通道组中。32比特的第一校验码能够实现X2chipkill能力，也即利用32比特的第一校验码可以纠正一个X2颗粒(X2颗粒的位宽为2比特)存在的多比特错误。RS8编码算法是指算法中一个符号(symbol)等于8比特的RS编码算法。

又例如，内存控制器200调用RS16编码算法对512比特的数据生成的第一校验码的大小为128比特。内存满足DDR5 JEDEC标准，通道大小为256比特，若一个通道组中包括2个通道，那么，该512比特的数据以及64比特的第一校验码可以存储在一个通道组中。32比特的第一校验码能够实现两个X4 chipkill能力，或实现一个X8 chipkill能力。RS16编码算法是指算法中一个符号(symbol)等于16比特的RS编码算法。

又例如，内存控制器200调用RS16编码算法对1024比特的数据生成的第一校验码的大小为256比特。以通道大小为256比特为例，若一个通道组中包括4个通道，那么，该1024比特的数据以及256比特的第一校验码可以存储在一个通道组中，256比特的第一校验码能够实现四个X4 chipkill能力，也即利用256比特的第一校验码可以纠正四个X4颗粒存在的多比特错误。

本申请实施例并不限定内存控制器200生成第一校验码所调用的ECC算法。该ECC算法可以为RS编码算法、循环冗余校验(cyclic redundancy check，CRC)算法、BCH(bose、 ray-chaudhuri，hocquenghem)算法、哈希(HASH)算法、或独立磁盘冗余阵列(redundant array of independent disks，RAID)算法(如RAID 5算法、RAID 6算法)。该ECC算法也可以为前述算法中多种算法的组合。凡是能够用于生成校验码的算法均适用于本申请实施例。

步骤403：内存控制器200将该数据以及第一校验码写入到内存100的通道组中。其中该数据的校验码分散在该通道组中的各个通道上。

内存控制器200在生成第一校验码之后，可以对数据进行分段，形成多个数据段；对第一校验码进行分段，形成多个校验码段。内存控制器200将多个数据段和校验码段分散在该通道组中的各个通道中。其中，数据段的数量与通道组中通道的数量相同，校验码段的数量与通道组中通道的数量相同。

内存控制器200在将该多个数据段和校验码段分散在该通道组中的多个通道时，可以将一个数据段以及一个校验码段存储在一个通道中。

以通道组中包括4个通道，每个通道大小为256比特为例。

如图5A所示，内存控制器200可以将1024比特数据分为四个数据段，每个数据段的长度为256比特。内存控制器200可以将256比特的第一校验码分为四个校验码段，每个校验码段的长度为64比特。

内存控制器200在每个通道中写入一个数据段以及一个校验码段。例如，内存控制器200可以将数据中0到255比特的数据构成的数据段以及第一校验码中0到63比特的数据构成的校验码段写入到该通道组中的通道1中，将数据中256到511比特的数据构成的数据段以及第一校验码中64到127比特的数据构成的校验码段写入到该通道组中的通道2中，将数据中512到767比特的数据构成的数据段以及第一校验码中128到191比特的数据构成的校验码段写入到该通道组中的通道3中，将数据中768到1023比特的数据构成的数据段以及第一校验码中192到255比特的数据构成的校验码段写入到该通道组中的通道4中。

以通道组中包括2个通道，每个通道大小为256比特为例。

如图5B所示，内存控制器200可以将512比特数据分为2个数据段，每个数据段的长度为256比特。内存控制器200可以将128比特的第一校验码分为2个校验码段，每个校验码段的长度为64比特。

内存控制器200在每个通道中写入一个数据段以及一个校验码段。例如，内存控制器200可以将数据中0到255比特的数据构成的数据段以及第一校验码中0到63比特的数据构成的校验码段写入到该通道组中的通道1中，将数据中256到511比特的数据构成的数据段以及第一校验码中64到127比特的数据构成的校验码段写入到该通道组中的通道2中。

至此，内存控制器200将数据进行到了内存100的通道组中。在数据写入到内存100后，内存控制器200还可以对写入到内存100中的数据进行更新。例如，处理器指示内存控制器200对数据中的某个比特或某一个比特进行修改。又例如，内存控制器200采用RMW方法将数据写入到内存100中时。

内存控制器200在需要对内存100中的数据进行更新时，除了需要对数据本身进行更新，还重新生成校验码。下面以内存控制器200对前述步骤中写入的数据进行更新为例对内存控制器200对内存100中的数据进行更新的方式进行说明。

步骤404：内存控制器200从该通道组中读取数据以及数据的第一校验码。

内存控制器200从该通道组中的多个通道中读出多个数据段和多个校验码段，将该多个数据段拼接为原始的数据，将该多个校验码段拼接为第一校验码。

内存控制器200可以将该多个数据段以及多个校验码段写入到内存控制器200中的缓存单元220中。其中，多个数据段写入到缓存单元220中的数据区域，多个校验码段写入到缓存单元220的校验码区域。该多个数据段在该数据区域的排序位置与该多个数据段在该数据中排序位置一致，该多个校验码段在该校验码区域的排序位置与该多个校验码段在该第一校验码中的排序位置一致。

以图5A所示的数据以及第一校验码写入到通道组的方式为前提，参见图6A，为本申请实施例提供的从通道组中读取数据的示意图。

内存控制器200可以从通道1中读取256比特的数据段以及64比特的校验码段，将256比特的数据段写入到缓存单元220中数据区域中0～255比特的位置，将64比特的校验码段写入到缓存单元220中校验码区域中0～63比特的位置。内存控制器200可以从通道2中读取256比特的数据段以及64比特的校验码段，将256比特的数据段写入到缓存单元220中数据区域中256～511比特的位置，将64比特的校验码段写入到缓存单元220中校验码区域中64～127比特的位置。内存控制器200可以从通道3中读取256比特的数据段以及64比特的校验码段，将256比特的数据段写入到缓存单元220中数据区域中512～767比特的位置，将64比特的校验码段写入到缓存单元220中校验码区域中128～191比特的位置。内存控制器200可以从通道4中读取256比特的数据段以及64比特的校验码段，将256比特的数据段写入到缓存单元220中数据区域中768～1023比特的位置，将64比特的校验码段写入到缓存单元220中校验码区域中192～256比特的位置。

以图5B所示的数据以及第一校验码写入到通道组的方式为前提，参见图6B，为本申请实施例提供的从通道组中读取数据的示意图。

内存控制器200可以从通道1中读取256比特的数据段以及64比特的校验码段，将256比特的数据段写入到缓存单元220中数据区域中0～255比特的位置，将64比特的校验码段写入到缓存单元220中校验码区域中0～63比特的位置。内存控制器200可以从通道2中读取256比特的数据段以及64比特的校验码段，将256比特的数据段写入到缓存单元220中数据区域中256～511比特的位置，将64比特的校验码段写入到缓存单元220中校验码区域中64～128比特的位置。

步骤405：内存控制器200更新数据，并根据更新后的数据生成第二校验码。

内存控制器200可以对数据更新，例如修改或删除该数据中的部分比特。内存控制器200在更新了该数据之后，为该更新后的数据生成第二校验码。内存控制器200生成第二校验码的方式与生成第一校验码的方式类似，具体可以参见步骤402。在内存控制器200中可以删除第一校验码，将第二校验码写入到缓存单元220的校验码区域中。

步骤406：内存控制器200将更新后的数据以及第二校验码写入到内存100的通道组中。其中该数据的校验码分散在该通道组中的各个通道上。步骤406与步骤403类似，区别仅在于内存控制器200所存储的数据以及校验码不同，具体可以参见步骤403的相关说明，此处不再赘述。

通过步骤404～步骤406，实现了内存100中数据的更新。内存控制器200还可以将内存100中的数据读取后反馈给处理器，下面以内存控制器200需要读取写入到通道组中的数据为例，对内存控制器200读取数据的方式进行说明，具体可以参见步骤407～步骤408。

步骤407：内存控制器200在处理器的指示下从该通道组中读取数据以及第二校验码。

当处理器需要读取数据，处理器会向内存控制器200发送指示，告知所需读取的数据的信息，如该数据的逻辑地址等。内存控制器200在接收到处理器发送的指示后，内存控制器200可以确定该数据在该内存100所在的通道组，从该通道组中读取多个数据段以及校验码段，将读取的多个数据段写入到缓存单元220的数据区域中，在数据区域中形成完整的数据，将读取的多个校验码段写入到缓存单元220的校验码区域，在校验码区域中形成第二校验码。

步骤408：内存控制器200利用该第二校验码对读取的数据进行校验、纠错。

内存控制器200在读取了第二校验码以及数据之后，内存控制器200利用第二校验码确定该所读取的数据是否存在错误数据，并定位错误数据的位置。这里的错误数据是指读取的数据中与写入该通道组中的数据(也即步骤406中更新后的数据)不同的数据。

若内存控制器200利用第二校验码确定该所读取的数据不存在数据错误，内存控制器200可以将该数据反馈给处理器。

若内存控制器200利用第二校验码确定该所读取的数据存在数据错误，内存控制器200可以利用第二校验码定位数据错误的位置，并利用第二校验码对错误数据进行纠错，将纠错后的数据反馈给处理器。若内存控制器200利用第二校验码对错误数据纠错失败，内存控制器200可以通知处理器数据读取失败。

需要说明的是，内存控制器200利用该第二校验码对读取的数据进行校验、纠错的方式与内存控制器200生成第二校验码的方式有关。内存控制器200需要利用与生成第二校验码所调用的ECC算法相对应的纠错算法对读取的数据进行校验、纠错。例如，在步骤402以及步骤405中采用RS编码算法生成了第一校验码以及第二校验码，那么在步骤408中，内存控制器200可以采用RS纠错算法、该第二校验码对读取的数据进行校验、纠错。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种内存数据读写方法，其特征在于，所述方法用于对内存进行数据读写，所述内存包括一个或多个通道组，每个通道组包括多个通道，所述方法由内存控制器执行，所述方法包括：

获取需要写入通道组的目标数据；

生成所述目标数据的校验码，所述校验码用于对所述目标数据进行校验以及纠错；

将所述目标数据以及所述校验码写入到所述通道组中，所述校验码分散存储在所述通道组的各个通道中，所述目标数据分散存储在所述通道组的通道中。
如权利要求1所述的方法，其特征在于，所述方法还包括：

在处理器的指示下，从所述通道组中读取所述目标数据以及所述校验码；

利用所述校验码对所述目标数据进行纠错；

将纠错后的所述目标数据反馈至所述处理器。
如权利要求1或2所述的方法，其特征在于，一次写入到所述通道组中的数据等于处理器中缓存的位宽。
如权利要求1或2所述的方法，其特征在于，一次写入到所述通道组中一个通道的数据等于处理器中缓存的位宽。
如权利要求1～4任一项所述的方法，其特征在于，所述通道组中通道的数量等于2、3、4、6、8、12或16。
如权利要求1～5任一项所述的方法，其特征在于，所述生成所述目标数据的第一校验码，包括：

调用RS8编码算法或RS16编码算法生成所述目标数据的校验码。
如权利要求1～6任一项所述的方法，其特征在于，每个通道包括一个或多个RANK，每个RANK中包括多个内存颗粒。
如权利要求1～7任一项所述的方法，其特征在于，所述将所述目标数据以及所述校验码写入到所述通道组中，包括：

将所述目标数据拆分为多个目标数据段，将所述校验码拆分为多个校验码段；

将所述多个目标数据段分别写入所述通道组中的所述各个通道，将所述多个校验码段分别写入所述通道组中的所述各个通道。
一种内存系统，其特征在于，所述系统包括内存控制器以及内存；

所述内存包括一个或多个通道组，每个通道组包括多个通道；

所述内存控制器，用于获取需要写入通道组的目标数据；生成所述目标数据的校验码，所述校验码用于对所述目标数据进行校验以及纠错；将所述目标数据以及所述校验码写入到所述通道组中，所述校验码分散存储在所述通道组的各个通道中，所述目标数据分散存储在所述通道组的通道中。
如权利要求9所述的系统，其特征在于，所述内存控制器，还用于：

在处理器的指示下，从所述通道组中读取所述目标数据以及所述校验码；

利用所述校验码对所述目标数据进行纠错；

将纠错后的所述目标数据反馈至所述处理器。
如权利要求9或10所述的系统，其特征在于，一次写入到所述通道组中的数据等于处理器中缓存的位宽。
如权利要求9或10所述的系统，其特征在于，一次写入到所述通道组中一个通道的数据等于处理器中缓存的位宽。
如权利要求9～12任一项所述的系统，其特征在于，所述通道组中通道的数量等于2、3、4、或8。
如权利要求9～13任一项所述的系统，其特征在于，所述内存控制器在生成所述目标数据的第一校验码，用于：

调用RS8编码算法或RS16编码算法生成所述目标数据的校验码。
如权利要求9～14任一项所述的系统，其特征在于，每个通道包括一个或多个RANK，每个RANK中包括多个内存颗粒。
如权利要求9～15任一项所述的系统，其特征在于，所述内存控制器在将所述目标数据以及所述校验码写入到所述通道组中，用于：

将所述目标数据拆分为多个目标数据段，将所述校验码拆分为多个校验码段；

将所述多个目标数据段分别写入所述通道组中的所述各个通道，将所述多个校验码段分别写入所述通道组中的所述各个通道。
一种内存控制器，其特征在于，所述内存控制器包括处理单元和缓存单元；

所述缓存单元，用于缓存所述目标数据；

所述处理单元，用于执行如权利要求1～8任一所述的方法。