WO2022205130A1

WO2022205130A1 - 读写操作执行方法和SoC芯片

Info

Publication number: WO2022205130A1
Application number: PCT/CN2021/084556
Authority: WO
Inventors: 夏晶; 信恒超; 黎卓南; 袁思睿
Original assignee: 华为技术有限公司
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2022-10-06
Also published as: EP4310683A4; CN116940934A; EP4310683A1; US20240028528A1

Abstract

本申请公开了一种读写操作执行方法和SoC芯片，用于实现遵守RO约束的节点执行读写操作的执行结果全局可见的顺序符合遵守SO约束的节点的要求。读写操作执行方法包括：第一节点从第二节点接收第一消息和第二消息；第一消息用于请求对第三节点管理的第一地址进行读写操作；第二消息用于请求对第三节点管理的第二地址进行读写操作；第二节点的读写操作的执行顺序约束比第三节点的读写操作的执行顺序约束严格；第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限；第一节点对第一地址和第二地址进行读写操作。

Description

读写操作执行方法和SoC芯片

技术领域

本申请涉及存储领域，尤其涉及一种读写操作执行方法和片上系统(system on chip，SoC)芯片。

背景技术

多个进程(软件)之间可以通过访问共享内存(shared memory)来传递数据。具体的，多个进程向硬件(例如中央处理器(central processing unit，CPU))发送读写命令，由硬件对共享内存执行读写操作。硬件执行读写操作的顺序将影响软件最终看到的执行结果，因此可以通过存储一致性模型(memory consistency model)来对读写操作的执行顺序进行不同程度的要求，以保证执行结果符合软件预期。

不同的存储一致性模型所要求的执行顺序的严格程度是不同的，当遵守严格顺序(strict order，SO)约束的存储一致性模型(简称强顺序模型)的节点向遵守宽松顺序(relax order，RO)约束的存储一致性模型(简称弱顺序模型)的节点请求读写操作时，也要在弱顺序模型内按照强顺序模型的执行顺序来执行读写操作，以保证执行结果全局可见(global observable，GO)的顺序符合强顺序模型的要求。

发明内容

本申请实施例提供一种读写操作执行方法和SoC芯片，用于实现遵守RO约束的节点执行读写操作的执行结果全局可见的顺序符合遵守SO约束的节点的要求。

为达到上述目的，本申请的实施例采用如下技术方案：

第一方面，提供了一种读写操作执行方法，包括：第一节点从第二节点接收第一消息和第二消息；第一消息用于请求对第三节点管理的第一地址进行读写操作；第二消息用于请求对第三节点管理的第二地址进行读写操作；第二节点的读写操作的执行顺序约束比第三节点的读写操作的执行顺序约束严格；第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限；第一节点对第一地址和第二地址进行读写操作。

本申请实施例提供的读写操作执行方法，第一节点从第二节点接收第一消息和第二消息，第二节点遵守SO约束，第一消息请求对第三节点管理的第一地址进行读写操作，第二消息请求对第三节点管理的第二地址进行读写操作，第三节点遵守RO约束；则第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限，使得第一节点参与到缓存一致性的管理，其他节点都无法对第一地址和第二地址进行需要操作权限的读写操作，即第一地址和第二地址的读写操作的执行顺序由第一节点来控制，那么执行结果全局可见的顺序也就由第一节点来控制。从而实现遵守RO约束的节点执行读写操作的执行结果全局可见的顺序符合遵守SO约束的节点的要求。

在一种可能的实施方式中，第一节点对第一地址和第二地址进行读写操作，包括：第一节点并行对第一地址和第二地址进行读写操作。该实施方式可以实现并行处理来自遵守SO约束的节点的读写操作请求，从而提高遵守SO约束的节点(第二节点)与遵守RO约束的节点(第三节点)之间的传输带宽和交互效率。

在一种可能的实施方式中，第一节点并行对第一地址和第二地址进行读写操作，包括：第一节点按照第一消息和第二消息的接收顺序并行对第一地址和第二地址进行读写操作。该实施方式可以保证执行结果的全局可见的顺序符合强顺序模型要求。

在一种可能的实施方式中，第二节点遵守严格顺序SO约束，第三节点遵守宽松顺序RO约束。该实施方式解释了何为第二节点的读写操作的执行顺序约束比第三节点的读写操作的执行顺序约束严格。

在一种可能的实施方式中，还包括：第一节点在完成对第一地址的读写操作后，向第三节点释放第一地址的操作权限。这样第三节点或其他节点可以继续对第一地址进行读写操作。第一节点在完成对第二地址的读写操作后，向第三节点释放第二地址的操作权限。这样第三节点或其他节点可以继续对第二地址进行读写操作。

在一种可能的实施方式中，第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限，包括：第一节点从第三节点获取第一地址的E态以及第二地址的E态。该实施方式提供了第一地址的操作权限和第二地址的操作权限的一种具体形式。

在一种可能的实施方式中，第一节点在请求第一地址的操作权限但未获取第一地址的操作权限时，接收到第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点指示未获取第一地址的操作权限；使得第三节点或其他节点可以对第一地址进行读写操作。第一节点在请求第二地址的操作权限但未获取第二地址的操作权限时，接收到第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点向第三节点指示未获取第二地址的操作权限；使得第三节点或其他节点可以对第二地址进行读写操作。

在一种可能的实施方式中，在第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限之后，方法还包括：在预设条件满足时，第一节点向第三节点释放第一地址的操作权限和第二地址的操作权限。使得第三节点或其他节点可以对第一地址和第二地址进行读写操作。

在一种可能的实施方式中，预设条件为第三节点请求第一地址和第二地址的操作权限。使得第三节点或其他节点可以对第一地址和第二地址进行读写操作。

在一种可能的实施方式中，预设条件为第一节点从第三节点获取第一地址的操作权限的时间大于或等于第一预设时间，以及第一节点从第三节点获取第二地址的操作权限的时间大于或等于第二预设时间。第一节点在接收了来自第二节点的读写请求后不必再执行获取第一地址的操作权限的流程，可以快速对第一地址执行读写操作。第一节点在接收了来自第二节点的读写请求后不必再执行获取第二地址的操作权限的流程，可以快速对第二地址执行读写操作。

在一种可能的实施方式中，还包括：在第一节点获取了第一地址的操作权限之后并且开始对第一地址进行读写操作之前，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点释放第一地址的操作权限，并重新从第三节点获取第一地址的操作权限；第一节点重新从第三节点获取第一地址的操作权限，则可以继续对第一地址进行读写操作。在第一节点获取了第二地址的操作权限之后并且开始对第二地址进行读写操作之前，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点释放第二地址的操作权限，并重新从第三节点获取第二地址的操作权限。第一节点重新从第三节点获取第二地址的操作权限，则可以继续对第二地址进行读写操作。

在一种可能的实施方式中，还包括：在第一节点开始对第一地址进行写操作但未获取第一地址对应的缓存地址时，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点在获取第一地址对应的缓存地址之后，向第三节点发送第一地址对应的缓存地址写入的数据，或者，指示已经释放第一地址的操作权限；使得第三节点或其他节点能够对第一地址进行读写操作。在第一节点开始对第二地址进行写操作但未获取第二地址对应的缓存地址时，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点在获取第二地址对应的缓存地址之后，向第三节点发送第二地址对应的缓存地址写入的数据，或者，指示已经释放第二地址的操作权限。使得第三节点或其他节点能够对第二地址进行读写操作。

在一种可能的实施方式中，第二节点为片上系统SoC芯片之外的输入输出I/O设备，第一节点为SoC芯片中的内存管理单元(memory management unit，MMU)，该MMU可以为SMMU，第三节点为SoC芯片中的内存控制器或内存控制器中的本地代理HA。该实施方式提供了一种具体应用场景。

在一种可能的实施方式中，第二节点为SoC芯片中的处理器，第一节点为SoC芯片中的片上互联网络NOC或者处理器的接口模块，第三节点为SoC芯片中的内存控制器或内存控制器中的HA。该实施方式提供了另一种具体应用场景。

第二方面，提供了一种片上系统SoC芯片，其特征在于，包括：第一节点和内存控制器，第一节点用于：从第二节点接收第一消息和第二消息；第一消息用于请求对内存控制器管理的第一地址进行读写操作；第二消息用于请求对内存控制器管理的第二地址进行读写操作；第二节点的读写操作的执行顺序约束比内存控制器的读写操作的执行顺序约束严格；从内存控制器获取第一地址的操作权限和第二地址的操作权限；对第一地址和第二地址进行读写操作。

在一种可能的实施方式中，第一节点具体用于：并行对第一地址和第二地址进行读写操作。

在一种可能的实施方式中，第一节点具体用于：按照第一消息和第二消息的接收顺序并行对第一地址和第二地址进行读写操作。

在一种可能的实施方式中，第二节点遵守严格顺序SO约束，内存控制器遵守宽松顺序RO约束。

在一种可能的实施方式中，第一节点还用于：在完成对第一地址的读写操作后，向内存控制器释放第一地址的操作权限；在完成对第二地址的读写操作后，向内存控制器释放第二地址的操作权限。

在一种可能的实施方式中，第一节点具体用于：从内存控制器获取第一地址的E态以及第二地址的E态。

在一种可能的实施方式中，第一节点还用于：在请求第一地址的操作权限但未获取第一地址的操作权限时，接收到内存控制器请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则向内存控制器指示未获取第一地址的操作权限；在请求第二地址的操作权限但未获取第二地址的操作权限时，接收到内存控制器请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则向内存控制器指示未获取第二地址的操作权限。

在一种可能的实施方式中，在从内存控制器获取第一地址的操作权限和第二地址的操作权限之后，第一节点还用于：在预设条件满足时，向内存控制器释放第一地址的操作权限和第二地址的操作权限。

在一种可能的实施方式中，预设条件为内存控制器请求第一地址和第二地址的操作权限。

在一种可能的实施方式中，预设条件为第一节点从内存控制器获取第一地址的操作权限的时间大于或等于第一预设时间，以及第一节点从内存控制器获取第二地址的操作权限的时间大于或等于第二预设时间。

在一种可能的实施方式中，第二节点为SoC芯片之外的输入输出I/O设备，第一节点为SoC芯片中的内存管理单元MMU。

在一种可能的实施方式中，第二节点为SoC芯片中的处理器，第一节点为SoC芯片中的片上互联网络NOC或者处理器的接口模块。

在一种可能的实施方式中，第一节点包括顺序处理模块、操作权限判断模块和数据缓存判断模块；顺序处理模块用于记录接收第一消息和第二消息的顺序；操作权限判断模块用于记录是否收到第一地址的操作权限和第二地址的操作权限，并根据顺序来确定对第一地址和第二地址进行读写操作的先后顺序；数据缓存判断模块用于记录是否收到第一地址对应的缓存地址的标识以及第二地址对应的缓存地址的标识，从而确定是否发送数据。

第二方面的技术效果参照第一方面及其任一实施方式所述的内容，在此不再重复。

附图说明

图1为本申请实施例提供的一种I/O设备与SoC芯片通信的芯片系统的结构示意图；

图2为本申请实施例提供的一种SMMU的结构示意图；

图3为本申请实施例提供的一种不同存储一致性模型的RO约束和SO约束的示意图；

图4为本申请实施例提供的一种在弱顺序模型实现执行结果的全局可见的顺序符合强顺序模型要求的示意图一；

图5为本申请实施例提供的一种在弱顺序模型实现执行结果的全局可见的顺序符合强顺序模型要求的示意图二；

图6为本申请实施例提供的一种同一存储一致性模型内部不同模块之间通信的示意图；

图7为本申请实施例提供的一种对弱顺序模型的改进的示意图；

图8为本申请实施例提供的一种对同一存储一致性模型的改进的示意图；

图9为本申请实施例提供的一种读写操作执行方法的流程示意图一；

图10为本申请实施例提供的一种读写操作执行方法的流程示意图二；

图11为本申请实施例提供的一种读写操作执行方法的流程示意图三；

图12为本申请实施例提供的一种读写操作执行方法的流程示意图四；

图13为本申请实施例提供的一种读写操作执行方法的流程示意图五；

图14为本申请实施例提供的一种读写操作执行方法的流程示意图六；

图15为本申请实施例提供的一种读写操作执行方法的流程示意图七；

图16为本申请实施例提供的一种读写操作执行方法的流程示意图八；

图17为本申请实施例提供的一种读写操作执行方法的流程示意图九；

图18为本申请实施例提供的一种读写操作执行方法的流程示意图十；

图19为本申请实施例提供的一种读写操作执行方法的流程示意图十一。

具体实施方式

首先对本申请涉及的一些概念进行描述：

存储一致性：指硬件执行读写操作后，读写操作的执行结果(是否执行了读写操作)对其他节点全局可见的顺序有一定要求，例如某一节点先后对两个地址分别进行一次读写操作(相当于执行了两次读写操作)，或者，某一节点先后对一个地址进行两次读写操作，其他节点不仅获知已经执行了两次读写操作，并且获知(即全局可见)这两次读写操作的执行结果的顺序符合软件预期，即为满足了存储一致性的要求。例如，在对读写操作的执行顺序有要求的情况下，先后对第一地址和第二地址执行写操作，则执行结果全局可见的正确顺序包括：对第一地址和第二地址均执行了写操作，只对第一地址执行了写操作，或者，第一地址和第二地址均未执行写操作。执行结果全局可见的错误顺序包括：只对第二地址执行了写操作。

缓存一致性：处理器相对于存储器是快速运行的设备，处理器对存储器进行读写操作时，如果等待操作完成再处理其他任务，将造成处理器阻塞，降低处理器的工作效率。因此，可以针对每个处理器配置一个缓存(缓存的速度远远快于存储器但容量小于存储器)。当处理器向存储器中写数据时，可以将数据先写入缓存然后就可以处理其他任务，由直接存储器访问(direct memory access，DMA)器件来将数据存储至存储器；同理，当处理器读存储器中的数据时，由DMA器件先将数据从存储器存储至缓存，再由处理器从缓存中读取数据。当不同处理器通过缓存对存储器中同一地址进行读写操作时，对读写操作的执行顺序有严格要求，即前一个读写操作完成前阻塞后一个读写操作，以防止同时进行读写操作而引起缓存中数据与存储器中数据不一致。

缓存一致性的设备遵守MESI协议，在MESI协议中规定了缓存线(cache line)(缓存中的最小缓存单位)的四种独占状态，包括：E(Exclusive)态、M(Modified)态、S(Shared)态和I(Invalid)态。其中，E态表示该缓存线有效，缓存中数据和存储器中数据一致，数据只存在于本缓存中；M态表示该缓存线有效，数据被修改了，缓存中数据和存储器中数据不一致，数据只存在于本缓存中；S态表示该缓存线有效，缓存中数据和存储器中数据一致，数据存在于多个缓存中；I态表示该缓存线无效。

存储一致性模型按照所要求的执行顺序的严格程度从强到弱包括：顺序一致性(sequential consistency，SC)模型、完全存储定序(total store order，TSO)模型、宽松模型(relax model，RM)等。SC模型要求硬件上读写共享内存的操作顺序与软件指令要求的操作顺序严格保持一致；TSO模型，在SC模型的基础上引入了缓存机制，放松了对于写-读(先写后读)操作的顺序约束，即写-读操作中的读操作可以先于写操作完成；RM模型最为宽松，不对任何读写操作进行顺序约束，简化了硬件实现，只是在有需求的时候通过一些软件手段，例如阻塞(fence)后续操作的方式来保证执行顺序。

强顺序模型的设备向弱顺序模型的设备发送读写请求时，可能会出现强顺序模型对于某种读写组合(例如写-写(先写后写)、写-读(先写后读)、读-写(先读后写)、读-读(先读后读))有顺序约束，而弱顺序模型没有该顺序约束的情况。为此，对于强顺序模型内的并行读写请求，在弱顺序模型内要按照强顺序模型的执行顺序来串行执行，以保证执行结果能够全局可见的顺序符合强顺序模型的要求。

首先以图1中的芯片系统为例，说明强顺序模型的设备向弱顺序模型的设备发送读写请求的一种典型应用场景。

如图1所示，本申请实施例提供的一种芯片系统包括SoC芯片之外的输入输出(input output，I/O)设备11和SoC芯片12。当I/O设备11与SoC芯片12通过高速串行计算机扩展总线标准(peripheral component interconnect express，PCIE)连接时，I/O设备11可以为PCIE板卡，当I/O设备11与SoC芯片12通过网络传输协议连接时，I/O设备11可以为以太网接口。

I/O设备11使用X86架构，对应的强顺序模型是TSO模型，SoC芯片12使用ARM架构，对应的弱顺序模型是RM模型。

示例性的，SoC芯片12可以包括图形处理单元(graphics processing unit，GPU)120、中央处理器(central processing unit，CPU)121、神经网络处理器(neural network processing unit，NPU)122、系统内存管理单元(system memory management unit，SMMU)123、内存控制器(memory controller)124、存储器125，可选的，还可以包括片上互联网络(network on chip，NOC)126。GPU 120、CPU 121、NPU 122、SMMU 123、内存控制器124通过NOC 126互联。

其中，GPU 120为图形处理核心；CPU 121为通用处理器核心；NPU 122为人工智能(artificial intelligence，AI)专用处理器核心；SMMU 123为系统内存管理单元，用于基于页表提供地址翻译功能，例如，SMMU 123提供I/O设备11与SoC芯片12之间地址翻译功能；内存控制器124用于管理存储器125中的数据读写操作；内存控制器124还可以包括本地代理(home agent，HA)，HA负责SoC芯片的缓存一致性管理，可以合并入内存控制器124中，也可以独立挂载在NOC 126上；存储器125可以是存储器，也可以是片内存储器。

进一步的，如图2所示，SMMU 123可以包括转换检测缓冲区(translation lookaside buffer，TLB)211和地址转化电路212。TLB 211可以减少用于访问用户存储器位置的时间，TLB 211将虚拟内存到物理内存的最新转换存储起来，可以称为地址转换缓存。地址转化电路212用于执行虚拟地址到物理地址的转化。

如图3所示，I/O设备(后文中指第二节点)通过SoC芯片中的SMMU(后文中指第一节点)向SoC芯片中的内存控制器(后文中指第三节点)发送读写请求，即为强顺序模型的设备向弱顺序模型的设备发送读写请求。对于I/O设备的RO约束的读写请求，两个模型都允许乱序的写-读请求(即先写后读)，在两种模型中都可以并行处理，因此对于这两个模型之间的传输带宽和交互效率没有影响。而对于I/O设备的SO约束的读写请求，在进入SoC芯片后，仍要按照顺序执行对应的读写操作，保证执行结果能够全局可见的顺序符合强顺序模型的要求。

示例性的，以写操作为例，如图4所示，SMMU作为不同存储一致性模型之间的接口接点，位于强顺序模型中的I/O设备以并行顺序向SMMU发送写请求1和写请求2，SMMU经过两次握手，以串行顺序向弱顺序模型中的内存控制器发送写请求1和写请求2，即SMMU在第一次握手中向内存控制器发送写请求1以及对应的数据，完成后在第二次握手中向内存控制器发送写请求2以及对应的数据。

其中，写请求1和写请求2指示要进行写操作，写响应1和写响应2指示可接收数据以及数据存储的位置，写数据1和写数据2中包括待写的数据以及数据存储的位置，写完成1和写完成2指示写操作完成，确认(acknowledge，ACK)1和ACK2指示接收到写完成。

这种方式使得在弱顺序模型内，有顺序约束的多个读写请求只能串行执行，并且需要SMMU和内存控制器反复握手以保证在弱顺序模型内的执行顺序，降低了不同存储一致性模型的设备之间的传输带宽和交互效率。并且通用性和扩展性不好，内存控制器发生变更时，SMMU要与新的节点重新建立顺序处理机制。

示例性的，如图5所示，为了减少SMMU与内存控制器之间握手耗时，对图3的处理流程进行了如下改进：SMMU向内存控制器发送写请求1并接收写响应1，不需要等待写请求1完成，可以先发送写请求2并接收写响应2，然后SMMU并行发送写数据1和写数据2，并行接收写完成1和写完成2，并行发送ACK1和ACK2。其中，ACK1早于ACK2，告知内存控制器写请求的执行结果已经全局可见。

这种方式中，在某些场景(例如跨芯片)下SMMU等待内存控制器返回写响应的时延仍很大，仍会降低不同的存储一致性模型的设备之间的传输带宽和交互效率。并且，SMMU和内存控制器仍需要至少一次握手，顺序处理机制更加繁琐。

另外，对于同一存储一致性模型内部不同模块之间的通信，当存储一致性模型(例如TSO模型或者SC模型)对执行结果全局可见的顺序有要求时，遵守SO约束的模块向遵守RO约束的模块发送读写请求时，同样会降低模型内部的传输带宽和交互效率。

下面以图1中属于弱顺序模型的SOC芯片中的处理器(例如GPU 120、CPU 121、NPU 122等)(后文中指第二节点)通过接口(例如NOC 126、处理器中的接口模块等)(后文中指第一节点)向内存控制器124(后文中指第三节点)发送读写请求为例，来说明同一存储一致性模型内部不同模块之间发送读写请求的一种典型应用场景。

示例性的，如图6所示，遵守SO约束的处理器并行发出多个读写请求(例如写流(stream-write)请求)时，在这些请求进入遵守RO约束的乱序(out-of-order)总线之前，执行顺序由模型本身保证。当这些请求通过与乱序总线之间的接口进入乱序总线并发送给内存控制器时，为了保证执行结果的全局可见的顺序符合强顺序模型要求，同样采用类似图4的串行执行方式或图5的部分串行执行方式(图6中未示出)，因此会降低模型内部的传输带宽和交互效率。

为此，本申请实施例提供了一种读写操作执行方法，可以应用于不同存储一致性模型之间的通信，也可以应用于同一存储一致性模型内部不同模块之间的通信，以优化模型内部的传输带宽和交互效率。

对于不同存储一致性模型之间的通信，如图7所示，通过对弱顺序模型的缓存一致性(cache coherence，CC)范围(domain)进行扩展，将不同模型之间的接口节点SMMU也纳入CC范围，在SMMU处完成顺序处理，使得来自强顺序模型的并行读写请求在弱顺序模型也可以并行处理，提高遵守SO约束的设备与遵守RO约束的设备之间的传输带宽和交互效率。另外，由于在SMMU完成顺序处理，弱顺序模型的内存控制器不需要顺序处理机制，内存控制器发生变更时，不必重新建立顺序处理机制，因此通用性和延展性更强。

由于读写请求在软件上有明确的先后顺序关系，并且I/O设备所在的强顺序模型约束了这类读写请求之间的顺序，因此在强顺序模型内，读写请求在顺序发出后就可以高效地并行处理。

读写请求到达两个模型之间接口的SMMU后，为了在弱顺序模型保证执行顺序，在未采用本申请提供的方案前，由弱顺序模型内部的内存控制器来实现缓存一致性，SMMU不参与缓存一致性管理，因此无法在SMMU进行缓存一致性处理来保证在弱顺序模型执行结果全局可见的顺序符合强顺序模型要求，只能由内存控制器通过握手过程来实现缓存一致性，从而导致不同的存储一致性模型的设备之间的传输带宽和交互效率降低。本申请通过扩展弱顺序模型的缓存一致性域，将缓存一致性的处理权限从内部内存控制器移到SMMU，SMMU收到强顺序模型的读写请求之后就可以完成顺序处理，保证了执行结果在弱顺序模型的全局可见的顺序符合强顺序模型的要求。

在SMMU完成了顺序处理之后，可以避免与I/O设备的串行握手，读写请求可以在弱顺序模型并行处理，提高并行处理效率。

对于同一存储一致性模型内部不同模块之间的通信，如图8所示，可以对遵守RO约束的CC范围进行扩展，将模型内部位于遵守SO约束的模块(例如处理器)与遵守RO约束的模块(例如内存控制器)之间的接口也纳入CC范围，使得来自遵守SO约束的模块的读写请求在接口和遵守RO约束的模块也可以并行处理，以优化模型内部的传输带宽和交互效率。

另外，本申请通过扩展弱顺序模型的缓存一致性域，将缓存一致性的处理权限从内存控制器移到处理器与内存控制器之间的接口，该接口收到来自处理器的读写请求之后就可以完成顺序处理，保证了执行结果在遵守RO约束的模块全局可见的顺序符合强遵守RO约束的模块的要求。

如图9所示，本申请实施例提供的读写操作执行方法，包括：

S901、第一节点从第二节点接收第一消息和第二消息。

第一消息用于请求对第三节点管理的第一地址进行读写操作，第二消息用于请求对第三节点管理的第二地址进行读写操作。第二节点读写操作的执行顺序约束比第三节点的读写操作的执行顺序约束更严格，即第二节点遵守SO约束，第三节点遵守RO约束。由于第二节点遵守SO约束，所以实际上，第一消息用于请求对第三节点管理的第一地址按照严格顺序进行读写操作，第二消息用于请求对第三节点管理的第二地址按照严格顺序进行读写操作。

对于不同存储一致性模型之间的通信来说，第二节点指强顺序模型中遵守SO约束的设备，第三节点指弱顺序模型中遵守RO约束的设备。第一节点指位于强顺序模型和弱顺序模型之间的接口节点，第一节点可以是独立的设备，也可以是第二节点或第三节点中的接口模块。

例如，第二节点可以为图1中的位于SoC芯片12之外的I/O设备11，用于发送读写请求；第三节点可以为图1中的SoC芯片12中的内存控制器124或内存控制器124中的HA，用于缓存一致性管理，例如管理存储空间的目录；第一节点可以为MMU，例如可以为图1的SoC芯片12中的SMMU 123或者如图10所示的SMMU 123中的读写操作执行电路213，该读写操作执行电路213是在图2所示的SMMU 123上新增的，用于执行本申请提供的读写操作执行方法。

进一步，图10提供了一种读写操作执行电路213的结构示意图，该读写操作执行电路213包括顺序处理模块2131、操作权限判断模块2132和数据缓存判断模块2133。

顺序处理模块2131用于记录接收第一消息和第二消息的顺序，用于操作权限判断模块2132保序进行读写操作。

操作权限判断模块2132用于记录是否收到第一地址的操作权限(例如E态)和第二地址的操作权限(例如E态)，并且根据顺序处理模块2131记录的第一消息和第二消息顺序来确定对第一地址和第二地址进行读写操作的先后顺序，例如顺序处理模块2131记录了先接收到第一消息后接收到第二消息，则顺序处理模块2131先发送针对第一地址的回写(WriteBack)消息，后发送针对第二地址的回写消息。对于写操作来说，回写消息可以包括写操作类型、目标地址(第一地址或第二地址)；对于读操作来说，回写消息可以包括读操作类型、目标地址。

数据缓存判断模块2133用于记录是否收到内存控制器返回的第一地址对应的缓存地址的标识(例如数据缓冲标识(data buffer ID，DBID)和第一地址对应的缓存地址的标识(例如DBID)，从而确定是否需要发送数据。

需要说明的是，在针对I/O设备访问SoC片内存储的场景，即不同存储一致性模型之间的通信，读写操作执行电路214作为第一节点可以位于SMMU中；类似地，在针对片内处理器访问片内存储的场景，即同一存储一致性模型内部不同模块之间的通信，读写操作执行电路214作为第一节点可以位于NOC或者片内处理器。

另外需要说明的是，本申请示例性的以不同存储一致性模型之间的通信场景为例进行描述，但并不意在限定于此。

对于同一存储一致性模型内部的模块之间的通信来说，第一节点指存储一致性模型中遵守SO约束的模块，第三节点指存储一致性模型中遵守RO约束的模块，第二节点指存储一致性模型中用于第一节点与第三节点之间交互的接口模块。

例如，第二节点为图1中SoC芯片中的处理器(例如GPU 120、CPU 121、NPU 122等)，第二节点为SoC芯片中的片上NOC 126或者处理器的接口模块(该模块为硬件电路)，第三节点为SoC芯片中的内存控制器124或内存控制器124中的HA。或者，第一节点、第二节点和第三节点为处理器内部不同的硬件模块。

本申请涉及的读写操作，可以支持写-写(先写后写)、写-读(先写后读)、读-写(先读后写)、读-读(先读后读)等操作。第一消息或第二消息可以为写请求，对应写操作，或者，可以为读请求，对应读操作。第一消息或第二消息不限定一个，可以是多个。并且第一消息和第二消息的消息类型可以相同，例如均为写请求(即写-写请求)或读请求(即读-读请求)，也可以不同，例如，一个为写请求另一个为读请求(即写-读请求或读-写请求)。并且第一消息的第一地址与第二消息的第二地址可以相同或不同。

示例性的，如图11所示，第二节点可以向第一节点发送第一消息和第二消息，第一消息和第二消息可以为写请求消息。第一消息用于请求对第三节点管理的第一地址按照严格顺序进行写操作，第二消息用于请求对第三节点管理的第二地址按照严格顺序进行写操作。

S902、第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限。

操作权限可以指缓存一致性中的E态，表示节点对于该地址拥有的操作权限，也就是说，第一节点可以从第三节点获取第一地址的E态和第二地址的E态。

第一节点获取第一地址的操作权限和第二地址的操作权限后，CC范围从第三节点扩展到第一节点，使得第一节点参与到弱顺序模型中缓存一致性的管理，其他节点(例如第三节点)不能对第一地址和第二地址进行需要操作权限的读写操作，即第三节点对读写请求的顺序处理权限已经转移到第一节点，第一地址和第二地址的读写操作的执行顺序由第一节点来控制。

下面具体说明第一节点如何获取第一地址的操作权限和第二地址的操作权限。

第一节点可以向第三节点发送第三消息，第三消息中包括第一地址，第二消息用于请求第一地址的操作权限。第三节点在接收到第二消息后，可以向第一节点发送第四消息，第四消息可以为第三消息的响应消息，第四消息用于指示第一地址的操作权限。第一节点接收到第四消息后，可以向第三节点发送第四消息的确认消息，该确认消息用于指示第一节点接收到第四消息。

同理，第一节点可以向第三节点发送第三消息，第三消息中包括第二地址，第二消息用于请求第二地址的操作权限。第三节点在接收到第二消息后，可以向第一节点发送第四消息，第四消息可以为第三消息的响应消息，第四消息用于指示第二地址的操作权限。第一节点接收到第四消息后，可以向第三节点发送第四消息的确认消息，该确认消息用于指示第一节点接收到第四消息。

本申请不限定第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限的顺序，例如，假设第一节点先接收第一消息(包括第一地址)后接收第二消息(包括第二地址)，第一节点可以先获取第二地址的操作权限后获取第一地址的操作权限。

下面结合图11说明第一节点如何获取第一地址的操作权限和第二地址的操作权限。

示例性的，如图11所示，第一节点可以向第三节点发送第三消息1和第三消息2，第三消息1和第三消息2可以为GET_E消息。第三消息1中包括第一地址，第三消息2中包括第二地址。第三消息1用于请求第一地址的操作权限，第三消息2用于请求第二地址的操作权限。本申请不限定第一节点向第三节点发送第三消息1和第三消息 2的顺序。

第三节点向第一节点发送第四消息1和第四消息2，第四消息1可以为第三消息1的响应消息(RSP1)，第四消息2可以为第三消息2的响应消息(RSP2)。相应地，第一节点从第三节点接收第四消息1和第四消息2。第四消息1用于指示第一节点获取第一地址的操作权限，第四消息2用于指示第一节点获取第二地址的操作权限。

第一节点向第三节点发送第四消息1的确认消息1(ACK1)以及第四消息2的确认消息2(ACK2)。这两个确认消息用于指示第一节点接收到第四消息。

步骤S901和S902无先后执行顺序，例如，可以先执行步骤S901后执行步骤S902，或者，先执行步骤S902后执行步骤S901。

S903、第一节点对第一地址和第二地址进行读写操作。

本申请不对第一节点对第一地址和第二地址进行读写操作的执行顺序进行限定，在一种可能的实施方式中，第一节点可以并行对第一地址和第二地址进行读写操作，并行指不等上一个读写操作完成即进行下一个读写操作，从而在弱顺序模型实现多个读写操作的并行处理。

通过第一节点并行对第一地址和第二地址进行读写操作，则可以实现并行处理来自强顺序模型的请求，从而提高遵守SO约束的节点(第二节点)与遵守RO约束的节点(第三节点)之间的传输带宽和交互效率。

第一节点开始对第一地址和第二地址进行读写操作的顺序可以与第一消息和第二消息的接收顺序相同，也就是说，第一节点可以按照第一消息和第二消息的接收顺序并行对第一地址和第二地址进行读写操作。例如，第一节点先接收第一消息后接收第二消息，则第一节点可以先对第一地址进行读写操作，后对第二地址进行读写操作。从而由第一节点完成读写请求的顺序处理，以实现存储一致性。

下面具体说明第一节点如何对第一地址和第二地址进行读写操作。

第一节点可以向第三节点发送第五消息，第五消息用于指示对第一地址进行读写操作，第五消息可以为回写(WriteBack)消息。对于写操作来说，第五消息可以包括待写的数据、写操作类型、第一地址；对于读操作来说，第五消息可以包括读操作类型、第一地址。同理，第一节点可以向第三节点发送第五消息，第五消息用于指示对第二地址进行读写操作，第五消息可以为回写(WriteBack)消息。对于写操作来说，第五消息可以包括待写的数据、写操作类型、第二地址；对于读操作来说，第五消息可以包括读操作类型、第二地址。

第一节点发送第一地址对应的第五消息和第二地址对应的第五消息的顺序与第一消息和第二消息的接收顺序可以相同。例如，第一节点先接收第一消息后接收第二消息，则第一节点先发送第一地址对应的第五消息后发送第二地址对应的第五消息。

第三节点在接收到第五消息后可以向第一节点发送第六消息，该第六消息可以为第五消息的响应消息，该第六消息用于指示第一地址对应的缓存地址。同理，第三节点在接收到第五消息后可以向第一节点发送第六消息，该第六消息可以为第五消息的响应消息，该第六消息用于指示第二地址对应的缓存地址。

第一节点在接收到第六消息后，向第三节点发送第七消息，第七消息可以为写数据(WriteData)消息，第七消息用于对第一地址对应的缓存地址进行读写操作。同理，第一节点在接收到第六消息后，向第三节点发送第七消息，第七消息可以为写数据(WriteData)消息，第七消息用于对第二地址对应的缓存地址进行读写操作。

示例性的，如图11所示，第一节点向第三节点发送第五消息1和第五消息2，第五消息1和第五消息2可以为回写(WriteBack)消息。第五消息1与第一消息对应，用于指示对第一地址进行写操作，第五消息2与第二消息对应，用于指示对第二地址进行写操作。由于第一节点先从第二节点接收第一消息后接收第二消息，所以第一节点先向第三节点先发送第五消息1后发送第五消息2。此时的并行指第一节点不用等待第五消息1对应的读写操作全部完成即可以发送第五消息2。

第三节点向第一节点发送第六消息1和第六消息2，第六消息1可以为第五消息1的响应消息(RSP3)，第六消息2可以为第五消息2的响应消息(RSP4)。第六消息1用于指示第一地址对应的缓存地址，第五消息2用于指示第二地址对应的缓存地址。

第一节点向第三节点发送第七消息1和第七消息2，第七消息可以为写数据(WriteData)消息。第七消息1用于向第一地址对应的缓存地址写入数据，第七消息2用于向第二地址对应的缓存地址写入数据。

第一节点在完成对第一地址的读写操作后可以向第三节点释放第一地址的操作权限。例如，上述第七消息还可以用于向第三节点释放第一地址的操作权限。这样第三节点或其他节点可以继续对第一地址进行读写操作。同理，第一节点在完成对第二地址的读写操作后可以向第三节点释放第二地址的操作权限，例如，上述第七消息还可以用于向第三节点释放第二地址的操作权限。这样第三节点或其他节点可以继续对第二地址进行读写操作。

示例性的，如图11所示，第七消息1还用于指示向第三节点释放第一地址的操作权限；第七消息2还用于指示向第三节点释放第二地址的操作权限。

下面结合图12-图19，基于缓存一致性的原理，说明如果在第一节点与第三节点交互以进行读写操作的过程中，如果其他节点要对第一地址(或第二地址)进行需要操作权限的读写操作，则第三节点请求第一地址(或第二地址)的操作权限或者对第一地址(或第二地址)进行需要操作权限的读写操作，第一节点将如何处理，以满足存储一致性要求，保证执行结果全局可见的顺序符合强顺序模型要求。

在一种可能的实施方式中，如果第一节点在请求第一地址的操作权限但未获取第一地址的操作权限时，接收到第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点指示未获取第一地址的操作权限。同理，如果第一节点在请求第二地址的操作权限但未获取第二地址的操作权限之前，接收到第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点向第三节点指示未获取第二地址的操作权限。如图12所示，上述读写操作执行方法还包括：

S1201、在第一节点获取第一地址(或第二地址)的操作权限之前，第一节点从第三节点接收第八消息。

第八消息用于请求对第一地址进行需要操作权限的读写操作，或者说，用于请求第一地址的操作权限。同理，第八消息用于请求对第二地址进行需要操作权限的读写操作，或者说，用于请求第二地址的操作权限。示例性的，第八消息可以是嗅探(snoop)消息。

示例性的，如图13所示，在第三节点向第一节点发送第三消息1(GET_E1)的响应消息(RSP1)以使第一节点获取第一地址(或第二地址)的操作权限之前，第三节点向第一节点发送第八消息(嗅探消息)，使得第一节点从第三节点接收第八消息，该第八消息用于请求对第一地址(或第二地址)进行需要操作权限的读写操作，或者，用于请求第一地址(或第二地址)的操作权限。

S1202、第一节点向第三节点发送第九消息。

第九消息用于指示未获取第一地址(或第二地址)的操作权限。第九消息可以为第八消息的响应消息，例如第九消息可以为嗅探响应消息。

示例性的，如图13所示，第一节点向第三节点发送第九消息(嗅探响应消息)，第八消息用于指示未获取第一地址(或第二地址)的操作权限。

该实施方式中，如果在第一节点获取第一地址的操作权限之前，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点指示未获取第一地址的操作权限。使得第三节点或其他节点可以对第一地址进行读写操作。同理，如果在第一节点获取第二地址的操作权限之前，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点向第三节点指示未获取第二地址的操作权限。使得第三节点或其他节点可以对第二地址进行读写操作。

在又一种可能的实施方式中，如果在第一节点开始对第一地址进行写操作但获取第一地址对应的缓存地址之前，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点在获取了第一地址对应的缓存地址之后，向第三节点发送向第一地址对应的缓存地址写入的数据，或者，指示已经释放第一地址的操作权限。同理，如果在第一节点开始对第二地址进行写操作但获取第二地址对应的缓存地址之前，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点在获取了第二地址对应的缓存地址之后，向第三节点发送向第二地址对应的缓存地址写入的数据，或者，指示已经释放第二地址的操作权限。如图14所示，上述读写操作执行方法还包括：

S1401、在第一节点开始对第一地址(或第二地址)进行写操作但未获取第一地址(或第二地址)对应的缓存地址，第一节点从第三节点接收第十二消息。

第十二消息用于请求对第一地址(或第二地址)进行需要操作权限的读写操作，或者说，用于请求第一地址(或第二地址)的操作权限。例如，第十二消息可以是嗅探(snoop)消息。

示例性的，如图15所示，在第三节点向第一节点发送第六消息(包括第一地址(或第二地址)对应的缓存地址)之前，第三节点向第一节点发送第十二消息(嗅探消息)，使得第一节点从第三节点接收第十二消息，该第十二消息用于请求对第一地址(或第二地址)进行需要操作权限的读写操作，或者，用于请求第一地址(或第二地址)的操作权限。

S1402、第一节点在获取第一地址(或第二地址)对应的缓存地址之后，向第三节点发送第十三消息。

示例性的，如图15所示，在第一节点接收到来自第一节点的第六消息1(包括第一地址(或第二地址)对应的缓存地址)之后，向第三节点发送第十三消息。第十三消息可以为第十二消息的响应消息，例如第十三消息可以为嗅探响应消息。

在一种可能的实施方式中，第十三消息中可以包括向第一地址(或第二地址)对应的缓存地址写入的数据。第十三消息可以具有第七消息的功能以取代第七消息，即第十三消息还可以用于指示向第三节点释放第一地址(或第二地址)的操作权限。

在另一种可能的实施方式中，第十三消息可以在第七消息(此时第七消息用于指示向第三节点释放第一地址(或第二地址)的操作权限)之后发送，用于指示已经释放第一地址(或第二地址)的操作权限。

在图14和图15所示的实施方式中，如果在第一节点开始对第一地址进行写操作但获取第一地址对应的缓存地址之前，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点在获取了第一地址对应的缓存地址之后，向第三节点发送向第一地址对应的缓存地址写入的数据，或者，指示已经释放第一地址的操作权限。则第一节点在获取了第一地址对应的缓存地址之后，向第三节点发送向第一地址对应的缓存地址写入的数据，使得第三节点能够直接得到该数据；或者，第一节点在发送第七消息后指示已经释放第一地址的操作权限，使得第三节点或其他节点能够对第一地址进行读写操作。

同理，如果在第一节点开始对第二地址进行写操作但获取第二地址对应的缓存地址之前，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点在获取了第二地址对应的缓存地址之后，向第三节点发送向第二地址对应的缓存地址写入的数据，或者，指示已经释放第二地址的操作权限。则第一节点在获取了第二地址对应的缓存地址之后，向第三节点发送向第二地址对应的缓存地址写入的数据，使得第三节点能够直接得到该数据；或者，第一节点在发送第七消息后指示已经释放第二地址的操作权限，使得第三节点或其他节点能够对第二地址进行读写操作。

在第一节点从第三节点获取第一地址的操作权限和第二地址的操作权限之后，在预设条件满足时，第一节点可以向第三节点释放第一地址的操作权限和第二地址的操作权限。使得第三节点或其他节点可以对第一地址和第二地址进行读写操作。

在一种可能的实施方式中，预设条件为第三节点请求第一地址和第二地址的操作权限。

示例性的，如果在第一节点获取了第一地址的操作权限之后并且开始对第一地址进行读写操作之前，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点释放第一地址的操作权限，并重新从第三节点获取第一地址的操作权限。同理，如果在第一节点获取了第二地址的操作权限之后并且开始对第二地址进行读写操作之前，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点向第三节点释放第二地址的操作权限，并重新从第三节点获取第二地址的操作权限。如图16所示，上述读写操作执行方法还包括：

S1601、在第一节点获取了第一地址(或第二地址)的操作权限之后并且开始对第一地址(或第二地址)进行读写操作之前，第一节点从第三节点接收第十消息。

第十消息用于请求对第一地址(或第二地址)进行需要操作权限的读写操作，或者说，用于请求第一地址(或第二地址)的操作权限。例如，第十消息可以是嗅探(snoop)消息。

示例性的，如图17所示，在第一节点向第三节点发送第四消息1之前，第三节点向第一节点发送第十消息(嗅探消息)，使得第一节点从第三节点接收第十消息，该第十消息用于请求对第一地址(或第二地址)进行需要操作权限的读写操作，或者，用于请求第一地址(或第二地址)的操作权限。

S1602、第一节点向第三节点发送第十一消息，并重新从第三节点获取第一地址(或第二地址)的操作权限。

第十一消息用于指示释放第一地址(或第二地址)的操作权限。第十一消息可以为第十消息的响应消息，例如第十一消息可以为嗅探响应消息。

示例性的，如图17所示，第一节点向第三节点发送第十一消息(嗅探响应消息)，第十一消息用于指示释放第一地址(或第二地址)的操作权限，并重新向第三节点发送第三消息(GET_E)，并从第三节点接收第四消息(RSP1/RSP2)以获取第一地址(或第二地址)的操作权限，并向第三节点发送第四消息的确认消息(ACK1)，然后重新执行对第一地址(或第二地址)的读写操作流程以及释放第一地址(或第二地址)的操作权限流程。

在该实施方式中，如果在第一节点获取了第一地址的操作权限之后并且开始对第一地址进行读写操作之前，第三节点请求对第一地址进行需要操作权限的读写操作，或者，请求第一地址的操作权限，则第一节点向第三节点释放第一地址的操作权限，并重新从第三节点获取第一地址的操作权限。在第一节点向第三节点释放第一地址的操作权限之后，使得第三节点可以直接对第一地址进行读写操作。第一节点重新从第三节点获取第一地址的操作权限，则可以继续对第一地址进行读写操作。

同理，如果在第一节点获取了第二地址的操作权限之后并且开始对第二地址进行读写操作之前，第三节点请求对第二地址进行需要操作权限的读写操作，或者，请求第二地址的操作权限，则第一节点向第三节点释放第二地址的操作权限，并重新从第三节点获取第二地址的操作权限。在第一节点向第三节点释放第二地址的操作权限之后，使得第三节点可以直接对第二地址进行读写操作。第一节点重新从第三节点获取第二地址的操作权限，则可以继续对第二地址进行读写操作。

在另一种可能的实施方式中，预设条件为第一节点从第三节点获取第一地址的操作权限的时间大于或等于第一预设时间，以及第一节点从第三节点获取第二地址的操作权限的时间大于或等于第二预设时间。第一预设时间和第二预设时间可以相同或不同。

如前文所述的，步骤S901和S902无先后执行顺序，对于先执行步骤S902后执行步骤S901，即第一节点预先获取第一地址(或第二地址)的操作权限，当接收到第一消息(或第二消息)时，可以快速对第一地址(或第二地址)执行读写操作。第一节点可以根据历史的读写操作提前获取第一地址(或第二地址)的操作权限。

在第一节点从第三节点获取第一地址的操作权限之后的预设时间内，如果未接收到第一消息，则第一节点向第三节点释放第一地址的操作权限。同理，在第一节点从第三节点获取第二地址的操作权限之后的预设时间内，如果未接收到第二消息，则第一节点向第三节点释放第二地址的操作权限。

示例性的，如图18所示，第一节点在通过第三消息和第四消息获取第一地址(或第二地址)的操作权限后，经过预设时间未接收到第一消息(或第二消息)，则第一节点向第三节点发送第十四消息以指示释放第一地址(或第二地址)的操作权限。后续第一节点再接收到第一消息(或第二消息)时，重新执行上述步骤S902-S903对应的交互流程，以完成读写操作。

示例性的，如图19所示，第一节点在通过第三消息和第四消息获取第一地址(或第二地址)的操作权限后，在预设时间内接收到第一消息(或第二消息)，则第一节点执行步骤S903对应的交互流程，以完成读写操作。

在该实施方式中，第一节点在接收了来自第二节点的读写请求后不必再执行获取操作权限的流程，可以快速对第一地址(或第二地址)执行读写操作。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时，可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)，光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种读写操作执行方法，其特征在于，包括：

第一节点从第二节点接收第一消息和第二消息；所述第一消息用于请求对第三节点管理的第一地址进行读写操作；所述第二消息用于请求对所述第三节点管理的第二地址进行读写操作；所述第二节点的读写操作的执行顺序约束比所述第三节点的读写操作的执行顺序约束严格；

所述第一节点从所述第三节点获取所述第一地址的操作权限和所述第二地址的操作权限；

所述第一节点对所述第一地址和所述第二地址进行读写操作。
根据权利要求1所述的方法，其特征在于，所述第一节点对所述第一地址和所述第二地址进行读写操作，包括：

所述第一节点并行对所述第一地址和所述第二地址进行读写操作。
根据权利要求2所述的方法，其特征在于，所述第一节点并行对所述第一地址和所述第二地址进行读写操作，包括：

所述第一节点按照所述第一消息和所述第二消息的接收顺序并行对所述第一地址和所述第二地址进行读写操作。
根据权利要求1-3任一项所述的方法，其特征在于，所述第二节点遵守严格顺序SO约束，第三节点遵守宽松顺序RO约束。
根据权利要求1-4任一项所述的方法，其特征在于，还包括：

所述第一节点在完成对所述第一地址的读写操作后，向所述第三节点释放所述第一地址的操作权限；

所述第一节点在完成对所述第二地址的读写操作后，向所述第三节点释放所述第二地址的操作权限。
根据权利要求1-5任一项所述的方法，其特征在于，所述第一节点从第三节点获取所述第一地址的操作权限和所述第二地址的操作权限，包括：

所述第一节点从所述第三节点获取所述第一地址的E态以及所述第二地址的E态。
根据权利要求1-6任一项所述的方法，其特征在于，还包括：

所述第一节点在请求所述第一地址的操作权限但未获取所述第一地址的操作权限时，接收到所述第三节点请求对所述第一地址进行需要操作权限的读写操作，或者，请求所述第一地址的操作权限，则所述第一节点向所述第三节点指示未获取所述第一地址的操作权限；

所述第一节点在请求所述第二地址的操作权限但未获取所述第二地址的操作权限时，接收到所述第三节点请求对所述第二地址进行需要操作权限的读写操作，或者，请求所述第二地址的操作权限，则所述第一节点向所述第三节点指示未获取所述第二地址的操作权限。
根据权利要求1-7任一项所述的方法，其特征在于，在所述第一节点从所述第三节点获取所述第一地址的操作权限和所述第二地址的操作权限之后，所述方法还包括：

在预设条件满足时，所述第一节点向所述第三节点释放所述第一地址的操作权限和所述第二地址的操作权限。
根据权利要求8所述的方法，其特征在于，所述预设条件为所述第三节点请求所述第一地址和所述第二地址的操作权限。
根据权利要求8所述的方法，其特征在于，所述预设条件为所述第一节点从所述第三节点获取所述第一地址的操作权限的时间大于或等于第一预设时间，以及所述第一节点从所述第三节点获取所述第二地址的操作权限的时间大于或等于第二预设时间。
根据权利要求1-10任一项所述的方法，其特征在于，所述第二节点为片上系统SoC芯片之外的输入输出I/O设备，所述第一节点为所述SoC芯片中的内存管理单元MMU，所述第三节点为所述SoC芯片中的内存控制器或所述内存控制器中的本地代理HA。
根据权利要求1-10任一项所述的方法，其特征在于，所述第二节点为SoC芯片中的处理器，所述第一节点为所述SoC芯片中的片上互联网络NOC或者所述处理器的接口模块，所述第三节点为所述SoC芯片中的内存控制器或所述内存控制器中的HA。
一种片上系统SoC芯片，其特征在于，包括：第一节点和内存控制器，

所述第一节点用于：

从第二节点接收第一消息和第二消息；所述第一消息用于请求对所述内存控制器管理的第一地址进行读写操作；所述第二消息用于请求对所述内存控制器管理的第二地址进行读写操作；所述第二节点的读写操作的执行顺序约束比所述内存控制器的读写操作的执行顺序约束严格；

从所述内存控制器获取所述第一地址的操作权限和所述第二地址的操作权限；

对所述第一地址和所述第二地址进行读写操作。
根据权利要求13所述的SoC芯片，其特征在于，所述第一节点具体用于：

并行对所述第一地址和所述第二地址进行读写操作。
根据权利要求14所述的SoC芯片，其特征在于，所述第一节点具体用于：

按照所述第一消息和所述第二消息的接收顺序并行对所述第一地址和所述第二地址进行读写操作。
根据权利要求13-15任一项所述的SoC芯片，其特征在于，所述第二节点遵守严格顺序SO约束，内存控制器遵守宽松顺序RO约束。
根据权利要求13-16任一项所述的SoC芯片，其特征在于，所述第一节点还用于：

在完成对所述第一地址的读写操作后，向所述内存控制器释放所述第一地址的操作权限；

在完成对所述第二地址的读写操作后，向所述内存控制器释放所述第二地址的操作权限。
根据权利要求13-17任一项所述的SoC芯片，其特征在于，所述第一节点具体用于：

从所述内存控制器获取所述第一地址的E态以及所述第二地址的E态。
根据权利要求13-18任一项所述的SoC芯片，其特征在于，所述第一节点还用于：

在请求所述第一地址的操作权限但未获取所述第一地址的操作权限时，接收到所述内存控制器请求对所述第一地址进行需要操作权限的读写操作，或者，请求所述第一地址的操作权限，则向所述内存控制器指示未获取所述第一地址的操作权限；

在请求所述第二地址的操作权限但未获取所述第二地址的操作权限时，接收到所述内存控制器请求对所述第二地址进行需要操作权限的读写操作，或者，请求所述第二地址的操作权限，则向所述内存控制器指示未获取所述第二地址的操作权限。
根据权利要求13-19任一项所述的SoC芯片，其特征在于，在从所述内存控制器获取所述第一地址的操作权限和所述第二地址的操作权限之后，所述第一节点还用于：

在预设条件满足时，向所述内存控制器释放所述第一地址的操作权限和所述第二地址的操作权限。
根据权利要求20所述的SoC芯片，其特征在于，所述预设条件为所述内存控制器请求所述第一地址和所述第二地址的操作权限。
根据权利要求20所述的SoC芯片，其特征在于，所述预设条件为所述第一节点从所述内存控制器获取所述第一地址的操作权限的时间大于或等于第一预设时间，以及所述第一节点从所述内存控制器获取所述第二地址的操作权限的时间大于或等于第二预设时间。
根据权利要求13-22任一项所述的SoC芯片，其特征在于，所述第二节点为所述SoC芯片之外的输入输出I/O设备，所述第一节点为所述SoC芯片中的内存管理单元MMU。
根据权利要求13-22任一项所述的SoC芯片，其特征在于，所述第二节点为所述SoC芯片中的处理器，所述第一节点为所述SoC芯片中的片上互联网络NOC或者所述处理器的接口模块。
根据权利要求13-24任一项所述的SoC芯片，其特征在于，所述第一节点包括顺序处理模块、操作权限判断模块和数据缓存判断模块；

所述顺序处理模块用于记录接收所述第一消息和所述第二消息的顺序；

所述操作权限判断模块用于记录是否收到所述第一地址的操作权限和所述第二地址的操作权限，并根据所述顺序来确定对所述第一地址和所述第二地址进行读写操作的先后顺序；

所述数据缓存判断模块用于记录是否收到所述第一地址对应的缓存地址的标识以及所述第二地址对应的缓存地址的标识，从而确定是否发送数据。