WO2012149812A1

WO2012149812A1 - 一种防止节点控制器死锁的方法及节点控制器

Info

Publication number: WO2012149812A1
Application number: PCT/CN2011/081393
Authority: WO
Inventors: 赵亚飞; 戴若星; 褚小伟
Original assignee: 华为技术有限公司
Priority date: 2011-10-27
Filing date: 2011-10-27
Publication date: 2012-11-08
Also published as: EP2568379A4; EP2568379A1; US20130111150A1; EP2568379B1; CN102439571A; CN102439571B

Description

一种防止节点控制器死锁的方法及节点控制器技术领域

本发明涉及计算机领域，尤其涉及一种防止节点控制器死锁的方法及节点控制器，应用于非一致内存访问（Non-Uniform Memory Access, NUMA ) 系统。

背景技术

传统的 NUMA系统的结构如图 1所示，由第一节点 N0、第二节点 N1 和第三节点 N2 这三个节点构成，这三个节点之间通过节点网络（Node Interconnect )相连。其中，第一节点 NO中包括一个节点控制器（ Node Controller, NC ), 一块系统内存（图 1未显示）以及用于管理系统内存的系统地址的本地代理（Home Agent, HA ), 一个处理器单元（图 1未显示）及该处理器单元的緩存代理（Caching Agent, CA )。如图 1所示，第一节点 NO中的各个组件本地互联（ Local Interconnect ), 第一节点 NO的 NC、第二节点 N1以及第三节点 N2之间节点互联（ Node Interconnect )。其中，第二节点 N1、第三节点 N2可以是仅包括处理器单元及其 CA 的节点，或者也可以是结构类似于第一节点 NO 的复杂节点。

在图 1所示的 NUMA系统中，第一节点 NO的 HA用于管理的系统内存的系统地址，第一节点 NO的 CA、第二节点 N1以及第三节点 N2通过该系统地址可以实现对系统内存访问。支设第一节点 NO的 HA管理系统地址 A , 当第二节点 N1 和 /或第三节点 N2 需要请求系统地址 A时，第二节点 N1 和 / 或第三节点 N2需要发起请求消息，并传送给第一节点 NO 的 NC, 然后由第一节点 NO的 NC将该请求消息传送给第一节点 NO 的 HA, 第一节点 NO 的 HA收到该请求消息后将系统地址 A传送给第一节点 NO 的 NC, 再由第一节点 NO 的 NC传送给第二节点 N1 和 /或第三节点 N2。进一步地， 4 设第二节点 N1 已緩存（ Cached )了系统地址 A, 而且第一节点 NO 的 CA也需要请求系统地址 A时，则第一节点 NO 的 CA也需要发起请求消息，并传送给第一节点 NO的 HA, 第一节点 NO的 HA收到其 CA发起的请求消息后需要发起监听消息，并传送给第一节点 NO的 NC, 由第一节点 NO的 NC将该监听消息传送给第二节点 Nl。第二节点 N1 收到该监听消息后，将反馈消息传送给第一节点 NO的 NC, 再由第一节点 NO的 NC传送给第一节点 NO的 HA, 使得第一节点 NO的 HA获悉第二节点緩存的系统地址 A有效，进而第一节点 NO 的 HA 可以将其存储的系统地址 A通过本地网络传送给第一节点 NO的 CA, 至此第一节点 NO的 HA完成了对第一节点 NO的 CA发起的请求消息的处理。在上述过程中，第一节点 NO的 HA获悉第二节点 N1緩存的系统地址 A有效后进一步通过本地网络将系统地址 A传送给 CA , 使 CA可以使用系统地址 A 进行系统内存，确保了第一节点 NO的 CA和第二节点 N1所使用的系统地址一致，从而满足 NUMA系统的緩存一致性协议（Cache Coherence Protocol ) 的要求。

实践中发现，在图 1所示的 NUMA 系统中，第一节点 NO的 NC上设有排队策略，来自第二节点 N1或第三节点 N2 的请求消息 Request先进入处理队列，使得来自第一节点 NO的 HA发起的监听消息 Probe有可能被第二节点 N1或第三节点 N2发起的请求消息 Request阻塞。同时，第一节点 NO 的 HA上也设有排队策略，来自第一节点 NO 的 CA发起的请求消息 Request先进入处理队列，使来自第一节点 NO的 NC传送的请求消息 Request也有可能被来第一节点 NO的 CA发起的请求消息 Request阻塞，如此，第一节点 NO的 NC和 HA之间就形成一个如图 2所示的阻塞环，从而导致了第一节点 NO的 NC死锁，而 NC死锁会永久性地消耗 NUMA 系统资源，最终会导致 NUMA 系统崩溃。

发明内容

针对上述缺陷，本发明实施例提供的一种防止节点控制器死锁的方法及节点控制器，主要应用于 NUMA系统，能够防止节点控制器死锁，从而避免死锁导致 NUMA系统性能下降或者崩溃。

一种防止节点控制器死锁的方法，应用于 NUMA系统，包括：

本节点的节点控制器接收任一节点发送的请求消息，并将所述请求消息写入处理队列；所述请求消息用于请求系统地址；

所述节点控制器监测其它节点上是否緩存有包含所述系统地址的緩存数据块，若是，则将所述其它节点上緩存中包含所述系统地址的緩存数据块进行无效处理，以使所述节点控制器接收到所述本节点的本地代理传送的第一监听消息时直接回应反馈消息至所述本地代理，而避免将所述第一监听消息写入所述处理队列被所述请求消息阻塞；所述第一监听消息用于监听所述其它节点上是否緩存有所述系统地址；所述反馈消息用于指示所述其它节点上緩存的所述系统地址无效，以使所述本地代理将其存储的所述系统地址传送给所述本节点的緩存代理；

所述节点控制器将已写入处理队列的所述请求消息传送给所述第一节点的本地代理。

一种节点控制器，应用于 NUMA系统，所述节点控制器位于 NUMA系统的本地节点中，所述节点控制器包括：

接收单元，用于接收任一节点发送的请求消息，并将所述请求消息写入处理队列；所述请求消息用于请求系统地址；

监测单元，用于监测其它节点上是否緩存有包含所述系统地址的緩存数据块；

处理单元，用于在所述监测单元的监测结果为是时，将所述其它节点上緩存的包含所述系统地址的緩存数据块进行无效处理；

所述接收单元，还用于接收所述本地节点的本地代理传送的第一监听消息，所述第一监听消息用于监听所述其它节点上是否緩存有所述系统地址；传送单元，用于在所述接收单元接收到所述第一监听消息时直接回应反馈消息至所述本地代理，避免所述接收单元将所述第一监听消息写入所述处理队列单元被所述请求消息阻塞；所述反馈消息用于指示所述其它节点上緩存的所述系统地址无效，以使所述本地代理将其存储的所述系统地址传送给所述本节点的緩存代理；

所述处理队列单元，用于存储所述接收单元写入的请求消息；

所述传送单元，还用于将已写入所述处理队列单元的所述请求消息传送给所述本地代理。

一种 NUMA系统，包括本地节点以及本地节点以外的其它节点，所述本地节点包括节点控制器、本地代理以及緩存代理，其中：

所述节点控制器接收所述其它节点的请求消息并将所述请求消息写入处理队列，所述请求消息用于请求系统地址；所述节点控制器监测所述其它节点上是否緩存有包含所述系统地址的緩存数据块，若是，则将所述其它节点上緩存的包含所述系统地址的緩存数据块进行无效处理，以使所述节点控制器接收到所述本地代理传送的第一监听消息时直接回应反馈消息至所述本地代理，而避免将所述第一监听消息写入所述处理队列被所述请求消息阻塞，所述第一监听消息用于监听所述其它节点上是否緩存有所述系统地址；所述反馈消息用于指示所述其它节点上緩存的所述系统地址无效，以使所述本地代理将其存储的所述系统地址传送给所述緩存代理；所述节点控制器将已写入处理队列的所述请求消息传送给所述本地代理。

本发明实施例中，本节点的节点控制器在接收到任一节点发送的请求消息并写入处理队列后，先监测其它节点上是否緩存有包含该系统地址的緩存数据块，若监测发现其它节点上緩存有包含该系统地址的緩存数据块，则节点控制器将其它节点上緩存的包含该系统地址的緩存数据块进行无效处理，后续节点控制器接收到本节点的本地代理传送的第一监听消息时，由于节点控制器已经无效掉了其它节点上緩存的包含该系统地址的緩存数据块，使得节点控制器不需要再向其它节点传送该第一监听消息，直接回应反馈消息给 HA即可，避免了节点控制器将该第一监听消息写入处理队列被请求消息阻塞，从而解开了节点控制器与 HA之间相互依赖的阻塞环，防止了节点控制器发生死锁，避免了 NUMA系统因为节点控制器发生死锁而崩溃。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作筒单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图 1为传统的 NUMA系统的结构示意图；

图 2为传统的 NUMA系统的 NC发生死锁的流程示意图；

图 3为本发明实施例一提供的防止节点控制器死锁的方法流程示意图；图 4为本发明实施例二提供的防止节点控制器死锁的方法流程示意图；图 5为本发明实施例三提供的一种节点控制器的结构示意图；图 6为本发明实施例三提供的另一种节点控制器的结构示意图；图 7为本发明实施例四提供的 NUMA系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明实施例提供了一种防止节点控制器死锁的方法、节, 控制器以及 NUMA系统，可以防止节点控制器死锁，避免 NUMA系统因为节点控制器死锁而崩溃。下面通过具体实施例进行说明。

实施例一：

请参阅图 3, 图 3为本发明实施例一提供的一种防止节点控制器死锁的方法，应用于 NUMA系统。如图 3所示，该方法可以包括以下步骤：

301、本节点的节点控制器（NC )接收任一节点发送的请求消息，并将该请求消息写入处理队列，该请求消息用于请求系统地址。

在 NUMA系统中， NC上设置有排队策略，用于请求系统地址的请求消息传送至 NC后， NC需要将该请求消息写入处理队列进行排队，然后按照处理权限（即处理的先后顺序）进行处理。

在 NUMA系统中，任一节点根据所请求的系统地址可以访问系统内存。在 NUMA系统中，本节点可以是中央处理器单元（ Central Processing Unit ,

CPU ), 或者可以是对称多处理（Symmetric Multi processing, SMP ) 系统，本发明实施例不作限定。

302、 NC 监测其它节点上是否緩存有包含上述系统地址的緩存数据块 ( Cache Line ),若是，则将其它节点上緩存的包含上述系统地址的緩存数据块进行无效处理，使 NC接收到本节点的 HA传送的第一监听消息时直接回应反馈消息给 HA, 避免 NC将该第一监听消息写入处理队列被请求消息阻塞；其中，第一监听消息用于监听其它节点上是否緩存有上述系统地址；该反馈消息用于指示其它节点上緩存的上述系统地址无效，以使 HA将其存储的上述系统地址传送给本节点的 CA。在 NUMA系统中，其它节点可以是 CPU, 或者可以是 SMP系统，本发明实施例不作限定。

作为一种可选的实施方式， NC监测其它节点上是否緩存有包含上述系统地址的緩存数据块的实现过程可以包括以下步骤：

Al、 NC向其它节点传送第二监听消息 SnpData,该第二监听消息 SnpData 用于监测其它节点上是否緩存有包含上述系统地址的緩存数据块。

Bl、 NC接收其它节点传送的响应消息 RapS, 该响应消息 RapS用于指示其它节点上是否緩存有包含上述系统地址的緩存数据块。

由此可见，通过上述步骤 A1和步骤 Bl , NC可以实现对其它节点的监测，获悉其它节点上是否緩存有包含上述系统地址的緩存数据块。

作为一种可选的实施方式， NC将其它节点上緩存的包含上述系统地址的緩存数据块进行无效处理的实现过程可以为：

NC传送指示消息 SnpInvXtoI给其它节点，其中，该指示消息 SnpInvXtoI 用于指示其它节点将其緩存的包含上述系统地址的緩存数据块删除或置为不可用。

进一步地， NC还可以接收其它节点传送的指示响应消息 Rspl , 该指示响应消息 Rspl是其它节点根据上述指示消息 SnpInvXtoI的指示，将其緩存的包含上述系统地址的緩存数据块删除或置为不可用后传送的。

在 NUMA系统中，其它节点接收到 NC传送的指示消息 SnpInvXtoI后，可以根据该指示消息 SnpInvXtoI的指示，将其緩存的包含上述系统地址的緩存数据块删除或置为不可用。其中，其它节点将其緩存的包含上述系统地址的緩存数据块删除或置为不可用的具体实现方式是本领域技术人员所公知的常识，本发明实施例此处不作详细介绍。

其中，对于 NC而言，当其接收到其它节点传送的指示响应消息 Rspl后，即可获悉其它节点已经将其緩存的包含上述系统地址的緩存数据块进行无效处理，这样 NC在后续过程中即使收到本节点的 HA传送的第一监听消息也不需要再将该第一监听消息传送给其它节点了，避免了 NC将该第一监听消息写入处理队列被请求消息阻塞。

303、 NC将已写入处理队列的请求消息传送给 HA。本实施例中， NC在监测出其它节点上緩存有包含上述系统地址的緩存数据块，并将其它节点上緩存的包含上述系统地址的緩存数据块进行无效处理之送给本节点的 HA, 以使 HA可以根据该请求消息的请求将存储的系统地址传送给 NC, 再由 NC将该系统地址传送给第二节点，从而使得第二节点可以采用该系统地址进行系统内存。

本实施例中， NC收到 HA传送的第一监听消息后，可以传送反馈消息至 HA,以使 HA根据该反馈消息的指示获悉其它节点緩存的上述系统地址无效，从而 HA可以将其存储的上述系统地址传送给 CA, 使得 CA可以采用该系统地址进行系统内存访问，从而满足 NUMA系统的緩存一致性协议的要求。

本实施例中， NC如果监测出其它节点上没有緩存有包含上述系统地址的緩存数据块，则 NC接收到 HA传送的第一监听消息后，也可以传送反馈消息至 HA, 使 HA可以将其存储的上述系统地址传送给 CA, 从而完成一次握手流程。 NC也不需要将该第一监听消息传送给其它节点了，从而可以避免将该第一监听消息写入处理队列被请求消息阻塞，进而避免了 NUMA系统因为 NC 发生死锁而崩溃。

本实施例中， NC传送请求消息和接收第一监听消息的先后顺序不限定，只要 NC在接收到第一监听消息之前已将其它节点緩存的包含上述系统地址的緩存数据块进行无效处理即可。本实施例中， NC已经预先获悉了其它节点已经将其緩存的包含上述系统地址的緩存数据块进行无效处理，这样 NC在接收到 HA传送的第一监听消息时，不需要再将该第一监听消息传送给其它节点了，从而可以避免 NC将该第一监听消息写入处理队列被请求消息阻塞。由于发生死锁是因为 NC和 HA之间形成相互依赖的阻塞环，因此只要在 NC上避免第一监听消息被请求消息阻塞，那么这个导致发生死锁的阻塞环也随之被解开，进而避免了 NUMA系统因为 NC发生死锁而崩溃。

本实施例中， CA传送的请求消息用于请求上述系统地址，也就是说 CA 与任一节点传送的请求消息所请求的系统地址相同，从而使得 CA与任一节点所使用的系统地址一致，满足 NUMA系统的緩存一致性协议的要求。其中， CA与任一节点传送的请求消息所请求的系统地址可以是 HA管理的多个系统地址中的任意一个。

实施例二：

请参阅图 4, 图 4为本发明实施例二提供的一种防止节点控制器死锁的方法，应用于 NUMA系统。其中，本实施例二以满足快速通道互联（ Quick Path Interconnect, QPI )协议的 NUMA系统为例，介绍本发明实施例中提供的一种防止节点控制器死锁的方法。进一步地，本实施例二中 H殳 NUMA系统中的第三节点 N2上緩存有包含系统地址 A的緩存数据块（ Cache Line )。如图 4 所示，该方法可以包括以下步骤：

401、第一节点 NO的 NC接收第二节点 N1传送的用于请求系统地址 A的请求消息 RdData, 并将请求消息 RdData写入处理队列。

402、第一节点 NO的 NC向第三节点 N2传送监听消息 SnpData, 该监听消息 SnpData用于监测第三节点 N2上是否緩存有包含系统地址 A的緩存数据块。

403、第一节点 NO的 NC接收第三节点 N2传送的响应消息 RapS, 该响应消息 RapS用于指示第三节点 N2上緩存有包含系统地址 A的 Cache Line。

404、第一节点 N0的 NC将指示消息 SnpInvXtoI传送给第三节点 N2, 其中，该指示消息 SnpInvXtoI用于指示第三节点 N2将其緩存的包含系统地址 A 的 Cache Line进行无效处理。

405、第一节点 N0的 NC接收第三节点 N2传送的指示响应消息 Rspl , 其中，该指示响应消息 Rspl是第三节点 N2根据上述指示消息 SnpInvXtoI的指示，将其緩存的包含系统地址 A的 Cache Line进行无效处理后传送的。

本实施例中，第三节点 N2将其緩存的包含系统地址 A的 Cache Line进行无效处理是指第三节点 N2将其緩存的包含系统地址 A的 Cache Line删除或置为不可用。

406、第一节点 NO的 NC将已写入处理队列的请求消息 RdData传送给第一节点 NO的 HA。

407、第一节点 NO的 NC接收第一节点 NO的 HA传送的监听消息 SnpData, 其中，第一节点 NO的 HA传送的监听消息 SnpData是第一节点 NO的 HA收到第一节点 NO的 CA传送的用于请求系统地址 A的请求消息 RdData后触发传送的。

408、第一节点 N0 的 NC接收到第一节点 N0 的 HA传送的监听消息 SnpData时，立刻传送反馈消息 RspCnfit至第一节点 N0的 HA。

本实施例中，第一节点 N0的 HA可以将 CA传送的用于请求系统地址 A 的请求消息 RdData以及第一节点 N0的 NC传送的请求消息 RdData写入处理队列进行排队，并按照处理权限（即处理的先后顺序）依次进行处理。具体地，第一节点 N0的 HA可以根据 CA传送的请求消息 RdData将系统地址 A传送给 CA;以及根据第一节点 N0的 NC传送的请求消息 RdData将系统地址 A传送给第一节点 N0的 NC, 再由第一节点 N0的 NC将系统地址 A传送给第二节点 Nl。

本实施例中，第一节点 N0的 NC在接收到来自第一节点 N0的 HA传送的监听消息 SnpData时，第一节点 N0的 NC已获悉了第一节点 N0的另一侧所有节点（即包括第二节点 N1和第三节点 N2 )上都不存在系统地址 A的 Cache Line, 那么第一节点 N0 的 NC 也就不需要继续向另一侧去传送监听消息 SnpData了，可以传送反馈消息 RspCnfit至第一节点 N0的 HA, 避免了第一节点 N0的 NC将监听消息 SnpData写入处理队列被请求消息 RdData阻塞，从而可以在第一节点 N0的 NC上解开相互依赖的阻塞环，避免了第一节点 N0 的 NC发生死锁。

作为一种可选的实施方式，本实施例中第一节点 N0的 NC上除了设置排队策略之外，还可以设置以下策略：

即第一节点 NO的 NC在收到其它节点传送的用于请求系统地址的请求消息时，如需要向第一节点 NO的 HA进一步请求时（第一节点 NO的 NC无法实现 HA的代理 ),必须先使其它节点所在一侧的所有包含该系统地址的 Cache Line无效，然后才能进行垮域请求。

其中，所谓的垮域请求是指用于请求系统地址的请求消息从其它节点进入第一节点 NO的 HA。

如图 4所示，第一节点 NO的 NC接收到来自第二节点 N1传送的请求消息后，发现自身作为 HA代理无法满足该请求，则第一节点 NO的 NC在进行垮域请求前，先按照上述设置好的策略，先将第二节点 N1 —侧的第三节点 N2上緩存的系统地址 A的 Cache Line无效掉。当第一节点 NO的 NC接收到来自第一节点 NO的 HA传送的监听消息时，尽管这个时候第一节点 NO的 NC 已经在处理来自第二节点 N1的请求消息，第一节点 NO的 NC也可以对针对监听消息传送反馈消息至第一节点的 HA。如此，第一节点 NO的 HA就可以先处理完来自 CA的请求消息，再继续处理来自第一节点 NO的 NC传送的请求消息。

本实施例中， NUMA系统的第一节点 NO的 NC在接收到第二节点 N1传送的请求消息并写入处理队列后，先将第三节点 N2上緩存的包含系统地址 A 的 Cache Line无效掉；然后 NC再将已写入处理队列的请求消息传送给第一节点 NO的 HA。第一节点 NO的 NC接收到第一节点 NO的 HA传送的监听消息时，第一节点 NO的 NC已经无效掉了第三节点 N2上緩存的包含系统地址 A 的 Cache Line, 使第一节点 NO的 NC不需要继续向第三节点 N2传送该监听消息，从而可以避免第一节点 NO的 NC将监听消息写入处理队列被请求消息阻塞，从而解开了第一节点 NO的 NC与 HA之间相互依赖的阻塞环，防止了第一节点 NO的 NC发生死锁，避免了 NUMA系统因为第一节点 NO的 NC发生死锁而崩溃。

实施例三：

请参阅图 5,图 5为本发明实施例三提供的一种节点控制器，应用于 NUMA 系统，本实施例提供的节点控制器位于 NUMA系统的某一节点中，该节点控制器可以包括：

接收单元 501 , 用于接收任一节点发送的请求消息，并将该请求消息写入处理队列 505; 其中，该请求消息用于请求系统地址；

监测单元 502, 用于监测其它节点上是否緩存有包含上述系统地址的緩存数据块；

处理单元 503, 用于在监测单元 502的监测结果为是时，将其它节点上緩存的包含上述系统地址的緩存数据块进行无效处理；

接收单元 501 , 还用于接收本节点的本地代理传送的第一监听消息，该第一监听消息用于监听其它节点上是否緩存有上述系统地址；

传送单元 504, 用于在接收单元 501接收到第一监听消息时直接回应反馈消息至本地代理，避免接收单元 501将第一监听消息写入处理队列单元被请求消息阻塞；其中，反馈消息用于指示其它节点上緩存的上述系统地址无效，以使本地代理将其存储的上述系统地址传送给本节点的緩存代理；

处理队列单元 505, 用于存储接收单元 501写入的请求消息；

传送单元 504还用于将已写入处理队列单元的请求消息传送给本地代理。请一并参阅图 6, 图 6为本发明实施例三提供的另一种节点控制器，应用于 NUMA系统。其中，图 6所示的节点控制器是由图 5所示的节点控制器进行优化得到的，图 6所示的节点控制器同样位于 NUMA系统的某一节点中。在图 6所示的节点控制器中，监测单元 502可以包括：

第一模块 5021 , 用于向其它节点传送第二监听消息，该第二监听消息用于监测其它节点上是否緩存有包含上述系统地址的緩存数据块；

第二模块 5022, 用于接收的其它节点传送的响应消息，该响应消息用于指示其它节点上是否緩存有包含上述系统地址的緩存数据块。

相应地，处理单元 503具体用于在第二模块 5022接收的响应消息表示第三节点上緩存有包含上述系统地址的緩存数据块时，将第三节点上緩存的包含系统地址的緩存数据块进行无效处理。

进一步地，在图 6所示的节点控制器中，处理单元 503可以包括：第三模块 5031 , 用于将指示消息 SnpInvXtoI传送给其它节点，该指示消息 SnpInvXtoI用于指示其它节点将其緩存的包含上述系统地址的緩存数据块删除或置为不可用。

进一步地，在图 6所示的节点控制器中，处理单元 503还可以包括：第四模块 5032, 用于接收其它节点传送的指示响应消息 Rspl , 该指示响应消息 Rspl是其它节点根据该指示消息 SnpInvXtoI的指示，将其緩存的包含上述系统地址的緩存数据块删除或置为不可用后传送的。

本实施例中，本地代理根据传送单元 504回应的反馈消息的指示获悉其它节点緩存了上述系统地址之后，可以将本地代理存储的上述系统地址传送给緩存代理，使得緩存代理可以采用该系统地址访问网络。

本实施例中，本节点的 CA传送的请求消息也用于请求上述系统地址，也就是说 CA 所请求的系统地址与任一节点传送的请求消息所请求的系统地址相同，从而使得 CA与任一节点所使用的系统地址一致，满足 NUMA系统的緩存一致性协议的要求。

在 NUMA系统中，节点可以是 CPU, 或者可以是 SMP系统，本发明实施例不作限定。

实施例四：

请参阅图 7, 图 7为本发明实施例四提供的一种 NUMA系统。在图 7所示的 NUMA系统中，该 NUMA系统包括本地节点 701以及本地节点 701以外的其它节点 702。其中，本地节点 701的结构与图 1中第一节点 NO的结构类似，不同的是，本地节点 701的 NC的结构与图 5所示的节点控制器结构相同，或者与图 6所示的节点控制器的结构相同。

其中，本地节点 701的节点控制器接收其它节点 702的请求消息并将该请求消息写入处理队列，该请求消息用于请求系统地址；

本地节点 701的节点控制器监测其它节点 702上是否緩存有包含上述系统地址的緩存数据块，若是，则将其它节点 702上緩存的包含上述系统地址的緩存数据块进行无效处理，以使节点控制器接收到本地代理传送的第一监听消息时直接回应反馈消息至本地代理，而避免将第一监听消息写入处理队列被请求消息阻塞，其中，第一监听消息用于监听其它节点 702上是否緩存有上述系统地址；反馈消息用于指示其它节点 702上緩存的上述系统地址无效，使本地代理将其存储的上述系统地址传送给緩存代理，以便所述本地节点 701的节点控制器将已写入处理队列的请求消息传送给本地代理。

其中，上述的第一监听消息是本地代理接收到緩存代理传送的请求消息之后传送给节点控制器的，緩存代理传送的请求消息用于请求上述系统地址。

其中，緩存代理请求上述系统地址与其它节点 702请求的系统地址相同。本发明实施例中，本地节点 701的节点控制器在接收到其它节点 702发送的请求消息并写入处理队列后，先监测其它节点 702上是否緩存有包含该系统地址的緩存数据块，若监测发现其它节点 702上緩存有包含该系统地址的緩存数据块，则节点控制器将其它节点 702上緩存的包含该系统地址的緩存数据块进行无效处理，后续节点控制器接收到本地代理传送的第一监听消息时，由于节点控制器已经无效掉了其它节点 702 上緩存的包含该系统地址的緩存数据块，使得节点控制器不需要再向其它节点 702传送该第一监听消息，直接回应反馈消息给本地代理即可，避免了节点控制器将该第一监听消息写入处理队列被请求消息阻塞，从而解开了节点控制器与 HA之间相互依赖的阻塞环，防止了节点控制器发生死锁，避免了 NUMA系统因为节点控制器发生死锁而崩溃。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：只读存储器（ Read-Only Memory, ROM )、随机存取存储器 ( Random Access Memory, RAM ), 磁碟或者光盘等各种可以存储程序代码的介质。以上对本发明实施例提供的一种防止节点控制器死锁的方法及节点控制器、 NUMA系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

权利要求

1、一种防止节点控制器死锁的方法，应用于非一致内存访问系统，其特征在于，包括：

2、根据权利要求 1所述的方法，其特征在于，所述节点控制器监测其它节点上是否緩存有包含所述系统地址的緩存数据块，包括：

所述节点控制器向其它节点传送第二监听消息，所述第二监听消息用于监测其它节点上是否緩存有包含所述系统地址的緩存数据块；

所述节点控制器接收的所述其它节点传送的响应消息，所述响应消息用于指示所述其它节点上是否緩存有包含所述系统地址的緩存数据块。

3、根据权利要求 1或 2所述的方法，其特征在于，所述将所述其它节点上緩存中包括所述系统地址的緩存数据块进行无效处理，包括：

所述节点控制器传送指示消息 SnpInvXtoI给所述其它节点，所述指示消息 SnpInvXtoI用于指示所述其它节点将其緩存中包含所述系统地址的緩存数据块删除或置为不可用。

4、根据权利要求 3所述的方法，其特征在于，所述方法还包括：所述节点控制器接收所述其它节点传送的指示响应消息 Rspl , 所述指示响应消息 Rspl是所述其它节点根据所述指示消息 SnpInvXtoI的指示，将其緩存的包含所述系统地址的緩存数据块删除或置为不可用后传送的。

5、根据权利要求 1或 2所述的方法，其特征在于，所述第一监听消息是所述本地代理接收到所述本节点的緩存代理传送的请求消息之后传送给所述节点控制器的，所述緩存代理传送的请求消息用于请求所述系统地址。

6、根据权利要求 1或 2所述的方法，其特征在于，所述本节点为中央处理器单元或是对称多处理 SMP系统。

7、一种节点控制器，应用于非一致内存访问系统，所述节点控制器位于所述非一致内存访问系统的本地节点中，其特征在于，所述节点控制器包括：接收单元，用于接收任一节点发送的请求消息，并将所述请求消息写入处理队列；所述请求消息用于请求系统地址；

8、根据权利要求 7所述的节点控制器，其特征在于，所述监测单元包括：第一模块，用于向其它节点传送第二监听消息，所述第二监听消息用于监测其它节点上是否緩存有包含所述系统地址的緩存数据块；

第二模块，用于接收所述其它节点传送的响应消息，所述响应消息用于指示所述其它节点上是否緩存有包含所述系统地址的緩存数据块。

9、根据权利要求 7或 8所述的节点控制器，其特征在于，所述处理单元包括：

第三模块，用于在所述监测单元的监测结果为是时，传送指示消息 SnpInvXtoI给所述其它节点，所述指示消息 SnpInvXtoI用于指示所述其它节点将其緩存的包含所述系统地址的緩存数据块删除或置为不可用。

10、根据权利要求 9所述的节点控制器，其特征在于，所述处理单元还包括：

第四模块，用于接收所述其它节点传送的指示响应消息 Rspl , 所述指示响应消息 Rspl是所述其它节点根据所述指示消息 SnpInvXtoI的指示，将其緩存的包含所述系统地址的緩存数据块删除或置为不可用后传送的。

11、根据权利要求 7或 8所述的节点控制器，其特征在于，所述第一监听消息是所述本地代理接收到所述本地节点的緩存代理传送的请求消息之后传送给所述节点控制器的，所述緩存代理传送的请求消息用于请求所述系统地址。

12、根据权利要求 7或 8所述的节点控制器，其特征在于，所述本地节点为中央处理器单元或是对称多处理 SMP系统。

13、一种非一致内存访问系统，包括本地节点以及本地节点以外的其它节点，所述本地节点包括节点控制器、本地代理以及緩存代理，其特征在于：所述节点控制器接收所述其它节点的请求消息并将所述请求消息写入处理队列，所述请求消息用于请求系统地址；所述节点控制器监测所述其它节点上是否緩存有包含所述系统地址的緩存数据块，若是，则将所述其它节点上緩存的包含所述系统地址的緩存数据块进行无效处理，以使所述节点控制器接收到所述本地代理传送的第一监听消息时直接回应反馈消息至所述本地代理，而避免将所述第一监听消息写入所述处理队列被所述请求消息阻塞，所述第一监听消息用于监听所述其它节点上是否緩存有所述系统地址；所述反馈消息用于指示所述其它节点上緩存的所述系统地址无效，使所述节点控制器将已写入处理队列的所述请求消息传送给所述本地代理。

14、根据权利要求 13所示的非一致内存访问系统，其特征在于，所述第一监听消息是所述本地代理接收到所述緩存代理传送的请求消息之后传送给所述节点控制器的，所述緩存代理传送的请求消息用于请求所述系统地址。