WO2015135385A1

WO2015135385A1 - 服务器及数据访问方法

Info

Publication number: WO2015135385A1
Application number: PCT/CN2015/070453
Authority: WO
Inventors: 王工艺; 贺成洪; 赵亚飞; 常胜
Original assignee: 华为技术有限公司
Priority date: 2014-03-12
Filing date: 2015-01-09
Publication date: 2015-09-17
Also published as: CN103870435A; CN103870435B

Abstract

一种服务器及数据访问方法，该服务器（100）包括处理器互联节点（110）；处理器互联节点（110）包括至少一个节点控制器（120）和至少两个基本节点（130），每个基本节点（130）包括至少四个处理器（140）；节点控制器（120），与基本节点（130）相连接，用于按照处理器（140）的地址空间管理处理器（140）的事务；还用于接收源处理器的访问请求及源处理器标识，按照访问请求中携带的目标地址，将访问请求以及节点控制器标识发往目标处理器。至少一个NC保证了服务器的带宽；相同基本节点中的处理器可以直接互联并互相访问，相同处理器互联节点的不同基本节点中的处理器进行数据访问时，不需跨越NC之间的链路，降低了服务器延迟。

Description

服务器及数据访问方法

本申请要求于2014年3月12日提交中国专利局、申请号201410091090.X、发明名称为“服务器及数据访问方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及计算机技术领域，尤其涉及一种服务器及数据访问方法。

背景技术

从系统架构来看，目前的商用服务器一般可以分为三类，即对称多处理器结构(Symmetric Multi-Processor，SMP)、非一致存储访问结构(Non-Uniform Memory Access，NUMA)以及海量并行处理结构(Massive Parallel Processing，MPP)。

SMP服务器是指服务器中多个中央处理器(Central Processing Unit，CPU)对称工作，无主次或从属关系，每个CPU共享相同的物理内存，访问内存中的任何地址所需的时间相同，SMP的缺点是扩展性能有限；NUMA服务器具有多个CPU模块，每个CPU模块由多个CPU(如4个)组成，并且具有独立的本地内存、I/O槽口等，CPU模块之间可以通过互联模块(如Crossbar Switch)进行连接完成信息交互，各个CPU访问本地内存的速度远远高于访问远地内存(系统内其它CPU模块的内存)的速度，当CPU数量增加时，服务器性能无法线性增加；MPP服务器由多个SMP服务器通过一定的节点互联网络进行连接，每个SMP节点可以运行自己的操作系统、数据库等，但是每个节点内的CPU不能访问另一个节点的内存，节点之间的信息交互通过节点互联网络实现。

当前具有三种处理器互联架构，第一种为单立方体互联架构，是Intel推荐的最大处理器互联架构，可以支持8个CPU互联，但是最大仅能扩展到8P系统，无法进行更多CPU的连接，扩展性受到影响。

第二种处理器互联架构为一个节点内两个CPU或者四个CPU与一个节点控制器(Node Controller，NC)互联，NC与NC之间互联形成更大规模的系统。这种架构的缺点是NC上的对外连接的链路会成为带宽瓶颈，节点内CPU都需要通过同一个NC进行事务处理和带宽需求。

第三种处理器互联架构为一个节点内两个CPU或者四个CPU与两个NC互联，这种拓扑方案节点间通过两个NC互联，两个NC按照地址空间分摊了的事务处理和带宽需求，能较好的满足带宽需求。这种拓扑方案在4P时延迟较小，但是对于8P以上甚至更大系统，某个节点中的CPU访问另外节点上的内存时，需要跨越两个NC，延迟较大，并且延迟对于NUMA系统性能影响很大。

综上所述，如何在保证服务器带宽的同时减小服务器延迟是目前需要解决的问题。

发明内容

技术问题

有鉴于此，本发明要解决的技术问题是，如何在保证服务器带宽的同时减小服务器延迟。

解决方案

为了解决上述技术问题，在第一方面，本发明提供了一种服务器，包括：

处理器互联节点；

所述处理器互联节点包括至少一个节点控制器和至少两个基本节点，每个所述基本节点包括至少四个处理器；

所述节点控制器，与所述基本节点相连接，用于按照所述处理器的地址空间管理所述处理器的事务；

所述节点控制器，还用于接收源处理器的访问请求及源处理器标识，按照所述访问请求中携带的目标地址，将所述访问请求以及节点控制器标识发往目标处理器，其中，所述源处理器和所述目标处理器位于不同的基本节点，所述目标地址为所述目标处理器的地址。

结合第一方面，在第一方面的第一种可能的实现方式中，所述节点控制器，还用于从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述节点控制器包括控制芯片、本地代理LP和远端代理RP；

所述控制芯片，用于从所述源处理器接收所述源处理器标识和所述访问请求；从所述访问请求中获取RP标识，向所述RP标识指向的RP发送所述访问请求和所述源处理器标识；

所述RP，用于从所述访问请求中获取所述目标地址，对所述目标地址进行译码得到LP标识，向所述LP标识指向的LP发送所述访问请求；从所述LP接收所述数据响应，将所述数据响应发送至所述源处理器标识对应的所述源处理器；

所述LP，用于记录所述RP标识，从所述访问请求中获取所述目标地址，向所述目标地址所指向的所述目标处理器发送所述访问请求和节点控制器标识，所述节点控制器标识为所述LP标识；从所述目标处理器接收所述数据响应；向所述RP标识指向的所述RP发送所述数据响应。

结合第一方面以及第一方面的第一种和第二种可能的实现方式，在第一方面的第三种可能的实现方式中，所述节点控制器具体还用于：在所述目标处理器接收到新的访问请求，指示访问所述目标地址上的数据的情况下，接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址；按照所述源处理器标识向所述源处理器发送所述侦听消息；接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。

结合第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，LP还用于从所述目标处理器接收所述侦听消息；从第二目录信息中获取所述RP标识，并向所述RP标识指向的所述RP发送所述侦听消息，所述第二目录信息为所述LP中保存的目录信息；根据所述目标地址向所述目标处理器发送所述侦听响应；

所述RP还用于向所述源处理器标识指向的所述源处理器发送所述侦听消息；向所述节点控制器标识指向的所述LP发送所述侦听响应。

结合第一方面以及第一方面的第一种至第四种可能的实现方式中的任意一种可能的实现方式，在第一方面的第五种可能的实现方式中，所述处理器互联节点包括第一基本节点、第二基本节点和两个节点控制器，所述第一基本节点和所述第二基本节点分别包括至少四个处理器。

在第二方面，本发明提供了一种数据访问方法，应用于第一方面以及第一方面的任意一种可能的实现方式所述的服务器，源处理器需要访问目标处理器时，所述数据访问方法包括：

节点控制器接收所述源处理器的访问请求及源处理器标识，所述访问请求中携带目标地址，所述目标地址为所述目标处理器的地址；

所述节点控制器按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器；

所述节点控制器从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。

结合第二方面，在第二方面的第一种可能的实现方式中，所述节点控制器包括控制芯片、本地代理LP和远端代理RP，所述节点控制器按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器，包括：

所述控制芯片从所述源处理器接收所述源处理器标识和所述访问请求，并从所述访问请求中获取RP标识，向所述RP标识指向的RP发送所述访问请求和所述源处理器标识；

所述RP从所述访问请求中获取所述目标地址，对所述目标地址进行译码得到LP标识，向所述LP标识指向的LP发送所述访问请求；

所述LP记录所述RP标识，从所述访问请求中获取所述目标地址，向所述目标地址所指向的所述目标处理器发送所述访问请求和节点控制器标识，所述节点控制器标识为所述LP标识；

所述节点控制器从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器，包括：

所述LP从所述目标处理器接收所述数据响应，并向所述RP标识指向的所述RP发送所述数据响应；

所述RP将所述数据响应发送至所述源处理器标识对应的所述源处理器。

结合第二方面以及第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，在所述目标处理器接收到新的访问请求，指示需要访问所述目标地址上的数据的情况下，所述数据访问方法还包括：

所述节点控制器接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址；

所述节点控制器按照所述源处理器标识向所述源处理器发送所述侦听消息；

所述节点控制器接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。

结合第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，所述节点控制器按照所述源处理器标识向所述源处理器发送所述侦听消息，包括；

所述LP从所述目标处理器接收所述侦听消息；

所述LP从第二目录信息中获取所述RP标识，并向所述RP标识指向的所述RP发送所述侦听消息，所述第二目录信息为所述LP中保存的目录信息；

所述RP向所述源处理器标识指向的所述源处理器发送所述侦听消息；

所述节点控制器接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器，包括：

所述控制芯片从所述源处理器接收所述侦听响应，并从所述侦听响应中获取所述RP标识，向所述RP标识指向的所述RP发送所述侦听响应；

所述RP向所述节点控制器标识指向的所述LP发送所述侦听响应；

所述LP根据所述目标地址向所述目标处理器发送所述侦听响应。

有益效果

本实施例的服务器，至少一个NC保证了服务器的带宽；进一步地，相同基本节点中的处理器可以直接互联并互相访问彼此的数据，相同处理器互联节点的不同基本节点中的处理器之间进行数据访问时，不需要跨越NC之间的链路，降低了服务器延迟。

根据下面参考附图对示例性实施例的详细说明，本发明的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面，并且用于解释本发明的原理。

图1a示出根据本发明一实施例的服务器的结构框图；

图1b示出根据本发明一实施例的处理器互联节点的结构框图；

图1c示出根据本发明一实施例的处理器互联节点的结构框图；

图2示出根据本发明一实施例的数据访问方法的流程图；

图3示出根据本发明一实施例的处理器互联节点的结构框图；

图4示出根据本发明另一实施例的数据访问方法的流程图；

图5示出根据本发明另一实施例的服务器的结构框图。

具体实施方式

以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本发明，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本发明同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本发明的主旨。

图1a示出根据本发明一实施例的服务器的结构框图。该服务器100，具体可以包括：

处理器互联节点110；

所述处理器互联节点110包括至少一个节点控制器120和至少两个基本节点130，每个所述基本节点130包括至少四个处理器140；

所述节点控制器120，与所述基本节点130相连接，用于按照所述处理器140的地址空间管理所述处理器140的事务。

具体地，服务器100可以包括处理器互联节点110，处理器互联节点110可以包括至少一个节点控制器120。进一步地，处理器互联节点110还可以包括至少两个基本节点130，每个基本节点130中可以包括至少四个处理器140。

在该服务器100中，节点控制器120与基本节点130相连接，可以按照基本节点130中不同处理器140的地址空间管理处理器140的事务。节点控制器120还可以与其他处理器互联节点中的节点控制器相连接，使得一个处理器可以通过节点控制器以及节点控制器之间的链路访问其他处理器互联节点中的处理器，满足服务器的带宽需求。

进一步地，所述节点控制器120，还用于接收源处理器的访问请求及源处理器标识，按照所述访问请求中携带的目标地址，将所述访问请求以及节点控制器标识发往目标处理器，其中，所述源处理器和所述目标处理器位于不同的基本节点，所述目标地址为所述目标处理器的地址；所述节点控制器120，还用于从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。

对于处理器互联节点110，相同基本节点130内的处理器140之间可以通过处理器140中的通信模块直接进行通信，实现互访问，不同基本节点 130中的处理器140之间可以通过节点控制器120进行通信，实现互访问。并且，在源处理器需要访问目标处理器中的数据、且源处理器和目标处理器位于不同的基本节点时，在源处理器向目标处理器发送访问请求的过程中，节点控制器120可以接收源处理器的访问请求及源处理器标识，按照所述访问请求中携带的目标地址，将所述访问请求以及节点控制器标识发往目标处理器；在目标处理器向源处理器返回数据响应的过程中，目标处理器可以根据节点控制器标识向对应的节点控制器120发送数据响应，节点控制器120接收到该数据响应之后可以按照所述源处理器标识将所述数据响应发往所述源处理器。在通信的过程中，不需要跨越NC之间的链路，可以减少服务器的延迟。

具体地，所述节点控制器120可以包括控制芯片、本地代理LP和远端代理RP。在源处理器请求访问目标处理器中数据的过程中，节点控制器120的上述组件分别可以执行以下动作：

所述控制芯片，用于从所述源处理器接收所述源处理器标识和所述访问请求；从所述访问请求中获取RP标识，向所述RP标识指向的RP发送所述访问请求和所述源处理器标识。

所述RP，用于从所述访问请求中获取所述目标地址，对所述目标地址进行译码得到LP标识，向所述LP标识指向的LP发送所述访问请求；从所述LP接收所述数据响应，将所述数据响应发送至所述源处理器标识对应的所述源处理器。

在一种可能的实现方式中，在所述目标处理器接收到新的访问请求，指示访问所述目标地址上的数据的情况下，节点控制器120可以接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址；按照所述源处理器标识向所述源处理器发送所述侦听消息；接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。

本实施例的服务器，至少一个NC保证了服务器的带宽；相同基本节点中的处理器可以直接互联并互相访问彼此的数据，相同处理器互联节点的不同基本节点中的处理器之间进行数据访问时，不需要跨越NC之间的链路，降低了服务器延迟。

图1b示出根据本发明一实施例的处理器互联节点的结构框图。如图1b所示，该处理器互联节点200具体可以包括：第一基本节点210、第二基本节点220和两个节点控制器230，所述第一基本节点210包括至少四个处理器240，所述第二基本节点220包括至少四个处理器250。

具体地，由四个处理器构成一个4P节点，该4P节点可以称之为基本节点，其中每个处理器具有自身的内存、通信模块，每个处理器之间可以通过通信模块进行通信，可以访问自身内存中的数据也可以彼此内存中的数据。每个处理器互联节点可以由八个处理器构成，由两个如上所述的基本节点通过两个节点控制器(NC)互联而成。两个NC可以分别负责两个不同地址空间的平面，即分别负责两个不同地址空间的处理器的事务，也可以根据需要进行调整，本发明对此不作限定。图1c示出根据本发明一实施例的处理器互联节点的结构框图。如图1c所示，节点控制器1负责基本节点0中处理器0、处理器1的事务和基本节点1中处理器4、处理器5的事务，节点控制器0负责基本节点0中处理器2、处理器3的事务和基本节点1中处理器6、处理器7的事务。进一步地，两个NC可以各自与其他NC互联构成具有更大带宽的服务器，即NC可以通过互联接口与其他NC相连接。该处理器互联节点中，双NC可以保证在处理器进行跨NC访问的过程中服务器的带宽。此外，在基本节点0中的处理器访问基本节点1中的内存时，可以通过节点控制器0或节点控制器1直接进行访问，不再需要跨NC之间的链路，例如基本节点0中的处理器2可以通过节点控制器0 直接访问基本节点1中处理器6的内存，这样可以保证处理器互联节点中跨基本节点访问造成的服务器延迟较低。

综上所述，本发明提供的服务器，包括至少一个节点控制器和至少两个通过节点控制器相通信的基本节点，可以在保证服务器带宽的同时，降低相同处理器互联节点中不同基本节点的处理器互相访问时的服务器延迟。

图2示出根据本发明一实施例的数据访问方法的流程图。如图2所示，该数据访问方法可以应用于本发明上述实施例的服务器中，源处理器需要访问目标处理器时，该数据访问方法主要可以包括：

步骤300、节点控制器接收所述源处理器的访问请求及源处理器标识，所述访问请求中携带目标地址，所述目标地址为所述目标处理器的地址。

具体地，在本发明上述实施例的处理器互联节点中，源处理器需要访问目标处理器的情况下，可以根据待访问数据的地址即目标地址确定处理源处理器事务的NC，并向该NC发送访问请求和源处理器标识。在该访问请求中可以包括目标地址。

在一种可能的实现方式中，本发明上述实施例的处理器互联节点中，源处理器的事务与目标处理器的事务可能分别由该处理器互联节点中的两个NC管理的，两个NC管理的地址空间不同，可以分担处理器互联节点的带宽压力，这两个NC之间没有互联，不能直接进行通讯。在这种情况下，源处理器需要先将访问请求和源处理器标识发送至某一个中间处理器，该中间处理器与源处理器归属于同一基本节点，可以不通过NC直接进行通讯，且该中间处理器的事务与目标处理器的事务由同一个NC管理，中间处理器可以通过该NC与目标处理器进行通讯。通过中间处理器的转发，可以将源处理器的访问请求和源处理器标识发送至目标处理器。例如，图3示出根据本发明一实施例的处理器互联节点的结构框图，如图3所示，若CPU5为源处理器，CPU2为目标处理器，CPU5需要访问CPU2的数据，CPU5需要将访问请求和CPU5的标识发送至CPU6或CPU7，CPU6或CPU7将访问请求和CPU5的标识通过右侧NC发送至CPU2。CPU6和CPU7的选择可以由该处理器互联节点的路由配置来确定。

步骤310、所述节点控制器按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器。

具体地，NC接收到访问请求和源处理器标识之后，可以记录源处理器标识，用于后续确定哪个处理器占用该目标地址的数据。NC可以通过目标地址确定待访问数据所在的目标处理器，并将访问请求发送至目标处理器，同时NC还可以向目标处理器发送NC的标识即节点控制器标识，用于目标处理器可以正确返回数据响应。

步骤320、所述节点控制器从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。

具体地，目标处理器接收到数据访问请求之后，可以返回数据响应，在返回数据响应的过程中，可以先通过节点控制器标识确定可以转发数据响应的NC，NC在接收到数据响应之后，可以通过记录的源处理器标识确定请求访问数据的源处理器，并将数据响应发往源处理器，完成数据访问。

在一种可能的实现方式中，NC中可以包括本地代理(Local Proxy，LP)和远端代理(Remote Proxy，RP)。其中，LP可以用于完成基本节点内CPU与基本节点外NC的协议处理工作，从基本节点内CPU来看LP具有缓存代理(Cache Agent，CA)功能，即基本节点内CPU认为LP上是有处理器核的，虽然处理器核并不在LP上，而是在远端节点内的处理器中；从基本节点外NC来看LP具有内存代理(Home Agent，HA)功能，即基本节点外NC认为LP上是有内存的，虽然内存并不在LP上，而是连接在基本节点内的处理器上；RP可以完成基本节点内CPU与基本节点外NC的协议处理工作，从基本节点内CPU来看RP具有HA功能，即基本节点内CPU认为RP上是有内存的，虽然内存并不在RP上，而是连接在基本节点外的处理器上；从基本节点外NC来看RP具有CA功能，即基本节点外NC认为RP是有处理器核的，虽然处理器核并不在RP上，而是在基本节点内的处理器上的。在CPU之间进行数据访问的过程中，一个LP可以负责位于两个处理器内的HA事务，其中HA事务即为请求访问内存的过程。RP可以通过低位地址交织管理八个CPU的请求。LP、RP的存在可以让基本节点内外的处理器都能够访问基本节点内外内存中的数据而不会出现数据不一致的现象。

在一种可能的实现方式中，在步骤300之前，源处理器可以根据目标地址确定是否需要将访问请求发往NC，若源处理器和待访问数据所在的目标处理器属于同一个基本节点(如基本节点0)，由于同一个基本节点内的CPU之间可以通过通信模块直接访问，则不需要将访问请求发往NC；若源处理器和待访问数据所在的目标处理器不属于同一个基本节点(如源处理器归属于基本节点0，目标处理器归属于基本节点1)，由于不同基本节点中的处理器需要通过NC进行访问，则需要将访问请求发往NC。在需要将访问请求发往NC的情况下，源处理器可以继续根据目标地址确定将访问请求发往该处理器互联节点中的哪一个NC。如图3所示，CPU0～CPU3属于同一基本节点，地址中地址位A41＝0，CPU4～CPU7属于同一基本节点，地址中地址位A41＝1；左侧NC代理的处理器地址中地址位A40＝0，右侧NC代理的处理器地址中地址位A40＝1。如果CPU5请求访问CPU2的内存数据，CPU5可以通过待访问数据所在的CPU2的地址位A41＝0确定CPU2与CPU5不属于同一基本节点，访问过程中需要经过NC。CPU5再通过待访问数据所在的CPU2的地址位A40＝1确定将访问请求发往右侧NC。

在一种可能的实现方式中，NC中还可以包括控制芯片，步骤310具体可以包括：

步骤311、所述控制芯片从所述源处理器接收所述源处理器标识和所述访问请求，并从所述访问请求中获取RP标识，向所述RP标识指向的RP发送所述访问请求和所述源处理器标识。

具体地，在访问请求中可以包括目标地址，用于指示源处理器需要访问的数据所在的地址。控制芯片从源处理器接收到源处理器标识和访问请求之后，可以在访问请求中包括的目标地址中获取RP标识，该RP标识指示控制芯片将源处理器标识和访问请求发往NC中的哪一个RP。控制芯片可以向该RP标识指向的RP发送源处理器标识和访问请求，其中，RP标识可以为目标地址中的地址位[A7，A6]，该源处理器标识可以用于在RP的目录信息中记录占用内存中目标地址上的数据的源处理器。例如，如图3所示，若目标地址中的地址位[A7，A6]＝10，则CPU5可以确定通过中间处理器CPU6或CPU7将访问请求发送至右侧NC，右侧NC的控制芯片接收该访问请求，并从中获取RP标识，并可以根据RP标识确定将该访问请求发送至RP2。

步骤312、所述RP从所述访问请求中获取所述目标地址，对所述目标地址进行译码得到LP标识，向所述LP标识指向的LP发送所述访问请求。

具体地，在RP中可以保存一个目录信息即第一目录信息，在该目录信息中可以记录某一个处理器占用了内存某一个地址上的数据，其中处理器可以通过处理器的标识来记录。根据缓存一致性和内存一致性协议MESI协议，每一个缓存行都可以被标记为以下四种状态之一：修改(Modified)、独占(Exclusive)、共享(Shared)、无效(Invalid)。在某一个缓存行被标记为无效态时，说明该缓存行是无效的，即为空行，无效行必须被从内存中取出，变为共享或者独占状态才能实现读请求。

在RP的第一目录信息中还可以记录缓存行的状态，在RP查找到该目标地址在第一目录信息中记录为无效态的情况下，RP可以根据目标地址的[A45，A42]地址位判断需要将接收到的访问请求发往哪个处理器互联节点，如果是该RP所在的处理器互联节点，则可以根据目标地址的地址位A41和A6判断发往哪个LP。例如，如图3所示，A41＝0，且LP0和LP1代理的处理器地址位A41＝0，LP3和LP4代理的处理器地址位A41＝1，则RP可以根据目标地址译码得到LP标识，即由目标地址中的地址位A41＝0确定将接收到的访问请求发往LP0或者LP1。进一步地，LP0代理的HA事务中A6＝0，而LP1代理的HA事务中A6＝1，则RP可以由目标地址中的地址位A6＝0确定将接收到的访问请求发往LP0即LP。

步骤313、所述LP记录所述RP标识，从所述访问请求中获取所述目标地址，向所述目标地址所指向的所述目标处理器发送所述访问请求和节点控制器标识，所述节点控制器标识为所述LP标识。

具体地，LP接收到上述访问请求之后，可以记录RP的标识即RP标识，以用于后续向该RP返回数据响应。LP还可以获取访问请求中的目标地址，根据目标地址中的地址位A39可以确定将访问请求发往哪个处理器即目标处理器。在LP发送访问请求时还可以将节点控制器标识即LP标识一起发送至目标处理器，用于后续目标处理器向该LP返回数据响应。例如，如图3所示，目标地址中的地址位A39＝0，则LP0可以将访问请求和节点控制器标识发送至对应的目标处理器CPU2。

在一种可能的实现方式中，若源处理器和目标处理器不属于同一个处理器互联节点，参见本发明上述实施例的服务器，不同的处理器互联节点之间可以通过NC之间的链路进行连接。在这种情况下，源处理器请求访问目标处理器的数据需要跨越NC之间的链路，可能由不同NC的LP和RP实现访问请求的发送与接收，即RP与LP并不属于同一个NC，RP属于源处理器所在处理器互联节点的NC，LP属于目标处理器所在处理器互联节点的NC。此时，LP除了记录RP标识之外，还可以记录RP所在的NC。在后续返回数据响应时，LP可以先根据记录的信息确定RP所在的NC，然后再根据RP标识确定RP。

在一种可能的实现方式中，步骤320具体可以包括：

步骤321、所述LP从所述目标处理器接收所述数据响应，并向所述RP标识指向的所述RP发送所述数据响应；

步骤322、所述RP将所述数据响应发送至所述源处理器标识对应的所述源处理器。

具体地，在目标处理器接收到访问请求和节点控制器标识之后，需要向请求访问数据的源处理器返回数据响应，但是目标处理器并不记录具体是哪一个处理器需要访问该地址上的数据。目标处理器可以通过节点控制器标识确定对应的LP，并向该LP返回数据响应，LP接收到数据响应之后，可以根据之前记录的RP标识，即目标地址的地址位[A7，A6]，将该数据响应转发至该RP标识对应的RP。在一种可能的实现方式中，参见本实施例的上述描述，LP还可以先根据之前记录的信息确定RP所在的NC。例如，如图3所示，CPU2在接收到访问请求的同时，还可以接收到节点控制器标识。CPU2可以根据节点控制器标识向其指向的LP0发送数据响应，在数据响应中可以包括目标地址。LP0接收到数据响应之后，可以从记录的信息中获取RP标识即[A7，A6]＝10，通过该RP标识可以确定将数据响应发送其指向的RP2。

在上述步骤312中，RP记录了源处理器标识，RP接收到数据响应之后，可以按照记录的源处理器标识，将数据响应转发至源处理器标识对应的源处理器，这样源处理器接收到数据响应之后便可以访问该目标地址上的数据，完成了数据访问的过程。目标处理器中可以保存目录信息并记录有外部处理器占用了内存该目标地址上的数据，但并没有记录是外部哪个处理器占用的；LP中可以保存目录信息并记录是该LP所在的NC中的RP占用了内存该目标地址上的数据，进一步地，参见本发明上述实施例的相关描述，LP记录的RP所在的NC还可以与LP所在的NC不同；RP中可以保存第一目录信息并记录是源处理器占用了内存该目标地址上的数据。例如，如图3所示，在RP2的第一目录信息中记录访问该目标地址上的数据的源处理器为CPU5，RP2可以将数据响应发送至CPU5，这样CPU5便可以访问CPU2上该目标地址上的数据。

需要说明的是，本发明的处理器互联节点中，相同基本节点中的处理器之间，可以通过任一种方式进行互联，并通过处理器的通信模块进行通信，本发明对此不做限定。此外，本发明的处理器互联节点中，NC具体可以管理哪些处理器的事务，可以根据不同的地址空间进行划分，也可以根据需求发生适应性的改变，本发明同样对此不做限定。如图3所示，可以根据地址空间的划分，右侧NC管理CPU2、CPU3、CPU6、CPU7的事务，左侧NC管理CPU0、CPU1、CPU4、CPU5的事务；还可以根据需求进行交叉管理，如右侧NC管理CPU1、CPU2、CPU4、CPU7的事务，左侧NC管理CPU0、CPU3、CPU5、CPU6的事务。

本实施例的数据访问方法，在同一个处理器互联节点中，相同基本节点中的处理器可以直接互联并互相访问彼此的数据，不同基本节点中的处理器之间进行数据访问时，不需要跨越NC之间的链路，在保证服务器带宽的同时，降低了服务器延迟。

图4示出根据本发明另一实施例的数据访问方法的流程图。在一种可能的实现方式中，在所述目标处理器根据所述访问请求将所述数据响应发送至所述源处理器之后，可能有其它处理器需要访问该目标地址的数据，并向目标处理器发送新的访问请求。此时查找目标处理器中的目录信息可以发现该目标地址上的数据已经被外部处理器占用，此时目标处理器可以对外发起侦听。如图4所示，该数据访问方法主要可以包括：

步骤400、所述节点控制器接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址。

具体地，目标处理器接收到新的访问请求时，并且该新的访问请求指示需要使用该目标地址上的数据时，目标处理器可以根据其保存的目录信息确定该目标地址上的数据已经被外部处理器占用，但并不确定具体被哪一个外部处理器占用。此时，目标处理器可以向NC发起侦听，即发送侦听消息，同时还可以向NC发送其通过上述步骤120接收到的节点控制器标识，用于NC的控制芯片确定将该侦听消息发往哪一个LP。在侦听消息中还可以包括目标地址。

步骤410、所述节点控制器按照所述源处理器标识向所述源处理器发送所述侦听消息；

步骤420、所述节点控制器接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。

具体地，NC接收到上述侦听消息和节点控制器标识后，可以根据源处理器标识将该侦听消息发送至源处理器。在源处理器接收到侦听消息之后，可以向NC返回侦听响应，在源处理器向NC返回侦听响应的过程中，源处理器可以先通过目标地址确定可以转发该侦听响应的NC，NC在接收到侦听响应之后，还可以通过目标地址确定目标处理器，并将侦听响应发往目标处理器，完成侦听。

在一种可能的实现方式中，在该处理器互联节点中，处理器的每个HA事务对应一个LP，在步骤400之前，目标处理器可以根据HA事务与LP的对应关系向NC发送侦听消息。这样目标处理器可能会同时向多个NC发送侦听消息，不代理目标处理器的NC接收到侦听消息之后可以向目标处理器返回无效响应(Response Invalid，RSPI)。例如，如图3所示，HA0事务对应LP0，在CPU2发送侦听消息时，会同时发送至左右两侧的两个NC，在左侧NC接收到侦听消息后，由于其不代理CPU2的事务，所以可以直接向CPU2返回RSPI。

在一种可能的实现方式中，参见本发明上述实施例的数据访问方法的相关描述，源处理器的事务与目标处理器的事务可能分别由该处理器互联节点中的两个NC管理的，这两个NC之间没有互联，不能直接进行通讯。在这种情况下，目标处理器需要先将侦听消息发送至某一个中间处理器，该中间处理器与目标处理器归属于同一基本节点，可以不通过NC直接进行通讯，且该中间处理器的事务与源处理器的事务由同一个NC管理，中间处理器可以通过该NC与目标处理器进行通讯。通过中间处理器的转发，可以将目标处理器的侦听消息发送至源处理器。如图3所示，若CPU5为源处理器，CPU0为目标处理器，CPU0发起侦听时，CPU0需要将侦听消息发送至CPU2或CPU3，CPU2或CPU3将侦听消息通过右侧NC发送至CPU5。CPU2和CPU3的选择可以由该处理器互联节点的路由配置来确定。

在该数据访问方法中，在步骤410具体还可以包括：

步骤411、所述LP从所述目标处理器接收所述侦听消息；

步骤412、所述LP从第二目录信息中获取所述RP标识，并向所述RP标识指向的所述RP发送所述侦听消息，所述第二目录信息为所述LP中保存的目录信息。

具体地，在NC接收目标处理器发送的侦听消息的同时，还可以接收到目标处理器发送的节点控制器标识，控制芯片可以根据节点控制器标识向其指向的LP发送侦听消息。LP接收到侦听消息之后，可以根据LP保存的第二目录信息，确定向哪一个NC发送侦听消息，进一步地，LP可以根据RP标识确定向NC中哪一个RP发送侦听消息。例如，如图3所示，若目标地址中的地址位[A7，A6]＝00，则右侧NC的LP0可以确定需要将侦听消息发送至RP0，LP通过查找第二目录信息，确定RP与LP0属于同一个NC，则将侦听消息发送至右侧NC的RP0。

步骤413、所述RP向所述源处理器标识指向的所述源处理器发送所述侦听消息。

具体地，RP接收到侦听消息之后，可以记录节点控制器标识，用于后续向目标处理器正确地返回侦听响应。第一目录信息中记录了占用该地址上数据的源处理器，RP可以按照记录的源处理器标识并向该源处理器发送侦听消息。例如，如图3所示，RP0的第一目录信息中记录CPU5占用了该目标地址上的数据，通过查找第一目录信息，RP0可以确定CPU5并向CPU5发送侦听消息。

在一种可能的实现方式中，参见本发明上述实施例的数据访问方法的相关描述，接收侦听消息的NC并不处理源处理器的事务，在这种情况下，NC需要先将侦听消息发送至某一个中间处理器，该中间处理器的事务由该NC管理，并且该中间处理器与源处理器归属于同一基本节点，通过中间处理器的转发，可以将目标处理器的侦听消息发送至源处理器。中间处理器的选择可以由该处理器互联节点的路由配置来确定。

在一种可能的实现方式中，若源处理器和目标处理器不属于同一个处理器互联节点，参见本发明上述实施例的服务器，不同的处理器互联节点之间可以通过NC之间的链路进行连接。在这种情况下，目标处理器向源处理器发送的侦听消息需要跨越NC之间的链路，可能由不同NC的LP和RP实现侦听消息的发送与接收，即RP与LP并不属于同一个NC，RP属于源处理器所在处理器互联节点的NC，LP属于目标处理器所在处理器互联节点的NC。此时，LP除了记录RP标识之外，还可以记录RP所在的NC。在后续返回侦听响应时，LP可以先根据记录的信息确定RP所在的NC，然后再根据RP标识确定RP。

在该数据访问方法中，步骤420具体可以包括：

步骤421、所述控制芯片从所述源处理器接收所述侦听响应，并从所述侦听响应中获取所述RP标识，向所述RP标识指向的所述RP发送所述侦听响应；

步骤422、所述RP向所述节点控制器标识指向的所述LP发送所述侦听响应。

具体地，源处理器接收到侦听消息之后，可以通过NC向目标处理器返回侦听响应，在侦听响应中可以包括目标地址。控制芯片接收到侦听响应之后，可以在侦听响应中获取RP标识，向RP标识指向的RP发送该侦听响应。其中，RP标识为目标地址中的地址位[A7，A6]。例如，如图3所示，若目标地址中的地址位[A7，A6]＝10，则CPU5可以确定需要将侦听响应发送至RP0。

步骤423、所述LP根据所述目标地址向所述目标处理器发送所述侦听响应。

具体地，通过上述步骤413，在RP中记录了节点控制器标识，即LP标识。在RP接收到侦听响应之后，RP可以通过节点控制器标识确定LP，并将侦听响应发送至该LP。该LP接收到侦听响应之后，可以根据侦听响应中包括的目标地址确定发起本次侦听的目标处理器。在一种可能的实现方式中，参见本实施例的上述描述，LP还可以先根据之前记录的信息确定RP所在的NC。例如，如图3所示，若RP0中记录了向其发送侦听消息的 LP的节点控制器标识即LP0，则RP0可以将侦听响应发送至LP0。LP0可以根据目标地址中的地址位A39＝0确定将侦听响应发送至CPU2。

在一种可能的实现方式，侦听消息中还可以包括侦听类型，目标处理器完成本次侦听之后，可以获取到使用该目标地址上的数据的权限。同时，目标处理器、LP、RP中保存的目录信息可以根据侦听消息中的侦听类型做相应的修改。例如，若侦听为独占类型的侦听，目标处理器、LP、RP中保存的目录信息中有关该目标地址的信息可以被清除，源处理器不能再继续占用该目标地址上的数据；若侦听为共享类型的侦听，目标处理器、LP、RP中保存的目录信息中有关该目标地址的信息改为共享状态，源处理器和向目标处理器发送上述新的访问请求的处理器可以同时共享该目标地址上的数据。

需要说明的是，本发明的处理器互联节点中，相同基本节点中的处理器之间，可以通过任一种方式进行互联，并通过处理器的通信模块进行通信，本发明对此不做限定。此外，本发明的处理器互联节点中，NC具体可以管理哪些处理器的事务，可以根据不同的地址空间进行划分，也可以根据需求发生适应性的改变，本发明同样对此不做限定。

图5示出根据本发明另一个实施例的一种服务器的结构框图。所述服务器500可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对计算节点的具体实现做限定。

所述服务器500包括处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530、总线540和节点控制器550。其中，处理器510、通信接口520、节点控制器550以及存储器530通过总线540完成相互间的通信。

通信接口520用于与网络设备通信，其中网络设备包括例如虚拟机管理中心、共享存储等。

节点控制器550用于执行程序。处理器510可能是一个中央处理器CPU，或者是专用集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。

存储器530用于存放文件。存储器530可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器530也可以是存储器阵列。存储器530还可能被分块，并且所述块可按一定的规则组合成虚拟卷。

在一种可能的实施方式中，上述程序可为包括计算机操作指令的程序代码。该程序具体可用于：

接收所述源处理器的访问请求及源处理器标识，所述访问请求中携带目标地址，所述目标地址为所述目标处理器的地址；

按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器；

从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。

在一种可能的实现方式中，所述节点控制器包括控制芯片、本地代理LP和远端代理RP，所述节点控制器按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器，包括：

在一种可能的实现方式中，在所述目标处理器接收到新的访问请求，指示需要访问所述目标地址上的数据的情况下，该程序具体还可用于：

接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址；

按照所述源处理器标识向所述源处理器发送所述侦听消息；

接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。

在一种可能的实现方式中，按照所述源处理器标识向所述源处理器发送所述侦听消息，包括：

所述LP从所述目标处理器接收所述侦听消息；

本领域普通技术人员可以意识到，本文所描述的实施例中的各示例性单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现，取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时，则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有技术做出贡献的部分)是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的非易失性存储介质中，包括若干指令用以使得计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

一种服务器，其特征在于，包括：

处理器互联节点；

所述处理器互联节点包括至少一个节点控制器和至少两个基本节点，每个所述基本节点包括至少四个处理器；

所述节点控制器，与所述基本节点相连接，用于按照所述处理器的地址空间管理所述处理器的事务；

所述节点控制器，还用于接收源处理器的访问请求及源处理器标识，按照所述访问请求中携带的目标地址，将所述访问请求以及节点控制器标识发往目标处理器，其中，所述源处理器和所述目标处理器位于不同的基本节点，所述目标地址为所述目标处理器的地址。
根据权利要求1所述的服务器，其特征在于，所述节点控制器，还用于从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。
根据权利要求2所述的服务器，其特征在于，所述节点控制器包括控制芯片、本地代理LP和远端代理RP；

所述控制芯片，用于从所述源处理器接收所述源处理器标识和所述访问请求；从所述访问请求中获取RP标识，向所述RP标识指向的RP发送所述访问请求和所述源处理器标识；

所述RP，用于从所述访问请求中获取所述目标地址，对所述目标地址进行译码得到LP标识，向所述LP标识指向的LP发送所述访问请求；从所述LP接收所述数据响应，将所述数据响应发送至所述源处理器标识对应的所述源处理器；

所述LP，用于记录所述RP标识，从所述访问请求中获取所述目标地址，向所述目标地址所指向的所述目标处理器发送所述访问请求和节点控制器标识，所述节点控制器标识为所述LP标识；从所述目标处理器接收所述数据响应；向所述RP标识指向的所述RP发送所述数据响应。
根据权利要求1-3中任一项所述的服务器，其特征在于，所述节点控制器具体还用于：在所述目标处理器接收到新的访问请求，指示访问所述目标地址上的数据的情况下，接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址；按照所述源处理器标识向所述源处理器发送所述侦听消息；接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。
根据权利要求4所述的服务器，其特征在于，LP还用于从所述目标处理器接收所述侦听消息；从第二目录信息中获取所述RP标识，并向所述RP标识指向的所述RP发送所述侦听消息，所述第二目录信息为所述LP中保存的目录信息；根据所述目标地址向所述目标处理器发送所述侦听响应；

所述RP还用于向所述源处理器标识指向的所述源处理器发送所述侦听消息；向所述节点控制器标识指向的所述LP发送所述侦听响应。
根据权利要求1-5中任一项所述的服务器，其特征在于，所述处理器互联节点包括第一基本节点、第二基本节点和两个节点控制器，所述第一基本节点和所述第二基本节点分别包括至少四个处理器。
一种数据访问方法，其特征在于，应用于权利要求1-6中任一项所述的服务器，源处理器需要访问目标处理器时，所述数据访问方法包括：

节点控制器接收所述源处理器的访问请求及源处理器标识，所述访问请求中携带目标地址，所述目标地址为所述目标处理器的地址；

所述节点控制器按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器；

所述节点控制器从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器。
根据权利要求7所述的数据访问方法，其特征在于，所述节点控制器包括控制芯片、本地代理LP和远端代理RP，所述节点控制器按照所述目标地址，将所述访问请求以及节点控制器标识发往所述目标处理器，包括：

所述控制芯片从所述源处理器接收所述源处理器标识和所述访问请求，并从所述访问请求中获取RP标识，向所述RP标识指向的RP发送所述访问请求和所述源处理器标识；

所述RP从所述访问请求中获取所述目标地址，对所述目标地址进行译码得到LP标识，向所述LP标识指向的LP发送所述访问请求；

所述LP记录所述RP标识，从所述访问请求中获取所述目标地址，向所述目标地址所指向的所述目标处理器发送所述访问请求和节点控制器标识，所述节点控制器标识为所述LP标识；

所述节点控制器从所述目标处理器接收数据响应，并按照所述源处理器标识将所述数据响应发往所述源处理器，包括：

所述LP从所述目标处理器接收所述数据响应，并向所述RP标识指向的所述RP发送所述数据响应；

所述RP将所述数据响应发送至所述源处理器标识对应的所述源处理器。
根据权利要求7或8所述的数据访问方法，其特征在于，在所述目标处理器接收到新的访问请求，指示需要访问所述目标地址上的数据的情况下，所述数据访问方法还包括：

所述节点控制器接收所述目标处理器发送的侦听消息和所述节点控制器标识，所述侦听消息中包括所述目标地址；

所述节点控制器按照所述源处理器标识向所述源处理器发送所述侦听消息；

所述节点控制器接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器。
根据权利要求9所述的数据访问方法，其特征在于，所述节点控制器按照所述源处理器标识向所述源处理器发送所述侦听消息，包括：

所述LP从所述目标处理器接收所述侦听消息；

所述LP从第二目录信息中获取所述RP标识，并向所述RP标识指向的所述RP发送所述侦听消息，所述第二目录信息为所述LP中保存的目录信息；

所述RP向所述源处理器标识指向的所述源处理器发送所述侦听消息；

所述节点控制器接收所述源处理器返回的侦听响应，并按照所述目标地址将所述侦听响应发往所述目标处理器，包括：

所述控制芯片从所述源处理器接收所述侦听响应，并从所述侦听响应中获取所述RP标识，向所述RP标识指向的所述RP发送所述侦听响应；

所述RP向所述节点控制器标识指向的所述LP发送所述侦听响应；

所述LP根据所述目标地址向所述目标处理器发送所述侦听响应。