WO2017107411A1

WO2017107411A1 - 分形树中向量数据回传处理单元的装置、方法、控制装置及智能芯片

Info

Publication number: WO2017107411A1
Application number: PCT/CN2016/086094
Authority: WO
Inventors: 罗韬; 刘少礼; 张士锦; 陈云霁
Original assignee: 中国科学院计算技术研究所
Priority date: 2015-12-24
Filing date: 2016-06-17
Publication date: 2017-06-29
Also published as: US10866924B2; US20200272595A1; CN105630733A; CN105630733B

Abstract

本发明提出分形树中向量数据回传处理单元的装置、方法、控制装置及智能芯片，该装置包括一中心节点，接收叶子节点回传的向量数据；多个叶子节点，对向量数据进行计算与移位；转发器模块，包括局部缓存结构与数据处理部件；将所述多个叶子节点分为N组，每组中叶子节点的个数相同，所述中心节点通过所述转发器模块单独与每一组叶子节点进行通信连接，每组叶子节点构成的通信结构具有自相似性，所述多个叶子节点与所述中心节点通过多层所述转发器模块以完全M叉树方式进行通信连接，每个叶子节点包括设置位，如果所述设置位要求叶子节点中的向量数据进行移位，则叶子节点将预设带宽位的向量数据移至相应位置，否则叶子节点将向量数据回传给中心节点。

Description

分形树中向量数据回传处理单元的装置、方法、控制装置及智能芯片

技术领域

本发明涉及智能设备、无人驾驶、片上网络数据传输等技术领域，尤其涉及分形树中向量数据回传处理单元的装置、方法、控制装置及智能芯片。

背景技术

分形树结构，是一种由一个根节点作为中心节点，多组具有自相似性的叶子节点组成的多层次树状结构。分形树在超大规模集成电路设计中得到了广泛应用，因为在应用时采用了完全M叉树的布局，这种布局的使用面积与树节点的数目成正比，能节省片上空间；而且在分形上传播的延迟是相同的，所以经常被用作VLSI多处理器中的互连网络。

在线性代数中的向量是指n个实数或者复数组成的有序数组，称为n维向量，a＝(a₁，a₂，…a_i，a_n)称为n维向量，其中a_i称为向量α的第i个分量。

在将向量的多个零散在各个分形叶子节点的分量回传给分形根节点的过程中，分量数据在分形的中间节点上互相竞争传输，维护分量数据的传输需要一个协议，用于保证分量数据的可靠性，分量数据传回的时间在各个叶节点之间无法互相通知，当分量数据传输到根节点时，分量数据是乱序的，根节点需要和叶节点建立一套复杂机制用于维护各个分量之间的顺序，最后将分量数据按序拼成向量数据。

现有技术对片上分形网络上对向量数据传输的网络的通讯没有提供有效方便的支持，因此，提供一种同时适合分形网络上对向量数据传输的网络的通讯方式的无冲突的、可靠的、有序的方式就尤为迫切和需要。

发明公开

针对现有技术的不足，本发明提出分形树中向量数据回传处理单元的装置、方法、控制装置及智能芯片。

本发明提出一种分形树中向量数据回传处理单元的装置，包括：

一中心节点，其为所述片上网络的通信数据中心，用于接收多个叶子节点回传的向量数据；

多个叶子节点，用于对向量数据进行计算与移位；

转发器模块，包括局部缓存结构与数据处理部件，用于与上层、下层节点的数据通信与对向量数据的处理；

将所述多个叶子节点分为N组，每组中叶子节点的个数相同，所述中心节点通过所述转发器模块单独与每一组叶子节点进行通信连接，每组叶子节点构成的通信结构具有自相似性，所述多个叶子节点与所述中心节点通过多层所述转发器模块以完全M叉树方式进行通信连接，每个叶子节点包括设置位，如果所述设置位要求叶子节点中的向量数据进行移位，则叶子节点将预设带宽位的向量数据移至相应位置，否则叶子节点将向量数据回传给中心节点。

所述的分形树中向量数据回传处理单元的装置，包括：每个叶子节点均有id标识，且所述id标识从完全M叉树的拓扑一侧按序依次增加序号；所述数据发布装置共享一个时钟信号。

所述的分形树中向量数据回传处理单元的装置，每个所述转发器模块包括预设带宽的加法器，所述加法器的个数为所有叶子节点的总数量，且所述加法器具有溢出检查功能，其中，如果向量数据进行过移位，则所述转发器模块将接收到的向量数据进行位拼接，将拼接结果传输给上一层节点，否则，所述转发器模块将接收到的向量数据进行检查溢出并进行加法操作后，传输给上一层节点。

本发明还提出一种利用所述装置的方法，包括：

通过所述叶子节点对向量数据进行计算与移位，并回传到所述中心节点，其中，每个叶子节点包括设置位，如果所述设置位要求叶子节点中的向量数据进行移位，则叶子节点将预设带宽位的向量数据移至相应位置，否则叶子节点将向量数据回传给中心节点。

所述的方法，每个叶子节点均有id标识，且所述id标识从完全M叉树的拓扑一侧按序依次增加序号；所述数据发布装置共享一个时钟信号

所述的方法，若叶子节点传输的数据为有效的预设带宽的向量数据，则设置位要求叶子节点进行移位，叶子节点根据id标识与预设带宽的位数进行计算，将叶子节点中的向量数据移至全带宽上的相应位置。

所述的方法，如果向量数据进行过移位，则所述转发器模块将接收到的向量数据进行位拼接，将拼接结果传输给上一层节点，否则，所述转发器模块将接收到的向量数据进行检查溢出并进行加法操作后，传输给上一层节点。

所述的方法，叶子节点与中心节点之间遵守握手协议。

本发明还提出一种包含所述装置的控制装置。

本发明还提出一种包含所述控制装置的智能芯片。

附图简要说明

图1为本发明的一个实施例中使用H-tree连接的16+1个核的片上多核结构示意图；

图2为本发明的一个实施例中hub_two_add_to_one结构示意图；

图3为本发明的一个实施例中hub_two_add_to_one与数据发送方握手的行为示意图；

图4为本发明的H-tree结构的展开成完全二叉树拓扑的结构示意图；

图5为本发明的一个实施例中分量数据在叶子tile中移位成为向量数据的行为示意图；

图6为本发明的一个实施例中向量数据在hub中进行位拼接的行为示意图；

图7为本发明的一个实施例中所有leaf tile的分量数据在位拼接数据通路终点时向量结果的示意图。

图8为本发明的一个实施例中向量数据在hub中进行叠加的行为示意图。

图9为本发明的另一个实施例中使用X-tree连接的64+1个核的片上多核结构示意图；

图10为本发明的另一实施例中hub_four_add_to_one结构示意图；

图11为本发明的另一实施例中hub_four_add_to_one与数据发送方握手的行为示意图；

图12为本发明的另一实施例中分量数据在叶子tile中移位成为向量数据的行为示意图；

图13为本发明的另一实施例中向量数据在hub中进行位拼接的行为示意图；

图14为本发明的另一实施例中所有leaf tile的分量数据在位拼接数据通路终点时向量结果的示意图。

图15为本发明的另一个实施例中向量数据在hub中进行叠加的行为示意图。

实现本发明的最佳方式

多个叶子节点，用于对向量数据进行计算与移位；

转发器模块，包括局部缓存结构与数据处理部件，用于与上层、下层节点的数据通信与对向量数据的处理，包括与叶子节点直接相连的叶子转发器模块、与中心节点直接相连的中心转发器模块、与叶子节点与中心节点间接相连的中间转发器模块；

每个叶子节点均有id标识，且所述id标识从完全M叉树的拓扑一侧按序依次增加序号；所述数据发布装置共享一个时钟信号。

每个所述转发器模块包括预设带宽的加法器，所述加法器的个数为所有叶子节点的总数量，且所述加法器具有溢出检查功能，其中，如果向量数据进行过移位，则所述转发器模块将接收到的向量数据进行位拼接，将拼接结果传输给上一层节点，否则，所述转发器模块将接收到的向量数据进行检查溢出并进行加法操作后，传输给上一层节点。

本发明还提出一种利用所述装置的方法，包括：

若叶子节点传输的数据为有效的预设带宽的向量数据，则设置位要求叶子节点进行移位，叶子节点根据id标识与预设带宽的位数进行计算，将叶子节点中的向量数据移至全带宽上的相应位置。

如果向量数据进行过移位，则所述转发器模块将接收到的向量数据进行位拼接，将拼接结果传输给上一层节点，否则，所述转发器模块将接收到的向量数据进行检查溢出并进行加法操作后，传输给上一层节点。

叶子节点与中心节点之间遵守握手协议，即下一层两个节点的数据发送方都准备好发送数据后，发送数据有效信号，并将数据置于总线；上一层节点的数据接收方准备好接收数据后，发送数据准备接收信号；只有在上述的数据有效信号和数据准备接收信号均被检测到后，总线上的数据才会被数据接收方接收。

中间转发器模块将向量数据在数据缓存中位拼接和传输，包括：首先通过加法器，对所有的接收到的下一层节点传递来的向量数据进行位拼接，然后才将向量数据结果输入给上一层节点。

当执行所述多个叶子节点向所述中心节点之间的加法树进行向量数据回传时，如果叶子节点传输的是有效数据为全带宽的向量数据，则所述多个叶子节点发出的向量数据在hub上的传输方式如下：首先输入直接连接至所述叶子节点的叶子转发器模块的数据缓存中叠加和缓存，再依次在中间转发器模块的数据缓存中叠加和传输，最后输入直接连接至中心节点的中心转发器模块的数据缓存中进行叠加，最终将叠加结果通过输出端口输出给所述中心节点。

中间转发器模块将向量数据在数据缓存中叠加和传输，包括：首先通过如加法器，对所有的接收到的下一层节点传递来的向量数据进行叠加，然后才将向量数据结果输入给上一层节点。

本发明还提出一种包含所述数据发布装置的控制装置。

本发明还提出一种包含所述控制装置的智能芯片。

以下为本发明两个实施例，结合附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

一个实施例是H树网络结构中向量数据的回传处理单元的具体设置。

附图1表示了一个由H树网络结构连接的16+1个处理单元的片上处理并回传向量数据元素的通讯设备示意图。H树的根节点为central tile，其为向量数据传输的终点；H树的叶子节点为leaf tile，其为向量数据的起点；其余的中间节点为hub，用于处理并传输向量数据。此设备实现了用于H树的将向量结果回传的处理数据元素的通讯方法。

附图2表示了H树网络结构中hub结构示意图，hub由hub_two_add_to_one模块构成，其中含有一个加法器，hub_two_add_to_one将两组全带宽的输入向量数据20和21，处理成一组全带宽的向量数据22输出，用于从leaf tile到central tile的传输。

如图1，当标记为10的central tile收集到来自于各叶子tile传来的有效带宽为预设带宽的向量数据，向量数据在hub上的传输方式如下：首先每组叶子tile：标记为150的leaf tile0与标记为151的leaf tile1，152和153，154和155，156和157，158和159，15a和15b，15c和15d，15e和15f，分别与各自的上一层的与叶子直接相连的叶子hub：标记为140的hub3_0，141，142，143，144，145，146，147进行握手协议，握手成功后，把其向量数据输入叶子hub的数据缓存中，并进行位拼接；当叶子hub：标记为140的hub3_0，141，142，143，144，145，146，147分别与其上一层的中间hub：标记为130的hub2_0，131，132，133握手成功后，将其向量数据输入中间hub的数据缓存中，并进行位拼接；同样的，在中间hub：标记为130的hub2_0，131，132，133与其上一层的hub：标记为120的hub1_0，121握手成功以后，将其向量数据输入120与121的数据缓存中，并进行位拼接；最后通过握手协议后，120与121将向量数据输入直接连接至中心tile的中心hub0_0的数据缓存中进行位拼接，最终的位拼接结果通过输出端口输出给所述中心tile。通过这种方法，可以实现在此网络结构上的位拼接向量数据回传。

如图3所示，当标记为330的hub_two_add_to_one模块已经将数据准备接收信号发至总线上，且标记为310的数据发送方0与标记为320的数据发送方1已经将数据及数据有效信号发至总线时，此时握手协议才算成功：此拍310和320，认为数据接收方330已经接收数据，而下一拍330将此拍总线上的数据存入自己的缓冲区。此数据传输协议保证了在点对点的数据传输中的数据可靠性，从而保证了数据在片上网络传输的可靠性。

其中，在上述执行位拼接向量数据回传过程中，叶子tile传输的有效数据位是预设带宽的向量数据，则要求叶子tile在向量数据发送前，将设置位选择成将其拥有的分量数据进行移位。当选择对向量数据进行移位时，叶子tile将根据独有的id序号与预设带宽的位数计算所移位数，将其所拥有的预设带宽位的分量数据移至全带宽的向量数据上的相应位置。如图5，是图1中H树上实现的一特定实例，假设全带宽为251位，可由16个叶子tile所拥有的16位的分量数据拼接而成。图5所示描述了对leaf tile1的分量数据D0位移的过程。首先，在分量数据前补零，使得向量数据D1到达全带宽的位数，即256位。其次按照其id序号，即1号；与其预设带宽位，即其分量数据的位数，16位，通过算式(id*预设带宽)计算向量数据应当左移的位数。在此例中，此向量数据恰好需要左移16位。可见移位使得原分量D0位于全带宽数据data[31：161，即D2的位置，形成了最后将要传输的向量数据D3。

其中，如图4，是图1所示的H树的完全二叉树展开。每个叶子tile的id标识，是对应其在将H树展开为完全二叉树的拓扑中从一侧按序依次增加的队列序号，即leaf tile0所对应的即0序号。可见，每个叶子tile的id标识都是唯一的，且所有叶子tile的id为自然数连续的，在此例中，即自然数0到15。由此可推，每个叶子tile在全带宽的向量数据上所对应的预设带宽的分量数据都是唯一且不冲突的，且在全带宽的向量数据上所有分量数据连续。如图7，此向量数据表示，为上述实例中，将所有由叶子tile的有效数据为预设带宽的分量位拼接而成的结果。在此实例中，分量D0在向量数据中表示的是叶子tile15所拥有的分量，位于全带宽数据data[255：240]；分量D1在向量数据中表示的是叶子tile14所拥有的分量，位于全带宽数据data[239：224]，每两个不同叶子tile所在全带宽向量数据上的位置均不冲突，且连续，且按序排列。可知，此移位方式为在此H树结构上的无冲突、有序的向量结果回传提供了技术支持。

其中，在上述执行位拼接向量数据回传过程中，在上述一些实例中，hub将向量数据在数据缓存中进行位拼接和传输。如图6，以图1中hub3_0为例。首先，hub将向量数据存储在局部缓存中。Hub中加法器的个数为叶子节点的数目，即在此例中，共有16个叶子节点，故共有16个加法器，每个加法器都是可以进行预设带宽的，本例中设置为16位，并且每个加法器具有溢出检查功能。对接收到的下一层一组叶子节点，leaf tile0和leaf tile1传递来的两个向量数据D3和D1进行叠加位拼接。可以看见，leaf tile0的分量D4在位拼接后位于全带宽向量数据D2的data[31：16]，即D0的位置；而leaf tile1的分量D5在位拼接后位于全带宽向量数据D2的data[15：0]，即D1的位置。由此，他们的分量数据在此向量结果数据上均是有序、唯一且不冲突的。如图7所示的向量数据为在此方法在如图1的结构上执行下的hub0_0最后处理得到的向量数据结果。可见，此方法为无冲突的、有序的向量结果回传提供了技术支持。

如图1，当标记为10的central tile接收到来自与各叶子tile传来的有效带宽为全带宽的向量数据，向量数据在hub上的传输方式如下：首先每组叶子tile：标记为150的leaf tile0与标记为151的leaf tile1，152和153，154和155，151和157，158和159，15a和15b，15c和15d，15e和15f，分别于各自的上一层的与叶子直接相连的叶子hub：标记为140的hub3_0，141，142，143，144，145，141，147进行握手协议，把其向量数据输入叶子hub的数据缓存中，并进行叠加；当叶子hub：标记为140的hub3_0，141，142，143，144，145，141，147分别与其上一层的中间hub：标记为130的hub2_0，131，132，133握手成功后，将其向量数据输入中间hub的数据缓存中，并进行叠加；同样的，在中间hub：标记为130的hub2_0，131，132，133与其上一层的hub：标记为120的hub1_0，121握手成功以后，将其向量数据输入120与121的数据缓存中，并进行叠加；最后通过握手120与121将向量数据输入直接连接至中心tile的中心hub0_0的数据缓存中进行叠加，最终的叠加结果通过输出端口输出给所述中心tile。通过这种方法，可以看见，叶子tile中的向量数据在向中心tile回传的路径上完成了加法树的操作，实现在此网络结构上的进行加法树操作的向量数据回传。

其中，在上述执行加法树的向量数据回传过程中，在一些实例中，hub将向量数据在数据缓存中进行叠加并传输。如图8，以图1中hub3_0为例。首先，hub将向量数据存储在局部缓存中。Hub中加法器的个数为叶子节点的数目，即在此例中，共有16个叶子节点，故共有16个加法器，每个加法器都是可以进行预设带宽的，本例中设置为16位，并且每个加法器具有溢出检查功能。。加法器对接收到的下一层一组叶子节点，leaf tile0和leaf tile1，传递来的两个向量数据D3和D5中的16个分量分开进行叠加。可以看见，D3的低位分量D4位于全带宽的data[15：0]，D5的低位分量D6位于全带宽的data[15：0]，在经过加法器叠加后的结果中，两者的和在溢出检查和判断后写入结果D2的D0分量位置，即data[15：0]。如果D4与D6叠加的结果溢出，那么加法器会根据溢出结果判断并估计赋值。通过这种方法，上述装置上的加法树向量数据回传得以实现。

另一个实施例是X树网络结构中向量数据的回传处理单元的具体设置。

附图9表示了一个由X树网络结构连接的64+1个处理单元的片上处理并回传向量数据元素的通讯设备示意图。X树的根节点为central tile，其为向量数据传输的终点；X树的叶子节点为leaf tile，其为向量数据的起点；其余的中间节点为hub，用于处理并传输向量数据。每个叶子tile具有唯一的id标识，是对应其在将X树展开为完全四叉树的拓扑中从一侧按序依次增加的队列序号，即leaf tile0所对应的即0序号。因而能够保证每个叶子tile的id标识都是唯一的，且所有叶子tile的id为自然数连续的，在此例中，即自然数0到63。每个叶子tile在全带宽的向量数据上所对应的预设带宽的分量数据都是唯一且不冲突的，且在全带宽的向量数据上所有分量数据连续。此设备实现了用于X树的将向量结果回传的处理数据元素的通讯方法。

附图10表示了X树网络结构中hub的结构示意图，hub由hub_four_add_to_one模块构成，其中含有一个加法器，hub_four_add_to_one将四组全带宽的输入向量数据a1、a2、a3和a4，处理成一组全带宽的向量数据a5输出，用于从leaf tile到central tile的传输。

如图9，当标记为90的central tile收集到来自于各叶子tile传来的有效带宽为预设带宽的向量数据，向量数据在hub上的传输方式如下：首先每组叶子tile：标记为940的leaf tile0、标记为941的leaf tile1、标记为942的leaf tile2和标记为943的leaf tile3，944、945、946和947，……，9a0、9a1、9a2和9a3，分别与各自的上一层的与叶子直接相连的叶子hub：标记为930的hub2_0，931，932，933，934，935，936，937，938，939，93a，93b，93c，93d，93e，93f进行握手协议，握手成功后，把其向量数据输入叶子hub的数据缓存中，并进行位拼接；当叶子hub：标记为930的hub2_0，931，932，933，934，935，936，937，938，939，93a，93b，93c，93d，93e，93f分别与其上一层的中间hub：标记为920的hub1_0，921，922，923握手成功后，将其向量数据输入中间hub的数据缓存中，并进行位拼接；最后通过握手协议后，标记为920的hub1_0，921，922，923将向量数据输入直接连接至标记为910的中心tile 的中心hub0_0的数据缓存中进行位拼接，最终的位拼接结果通过输出端口输出给所述标记为90的中心tile。通过这种方法，可以实现在此网络结构上的位拼接向量数据回传。

如图11所示，当标记为b5的hub_four_add_to_one模块已经将数据准备接收信号发至总线上，且标记为b1的数据发送方0、标记为b2的数据发送方1、标记为b3的数据发送方2和标记为b4的数据发送方3已经将数据及数据有效信号发至总线时，此时握手协议才算成功：此拍b1、b2、b3和b4认为数据接收方b5已经接收数据，而下一拍b5将此拍总线上的数据存入自己的缓冲区。此数据传输协议保证了在点对点的数据传输中的数据可靠性，从而保证了数据在片上网络传输的可靠性。

其中，在上述执行位拼接向量数据回传过程中，叶子tile传输的有效数据位是预设带宽的向量数据，则要求叶子tile在向量数据发送前，将设置位选择成将其拥有的分量数据进行移位。当选择对向量数据进行移位时，叶子tile将根据独有的id序号与预设带宽的位数计算所移位数，将其所拥有的预设带宽位的分量数据移至全带宽的向量数据上的相应位置。如图12，是图9中X树上实现的一特定实例，假设全带宽为1024位，可由64个叶子tile所拥有的16位的分量数据拼接而成。图12所示描述了对leaf tile1的分量数据c1位移的过程。首先，在分量数据前补零，使得向量数据c2到达全带宽的位数，即1024位。其次按照其id序号，即1号；与其预设带宽位，即其分量数据的位数16位，通过算式(id*预设带宽)计算向量数据应当左移的位数。在此例中，此向量数据恰好需要左移16位。可见移位使得原分量c1位于全带宽数据data[31：16]，即c3的位置，形成了最后将要传输的向量数据c4。

如图14，此向量数据表示，为上述实例中，将所有由叶子tile的有效数据为预设带宽的分量位拼接而成的结果。在此实例中，分量f3在向量数据中表示的是leaf tile 63所拥有的分量，位于全带宽数据data[1024：1008]；分量f2在向量数据中表示的是leaf tile 62所拥有的分量，位于全带宽数据data[1007：992]，以此类推，图中所示的分量f1在向量数据中表示的是leaf tile1所拥有的分量，位于全带宽数据data[31：16]；分量f0在向量数据中表示的是leaf tile 0所拥有的分量，位于全带宽数据data[15：0]。每两个不同leaf tile所在全带宽向量数据上的位置均不冲突，且连续，且按序排列。可知，此移位方式为在此X树结构上的无冲突、有序的向量结果回传提供了技术支持。

其中，在上述执行位拼接向量数据回传过程中，在上述一些实例中，hub将向量数据在数据缓存中进行位拼接和传输。如图13，以图9中hub2_0为例。首先，hub将向量数据存储在局部缓存中。Hub中加法器的个数为叶子节点的数目，即在此例中，共有64个叶子节点，故共有64个加法器，每个加法器都是可以进行预设带宽的，本例中设置为16位，并且每个加法器具有溢出检查功能。对接收到的下一层一组叶子节点，leaf tile0、leaf tile1、leaf tile2和leaf tile3传递来的四个向量数据e7、e9、e11和e13进行叠加位拼接。可以看见，leaf tile0的分量e6在位拼接后位于全带宽向量数据e5的data[15：0]，即e1的位置；leaf tile1的分量e8在位拼接后位于全带宽向量数据e5的data[31：16]，即e2的位置；leaf tile2的分量e10在位拼接后位于全带宽向量数据e5的data[47：32]，即e3的位置；leaf tile3的分量e8在位拼接后位于全带宽向量数据e5的data[63：48]，即e4的位置。由此，他们的分量数据在此向量结果数据上均是有序、唯一且不冲突的。如图14所示的向量数据为在此方法在如图9的结构上执行下的hub0_0最后处理得到的向量数据结果。可见，此方法为无冲突的、有序的向量结果回传提供了技术支持。

如图9，当标记为90的central tile接收到来自与各leaf tile传来的有效带宽为全带宽的向量数据，向量数据在hub上的传输方式如下：首先每组叶子tile：标记为940的leaf tile0、标记为941的leaf tile1、标记为942的leaf tile2和标记为943的leaf tile3，944、945、946和947，……，9a0、9a1、9a2和9a3，分别于各自的上一层的与叶子直接相连的叶子hub：标记为930的hub2_0，931，932，933，934，935，936，937，938，939，93a，93b，93c，93d，93e，93f进行握手协议，把其向量数据输入叶子hub的数据缓存中，并进行叠加；当叶子hub：标记为930的hub2_0，931，932，933，934，935，936，937，938，939，93a，93b，93c，93d，93e，93f分别与其上一层的中间hub：标记为920的hub1_0，921，922，923握手成功后，将其向量数据输入中间hub的数据缓存中，并进行叠加；最后通过握手标记为920的hub1_0，921，922，923将向量数据输入直接连接至标记为910的中心tile的中心hub0_0的数据缓存中进行叠加，最终的叠加结果通过输出端口输出给所述标记为90的中心tile。通过这种方法，可以看见，叶子tile中的向量数据在向中心tile回传的路径上完成了加法树的操作，实现在此网络结构上的进行加法树操作的向量数据回传。

其中，在上述执行加法树的向量数据回传过程中，在一些实例中，hub将向量数据在数据缓存中进行叠加并传输。如图15，以图9中hub2_0为例。首先，hub将向量数据存储在局部缓存中。Hub中加法器的个数为叶子节点的数目，即在此例中，共有64个叶子节点，故共有64个加法器，每个加法器都是可以进行预设带宽的，本例中设置为16位，并且每个加法器具有溢出检查功能。加法器对接收到的下一层一组叶子节点，leaf tile0、leaf tile1、leaf tile2和leaf tile3传递来的四个向量数据g5、g7、g9和g11中的16个分量分开进行叠加。可以看见，g5的低位分量g6位于全带宽的data[15：0]，g7的低位分量g8位于全带宽的data[15：0]，g9的低位分量g10位于全带宽的data[15：0]，g11的低位分量g12位于全带宽的data[15：0]，在经过加法器叠加后的结果中，四者的和在溢出检查和判断后写入结果g4的g13分量位置，即data[15：0]。如果g6、g8、g10与g12叠加的结果溢出，那么加法器会根据溢出结果判断并估计赋值。通过这种方法，上述装置上的加法树向量数据回传得以实现。

这里说明的装置和处理规模是用来简化本发明的说明的。对本发明的用于分形树(以H树和X树为例)的将向量结果回传的处理数据元素的通讯装置和方法的应用、修改和变化对本领域的技术人员来说是显而易见的。

如上所述，根据本发明，由于提供用于分形树的将向量结果回传的处理数据元素的通讯装置和方法，其在，为片上网络实现对向量数据结果位拼接、叠加等操作，无冲突地、可靠地、有序地完成向量结果的回传，从而使通信更为便捷和有效，效果更好。

工业应用性

本发明为片上网络实现了对向量数据结果进行位拼接、叠加等操作，使得向量结果能够无冲突地、可靠地、有序地进行回传，从而获得更好的通讯效果。

Claims

一种分形树中向量数据回传处理单元的装置，其特征在于，包括：

一中心节点，其为片上网络的通信数据中心，用于接收多个叶子节点回传的向量数据；

多个叶子节点，用于对向量数据进行计算与移位；

转发器模块，包括局部缓存结构与数据处理部件，用于与上层、下层节点的数据通信与对向量数据的处理；

将所述多个叶子节点分为N组，每组中叶子节点的个数相同，所述中心节点通过所述转发器模块单独与每一组叶子节点进行通信连接，每组叶子节点构成的通信结构具有自相似性，所述多个叶子节点与所述中心节点通过多层所述转发器模块以完全M叉树方式进行通信连接，每个叶子节点包括设置位，如果所述设置位要求叶子节点中的向量数据进行移位，则叶子节点将预设带宽位的向量数据移至相应位置，否则叶子节点将向量数据回传给中心节点。
如权利要求1所述的分形树中向量数据回传处理单元的装置，其特征在于，包括：每个叶子节点均有id标识，且所述id标识从完全M叉树的拓扑一侧按序依次增加序号；所述数据发布装置共享一个时钟信号。
如权利要求1所述的分形树中向量数据回传处理单元的装置，其特征在于，每个所述转发器模块包括预设带宽的加法器，所述加法器的个数为所有叶子节点的总数量，且所述加法器具有溢出检查功能，其中，如果向量数据进行过移位，则所述转发器模块将接收到的向量数据进行位拼接，将拼接结果传输给上一层节点，否则，所述转发器模块将接收到的向量数据进行检查溢出并进行加法操作后，传输给上一层节点。
一种利用如权利要求1-3任意一项装置的方法，其特征在于，包括：

通过所述叶子节点对向量数据进行计算与移位，并回传到所述中心节点，其中，每个叶子节点包括设置位，如果所述设置位要求叶子节点中的向量数据进行移位，则叶子节点将预设带宽位的向量数据移至相应位置，否则叶子节点将向量数据回传给中心节点。
如权利要求4所述的方法，其特征在于，每个叶子节点均有id标识，且所述id标识从完全M叉树的拓扑一侧按序依次增加序号；所述数据发布装置共享一个时钟信号。
如权利要求5所述的方法，其特征在于，若叶子节点传输的数据为有效的预设带宽的向量数据，则设置位要求叶子节点进行移位，叶子节点根据id标识与预设带宽的位数进行计算，将叶子节点中的向量数据移至全带宽上的相应位置。
如权利要求4所述的方法，其特征在于，如果向量数据进行过移位，则所述转发器模块将接收到的向量数据进行位拼接，将拼接结果传输给上一层节点，否则，所述转发器模块将接收到的向量数据进行检查溢出并进行加法操作后，传输给上一层节点。
如权利要求4所述的方法，其特征在于，叶子节点与中心节点之间遵守握手协议。
一种包含如权利要求1所述装置的控制装置。
一种包含如权利要求9所述控制装置的智能芯片。