WO2024016659A1

WO2024016659A1 - 工作量证明芯片及其处理方法

Info

Publication number: WO2024016659A1
Application number: PCT/CN2023/077712
Authority: WO
Inventors: 蔡凯; 田佩佳; 刘明; 张雨生; 闫超
Original assignee: 声龙(新加坡)私人有限公司
Priority date: 2022-07-19
Filing date: 2023-02-22
Publication date: 2024-01-25
Also published as: CN114928577B; CN114928577A

Abstract

一种工作量证明芯片及其处理方法，包括：计算单元(10)进行工作量证明计算，需要其他节点中存储单元数据集中的数据时，向本节点第一路由单元(30)发送请求，第一路由单元(30)将请求发送至本节点第二仲裁单元(60)，通过第二仲裁单元(60)将请求发送至其他节点；第二路由单元(50)接收到其他节点发送的计算单元(10)请求的数据后，将数据发送至第一仲裁单元(40)，第一仲裁单元(40)将数据发送至计算单元(10)。

Description

工作量证明芯片及其处理方法

本申请要求于2022年7月19日提交中国专利局、申请号为202210844639.2、发明名称为“工作量证明芯片及其处理方法”的中国专利申请的优先权，其内容应理解为通过引用的方式并入本申请中。

技术领域

本公开实施例涉及但不限于计算机应用技术领域，尤指一种工作量证明芯片及其处理方法。

背景技术

区块链技术中，区块的产生需要靠工作量证明算法(Proof of Work，POW)来完成，工作量证明是一种哈希函数，可以使用中央处理器(Central Processing Unit，CPU)、图形处理器(Graphic Processing Unit，GPU)或现场可编程逻辑门阵列(Field-Programmable Gate Array，FPGA)等对其求解，求解的过程中需要对一个大数据集进行随机地址访问，整个数据集一般存放于内存或者显存中。采用CPU、GPU或FPGA完成工作量证明的共同问题是功耗高，效率低，需要外挂内存或者显存用来存储数据集。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

一方面，本公开实施例提供了一种工作量证明芯片，包括2个或2个以上个节点，每个节点包括：一个计算单元、一个存储单元、一个第一路由单元、一个第一仲裁单元、至少一个第二路由单元和至少一个第二仲裁单元，所述第二路由单元和第二仲裁单元的数量相同，其中，所述计算单元与所述存储单元相连，且所述计算单元和所述存储单元的输出端口均与所述第一路由单元的输入端口连接，所述第一路由单元的输出端口以及所述第二路由单元的输出端口均与所述第二仲裁单元的输入端口连接，所述第二仲裁单元的输出端口设置为与其他节点的第二路由单元的输入端口连接，所述计算单元和所述存储单元的输入端口均与所述第一仲裁单元的输出端口连接，所述第一仲裁单元的输入端口与所述第二路由单元的输出端口连接，所述第二路由单元的输入端口设置为与其他节点的第二仲裁单元的输出端口连接。

在示例性实施例中：

所述计算单元设置为向本节点或其他节点的存储单元请求数据进行工作量证明计算；

所述存储单元设置为存储工作量证明计算中使用的数据集，响应于本节点或其他节点计算单元的请求，向本节点或其他节点的计算单元发送数据；

所述第一路由单元设置为接收所述计算单元发送的请求或所述存储单元发送的数据，向所述第二仲裁单元转发所述请求或数据；

所述第一仲裁单元设置为接收所述第二路由单元发送的请求转发至所述存储单元，以及接收所述第二路由单元发送的数据转发至所述计算单元；

所述第二路由单元设置为接收其他节点发送请求或数据转发至所述第一仲裁单元或所述第二仲裁单元；

所述第二仲裁单元设置为接收所述第一路由单元或所述第二路由单元发送的请求或数据向其他节点转发。

另一方面，本公开实施例还提供了一种工作量证明芯片的处理方法，所述工作量证明芯片为前述任一种工作量证明芯片，所述处理方法包括：

所述计算单元需要其他节点存储单元数据集中的数据进行工作量证明计算时，向本节点第一路由单元发送请求，所述第一路由单元将所述请求发送至本节点第二仲裁单元，通过所述第二仲裁单元将所述请求发送至其他节点；

所述第二路由单元接收到其他节点发送的所述计算单元请求的数据后，将所述数据发送至所述第一仲裁单元，所述第一仲裁单元将所述数据发送至所述计算单元。

本公开的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本公开而了解。本公开的其他优点可通过在说明书、权利要求书以及附图中所描述的方案来实现和获得。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图概述

附图用来提供对本公开技术方案的理解，并且构成说明书的一部分，与本公开的实施例一起用于解释本公开的技术方案，并不构成对本公开技术方案的限制。附图中各部件的形状和大小不反映真实比例，目的只是示意说明本公开内容。

图1为本公开实施例一种工作量证明芯片的结构示意图；

图2为本公开实施例提供的包含2节点的工作量证明芯片结构示意图；

图3为本公开实施例提供的包含4节点的工作量证明芯片结构示意图；

图4为本公开实施例提供的包含9节点的工作量证明芯片结构示意图；

图5为图4中节点S11的内部结构示意图；

图6为本公开实施例工作量证明芯片处理方法流程图。

详述

本公开描述了多个实施例，但是该描述是示例性的，而不是限制性的，并且对于本领域的普通技术人员来说显而易见的是，在本公开所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在详述中进行了讨论，但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。

本公开包括并设想了与本领域普通技术人员已知的特征和元件的组合。本公开已经公开的实施例、特征和元件也可以与任何常规特征或元件组合，以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合，以形成另一个由权利要求限定的独特的发明方案。因此，应当理解，在本公开中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此，除了根据所附权利要求及其等同替换所做的限制以外，实施例不受其它限制。此外，可以在所附权利要求的保护范围内进行各种修改和改变。

此外，在描述具有代表性的实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的，其它的步骤顺序也是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤，本领域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本公开实施例的精神和范围内。

本公开实施例提供一种可用于完成工作量证明计算的专用集成电路(Application Specific Integrated Circuit，ASIC)芯片结构，相比传统的CPU、GPU或FPGA等结构，本实施例结构功耗更低，效率更高，并且摆脱了外挂内存或显存，可以直接将数据集存储到ASIC芯片内部。

图1为本公开实施例提供的工作量证明芯片结构示意图，包括2个或2个以上个节点，每个节点包括：一个计算单元10、一个存储单元20、一个第一路由单元30、一个第一仲裁单元40、至少1个第二路由单元50和至少1个第二仲裁单元60，第二路由单元50和第二仲裁单元60的数量相同，均为1个或2个或2个以上，其中，计算单元10与存储单元20相连，且所述计算单元10和存储单元20的输出端口均与第一路由单元30的输入端口连接，第一路由单元30的输出端口以及第二路由单元50的输出端口均与第二仲裁单元60的输入端口连接，其中第一路由单元30的输出端口分别与每个第二仲裁单元60的输入端口连接，第二路由单元50的输出端口与第二仲裁单元60的输入端口一一对应连接，即一个第二路由单元50的输出端口与一个第二仲裁单元60的输入端口连接，第二仲裁单元60的输出端口设置为与其他节点的第二路由单元50的输入端口连接，每个第二仲裁单元60的输出端口设置为与不同节点的第二路由单元50的输入端口连接，其中第二仲裁单元60的输出端口与第二路由单元50的输入端口一一对应连接，所述计算单元10和存储单元20的输入端口均与第一仲裁单元40的输出端口连接，第一仲裁单元40的输入端口与第二路由单元50的输出端口连接，第二路由单元50的输入端口设置为与其他节点的第二仲裁单元60的输出端口连接，每个第二路由单元50的输入端口设置为与不同节点的第二仲裁单元60的输出端口连接，其中第二路由单元50的输入端口与第二仲裁单元60的输出端口一一对应连接；其中：

所述计算单元10设置为向本节点或其他节点存储单元20请求数据进行工作量证明计算；

所述存储单元20设置为存储工作量证明计算中使用的数据集，响应于本节点或其他节点计算单元10的请求，向本节点或其他节点的计算单元10发送数据；

所述第一路由单元30设置为接收计算单元10发送的请求或存储单元20发送的数据，向第二仲裁单元60转发所述请求或数据；

所述第一仲裁单元40设置为接收第二路由单元50发送的请求转发至存储单元20，以及接收第二路由单元50发送的数据转发至计算单元10；

所述第二路由单元50设置为接收其他节点发送请求或数据转发至第一仲裁单元40或第二仲裁单元60；

所述第二仲裁单元60设置为接收第一路由单元30或第二路由单元50发送的请求或数据向其他节点转发。

通过本公开实施例所述芯片结构，存储单元设置在节点内部，无需外挂内存或者显存，不受内存接口和显存结构的带宽限制，可以在芯片内部实现更高的带宽，且数据集存储在节点内部，可以降低工作量证明计算的功耗，提高效率。

本公开实施例以请求和数据为例说明信号流向，在节点内传输的信息内容不能作为对本申请的限制，在其他实施例中，其他信息内容可以参照请求和数据的信号流向执行。

在示例性实施例中，所述第二路由单元50和第二仲裁单元60均包括n个，n为大于等于2的正整数，所述第一仲裁单元40包括n个输入端口，每个输入端口与一个所述第二路由单元50的输出端口连接，所述第二仲裁单元60包括n个输入端口，其中一个输入端口与第一路由单元30的输出端口连接，其余n-1个输入端口与其他第二路由单元50的输出端口一一对应连接，所述第一路由单元30包括n个输出端口，每个输出端口与一个第二仲裁单元60的输入端口连接，所述第二路由单元50包括n个输出端口，其中一个输出端口与第一仲裁单元40的输入端口连接，其余n-1个输入端口与其他第二仲裁单元60的输入端口一一对应连接。由于一个第二仲裁单元60设置为连接一个节点的第二路由单元，当第二仲裁单元有n个时，说明与当前节点相连接的节点的最大值为n，即当前节点最多连接n个节点，例如n为1时，当前节点与一个节点相连接；n为2时，当前节点最多与两个节点相连接；n为3时，当前节点最多与三个节点相连接；n为4时，当前节点最多与四个节点相连接。

在示例性实施例中，当仲裁单元的输入端口包括2个以上时，所述仲裁单元可以设置为为本仲裁单元的每个输入端口设置相同或不同的权重，每个输入端口的权重值表示了该输入端口能连续处理的请求或数据数量的期望值，例如每个输入端口的权重比值等于设计中对每个端口应通过的请求或数据数量的期望比值，通过实验发现，在为每个端口设置不同的权重后，可以提高芯片整理的运算速度，提升处理效率。

在示例性实施例中，当仲裁单元的输入端口包括2个以上时，可以为每个输入端口设置相同或不同的优先级，并还可以在输入端口没有请求或数据后，降低该输入端口的优先级，经实验证明，动态调整优先级的方式相比固定优先级的方式，可以提高芯片的处理效率。

在示例性实施例中，可以为仲裁单元每个输入端口同时设置权重和优先级，在仲裁单元接收到请求或数据后，根据每个端口的优先级，选择优先级最高的有待处理请求或数据的端口，处理请求或数据的数量根据该端口的权重确定，请求或数据处理完成后，重新调整该端口的优先级，例如将该端口的优先级调至最低，继续选择下一个优先级最高的且有待处理请求或数据的端口。当优先级最高的端口无待处理请求或数据，则调整该端口的优先级，例如将该端口的优先级调至最低。

图2为本公开实施例提供的一种包含2节点的工作量证明芯片结构示意图，该芯片包括节点1和节点2，每个节点结构相同，每个节点包括1个计算单元、1个存储单元、1个第一路由单元、1个第一仲裁单元、1个第二路由单元和1个第二仲裁单元。计算单元与存储单元相连，计算单元和存储单元的输出端口均与第一路由单元的输入端口连接，第一路由单元的输出端口与第二仲裁单元的输入端口连接，第二仲裁单元的输出端口与另一个节点的第二路由单元的输入端口连接，计算单元和存储单元的输入端口均与第一仲裁单元的输出端口连接，第一仲裁单元的输入端口与第二路由单元的输出端口连接，第二路由单元的输入端口与另一个节点的第二仲裁单元的输出端口连接。由于两个节点间的请求、数据传输都只有一组总线，因此，在其他实施例中，该路由单元和仲裁单元可省略。

图3为本公开实施例提供的一种包含4节点的工作量证明芯片结构示意图，该芯片包括第一节点、第二节点、第三节点和第四节点，每个节点结构相同，每个节点包括1个计算单元、1个存储单元、1个第一路由单元、1个第一仲裁单元、2个第二路由单元和2 个第二仲裁单元。计算单元与存储单元相连，计算单元和存储单元的输出端口均与第一路由单元的输入端口连接，第一路由单元的2个输出端口分别与2个第二仲裁单元的输入端口连接，每个第二仲裁单元的输出端口与相邻节点的第二路由单元的输入端口连接，计算单元和存储单元的输入端口均与第一仲裁单元的输出端口连接，第一仲裁单元的2个输入端口分别与2个第二路由单元的输出端口连接，第二路由单元的输入端口与相邻节点的第二仲裁单元的输出端口连接。

在本示例中，包括第一仲裁单元和第二仲裁单元在内，每个仲裁单元有两个输入端口，如前所述，可为每个输入端口设置权重和优先级，仲裁单元在处理请求或数据时，可根据优先级选择先处理哪个端口的请求或数据，根据该端口的权重确定处理的请求或数据的数量。

图4为本公开实施例提供的一种包含9节点的工作量证明芯片的结构示意图，在本示例中，工作量证明芯片包含的9个节点分别为：节点S00、节点S01、节点S02、节点S10、节点S11、节点S12、节点S20、节点S21和节点S22。每个节点均与相邻的节点相连，每个节点结构相同，图5为节点S11的内部结构示意图。节点S11中包括计算单元S1180，与其连接的存储单元S1181，分别与计算单元S1180和存储单元S1181连接的第一路由单元S1190(图中简写为路由单元)，以及分别与计算单元S1180和存储单元S1181连接的第一仲裁单元S1191(图中简写为仲裁单元)，此外，节点S11还包括与第一路由单元S1190连接的4个第二仲裁单元(图中简写为仲裁单元)S110、S112、S114和S116，和与第一仲裁单元S1191连接的4个第二路由单元(图中简写为路由单元)S111、S113、S115和S117。

在示例性实施例中，仲裁单元S110、S112、S114、S116和S1191可以为带反压和缓存的仲裁结构，该些仲裁单元可以缓存一定数量的请求或数据，并在该请求或数据能被对应的互连结构接收时，将其发送到对应的互连结构(指与本单元连接的节点)，当缓存满时，对前一级结构产生反压，防止前一级结构发出的请求或数据无法被接收而丢失，当缓存不满时，反压解除。此外，该些仲裁单元可以根据每个输入端口的数据量设计每个端口的权重比，这决定了每个端口通过的请求或数据的比例，当该比例设置与实际需要通过的请求或数据的比例相符，则会提升整个系统的效率。

以仲裁单元S110为例，其包括四个输入端口：S1100、S1101、S1102和S1103。假设四个输入端口的默认优先级为S1100>S1101>S1102>S1103，并且假设S1100的权重为4，S1101的权重为2，S1102的权重为1，S1103的权重为0。在本例中，权重数量与发送请求的数量相关，权重为4表示最多可连续发送4个请求，权重为0视为端口关闭，不允许请求通过。本例中，优先级调整的原则是在端口发送完请求或者没有请求后，将该端口的优先级调至最低。

对于仲裁单元S110来说，其加权轮询仲裁的行为举例如下：

假设端口S1100接收到请求，且当前端口S1100的优先级最高，由于端口S1100的权重为4，因此该端口S1100最多可以连续接收4个请求，当端口S1100发送完连续4个请求或者S1100没有请求后，仲裁单元S110将优先级顺序调整为：S1101>S1102>S1103>S1100；

此时可有4种情况：

情况1，端口S1101有请求，由于S1101是优先级最高的有请求的端口，且由于端口S1101的权重为2，因此端口S1101最多可以连续发送2个请求，当端口S1101连续发送完2个请求或者S1101没有请求后，仲裁单元S110将优先级顺序调整为： S1102>S1103>S1100>S1101；

情况2，端口S1101没有请求，但端口S1102有请求，由于端口S1102是优先级最高的有请求的端口，且由于端口S1102的权重为1，当端口S1102发送完1个请求后，仲裁单元S110将优先级顺序调整为：S1103>S1100>S1101>S1102；

情况3，端口S1101和S1102均没有请求，但端口S1100有请求，由于S1100是优先级最高的有请求的端口，由于端口S1100的权重为4，其最多可以连续发送4个请求，当端口S1100发送完连续4个请求或者端口S1100没有请求后，仲裁单元S110将优先级顺序调整为：S1101>S1102>S1103>S1100；

情况4，端口S1101和S1102均没有请求，S1100没有请求，此时优先级不变，仍为S1101>S1102>S1103>S1100，等待端口S1100、S1101和S1102发来的请求。

每个仲裁单元S110、S112、S114、S116和S1191均可采用上述加权优先级轮询仲裁方案，可以提高整个节点结构的效率。在其他实施例中，或者可以采用固定权重轮询仲裁方案(每个端口权重比固定为1:1)，或者固定优先级仲裁方案。

在示例性实施例中，路由单元S111、S113、S115、S117和S1190可以为带反压和缓存的路由结构，该些路由单元可以缓存一定数量的请求或数据，并在该请求或数据能被对应的互连结构接收时，将其发送到对应的互连结构；当缓存满时，对前一级结构产生反压，防止前一级结构发出的请求或数据无法被接收而丢失；当缓存不满时，反压解除。

例如对于路由单元S1190，其接收来自计算单元S1180的请求并将其缓存，当缓存满，则反压计算单元S1180使其不再发出请求。路由单元S1190解析所有缓存的请求要发往的位置，例如存在发往仲裁单元S114的请求，当仲裁单元S114能够接收请求，即对路由单元S1190没有反压，则将请求发往仲裁单元S114。当缓存中同时存在发往仲裁单元S114和S116的请求，并且仲裁单元S114和S116都能接收请求，则同时将两个请求分别发往仲裁单元S114和S116。存在发往其他端口的请求时，处理方式相同。当对应的结构不能接收请求，则路由单元S1190继续将其缓存。

计算单元S1180用于进行工作量证明中的计算部分；

存储单元S1181用于存储工作量证明中用到的数据集，数据集被拆分成多个部分，分别存放在多个节点的存储单元内。

下面以节点S00为例介绍本公开实施例工作量证明芯片的工作流程，其他节点可参照执行。节点S00与节点S11结构相同，参照图4和图5。

节点S00中计算单元S0080开始进行工作量证明计算，需要请求数据集中的数据，计算单元S0080连续发出请求直到路由单元S0090产生反压，计算单元S0080发出的请求被缓存到路由单元S0090中；

假设计算单元S0080发出的其中一个请求需要访问S11节点存储单元S1181中的数据，记为请求1，请求1首先被发送到路由单元S0090，路由单元S0090缓存请求1；

路由单元S0090同时解析被缓存的所有请求，将缓存中的请求分别发往仲裁单元S000、S002、S004和S006，在此过程中，请求1会被尝试发往到仲裁单元S004；

当仲裁单元S004此时缓冲是满的，或者由于仲裁的关系不能接收路由单元S0090的请求，即对路由单元S0090有反压，则路由单元S0090继续保存请求1，当没有反压，则请求1通过路由单元S0090发送到仲裁单元S004；

仲裁单元S004分析所有输入端口上的请求，根据路由单元S007、S0090、S001和 S003对应在仲裁单元S004输入端口的权重，依次接收来自上述路由单元的请求，并将其发往节点S01路由单元S011，在此过程中，请求1被发往路由单元S011；

路由单元S011缓存来自仲裁单元S004的所有请求；路由单元S011同时解析被缓存的所有请求，将缓存中的请求分别发往仲裁单元S016、S0191、S014和S012，在此过程中，请求1会被尝试发往仲裁单元S016；

当仲裁单元S016此时缓冲是满的，或者由于仲裁的关系不能接收路由单元S011的请求，即对路由单元S011有反压，则路由单元S011继续保存请求1，当没有反压，则请求1通过路由单元S011发往仲裁单元S016；

仲裁单元S016分析所有输入端口上的请求，根据路由单元S011、S0190、S013和S015对应在仲裁单元S016输入端口的权重，依次接收来自上述路由单元的请求，并将其发往S11节点路由单元S113，在此过程中，请求1被发往路由单元S113；

路由单元S113缓存来自S01节点仲裁单元S016的所有请求；路由单元S113同时解析被缓存的所有请求，将缓存中的请求分别发往仲裁单元S110、S1191、S116和S114，在此过程中，请求1被尝试发往仲裁单元S1191；

当仲裁单元S1191此时缓冲是满的，或者由于仲裁的关系不能接收路由单元S113的数据，即对路由单元S113有反压，则路由单元S113继续保存请求1，当没有反压，则请求1通过路由单元S113发送到仲裁单元S1191；

仲裁单元S1191分析所有输入端口上的请求，根据路由单元S117、S111、S113和S115对应在仲裁单元S1191输入端口的权重，依次接收来此上述路由单元的请求，并将其发往存储单元S1181，在此过程中，请求1被发往存储单元S1181；

请求1访问存储单元S1181，获得所请求的数据，记为数据1；

数据1依次通过S11节点路由单元S1190，S11节点仲裁单元S110，S10节点路由单元S105，S10节点仲裁单元S102，S00节点路由单元S007，S00节点仲裁单元S0091被发送到S00节点计算单元S0080，过程与请求1类似，此处不在赘述。至此计算单元S0080完成对位于存储单元S1181上的数据的请求。

计算单元S0080可按以上过程从任意节点获得工作量证明需要的其他数据，进行工作量证明计算。

节点的数量可以有2个到任意多个，前述实施例分别以2节点、4节点和9节点为例进行说明，节点的数量不限于此，以图4所示的芯片结构为例，可以在该结构的基础上进行扩展，增加节点数量，最多例如可以增加至1024个节点。

本公开实施例实现了一种用于工作量证明算法的ASIC单元，解决了CPU、GPU或FPGA做工作量证明时，功耗高、效率低，需要外挂内存或者显存用来存储数据集的问题。

本公开实施例还提供了一种工作量证明芯片的处理方法，所述工作量证明芯片可以是前述任一实施例所述的工作量证明芯片，如图6所示，所述处理方法包括：

步骤A1，计算单元进行工作量证明计算，需要其他节点中存储单元数据集中的数据时，向本节点第一路由单元发送请求；

步骤A2，所述第一路由单元将所述请求发送至本节点第二仲裁单元，通过所述第二仲裁单元将所述请求发送至其他节点；

步骤A3，所述第二路由单元接收到其他节点发送的所述计算单元请求的数据后，将所述数据发送至所述第一仲裁单元；

步骤A4，所述第一仲裁单元将所述数据发送至所述计算单元。

上述步骤A1-步骤A4描述了计算单元从其他节点获取数据进行工作量证明计算的过程。

在示例性实施例中，所述方法还包括：

步骤B1，所述存储单元接收到所述第一仲裁单元发送的由其他节点计算单元发出的请求，将请求的数据发送至所述第一路由单元；

步骤B2，所述第一路由单元将所述数据发送至本节点第二仲裁单元，通过所述第二仲裁单元将所述请求发送至请求数据的节点。

上述步骤B1-步骤B2描述了存储单元反馈所请求数据的过程。

在示例性实施例中，所述方法还包括：

所述第二路由单元接收到其他节点发送的请求或数据后，将所述请求或数据发送至所述第二仲裁单元，通过所述第二仲裁单元将所述数据发送至所述请求或数据的目标节点。

上述步骤描述了当前节点作为路由节点转发请求或数据的过程。

在示例性实施例中，所述第一仲裁单元和所述第二仲裁单元均包括n个输入端口，n为大于等于2的正整数，所述第一仲裁单元或第二仲裁单元接收到请求或数据后，根据每个输入端口的权重和/或优先级处理每个输入端口的请求或数据。根据优先级处理请求或数据例如可以是：选择优先级最高的且有待处理请求或数据的输入端口，该输入端口的请求或数据处理完成后，将该输入端口的优先级调至最低。根据权重处理请求或数据例如可以是：根据输入端口的权重值确定所述输入端口能连续处理的请求或数据数量。

本公开实施例实现了一种用于工作量证明算法的处理方法，解决了CPU、GPU或FPGA做工作量证明时，功耗高、效率低，需要外挂内存或者显存用来存储数据集的问题。

在本公开实施例的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据情况理解上述术语在本公开中的含义。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

Claims

一种工作量证明芯片，包括2个或2个以上个节点，其中每个节点包括：一个计算单元、一个存储单元、一个第一路由单元、一个第一仲裁单元、至少一个第二路由单元和至少一个第二仲裁单元，所述第二路由单元和第二仲裁单元的数量相同，其中，所述计算单元与所述存储单元相连，且所述计算单元和所述存储单元的输出端口均与所述第一路由单元的输入端口连接，所述第一路由单元的输出端口以及所述第二路由单元的输出端口均与所述第二仲裁单元的输入端口连接，所述第二仲裁单元的输出端口设置为与其他节点的第二路由单元的输入端口连接，所述计算单元和所述存储单元的输入端口均与所述第一仲裁单元的输出端口连接，所述第一仲裁单元的输入端口与所述第二路由单元的输出端口连接，所述第二路由单元的输入端口设置为与其他节点的第二仲裁单元的输出端口连接。
根据权利要求1所述的工作量证明芯片，其中，

所述计算单元设置为向本节点或其他节点的存储单元请求数据进行工作量证明计算；

所述存储单元设置为存储工作量证明计算中使用的数据集，响应于本节点或其他节点计算单元的请求，向本节点或其他节点的计算单元发送数据；

所述第一路由单元设置为接收所述计算单元发送的请求或所述存储单元发送的数据，向所述第二仲裁单元转发所述请求或数据；

所述第一仲裁单元设置为接收所述第二路由单元发送的请求转发至所述存储单元，以及接收所述第二路由单元发送的数据转发至所述计算单元；

所述第二路由单元设置为接收其他节点发送请求或数据转发至所述第一仲裁单元或所述第二仲裁单元；

所述第二仲裁单元设置为接收所述第一路由单元或所述第二路由单元发送的请求或数据向其他节点转发。
根据权利要求2所述的工作量证明芯片，其中，所述第二路由单元和所述第二仲裁单元均包括n个，n为大于等于2的正整数，所述第一仲裁单元包括n个输入端口，每个输入端口与一个所述第二路由单元的输出端口连接，所述第二仲裁单元包括n个输入端口，其中一个输入端口与所述第一路由单元的输出端口连接，其余n-1个输入端口与其他第二路由单元的输出端口一一对应连接，所述第一路由单元包括n个输出端口，每个输出端口与一个所述第二仲裁单元的输入端口连接，所述第二路由单元包括n个输出端口，其中一个输出端口与所述第一仲裁单元的输入端口连接，其余n-1个输入端口与其他第二仲裁单元的输入端口一一对应连接。
根据权利要求2所述的工作量证明芯片，其中，

所述仲裁单元还设置为为本仲裁单元的n个输入端口分别设置权重，输入端口的权重值表示该输入端口能连续处理的请求或数据数量的期望值，所述仲裁单元包括所述第一仲裁单元和所述第二仲裁单元。
根据权利要求2或3或4所述的工作量证明芯片，其中，

所述仲裁单元还设置为为本仲裁单元的n个输入端口分别设置优先级，在本仲裁单元处理请求或数据时，所述仲裁单元选择优先级最高的且有待处理请求或数据的输入端口。
根据权利要求5所述的工作量证明芯片，其中，

所述仲裁单元还设置为在选择优先级最高的且有待处理请求或数据的输入端口后，当所述输入端口的请求或数据处理完成后，重新调整所述输入端口的优先级。
根据权利要求6所述的工作量证明芯片，其中，所述重新调整所述输入端口的优先级，包括：

所述仲裁单元将所述输入端口的优先级调至最低。
根据权利要求1或2所述的工作量证明芯片，其中，

所述仲裁单元为带反压和缓存的仲裁单元。
根据权利要求1或2所述的工作量证明芯片，其中，

所述路由单元为带反压和缓存的路由单元。
一种工作量证明芯片的处理方法，其中，所述工作量证明芯片包括2个或2个以上个节点，每个节点包括：一个计算单元、一个存储单元、一个第一路由单元、一个第一仲裁单元、至少一个第二路由单元和至少一个第二仲裁单元，所述第二路由单元和第二仲裁单元的数量相同，其中，所述计算单元与所述存储单元相连，且所述计算单元和所述存储单元的输出端口均与所述第一路由单元的输入端口连接，所述第一路由单元的输出端口以及所述第二路由单元的输出端口均与所述第二仲裁单元的输入端口连接，所述第二仲裁单元的输出端口设置为与其他节点的第二路由单元的输入端口连接，所述计算单元和所述存储单元的输入端口均与所述第一仲裁单元的输出端口连接，所述第一仲裁单元的输入端口与所述第二路由单元的输出端口连接，所述第二路由单元的输入端口设置为与其他节点的第二仲裁单元的输出端口连接；所述处理方法包括：

所述计算单元需要其他节点存储单元数据集中的数据进行工作量证明计算时，向本节点第一路由单元发送请求，所述第一路由单元将所述请求发送至本节点第二仲裁单元，通过所述第二仲裁单元将所述请求发送至其他节点；

所述第二路由单元接收到其他节点发送的所述计算单元请求的数据后，将所述数据发送至所述第一仲裁单元，所述第一仲裁单元将所述数据发送至所述计算单元。
根据权利要求10所述的处理方法，还包括：

所述存储单元接收到所述第一仲裁单元发送的由其他节点计算单元发出的请求，将请求的数据发送至所述第一路由单元，所述第一路由单元将所述数据发送至本节点第二仲裁单元，通过所述第二仲裁单元将所述请求发送至请求数据的节点。
根据权利要求10所述的处理方法，还包括：

所述第二路由单元接收到其他节点发送的请求或数据后，将所述请求或数据发送至所述第二仲裁单元，通过所述第二仲裁单元将所述数据发送至所述请求或数据的目标节点。
根据权利要求10所述的处理方法，其中，

所述第一仲裁单元和所述第二仲裁单元均包括n个输入端口，n为大于等于2的正整数，所述第一仲裁单元或所述第二仲裁单元接收到请求或数据后，根据每个输入端口的权重和/或优先级处理所述输入端口的请求或数据。
根据权利要求13所述的处理方法，其中，所述仲裁单元根据每个输入端口的优先级处理所述输入端口的请求或数据，包括：

选择优先级最高的且有待处理请求或数据的输入端口，该输入端口的请求或数据处理完成后，将该输入端口的优先级调至最低。
根据权利要求13所述的处理方法，其中，所述仲裁单元根据每个输入端口的权重处理所述输入端口的请求或数据，包括：根据输入端口的权重值确定所述输入端口能连续处理的请求或数据数量。