CN107688471A - 一种动态调整数据流架构的资源带宽的计算系统及其方法 - Google Patents
一种动态调整数据流架构的资源带宽的计算系统及其方法 Download PDFInfo
- Publication number
- CN107688471A CN107688471A CN201710667610.0A CN201710667610A CN107688471A CN 107688471 A CN107688471 A CN 107688471A CN 201710667610 A CN201710667610 A CN 201710667610A CN 107688471 A CN107688471 A CN 107688471A
- Authority
- CN
- China
- Prior art keywords
- point
- bandwidth
- floating
- fixed
- counter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 7
- 238000004364 calculation method Methods 0.000 claims abstract description 54
- 238000000205 computational method Methods 0.000 claims abstract description 14
- 230000006399 behavior Effects 0.000 claims description 11
- 238000007667 floating Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 abstract 1
- 238000005259 measurement Methods 0.000 abstract 1
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3867—Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Executing Machine-Instructions (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开一种动态调整数据流架构的资源带宽计算方法及其系统,包括:数据流架构中的指令发射机制,在指令发射逻辑当中增加如下功能:定点运算计数器、浮点运算计数器、带宽调整计数器、带宽预测器,用于计算定点与浮点的指令数,计算带宽调整指令数,并发射相应的指令到运算单元。运算单元,采用组合运算单元,在数据通路上可以做到定点运算和浮点运算的共用,其调整的控制点为指令发射逻辑;可根据指令发射逻辑发射的指令增加定点流水量带宽、减少浮点流水线的带宽或减少定点流水量带宽、增加浮点流水线的带宽,调整带宽分配比例。统计周期,设定粒度N,N为自然数,以N个时钟周期为一个计算小周期。
Description
技术领域
本发明涉及计算机应用技术领域,特别是涉及高性能计算的领域。
背景技术
随着计算机体系结构的发展,领域专用的计算机体系结构成为主要发展趋势。在面向特定应用时,专用型结构利用应用特征对结构进行相应的优化,从而更好地发挥出硬件的计算性能。在高性能计算领域,数据流计算是领域专用计算结构的一个重要分支,数据流计算表现出了较好的性能和适用性。
数据流架构通常都包括若干个或者十几个计算节点,每个计算节点都是运算能力较强但是控制能力较弱、复杂度较小的核心。每个核心当中设置固定个数的运算单元:X个定点运算单元和Y个浮点运算单元,每个定点运算单元对应一条定点运算流水线,每个浮点运算单元对应一条浮点运算流水线。在每个时钟周期,每条流水线都会从所有准备好的指令当中选择一条指令进入到对应的流水线执行。不同的负载应用当中的浮点指令和定点指令的比例都不尽相同,某些负载当中可能浮点指令的比例更大,那么这类负载对浮点运算的带宽需求将更大;而某些负载当中可能定点指令的比例更大,那么这种负载对定点运算的带宽需求将更大。
在传统数据流架构当中,任意一个节点内部的指令发射机制如图1所示。在数据流架构的任意一个节点内部,指令队列101用于保存指令的实时的执行信息,指令发射逻辑用于选择指令并且发射到对应的运算单元当中。在图1的例子中,设置了3个运算单元,分别是2个定点运算单元103、104和1个浮点运算单元105。指令发射逻102辑根据指令队列当中每条指令的状态是否准备好,以及每个运算单元是否能够接收并执行新的指令,把指令队列101当中的指令分配到执行单元去执行。定点运算单元103、104当中的执行流水线叫做定点流水线,浮点运算单元105当中的执行流水线叫做浮点流水线。通常定点流水线的长度是1-2个流水级,浮点流水线的长度是4-6个流水级(流水线的级数和具体的实现方式有关系),该例子当中认为定点流水线都是1个流水级,浮点流水线是4个流水级。采用这种传统方式发射指令的话,如果一个应用当中的定点指令的比例较少反之浮点指令较多的话,那么会产生这样的情况:其中一个定点运算单元(比如103或者104)的计算流水线较为空闲,而浮点流水线105的带宽较为紧张。在这种结构下,相当于定点运算带宽和浮点运算带宽的硬件都是固定的,没有任何能够进行调整的余地,而带宽紧张的流水线,其执行效率将有可能成为执行效率的瓶颈。
发明内容
本发明针对传统设计不能根据实际负载特性调整计算带宽的问题,提出了能够根据负载的特性,动态调整定点和浮点运算的带宽以适应负载的特点,达到最佳的运算性能的方法和系统机制。具体技术方案如下:
一种动态调整数据流架构的资源带宽的计算系统,包括:
指令发射单元,包括定点运算计数器、浮点运算计数器、带宽统计器和带宽调整计数器;其中所述定点运算计数器用于计算在N个时钟周期中进入定点流水线的有效指令数;所述浮点运算计数器用于计算在N个时钟周期中进入浮点流水线的有效指令数;所述带宽统计器用于统计在过去的多组N个时钟周期内的的历史行为,是定点带宽需求更大还是浮点带宽需求更大;所述带宽调整计数器用于根据所述带宽统计器的数值调整运算单元当中定点计算和浮点计算的执行比例;
运算单元,与所述指令发射单元连接,包括定点运算单元、浮点运算单元以及组合运算单元,其中所述组合运算单元在数据通路上用于实现定点运算和浮点运算的共用,其既可以执行定点运算也可以执行浮点运算;所述运算单元根据所述带宽调整计数器的数值来调整定点流水量带宽和浮点流水量带宽的分配比例;
其中,N为自然数,代表带宽调整的粒度,以N个时钟周期作为一个计算小周期。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算系统,其中,在每个所述计算小周期结束的时候,所述定点运算计数器和所述浮点运算计数器分别复位并重新开始从0计数;
所述带宽统计器用于统计在过去的Z个所述计算小周期内的历史行为,其中Z为自然数;若定点计算的带宽需求大于浮点计算,所述带宽统计器的数值做饱和加1;若定点计算带宽小于浮点计算带宽,所述带宽统计器的数值做饱和减1;
所述带宽调整计数器只有在所述计算小周期结束的时候才会根据所述带宽统计器的数值进行调整,否则执行过程中所述带宽调整计数器的数值不会发生改变,只是作为固定的配置。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算系统,其中,所述组合运算单元所占用的空间比单独的定点运算单元或者单独的浮点运算单元所占用的空间大。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算系统,其中,初始状态下所述组合运算单元针对定点计算和浮点计算所分配的带宽是相等的。
本发明同时还提出了一种动态调整数据流架构的资源带宽的计算方法,包括以下步骤:
S1:将运算单元划分为定点运算单元、浮点运算单元以及组合运算单元,所述定点运算单元用于只进行定点运算,所述浮点运算单元用于只进行浮点运算,所述组合运算单元在数据通路上用于实现定点运算和浮点运算的共用,其既可以执行定点运算也可以执行浮点运算;
S2:利用定点运算计数器计算在N个时钟周期中进入定点流水线的有效指令数;利用浮点运算计数器计算在N个时钟周期中进入浮点流水线的有效指令数;其中N为自然数,代表带宽调整的粒度,以N个时钟周期作为一个计算小周期;
S3:利用带宽统计器统计在过去的多组N个时钟周期内的的历史行为,是定点带宽需求更大还是浮点带宽需求更大;
S4:利用带宽调整计数器,根据所述带宽统计器的数值调整所述运算单元当中定点计算和浮点计算的执行比例。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算方法,其中,所述步骤S2包括:在每个所述计算小周期结束的时候,所述定点运算计数器和所述浮点运算计数器分别复位并重新开始从0计数。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算方法,其中,所述步骤S3中,带宽统计器用于统计在过去的Z个所述计算小周期内的历史行为,其中Z为自然数;若定点计算的带宽需求大于浮点计算,所述带宽统计器的数值做饱和加1;若定点计算带宽小于浮点计算带宽,所述带宽统计器的数值做饱和减1。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算方法,其中,所述步骤S4中,所述带宽调整计数器只有在所述计算小周期结束的时候才会根据所述带宽统计器的数值进行调整,否则执行过程中所述带宽调整计数器的数值不会发生改变,只是作为固定的配置。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算方法,其中,所述组合运算单元所占用的空间比单独的定点运算单元或者单独的浮点运算单元所占用的空间大。
根据本发明提出的一种动态调整数据流架构的资源带宽的计算方法,其中,所述步骤S1中,初始状态下所述组合运算单元针对定点计算和浮点计算所分配的带宽是相等的。
与现有技术相比,本发明的有益效果在于:
本发明提出的动态调整数据流架构的资源带宽计算方法及其系统具有适应各种负载,运算效率高的优点,并且本发明中粒度N的设定,可以供软件根据实际情况增加或减少小周期的长度,使使用更为灵活。
附图说明
图1为传统的数据流架构中指令发射的结构示意图;
图2为本发明提出的数据流架构中指令发射的结构示意图;
图3为带宽预测器的基本工作原理图;
图4为本发明实施例的执行步骤示意图。
附图标记说明:图3中的N-cycle以及图4中的N,均表示由N个时钟周期组成的小周期。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图2所示,本发明把图1中原来的定点运算单元104变成了定点+浮点运算单元204。定点+浮点运算单元表示该运算单元既可以支持定点运算,也能够支持基本的浮点运算(复杂运算除外),这种组合型的运算单元在数据通路上可以做到定点运算和浮点运算的共用,总的面积上略大于单独的定点运算单元以及单独的浮点运算单元,在后面的描述中把204叫做combo运算单元(combo是combination的缩写,表示组合型的运算单元)。
之所以要采用combo运算单元,是因为这样的设置可以配合满足运算带宽可调的需求。调整的控制点就是指令发射逻辑202。在本发明提出的机制当中,初始状态设定为定点带宽和浮点带宽1:1(初始状态下的combo运算单元针对浮点和定点的带宽分配是相等的,再加上一个单独的定点运算单元和一个单独的浮点运算单元,故初始带宽比例为1:1),同时指令发射逻辑202除了具备基本的指令发射功能之外,还需要针对定点和浮点流水线的空闲状态进行监测,如果发现定点流水线较为空闲而浮点流水线较为忙碌的话,那么就降低定点流水线的带宽增加浮点流水线的带宽,经过调整之后,两者可能将不再是1:1的带宽分配关系。
在指令发射逻辑202当中需要增加如下的功能:
定点运算Counter206:表示在N个Cycle当中进入定点流水线的有效指令数;该计数器用于实时计数,每当有一条定点运算指令被发射到专门的定点运算单元或者是combo运算单元当中,该计数器会加1。以N个Cycle为一个小周期,在每个小周期结束的时候该计数器将复位,重新开始从0计数。
浮点运算Counter207:表示在N个Cycle当中进入浮点流水线的有效指令数;该计数器的原理和206的类似,用于实时计数,每当有一条浮点运算指令被发射到专门的浮点运算单元或者是combo运算单元当中,该计数器会加1。以N个Cycle为一个小周期,在每个小周期结束的时候该计数器将复位,重新开始从0计数。
带宽调整Counter208:表示在N个Cycle之内进入到定点流水线当中的有效指令数(假设N=10,带宽调整Counter=3,表示每10个Cycle之内,3个cycle分配给定点流水线,7个Cycle分配给浮点流水线。这里需要说明,在3个分配给定点流水线的Cycle当中,如果没有有效的定点指令但是却存在有效的浮点指令时,依然可以发射浮点指令。这里的分配只是确定了1个Cycle内被combo运算单元优先处理的指令类型)。该计数器的数值只有在以N个Cycle为界限的小周期结束的时候才会根据预测器209的结果进行适当的调整,否则执行过程中该计数器的数值不会发生改变,只是作为固定的配置。这个带宽调整Counter用于调整combo运算单元当中定点和浮点的执行比例。
上面提到的N,可以在实现的时候固定为某一个数字,比如10,也可以采用寄存器进行设置。N表示了带宽调整的粒度,比如设置为10,就是以10个时钟周期为粒度进行调整,如果设置为100,就是以100个时钟周期进行调整。N的数值实现为软件可以配置。
带宽预测器209:该预测器用于预测在过去的X个N-cycle小周期内的历史行为,是定点带宽需求更大还是浮点需求更大。具体带宽预测器的原理如图3所示:把时间轴切分为X段,每一段以N个Cycle为一个小周期,把定点运算和浮点运算在这个小周期内的相对带宽占比作为历史行为驱动带宽预测器的变化。在第一个小周期301,定点的带宽需求大于浮点,所以预测器做饱和加1;在第二个和第三个小周期,定点带宽需求仍然大于浮点,所以预测器仍然做饱和加1;在第四个小周期,定点带宽小于浮点,所以预测器做饱和减1。具体预测器的位数是实现决定的。
继续参阅图2,在本实施例当中,带宽预测器209设计为2比特率的预测器。在每个由数值N确定的小周期结束的时候,根据更新后的带宽预测器的数值决定带宽调整计数器208如何进行调整。在本实施例中,带宽调整计数器208每次调整的步幅设定为1。
其中,带宽预测器的原理如图3所示:把时间轴切分为X段,每一段以N个时钟周期为一个小周期,把定点运算和浮点运算在这个小周期内的相对带宽占比作为历史行为驱动带宽预测器的变化。在第一个小周期301,定点的带宽需求大于浮点,所以预测器做饱和加1;在第二个302和第三个小周期303,定点带宽需求仍然大于浮点,所以预测器仍然做饱和加1;在第四个小周期304,定点带宽小于浮点,所以预测器做饱和减1。如果定点带宽需求大于浮点,带宽预测器进行饱和加1;如果定点带宽需求小于浮点,带宽预测器进行饱和减1;如果两者相等,带宽预测器保持不变。
如图4所示是一个具体实施的例子,带宽预测器410的初始值是2’b00;带宽调整计数器411的初始值是3。图中401-409分别表示连续的以N个时钟周期为粒度的小周期。每一行表示了在每个小周期内,定点和浮点的带宽需求情况(根据定点运算计数器和浮点运算计数器的数值决定,这两个计数器在每个小周期结束的时候复位)。根据定点和浮点的带宽需求状况,决定了带宽预测器410的跳转方向,从而决定了针对下一个小周期如何调整带宽调整计数器411的数值。从图中可以看出,本实施例使用带宽预测器410的高位用于决定带宽调整计数器411是加1、还是减1,同时如果带宽预测器410保持不变的话,带宽调整计数器411也保持不变。可以看出,如果运算带宽的特征发生了变化,预测器将在2个小周期之后调整完毕。
从上面的描述可以看出,在本实施例当中,根据软件设置的N,硬件根据负载当中定点指令和浮点指令的实时带宽比例,动态调整了硬件运算资源的带宽比例,从而达到了动态适应负载特性的效果,提高运算单元的利用率。
需要注意的是,图中定点>浮点的意思是,在N个时钟周期的内,有效发射的定点指令数大于有效发射的浮点指令数。
另外,带宽预测器410和带宽调整计数器411的加1运算和减1运算都是饱和运算。
步骤401:带宽预测器410的初始值是2’b00,在这个N个时钟周期的小周期内,发现有效的定点指令数大于有效的浮点指令数,表示在该小周期内,定点带宽需求大于浮点带宽需求,预测器410的数值加1,从2’b00变成2’b01。带宽调整计数器411的变化方向取决于预测器410的高位,这里高位为0,故带宽调整计数器411的数值进行减1。
后面的步骤402-409和步骤401都是类似的,区别只是调整的方向不同。
从上面的描述可以看出,在本实施例当中,根据软件设置的N,硬件根据负载当中定点指令和浮点指令的实时带宽比例,动态调整了硬件运算资源的带宽比例,从而达到了动态适应负载特性的效果,提高运算单元的利用率。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
Claims (10)
1.一种动态调整数据流架构的资源带宽的计算系统,其特征在于,包括:
指令发射单元,包括定点运算计数器、浮点运算计数器、带宽统计器和带宽调整计数器;其中所述定点运算计数器用于计算在N个时钟周期中进入定点流水线的有效指令数;所述浮点运算计数器用于计算在N个时钟周期中进入浮点流水线的有效指令数;所述带宽统计器用于统计在过去的多组N个时钟周期内的的历史行为,是定点带宽需求更大还是浮点带宽需求更大;所述带宽调整计数器用于根据所述带宽统计器的数值调整运算单元当中定点计算和浮点计算的执行比例;
运算单元,与所述指令发射单元连接,包括定点运算单元、浮点运算单元以及组合运算单元,其中所述组合运算单元在数据通路上用于实现定点运算和浮点运算的共用,其既可以执行定点运算也可以执行浮点运算;所述运算单元根据所述带宽调整计数器的数值来调整定点流水量带宽和浮点流水量带宽的分配比例;
其中,N为自然数,代表带宽调整的粒度,以N个时钟周期作为一个计算小周期。
2.根据权利要求1所述的一种动态调整数据流架构的资源带宽的计算系统,其特征在于,在每个所述计算小周期结束的时候,所述定点运算计数器和所述浮点运算计数器分别复位并重新开始从0计数;
带宽统计器用于统计在过去的Z个所述计算小周期内的历史行为,其中Z为自然数;若定点计算的带宽需求大于浮点计算,所述带宽统计器的数值做饱和加1;若定点计算带宽小于浮点计算带宽,所述带宽统计器的数值做饱和减1;
所述带宽调整计数器只有在所述计算小周期结束的时候才会根据所述带宽统计器的数值进行调整,否则执行过程中所述带宽调整计数器的数值不会发生改变,只是作为固定的配置。
3.根据权利要求1或2所述的一种动态调整数据流架构的资源带宽的计算系统,其特征在于,所述组合运算单元所占用的空间比单独的定点运算单元或者单独的浮点运算单元所占用的空间大。
4.根据权利要求3所述的一种动态调整数据流架构的资源带宽的计算系统,其特征在于,初始状态下所述组合运算单元针对定点计算和浮点计算所分配的带宽是相等的。
5.一种动态调整数据流架构的资源带宽的计算方法,其特征在于,包括以下步骤:
S1:将运算单元划分为定点运算单元、浮点运算单元以及组合运算单元,所述定点运算单元用于只进行定点运算,所述浮点运算单元用于只进行浮点运算,所述组合运算单元在数据通路上用于实现定点运算和浮点运算的共用,其既可以执行定点运算也可以执行浮点运算;
S2:利用定点运算计数器计算在N个时钟周期中进入定点流水线的有效指令数;利用浮点运算计数器计算在N个时钟周期中进入浮点流水线的有效指令数;其中N为自然数,代表带宽调整的粒度,以N个时钟周期作为一个计算小周期;
S3:利用带宽统计器统计在过去的多组N个时钟周期内的的历史行为,是定点带宽需求更大还是浮点带宽需求更大;
S4:利用带宽调整计数器,根据所述带宽统计器的数值调整所述运算单元当中定点计算和浮点计算的执行比例。
6.根据权利要求5所述的一种动态调整数据流架构的资源带宽的计算方法,其特征在于,所述步骤S2包括:在每个所述计算小周期结束的时候,所述定点运算计数器和所述浮点运算计数器分别复位并重新开始从0计数。
7.根据权利要求5所述的一种动态调整数据流架构的资源带宽的计算方法,其特征在于,所述步骤S3中,带宽统计器用于统计在过去的Z个所述计算小周期内的历史行为,其中Z为自然数;若定点计算的带宽需求大于浮点计算,所述带宽统计器的数值做饱和加1;若定点计算带宽小于浮点计算带宽,所述带宽统计器的数值做饱和减1。
8.根据权利要求5所述的一种动态调整数据流架构的资源带宽的计算方法,其特征在于,所述步骤S4中,所述带宽调整计数器只有在所述计算小周期结束的时候才会根据所述带宽统计器的数值进行调整,否则执行过程中所述带宽调整计数器的数值不会发生改变,只是作为固定的配置。
9.根据权利要求5所述的一种动态调整数据流架构的资源带宽的计算方法,其特征在于,所述组合运算单元所占用的空间比单独的定点运算单元或者单独的浮点运算单元所占用的空间大。
10.根据权利要求5所述的一种动态调整数据流架构的资源带宽的计算方法,其特征在于,所述步骤S1中,初始状态下所述组合运算单元针对定点计算和浮点计算所分配的带宽是相等的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710667610.0A CN107688471B (zh) | 2017-08-07 | 2017-08-07 | 一种动态调整数据流架构的资源带宽的计算系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710667610.0A CN107688471B (zh) | 2017-08-07 | 2017-08-07 | 一种动态调整数据流架构的资源带宽的计算系统及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107688471A true CN107688471A (zh) | 2018-02-13 |
CN107688471B CN107688471B (zh) | 2021-06-08 |
Family
ID=61153204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710667610.0A Active CN107688471B (zh) | 2017-08-07 | 2017-08-07 | 一种动态调整数据流架构的资源带宽的计算系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107688471B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109196937A (zh) * | 2018-08-16 | 2019-01-11 | 北京小米移动软件有限公司 | 带宽部分调整方法和带宽部分调整装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1716183A (zh) * | 2004-06-30 | 2006-01-04 | 中国科学院计算技术研究所 | 一种应用于同时多线程处理器的取指控制装置及其方法 |
CN101057223A (zh) * | 2004-10-15 | 2007-10-17 | 索尼计算机娱乐公司 | 支持多处理器系统中的多个配置的方法和设备 |
CN102566974A (zh) * | 2012-01-14 | 2012-07-11 | 哈尔滨工程大学 | 基于同时多线程的取指控制方法 |
CN106357559A (zh) * | 2016-09-21 | 2017-01-25 | 东软集团股份有限公司 | 带宽分配的方法及装置 |
-
2017
- 2017-08-07 CN CN201710667610.0A patent/CN107688471B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1716183A (zh) * | 2004-06-30 | 2006-01-04 | 中国科学院计算技术研究所 | 一种应用于同时多线程处理器的取指控制装置及其方法 |
CN101057223A (zh) * | 2004-10-15 | 2007-10-17 | 索尼计算机娱乐公司 | 支持多处理器系统中的多个配置的方法和设备 |
CN102566974A (zh) * | 2012-01-14 | 2012-07-11 | 哈尔滨工程大学 | 基于同时多线程的取指控制方法 |
CN106357559A (zh) * | 2016-09-21 | 2017-01-25 | 东软集团股份有限公司 | 带宽分配的方法及装置 |
Non-Patent Citations (1)
Title |
---|
YANNAN LIU等: "《Dealing with the Functional Units Starvation in SMT》", 《2012 IEEE 14TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND COMMUNICATION & 2012 IEEE 9TH INTERNATIONAL CONFERENCE ON EMBEDDED SOFTWARE AND SYSTEMS, LIVERPOOL》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109196937A (zh) * | 2018-08-16 | 2019-01-11 | 北京小米移动软件有限公司 | 带宽部分调整方法和带宽部分调整装置 |
CN109196937B (zh) * | 2018-08-16 | 2023-10-24 | 北京小米移动软件有限公司 | 带宽部分调整方法和带宽部分调整装置 |
US11937130B2 (en) | 2018-08-16 | 2024-03-19 | Beijing Xiaomi Mobile Software Co., Ltd. | Bandwidth part adjustment method and bandwidth part adjustment apparatus |
Also Published As
Publication number | Publication date |
---|---|
CN107688471B (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10515046B2 (en) | Processors, methods, and systems with a configurable spatial accelerator | |
KR101100470B1 (ko) | 멀티쓰레드 프로세서에서의 자동 저전력 모드 호출을 위한장치 및 방법 | |
US20190007332A1 (en) | Processors and methods with configurable network-based dataflow operator circuits | |
US7945764B2 (en) | Processing unit incorporating multirate execution unit | |
US20200310994A1 (en) | Apparatuses, methods, and systems for memory interface circuit allocation in a configurable spatial accelerator | |
US10853073B2 (en) | Apparatuses, methods, and systems for conditional operations in a configurable spatial accelerator | |
US9753726B2 (en) | Computer for amdahl-compliant algorithms like matrix inversion | |
GB2503438A (en) | Method and system for pipelining out of order instructions by combining short latency instructions to match long latency instructions | |
CN113326066B (zh) | 量子控制微体系结构、量子控制处理器及指令执行方法 | |
CN1983165A (zh) | 用于在simd结构中处理线程组的系统和方法 | |
Henry et al. | Circuits for wide-window superscalar processors | |
CN101021832A (zh) | 支持局部寄存和条件执行的64位浮点整数融合运算群 | |
Ainsworth et al. | On characterizing performance of the cell broadband engine element interconnect bus | |
CN107688471A (zh) | 一种动态调整数据流架构的资源带宽的计算系统及其方法 | |
CN105528250A (zh) | 多核多线程计算机系统确定性评测及控制方法 | |
Tumeo et al. | Designing next-generation massively multithreaded architectures for irregular applications | |
EP2731008A1 (en) | Resource contention in multiple cores | |
US11907118B2 (en) | Interleaved data conversion to change data formats | |
US20170330303A1 (en) | Analysis system and method for reducing the control flow divergence in the Graphics Processing Units (GPUs) | |
CN112379928A (zh) | 指令调度方法以及包括指令调度单元的处理器 | |
Carroll et al. | A queuing model for CPU functional unit and issue queue configuration | |
JP7287147B2 (ja) | 演算処理装置および演算処理装置の制御方法 | |
Moonen et al. | Cache aware mapping of streaming applications on a multiprocessor system-on-chip | |
Ade et al. | Implementing dsp applications on heterogeneous targets using minimal size data buffers | |
CN107273098A (zh) | 一种优化数据流架构数据传输延迟的方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100095 room 135, 1st floor, building 15, Chuangke Town, Wenquan Town, Haidian District, Beijing Applicant after: Beijing Zhongke Ruixin Technology Group Co.,Ltd. Address before: 1 wensong Road, Zhongguancun environmental protection park, Beiqing Road, Haidian District, Beijing 100095 Applicant before: SMARTCORE (BEIJING) Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |