CN106547707A - 阵列处理器中簇内存储并行访问局部优先交换电路 - Google Patents

阵列处理器中簇内存储并行访问局部优先交换电路 Download PDF

Info

Publication number
CN106547707A
CN106547707A CN201610837727.4A CN201610837727A CN106547707A CN 106547707 A CN106547707 A CN 106547707A CN 201610837727 A CN201610837727 A CN 201610837727A CN 106547707 A CN106547707 A CN 106547707A
Authority
CN
China
Prior art keywords
local
request
access
read
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610837727.4A
Other languages
English (en)
Other versions
CN106547707B (zh
Inventor
山蕊
蒋林
邓军勇
刘有耀
李雪婷
吴进
杨博文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Posts and Telecommunications
Original Assignee
Xian University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Posts and Telecommunications filed Critical Xian University of Posts and Telecommunications
Priority to CN201610837727.4A priority Critical patent/CN106547707B/zh
Publication of CN106547707A publication Critical patent/CN106547707A/zh
Application granted granted Critical
Publication of CN106547707B publication Critical patent/CN106547707B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1605Handling requests for interconnection or transfer for access to memory bus based on arbitration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/18Handling requests for interconnection or transfer for access to memory bus based on priority control

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

阵列处理器中簇内存储并行访问局部优先交换电路主要适用于阵列处理器中簇内分布式存储结构的数据并行访问功能,属于集成电路设计技术领域。目的在于通过多级交换结构及局部优先访问策略,降低存储访问延迟、提高访问带宽、提高资源利用率。本设计采用“局部交换+全局交换+局部交换”的三级交换结构,实现了4*4阵列处理器对16个分布式存储块的并行访问,提高了局部数据访问的并行性、降低了全局访问延迟、简化了存储结构。

Description

阵列处理器中簇内存储并行访问局部优先交换电路
技术领域
本发明属于集成电路设计技术领域,尤其涉及到阵列处理器中4*4处理器阵列簇内分布式存储结构的数据并行访问。
背景技术
随着集成电路技术的发展,仍然沿用传统的处理器性能提升方法:不断提高主频和开发指令集并行性,存在设计复杂度急剧增长和功耗过大的问题,并且主频的不断提高使得“存储墙”问题日益突出,为了适应集成电路工艺的发展,维持摩尔定律,单片上集成数十个、甚至上百个简单处理器核成为计算机体系结构发展的趋势。然而随着工艺的进步,片上集成的处理器核数越来越多,并行处理过程对数据传输带宽的要求也越来越高,“存储墙”问题变得越为突出,访问带宽受限、访问延迟过大是制约阵列处理器性能提升的主要瓶颈。
基于邻接互连的轻核阵列处理器,与众核处理器结构相比,具有执行操作级并行和数据级并行的特点,在进行算法实现时,尽可能的开发操作级并行和数据级并行,因此需要多个处理单元协同或者并行完成算法的运算。在处理一些算法时,例如图像算法中的滤波、卷积、直方图,视频算法中的运动估计、帧内预测,需要相邻的一块或者全部数据参与运算,这样就涉及到需要访问相邻的存储块。传统的NoC(Network on Chip)互连,一方面,数据访问延时较大,一般读/写延时高达数十个时钟周期,这与操作级或是数据级运算的1~2个周期相比,延时太大,导致难以满足应用的实时性需求;另一方面,轻核阵列处理器,单个处理单元的电路规模大概在2000个逻辑单元,而4通道的虚通道路由器占用资源大概是处理单元的六倍,导致通信资源远远大于计算资源,资源利用率低下。
簇内存储并行访问局部优先交换电路,充分考虑了数据级并行应用的存储访问特点,采用局部优先访问策略,并通过三级交换结构实现了4*4阵列处理器簇内16个处理单元对16个存储块的并行访问。
发明内容
本发明涉及到阵列处理器中簇内存储并行访问局部优先交换电路,目的在于通过多级交换结构及局部优先访问策略,降低存储访问延迟、提高访问带宽、提高资源利用率。
本发明实施例是这样实现的,簇内存储并行访问局部优先交换电路的功能是接收来自簇内16个处理单元的存储访问请求信号及相应的地址、数据信息,并根据地址信息进行判断,如果访问本地存储,则无冲突直接访问;如果访问2*2局部阵列存储块,通过局部交换单元完成数据访问;如果访问其它存储块,通过本地局部交换单元、全局交换单元、目的局部交换单元三级交换结构实现数据访问;其中本地存储指与发起访问请求的处理单元所对应的存储块;本地局部交换单元指发起访问请求的处理单元所在的局部交换单元;目的局部交换单元指被访问的存储块所在的局部交换单元。
所述的簇内存储并行访问局部优先交换电路,由16个判断模块、16个仲裁模块、4个局部交换单元、1个全局交换单元构成。
判断模块由6个“与”门、1个“或”门、1个比较器、1个触发器和1个二选一电路构成,主要功能是接收来自处理器的存储访问请求信号及相应的地址、数据信息,对当前请求类型进行译码,并且根据请求的地址信息,产生本地读/写请求信号及相应的地址、数据信息送给仲裁模块,或者产生外部读/写请求信号及相应的地址信息送给局部交换单元,同时根据接收到的外部请求响应信号和当前请求类型产生输出给处理器的请求响应信号。
仲裁模块由2个“与”门、2个“或”门、1个触发器、4个二选一电路和1个发散电路构成,主要功能是根据接收到的来自判断模块的本地读/写请求及来自局部交换单元的外部读/写请求,产生输出的本地存储块的读/写请求信号及相应的地址、数据信息,并将产生的响应信号送给局部交换单元;当本地写请求和外部写请求同时到达时,优先响应本地写请求,同样当本地读请求和外部读请求同时到达时,优先响应本地读请求。
局部交换单元由5个写仲裁单元、5个读仲裁单元和1个响应单元构成,主要功能是接收来自2*2局部阵列中4个判断模块和全局交换单元产生的访问外部存储块的读/写请求信号,并根据访问地址信息进行仲裁,将接收到的请求信号发送给对应的仲裁模块或者是全局交换单元,并产生相应的响应信号。
全局交换单元由4个写仲裁单元、4个读仲裁单元和1个响应单元构成,主要功能是接收来自4个局部交换单元产生的访问存储块的读/写请求信号,并根据访问地址信息进行仲裁,将接收到的请求信号发送给目的局部交换单元,并产生相应的响应信号。
本发明的特点是采用“局部交换+全局交换+局部交换”的三级交换结构,完成了4*4阵列处理器对16个分布式存储块的并行全访问,提高了局部数据访问的并行性、降低了全局访问延迟、简化了存储结构、降低了功耗。
附图说明
图1 簇内存储并行访问局部优先交换电路结构图;
图2 判断模块电路图;
图3 仲裁模块电路图;
图4 局部交换单元结构图;
图5 局部交换单元中写仲裁单元电路图;
图6局部交换单元中读仲裁单元电路图;
图7局部交换单元中响应单元电路图;
图8 全局交换单元结构图;
图9 全局交换单元中写仲裁单元电路图;
图10全局交换单元中读仲裁单元电路图;
图11全局交换单元中响应单元电路图。
具体实施方式
下面结合附图具体介绍本发明所采用的技术方案和工作原理。
电路端口说明:
信号名称 信号说明 含义
req OUT 来自处理器端的请求信号,高有效
r_w OUT 来自处理器端的读写操作指示信号,高电平表示读操作,低电平表示写操作
wr_data[31:0] OUT 来自处理器端的写入数据信息
addr[13:0] OUT 来自处理器端的读/写地址信息
ack IN 来自处理器端的读/写响应信号
rd_data[31:0] IN 来自处理器端的读出的数据信息
wr_ram_req OUT 发送给存储块的写请求,高有效
wr_ram_addr[9:0] OUT 发送给存储块的写地址信息
wr_ram_data[31:0] OUT 发送给存储块的写数据信息
rd_ram_req OUT 发送给存储块的读请求,高有效
rd_ram_addr[9:0] OUT 发送给存储块的读地址信息
rd_ram_data[31:0] IN 接收来自存储块的读数据信息
本发明适用于4*4阵列处理器对16个分布式存储块的并行访问,因此需要16组来自处理器端的读/写请求接口信息和16组访问分布式存储块的读/写信息,上表对1组读/写请求接口信息进行了详细的说明。
电路工作原理说明:
本发明的簇内存储并行访问局部优先交换电路的功能是接收来自簇内16个处理单元的存储访问读/写请求信号及相应的地址信息,并根据地址信息进行判断,如果访问本地存储,则无冲突直接访问;如果访问2*2局部阵列存储块,通过局部交换单元完成数据访问;如果访问其它存储块,通过本地局部交换单元、全局交换单元、目的局部交换单元三级交换结构实现数据访问。其中本地存储指与发起读/写请求的处理单元所对应的存储块。本地局部交换单元指发起读/写请求的处理单元所在的局部交换单元。目的局部交换单元指被访问的存储块所在的局部交换单元。详细设计过程如下:
参照图1,本发明的簇内存储并行访问局部优先交换电路,由判断模块、仲裁模块、局部交换单元、全局交换单元构成。
其中,判断模块由6个“与”门、1个“或”门、1个比较器、1个触发器和1个二选一电路构成,参见图2。当接收到req、r_w、和addr[13:0]信号后,首先将req信号和r_w信号进行“与”操作,判断当前的请求是否为写操作请求;同时将req信号和“取反”后的r_w信号进行“与”操作,判断当前请求是否为读操作请求。将addr[13:10]与本地地址(local id)进行比较,判断是否读/写本地存储块,并根据判断的结果,通过四个“与”门,分别产生写本地存储块请求信号wr_local_req、写其它存储块请求信号wr_other_req、读本地存储块请求信号rd_local_req、和读其它存储块请求信号rd_other_req。通过将本地存储块读/写请求信号wr_local_req、rd_local_req和来自读/写其它存储块产生的响应信号wr_other_ack、rd_other_ack进行“或”运算产生请求的响应信号ack。将rd_local_req经过触发器缓存一拍,并根据触发器的输出结果,控制二选一电路,将接收到的数据信号rd_local_data[31:0]或者rd_other_data[31:0]信号分配给需要输出的数据信号rd_data[31:0]。
仲裁模块由2个“与”门、2个“或”门、1个触发器、4个二选一电路和1个发散电路构成,参见图3。当接收到本地写请求信号wr_local_req和外部写请求信号wr_sw_req时,将这两个信号进行“或”运算,即两个请求信号任意一个有请求时,产生本地存储块写请求信号wr_ram_req。选择输出写地址信息wr_ram_addr[9:0]时,当本地写请求信号wr_local_req有效时,通过二选一电路,优先将本地写地址信息wr_local_addr[9:0]发送,否则将外部写地址信息wr_sw_addr[9:0]发送。选择输出写数据信息wr_ram_data[31:0]的过程与选择输出写地址信息wr_ram_addr[9:0]的过程一致。将本地写请求信号wr_local_req“取反”后,与外部写请求信号wr_sw_req进行“与”操作,产生外部写请求的响应信号wr_sw_ack,即有外部写请求时,在本地写请求无效时,才能响应外部写请求信号。产生本地存储块读请求信号rd_ram_req、输出读地址信息rd_ram_addr[9:0]、和外部读请求响应信号rd_sw_ack的过程与产生本地存储块写请求信号wr_ram_req、输出写地址信息wr_ram_addr[9:0]和外部写请求响应信号wr_sw_ack的过程一致。将rd_local_req经过触发器缓存一拍,并根据触发器的输出结果,控制发散电路,将接收到的本地存储读数据信号rd_ram_data[31:0]分配给输出数据信号rd_local_data[31:0]或者rd_sw_data[31:0]。
局部交换单元由5个写仲裁单元、5个读仲裁单元和1个响应单元构成,参见图4。写仲裁单元0用来接收来自判断模块1、2、3和全局交换单元送来的写请求以及相应的地址、数据信息,采用轮询算法进行仲裁,选择其一发送给仲裁模块0;写仲裁单元1用来接收来自判断模块0、2、3和全局交换单元送来的写请求以及相应的地址、数据信息,采用轮询算法进行仲裁,选择其一发送给仲裁模块1;以此类推,通过5个写仲裁单元完成对写请求的仲裁及地址、数据传送。同样,读仲裁单元0用来接收来自判断模块1、2、3和全局交换单元送来的读请求以及相应的地址,采用轮询算法进行仲裁,选择其一发送给仲裁模块0,同时接收来自仲裁模块1、2、3和全局交换单元送来的读数据,并根据上一时钟周期来自判断模块0读请求的相关仲裁结果,选择其一,发送给判断模块0;读仲裁单元1用来接收来自判断模块0、2、3和全局交换单元送来的读请求以及相应的地址,采用轮询算法进行仲裁,选择其一发送给仲裁模块1,同时接收来自仲裁模块0、2、3和全局交换单元送来的读数据,并根据上一时钟周期来自判断模块1读请求的相关仲裁结果,选择其一,发送给判断模块1;以此类推,通过5个读仲裁单元完成对读请求的仲裁及地址、数据传送。响应单元用于接收来自仲裁模块0、1、2、3和全局交换单元送来的读/写响应信号,根据5个写仲裁单元和5个读仲裁单元的仲裁结果,产生输出给判断模块0、1、2、3和全局交换单元的请求响应信号。
写仲裁单元由1个仲裁器、1个“或”门和两个多路选择器构成,参见图5。仲裁器用来接收输入的四个请求信号,并对请求信号根据轮询算法进行仲裁,选择其一有效,并通过“或”门,产生输出的写请求信号wr_sw_req。根据仲裁的结果,通过多路选择器,选择输入的四个地址之一输出给写地址信号wr_sw_addr[13:0]。输出写数据信号wr_sw_data[31:0]产生过程与写地址信号wr_sw_addr[13:0]产生过程一致。
读仲裁单元由1个仲裁器、1个“或”门、1个触发器和两个多路选择器构成,参见图6。仲裁器用来接收输入的四个请求信号,并对请求信号根据轮询算法进行仲裁,选择其一有效,并通过“或”门,产生输出的写请求信号rd_sw_req。根据仲裁的结果,通过多路选择器,选择输入的四个地址之一输出给读地址信号rd_sw_addr[13:0]。根据接收到的来自其它四个读仲裁单元缓存一拍的仲裁结果,通过多路选择器,选择输入的四个数据信息之一输出给读数据信号rd_oth_data[31:0]。触发器用来缓存本次仲裁结果,用于其它四个仲裁单元对读取数据的选择。
响应单元由10个译码器和10个“或”门构成,参见图7。5个译码器根据接收到的来自5个写仲裁单元的仲裁结果,将接收到的来自仲裁模块0、1、2、3和全局交换单元的写响应信号进行译码,并将译码的结果进行组合后,通过5个“或”门,分别产生输出给判断模块0、1、2、3和全局交换单元的写响应信号。例如,译码器0产生的译码4位译码结果,依次送到“或”门1、2、3、4;同样译码器1产生的译码4位译码结果,依次送到“或”门0、2、3、4;以此类推。输出给判断模块0、1、2、3和全局交换单元的读响应信号产生过程与输出给判断模块0、1、2、3和全局交换单元的写响应信号产生过程一致。
全局交换单元由4个写仲裁单元、4个读仲裁单元和1个响应单元构成,参见图8。写仲裁单元0用来接收来自局部交换单元1、2、3的写请求以及相应的地址、数据信息,采用轮询算法进行仲裁,选择其一发送给局部交换单元0;写仲裁单元1用来接收来自局部交换单元0、2、3送来的写请求以及相应的地址、数据信息,采用轮询算法进行仲裁,选择其一发送给局部交换单元1;以此类推,通过4个写仲裁单元完成对写请求的仲裁及地址、数据传送。同样,读仲裁单元0用来接收来自局部交换单元1、2、3的读请求以及相应的地址,采用轮询算法进行仲裁,选择其一发送给局部交换单元0,同时接收来自局部交换单元1、2、3送来的读数据,并根据上一时钟周期来自局部交换单元0读请求的相关仲裁结果,选择其一,发送给局部交换单元0;读仲裁单元1用来接收来自局部交换单元0、2、3的读请求以及相应的地址,采用轮询算法进行仲裁,选择其一发送给局部交换单元1,同时接收来自局部交换单元0、2、3送来的读数据,并根据上一时钟周期来自局部交换单元1读请求的相关仲裁结果,选择其一,发送给局部交换单元1;以此类推,通过4个读仲裁单元完成对读请求的仲裁及地址、数据传送。响应单元用于接收来自局部交换单元0、1、2、3的读/写响应信号,根据4个写仲裁单元和4个读仲裁单元的仲裁结果,产生输出给局部交换单元0、1、2、3读/写请求的响应信号。写仲裁单元、读仲裁单元和响应单元的结构与局部交换单元中的结构类似,具体结构分别参见图9、图10、图11。
电路应用效果:
本发明已经在“三维视频处理系统芯片动态可重构可编程体系结构研究”项目中加以采用,经过了FPGA开发的实际测试,测试结果表明该设计电路的功能完全正确,各项功能及性能指标均符合要求,实现了发明的目的。

Claims (2)

1.一种簇内存储并行访问局部优先交换电路,由16个判断模块、16个仲裁模块、4个局部交换单元、1个全局交换单元构成,其特征在于:
判断模块接收来自处理器的存储访问请求信号及相应的地址、数据信息,对当前请求类型进行译码,并且根据请求的地址信息,产生本地读/写请求信号及相应的地址、数据信息送给仲裁模块,或者产生外部读/写请求信号及相应的地址信息送给局部交换单元,同时根据接收到的外部请求响应信号和当前请求类型产生输出给处理器的请求响应信号;
仲裁模块根据接收到的来自判断模块的本地读/写请求及来自局部交换单元的外部读/写请求,产生输出到本地存储块的读/写请求信号及相应的地址、数据信息,并将产生的响应信号送给局部交换单元;当本地写请求和外部写请求同时到达时,优先响应本地写请求,同样当本地读请求和外部读请求同时到达时,优先响应本地读请求;
局部交换单元接收来自2*2局部阵列中4个判断模块和全局交换单元产生的访问存储块的读/写请求信号及相应的地址、数据信息,并根据访问地址信息按照轮询算法进行仲裁,将接收到的请求信号及相关地址、数据信息发送给目的仲裁模块或者全局交换单元,并产生相应的响应信号;
全局交换单元接收来自4个局部交换单元产生的访问存储块的读/写请求信号,并根据访问地址信息进行仲裁,将接收到的请求信号发送给目的局部交换单元,并产生相应的响应信号。
2.如权利要求1所述的簇内存储并行访问局部优先交换电路,其特征在于:能够接收来自簇内16个处理单元的存储访问请求信号及相应的地址、数据信息,并根据地址信息进行判断,如果访问本地存储,则无冲突直接访问;如果访问2*2局部阵列存储块,通过局部交换单元完成数据访问;如果访问其它存储块,通过本地局部交换单元、全局交换单元、目的局部交换单元三级交换结构实现数据访问;其中本地存储指与发起访问请求的处理单元所对应的存储块;本地局部交换单元指发起访问请求的处理单元所在的局部交换单元;目的局部交换单元指被访问的存储块所在的局部交换单元。
CN201610837727.4A 2016-09-21 2016-09-21 阵列处理器中簇内存储并行访问局部优先交换电路 Active CN106547707B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610837727.4A CN106547707B (zh) 2016-09-21 2016-09-21 阵列处理器中簇内存储并行访问局部优先交换电路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610837727.4A CN106547707B (zh) 2016-09-21 2016-09-21 阵列处理器中簇内存储并行访问局部优先交换电路

Publications (2)

Publication Number Publication Date
CN106547707A true CN106547707A (zh) 2017-03-29
CN106547707B CN106547707B (zh) 2019-03-05

Family

ID=58367928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610837727.4A Active CN106547707B (zh) 2016-09-21 2016-09-21 阵列处理器中簇内存储并行访问局部优先交换电路

Country Status (1)

Country Link
CN (1) CN106547707B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108429938A (zh) * 2018-01-31 2018-08-21 西安科技大学 可重构阵列处理器中簇间通信光互连网络
CN109118422A (zh) * 2018-07-10 2019-01-01 西安科技大学 一种嵌入式移动图形处理器的纹理Cache及处理方法
CN113222115A (zh) * 2021-04-30 2021-08-06 西安邮电大学 面向卷积神经网络的共享缓存阵列

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409103A (zh) * 2008-11-13 2009-04-15 戴葵 基于计算型存储器的加速装置
US20090106569A1 (en) * 2007-10-19 2009-04-23 Samsung Electronics Co., Ltd. Apparatus and method for controlling voltage and frequency in network on chip
US20110093854A1 (en) * 2007-12-14 2011-04-21 Commissariat A L'energie Atomique Et Aux Energies Alternatives System comprising a plurality of processing units making it possible to execute tasks in parallel, by mixing the mode of execution of control type and the mode of execution of data flow type
CN103377154A (zh) * 2012-04-25 2013-10-30 无锡江南计算技术研究所 存储器的访存控制装置及方法、处理器及北桥芯片

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106569A1 (en) * 2007-10-19 2009-04-23 Samsung Electronics Co., Ltd. Apparatus and method for controlling voltage and frequency in network on chip
US20110093854A1 (en) * 2007-12-14 2011-04-21 Commissariat A L'energie Atomique Et Aux Energies Alternatives System comprising a plurality of processing units making it possible to execute tasks in parallel, by mixing the mode of execution of control type and the mode of execution of data flow type
CN101409103A (zh) * 2008-11-13 2009-04-15 戴葵 基于计算型存储器的加速装置
CN103377154A (zh) * 2012-04-25 2013-10-30 无锡江南计算技术研究所 存储器的访存控制装置及方法、处理器及北桥芯片

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋林 等: "基于SystemC的可重构阵列处理器模型", 《西安邮电大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108429938A (zh) * 2018-01-31 2018-08-21 西安科技大学 可重构阵列处理器中簇间通信光互连网络
CN108429938B (zh) * 2018-01-31 2024-01-23 西安科技大学 可重构阵列处理器中簇间通信光互连网络
CN109118422A (zh) * 2018-07-10 2019-01-01 西安科技大学 一种嵌入式移动图形处理器的纹理Cache及处理方法
CN109118422B (zh) * 2018-07-10 2023-05-05 西安科技大学 一种嵌入式移动图形处理器的纹理Cache及处理方法
CN113222115A (zh) * 2021-04-30 2021-08-06 西安邮电大学 面向卷积神经网络的共享缓存阵列
CN113222115B (zh) * 2021-04-30 2024-03-01 西安邮电大学 面向卷积神经网络的共享缓存阵列

Also Published As

Publication number Publication date
CN106547707B (zh) 2019-03-05

Similar Documents

Publication Publication Date Title
US7469308B2 (en) Hierarchical bus structure and memory access protocol for multiprocessor systems
WO2021207919A1 (zh) 控制器、存储器件访问系统、电子设备和数据传输方法
CN101841420B (zh) 面向片上网络的低延迟路由器结构
CN104699631A (zh) Gpdsp中多层次协同与共享的存储装置和访存方法
CN101069391A (zh) 流式存储控制器
JPH02263260A (ja) メモリアクセススイッチネットワーク
JP2002508099A (ja) 異なるデータ・レートで動作するネットワーク・ポートに関して、共用メモリへのアクセスを調停する方法および装置
US9122802B2 (en) Interconnect, bus system with interconnect and bus system operating method
CN105553887B (zh) 用于管芯上互连的体系结构
CN108279927A (zh) 可调整指令优先级的多通道指令控制方法及系统、控制器
CN105183662A (zh) 一种无cache一致性协议的分布式共享片上存储架构
CN106547707A (zh) 阵列处理器中簇内存储并行访问局部优先交换电路
TWI470437B (zh) 擷取串列輸入資料的裝置及方法
CN106294239A (zh) 一种外围总线apb总线桥
EP2646925A1 (en) Partitioning of memory device for multi-client computing system
US9335934B2 (en) Shared memory controller and method of using same
CN114121055A (zh) 内存互连架构系统和方法
CN103425434B (zh) 一种多通道读/写ram的电路和方法
CN111079908B (zh) 片上网络数据处理方法、存储介质、计算机设备和装置
CN111611180B (zh) 一种支持多协议的动态共享缓冲区
CN112882986A (zh) 一种带有超节点以及超节点控制器的众核处理器
CN117215989A (zh) 一种异构加速设备、系统、方法、装置及存储介质
CN105824769B (zh) 一种可配置的动态时间片轮转调度方法
CN103905339A (zh) 电脑仲裁系统、其带宽分配设备以及方法
CN112463668B (zh) 一种基于stt-mram的多通道高速数据访存结构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant