CN101710311B - 一种非对称多元资源节点体系结构 - Google Patents
一种非对称多元资源节点体系结构 Download PDFInfo
- Publication number
- CN101710311B CN101710311B CN2009102659008A CN200910265900A CN101710311B CN 101710311 B CN101710311 B CN 101710311B CN 2009102659008 A CN2009102659008 A CN 2009102659008A CN 200910265900 A CN200910265900 A CN 200910265900A CN 101710311 B CN101710311 B CN 101710311B
- Authority
- CN
- China
- Prior art keywords
- module
- resource node
- bus
- resource
- sheet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
本发明涉及片上系统体系结构,具体是一种采用非对称片内单向串行只写总线互联的非对称多元资源节点体系结构。解决了随着片上处理器节点的处理器数目越来越多带来的总线结构扩展性差、以及处理器节点间高速互联、并行访问等片上通信的瓶颈问题。一种非对称多元资源节点体系结构包括一个主资源节点、一条由主资源节点独占的片内单向串行只写总线、至少两个从资源节点、至少一条由从资源节点共享或独占的片内单向串行只写总线、以及一个总线仲裁切换及数据转发单元模块。本发明解决了随着片上处理器节点的处理器数目越来越多带来的总线结构扩展性差、以及处理器节点间高速互联、并行访问等片上通信的瓶颈问题。
Description
技术领域
本发明涉及片上系统体系结构,具体是一种采用非对称片内单向串行只写总线互联的非对称多元资源节点体系结构。
背景技术
随着半导体工艺技术发展进入纳米阶段,在单一芯片中集成上亿晶体管已经成为现实,据2007国际半导体技术路线图(ITRS)预测,到2013年,单个芯片上的晶体管数目将达到44亿个。这些技术的发展驱使IC设计者必须将越来越复杂的功能集成到单硅片上,当今业界正在蕴酿着亿亿次计算能力的高性能计算机。为了克服由于无限制提升处理器时钟频率带来的包括功耗在内的一系列问题,高性能计算机普遍采用了网络互连多处理器节点,同时采用多核架构作为处理器节点解决方案。现有的处理器节点普遍采用对称多处理器(SMP)结构,例如IBM公司的千万亿次计算机系统在一个处理器节点上容纳了8个处理器(CPU),但是当进一步增加处理器节点的处理器(CPU)数目时,遇到了前所未有的困难,即由于总线随着处理器(CPU)数目的增加而急剧膨胀,带来总线结构扩展性差的问题、以及处理器节点间高速互联、并行访问等片上通信的瓶颈问题,于是人们开始研究探索新的总线结构。
发明内容
本发明为了解决随着片上处理器节点的处理器数目越来越多带来的总线结构扩展性差、以及处理器节点间高速互联、并行访问等片上通信的瓶颈问题,提供了一种采用非对称片内单向串行只写总线(One-way Chip Serial Bus)互联的非对称多元资源节点体系结构。
本发明是采用如下技术方案实现的:一种非对称多元资源节点体系结构,包括一个主资源节点、一条由主资源节点独占的片内单向串行只写总线、至少两个从资源节点、至少一条由从资源节点共享或独占的片内单向串行只写总线、以及一个总线仲裁切换及数据转发单元模块;主资源节点由主资源节点模块(Master Resource Node)和与主资源节点模块相连的主资源网络接口模块(Master Resource Network Interface)组成,从资源节点由从资源节点模块(Slave Resource Node)和与从资源节点模块相连的从资源网络接口模块(Slave Resource Network Interface)组成;其中,主资源网络接口模块的输出端与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输入端均与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输出端均通过各条由从资源节点共享或独占的片内单向串行只写总线以及总线仲裁切换及数据转发单元模块与主资源网络接口模块的输入端相连;所述片内单向串行只写总线、总线仲裁切换及数据转发单元模块均为本领域技术人员通过现有工艺容易实现的结构;所述主资源节点模块、主资源网络接口模块、从资源节点模块、从资源网络接口模块均为本领域技术人员容易实现的结构,可以有多种结构变形。
工作时,主资源节点模块通过主资源节点独占的片内单向串行只写总线向各个从资源节点模块发送信息;各个从资源节点模块通过由从资源节点共享或独占的片内单向串行只写总线向主资源节点模块发送信息;具体工作过程如下:各个从资源节点模块所发送的信息通过由从资源节点共享或独占的片内单向串行只写总线进入总线仲裁及数据转发单元模块,然后由总线仲裁及数据转发单元模块通过片内单向串行只写总线转发至主资源节点模块;在此过程中,总线仲裁及数据转发单元模块采用时分复用访问(TDMA)机制和轮询服务策略判决和切换各条由从资源节点共享或独占的片内单向串行只写总线在各个从资源节点模块之间的分配,并完成数据转发。与采用对称多处理器结构的现有处理器节点相比,本发明采用片内单向串行只写总线互联多个相同或不同种类的资源节点而形成非对称多元资源节点体系结构,采用此种结构能够极大地提高单硅片的有效资源占用率,由此彻底解决了随着片上处理器节点的处理器数目越来越多带来的总线结构扩展性差、以及处理器节点间高速互联、并行访问等片上通信的瓶颈问题。
本发明通过采用片内单向串行只写总线互联多个资源节点而形成非对称多元资源节点体系结构,极大地提高了单硅片的有效资源占用率,并有效解决了随着片上处理器节点的处理器数目越来越多带来的总线结构扩展性差、以及处理器节点间高速互联、并行访问等片上通信的瓶颈问题,适用于嵌入式高性能计算机设计领域。
附图说明
图1是本发明的一种结构示意图。
图2是本发明的另一种结构示意图。
图3是本发明的主资源网络接口或从资源网络接口模块的结构示意图。
图中:K(K为正整数,且K≥2)为从资源节点的数目;P(P为正整数,且1≤P≤K)为由从资源节点共享或独占的片内单向串行只写总线的数目;OCSB为片内单向串行只写总线;MR为主资源节点模块;MRNI为主资源网络接口模块;SR1,SR2,SR3,SR4,SR5,SR6,……,SRK均为从资源节点模块;SRNI1,SRNI2,SRNI3,SRNI4,SRNI5,SRNI6,……,SRNIK均为从资源网络接口模块。
具体实施方式
实施例一
一种非对称多元资源节点体系结构,包括一个主资源节点、一条由主资源节点独占的片内单向串行只写总线、至少两个从资源节点、至少一条由从资源节点共享或独占的片内单向串行只写总线、以及一个总线仲裁切换及数据转发单元模块;主资源节点由主资源节点模块和与主资源节点模块相连的主资源网络接口模块组成,从资源节点由从资源节点模块和与从资源节点模块相连的从资源网络接口模块组成;其中,主资源网络接口模块的输出端与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输入端均与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输出端均通过各条由从资源节点共享或独占的片内单向串行只写总线以及总线仲裁切换及数据转发单元模块与主资源网络接口模块的输入端相连;
所述主资源节点模块包括主处理器模块,主处理器模块通过主资源网络接口模块与由主资源节点独占的片内单向串行只写总线相连;所述从资源节点模块包括逻辑功能模块或物理设备模块,逻辑功能模块或物理设备模块通过从资源网络接口模块与由从资源节点共享或独占的片内单向串行只写总线相连;
如图3所示,所述主资源网络接口模块包括MPI加速器模块、协议转换模块、总线接口模块、寄存器组模块、发送模块、接收模块、数据帧收发缓冲区、以及设备接口;其中,发送模块、接收模块分别通过数据帧收发缓冲区与总线接口模块相连,寄存器组模块分别与总线接口模块、发送模块、接收模块相连,发送模块、接收模块分别通过MPI加速器模块、协议转换模块与设备接口相连;设备接口与主资源节点模块相连,总线接口模块与由主资源节点独占的片内单向串行只写总线相连;所述从资源网络接口模块的结构与主资源网络接口模块的结构一致;工作时,发送模块的功能包括:一、当接收到发送请求后,向总线仲裁切换及数据转发单元模块发出信道征用请求;二、接收到信道征用请求应答信号后,启动数据帧发送过程;三、发送过程中根据数据帧中帧长字段的值,控制数据帧的发送。接收模块的功能包括:一、根据数据帧收发缓冲区空闲空间的大小对接收到的数据有效信号做出响应;二、接收并缓存数据帧;三、接收数据帧的过程中记录该帧的帧长度及源地址。总线接口模块的功能是对从资源节点模块发出的异步静态随机访问存储器(ASRAM)时序进行响应;寄存器组模块的功能则包括数据帧的发送控制、广播帧的接收许可、数据帧发送及接收完成标志、接收数据帧的长度及源地址显示等。
在本实施例中,如图1所示,从资源节点的数目大于由从资源节点共享或独占的片内单向串行只写总线的数目,即P<K;工作时,由于从资源节点的数目大于由从资源节点共享或独占的片内单向串行只写总线的数目,即P<K,K个从资源节点对P条片内单向串行只写总线的共享和独占数目随P值的不同而变化,总线仲裁切换及数据转发单元模块的功能是确保各个从资源节点的等待时间最少,并保证各条由从资源节点共享或独占的片内单向串行只写总线的吞吐率最大。
具体实施时,主资源节点模块的主处理器模块采用RISC通用处理器(GPP)或数字信号处理器(DSP)或应用程序专用集成处理器(ASIP),从资源节点模块的逻辑功能模块或物理设备模块采用通用/专用协处理器或FPGA/ASIC或存储器阵列(如SDRAM、NOR/NAND-Flash、SD/MMC/CF卡和硬盘等)或DMA或MMU或硬件/固件化的应用模块或软件组件或通用/专用算法逻辑功能单元或片上外设或异构I/O接口(如串口、以太网接口和USB接口)等。
实施例二
一种非对称多元资源节点体系结构,包括一个主资源节点、一条由主资源节点独占的片内单向串行只写总线、至少两个从资源节点、至少一条由从资源节点共享或独占的片内单向串行只写总线、以及一个总线仲裁切换及数据转发单元模块;主资源节点由主资源节点模块和与主资源节点模块相连的主资源网络接口模块组成,从资源节点由从资源节点模块和与从资源节点模块相连的从资源网络接口模块组成;其中,主资源网络接口模块的输出端与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输入端均与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输出端均通过各条由从资源节点共享或独占的片内单向串行只写总线以及总线仲裁切换及数据转发单元模块与主资源网络接口模块的输入端相连;
所述主资源节点模块包括主处理器模块,主处理器模块通过主资源网络接口模块与由主资源节点独占的片内单向串行只写总线相连;所述从资源节点模块包括逻辑功能模块或物理设备模块,逻辑功能模块或物理设备模块通过从资源网络接口模块与由从资源节点共享或独占的片内单向串行只写总线相连;
如图3所示,所述主资源网络接口模块包括MPI加速器模块、协议转换模块、总线接口模块、寄存器组模块、发送模块、接收模块、数据帧收发缓冲区、以及设备接口;其中,发送模块、接收模块分别通过数据帧收发缓冲区与总线接口模块相连,寄存器组模块分别与总线接口模块、发送模块、接收模块相连,发送模块、接收模块分别通过MPI加速器模块、协议转换模块与设备接口相连;设备接口与主资源节点模块相连,总线接口模块与由主资源节点独占的片内单向串行只写总线相连;所述从资源网络接口模块的结构与主资源网络接口模块的结构一致;工作时,发送模块的功能包括:一、当接收到发送请求后,向总线仲裁切换及数据转发单元模块发出信道征用请求;二、接收到信道征用请求应答信号后,启动数据帧发送过程;三、发送过程中根据数据帧中帧长字段的值,控制数据帧的发送。接收模块的功能包括:一、根据数据帧收发缓冲区空闲空间的大小对接收到的数据有效信号做出响应;二、接收并缓存数据帧;三、接收数据帧的过程中记录该帧的帧长度及源地址。总线接口模块的功能是对从资源节点模块发出的异步静态随机访问存储器(ASRAM)时序进行响应;寄存器组模块的功能则包括数据帧的发送控制、广播帧的接收许可、数据帧发送及接收完成标志、接收数据帧的长度及源地址显示等。
在本实施例中,如图2所示,从资源节点的数目等于由从资源节点共享或独占的片内单向串行只写总线的数目,即P=K;工作时,由于从资源节点的数目等于由从资源节点共享或独占的片内单向串行只写总线的数目,即P=K,每个从资源节点均独占一条片内单向串行只写总线,总线仲裁切换及数据转发单元模块只起数据转发的作用。
具体实施时,主资源节点模块的主处理器模块采用RISC通用处理器(GPP)或数字信号处理器(DSP)或应用程序专用集成处理器(ASIP),从资源节点模块的逻辑功能模块或物理设备模块采用通用/专用协处理器或FPGA/ASIC或存储器阵列(如SDRAM、NOR/NAND-Flash、SD/MMC/CF卡和硬盘等)或DMA或MMU或硬件/固件化的应用模块或软件组件或存储器或通用/专用算法逻辑功能单元或片上外设或异构I/O接口(如串口、以太网接口和USB接口)等。
Claims (7)
1.一种非对称多元资源节点体系结构,其特征在于:包括一个主资源节点、一条由主资源节点独占的片内单向串行只写总线、至少两个从资源节点、至少一条由从资源节点共享或独占的片内单向串行只写总线、以及一个总线仲裁切换及数据转发单元模块;主资源节点由主资源节点模块和与主资源节点模块相连的主资源网络接口模块组成,从资源节点由从资源节点模块和与从资源节点模块相连的从资源网络接口模块组成;其中,主资源网络接口模块的输出端与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输入端均与由主资源节点独占的片内单向串行只写总线相连,各个从资源网络接口模块的输出端均通过各条由从资源节点共享或独占的片内单向串行只写总线以及总线仲裁切换及数据转发单元模块与主资源网络接口模块的输入端相连;各个从资源节点模块所发送的信息通过由从资源节点共享或独占的片内单向串行只写总线进入总线仲裁切换及数据转发单元模块,然后由总线仲裁切换及数据转发单元模块通过片内单向串行只写总线转发至主资源节点模块;在此过程中,总线仲裁切换及数据转发单元模块采用时分复用访问机制和轮询服务策略判决和切换各条由从资源节点共享或独占的片内单向串行只写总线在各个从资源节点模块之间的分配,并完成数据转发。
2.根据权利要求1所述的一种非对称多元资源节点体系结构,其特征在于:所述主资源节点模块包括主处理器模块,主处理器模块通过主资源网络接口模块与由主资源节点独占的片内单向串行只写总线相连。
3.根据权利要求1或2所述的一种非对称多元资源节点体系结构,其特征在于:所述从资源节点模块包括逻辑功能模块或物理设备模块,逻辑功能模 块或物理设备模块通过从资源网络接口模块与由从资源节点共享或独占的片内单向串行只写总线相连。
4.根据权利要求1或2所述的一种非对称多元资源节点体系结构,其特征在于:所述主资源网络接口模块包括MPI加速器模块、协议转换模块、总线接口模块、寄存器组模块、发送模块、接收模块、数据帧收发缓冲区、以及设备接口;其中,发送模块、接收模块分别通过数据帧收发缓冲区与总线接口模块相连,寄存器组模块分别与总线接口模块、发送模块、接收模块相连,发送模块、接收模块分别通过MPI加速器模块、协议转换模块与设备接口相连;设备接口与主资源节点模块相连,总线接口模块与由主资源节点独占的片内单向串行只写总线相连;所述从资源网络接口模块的结构与主资源网络接口模块的结构一致。
5.根据权利要求3所述的一种非对称多元资源节点体系结构,其特征在于:所述主资源网络接口模块包括MPI加速器模块、协议转换模块、总线接口模块、寄存器组模块、发送模块、接收模块、数据帧收发缓冲区、以及设备接口;其中,发送模块、接收模块分别通过数据帧收发缓冲区与总线接口模块相连,寄存器组模块分别与总线接口模块、发送模块、接收模块相连,发送模块、接收模块分别通过MPI加速器模块、协议转换模块与设备接口相连;设备接口与主资源节点模块相连,总线接口模块与由主资源节点独占的片内单向串行只写总线相连;所述从资源网络接口模块的结构与主资源网络接口模块的结构一致。
6.根据权利要求1或2所述的一种非对称多元资源节点体系结构,其特征在于:从资源节点的数目大于由从资源节点共享或独占的片内单向串行只写 总线的数目。
7.根据权利要求1或2所述的一种非对称多元资源节点体系结构,其特征在于:从资源节点的数目等于由从资源节点所共享或独占的片内单向串行只写总线的数目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102659008A CN101710311B (zh) | 2009-12-30 | 2009-12-30 | 一种非对称多元资源节点体系结构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102659008A CN101710311B (zh) | 2009-12-30 | 2009-12-30 | 一种非对称多元资源节点体系结构 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101710311A CN101710311A (zh) | 2010-05-19 |
CN101710311B true CN101710311B (zh) | 2011-11-30 |
Family
ID=42403103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102659008A Expired - Fee Related CN101710311B (zh) | 2009-12-30 | 2009-12-30 | 一种非对称多元资源节点体系结构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101710311B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446154B (zh) * | 2010-10-13 | 2014-04-02 | 英业达股份有限公司 | 共用基板管理控制器的服务器系统及方法 |
CN102158380B (zh) * | 2011-02-21 | 2013-05-08 | 南京大学 | 一种基于统计时分复用技术的多簇片上网络架构 |
CN103136162B (zh) * | 2013-03-07 | 2015-07-29 | 太原理工大学 | Asic片内云架构及基于该架构的设计方法 |
CN103412849A (zh) * | 2013-08-02 | 2013-11-27 | 桂林电子科技大学 | ARM处理器的NoC资源网络接口及其驱动方法 |
WO2020087248A1 (zh) * | 2018-10-30 | 2020-05-07 | 北京比特大陆科技有限公司 | 多核芯片数据总线布线结构和数据发送的方法 |
CN116074179B (zh) * | 2023-03-06 | 2023-07-14 | 鹏城实验室 | 基于cpu-npu协同的高扩展节点系统及训练方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1520109A (zh) * | 2003-01-29 | 2004-08-11 | ���ǵ�����ʽ���� | 利用环形atm系统中节点组的保护交换设备和方法 |
CN101150518A (zh) * | 2007-10-29 | 2008-03-26 | 北京科技大学 | 一种单向链路环境下建立路由的方法 |
-
2009
- 2009-12-30 CN CN2009102659008A patent/CN101710311B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1520109A (zh) * | 2003-01-29 | 2004-08-11 | ���ǵ�����ʽ���� | 利用环形atm系统中节点组的保护交换设备和方法 |
CN101150518A (zh) * | 2007-10-29 | 2008-03-26 | 北京科技大学 | 一种单向链路环境下建立路由的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101710311A (zh) | 2010-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10027433B2 (en) | Multiple clock domains in NoC | |
CN101710311B (zh) | 一种非对称多元资源节点体系结构 | |
US7305510B2 (en) | Multiple master buses and slave buses transmitting simultaneously | |
US7925803B2 (en) | Method and systems for mesochronous communications in multiple clock domains and corresponding computer program product | |
CN105068951B (zh) | 一种具有非等时传输结构的片上系统总线 | |
CN102929836B (zh) | 一种航天专用asic芯片系统 | |
CN105740195B (zh) | Or链式总线的增强数据总线反转编码的方法和装置 | |
Shrivastav et al. | Performance comparison of AMBA bus-based system-on-chip communication protocol | |
CN105247817A (zh) | 用于源同步电路交换片上网络(NoC)的方法、装置和系统 | |
EP3235195B1 (en) | Spatially divided circuit-switched channels for a network-on-chip | |
US7298758B2 (en) | Method and system for optimizing UTOPIA CLAV polling arbitration | |
JP2008532169A (ja) | 共有されたリソースを調停するための電子装置及び方法 | |
CN101377691B (zh) | 一种apb总线跨时钟域访问的电路及方法 | |
CN107111584B (zh) | 到片上网络的接口的高带宽核 | |
CN118227527A (zh) | Sdram控制器子系统的源同步分区 | |
TWI338231B (en) | A single chip protocol converter | |
US20100315134A1 (en) | Systems and methods for multi-lane communication busses | |
KR20160046883A (ko) | 듀얼 전압 데이터 전송을 이용한 메시 성능 향상 | |
JP2009282917A (ja) | サーバ間通信機構及びコンピュータシステム | |
CN105718349B (zh) | 跨管芯接口监听或全局观察消息排序 | |
EP3173895B1 (en) | Clock tree implementation method, system-on-chip and computer storage medium | |
Nyathi et al. | Multiple clock domain synchronization for network on chip architectures | |
CN114579507B (zh) | 一种多核架构下实现快速计算与快速同步的方法 | |
US9170768B2 (en) | Managing fast to slow links in a bus fabric | |
KR100651888B1 (ko) | 비동기 인터페이스 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111130 Termination date: 20141230 |
|
EXPY | Termination of patent right or utility model |