CN105487994B - 可扩展的2.5d接口架构 - Google Patents

可扩展的2.5d接口架构 Download PDF

Info

Publication number
CN105487994B
CN105487994B CN201510617804.0A CN201510617804A CN105487994B CN 105487994 B CN105487994 B CN 105487994B CN 201510617804 A CN201510617804 A CN 201510617804A CN 105487994 B CN105487994 B CN 105487994B
Authority
CN
China
Prior art keywords
input
module
output
clock
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510617804.0A
Other languages
English (en)
Other versions
CN105487994A (zh
Inventor
郑志学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Altera Corp
Original Assignee
Altera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Altera Corp filed Critical Altera Corp
Priority to CN201811118500.XA priority Critical patent/CN109412577B/zh
Publication of CN105487994A publication Critical patent/CN105487994A/zh
Application granted granted Critical
Publication of CN105487994B publication Critical patent/CN105487994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/382Information transfer, e.g. on bus using universal interface adapter
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K19/00Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
    • H03K19/0175Coupling arrangements; Interface arrangements
    • H03K19/0185Coupling arrangements; Interface arrangements using field effect transistors only
    • H03K19/018507Interface arrangements
    • H03K19/01855Interface arrangements synchronous, i.e. using clock signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/34Circuit design for reconfigurable circuits, e.g. field programmable gate arrays [FPGA] or programmable logic devices [PLD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/34Circuit design for reconfigurable circuits, e.g. field programmable gate arrays [FPGA] or programmable logic devices [PLD]
    • G06F30/347Physical level, e.g. placement or routing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/39Circuit design at the physical level

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Dram (AREA)
  • Logic Circuits (AREA)

Abstract

本公开涉及用于接口块的系统和方法。接口块包括沿着接口块分布的输入/输出模块和散置在输入/输出模块内的中间栈。输入/输出模块包括至少一个数据模块和至少一个命令模块。输入/输出模块中的至少一个由毗邻的一对信道共享。输入/输出模块中的每个被配置成经由硅中介或等同物与存储器件对接。中间栈模块经由可编程逻辑电路与输入/输出模块通信。中间栈模块可以包括独立的时钟象限。各时钟象限被配置成在不同相位处操作,其中各相位被对准到相应的核心时钟。

Description

可扩展的2.5D接口架构
相关申请的交叉引用
本申请要求2014年10月2日提交的同在申请中的、共同受让的美国临时专利申请号62/058,933的优先权,该申请的全部内容通过引用明确地合并于此。
技术领域
该公开总体涉及用于在多个存储器件之间建立通信的系统互连架构的领域。
背景技术
半导体行业正逐步走向2.5D和3D架构以解决硅可扩展性。2.5D配置是指经由相同封装上的硅中介或等同物连接两个或多个硅片。各种硅片典型地经由称作微凸块的小凸块连接。2.5D接口架构是行业中新的但越来越从很多专用集成电路(ASIC)、专用标准产品(ASSP)和现场可编程门阵列(FPGA)的开发者获得动力和支持、尤其是在用于对接至以解决时延和带宽关注为目标的存储器件的应用中。然而,当前的2.5D架构仅能够对接至单一2.5D器件并且不以用于通用2.5D器件的可扩展接口作为目标。
发明内容
该发明涉及可扩展2.5D接口的架构,具体为输入/输出(I/O)缓冲器的分区、横跨允许相同接口块与无数2.5D存储器件通信以及允许其他集成电路器件(例如,ASIC、ASSP和FPGA)经由硅中介或桥与类似2.5D接口通信的整个架构的控制以及功能。
该接口架构使接口的有用性延伸超过只对接至2.5D存储器件。公开包括可以被复制以匹配2.5D接口的宽度、接口I/O缓冲器的分区及其控制的有效分组以允许接口至变化的协议标准的最大灵活性的小型可编程I/O模块的限定。最终得到的架构允许单一个硬件结构简单地通过将其与利用诸如FPGA构造等的可编程逻辑构造实施的合适的软件逻辑配对物联接而与无数存储器件接口。架构的延伸还允许相同的硬件接口缩放以与外部ASIC、ASSP或其他硅片接口以解决很多其他应用领域问题而不必重新制造用于接口架构的硬件。
现有的2.5D接口架构典型地被开发用于经由专有的2.5D接口协议对接至专有的静态随机存取内存(SRAM)芯片。接口架构经由简单I/O接口使双倍数据速率(DDR)信令适应于与由主机驱动的时钟同步。由于由互连传播引入的时延可以降低接口上可得到的采用窗口,所以接口架构的同步DDR信令可能会限制可由架构实现的最大频率。在一些实施例中,同步DDR架构勉强能够实现500MHz操作,而现实操作很可能在甚至更低的频率。此外,接口架构仅可以提供用于对接至专有SRAM内存芯片。接口不可扩展至行业上开发的通信协议,从而将可得到的子代器件的选择锁定为对接至专有选项。
各种2.5D接口架构的分区也可以是刚性的并且不允许用于各种新兴2.5D接口标准的支持的可配置性。例如,四倍数据率宽输入输出(QDR WIO)SRAM是一种电超集但不是高带宽内存(HBM)DRAM的协议子集。现有的行业2.5D接口架构未分区成适应于这些不同的标准,并且不可以允许相同的ASIC/ASSP硅对接至不同的存储器件。
于是,描述了涉及可扩展2.5D接口的架构的系统和方法。在一些方面中,所公开的接口架构包括接口块。输入/输出模块沿着接口块分布。中间栈模块散置在多个输入/输出模块内。输入/输出模块包括至少一个数据模块和至少一个命令模块。多个输入/输出模块中的至少一个由毗邻的一对信道共享。多个输入/输出模块中的每个被配置成经由硅中介、硅桥或等同物中的一个与存储器件对接。输入/输出模块中的每个可以包括48-I/O模块。中间栈模块经由可编程逻辑电路与输入/输出模块通信。
在一些实施例中,中间栈包括独立的时钟象限。各时钟象限被配置成以不同相位操作。在一些实施例中,各相位对准至相应的核心时钟。在一些实施例中,每个相应的核心时钟对准至物理层时钟。
在一些实施例中,输入/输出模块中的每个包括:被映射至一组可编程单端输入/输出(PSIO)子模块中的一个的第一组引脚,和被映射至一组可编程差分/单端输入/输出(PDIO)子模块中的一个的第二组引脚。可以设置被分区使得第一时钟集可从PSIO子模块的第一半部重新分布至PSIO子模块的第二半部的时钟拓扑。
在一些实施例中,由毗邻的一对信道共享的输入/输出模块中的至少一个被分区成具有相同数量引脚的两个子模块。
在一些实施例中,输入/输出模块的数据模块包括被映射至输出选通引脚的PDIO子模块的第一子集和被映射至输入选通引脚的第二子集PDIO的子模块。输入/输出模块的命令模块可以包括被映射至PDIO子模块的差分时钟输出。
在一些实施例中,至少一个数据模块进一步包括被映射至PDIO子模块的第一子集的第一环形电路和被映射至PDIO子模块的第二子集的第二环形电路。第一环形电路被配置成使被映射至PSIO组的输出选通单元延迟。第一环形电路和第二环形电路可以包括延迟锁相环(DLL)电路和锁相环(PLL)电路。
在一些实施例中,各输入/输出模块经由包括了控制接口组和/或数据接口组的通用接口协议与所述可编程逻辑电路通信。控制接口组将地址、命令和/或控制信号发送至所述可编程逻辑电路。数据接口组将数据发送至可编程逻辑电路并且从可编程逻辑电路接收数据。
在一些方面中,这里所描述的系统和方法包括涉及可扩展的2.5D接口的架构以执行这里所描述的功能的方法。
应该注意的是,上面描述的系统和/或方法可以应用于其他系统、方法和/或设备或者依照其他系统、方法和/或设备使用。
附图说明
发明的以上和其他优点将在考虑到结合附图进行的以下详细描述时变得显而易见,在附图中同样的附图标记始终是指同样的部件,并且附图中:
图1是根据某些实施例的说明性接口块;
图2是根据某些实施例的包括了用于与32-信道QDR WIO SRAM对接的48-IO模块的说明性接口块;
图3是根据某些实施例的包括了用于与8-信道HBM DRAM对接的48-IO模块的说明性接口块;
图4是根据某些实施例的将48-IO模块连接至各个内存接口的说明性描绘;
图5是根据某些实施例的装配在微凸块阵列之上的48-IO模块的说明性描绘;
图6是根据某些实施例的48-IO模块微凸块映射的说明性描绘;
图7A和图7B(下文中统称为图7)描绘了根据某些实施例的具有分区的时钟拓扑的说明性48-IO模块;
图8A、图8B和图8C(在下文中统称为图8)描绘了根据某些实施例的用于接口块的说明性时钟网络拓扑;
图9A和图9B(下文中统称为图9)描绘了根据某些实施例的用于接口块的说明性时钟网络拓扑;
图10A和图10B(下文中统称为图10)描绘了根据某些实施例的用于被集成到可编程器件时钟网络内的接口块的说明性时钟网络拓扑;
图11A和图11B(下文中统称为图11)描绘了根据某些实施例的具有时钟域分区拓扑的说明性48-IO模块;
图12是根据某些实施例的PSIO的说明性逻辑代表;
图13是根据某些实施例的PSIO的说明性定时图;
图14A、图14B和图14C(下文中统称为图14)描绘了根据某些实施例的PDIO的说明性逻辑代表;
图15A和图15B(下文中统称为图15)描绘了根据某些实施例的PDIO的说明性定时图;
图16A和图16B(下文中统称为图16)描绘了根据某些实施例的包括了48-IO模块的接口块的说明性定时图;
图17A和图17B(下文中统称为图17)描绘了根据某些实施例的与QDR WIO SRAM一起工作的接口块的说明性定时图;
图18A和图18B(下文中统称为图18)描绘了根据某些实施例的与QDR WIO SRAM一起工作的接口块的另一说明性定时图;
图19A和图19B(下文中统称为图19)描绘了根据某些实施例的与QDR WIO SRAM一起工作的接口块的又另一说明性定时图;和
图20A和图20B(下文中统称为图20)描绘了根据某些实施例的与QDR WIO SRAM一起工作的接口块的又另一说明性定时图。
具体实施方式
该公开描述了2.5D接口架构。尽管描述的内容主要使用所公开的接口块作为2.5D内存架构解决方案(例如,支持QDR WIO SRAM和HBM DRAM两者),但决不限制所公开的接口块支持以任何2.5D配置或者在主芯片上或者在子代芯片上的任何2.5D接口,只要接口性质上源同步。
图1是根据某些实施例的说明性接口块。接口块100被以模块化方式组织并且包括48-IO模块104(包括边信道108)与被称作中间栈模块106的中间奇数模块的集合。分布带和物理层(PHY)逻辑区域102包括用于I/O校准和分段所需的综合控制逻辑。各48-IO模块104可以被配置成或者数据模块或者命令模块。命令模块可以仅占据48-IO模块的半部使得毗邻的信道可以物理上共享48-IO模块。这可以允许更好的引脚使用以及匹配内存接口标准的微凸块组织。需要一个以上的48-IO模块的组合以形成QDR WIO SRAM、HBM DRAM或另一合适存储器件的接口。图2和图3提供了形成这样的接口的说明性示例。所示出的尺寸是说明性的并且不限于针对接口块100的尺寸。图1中的说明性实施例使用了48-IO模块但公开不限于此。使用了48-IO模块的随后附图的说明性示例也并不限于此。说明性实施例可以替代使用另一适当类型的模块。48-IO模块是能够提供双源双向源同步信令能力的块。示例性48-IO模块包括:各具有20个PSIO缓冲器的两个PSIO组、四个PDIO、两个DLL和指针发生器。
图2示出根据某些实施例的用于与32-信道QDR WIO SRAM接口的说明性接口块。接口块200被以模块化方式组织并且包括48-IO模块204与中间栈模块206的集合。接口块200示出各种48-IO模块映射如何形成用于32-信道QDR WIO SRAM的内存接口。
图3示出根据某些实施例的用于与8-信道HBM DRAM接口的说明性接口块。接口块300也以模块化方式组织并且包括48-IO模块304与中间栈模块306的集合。接口块300还包括对于与8-信道HBM DRAM接口而言不需要的未使用的48-IO模块308的集。接口块300示出各种48-IO模块映射如何形成用于8-信道HBM DRAM的内存接口。
下面的表1详述了针对不同内存信道配置的各种模块要求。例如,接口块200需要配置为命令模块的16个模块和配置为数据模块的32个模块以与32-信道QDR WIO SRAM接口。在另一示例中,接口块200需要配置为命令模块的12个模块和配置为数据模块的24个模块以与24-信道QDR WIO SRAM接口。在又另一示例中,接口块300需要配置为命令模块的仅4个模块和配置为数据模块的32个模块以与8-信道HBM DRAM接口。
表1:用于内存信道配置的示例映射
图4是根据某些实施例的将48-IO模块映射至各个内存接口的说明性描绘400。各种48-IO模块402至各个内存接口的映射通常有利于如所示出的横跨接口的均匀长度布线。微凸块404与406之间的连接经由具有如所示出的均匀长度的硅桥408来建立。微凸块典型地允许在小型封装覆盖区上的增加的器件互连。均匀长度布线有助于较小的I/O缓冲器预驱动器/驱动器设计,因为组成部件必须驱动的范围是在彼此的小增量内。然而,某些信号、例如在中间栈内的信号当它们大多是非关键性信号、例如可测试性信号时可能不需要增量小。小增量允许I/O缓冲器如图5所示装配在微凸块阵列之上。
图5是根据某些实施例的装配在微凸块阵列之上的48-IO模块的说明性描绘500。该实施例中的微凸块阵列采用如QDR WIO SRAM和HBM DRAM规格中详述的且满足55μm的最小微凸块节距的面心矩形(FCR)图案。C4凸块代表参考时钟引脚和电源/接地凸块。尺寸是说明性的并且不限于针对微凸块的尺寸。48-IO模块502至各个内存的映射被布线为如图4所示横跨接口均匀长度的。微凸块504对应于图4中的微凸块404并且可以经由硅中介或等同物建立均匀长度布线。图5还示出PSIO缓冲器408、PDIO缓冲器510、PSIO微凸块522和PDIO微凸块524。中间栈506包括用于延迟锁相环(DLL)电路512、时钟网络/垂直布线514和锁相环(PLL)电路516的区域。图5还示出接地电压微凸块VSSQ518和高电压微凸块VDDQ520。
图6是根据某些实施例的48-IO模块微凸块映射600的说明性描绘。该描绘提供了微凸块映射600的底部视图。典型地,用于接口块的这样的微凸块映射将尽可能与QDR WIOSRAM和HBM DRAM微凸块映射(排除归因于由于PLL的阻塞的中间栈模块)匹配。如所示出的,各48-IO模块包括48个引脚602并且被分成作为PSIO引脚的40个引脚和作为PDIO引脚的8个引脚。
PSIO引脚被进一步细分成两个组(组0和组1),在各组中具有20个I/O引脚。在相同组内共享用于所有20个I/O的控制。各组还包括VSSQ引脚606和VDDQ引脚608。在一些实施例中,各组可以包括用于组水平可配置性的输入/输出配置(IOCSR)位的集。各PSIO也可以具有用于单个未可配置性的它自己的IOCSR位的集。
PDIO引脚包括可以或者作为差分I/O对被单个地编程或者作为两个单端I/O被单个地编程的四对引脚604。各PDIO可以具有用于单个位可配置性的它自己的IOCSR位的集。如果PDIO被配置为差分I/O对,则仅用于引脚0的IOCSR位经应用至PDIO。在一些实施例中,48-IO模块中的引脚源同步地操作。时钟/选通仅可以映射至PDIO引脚但其对应的信号可以映射至任何PSIO引脚(甚至映射至PDIO引脚内的PSIO引脚)。
图7是根据某些实施例的具有分区的时钟拓扑的说明性48-IO模块。如所示出的,各48-IO模块内的时钟拓扑被分区使得仅一个时钟的集可以被从PDIO集702和752的半部或者重新分布至另一半部或者重新分布至自身。这允许了48-IO模块虚拟分区成两个24-IO组成部件700和750,从而允许一个48-IO模块被横跨两个毗邻的信道共享。用于QDR WIO SRAM和HBM DRAM两者的引脚映射被示出在下面的表2中。
表2:用于QDR WIO SRAM和HBM DRAM的引脚映射
如果48-IO模块被配置成数据模块,则两个PDIO(一个来自虚拟分区的各半部)将被用作用于输出(WDQS_t和WDQS_c)和输入(RDQS_t和RDQS_c)选通引脚的差分对。剩余的PSIO706和756(包括未使用的PDIO组内的剩余的PSIO704和754)可以被映射为I/O引脚。
被附接至映射为输出选通引脚的半部的DLL 708可以用来使输出选通对延迟以使其集中在被映射至PSIO的传出数据上。被附接至映射为输入选通引脚的半部的DLL 758可以用来使传入的读取选通延迟以使其集中在被映射至PSIO的传入数据上。在其中48-IO模块被配置成命令模块的实施例中,PDIO的相同半部内的仅PSIO(包括未使用的PDIO组内的未使用的PSIO)可以用作用于命令引脚的映射。相同半部内的任一PDIO可以被映射为差分时钟输出(CK_t和CK_c)。被附接至相同半部的DLL接着用来使时钟输出延迟以使其集中在被映射至PSIO自身半部的传出命令总线上。
图8是根据某些实施例的用于接口块的说明性时钟网络拓扑800。各接口块由驻留在接口块布图规划的中间(例如,位于如图5所示的中间栈模块的上半部)的一个PLL计时。图8中的中间栈模块未按比例绘制。PLL 808接收来自位于PHY逻辑区域之上的一对参考时钟引脚(例如,图5中示出的C4凸块)的其参考时钟810。PLL 808输出给送四个独立的PHY时钟网络(如图8所示以象限对分组)的一个PHY时钟。各PHY时钟网络包括时钟门(CG)块802、核心时钟选择器(CCS)块804和时钟相位校准(CPA)块806。CG块802提供了接通未使用的象限中的PHY时钟的权限的能力。CCS块804被利用IOCSR配置位(例如,用于各CCs的2-位)控制并且提供了选择核心时钟源(直到标有814的所支持的四个核心时钟网络)的能力。CPA块806包括相位检测器(PD)和提供了或者使PHY时钟网络相位对准到核心时钟网络相位或者反之亦然的能力以有助于核心到PHY(C2P)和PHY到核心(P2C)转存的DLL。图9图示出具有其中PHY时钟被对准至核心时钟的逆向校准的用于接口块的时钟网络拓扑900。
四个独立的时钟象限(标记为象限AB、CD、EF和GH)允许接口块在相同频率但不同相位的四个不同时钟域内操作。各时钟象限经由CPA被相位对准至如由CCS编程的相应的核心时钟。这允许了用于在核心到接口与接口到核心之间的交叉的最大定时预算。该灵活性可以对于具有其中所有可得到的信道都没有相位/偏斜要求的HBM DRAM的应用是有用的。在这些应用中,与接口块接口的模块可以选取给具有与自身相同的时钟源(和与HBM DRAM相同的频率)的接口块计时。对于具有QDR WIO SRAM的应用,给送PHY逻辑的核心时钟可以被配置成选择相同源,即,所有四个CCS都可以被配置成选择相同的核心时钟源。这间接暗示,PHY逻辑以及核心构造中的软逻辑中的管线式触发也可以从相同的核心时钟网络获得来源。这使作为用于至少QDR WIO SRAM应用的要求的信道到信道偏斜最小化。
PLL 808还将两个同步的时钟输出812提供至核心构造。一个时钟输出可以代表全频率时钟而另一时钟输出可以代表用N的因数除的全频率时钟。后一时钟输出被预计用作用于内存接口的内存控制器时钟。全频率时钟可以配置成经由核心时钟网格网络被供给回到接口块以给PHY逻辑触发以及如图10所示与接口块接口的软逻辑计时。
图10是根据某些实施例的用于被集成到可编程器件时钟网络内的接口块的说明性时钟网络拓扑1000。除了其他组成部件以外,拓扑包括接口块1002、时钟线1004、CPA块1006和高速串行接口(HSSI)模块1008。在一些实施例中,内存控制器(MC)软逻辑负责当使用用N除的时钟输出时处理用N除的时钟输出与全频率时钟输出之间的时钟交叉。核心时钟源可以被从任何时钟区域驱动并且可以被从时钟脊柱驱动到接口块1002内并且通过VIOIF1010被复用。
整个接口块被预计以与其接口所至的存储器件相同的频率计时。例如,接口块在当其对接至以750MHz操作的QDR WIO SRAM时被以750MHz计时(与PHY时钟一起)。然而,将存在有以虽然相同频率但不同相位潜在地操作的高达八个时钟域。这些时钟域直接映射到四个I/O象限和图8中示出的四个PHY象限内。各I/O象限包含十二个48-IO模块。
图11是根据某些实施例的具有时钟域分区拓扑的说明性48-IO模块1100。各48-IO模块具有可以被获得来源以供给至各I/O组(组0和组1)的一对时钟域。取决于48-IO模块的映射,各I/O组可以被配置成从任一时钟域获得来源。PSIO组1102和1104可以仅具有在用于读取FIFO的它们的采用时钟上的可配置性,而PDIO组1106和1108可以具有用于读取FIFO的它们的采样时钟以及它们的发送时钟两者上的可配置性。模块1100包括能够以例如近似20ps步长使至少一个时钟周期(tCK)延迟的两个DLL 1110和1112。时钟周期可以根据适合于应用而大于或小于20ps。各DLL可以被配置成从来自相同半部中的任一PDIO对或PHY时钟的输入信号获得其输入时钟的来源。输入信号典型地被用来使用于第一阶段数据采集的输入读取数据选通延迟。PHY时钟典型地被用来使输出时钟或输出写入数据选通延迟以集中在命令或写入数据窗口的中间。下面的表3示出了用于针对如图11中描绘的模块1100及其输入的命令和数据模块的示例配置。
表3:用于命令和数据模块的示例配置
与接口块(和时钟)接口以形成内存子系统的MC可以在与接口块相同的时钟域中操作或者可以被分区成直到三个(例如,典型地为两个分区)的相互依赖的时钟域,即核心时钟域、内存控制器时钟域和PHY时钟域。典型地,核心时钟和内存控制器时钟以相同频率操作。然而,这可以取决于时钟域的配置而变化。对于其中它们不是相同频率的配置,MC软逻辑可以处理用某一常数K除内存控制器时钟以满足期望的核心时钟频率。源时钟可以从PLL所提供的两个核心时钟选择性地导出(经由核心时钟网格)。
图12是根据某些实施例的PSIO的说明性逻辑代表。在示出的实施例中,PSIO1200布置在48-IO模块内。在其他实施例中,PSIO的实施可以不同于该代表但是这里所示出的主要功能和可编程性被保留。PSIO1200包括可编程性选项、可配置性选项和IOCSR选项中的一个或多个(更多细节提供在下面的表4中)。输出使能(OE)1206位可以静态地启用/禁用输出驱动器。当启用时,输出使能的动态控制来自“oe”信号(图13中的信号1306)。输入使能(IE)位1204可以静态地启用/禁用输入接收器。当启用时,输入使能的动态控制来自“ie”信号(图13中的信号1304)。数据输入选择(DINSEL)位1202(对应于图13中的信号1302)可以静态地选择用于输入数据的源。输入数据可以从读取FIFO、直接从在输出时钟的正沿采样的或在输出时钟的负沿采样(例如,在输出时钟的上升沿上上演的以启用从管线至核心的全循环定时)的输入(旁通读取FIFO)获得来源。
图13是根据某些实施例的PSIO的说明性定时图。例如,图13示出PSIO1200如何基于如根据下面的表4配置的各种控制而行为的定时图1300。例如,如果配置位被设置为OE=0、IE=1和DINSEL=01,则PSIO输入数据被预计异步于子系统内的任何时钟。PSIO输入数据被进一步预计映射至异步输入信号(例如,用于QDR WIO SRAM的ERR_n)。在另一示例中,如果配置位被设置为OE=1、IE=0和DINSEL=XX,则PSIO输出1208/1308被预计同步于输出时钟的上升沿。PSIO输出1208被进一步预计映射至SDR/DDR输出信号(例如,用于QDR WIOSRAM的A、LD_n、RW_n、CFG和用于HBM DRAM的C、R)。下面在图4中示出了基于配置位预计的各种PSIO配置。这些配置位可以利用诸如FPGA等的可编程逻辑或电路来提供。未使用的配置用星号(*)指示出。
表4:预计的PSIO配置
图14是根据某些实施例的PDIO的说明性逻辑代表。在示出的实施例中,PDIO 1400布置在48-IO模块内。各PDIO可以在逻辑上被视为包括具有允许其被配置为或者单一个差分I/O缓冲器或者两个单端I/O缓冲器的附加共享源的两个PSIO。在其他实施例中,PDIO的确切实施可以不同于该代表但这里示出的主要功能和可编程性被保留。PDIO 1400包括可编程性选项、可配置性选项和IOCSR选项中的一个或多个(更多细节提供在下面的表5中)。OE位1406、OE0和OE1可以静态地启用/禁用输出驱动器。当启用时,输出使能的动态控制来自“oe”信号(图15中的信号1506)。IE位1404、IE0和IE1可以静态地启用/禁用输入接收器。当启用时,输入使能的动态控制来自“ie”信号(图15中的信号1504)。DINSEL位1402、DINSEL0和DINSEL 1可以静态地选择用于输入数据的源(对应于图15中的信号1502)。输入数据可以从读取FIFO、直接从在输出时钟的正沿采样的或在输出时钟的负沿采样(例如,在输出时钟的上升沿上上演的以启用从管线至核心的全循环定时)的输入(旁通读取FIFO)获得来源。
输出时钟选择(OCKSEL)位1412、OCKSEL0和OCKSEL1可以静态地选择输出时钟源。输出时钟可以或者从预DLL PHY时钟或者从后DLL PHY时钟获得来源。从后DLL PHY获得输出时钟的来源可以允许PDIO的输出被共享的DLL延迟。例如,该途径可以典型地用来或者使时钟或者使接口上的选通信号延迟。差分输入使能(DIFFIE)位1410可以静态地启用/禁用差分输入接收器。当启用时,输入使能的动态控制来自“ie[0]”信号(图15中的信号1504)。差分接收器不具有任何同步逻辑,因为接收到的差分信号被预计或者是时钟或者是选通信号。
图15是根据某些实施例的PDIO的说明性定时图。例如,图15示出PDIO1400如何基于如根据下面的表5配置的各种控制而行为的定时图1500。例如,如果配置位被设置为OE=0、IE=0、DINSEL=XX、OCKSEL=X和DIFFIE=1,则PDIO输出1408被预计在性质上是差分。PDIO输出1408/1508被进一步预计映射至差分输入选通(例如,RDQS_t/RDQS_c)。在另一示例中,如果配置位被设置为OE=0、IE=1、DINSEL=10、OCKSEL=X和DIFFIE=0,则任一或两个PDIO输出1408被预计为单端并且输入数据被预计同步于输出时钟的上升沿。PDIO输出1408/1508被进一步预计映射至SDR输入信号(例如,用于HBM DRAM的DERR)。下面在图5中示出基于配置位预计的各种PDIO配置。这些配置位可以利用诸如FPGA等的可编程逻辑或电路来提供。未使用的配置用星号(*)指示出。
表5:预计的PDIO配置
PHY接口是内存控制器与如图1至图3所图示的PHY之间的通信接口。在与QDR WIOSRAM或HBM DRAM有关的实施例中,PHY接口是DDR PHY接口(DFI)的变型。DFI变型PHY接口被称作用于该公开的剩余部分的通用PHY接口(UFI)。下面所描述的UFI的内容中的这样的变型将仍然在该公开的范围内。
UFI限定了跨越MC与PHY之间的UFI转存控制信息和数据所需的信号、定时参数和可编程参数。UFI适用于QDR WIO SRAM、HBM DRAM和其他合适内存。UFI限定了包括控制和状态、数据、中间栈和边带的接口组。控制和状态接口将地址、命令和控制信号驱动至存储器件并且从存储器件接收信令错误。数据接口被用来横跨UFI发出写入数据并接收读取数据。中间栈接口将复位和可测试性信号去冬至存储器件并从存储器件接收温度信息。边带接口充当到PHY内部配置寄存器的桥。
单端和差分接口组两者都可以根据相同接口协议和定时起作用但在它们接口所至的单独I/O的信号宽度和数量方面不同。各接口可以具有控制/数据信号,包括输出驱动器使能信号(ufi_{s|d}dout{x}_en)、输出数据信号(ufi_{s|d}dout{x})、输入接收器使能信号(ufi_{s|d}din{x}_en)、输入数据读取使能信号(ufi_{s|d}din{x}_rden)和输入数据信号(ufi_{s|d}din{x})。图15输出用于使用这些信号的48-IO接口的示例定时图。表6总结了至QDR WIO SRAM和HBM DRAM存储器件的UFI控制和状态信号映射。表7总结了至QDR WIOSRAM和HBM DRAM存储器件的UFI数据信号映射。
输出驱动器使能信号可以启用单端或差分I/O缓冲器的输出驱动器。输出数据信号可以包括待在单端或差分I/O缓冲器的引脚上被驱动的数据值。总线宽度可以是该组中的I/O缓冲器的数量的宽度的两倍以支持双倍数据速率(例如,对于I/O组的Y,IO[Z]在相位0中被用ufi_{s|d}dout{x}[Z]驱动并且在相位1中被用ufi_{s|d}dout{x}[Z+Y]驱动)。输入接收器使能信号可以启用单端或差分I/O缓冲器的输入接收器。输入数据读取使能信号可以具有排空读取FIFO的控制,即,使用于I/O组的读取指针前进。如果有虚读脉冲,则该信号需要被认定归因于虚读脉冲而将数据从FIFO入口另外地排空。输出数据信号可以包括来自接收器的数据值,或者来自由PHY时钟(上升沿/下降沿)采用的读取FIFO,或者从引脚输入旁通。
图16是根据某些实施例的包括48-IO模块的接口块的说明性定时图1600。在示出的实施例中,一个管道阶段延迟被假设用于接口块。在例如信号1602中的“CORE”的记号是指MC(在核心构造中实施的)中的最终触发之后的定时,而例如在信号1604中的“PHY”的记号是指在接口块管道阶段之后的在PHY接口处的定时。接口块也可以允许多个逻辑管线被插入MC与PHY之间用于较长布线以花费额外的时延获得期望的频率。在一些实施例中,这是接口的基本要求以限制在MC与PHY之间交叉的信号的数量。图16中的定时图示出了被插在MC与PHY之间的一个管线的示例。MC与PHY之间的管线的附加可以通过MC中的控制逻辑来解释。
UFI控制和状态接口处理将地址、命令和控制信号驱动至存储器件所需的信号的发送。它还接收用于存储器件的错误指示。传出信号被以维持UFI上的信号之中的定时关系的方式传输至存储器件。传出控制接口上的所有信号都被假设是双倍数据速率,即,时钟的高、低相位通信不同的属性。在一些实施例中,单倍数据速率信号被利用相同假设驱动但相同属性被驱动用于时钟的高、低相位。传入信号通信来自存储器件的状态/错误。传入状态接口上的所有信号都被假设为单倍数据率并且可以在它们被布线回到核心构造之前被同步到PHY时钟。下面的表6总结了至QDR WIO SRAM和HBM DRAM存储器件的这些UFI控制和状态信号映射。
表6:UFI控制和状态信号映射
数据接口处理横跨UFI的写入数据的发送和读取数据的采集/返回。信号被以与控制和状态接口类似地维持UFI上的信号之中的定时关系的方式传输至存储器件。数据接口上的所有信号都被假设为双倍数据速率,即,时钟的高、低相位两者通信不同的属性。在一些实施例中,单倍数据速率信号被利用相同假设驱动但相同的属性被驱动用于时钟的高、低相位两者。表7总结了至QDR WIO SRAM和HBM DRAM存储器件的这些UFI数据信号映射。
表7:UFI数据信号映射
图17至图20是根据某些实施例的与QDR WIO SRAM一起工作的接口块的说明性定时图。图17示出与QDR WIO SRAM(用于写入时延,WL=8)一起工作的接口块的内存写入定时图1700。图18示出与QDR WIO SRAM(用于读取时延,RL=13)一起工作的接口块的内存读取定时图1800。图19示出与其中内存读取(用于读取时延,RL13)随后是内存写入(用于写入时延,WL=8)的QDR WIO SRAM一起工作的接口块的定时图1900。图20示出与其中内存写入(用于写入时延,WL=8)随后是内存读取(用于读取时延,RL=13)的QDR WIO SRAM一起工作的接口块的定时图2000。
应该理解的是,术语“可编程逻辑”和“FPGA”的前述使用是示例性的,并且这样的使用可以适用于可编程逻辑器件和其他合适的电路,包括但不限于商业FPGA、可配置ASSP器件、可配置DSP和GPU器件、混合ASIC/可编程器件、被描述为具有可编程逻辑核心的ASIC的器件或具有嵌入的ASIC或ASSP核心的可编程逻辑器件。
应该理解的是,前述仅说明了发明的原理,并且本领域技术人员可以在不脱离发明的范围和精神的情况下做出各种修改,并且本发明仅由随附权利要求限制。例如,本文已经讨论的各种发明方面可以或者是在某些实施例中全部一起使用,或者是其他实施例可以仅采用发明方面的一个或多个(但少于全部)。并且如果采用了发明方面中的多个(但少于全部),那么可能会牵涉到发明方面的任何组合的采用。作为可能的修改的另一示例,遍及该公开,提到了特定参数值。这些特定值仅是示例,并且而且可以根据期望使用其他合适的参数值。

Claims (17)

1.一种接口块,包括:
沿着所述接口块分布的多个输入/输出模块;以及
散置在所述多个输入/输出模块内的中间栈模块,所述中间栈模块经由可编程逻辑电路与所述多个输入/输出模块通信,
其中:
所述多个输入/输出模块包括至少一个数据模块和至少一个命令模块,
所述多个输入/输出模块中的至少一个输入/输出模块由毗邻的一对信道共享,
所述多个输入/输出模块中的每个输入/输出模块被配置成经由硅中介和硅桥中的至少一个与存储器件对接,
所述输入/输出模块中的每个输入/输出模块包括被映射至多个可编程单端输入/输出(PSIO)子模块中的一个可编程单端输入/输出子模块的第一多个引脚,以及被映射至多个可编程差分/单端输入/输出(PDIO)子模块中的一个可编程差分/单端输入/输出子模块的第二多个引脚,以及
时钟拓扑,所述时钟拓扑被分区,以使得第一时钟集能够从所述PSIO子模块的第一半部重新分布至所述PSIO子模块的第二半部。
2.根据权利要求1所述的接口块,其中由所述毗邻的一对信道共享的所述多个输入/输出模块中的所述至少一个输入/输出模块被分区成具有相同数量的引脚的两个子模块。
3.根据权利要求1所述的接口块,其中所述至少一个数据模块包括被映射至输出选通引脚的PDIO子模块的第一子集和被映射至输入选通引脚的PDIO的子模块的第二子集。
4.根据权利要求3所述的接口块,其中所述至少一个数据模块进一步包括被映射至PDIO子模块的所述第一子集的第一环形电路和被映射至PDIO子模块的所述第二子集的第二环形电路,其中所述第一环形电路被配置成使被映射至PSIO子模块的输出选通单元延迟。
5.根据权利要求4所述的接口块,其中所述第一环形电路和所述第二环形电路是延迟锁相环(DLL)电路和锁相环(PLL)电路中的至少一个。
6.根据权利要求1所述的接口块,其中所述至少一个命令模块包括被映射至PDIO子模块的差分时钟输出。
7.根据权利要求1所述的接口块,其中所述中间栈模块包括独立的时钟象限,其中每个时钟象限被配置成在不同相位处操作,其中每个相位被对准至相应的核心时钟或者每个相应的核心时钟被对准至物理层时钟。
8.根据权利要求1所述的接口块,其中所述多个输入/输出模块中的每个输入/输出模块是48-IO模块。
9.一种接口块,包括:
沿着所述接口块分布的多个输入/输出模块,其中所述多个输入/输出模块包括至少一个数据模块和至少一个命令模块,其中所述多个输入/输出模块中的至少一个输入/输出模块由毗邻的一对信道共享,并且其中所述多个输入/输出模块中的每个输入/输出模块被配置成经由硅中介和硅桥中的至少一个与存储器件对接,
其中所述至少一个数据模块包括被映射至输出选通引脚的PDIO子模块的第一子集和被映射至输入选通引脚的PDIO子模块的第二子集,并且
其中所述至少一个数据模块包括被映射至PDIO子模块的所述第一子集的第一环形电路和被映射至PDIO子模块的所述第二子集的第二环形电路,其中所述第一环形电路被配置成使被映射至PSIO组的输出选通单元延迟。
10.根据权利要求9所述的接口块,其中所述输入/输出模块中的每个输入/输出模块包括:被映射至多个可编程单端输入/输出(PSIO)子模块中的一个可编程单端输入/输出子模块的第一多个引脚,以及被映射至多个可编程差分/单端输入/输出(PDIO)子模块中的一个可编程差分/单端输入/输出子模块的第二多个引脚。
11.根据权利要求10所述的接口块,其中时钟拓扑被分区以使得第一时钟集能够从所述PSIO子模块的第一半部重新分布至所述PSIO子模块的第二半部。
12.根据权利要求9所述的接口块,其中由所述毗邻的一对信道共享的所述多个输入/输出模块中的所述至少一个多个输入/输出模块被分区成具有相同数量的引脚的两个子模块。
13.根据权利要求12所述的接口块,其中所述第一环形电路和所述第二环形电路是延迟锁相环(DLL)电路和锁相环(PLL)电路中的一个。
14.根据权利要求9所述的接口块,其中所述至少一个命令模块包括被映射至PSIO组的差分时钟输出。
15.根据权利要求9所述的接口块,其中所述多个输入/输出模块中的每个输入/输出模块是48-IO模块。
16.一种接口块,包括:
沿着所述接口块分布的多个输入/输出模块;以及
散置在所述多个输入/输出模块内的中间栈模块,所述中间栈模块经由可编程逻辑电路与所述多个输入/输出模块通信,其中所述中间栈模块包括独立的时钟象限,其中每个时钟象限被配置成在不同相位处操作,并且其中每个相位被对准至相应的核心时钟,其中所述多个输入/输出模块包括至少一个数据模块,所述至少一个数据模块包括被映射至输出选通引脚的PDIO子模块的第一子集和被映射至输入选通引脚的PDIO子模块的第二子集,并且所述至少一个数据模块包括被映射至PDIO子模块的所述第一子集的第一环形电路和被映射至PDIO子模块的所述第二子集的第二环形电路,其中所述第一环形电路被配置成使被映射至PSIO子模块的输出选通单元延迟。
17.根据权利要求16所述的接口块,其中每个输入/输出模块经由包括控制接口组和数据接口组中的一个或多个的通用接口协议与所述可编程逻辑电路通信,其中:
所述控制接口组将地址、命令和控制信号中的至少一个传输至所述可编程逻辑电路,并且
所述数据接口组将数据传输至所述可编程逻辑电路并且从所述可编程逻辑电路接收数据。
CN201510617804.0A 2014-10-02 2015-09-24 可扩展的2.5d接口架构 Active CN105487994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811118500.XA CN109412577B (zh) 2014-10-02 2015-09-24 可扩展的2.5d接口架构

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462058933P 2014-10-02 2014-10-02
US62/058,933 2014-10-02
US14/692,133 US9819345B2 (en) 2014-10-02 2015-04-21 Scalable 2.5D interface architecture
US14/692,133 2015-04-21

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201811118500.XA Division CN109412577B (zh) 2014-10-02 2015-09-24 可扩展的2.5d接口架构

Publications (2)

Publication Number Publication Date
CN105487994A CN105487994A (zh) 2016-04-13
CN105487994B true CN105487994B (zh) 2018-10-19

Family

ID=55632786

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201811118500.XA Active CN109412577B (zh) 2014-10-02 2015-09-24 可扩展的2.5d接口架构
CN201510617804.0A Active CN105487994B (zh) 2014-10-02 2015-09-24 可扩展的2.5d接口架构

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201811118500.XA Active CN109412577B (zh) 2014-10-02 2015-09-24 可扩展的2.5d接口架构

Country Status (2)

Country Link
US (2) US9819345B2 (zh)
CN (2) CN109412577B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9990160B2 (en) 2016-06-27 2018-06-05 Altera Corporation Methods and apparatus for smart memory interface
US10784121B2 (en) * 2016-08-15 2020-09-22 Xilinx, Inc. Standalone interface for stacked silicon interconnect (SSI) technology integration
US10579552B1 (en) 2017-02-09 2020-03-03 Intel Corporation Interface architecture for master-to-master and slave-to-master communication
US11467995B2 (en) * 2020-12-01 2022-10-11 Micron Technology, Inc. Pin mapping for memory devices

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930798A (zh) * 2009-06-25 2010-12-29 联发科技股份有限公司 闪存装置、存储器装置以及控制闪存装置的方法
US8664975B1 (en) * 2011-04-13 2014-03-04 Altera Corporation Systems and methods for flexibly configuring a programmable logic device
WO2014149851A1 (en) * 2013-03-15 2014-09-25 Micron Technology, Inc. Flexible memory system with a controller and a stack of memory

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3620440B2 (ja) * 2000-11-20 2005-02-16 日本電気株式会社 半導体集積回路とそのクロック分配方法
US7098707B2 (en) * 2004-03-09 2006-08-29 Altera Corporation Highly configurable PLL architecture for programmable logic
US7218141B2 (en) * 2004-12-07 2007-05-15 Altera Corporation Techniques for implementing hardwired decoders in differential input circuits
JP5719926B2 (ja) * 2010-06-04 2015-05-20 ザイリンクス インコーポレイテッドXilinx Incorporated 集積回路のための入出力バンクアーキテクチャ
US8417867B2 (en) * 2010-11-17 2013-04-09 Xilinx, Inc. Multichip module for communications

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930798A (zh) * 2009-06-25 2010-12-29 联发科技股份有限公司 闪存装置、存储器装置以及控制闪存装置的方法
US8664975B1 (en) * 2011-04-13 2014-03-04 Altera Corporation Systems and methods for flexibly configuring a programmable logic device
WO2014149851A1 (en) * 2013-03-15 2014-09-25 Micron Technology, Inc. Flexible memory system with a controller and a stack of memory

Also Published As

Publication number Publication date
CN109412577A (zh) 2019-03-01
US9819345B2 (en) 2017-11-14
CN109412577B (zh) 2022-10-14
CN105487994A (zh) 2016-04-13
US20180069551A1 (en) 2018-03-08
US10505544B2 (en) 2019-12-10
US20160098061A1 (en) 2016-04-07

Similar Documents

Publication Publication Date Title
US20230056118A1 (en) Multi-purpose interface for configuration data and user fabric data
US11100028B1 (en) Programmable I/O switch/bridge chiplet
CN105487994B (zh) 可扩展的2.5d接口架构
CN101897119B (zh) 具有多个装置的系统中的时钟再生和时序方法以及具有可变数据对准的存储器控制器
CN111753489A (zh) 模块化的集成电路设备中管芯间和管芯内通信的片上网络
US7928770B1 (en) I/O block for high performance memory interfaces
US20140340125A1 (en) Programmable high-speed i/o interface
CN107111566B (zh) 用于存储器模块的动态随机存取存储器(dram)部件
US11037608B2 (en) Stacked memory device and memory system including the same
USRE45359E1 (en) Integrated circuit for clock generation for memory devices
US20090086558A1 (en) Multi-port memory device with serial input/output interface
US20200183877A1 (en) Distributed multi-die protocol application interface
CN112513827A (zh) 使用hbm物理接口的高带宽芯片到芯片接口
US10649944B2 (en) Configuration via high speed serial link
CN116368481A (zh) 具有数据处理引擎阵列的多裸片集成电路
US9349488B2 (en) Semiconductor memory apparatus
US11121715B2 (en) Coarse-grain programmable routing network for logic devices
US7772888B2 (en) Communication system for connecting synchronous devices that are uncorrelated in time
CN113096719A (zh) 层叠半导体器件和包括其的半导体系统
US20220109446A1 (en) Systems And Methods For Configurable Interface Circuits
US10049763B2 (en) Semiconductor memory apparatus
CN102723943B (zh) 一种cpld及其实现信号电平转换的方法
US20220200610A1 (en) Clocking system and a method of clock synchronization
Kajiwara et al. A novel three-dimensional FPGA architecture with high-speed serial communication links
KR100684890B1 (ko) 서데스 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant