JP5070228B2 - 半導体装置 - Google Patents

半導体装置 Download PDF

Info

Publication number
JP5070228B2
JP5070228B2 JP2009010499A JP2009010499A JP5070228B2 JP 5070228 B2 JP5070228 B2 JP 5070228B2 JP 2009010499 A JP2009010499 A JP 2009010499A JP 2009010499 A JP2009010499 A JP 2009010499A JP 5070228 B2 JP5070228 B2 JP 5070228B2
Authority
JP
Japan
Prior art keywords
lsi
clock signal
flip
circuit
flops
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009010499A
Other languages
English (en)
Other versions
JP2010171092A5 (ja
JP2010171092A (ja
Inventor
一雄 大津賀
健一 長田
真 佐圓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2009010499A priority Critical patent/JP5070228B2/ja
Priority to US12/690,659 priority patent/US7994822B2/en
Publication of JP2010171092A publication Critical patent/JP2010171092A/ja
Publication of JP2010171092A5 publication Critical patent/JP2010171092A5/ja
Application granted granted Critical
Publication of JP5070228B2 publication Critical patent/JP5070228B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • G06F1/12Synchronisation of different clock signals provided by a plurality of clock generators
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L25/00Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
    • H01L25/18Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof the devices being of types provided for in two or more different subgroups of the same main group of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K5/00Manipulating of pulses not covered by one of the other main groups of this subclass
    • H03K5/15Arrangements in which pulses are delivered at different times at several outputs, i.e. pulse distributors
    • H03K5/15013Arrangements in which pulses are delivered at different times at several outputs, i.e. pulse distributors with more than two outputs
    • H03K5/15026Arrangements in which pulses are delivered at different times at several outputs, i.e. pulse distributors with more than two outputs with asynchronously driven series connected output stages
    • H03K5/15033Arrangements in which pulses are delivered at different times at several outputs, i.e. pulse distributors with more than two outputs with asynchronously driven series connected output stages using a chain of bistable devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03LAUTOMATIC CONTROL, STARTING, SYNCHRONISATION OR STABILISATION OF GENERATORS OF ELECTRONIC OSCILLATIONS OR PULSES
    • H03L7/00Automatic control of frequency or phase; Synchronisation
    • H03L7/06Automatic control of frequency or phase; Synchronisation using a reference signal applied to a frequency- or phase-locked loop
    • H03L7/07Automatic control of frequency or phase; Synchronisation using a reference signal applied to a frequency- or phase-locked loop using several loops, e.g. for redundant clock signal generation
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/42Wire connectors; Manufacturing methods related thereto
    • H01L2224/47Structure, shape, material or disposition of the wire connectors after the connecting process
    • H01L2224/48Structure, shape, material or disposition of the wire connectors after the connecting process of an individual wire connector
    • H01L2224/481Disposition
    • H01L2224/48135Connecting between different semiconductor or solid-state bodies, i.e. chip-to-chip
    • H01L2224/48137Connecting between different semiconductor or solid-state bodies, i.e. chip-to-chip the bodies being arranged next to each other, e.g. on a common substrate
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2225/00Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
    • H01L2225/03All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
    • H01L2225/04All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
    • H01L2225/065All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L2225/06503Stacked arrangements of devices
    • H01L2225/06513Bump or bump-like direct electrical connections between devices, e.g. flip-chip connection, solder bumps
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2225/00Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
    • H01L2225/03All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
    • H01L2225/04All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
    • H01L2225/065All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L2225/06503Stacked arrangements of devices
    • H01L2225/06527Special adaptation of electrical connections, e.g. rewiring, engineering changes, pressure contacts, layout
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2225/00Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
    • H01L2225/03All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
    • H01L2225/04All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
    • H01L2225/065All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L2225/06503Stacked arrangements of devices
    • H01L2225/06541Conductive via connections through the device, e.g. vertical interconnects, through silicon via [TSV]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Nonlinear Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Semiconductor Integrated Circuits (AREA)
  • Manipulation Of Pulses (AREA)
  • Logic Circuits (AREA)

Description

本発明は、半導体装置に関し、特に、3次元方向に積層されたLSI間の同期手法に関する。
近年、電子機器に対する小型化、高性能化の要求はますます拡大している。小型化、高性能化を左右するキーデバイスは、機器に搭載されるLSI(Large Scale Integration)である。LSIは、微細加工技術の進化とともに、より多くのトランジスタを1チップに集積することで性能向上を図ってきた。しかしながら、微細化の限界や、最先端プロセスの利用コストの増大などの影響で、これまでのような1チップへの集積化を進めることが必ずしも最適解ではなくなる。そこで、複数のLSIを積層することによる3次元方向の集積が有望な技術となる。
図14は、論理回路が多数組み合わされて構成されるLSIを示したものである。LSI1には、プロセッサユニット(PU1、PU2)、メモリコントローラ(MEMC)、割り込みコントローラなどの周辺回路(PERI)、これらの信号を交互に接続するバス(BUS)、が搭載される。基準クロック信号を供給する水晶発振器(Crystal)がLSI1外部に設置され、LSI1内部には該基準クロック信号の周波数を逓倍するPLL回路(PLL)、PLL出力クロック信号を適切に分周して、PU1、PU2、MEMC、PERIの各回路ブロックにクロック信号を分配するクロックパルスジェネレータ(CPG)が搭載される。これら回路ブロックは、配線(SI1、SI2、SI3、SI4)でバス(BUS)と接続される。これにより、PU1、PU2、PERI、MEMCは交互に情報をやり取りできる。PU1、PU2、PERI、MEMCは、図15に示したような論理回路が多数組み合わされた構成を取っており、これら論理回路のフリップフロップ回路に供給されるクロック信号は、それぞれ、クロック配線(CLK_PU、CLK_BUS、CLK_MEMC、CLK_PERI)により供給される。
図15は、図14に用いられる論理回路を示す図であり、一つのチップ内に形成される。この論理回路は、複数のフリップフロップ回路(FF)、組み合わせ回路(Comb)、クロック配線(CLK1)、入力ポート(IN1,IN2,IN3)、出力ポート(OUT1,OUT2,OUT3)から構成される。また、論理回路は、クロック信号に同期して動作する。即ち、クロック信号の立ち上がり又は立ち下がりエッジにおいて、IN1〜IN3の信号がフリップフロップ回路にラッチされ、後段の組み合わせ回路に入力される。組み合わせ回路で演算された結果は、次のクロック信号の立ち上がり及び立ち下がりエッジにおいて、後段のフリップフロップ回路にラッチされ、OUT1〜OUT3へ出力される。前記のように、この動作はフリップフロップに分配されているクロック信号に同期して実行される。つまり、演算が同期していると言う。このため、各フリップフロップに配られるクロック信号の位相がずれている場合、後段のフリップフロップが正しい信号をラッチできなくなる等、誤動作を引き起こす。このクロック信号の位相のずれは一般的にクロックスキューと呼ばれている。
特許文献1では、このクロックスキューを低減する方法として、フリップフロップ回路とクロック配線のみで構成されたLSIと、組み合わせ論理回路のみで構成されたLSIを積層する手法について言及している。
特開2008−47768号公報
上述の背景技術に対し、我々は更なる性能向上、低消費電力化、スペース効率向上を達成するためには、プロセッサなどの演算LSIもメモリLSIに合わせて複数積層することが有効と考える。
しかしながら、単純に複数演算LSIを積層し、ワイヤボンディングで接続するだけでは、以下、詳述するようにシステム全体の性能向上を見込むことが難しい。図16は、LSI_AとLSI_Bが外部インタフェース配線(IF_AB)にて接続された構成である。外部インタフェース配線はワイヤボンディングやシステムボード上の基板配線で構成される。LSI_Aは、プロセッサユニット(PU_A)、外部インタフェース回路(IF_A)が搭載される。各回路ブロックのクロック信号は、クロック配線(CLK_A、CLK_B)から供給される。同様に、LSI_Bは、プロセッサユニット(PU_B)、外部インタフェース回路(IF_B)が搭載される。各回路ブロックのクロック信号は、クロック配線(CLK_B、CLK_C)から供給される。LSI_Aのプロセッサユニット(PU_A)が、LSI_Bのプロセッサユニット(PU_B)と通信する動作を説明する。CLK_Aの信号に同期したプロセッサユニット(PU_A)の送信データが、接続配線(SIA)を経由して、外部インタフェース回路(IF_A)の論理回路に取り込まれる。ここで、外部インタフェース回路(IF_A)の取り込み論理回路は、CLK_Aに同期している。ここではPU_AとIF_Aは直接接続されているが、間にバスを介して接続されてもよい。一般に、チップ外部通信用のクロック周波数とチップ内部回路ブロックのクロック周波数は異なり、同期していない。図16では、チップ外部通信用のクロック周波数はCLK_B、チップ内部回路ブロックのクロック周波数はCLK_Aである。そのため、外部インタフェース回路(IF_A)では、CLK_Aで同期する論理回路と、CLK_Bで同期する論理回路の間で、非同期通信を実施する必要がある。送信データがCLK_Bで同期する論理回路に取り込まれた後、決められた通信プロコトルを使用して、IF_ABを経由して、LSI_Bの外部インタフェース回路(IF_B)に取り込まれる。ここで、LSI_AのCLK_Bと、LSI_BのCLK_Bは同期していない。外部インタフェース回路で取り込まれたデータは、CLK_Bで動作する論理回路とCLK_Cで動作する論理回路の間で非同期通信を実施した後、プロセッサユニットPU_Bに送信される。このように、LSI同士の通信は、一般に非同期通信となるため、(1)LSI_Aによる演算、(2)LSI_Aの演算結果をLSI_Bへ転送、(3)LSI_Bによる演算、といったステップの中で、特に(2)がボトルネックとなり処理性能が向上しないという問題がある。
なお、特許文献1では、2つのチップを積層する構成を採用するが、2つのチップとは、論理回路を形成するチップとフリップフロップを形成するチップであり、上述の異なるチップ間の非同期転送の課題を解決するものではない。
本願において開示される発明のうち代表的なものについて簡単に説明すれば下記の通りである。
第1クロック信号が供給される複数の第1フリップフロップと、前記複数の第1フリップフロップの間に接続される第1論理回路とを有する第1LSIと、前記第1LSIとは異なるチップに形成され、第2クロック信号が供給される複数の第2フリップフロップと、前記複数の第2フリップフロップの間に接続される第2論理回路とを具備し、前記第1LSIと前記第2LSIは、一つの半導体パッケージ内に積層され、前記第1LSIは、前記第1クロック信号に基づいて前記第2LSIにデータを送信し、前記第2LSIは、前記第2クロック信号に基づいて前記第1LSIから送信されたデータを受信し、前記第2クロック信号は、前記第1クロック信号にその位相が合うように制御される。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば、3次元に積層された演算LSI間の通信が高速にできるようになる。
第一の実施例に係る積層されるLSIパッケージの説明図である。 第一の実施例に係る積層される演算LSIを示した説明図である。 LSI間同期通信を示した説明図である。 パイプライン処理を示した説明図である。 動画デコード処理を示した説明図である。 第一の実施例に係る積層LSI間同期回路システムを示した説明図である。 第二の実施例に係る積層される演算LSIを示した説明図である。 第三の実施例に係る積層LSI間同期回路システムを示した説明図である。 第四の実施例に係る積層LSI間同期回路システムを示した説明図である。 第五の実施例に係る積層されるLSIパッケージの説明図である。 第五の実施例に係る積層LSI間同期回路システムを示した説明図である。 第五の実施例に係る動作波形の説明図である。 第五の実施例に係る動作波形の説明図である。 同期LSIを示した説明図である。 同期論理回路を示した説明図である。 LSI間非同期通信を示した説明図である。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。
図1には、本発明の第一の実施例に係る積層されたLSIの一形態が示される。積層されたLSIの積層断面が図示されている。本形態においては、パッケージ基板PKGBの上層に外部通信LSI(COMLSI)が積層され、その上層に演算器を搭載した演算LSI(LGLSI)が3枚積層され、またその上層にデータの記憶を行うメモリLSI(MEMLSI)が1枚積層される。外部通信LSIは、この積層LSI外のシステム基板上の部品との間で通信周波数1GHzを超える高速な有線通信を行う回路を備え、積層LSI外部との高速通信はこの外部通信LSIを介して行う。メモリLSIは、DRAMや、SRAM、フラッシュメモリ、磁性体メモリなどが該当する。演算LSIには、CPUなど汎用のプロセッサや、グラフィックス・アクセラレータなどの専用プロセッサや、加算器や乗算器などの演算回路を多数ならべてその間をスイッチ回路で接続した動的再構成可能プロセッサや、FPGAを搭載するLSIが該当する。
このように、ひとつの半導体パッケージ内に、夫々異なるチップである、外部通信LSI、メモリLSI及び演算LSIを、この順序で積層し、これらのLSI間を貫通電極で接続することで、ワイヤボンディングやシステムボード上の基板配線と比較して高速大容量通信を最短経路で行うことを特徴とする。ここで、シリコン貫通電極とは、基板シリコンに穴をあけ、その穴に導電物質をつめたものであり、これにより積層されたLSI間を電気的に接続できる。
図1において、TVPWは電源供給のためのシリコン貫通電極である。TVPWはメモリLSIと演算LSIへ共通の電源を供給するためのシリコン貫通電極であり、電源は外部通信LSIから、TVPWを介して、メモリLSIと演算LSIの電源ラインに接続される。
TVCRYは、外部水晶発振器から生成される基準クロック信号を供給するためのシリコン貫通電極である。基準クロック信号は外部通信LSIから、TVCRYを介して、メモリLSIと演算LSIのPLLに接続される。なお、メモリLSIにPLLが搭載されていない場合もある。同様に、TVCLKは、以降で説明する各LSIの同期用の基準クロック信号を供給するためのシリコン貫通電極である。
次に本実施の形態における各LSIおよびパッケージ外部との通信の経路について記載する。外部通信LSI、演算LSI、メモリLSI間の通信は、シリコン貫通電極TVSIGを介す。外部通信LSIと、パッケージ外部LSIとの通信は、パッケージ基板PKGBを介して実施される。ここでいう通信とは、狭義の通信ではなく、リセット信号や、エンディアン信号や、動作周波数や端子設定などの初期値信号や、LSIの識別子信号なども含め電源以外のすべての情報の入出力をさす。
このシステムの典型的な動作は、外部通信LSIがパッケージ外部から画像や通信パケットなど処理対象データを積層されたメモリLSIに読み込み、このデータに対して演算LSIが何らかの演算処理を行う。そして、その結果をメモリLSIに格納し、その結果を外部通信LSIがメモリLSIから外のストレージやネットワークに出力するというものになる。
本実施例では、全てのLSIを貫通して接続するTVSIGが示されているが、必ずしもこれに限定されるものではなく、一部のLSI間のみを接続するシリコン貫通電極が併設されていてもよい。この場合、シリコン貫通電極の容量及び抵抗が小さくり高速な通信が可能となる。
また、図1の実施の形態においては積層されたLSI間は直接接続されているが、メモリLSIと演算LSI間、および、メモリLSIと外部通信LSI間に、端子位置調整用の配線を持つインタポーザー層が挿入される場合もある。例えば、メモリLSIのシリコン貫通電極の位置と、演算LSIのシリコン貫通電極の位置が一致しない場合に必要となる。また同じ目的で、再配線層を用いることもできる。
図2には、図1に示される演算LSI(LGLSI)の一形態が示される。なお、図1に示される複数の演算LSIは、夫々異なる構成を採用してもよいが、本実施例では後述する理由により同じ構成となっている。LGLSIは、プロセッサユニット(PU1、PU2)、メモリコントローラ(MEMC)、割り込みコントローラなどの周辺回路(PERI)、これらの信号を交互に接続するバス(BUS)、が搭載される。また、シリコン貫通電極を介して水晶発振器(Crystal)から出力された基準クロック信号を受け、該基準クロック信号の周波数を逓倍するPLL回路(PLL)、PLL出力クロック信号を適切に分周して、PU1、PU2、MEMC、PERIの各回路ブロックにクロック信号を分配するクロックパルスジェネレータ(CPG)が搭載される。プロセッサユニットは、CPU(Central Processor Unit)や、DSP(Digital Signal Processor)に相当する。プロセッサユニットは、動画処理や音声処理に特化したハードウェアIP(Intellectual Property)であってもよい。なお、プロセッサユニットの数が2個であるが、数を限定するものではない。これら回路ブロックは、配線(SI1、SI2、SI3、SI4)でバス(BUS)と接続される。これにより、PU1、PU2、PERI、MEMCは交互に情報をやり取りできる。PU1、PU2、PERI、MEMCは、図14に示したような論理回路が多数組み合わされた構成を取っており、これら論理回路のフリップフロップ回路に供給されるクロック信号は、それぞれ、クロック配線(CLK_PU、CLK_BUS、CLK_MEMC、CLK_PERI)により供給される。ここでは、PU1、PU2に供給されるクロック配線(CLK_PU)は同一であるが、個別のクロック配線を用いても良い。その場合、PU1、PU2は負荷量に応じて、別々のクロック周波数で動作させることが可能になる。また、同様に、プロセッサユニット、メモリコントローラ、周辺回路、バスに分配されるクロック周波数は異なっていても良い。ただし、各クロック信号は同期しているため、プロセッサユニット、メモリコントローラ、周辺回路、バスの演算は同期していることになる。また、本実施の形態では、位相調整用のDLL回路(DLL)が一つ搭載されており、本DLL回路により、他のチップに形成された演算LSIのクロックと同期したクロックを、プロセッサユニット(PU1、PU2)、メモリコントローラ(MEMC)、割り込みコントローラなどの周辺回路(PERI)、これらの信号を交互に接続するバス(BUS)、に供給する。
図3は、2枚の演算LSI(LSI_A、LSI_B)のデータの通信経路を示した概念図である。図3に示されるように、2枚の演算LSIは、シリコン貫通電極TVSIGを介してフリップフリップFF同士が接続される。また、演算LSI(LSI_A)は、複数のフリップフロップ回路(FF)、組み合わせ回路(COMB)、クロック配線(CLK1)、入力ポート(IN1,IN2,IN3)から構成される論理回路を含む。この論理回路は、図2に示されるような演算LSI(LSI_A)のプロセッシングユニット(PU1,PU2)に含まれる。また、演算LSI(LSI_B)は、複数のフリップフロップ回路(FF)、組み合わせ回路(COMB)、クロック配線(CLK2)、出力ポート(OUT1,OUT2,OUT3)から構成される論理回路を含む。この論理回路は、同様に、演算LSI(LSI_B)のプロセッシングユニット(PU1,PU2)に含まれる。
演算LSI(LSI_A)の論理回路は、クロック信号(CLK1)に同期して動作する。クロック信号(CLK1)の立ち上がり又は立ち下がりエッジにおいて、IN1〜IN3の信号がフリップフロップ回路にラッチされ、後段の組み合わせ回路に入力される。組み合わせ回路で演算された結果は、次のクロック信号の立ち上がり及び立ち下がりエッジにおいて、後段のフリップフロップ回路にラッチされ、演算LSI(LSI_B)へシリコン貫通電極TVSIGを介して出力される。一方、演算LSI(LSI_B)の論理回路は、クロック信号(CLK2)に同期して動作する。クロック信号(CLK2)の立ち上がり又は立ち下がりエッジにおいて、シリコン貫通電極TVSIGの信号がフリップフロップ回路にラッチされ、後段の組み合わせ回路に入力される。組み合わせ回路で演算された結果は、次のクロック信号の立ち上がり及び立ち下がりエッジにおいて、後段のフリップフロップ回路にラッチされ、その後段へ出力される。
本実施例では、異なるチップに形成されるLSI_AとLSI_Bの通信用論理回路に供給されるクロック信号CLK1とCLK2が同期するように制御される。従って、オンチップの同期しているフリップフロップ間と同じようなデータの受け渡しが可能となり、通信レイテンシを削減可能となる。この結果、少ない処理単位のデータをLSI間でやり取りして、各LSIで演算を行うことが可能になる。
また、本実施例では、演算LSI(LSI_A)と演算LSI(LSI_B)のフリップフロップ同士を貫通電極で接続する構成となっているため、その位置関係が丁度上下の位置にくることが重要となる。従って、演算LSI(LSI_A)及び演算LSI(LSI_B)が同じ構成となっていれば、その位置関係は保たれるため、同種の演算LSIを積層することが望ましい。しかしながら、異なるチップに接続されるフリップフロップの位置を予め定めておく、又は、上述したようにインタポーザー等で位置のずれを修正することができることは言うまでもない。
LSI間の通信及び演算が同期していた場合、細かい処理単位のデータをLSI間でやり取りすることが可能になる。例として、図4は、CPUのパイプライン処理を2個のLSIで実施する場合を示したものである。パイプライン処理は、命令フェッチ(IF)、命令デコード(RF)、命令実行(EX)、オペランドフェッチ(MEM)、ライトバック(WB)の5個の処理単位で構成されるとする。命令1(Inst1)のパイプライン処理は以下のようになる。IFはLSI_Aで処理され、TR1のサイクルでIFの結果がLSI_Bに転送され、RF、EXがLSI_Bで実施される。TR2のサイクルで、EXの結果が、LSI_Aに転送され、MEM、WBはLSI_Aで実施される。命令2(Inst2)以降も同様である。このように、LSI間の通信及び演算が同期していた場合、細かい処理単位を複数LSIに分散させることができる。各LSIが個々の処理単位に特化していると、システム全体の演算スループットを向上できる。
図5は、動画のデコード処理を示したものであり、処理単位が図4のパイプライン動作よりも大きい例である。動画のデコード処理単位は、エンコードされたストリームデータをデコードするデコード(Decode)処理、色変換(Color conversion)処理、拡大縮小(Scaling)処理、ブレンド(Blend)処理から構成される。図5の例では、デコード処理と、色変換処理はLSI_Aで実施され、その結果が、LSI_Bに転送され、LSI_Bで拡大縮小処理、ブレンド処理が実施される。ここでは、動画のデコード処理を例として示したが、LSI間の通信と演算の同期している場合の動作はこれに限定するものではなく、動画のエンコード処理や、画像処理にも応用できる。
図6には、本発明の第一の実施例に係るLSI間の通信と演算の同期を可能にする回路図を示す。図1の外部通信LSIと演算LSIが2枚積層された構成に特化して示している。各LSIには、水晶発振器クロック信号を逓倍するPLL、クロック信号を分配するクロックパルスジェネレータ、フリップフロップ回路が搭載される。演算LSIには、クロック位相比較器(CMP)、ディレイコントローラ(Delay_CTL)、ディレイチェイン(Delay_Chain)が搭載される。位相比較器、ディレイコントローラ、ディレイチェインを合わせてDLL回路と呼ぶ。各LSIの通信及び演算を同期させるため、外部通信LSIから同期用基準クロック信号が貫通電極(TVCLK)を介して、演算LGLSI1、LGLSI2のクロック位相比較器に入力される。外部通信LSIのFF1から送信されるデータは、貫通電極(TVSIG_A)を介して、演算LSIのフリップフロップ回路に入力される。LGLSI2のFF6から送信されるデータは、貫通電極(TVSIG_B)を介して、LGLSI1と外部通信LSIのフリップフロップ回路に入力される。図6では、各LSI回路間の通信にかかわるフリップフロップ回路のみ記載しており、組み合わせ回路や、他の回路ブロックについては図示していない。
本システムの動作について記載する。外部通信LSIとLGLSI1の通信及び演算が同期しているためには、FF1、FF2とFF3、FF4に供給されるクロックの位相差が、LGLSI1と外部通信LSI間の配線ディレイ分ずれた状態である必要がある。また、外部通信LSIとLGLSI2の通信及び演算が同期しているためには、FF1、FF2とFF5、FF6に供給されるクロックの位相差が、LGLSI2と外部通信LSI間の配線ディレイ分ずれた状態である必要がある。外部通信LSIからの同期用基準クロック信号が貫通電極(TVCLK)を介して、LGLSI1、LGLSI2のクロック位相比較器に入力される。この時、LGLSI1及び、LGLSI2に入力される同期用クロック信号は各演算LSIと外部通信LSIの配線ディレイ分の位相差がずれた状態である。LGLSI1、LGLSI2の個々のクロック信号は、PLL、CPG、Delay_Chainを介して位相比較器に入力される。演算LSI内部の個々のクロック信号の位相を、DLLで調整することで、外部通信LSIの同期用クロック信号と配線ディレイ分位相差がずれた状態に設定できる。この結果、外部通信LSIと、LGLSI1、LGLSI2の通信及び演算が同期する。LGLSI1、LGLSI2の通信及び演算が同期しているため、細かい処理単位を個々の演算LSIに分散させることができ、システム全体の演算スループットを向上できる。
本実施例では、水晶発信器(Crystal)からの基準クロック信号を、シリコン貫通電極を介して各演算LSIや外部通信LSIに供給している。このため、各LSIに分配される基準クロック信号は、シリコン貫通電極分の配線ディレイが含まれており、PLL回路から出力されるクロック信号を利用すれば、各LSI間を同期させることが可能になる。しかしながら、本実施例では、PLLの他にDLL回路を設け、かつ、他のLSIの内部動作に用いられるクロック信号をTVCLKを介して同期用基準クロック信号として受け取る構成としている。これは、クロックパルスジェネレータ等で発生する、プロセスばらつきやダイナミックノイズを原因とした各LSI間のクロック位相差を抑制するためである。
図7には、本発明の第二の実施例に係る演算LSI一形態が示される。LSI3の特徴は、位相調整用のDLL回路が通信回路ブロックであるプロセッサユニット(PU1、PU2)毎に一つずつ搭載され、本DLL回路により、外部基準クロック信号に同期したクロックを、プロセッサユニット(PU1、PU2)に供給できることである。この結果、図2の例と比較して、各プロセッサユニットの負荷に応じた周波数を設定できるようになり、消費電力低減が可能となる。一方、PU1とPU2間、あるいは、PU1、PU2と、BUS間のクロックは同期でなくなる。そのため、非同期通信回路AS1、AS2を経由して、夫々の回路ブロック間でデータを送受信することになる。具体的には、AS1は、PU1とBUSとの非同期通信で、AS2は、PU2とBUSとの非同期通信で使用される。
図8には、本発明の第三の実施例に係る演算LSI間の通信と演算の同期を可能にする回路図を示す。外部通信LSIから供給される同期用基準クロック信号を常に送信し続ける場合、クロック信号のトグルによる配線容量充放電消費電力が増大する。そこで、本システムでは、通信時のみに同期用基準クロック信号を送信することで、同期用基準クロック送信電力を削減する。動作例として、外部通信LSIがLGLSI1に対してデータを送信したい場合と、LGLSI1が外部通信LSIに対してデータ要求を行う場合がある。外部通信LSIがLGLSI1に対してデータを送信したい場合、クロックコントローラ(CLK_CTL)がクロックイネーブル信号(CLK_ENL)をアサートして、同期用基準クロックをLGLSI1に送信する。位相調整を実施するために数サイクル待った後、FF1からFF3に対してデータを送信する。一方、LGLSI1が外部通信LSIに対してデータ要求を行う場合は、LGLSI1に備わるデータリクエストコントローラDREQが、リクエスト用信号REQ_SIGをアサートする。この結果、データリクエストをキャッチしたCLK_CTLがCLK_ENLをアサートして、同期用基準クロックを送信開始する。その後の動作は前記と同様である。このように、本実施例では、通信時のみに同期用基準クロック信号を送信することで、同期用基準クロック送信電力を削減することが可能となる。
図9には、本発明の第四の実施例に係る演算LSI間の通信と演算の同期を可能にする回路図を示す。第一の実施例と異なる点は、フリップフロップ間のデータ送信を隣接するLSI間のみで実施することである。このような構成の利点は、後に示すように貫通電極の本数を削減できることである。
第一の実施例では、図6で示したように、外部通信LSIのFF1からは、LGLSI1のFF3、LGLSI2のFF5に対して直接データを送信できる。一方、本実施例では、図9に示すように、外部通信LSIから、LGLSI2へのデータ送信を実施する場合、一旦LGLSI1のフリップフロップ回路FF3でラッチし、その後、セレクタSEL1,フリップフロップ回路FF5を介して、LGLSI2へ送信される。LGLSI2への同期用基準クロック信号は、外部通信LSIに同期したLGLSI1のクロック信号をLGLSI2へ送信する。さて、第一の実施例では、データ送信を行うフリップフロップの数だけ、貫通電極が必要となる。そのため、例えば、LGLSI1から外部通信LSIやLGLSI2に対してデータを送信する場合、図6には示されていない新たな貫通電極が必要となる。一方、本実施例の構成では、LGLSI1からLGLSI2にデータを送信する場合、LGLSI1の送信データをINS1から入力し、セレクタSEL1を介してFF5から、LGLSI2へ送信することができる。或いは、INS2からデータを入力して、LGLSI1から外部通信LSIにデータ送信することも可能である。つまり、本実施例の構成を取ることで、データ送信方向に対して、一本の貫通電極があればよく、第一の実施例の構成に対して貫通電極の本数を削減することが可能になる。
図10には、本発明の第五の実施例に係る積層されたLSIの一形態が示される。基本的には図1と同じ構成のため詳細な説明は省略するが、実施例1の図1との比較において、本実施例の特徴は、同期用クロック信号を、コイルによる誘導結合無線通信(WLICLK)で実施することである。
図11には、本発明の第五の実施例に係るLSI間の通信と演算の同期を可能にする回路図を示す。本発明の特徴は、同期用クロック信号の送信をコイルによる誘導結合無線通信で実施することである。この結果、位相比較起用のコンパレータを特別に設置する必要がなくなる。図12及び図13の波形図と合わせて動作を説明する。はじめに、外部通信LSIと、LGLSI1のクロック位相がずれている場合の動作を、図12の波形図を用いて記載する。外部通信LSIの基準クロック信号(SIGA)の立ち上がり立ち下りエッジにおいて、コイルに誘導起電力信号(SIGB)が発生する。一方、演算LSIの内部クロック信号(SIGC)に立ち上がり立ち下りエッジにおいても、コイルに誘導起電力信号(SIGD)が発生する。ここで、SIGDの磁場の向きは、SIGBと反対である。SIGB、SIGDの磁場を位相比較用コイルで受信した時の誘導起電力信号がSIGEとなる。位相がずれているため、SIGEには各クロックの立ち上がり立ち下がりエッジに応じた誘導起電力が発生する。この信号が、Delay_CTLに入力され、適正なディレイ段をDelay_Chainに設定し、各クロックに位相が合わされる。
図13に、外部通信LSIと、LGLSI1のクロック位相が合っている場合の波形図を示す。外部通信LSIの基準クロック信号(SIGA)の立ち上がり立ち下りエッジにおいて、コイルに誘導起電力信号(SIGB)が発生する。一方、演算LSIの内部クロック信号(SIGC)に立ち上がり立ち下りエッジにおいても、コイルに誘導起電力信号(SIGD)が発生する。ここで、SIGDの磁場の向きは、SIGBと反対である。SIGB、SIGDの磁場を位相比較用コイルで受信した時の誘導起電力信号がSIGEとなる。位相が合っているため、各磁場がキャンセルされ、SIGEには誘導起電力が発生しない。この結果を持って、Delay_CTLは位相が合ったことを判断する。本実施例では、同期用クロック信号の送信をコイルによる誘導結合無線通信で実施することで、位相比較起用のコンパレータを特別に設置する必要がなくなる。
以上、本発明の好適な実施例について説明したが、本発明は上記実施例に限定されるものではなく、本発明の精神を逸脱しない範囲内において、種々の設計変更をなし得ることは勿論である。
CLK1,CLK2,CLK_PU,CLK_BUS,CLK_MEMC,CLK_PERI,CLK_A,CLK_B,CLK_C:クロック配線、IN1〜3:入力ポート、OUT1〜3:出力ポート、FF,FF1〜10:フリップフロップ回路、Comb:組み合わせ回路、PLL:Phase Locked Loop、Crystal:外部水晶発振器、CPG:クロックパルスジェネレータ、PU1〜2,PU_A,PU_B:プロセッサユニット、SIA,SIB:接続配線、IF_A,IF_B:外部インタフェース回路、IF_AB:外部インタフェース配線、BUS:バス、MEMC:メモリコントローラ、PERI:周辺回路、SI1〜4:バス接続配線、LSI1〜3,LAI_A,LSI_B,LGLSI1,LGLSI2,LGLSI3:演算LSI、MEMLSI:メモリLSI、COMLSI:外部通信LSI、PKGB:パッケージ基板、SYSB:システムボード、TVSIG,TVSIG_A,TVSIG_B:信号用シリコン貫通電極、WLICLK:クロック信号用コイル、TVCLK:クロック信号用シリコン貫通電極、TVCRY:基準クロック信号用シリコン貫通電極、TVPW:電源用シリコン貫通電極、Delay_Chain:ディレイ段、Delay_CTL:ディレイ段調整用コントローラ、SIGA〜SIGF:内部シグナル、SEL1〜4:セレクタ、INS1〜4:内部信号、CMP:位相比較器、DREQ:データリクエストコントローラ、REQ_SIG:リクエスト用信号、CLK_CTL:クロックコントローラ、CLK_ENL:クロックイネーブル信号、AS1〜2:非同期通信回路、DLL,DLL1〜2:ディレイラインループ。

Claims (6)

  1. 第1クロック信号が供給される複数の第1フリップフロップと、前記複数の第1フリップフロップの間に接続される第1論理回路とを有する第1LSIと、
    前記第1LSIとは異なるチップに形成され、第2クロック信号が供給される複数の第2フリップフロップと、前記複数の第2フリップフロップの間に接続される第2論理回路とを有する第2LSIとを具備し、
    前記第1LSIと前記第2LSIは、一つの半導体パッケージ内に積層され、
    前記第1LSIは、前記第1クロック信号に基づいて前記第2LSIにデータを送信し、
    前記第2LSIは、前記第2クロック信号に基づいて前記第1LSIから送信されたデータを受信し、
    前記第2クロック信号は、前記第1クロック信号と同期するように制御され、
    前記第1LSIの前記第1クロック信号は、前記第2LSIを貫通して設けられ、前記第1、及び第2LSIを互いに電気的に接続するための第1貫通電極により、前記第2LSIに送信され、
    前記第2LSIは、第1DLL回路を有し、前記第1DLL回路は、前記第1貫通電極を介して供給された前記第1クロック信号に基づいて前記第2クロック信号の位相を制御するものであり、
    前記第1LSIは、前記第1LSIから前記第2LSIに対して送信する前記第1クロック信号を制御するクロックコントローラ回路を具備し、
    前記クロックコントローラ回路は、前記第1LSIと前記第2LSIが通信を行うときのみ、前記第1クロック信号を送信することを特徴とする半導体装置。
  2. 請求項1において、
    前記第2LSIの上方に配置され第3クロック信号が供給される複数の第3フリップフロップと、前記第3フリップフロップの間に接続される論理回路とを有する第3LSIを更に具備し、
    前記第1貫通電極は、更に前記第3LSIを貫通し、前記第1、第2LSI及び第3LSIを互いに電気的に接続し、前記第1LSIの前記第1クロック信号は、前記第1貫通電極により、前記第2LSI及び第3LSIに送信され、
    前記第3クロック信号は、前記第1クロック信号に同期するように制御されることを特徴とする半導体装置。
  3. 請求項1において、
    前記第2LSIの上方に配置され、第3クロック信号が供給される複数の第3フリップフロップと、前記第3フリップフロップの間に接続される論理回路とを有する第3LSIと、
    前記第2LSI及び第3LSIを貫通して設けられ、第2LSI及び第3LSIを互いに電気的に接続するための第2貫通電極とを更に具備し、
    前記第2LSIの前記第2クロック信号は、前記第2貫通電極により、前記第3LSIに送信され、
    前記第3クロック信号は、前記第2クロック信号に同期するように制御されることを特徴とする半導体装置。
  4. 請求項3記載において、
    前記第1LSIから前記第3LSIへのデータ送信は、前記複数の第2フリップフロップの一部を介して行われることを特徴とする半導体装置。
  5. 請求項1において、
    前記第1LSIは、前記第1クロック信号を送信する第1無線通信回路をさらに有し、
    前記第2LSIは、前記第1クロック信号を受信する第2無線通信回路をさらに有することを特徴とする半導体装置。
  6. 請求項5において、
    前記第2LSIは、前記第2クロック信号を送信する第3無線通信回路を更に有し、
    前記第1無線通信回路は、前記第1クロック信号に対応した第1磁場を生成することで前記第1クロック信号を送信し、
    前記第2無線通信回路は、前記第2クロック信号に対応した第2磁場を生成することで前記第2クロック信号を送信し、
    前記第2無線通信回路は、前記第1磁場及び前記第2磁場の両方を受けて、誘導起電力信号を生成することで、前記第1クロック信号及び前記第2クロック信号の位相差を比較することを特徴とする半導体装置。
JP2009010499A 2009-01-21 2009-01-21 半導体装置 Expired - Fee Related JP5070228B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009010499A JP5070228B2 (ja) 2009-01-21 2009-01-21 半導体装置
US12/690,659 US7994822B2 (en) 2009-01-21 2010-01-20 Semiconductor device for synchronous communication between stacked LSI

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009010499A JP5070228B2 (ja) 2009-01-21 2009-01-21 半導体装置

Publications (3)

Publication Number Publication Date
JP2010171092A JP2010171092A (ja) 2010-08-05
JP2010171092A5 JP2010171092A5 (ja) 2011-10-20
JP5070228B2 true JP5070228B2 (ja) 2012-11-07

Family

ID=42336451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009010499A Expired - Fee Related JP5070228B2 (ja) 2009-01-21 2009-01-21 半導体装置

Country Status (2)

Country Link
US (1) US7994822B2 (ja)
JP (1) JP5070228B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8179173B2 (en) * 2010-03-12 2012-05-15 Raytheon Company Digitally calibrated high speed clock distribution
US8384435B2 (en) * 2011-01-05 2013-02-26 Texas Instruments Incorporated Clock switching circuit with priority multiplexer
JP5643665B2 (ja) * 2011-01-24 2014-12-17 学校法人慶應義塾 積層型半導体集積回路装置
JP5643673B2 (ja) * 2011-02-16 2014-12-17 学校法人慶應義塾 電子回路
US8786080B2 (en) * 2011-03-11 2014-07-22 Altera Corporation Systems including an I/O stack and methods for fabricating such systems
JP5807550B2 (ja) 2012-01-10 2015-11-10 株式会社ソシオネクスト 半導体装置
JP6312377B2 (ja) * 2013-07-12 2018-04-18 キヤノン株式会社 半導体装置
US9231603B2 (en) 2014-03-31 2016-01-05 International Business Machines Corporation Distributed phase detection for clock synchronization in multi-layer 3D stacks
US10147658B2 (en) 2014-06-09 2018-12-04 SK Hynix Inc. Stacked semiconductor apparatus being electrically connected through through-via and monitoring method
KR20150141018A (ko) * 2014-06-09 2015-12-17 에스케이하이닉스 주식회사 관통 비아를 통해 연결되는 적층 반도체 장치 및 모니터링 방법
US9319829B1 (en) * 2014-10-30 2016-04-19 Hua Wen Hsu Wireless inductive pointer clock
JP2017163204A (ja) * 2016-03-07 2017-09-14 APRESIA Systems株式会社 通信装置
KR102605617B1 (ko) 2016-11-10 2023-11-23 삼성전자주식회사 적층 반도체 패키지

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4063392B2 (ja) * 1998-03-26 2008-03-19 富士通株式会社 信号伝送システム
JP3475857B2 (ja) * 1999-06-03 2003-12-10 日本電気株式会社 ソースシンクロナス転送方式
JP2001251283A (ja) * 2000-03-06 2001-09-14 Hitachi Ltd インターフェース回路
US6331800B1 (en) * 2000-07-21 2001-12-18 Hewlett-Packard Company Post-silicon methods for adjusting the rise/fall times of clock edges
JP4752369B2 (ja) * 2004-08-24 2011-08-17 ソニー株式会社 半導体装置および基板
JP5063958B2 (ja) 2006-08-18 2012-10-31 川崎マイクロエレクトロニクス株式会社 半導体集積回路および半導体集積回路の設計方法
JP5149554B2 (ja) * 2007-07-17 2013-02-20 株式会社日立製作所 半導体装置
JP2009032857A (ja) * 2007-07-26 2009-02-12 Hitachi Ltd 半導体集積回路および半導体装置
US8781053B2 (en) * 2007-12-14 2014-07-15 Conversant Intellectual Property Management Incorporated Clock reproducing and timing method in a system having a plurality of devices
JP5258343B2 (ja) * 2008-03-27 2013-08-07 ルネサスエレクトロニクス株式会社 半導体装置及び半導体集積回路

Also Published As

Publication number Publication date
US20100182046A1 (en) 2010-07-22
US7994822B2 (en) 2011-08-09
JP2010171092A (ja) 2010-08-05

Similar Documents

Publication Publication Date Title
JP5070228B2 (ja) 半導体装置
US10846252B2 (en) Dynamic random access memory (DRAM) component for high-performance, high-capacity registered memory modules
US9886275B1 (en) Multi-core processor using three dimensional integration
CN111753489A (zh) 模块化的集成电路设备中管芯间和管芯内通信的片上网络
WO2014085689A1 (en) Clock distribution network for 3d integrated circuit
US20050127490A1 (en) Multi-die processor
JP2010186764A (ja) 半導体集積回路装置
TWI474331B (zh) Semiconductor device
JP2010171092A5 (ja)
KR20130011355A (ko) 반도체 집적회로 및 그의 신호 전달 방법
JP6138032B2 (ja) 集積回路及びそれを備える積層回路
JP2009032857A (ja) 半導体集積回路および半導体装置
TWI300582B (en) Programming semiconductor dies for pin map compatibility
JP4327699B2 (ja) マルチチップ・パッケージおよびicチップ
JP2009246246A (ja) 低容量貫通電極を持つ3次元積層構造体およびコンピュータシステム
JP2010086030A (ja) 情報処理装置
JP2002057270A (ja) チップ積層型半導体装置
TW494293B (en) Clock signal network structure
JP5807550B2 (ja) 半導体装置
Chacin et al. COOL interconnect low power interconnection technology for scalable 3D LSI design
JP5957103B2 (ja) 半導体チップと半導体チップパッケージ
JP2011061573A (ja) 半導体装置
JP2003203046A (ja) 回路構成
JP2004259285A (ja) クロックツリー合成装置及び方法
JP2007109773A (ja) 大規模半導体集積回路装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110905

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120724

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees