JP2022546472A - コンピュータデバイス及びその製造方法 - Google Patents

コンピュータデバイス及びその製造方法 Download PDF

Info

Publication number
JP2022546472A
JP2022546472A JP2022513444A JP2022513444A JP2022546472A JP 2022546472 A JP2022546472 A JP 2022546472A JP 2022513444 A JP2022513444 A JP 2022513444A JP 2022513444 A JP2022513444 A JP 2022513444A JP 2022546472 A JP2022546472 A JP 2022546472A
Authority
JP
Japan
Prior art keywords
silicon substrate
capacitor
supply voltage
computer
computer structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022513444A
Other languages
English (en)
Other versions
JP7379666B2 (ja
Inventor
フェリックス ステファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Graphcore Ltd
Original Assignee
Graphcore Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Graphcore Ltd filed Critical Graphcore Ltd
Publication of JP2022546472A publication Critical patent/JP2022546472A/ja
Application granted granted Critical
Publication of JP7379666B2 publication Critical patent/JP7379666B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L25/00Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
    • H01L25/16Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof the devices being of types provided for in two or more different main groups of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. forming hybrid circuits
    • H01L25/162Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof the devices being of types provided for in two or more different main groups of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. forming hybrid circuits the devices being mounted on two or more different substrates
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K1/00Printed circuits
    • H05K1/02Details
    • H05K1/0213Electrical arrangements not otherwise provided for
    • H05K1/0216Reduction of cross-talk, noise or electromagnetic interference
    • H05K1/023Reduction of cross-talk, noise or electromagnetic interference using auxiliary mounted passive components or auxiliary substances
    • H05K1/0231Capacitors or dielectric substances
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/48Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor
    • H01L23/488Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor consisting of soldered or bonded constructions
    • H01L23/498Leads, i.e. metallisations or lead-frames on insulating substrates, e.g. chip carriers
    • H01L23/49822Multilayer substrates
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/48Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor
    • H01L23/488Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor consisting of soldered or bonded constructions
    • H01L23/498Leads, i.e. metallisations or lead-frames on insulating substrates, e.g. chip carriers
    • H01L23/49827Via connections through the substrates, e.g. pins going through the substrate, coaxial cables
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/48Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor
    • H01L23/50Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor for integrated circuit devices, e.g. power bus, number of leads
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/58Structural electrical arrangements for semiconductor devices not otherwise provided for, e.g. in combination with batteries
    • H01L23/64Impedance arrangements
    • H01L23/642Capacitive arrangements
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L25/00Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
    • H01L25/16Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof the devices being of types provided for in two or more different main groups of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. forming hybrid circuits
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L28/00Passive two-terminal components without a potential-jump or surface barrier for integrated circuits; Details thereof; Multistep manufacturing processes therefor
    • H01L28/40Capacitors
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K1/00Printed circuits
    • H05K1/02Details
    • H05K1/0213Electrical arrangements not otherwise provided for
    • H05K1/0215Grounding of printed circuits by connection to external grounding means
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K1/00Printed circuits
    • H05K1/02Details
    • H05K1/03Use of materials for the substrate
    • H05K1/0313Organic insulating material
    • H05K1/032Organic insulating material consisting of one material
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K1/00Printed circuits
    • H05K1/18Printed circuits structurally associated with non-printed electric components
    • H05K1/182Printed circuits structurally associated with non-printed electric components associated with components mounted in the printed circuit board, e.g. insert mounted components [IMC]
    • H05K1/184Components including terminals inserted in holes through the printed circuit board and connected to printed contacts on the walls of the holes or at the edges thereof or protruding over or into the holes
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K3/00Apparatus or processes for manufacturing printed circuits
    • H05K3/0058Laminating printed circuit boards onto other substrates, e.g. metallic substrates
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/02Bonding areas; Manufacturing methods related thereto
    • H01L2224/04Structure, shape, material or disposition of the bonding areas prior to the connecting process
    • H01L2224/0401Bonding areas specifically adapted for bump connectors, e.g. under bump metallisation [UBM]
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/02Bonding areas; Manufacturing methods related thereto
    • H01L2224/04Structure, shape, material or disposition of the bonding areas prior to the connecting process
    • H01L2224/05Structure, shape, material or disposition of the bonding areas prior to the connecting process of an individual bonding area
    • H01L2224/05001Internal layers
    • H01L2224/05075Plural internal layers
    • H01L2224/0508Plural internal layers being stacked
    • H01L2224/05085Plural internal layers being stacked with additional elements, e.g. vias arrays, interposed between the stacked layers
    • H01L2224/05089Disposition of the additional element
    • H01L2224/05093Disposition of the additional element of a plurality of vias
    • H01L2224/05094Disposition of the additional element of a plurality of vias at the center of the internal layers
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/12Structure, shape, material or disposition of the bump connectors prior to the connecting process
    • H01L2224/13Structure, shape, material or disposition of the bump connectors prior to the connecting process of an individual bump connector
    • H01L2224/13001Core members of the bump connector
    • H01L2224/13099Material
    • H01L2224/131Material with a principal constituent of the material being a metal or a metalloid, e.g. boron [B], silicon [Si], germanium [Ge], arsenic [As], antimony [Sb], tellurium [Te] and polonium [Po], and alloys thereof
    • H01L2224/13101Material with a principal constituent of the material being a metal or a metalloid, e.g. boron [B], silicon [Si], germanium [Ge], arsenic [As], antimony [Sb], tellurium [Te] and polonium [Po], and alloys thereof the principal constituent melting at a temperature of less than 400°C
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/12Mountings, e.g. non-detachable insulating substrates
    • H01L23/14Mountings, e.g. non-detachable insulating substrates characterised by the material or its electrical properties
    • H01L23/147Semiconductor insulating substrates
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/48Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor
    • H01L23/488Arrangements for conducting electric current to or from the solid state body in operation, e.g. leads, terminal arrangements ; Selection of materials therefor consisting of soldered or bonded constructions
    • H01L23/498Leads, i.e. metallisations or lead-frames on insulating substrates, e.g. chip carriers
    • H01L23/49811Additional leads joined to the metallisation on the insulating substrate, e.g. pins, bumps, wires, flat leads
    • H01L23/49816Spherical bumps on the substrate for external connection, e.g. ball grid arrays [BGA]
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L24/00Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
    • H01L24/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L24/02Bonding areas ; Manufacturing methods related thereto
    • H01L24/04Structure, shape, material or disposition of the bonding areas prior to the connecting process
    • H01L24/05Structure, shape, material or disposition of the bonding areas prior to the connecting process of an individual bonding area
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L24/00Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
    • H01L24/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L24/10Bump connectors ; Manufacturing methods related thereto
    • H01L24/12Structure, shape, material or disposition of the bump connectors prior to the connecting process
    • H01L24/13Structure, shape, material or disposition of the bump connectors prior to the connecting process of an individual bump connector
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2924/00Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
    • H01L2924/0001Technical content checked by a classifier
    • H01L2924/00014Technical content checked by a classifier the subject-matter covered by the group, the symbol of which is combined with the symbol of this group, being disclosed without further technical details
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2924/00Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
    • H01L2924/10Details of semiconductor or other solid state devices to be connected
    • H01L2924/11Device type
    • H01L2924/14Integrated circuits
    • H01L2924/143Digital devices
    • H01L2924/1434Memory
    • H01L2924/1435Random access memory [RAM]
    • H01L2924/1436Dynamic random-access memory [DRAM]
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K2201/00Indexing scheme relating to printed circuits covered by H05K1/00
    • H05K2201/01Dielectrics
    • H05K2201/0137Materials
    • H05K2201/0162Silicon containing polymer, e.g. silicone

Landscapes

  • Engineering & Computer Science (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Power Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • General Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Manufacturing & Machinery (AREA)
  • Semiconductor Integrated Circuits (AREA)

Abstract

第1の態様によれば、第1のシリコン基板と、第2のシリコン基板とを含むコンピュータ構造が提供される。計算動作を実行するように構成されたコンピュータ回路類が第1のシリコン基板に形成され、この基板は、自己支持深さ及び内側対向面を有する。複数の分布容量ユニットが第2のシリコン基板に形成され、この基板は、第1の基板の内側対向面と重なって位置する内側対向面を有し、これらの内側対向面間で構造の深さ方向に延在して配置されたコネクタのセットを介して第1の基板に接続される。内側対向面は、一致する平面寸法を有する。第2の基板は、コンピュータ構造を電源電圧に接続するための複数のコネクタ端子が配置される外側対向面を有する。第2の基板は、第1の基板よりも小さい深さを有する。

Description

本開示は、コンピュータ構造における処理回路類への電源電圧の変動の制御に関する。
コンピュータ構造のための電圧供給の制御に関する問題が知られている。特に、オンチップ処理回路類の電流需要が大きく変化すると、電源電圧に望ましくないアーチファクトが生じる。電流需要の変化は、負荷ステップと呼ばれる。
アーチファクトの1つは、電源電圧の低下(droop)であり、これは、負荷アドミタンスが急激に増加したときに発生する。これは、電力源と、電流を引き込む回路類との間に存在する回路類の直列抵抗及びインダクタンスの結果である。これらの介在する素子の抵抗及びインダクタンスは、回路への導入を意図したものではなく、むしろチップ上の回路素子の不可避の特性であるため、寄生抵抗及び寄生インダクタンスと呼ばれることがある。
電源電圧の低下を低減するいくつかの方法がある。介在する回路類は、例えば、短いワイヤ又は大きい直径のワイヤを使用してワイヤの抵抗を低減するように変更することができる。インピーダンスの低いワイヤを使用して、コネクタの取り外しと同様に電源電圧の低下を低減させることも可能である。しかしながら、これらの解決策は、回路類の寸法が比較的固定されるチップでの用途に適していない。また、必要な電流を回路類のサイズと比較すると、このような幾何学的変化が電源電圧の低下にほとんど効果を有さないことを意味する。
電源電圧の低下を制限するための既知の技法の1つは、電源電圧と、電流を引き込む回路との間に容量を提供することである。
コンピュータ構造で現在利用可能な容量の多くの可能な供給源が存在し、それらの一部について以下の説明でさらに論じるが、これらのいずれも、電流需要が高い/電源電圧が低い構造での電圧低下に適切に対処するには容量が十分ではない。
本発明の第1の態様によれば、コンピュータ構造であって、計算動作を実行するように構成されたコンピュータ回路類が形成される第1のシリコン基板であって、自己支持深さ及び内側対向面を有する第1のシリコン基板と、複数の分布容量ユニットが形成される第2のシリコン基板であって、第1の基板の内側対向面と重なって位置する内側対向面を有し、内側対向面間で構造の深さ方向に延在して配置されたコネクタのセットを介して第1の基板に接続され、第2のシリコン基板の内側対向面は、第1のシリコン基板の内側対向面の平面寸法に一致する平面寸法を有する、第2のシリコン基板と、を含み、第2のシリコン基板は、コンピュータ構造を電源電圧に接続するための複数のコネクタ端子が配置される外側対向面を有し、第2のシリコン基板は、第1のシリコン基板よりも小さい深さを有する、コンピュータ構造が提供される。
第1及び第2のシリコン基板の内側対向面は、1つ又は複数の接合層によって接合され得る。
コネクタは、第2のシリコン基板を通して第1のシリコン基板まで延在して、コネクタ端子と第1のシリコン基板との間に電気接続を提供するシリコン貫通ビアを含むことができる。
各分布容量ユニットは、予め決められた数の0.1~1.5nFの範囲の容量を有するキャパシタブロックを含むことができる。予め決められた数は、10~20であり得る。
各分布容量ユニットは、5~30nFの範囲の容量を有することができる。
分布容量ユニットの総平面面積は、第1のシリコン基板の総平面面積の少なくとも80%であり得、複数の分布容量ユニットの容量は、0.5μF/mm~3μF/mmの範囲である。
第1のシリコン基板は、400μm~1000μmの深さを有することができる。
第2のシリコン基板は、10μm未満の非自己支持深さを有することができる。
分布容量ユニットは、規則的なアレイ状に配置され得、各分布容量ユニットは、電源電圧コネクタ端子及びアースコネクタ端子に接続される。
各コネクタ端子は、4つの異なる分布キャパシタ端子に接続され得る。
コネクタのセットは、コネクタ端子の場所で第1及び第2のシリコン基板間に接続を提供することができる。
各分布容量ユニットは、2つの禁止領域(keep-out region)を含むことができ、この禁止領域は、それぞれのコネクタ端子の場所にあり、禁止領域及びキャパシタブロックは、等しいサイズである。
各キャパシタブロックは、六角形アレイ状に配置されたトレンチキャパシタのアレイを含むことができ、各トレンチキャパシタは、6つの隣接するトレンチキャパシタを有し、各トレンチキャパシタは、その隣接するトレンチキャパシタから等距離に位置する。
シリコン貫通ビアは、分布容量ユニットの禁止領域に提供され得る。
コンピュータ回路類は、実行ユニット及びローカルメモリをそれぞれ有する複数の処理ユニットを含むことができ、複数の処理ユニットは、並行して計算するように構成される。
コンピュータ回路類は、バルク同期並列プロトコルに従って動作するように複数の処理ユニットを制御するように構成された同期回路類を含むことができる。
コンピュータ回路類は、処理ユニットの動作を制御するために接続されたクロックを含むことができる。
本発明の第2の実施形態によれば、コンピュータ構造を製造する方法であって、計算動作を実行するように構成されたコンピュータ回路類を含む第1のシリコン基板であって、自己支持深さを有する第1のシリコン基板を提供することと、複数の分布容量ユニットを含む第2のシリコン基板を提供することと、第1のシリコン基板の内側対向面を第2のシリコン基板の内側対向面に接合することであって、それにより、内側対向面は、重なって位置し、内側対向面は、一致する平面寸法を有することと、第2のシリコン基板を薄化することであって、それにより、第2の基板は、第1のシリコン基板よりも小さい深さを有することと、第2の基板の外側対向面上において、コンピュータ構造を電源電圧に接続するための複数のコネクタ端子を提供することとを含む方法が提供される。
第2のシリコン基板を薄化した後、シリコン貫通ビアが第2のシリコン基板に形成されて、コネクタ端子と第1のシリコン基板との間に接続を提供することができる。
第2のシリコン基板は、10μm未満の深さに薄化され得、それにより、第2のシリコン基板は、非自己支持深さを有する。
第1のシリコン基板は、700μm~800μmの深さを有することができる。
分布容量ユニットは、規則的なアレイ状に配置され得、各分布容量ユニットは、電源電圧コネクタ端子及びアースコネクタ端子に接続され得る。
各分布容量ユニットは、予め決められた数のキャパシタブロック及び2つの禁止領域を含むことができ、禁止領域は、2つのコネクタ端子の場所にあり、禁止領域及びキャパシタブロックは、等しいサイズである。
シリコン貫通ビアは、禁止領域の場所に形成され得る。
本発明をよりよく理解するために、また本発明をどのように実施することができるかを示すために、例として以下の図面を参照する。
引き込み電流とクロック周波数との間の関係を示すグラフである。 容量の最初の2つのレベルを図示する回路図である。 Colossus Mk1チップの負荷ステップ応答の一例を示すグラフである。 チップの負荷ステップ応答シミュレーションを示す。 負荷ステップ応答シミュレーションの拡大図を示す。 負荷ステップ応答シミュレーションの拡大図を示す。 WoWキャパシタを有するチップの負荷ステップ応答シミュレーションを示す。 WoWキャパシタを有するチップの負荷ステップ応答シミュレーションを示す。 積層ダイの一例の概略図である。 DRAMセルキャパシタの構造を示す。 DRAMセルキャパシタの構造を示す。 DRAMセルキャパシタの構造を示す。 繰り返し可能なキャパシタユニットの概略図である。 繰り返し可能なキャパシタユニットの概略図である。 C4バンプマップの一例を示す。 容量の3つのレベルを図示する回路図である。 WoWキャパシタがない場合及びある場合のチップのバンプで見られた電源インピーダンスを示す。 IPUを含む構造の概略図である。 シングルチッププロセッサのアーキテクチャの概略図である。 バルク同期並列プロトコルを図示する。
課題
特定のタイプのコンピュータがGraphcore社によって最近開発されており、これは、インテリジェントプロセッシングユニット(IPU)と呼ばれ、例えば米国特許出願公開第15/886009号明細書に記載されている。
Colossusは、Graphcore社によって製造されたこのようなIPUチップの1つである。IPUは、データ分析及び人工知能などの技術分野で使用することができる。IPUは、超並列で低精度の浮動小数点計算のために最適化され、他の解決策よりもはるかに高い計算密度を提供する。
図1は、IPUによって引き込まれたアンペア単位での電流と、IPUクロックのMHz単位での周波数との間の関係を示す。グラフは、収集されたデータが、1216個のタイルを含むIPUを形成することを示す。引き込み電流とクロック周波数との間に線形関係を見ることができる。すなわち、周波数が高くなるほど、チップの電流需要が高くなる。
IPUのほとんどのタイルが、各タイルの実行ユニットに供給される計算命令であるAMP命令の発出を開始又は停止すると、非常に著しい電流ステップが発生する可能性がある。
IPUが実行する機能に応じて、IPUによって引き込み電流の量が異なる。IPUが機能又は挙動を変更すると、引き込まれる電流が変化する。非常に著しい電流ステップが発生する場合の一例としては、「バルク同期並列」(BSP)時がある。BSPによれば、マルチタイルアレイの各タイルは、計算段階と交換段階とを交互に実行する。計算段階中、各タイルは、1つ又は複数の計算タスクをタイル上で局所的に実行するが、その計算の結果を他のいずれのタイルとも通信しない。交換段階では、各タイルは、前の計算段階からの計算の1つ又は複数の結果をグループ内の1つ又は複数の他のタイルと交換することが許可されるが、そのタイルが交換段階を終了するまで新たな計算段階を開始しない。さらに、この形態のBSP原理によれば、バリア同期は、計算段階から交換段階への移行時点若しくは交換段階から計算段階への移行時点又はその両方の時点で行われる。すなわち、(a)グループ内のいずれかが次の交換段階に進むことが許可される前に、すべてのタイルがそれぞれの計算段階を完了することが要求されるか、若しくは(b)グループ内のいずれかのタイルが次の計算段階に進むことを許可される前に、グループ内のすべてのタイルがそれぞれの交換段階を完了することを要求されるかのいずれか、又は(c)これらの両方である。本明細書で使用する場合の「計算段階と交換段階との間」という文言は、これらのすべての選択肢を包含する。
6つの異なるクロック周波数の電流需要を測定し、その結果が図1のグラフにプロットされ、測定された電流をアンペア単位で示す数値を点で表す。これらの測定値は、IPUの1216個のタイルのすべてにほぼ連続的にAMP命令を発出する間に得られた。電流がクロック周波数に比例するため、結果全体にわたって直線が当てはまる。
したがって、性能面では、高電流が望ましい。しかしながら、これらの高電流は、特にチップの複数の処理ユニットにわたって電流需要が瞬間的に生じた場合、電源電圧低下の問題を悪化させる。
1つ又は複数のIPUチップのための既存のパッケージ構造では、容量は、3つのレベルで供給される。第1のレベルは、回路の近くで供給される、本明細書でダイ容量と呼ばれる容量である。この容量は、電流引き込み回路、この事例ではチップに電気的に最も近いため、寄生インピーダンス及び寄生抵抗が最も小さくなるなど、即効性が最も大きいとはいえ、通常、小さいものである。
容量の第2のレベルは、ダイのエッジで供給される容量である(図15を参照されたい)。この容量は、本明細書でパッケージ容量と呼ばれ得る。この容量は、ダイ容量よりも電流引き込み回路から電気的に離れており、介在する抵抗/インダクタンスが大きくなるため、その効果が有用になるまでの時間が長くなる。
第3のレベルは、本明細書で「外部」容量と呼ばれる。これは、ダイが装着されるプリント回路基板(PCB)上のパッドの容量効果である(図15を参照されたい)。これは、パッドとダイとの間に物理的な距離があるため、負荷ステップが発生した場合、効果を発揮するのにさらに時間がかかる。
図13は、電力源1302をチップ1806に接続する回路類の抵抗、インダクタンス及び容量(RLC)成分を示す回路図である。この例では、チップは、Graphcore社製Colossus Mk2チップである。ダイ容量(第1のレベル)、パッケージ容量(第2のレベル)及びPCB容量(第3のレベル)は、すべて図13の回路図に示されている。
図2は、容量の最初の2つのレベルを表す回路図である。図2のチップ1806は、Graphcore社製Colossus Mk1チップである。
図2及び図13では、回路の部品の容量、抵抗及びインダクタンスに具体的な値が示されているが、これらの値が異なるような他の回路類部品を使用し得ることが理解されるであろう。
容量の第1のレベルは、ダイ1806によって供給されるが、このダイは、この例では、容量が10μFのオーダー、例えば5~30μF、10μFの範囲であり、抵抗が100μオームのオーダーである。容量及び抵抗は、ダイ1806の回路素子に固有のものである。
図2の回路図は、キャパシタ1808によって供給されるような容量の第2のレベルも表す。1μFの容量、2pHのオーダーのインダクタ及び200μオームのオーダーの抵抗器をそれぞれ有する数百個の別個のキャパシタ、例えば300個のキャパシタで構成された数百マイクロファラドの容量が存在する。数百個の別個のキャパシタ1808は、直列寄生インダクタンス及び直列寄生抵抗を最小限にするために、ダイ1806の周りに位置決めされ、特にパッケージに容量を加えるように提供される。パッケージインダクタンス及び抵抗は、回路に特別に導入されたものではなく、むしろ現実の電子デバイスに存在する固有のインダクタンス及び抵抗効果であるため、それぞれ寄生インダクタンス及び寄生抵抗と呼ばれることもある。容量の第2のレベルは、数100μFのオーダーである。
図1の直線の勾配を使用して、スイッチ容量は、以下の式を使用して計算される。
Figure 2022546472000002

ここで、Cは、容量であり、Iは、電流であり、Vは、電圧であり、及びFは、クロック周波数である。これは、推定される合計オンダイ容量のおよそ2.5%である。
電源電圧の「低下」は、容量の使用量と相関するが、高周波でクロックサイクルにわたって累積される。各クロックサイクルでは、2.5%の電源電圧の低下があり、上記で計算されたオンチップ容量のパーセンテージに対応する。これは、オンチップ容量の2.5%がクロックサイクルごとに切り替わるためである。電源電圧の降下は、複数のクロックサイクルにわたって累積され、場合により合計オンダイ容量を消費する可能性がある。
この例では、オンチップ容量が10%枯渇するまでに4つのクロックサイクルのみが発生する可能性がある。オンチップ容量が枯渇した直後には、パッケージ容量などのオフチップ容量に依存する。本明細書の事例のように、オンチップ容量が、各クロックサイクルと関連付けられる容量と比較して小さい場合、非常に短い時間後にはオフチップ容量に依存する。これについては、後に図5を参照してより詳細に説明する。
図13は、Graphcore社製Colossus Mk2論理チップの電源を減結合(decoupling)するためのRLC回路図を示す。上述したように、この回路は、3つのレベルの容量のすべて、すなわち図2にも示されるダイ容量及びパッケージ容量と、追加で外部容量とを表す。外部容量は、チップのダイバンプの反対側、すなわち電力源とダイバンプとの間に位置する。
ダイは、容量が20μFのオーダー、例えば5~30μFの範囲であり、抵抗が300μオームのオーダーであることが示されている。パッケージは、抵抗が200μオームのオーダーであり、インダクタンスが2pHのオーダーであり、容量が数百マイクロファラドのオーダー、例えば800μF前後である。
およそ2MHz未満の負荷過渡現象の周波数成分には、パッケージに近いPCB上の大型の(バルク)キャパシタを組み合わせること及びダイの電源電圧を監視し、電流の送達の増加による電圧低下に反応する電力源フィードバックループによって対処する。
図13に示される容量の第3のレベルは、数1000μFのオーダーであり、数10pHの寄生直列インダクタンスを有する。
本明細書において上記で提示した既存のパッケージの抵抗、インダクタンス及び容量の値は、例として与えられることが理解されるであろう。パッケージの設計及び電力源の配置には、幅広いバリエーションがある。しかしながら、いずれの場合にも、特に高周波、高電流の需要に対処するためにオンダイ容量を向上させる必要がある。
図13に図示される別個のキャパシタは、有意な固有の直列抵抗及びインダクタンスをそれぞれ有するが、それらは、RLC図に図示されていない。
寄生インダクタンスは、様々な別個のキャパシタがいつ有効になるかに影響を及ぼす。オンダイ容量は、負荷ステップの0~0.25ns後に効果が大きくなる。パッケージ容量は、約10ns後に効果を現わす。パッケージ/ボール及びPCB容量は、約250ns後に効果を現わす。ほとんどの電力源には、電圧低下に対処することを目的とした容量フィードバックループを動作させるレギュレータが組み込まれるが、これは、より長い時間枠、例えば1~2μsで反応する。
図3は、負荷ステップが適用された場合のColossus Mk1チップの負荷ステップ応答を示し、50V前後の電圧降下が生じる。負荷ステップは、計算動作実行時のオンチップ処理回路類の電流需要の変化に対応する。
例えば、チップの挙動が、高電力が必要な計算の実行から、コンピュータ集約度が低いタイル間のデータ交換に変化するとき、負荷ステップが存在する。このような負荷ステップは、前述したようなBSP構造では悪化する可能性がある。
電源電圧VSSの急激な変化を回避することが望ましい。電源電圧が一定のままであり、電流の変化が電源電圧に影響を与えないようになっていれば理想的である。しかしながら、電気部品の不完全性により、これが実現できる可能性はほとんどない。したがって、目的は、電源電圧の低下を低減し、電源電圧の急激な変化を平滑化することである。
図3では、IPUに印加された初期電源電圧Vinitialは、およそ800mVである。最低電圧Vminは、750mV前後である。予め決められた最低電源電圧が存在するが、これは、チップが安全に動作し、電源電圧がそれよりも低下し得ない最も低い電圧である。したがって、電源電圧VDDは、ダイで得られるVminが、予め決められた最低電源電圧よりも絶対に低くならないようにゆとりを設ける必要がある。
ダイで得られる最低電源電圧は、負荷電流に対する電圧の過渡応答による影響を受ける。これには、アンダーシュートを含む可能性のあるプロファイルを有する電源電圧低下が含まれる。電圧低下(droop)は、レギュレータが電源電圧を維持するように作用するまで、引き込まれる電流の増加に応じて電源電圧が低下する現象である。したがって、これに対処する必要がある。現在のところ、アンダーシュート時の最低電源電圧が、予め決められた最低電源電圧を上回るように、初期電源電圧を上昇させることによりこれを実現する。
図4は、図2に表されるようなGraphcore社製Colossus Mk1チップを使用する負荷ステップ応答のシミュレーションを示す。
グラフは、IPUのダイバンプで供給された約0.8~0.9Vの初期電圧、すなわち1Vのオーダーの電圧を示す。時間がx軸上に、電源電圧がy軸上にプロットされている。t=0.0001秒において、電流需要が80Aから300Aまで増加する負荷ステップがあり、その結果、時間t=0.0001秒前後で負荷ステップ応答を示す。
初期電源電圧は、無負荷での電源電圧である。負荷がかかったとき、例えば電流需要が増加したとき、電気部品に電流が流れ、これらの部品の固有の抵抗及びインダクタンスによって電源電圧を降下させるようになっている。
電源電圧は、0.8V前後で安定化することがわかる。初期電源電圧と、安定化した電源電圧又は定常状態の電源電圧との間の差は、IR降下によるものであり、安定した負荷線に維持される。
しかしながら、安定化前に、定常状態の電圧の電源電圧を下回る電源電圧アンダーシュートがある。滑らかな想定電圧低下曲線を下回って電源電圧が急激に低下すると、過渡応答でアンダーシュートが発生する。
図2に示される素子の寄生インダクタンス及びキャパシタ部品の減結合による第1のアンダーシュートがある。レギュレータの応答による別のアンダーシュートが後に存在する。アンダーシュートについては、後に図5を参照してより詳細に説明する。
その後、時間t=0.00136秒で負荷解放の結果として第2の負荷ステップ応答があり、電流需要が減少する。すなわち、電流が減少するため、電源電圧が上昇する。その結果、2つのオーバーシュートが生じる。第1のオーバーシュートは、図2のインダクタとキャパシタ部品との減結合によるものであり、第2のオーバーシュートは、電源チョーク(図13を参照されたい)から減結合キャパシタへの電圧のダンピングによるものである。電圧ダンピングは、以下の式から得られる。
E=0.5LI
ここで、Lは、実効インダクタンスであり、Iは、チップによって引き込まれる電流である。
図5は、図4を参照してより詳細に説明したような、時間t=0.0001秒においてステップ応答の結果として生じた電源電圧のアンダーシュートを示す。x軸は、負荷ステップ後の時間を対数スケールで示す。
3つのアンダーシュート508、510、512がグラフに示されている。3つの異なるグラフ502、504、506がプロットされており、各グラフは、異なるステップ持続時間を表す。ステップ持続時間は、電流を印加するためにかかる時間である。ステップ持続時間が長いほど、第1の最低電圧が実現されるまでの遅延が長くなる。これは、ステップ持続時間が短いほど、オンチップ容量の枯渇(depleted)が速くなるためである。しかしながら、3つのグラフ502、504、506は、同じ形状になる傾向があり、3つのグラフが第2の最低のアンダーシュートで合流し、その後、同じ形状をたどることがわかる。示される3つのステップ持続時間は、5ns、10ns及び20nsであり、グラフ506、604及び502にそれぞれ対応する。ステップ持続時間20nsのプロット502について、以下でさらに詳細に説明する。
電源電圧の第1のアンダーシュートは、ダイ容量が放電するときに発生する。第1の電源電圧アンダーシュート508は、最低電圧が0.79V前後であり、負荷ステップのおよそ10ns後に発生する。この最低電圧値は、負荷ステップ持続時間(ステップ持続時間が短いほど、最低電圧が低くなる)、ダイの容量及びパッケージの直列インピーダンスから計算することができる。上述したように、最低電圧は、オンチップ容量の容量を使い切ったときに発生する。
オンダイ容量の放電により電源電圧が低下するにつれて、オンダイ容量と直列のインダクタンスにわたる電圧が高くなる。この電圧が十分に高くなると、電源電圧は、低下することを止め、上昇し始める。
電圧は、短時間上昇した後に再び低下するが、今回はパッケージのキャパシタが放電した結果によるものである。第2の電源電圧アンダーシュート510の最低値は、パッケージのキャパシタの容量及びPCBの直列インピーダンスに影響され易い。電源電圧最低値は、負荷ステップのおよそ250ns後に発生し、0.77V前後の最低値を有する。
電源電圧が2回目に低下すると、バルクインダクタにわたる電圧が高くなる。この電圧が十分に高くなったら、電源電圧がそれ以上低下しないようにし、その後、ピークに達するまで電源電圧が上昇する。
ピーク後、電源電圧は、3回目に低下するが、今回はPCBの容量が放電したことによるものである。この容量が図13に示されている。最低電源電圧は、負荷ステップのおよそ3μs後に発生する。最低値は、0.79V前後である。最低電圧は、PCBの容量及び電源制御ループの応答に影響され易い。
第3の電源アンダーシュート512後、電源電圧は、上昇し、定常状態の電源電圧であるおよそ0.8Vで安定化する。これは、レギュレータの応答によるものである。
図6は、図5の20nsの時間ステップのグラフを示すが、250ns前後に電源電圧スパイク602が追加されている。このスパイク602は、0.75V前後の最低値を有する。
電流の負荷ステップの別の原因は、(例えば、異なるクロックを実装する前に、確実に現在のクロックが安全に選択解除されるようにするために)クロックをオン及びオフにすることである。
250nsで発生するスパイク602は、クロック選択解除信号によって引き起こされた3nsの短時間の負荷解放によるものである。ここでは、クロックを瞬間的に停止させた後に再開させることで、電流が300Aから0Aまで減少した後に非常に急速に増加して300Aに戻るようになっている。
電源電圧は、所定の最低値を有し、この最低値未満に電源電圧が低下することは、望ましくない。この最低電源電圧は、ハードウェアが意図したように機能することが可能な最低電圧によって決まる。この最低電圧値を下回ると、不具合が発生する。所定の最低許容電圧値は、予想外に低い電源電圧が発生した場合(アンダーシュート)でも不具合が発生しないように、IPUが機能することが可能な絶対最低電圧よりも高い量として定義することができる。
現在のところ、Vminが最低許容電源電圧未満に降下しないようにする唯一の方法は、初期電源電圧を上げることである。以下で説明するように、これは、電力消費量及び性能の両方に密接な関係を有する。
本発明は、電源電圧アンダーシュートを低減することを目的とする。
動的な電力は、電源電圧を2乗した値にクロック周波数を乗じたVDD ×Fに比例する。
アンダーシュートを低減することにより、初期電源電圧と、電圧低下の結果として得られた最低電源電圧との間の差が減少するため、初期電源電圧を低くする一方、最低電源電圧を予め決められたVmin値に制限し続けることが可能である。このように、動的な電力を変えずに周波数を大きくすることが可能である。
例えば、アンダーシュートを5%低減することが可能であれば、VDDも5%低減できる。次に、同じ動的な電力を維持するために、クロック周波数は、
Figure 2022546472000003

だけ大きくすることが可能であり、したがって、クロック周波数は、11%だけ大きくすることが可能である。性能は、クロック周波数に比例するため、性能も11%だけ向上させることが可能である。
本発明の態様は、複数のオンダイ並列処理ユニットが同期して動作するIPUアーキテクチャに関連して開発されてきた。このようなダイについて、図16を参照して説明する。しかしながら、本発明は、チッププロセス電源での電圧垂下を低減するために、より広い適用範囲を有することが理解されるであろう。
図16は、シングルチッププロセッサ2のアーキテクチャを概略的に図示する。プロセッサ2は、タイルと呼ばれる複数の処理ユニットを含む。一実施形態では、アレイ6a、6bに編成された1216個のタイルが存在する。説明する例では、各アレイは、76個のタイルからなる8つの列を有する(実際には、概して冗長性目的で80個のタイルがある)。チップ2は、チップ2の一方のエッジに2つのチップ-ホスト間リンク8a、8bと、4つのチップ-チップ間リンク30a、30bが配置される。チップは、チップのもう一方のエッジに沿って配置されたさらなる6つのチップ-チップ間リンク30a、30bによって一緒にカードに接続することができる。
チップ2は、コンピュータの動作及び他のチップの作用のタイミングを制御するクロック3を有する。このクロックは、チップのアクティブな回路及び部品のすべてに接続される。チップ2は、すべてのタイル及びリンクが接続ワイヤのセットによってそれに接続されたスイッチングファブリック34を含む。
各タイル4は、処理回路及びローカルメモリを有する。処理回路は、1つ又は複数の実行ユニットを有する実行パイプラインを含む。
実行パイプラインは、例えば、数学的計算の処理演算を行うとともに、チップ内のタイル間でデータをやり取りさせる交換命令の実行を担う。各チップは、計算段階及び交換段階を含むバルク同期並列プロトコルを動作させる。このプロトコルは、例えば、図17に図示されている。図17の左側の図は、各タイル4が、ステートフルコードレットがローカルメモリ上で実行される段階にある計算段階を表す。図17では、タイル4は、円形に配置されて示されているが、これは、説明目的のためのみのものであり、実際のアーキテクチャを反映しない。
計算段階後に同期があり、矢印30によって示されている。
BSP自体は、当技術分野で知られている。BSPによれば、各タイル4は、交互のサイクルで計算段階52及び交換(通信又はメッセージ通過と呼ばれ得る)段階50を実行する。この計算段階及び交換段階は、タイル実行命令によって実行される。計算段階52中、各タイル4は、1つ又は複数の計算タスクをタイル上で局所的に実行するが、他のいずれのタイル4ともその計算結果を通信しない。交換段階50において、各タイル4は、先行する計算段階からの計算の1つ又は複数の結果をグループ内の1つ又は複数の他のタイルとの間で交換(通信)することを許可されるが、別のタイル4上で実行されたタスクに対する依存関係を有する可能性があるか、又は別のタイル4上で実行されたタスクに対する依存関係を有する可能性があり得る新たな計算を依然として実行しない(これは、内部制御関連の動作などの他の動作が交換段階で実行され得ることを排除するものではない)。さらに、BSP原理によれば、バリア同期は、計算段階52から交換段階50に移行する時点若しくは交換段階50から計算段階52に移行する時点又はその両方で行われる。すなわち、(a)グループ内のいずれかのタイルが次の交換段階50に進むことを許可される前に、すべてのタイル4が計算段階52を完了することを要求されるか、若しくは(b)グループ内のいずれかのタイルが次の計算段階52に進むことを許可される前に、グループ内のすべてのタイル4が交換段階50を完了することを要求されるかのいずれか、又は(c)これらの条件の両方が実施される。この一連の交換段階及び計算段階は、その後、複数回反復して繰り返すことができる。BSPの専門用語では、交換段階及び計算段階の各繰り返しを、BSPの以前の説明における使用法と同様に本明細書で「スーパーステップ」と呼ぶ。本明細書では、「スーパーステップ」という用語は、交換段階及び計算段階のそれぞれを示すために当技術分野において使用される場合もあることに留意されたい。
BSPプロトコルの効果の1つは、すべてのタイル又は多数のタイルが同時に計算し、同時に交換するため、電流引き込み要件の効果を悪化させることである。計算に対する電流引き込み要件は、交換に対する電流引き込み要件よりもはるかに高い。したがって、タイルが計算段階を同時に開始したときの引き込み電流の大幅な増加に対応する大きい負荷ステップと、今回はタイルが交換段階を同時に開始したときの引き込み電流の大幅な減少に対応する第2の大きい負荷ステップとがある。
図15は、IPUを含む構造の図を示す。パッケージ基板1802は、部品がその上に取り付けられる基層を形成する。パッケージ基板1802は、プリント回路基板(PCB)である。
ダイ(又はチップ)1806がパッケージ基板1802の上に配置される。ダイ1806は、計算を実行するために使用するロジックを含む。
ダイ1806の周りには、キャパシタのアレイ1808がある。キャパシタは、寸法が0.5mm×1mmの多層のセラミックキャパシタである。これらのキャパシタ1808は、電流引き込み回路と容量との間のインダクタンスを低減するために、可能な限りダイ1806に近くなるようにパッケージ基板1802に配置される。これらの別個のキャパシタ1808は、上記で説明したような「オンチップ」容量を供給すると見なされる。以下で説明する本発明の態様を使用することにより、このような容量は、ダイ容量の時間を設けることにより、数を減らすか又は完全に排除することが可能であることが理解されるであろう。
キャパシタ1808の周りには補剛(stiffener)リング1804がある。補剛リング1804は、エポキシ接着剤を使用してパッケージ基板1802の表面に取り付けられる金属製リングである。補剛リング1804により、ダイの剛性が向上する。
図15の構造は、当技術分野で知られているようなフリップチップ技術を使用して構築される。ダイ1806は、はんだバンプ又はC4ボールを使用して、パッケージ基板1802に下向きに取り付けられる。これらは、チップ1806の上側に取り付けられる、はんだのボールである。ダイ1806をパッケージ基板1802上の適所に配置した後、構造を加熱することにより、C4ボールが溶けて、ダイ1806がパッケージ基板1802上の適所にはんだ付けされるようになる。このプロセスは、「パッケージング」と呼ばれ得る。
パッケージ基板1802は、はんだボールのアレイも含む。このアレイは、パッケージ基板1802の下側にあり、パッケージをPCBに接続するために使用される。パッケージのはんだボールは、C4ボールよりもはるかに大きく、大きいピッチを有する。C4ボールは、コネクタ端子のタイプの1つである。
他のタイプのコネクタ端子、すなわちチップを他の部品に接続するための手段を使用し得る。コネクタ端子が取る形態は、パッケージングのタイプ及び/又はパッケージングへの接続方法によって決まり得る。例えば、チップが従来のパッケージングに接続される場合、銅ピラーをコネクタ端子として使用し、シリコンインターポーザ(silicon interposer)のフリップチップのコネクタ端子としてマイクロバンプを使用する。
本発明のいくつかの実施形態によれば、電源電圧アンダーシュートを低減するための解決策が提供され、この解決策は、ウェハーオンウェハー技術を使用して、直列インピーダンスが非常に低い表面分布容量をチップ処理回路類に供給する。
分布容量ウェハー904は、プロセッサチップウェハー902と積層される。本明細書では、この積層は、ウェハーオンウェハー(WoW)と呼ばれ得る。本開示では、言及されるプロセッサチップウェハーは、Graphcore社製造のColossus Mk1及びMk2チップであり得るが、いずれのプロセッサチップも使用し得ることが理解されるであろう。
プロセッサウェハー902は、第1のシリコンウェハーである。すなわち、それは、「フリップチップ」を介して反転される前の積層ダイの最下部を形成する。分布容量又はDRAMウェハー904は、積層ダイの最上部を形成する第2のシリコンウェハーである。反転する前のウェハー902、904の配置は、図9に示されており、後により詳細に説明する。
接合層922がそれぞれウェハー902、904のそれぞれの「内側」表面上に形成され、この接合層が2つのウェハー902、904間の接続を提供する。接合層922については、後により詳細に説明する。次に、DRAMウェハー904は、2つの接合層922が接触し、位置合わせされるようにプロセッサウェハー902の上に積層される。
積層された後、DRAMウェハー904は、薄化される。ウェハー薄化は、基板の薄化を実現して所望の平坦度を実現するための、化学的機械的研磨法などの既知の技法を使用して実現することができる。他の適切な既知の技法を使用し得ることが理解されるであろう。
DRAMウェハー904は、プロセッサウェハー902がDRAMウェハー904を十分に支持することができるように、積層した後に薄化される。DRAMウェハー904は、わずか数ミクロンの厚さになるように薄化され、例えば、薄化された厚さは、3~10μmの範囲であり得る。対照的に、プロセッサウェハー904は、700μm前後の厚さ又は400μm~1000μmの範囲であり得る。プロセッサウェハー902は、自己支持深さを有する。すなわち、プロセッサウェハー902の深さは、プロセッサウェハー902が基板を追加せずに自らを支持することができる十分な深さである。DRAMウェハー904は、非自己支持深さを有するように薄化され、それにより、DRAMウェハー904は、何らかの支持層、本明細書ではプロセッサウェハー902がなければ自らを支持することができない。
シリコン貫通ビア(TSV)918がDRAMウェハー904に作成され、このシリコン貫通ビアがプロセッサウェハー902への接続を提供する。TSV918は、プラズマエッチングなどの既知の技法を使用して作成して、予め決められた側壁角度を有する深さ及び幅の比率を実現することが可能である。なお、側壁角度とは、TSVの側壁と水平面とが作る鋭角である。ウェハー902、904が積層され、DRAMウェハー904が薄化された後にTSVが作成される。これにより、TSVを非常に小さい直径及び非常に小さいピッチで積層ダイに形成することが可能になり、各TSV918の直径は、2~5μmの範囲である。これは、従来のCPUで使用されるTSVよりもはるかに小さい。TSV918のピッチ(ビア間の距離)は、2~5μmの範囲であり得る。
ボール下金属化(UBM)層926がDRAMウェハー904の「外側」表面上に形成される。UBM層926は、DRAMウェハー904の表面にあるパッドであり、その上に1つ又は複数のはんだドット又はC4ボール920が堆積される。次に、積層ウェハー902、904は、当技術分野で知られている方法である制御崩壊チップ接続(controlled collapse chip connection)又は「フリップチップ」を使用して、外部の回路類に接続することができる。C4ボールは、積層ウェハー902、904と、外部の回路類との間の接続を形成する。異なるタイプのコネクタ端子を使用する実施形態では、UBM層926がない場合があることが理解されるであろう。
キャパシタ層は、本配置では電力源減結合キャパシタとして機能し、DRAMセルの複数のブロック(キャパシタユニット)を含む。DRAMセルは、大型で密集したキャパシタのアレイを含む。現在のところ、40nm前後のDRAMセルがおよそ1500fF/μmの容量を実現する。およそ800mmのダイ全体では、これは、1200μF前後の総容量を有することになる。これらの値は、例として提供されるが、他の特性を有する部品を使用し得ることが理解されるであろう。
図9は、プロセッサウェハー902と、DRAMウェハー904とを積層して、積層ダイを形成した結果として形成された構造の一例を示す。
プロセッサウェハー902は、複数の層を含む。最下層は、プロセッサウェハー基板906である。プロセッサウェハー902は、finFET及びBeOL層908も含む。この層は、プロセッサウェハー基板906の上に位置する。用語「の上」及び「の下」は、必ずしも特定の向きを定義するものではなく、むしろ各層の互いに対する相対的な位置を定義するものであることが理解されるであろう。
最上部金属(Mr)層910がfinFET及びBeOL層908の上に追加される。Mr層910は、WoWキャパシタ層なしで使用するために、プロセッサウェハー902のアプリケーションプロセッサ(AP)層及び/又は再配線(RDL)層に置き換わる。
DRAMウェハー904は、プロセッサウェハー902の上に位置する。DRAMウェハー904は、下向きにすることができ、これにより、ウェハー904の露出した(「外側」)表面がウェハーの裏側となる。代わりに、DRAMウェハー904の裏側は、プロセッサウェハー902の最上部と接触させることができ、これにより、DRAMウェハー904の露出した表面がウェハーの上側となる。図9に示される例は、DRAMウェハー904が下向きであり、ウェハーの裏側が露出することを示す。
ウェハー902、904の露出した表面は、もう一方のウェハー902、904と接触していない表面である。すなわち、プロセッサウェハー902の露出した(「外側」)表面は、図9のプロセッサウェハー基板906の最下面であり、DRAMウェハー904の露出した(「外側」)表面は、図9のDRAMウェハー基板層914の最上面である。
ウェハー902、904の裏側とは、基板層906、914の、追加の層が上に配置されない側を指す。プロセッサウェハー902を例に挙げると、プロセッサウェハー902の裏側は、プロセッサ基板層906の下側である。ウェハー902、904の上側は、ウェハー902、904の反対側である。これは、回路類を含む最外層側、例えばプロセッサウェハー902のMr層910の最上部である。ウェハー902、904の上側は、電源電圧に接続しなければならない一方、裏側には、電流を消費する回路類がそこに位置していないため、接続する必要がない。
もう一方のウェハー904、902に向かい合い、もう一方のウェハー904、902と重なるウェハー902、904の表面は、内側対向面と呼ばれ得る。2つのウェハー902、904の内側対向面は、形状及び寸法が等しく、それにより、重なったときに内側対向面が一致する。これは、積層されたときのウェハーの外形及び外寸が共通であることを示唆する。
本明細書で使用される用語「等しい」は、文字通りに解釈されるのではなく、むしろ当技術分野で理解される設計要因による距離及び/又は寸法の事前定義された仕様に従い、ほぼ等しいか又は等しいことが好ましいことを意味すると解釈されることが理解されるであろう。
DRAMウェハー904は、少なくとも2つの層、すなわちシリコンで作られ得るキャパシタ基板層914及び積層キャパシタ層916を含み得る。
キャパシタ基板層914は、シリコンで作られ得る。キャパシタ基板層914は、シリコン貫通ビア(TSV)918がそれを貫通して形成される。これらは、C4ボールと、各ウェハー902、904の上側との間に接続を提供するために、C4ボール920の真下に位置する層914の一部分に位置決めされる。C4ボールは、例えば、並-直列/直-並列変換器(SerDes)を介して電源電圧VDD、アース電圧VSS及びI/Pポートへの接続を提供することができる。各C4ボール920は、複数のTSV918と関連付けられることに留意されたい。
キャパシタ層916は、2つの部分、すなわち積層キャパシタ部分930及びキャパシタのない部分928を含み得る。キャパシタのない部分928は、TSVを含むキャパシタ基板層914の部分と位置合わせされた位置にある。層916のこの部分928は、TSV918からプロセッサダイ902まで電気接続することができるようにするためのビア及び金属を含む。
キャパシタ層916の残りの区域は、キャパシタ部分930を含む。これらの区域は、図9の例では、1/μmのオーダーの容量を有する積層キャパシタを含む。キャパシタ部分930は、積層キャパシタアレイを提供する。
キャパシタ層916は、厚さ約2μmである。キャパシタ層916は、金属酸化膜で被覆され得る。
2つのウェハー902、904間に接続を提供する追加の層が存在し得る。この追加の層は、2つのウェハー902、904間を接続できるようにする接合層922であり得る。図9では単一の層として示されているが、ウェハー902、904のそれぞれの上に形成された接合層922が存在し得る。ウェハー902、904の接合層は、必要な接続を提供する互いの鏡像である。接合層922は、WoWコネクタのアレイ924を含み得る。これらのコネクタがDRAMダイ904とプロセッサダイ902との間に電気接続を提供し、それにより、構造の上側にあるC4ボールに接続された電源電圧をプロセッサダイ902に供給することができる。
プロセッサウェハー902及びDRAMウェハー904が積層された後、キャパシタ基板層914を薄化し得る。構造の剛性を維持する必要があるため、基板層906、914の1つのみを薄化することができる。別々の基板層914及びキャパシタ層916を有するDRAMウェハー904を使用することの利点は、キャパシタを避けるために注意を払わなくて済むため、キャパシタが基板に埋め込まれる場合よりもキャパシタ基板層914の薄化が容易になることである。
ボール下金属化(UBM)層926が容量ウェハー904の露出した表面、この例ではキャパシタ基板層914の裏側に位置し、それにより、この層は、C4ボール920とDRAMウェハー904との間に接続を形成する。
DRAMウェハー904は、容量を供給するために使用され、C4ボールとの接触に適した電気接続の規則的なパターンを含む。さらに、これらの接続があるため、抵抗が低くなる。
DRAMセルキャパシタ1つ当たりの容量が約15fFである、面積がおよそ25μm×25μmのDRAMセルを使用することにより、キャパシタブロックの総容量が約0.8nFとなり、0.5~1.5μFの範囲となる。これは、およそ54000個のDRAMセルキャパシタによって供給することが可能である。
図10A~図10Cは、DRAMセルキャパシタの構造を示す。
図10Aは、DRAMセルのハニカム構造の平面図を示す。各キャパシタ1002は、6つの隣接するキャパシタ1002を有し、そのそれぞれは、隣接するすべての6つのキャパシタから等間隔で位置する。ハニカム構造は、一定のパッキング密度のキャパシタ1002を提供し、その密度は、正方形配置での密度よりも高密度である。DRAMセルのこのようなハニカム構造は、当技術分野で知られている。図10Bは、同じハニカム構造の俯瞰図を示す。
図10Cは、2つのトレンチキャパシタ1002の図を示す。トレンチキャパシタ1002は、DRAMウェハー904の積層キャパシタ層916に形成される。トレンチキャパシタは、プラズマエッチングなどの既知の技法を使用して形成され得る。
トレンチキャパシタ1002は、トレンチキャパシタ1002の内側表面にストレージノード1004及び誘電体膜1006を含む。ストレージノード1004は、半球状粒子ポリシリコンを含み得る。この層1004により、トレンチキャパシタ1002の表面積が増加する。ストレージノード1004は、例えば、トレンチキャパシタ1002の表面積を2倍にし得る。
誘電体膜1008は、ストレージノード1004の表面全体にわたって膜を形成する。この膜は、高い誘電率を有する。例えば、この膜は、五酸化タンタル、酸化アルミニウム、ハフニウムジオキシド又は任意の他の適切な物質を含み得る。
トレンチキャパシタ1002は、パターニングのアスペクト比が高く、例えば、その比は、10よりも大きい。
図11A及び図11Bは、本明細書に開示されるWoWキャパシタウェハーとして使用することができる繰り返し可能なキャパシタユニット1100を示す。
図11Aは、総面積がおよそ10000μmであり、容量が10nFのオーダー、例えば5~30nFの範囲である単一の繰り返し可能なキャパシタユニット1100を示す。後述するように、繰り返し可能なキャパシタユニット1100の寸法は、C4ボールのピッチによって定義され得る。総分布容量は、プロセッサウェハー902のサイズ、繰り返し可能なキャパシタユニット1100がカバーするプロセッサウェハー902の総面積及び繰り返し可能なキャパシタユニット1100の容量によって決まる。図12を参照して説明するように、繰り返し可能なキャパシタユニット1100は、プロセッサウェハー902の面積の少なくとも80%をカバーする。繰り返し可能なキャパシタユニット1100によって各ダイに供給される総分布容量は、650μF~850μFの範囲である。ダイのサイズが異なれば、総分布容量の値が異なる。分布容量は、0.5μF/mmよりも大きく、0.5μF/mm~3μF/mmの範囲であることが好ましい。各DRAMウェハー904上に複数のダイがパターニングされ得る。例えば、各ウェハー上に約65個のダイがパターニングされ得る。各DRAMウェハー904上のダイの数は、ダイのサイズによって決まり得る。
繰り返し可能なキャパシタユニット1100は、13個のキャパシタブロック1104と、2つの禁止領域1102a、1102bとを含む。禁止領域1102a、1102bは、DRAMウェハー904のキャパシタ層916のキャパシタのない領域928に対応する。各キャパシタブロック1104及び禁止領域1102a、1102bは、約25μm×25μmの寸法を有し得る。本明細書で与えられる寸法は、単なる例示的な寸法であり、任意の他の適切な寸法を使用し得ることが理解されるであろう。加えて、それぞれの繰り返し可能なキャパシタユニット1100のキャパシタブロック1104の数は、繰り返し可能なキャパシタユニット1100のサイズ及びキャパシタブロック1104に応じて変わり得る。
キャパシタブロック1104及び禁止領域1102a、1102bは、寸法が5ブロック×3ブロックの矩形を形成するように配置される。キャパシタは、禁止領域1102a、1102bに提供されない。そのため、繰り返し可能なキャパシタユニット1100の形状は、15個のユニットからなる区域を含む矩形であるが、対角線上にある対向する角部の2つのユニットは、取り除かれる。すなわち、最上段は、4つのキャパシタブロック1104を含み、中央段は、5つのキャパシタブロック1104を含み、その段の第1の端部は、最上段の同じ端部(図11Aでは左側の端部)と位置合わせされ、最下段は、4つのキャパシタブロック1104を含み、中央段の第2の端部は、最下段の同じそれぞれの端部(図11Aでは右側の端部)と位置合わせされる。繰り返し可能なキャパシタユニット1100の対角線の長さは、対角線上にある対向する角部が禁止領域1102a、1102bを含むため、バンプのピッチと等しい。
図11Aに示され、また上記で説明した構造は、実現可能な繰り返し可能なキャパシタ1100の構造の1つにすぎないことが理解されるであろう。キャパシタブロック1104のレイアウト及び数は、キャパシタブロック1104のサイズ及びC4ボールのピッチによって決まる。後述するように、C4ボールの場所に禁止領域1102a、1102bがなければならず、各繰り返し可能なキャパシタユニット1100は、対角線上にある対向する角部にある2つの異なるC4ボールに接続する。したがって、これらの要件を満たすことができる繰り返し可能なキャパシタユニット1100を作成するために、ブロック1104のサイズ及びC4ボールのピッチに応じて、必要なキャパシタブロック1104の数が増減し得る。繰り返し可能なキャパシタユニット1100を含むキャパシタブロック1104の数は、10~20であり得る。
禁止領域1102a、1102bは、キャパシタのない領域を提供し、そこでC4バンプがDRAMウェハー904のTSV918に接続する。電源電圧VDD及びアース電圧VSSは、繰り返し可能なキャパシタブロック1100の対向する角部で印加される。図11Aの例では、電源電圧は、右上側にある電源禁止領域1102aの角部で印加され、アース電圧は、左下側にあるアース禁止領域1102bの角部で印加される。
TSV918のピッチは、禁止領域1102a、1102bのサイズに影響を与える。ピッチを細かくするほど、これらの領域1102a、1102bを小さくすることができる。禁止領域1102a、1102bは、禁止領域1102a、1102bにキャパシタが存在しないため、小さい方が望ましく、そのため、禁止領域1102a、1102bを小さくするほど、繰り返し可能なキャパシタユニット1100の寸法が一定である場合、繰り返し可能なキャパシタユニット1100の容量が高くなる。
ウェハーオンウェハーコネクタのアレイを見ることができる。図11Aの例は、WoWコネクタ924がDRAMウェハー904の表面全体にわたって等間隔であることを示す。WoWコネクタ924は、2μmのオーダーのピッチを有することができる。ピッチFは、例えば、1μm~5μmの範囲であり得る。プロセッサウェハー902の要件に応じて、他のWoW接続のピッチもあり得ることが理解されるであろう。図9に示されるWoWコネクタ924は、DRAMウェハー904とプロセッサウェハー902との間に接続を提供する。
WoWコネクタ924は、その機能に応じて、2つのカテゴリー、すなわち電源電圧に接続されたVDDWoWコネクタ及びアースに接続されたVSSWoWコネクタ924に分類することができる。
電源禁止領域1102aは、主にVDDWoWコネクタを含む一方、アース禁止領域1102bは、主にVSSWoWコネクタを含む。アース禁止領域1102bとx方向に一列に並んだキャパシタユニット1104は、VSSWoWコネクタを含む。電源禁止領域1102aとx方向に一列に並んだキャパシタブロック1104は、いくつかのVDDWoWコネクタを含む。
SSコネクタ、VDDコネクタのいずれでもないWoWコネクタ924がいくつか存在し得る。これらのコネクタとプロセッサウェハー902との間に接続がない場合がある。例えば、VSSのC4ボール、VDDのC4ボールのいずれとも位置合わせされないWoWコネクタ、すなわちキャパシタブロック1104の中央段に沿ったWoWコネクタ924である。
図11Bは、複数の繰り返し可能なキャパシタユニット1100を含むキャパシタ層を示す。繰り返し可能なキャパシタユニット1100は、VDDWoWコネクタ及びVSSWoWコネクタからなる段が作成されるように位置合わせされる。
禁止領域1102a、1102bは、同じタイプの4つの禁止領域1102a、1102bからなるグループが一緒にグループ化されるように位置合わせされる。4つの禁止領域1102a、1102bからなるグループは、それぞれ単一のC4ボール920と関連付けられる。
繰り返し可能なキャパシタユニット1100は、1つのダイ当たりおよそ75000回複製することができる。1つのダイ当たりの繰り返し可能なキャパシタユニット1100の数は、ダイ及び繰り返し可能なキャパシタユニット1100の両方の寸法によって決まることが理解されるであろう。
DRAMウェハー904をキャパシタ層として使用する場合、図9に示される構造には多くの利点がある。
第1に、プロセッサウェハー902をまったく変更する必要がない。ロジック層を薄化する場合、ロジックを避けるように慎重に薄化するか、又は薄化できるようにロジックを再設計するかのいずれかが必要になるであろう。TSV918をDRAMウェハーに形成して、ロジックウェハーに接続できるようにし得る。処理ダイ内の処理回路類を再設計する必要はない。このように、DRAMウェハーを最上層として使用することにより、コスト及び時間のかかるロジックウェハーの再設計が不要になり、これにより、WoWキャパシタウェハーの有無にかかわらず、ほとんどの層に同じマスクセットを用いて作られた同じロジックウェハーを使用することが可能になる。
しかしながら、代替的な実施形態では、2つのウェハー902、904を入れ替えることも可能であろう。すなわち、図9に示される最下部のウェハーは、DRAMウェハー904であり、最上部のウェハーは、プロセッサウェハー902である。プロセッサウェハー902が薄化され、TSV918は、プロセッサウェハー902の基板906を通して作成されることになる。このような実施形態では、DRAMウェハー904は、引き続きオンダイ容量を供給することになる。しかしながら、禁止領域1102a、1102bをプロセッサウェハー902上に作成することが必要になる。これには、プロセッサウェハー902のロジックを再設計することが必要になる。加えて、ロジックのために利用可能な面積が小さくなる。プロセッサウェハーの面積は、制約されることが多く、そのため、プロセッサウェハー902内に禁止領域がないことが好ましい。DRAMウェハー904内のシリコンの面積は、プロセッサウェハー904内の面積ほど貴重なものではない。
図12は、本発明で使用されるC4バンプマップ1202の一例を示す。バンプマップ1202の寸法は、ダイのサイズ、本明細書では25.7mm×32mmに対応する。寸法が異なる他のダイを本発明で使用し得ることが理解されるであろう。
バンプマップ1202は、各バンプを離散的なドットとして示す。色が異なる3つのドットが示されている。赤色のドットは、VDDバンプを表し、黒色のドットは、VSSバンプを表し、緑色のドットは、「その他」のバンプを表す。その他のバンプは、例えば、I/Oポートのために使用され得る。
その他のバンプは、プロセッサダイの外側の周りに位置決めされたパッチ1204内にまとめてクラスター化される。少数のVSSバンプがパッチ1204内に位置する。ダイの本体1206は、拡大した図1208により明確に示されるように、VDDバンプ及びVSSバンプからなる列を含む。図12に示されるように、プロセッサダイのバンプの中心は、バンプのピッチの分だけ離隔している。バンプのピッチは、およそ150μmであり得るが、他の寸法を使用し得ることが理解されるであろう。バンプのピッチは、25μm~250μmの範囲であり得る。
繰り返し可能なキャパシタ1100は、VDD-VSSバンプパターン区域のみをカバーする。すなわち、それらは、ダイの本体1206のみをカバーし、パッチ1204をカバーしない。繰り返し可能なキャパシタは、例えば、I/Oポートにはない。例えば、ダイの本体1206をカバーする約75000個の繰り返し可能なキャパシタユニット1100が存在し得る。
図7は、750μFのオンチップキャパシタを有するColossus Mk1の負荷ステップ応答を示す。改善された負荷ステップ応答702が20nsのステップ応答502に重ねて示されている。5nsのステップ応答506も示されている。
図5を参照して説明した20nsのステップ応答502の場合のように、改善されたステップ応答702は、3つの電源電圧最低値を有する。
第1の電源電圧最低値704は、分布オンチップキャパシタが放電した結果である。オンチップ容量は、図2及び図13に図示されるように、チップに固有のオンチップ容量及びDRAMウェハー904の容量の両方を含む。このアンダーシュートに見られる最小値は、0.835V前後であり、負荷ステップが適用された後、およそ10nsで発生する。最低電源電圧値は、DRAMウェハー904のキャパシタがないプロット502の最低電源電圧値よりもはるかに高いことがわかる。これは、各クロックスイッチと関連付けられた容量の方が総オンチップ容量に占めるパーセンテージがはるかに小さいため、同じ数のクロックスイッチの電源電圧降下の大きさの方がはるかに小さいためである。
第2の電源電圧アンダーシュート706は、オンチップ容量及びパッケージ容量の放電の結果である。このアンダーシュート706は、0.795V前後の最低値を有する。
アンダーシュート時の最低電源電圧は、オンチップ容量、パッケージ容量及びPCBの直列インピーダンスに影響され易い。
第3のアンダーシュート708は、PCBキャパシタの放電によるものである。最低電圧値は、上記と同様に、PCB容量及び電源制御ループ応答に影響され易い。
クロックスイッチングによって引き起こされる電源電圧のスパイク710がやはり存在する。しかしながら、このスパイク710は、単に電源電圧を上昇させるのみであり、スパイク710の大きさは、分布オンチップキャパシタがないIPUの応答のスパイク602と比較して大幅に小さい。
図7のグラフから、分布オンチップキャパシタを導入することにより、最低電圧が約45mV上昇したことがわかる。改善された負荷ステップ応答702の最低電圧は、PCBキャパシタの放電の結果として発生し、0.795V前後の値を有する。初期電圧と最低電圧との間の差は、オンチップキャパシタがない場合の0.1V超から0.06V前後に減少する。電源電圧の差の減少は、同じ最低電源電圧を維持しつつ、初期電圧を0.855Vから0.81V前後に下げることが可能であることを意味する。
図8は、長時間にわたる改善された負荷ステップ応答702及び20nsのステップ応答502を示し、図4と同様に、負荷ステップの増加を含む。アンダーシュートが著しく改善することがわかる。しかしながら、負荷ステップ増加時のオーバーシュートには、ほとんど改善が見られない。最大電源電圧は、消費電力にとって重要であるが、IPUの性能に及ぼすオーバーシュートの効果は、アンダーシュートよりもはるかに小さい。それは、初期電源電圧に効果を及ぼさず、ハードウェアが確実に不具合なく動作を実行するようにするための最大電圧の要件がないためである。
図14は、Colossus Mk2ダイのバンプで見られた電源インピーダンスを示す。左側のグラフは、WoWキャパシタがない場合の電源インピーダンスを示し、右側のグラフは、WoWキャパシタが導入される場合の電源インピーダンスを示す。グラフは、Hz単位での周波数に対するμオーム単位でのインピーダンスのプロットである。
グラフは、それぞれ4つの異なるプロットを示す。プロット1502a及び1502bは、プリント回路基板(bd)に装着されたキャパシタのインピーダンスに及ぼす周波数の効果を示し、180kHz前後に最小インピーダンスを有するバルクキャパシタと、最大1MHzまでの最小インピーダンスを有する他のより小さいキャパシタとを含む。プロット1504a及び1504bは、パッケージのインピーダンスに及ぼす周波数の効果を示す。プロット1506a及び1506bは、オンダイインピーダンスに及ぼす周波数の効果を示す。プロット1508aは、電源インピーダンスに及ぼす周波数の全体的な影響を示す。全体的な効果は、グラフに示される3つの成分に起因する効果を重ね合わせたものである。
プリント回路基板及びパッケージに装着されたキャパシタの可変の周波数に対するインピーダンス応答は、WoWキャパシタがある場合及びない場合のいずれにおいても同様であるが、WoWキャパシタが存在する場合、オンダイインピーダンスは、はるかに低い周波数で降下する。これは、全体的なインピーダンスのプロット1508a、1508bを比較することによってわかるように、より低い周波数で全体的なインピーダンスを最小まで低減させる効果を有する。WoWキャパシタは、全体的な最小インピーダンスを下げる効果も有する。この最小値は、およそ6eHzの周波数で発生する。
WoWキャパシタの追加の利益は、WoWキャパシタがオンチップ容量を供給供するため、別個のオンチップキャパシタ1808の必要性が減少することである。したがって、別個のキャパシタ1808の数を減らすことができるか、又は、別個のキャパシタ1808の必要性を完全に排除して、別個のキャパシタ1808が必要でないようにし得る。このような実施形態では、WoWキャパシタは、第1のレベルの容量全体を供給することになる。
本発明の実施形態は、ウェハーオンウェハー技術を使用する。ウェハーオンウェハー(WoW)技術は、ダイ製造において比較的最近開発されたものである。現在、この技術は、GPUを製造するために使用されており、物理的なサイズを大きくせずにGPUを高性能化することが可能になる。層は、プリント回路基板(PCB)に沿って水平ではなく、垂直に積み重ねられる。
マルチチップモジュール(MCM)で使用される従来の相互接続ではなく、WoWは、シリコン貫通ビア(TSV)を使用して、積層ダイが通信できるようにする。これにより、電力効率が向上し、モジュール間で失われる遅延が減少する。ウェハーに/ウェハーから信号を送信する方法を提供するために、すなわちウェハーのバックエンドオブライン(BeOL)層にアクセスするために、TSVがI/Oのためのウェハーの1つを通して製造される。ウェハーは、鏡像であるため、TSVが一方のウェハーを貫通することにより、両方のウェハーに電源電圧を通すことが可能になる。これにより、ロジックとC4ボールのアレイとの間が直接接続される。
論理層は、チップの厚さを減らすために薄化される。ウェハーのシリコン層上にフロントエンドオブライン(FeOL)及びBeOL層が形成された後、シリコン層がそれ以上機能しなくなるため、これを行うことができる。ロジックウェハーは、わずか数ミクロンの厚さまで薄化することができる。
得られた積層ウェハーは、次に、当技術分野で知られているような従来の方法でバンピングし、個片化し、パッケージング(フリップチップBGA)することができる。
上記の実施形態は、例としてのみ記載されることが理解されるであろう。本明細書の開示が与えられれば、開示される技法の他の変形形態又は使用の事例が当業者に明らかになるであろう。本開示の範囲は、記載される実施形態によって限定されるのではなく、添付の特許請求の範囲によってのみ限定される。

Claims (25)

  1. コンピュータ構造であって、
    計算動作を実行するように構成されたコンピュータ回路類が形成される第1のシリコン基板であって、自己支持深さ及び対向面を有する第1のシリコン基板と、
    複数の分布容量ユニットが形成される第2のシリコン基板であって、前記第1のシリコン基板の前記対向面と重なって位置する対向面を有し、前記対向面間で構造の深さ方向に延在して配置されたコネクタのセットを介して前記第1のシリコン基板に接続され、前記第2のシリコン基板の前記対向面は、前記第1のシリコン基板の前記対向面の平面寸法に一致する平面寸法を有する、第2のシリコン基板と、
    を含み、
    前記第2のシリコン基板は、前記コンピュータ構造を電源電圧に接続するための複数のコネクタ端子が配置される外側表面を有し、前記第2のシリコン基板は、前記第1のシリコン基板よりも小さい深さを有する、コンピュータ構造。
  2. 前記第1及び第2のシリコン基板の前記対向面は、1つ又は複数の接合層によって接合される、請求項1に記載のコンピュータ構造。
  3. コネクタは、前記第2のシリコン基板を通して前記第1のシリコン基板まで延在して、前記コネクタ端子と前記第1のシリコン基板との間に電気接続を提供するシリコン貫通ビアを含む、請求項1又は2に記載のコンピュータ構造。
  4. 各分布容量ユニットは、予め決められた数の0.1~1.5nFの範囲の容量を有するキャパシタブロックを含む、請求項1に記載のコンピュータ構造。
  5. 前記予め決められた数は、10~20である、請求項4に記載のコンピュータ構造。
  6. 各分布容量ユニットは、5~30nFの範囲の容量を有する、請求項4又は5に記載のコンピュータ構造。
  7. 分布容量ユニットの総平面面積は、前記第1のシリコン基板の総平面面積の少なくとも80%であり、前記複数の分布容量ユニットの容量は、0.5μF/mm~3μF/mmの範囲である、請求項1~6のいずれか一項に記載のコンピュータ構造。
  8. 前記第1のシリコン基板は、400μm~1000μmの深さを有する、請求項1~7のいずれか一項に記載のコンピュータ構造。
  9. 前記第2のシリコン基板は、10μm未満の非自己支持深さを有する、請求項1~8のいずれか一項に記載のコンピュータ構造。
  10. 前記分布容量ユニットは、規則的なアレイ状に配置され、各分布容量ユニットは、電源電圧コネクタ端子及びアースコネクタ端子に接続される、請求項1~9のいずれか一項に記載のコンピュータ構造。
  11. 各コネクタ端子は、4つの異なる分布容量ユニットに接続される、請求項10に記載のコンピュータ構造。
  12. 前記コネクタのセットは、前記コネクタ端子と軸方向に位置合わせされた前記第1及び第2のシリコン基板間に接続を提供する、請求項1~11のいずれか一項に記載のコンピュータ構造。
  13. 各分布容量ユニットは、2つの禁止領域を含み、前記禁止領域は、それぞれのコネクタ端子の場所にあり、前記禁止領域及び前記キャパシタブロックは、等しいサイズである、請求項4に記載のコンピュータ構造。
  14. 各キャパシタブロックは、六角形アレイ状に配置されたトレンチキャパシタのアレイを含み、各トレンチキャパシタは、6つの隣接するトレンチキャパシタを有し、各トレンチキャパシタは、その隣接するトレンチキャパシタから等距離に位置する、請求項4又は5に記載のコンピュータ構造。
  15. 前記シリコン貫通ビアは、前記分布容量ユニットの前記禁止領域に提供される、請求項3又は13に記載のコンピュータ構造。
  16. 前記コンピュータ回路類は、実行ユニット及びローカルメモリをそれぞれ有する複数の処理ユニットを含み、複数の処理ユニットは、並行して計算するように構成される、請求項1に記載のコンピュータ構造。
  17. 前記コンピュータ回路類は、バルク同期並列プロトコルに従って動作するように複数の処理ユニットを制御するように構成された同期回路類を含む、請求項16に記載のコンピュータ構造。
  18. 前記コンピュータ回路類は、前記処理ユニットの動作を制御するために接続されたクロックを含む、請求項16又は17に記載のコンピュータ構造。
  19. コンピュータ構造を製造する方法であって、
    計算動作を実行するように構成されたコンピュータ回路類を含む第1のシリコン基板であって、自己支持深さを有する第1のシリコン基板を提供することと、
    複数の分布容量ユニットを含む第2のシリコン基板を提供することと、
    前記第1のシリコン基板の対向面を前記第2のシリコン基板の対向面に接合することであって、前記対向面は、重なって位置し、前記対向面は、一致する平面寸法を有することと、
    前記第2のシリコン基板を薄化することであって、前記第2のシリコン基板は、前記第1のシリコン基板よりも小さい深さを有することと、
    前記第2のシリコン基板の外側表面上において、前記コンピュータ構造を電源電圧に接続するための複数のコネクタ端子を提供することと、
    を含む方法。
  20. 前記第2のシリコン基板を薄化した後、前記第2のシリコン基板にシリコン貫通ビアを形成して、前記コネクタ端子と前記第1のシリコン基板との間に接続を提供することをさらに含む、請求項19に記載の方法。
  21. 前記第2のシリコン基板は、10μm未満の深さに薄化され、それにより、前記第2のシリコン基板は、非自己支持深さを有する、請求項19又は20に記載の方法。
  22. 前記第1のシリコン基板は、700μm~800μmの深さを有する、請求項13~15のいずれか一項に記載の方法。
  23. 前記分布容量ユニットは、規則的なアレイで配置され、前記方法は、各分布容量ユニットを電源電圧コネクタ端子及びアースコネクタ端子に接続することを含む、請求項19~22のいずれか一項に記載の方法。
  24. 各分布容量ユニットは、予め決められた数のキャパシタブロック及び2つの禁止領域を含み、前記禁止領域は、前記2つのコネクタ端子の場所にあり、前記禁止領域及び前記キャパシタブロックは、等しいサイズである、請求項23に記載の方法。
  25. 前記禁止領域の場所に前記シリコン貫通ビアを形成することを含む、請求項20又は24に記載の方法。
JP2022513444A 2019-12-20 2020-12-17 コンピュータデバイス及びその製造方法 Active JP7379666B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1919083.4A GB2590643B (en) 2019-12-20 2019-12-20 Method of manufacturing a computer device
GB1919083.4 2019-12-20
PCT/EP2020/086813 WO2021123015A1 (en) 2019-12-20 2020-12-17 Computer device and method of manufacturing the same

Publications (2)

Publication Number Publication Date
JP2022546472A true JP2022546472A (ja) 2022-11-04
JP7379666B2 JP7379666B2 (ja) 2023-11-14

Family

ID=69322867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022513444A Active JP7379666B2 (ja) 2019-12-20 2020-12-17 コンピュータデバイス及びその製造方法

Country Status (8)

Country Link
US (2) US10820409B1 (ja)
EP (1) EP3973573A1 (ja)
JP (1) JP7379666B2 (ja)
KR (1) KR102682384B1 (ja)
CN (1) CN114008777A (ja)
GB (1) GB2590643B (ja)
TW (1) TW202143433A (ja)
WO (1) WO2021123015A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11901281B2 (en) 2019-03-11 2024-02-13 Adeia Semiconductor Bonding Technologies Inc. Bonded structures with integrated passive component

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006165025A (ja) * 2004-12-02 2006-06-22 Nec Electronics Corp 半導体装置およびそれを用いた半導体モジュール、ならびに半導体装置の製造方法
JP2007234843A (ja) * 2006-03-01 2007-09-13 Fujitsu Ltd 薄膜キャパシタ素子、インターポーザ、半導体装置、及び、薄膜キャパシタ素子或いはインターポーザの製造方法
JP2007266182A (ja) * 2006-03-28 2007-10-11 Fujitsu Ltd 半導体装置及び半導体装置の製造方法
US20080284037A1 (en) * 2007-05-15 2008-11-20 Andry Paul S Apparatus and Methods for Constructing Semiconductor Chip Packages with Silicon Space Transformer Carriers
WO2009110288A1 (ja) * 2008-03-04 2009-09-11 日本電気株式会社 貫通電極付きキャパシタおよびその製造方法、並びに半導体装置
US20100308435A1 (en) * 2009-06-08 2010-12-09 Qualcomm Incorporated Through Silicon Via With Embedded Decoupling Capacitor
US20150200242A1 (en) * 2014-01-15 2015-07-16 Globalfoundries Inc. Method and device for an integrated trench capacitor

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5786979A (en) * 1995-12-18 1998-07-28 Douglass; Barry G. High density inter-chip connections by electromagnetic coupling
JP4545889B2 (ja) 2000-06-09 2010-09-15 富士通株式会社 回路基板及びその製造方法並びに半導体装置
US6532143B2 (en) * 2000-12-29 2003-03-11 Intel Corporation Multiple tier array capacitor
TW560017B (en) * 2001-07-12 2003-11-01 Hitachi Ltd Semiconductor connection substrate
JP4997757B2 (ja) * 2005-12-20 2012-08-08 富士通株式会社 薄膜キャパシタ及びその製造方法、電子装置並びに回路基板
FR2917231B1 (fr) * 2007-06-07 2009-10-02 St Microelectronics Sa Realisation de condensateurs dotes de moyens pour diminuer les contraintes du materiau metallique de son armature inferieure
US8298914B2 (en) 2008-08-19 2012-10-30 International Business Machines Corporation 3D integrated circuit device fabrication using interface wafer as permanent carrier
US9420707B2 (en) * 2009-12-17 2016-08-16 Intel Corporation Substrate for integrated circuit devices including multi-layer glass core and methods of making the same
US8913402B1 (en) * 2010-05-20 2014-12-16 American Semiconductor, Inc. Triple-damascene interposer
US8618651B1 (en) * 2012-11-01 2013-12-31 Nvidia Corporation Buried TSVs used for decaps
US9640531B1 (en) * 2014-01-28 2017-05-02 Monolithic 3D Inc. Semiconductor device, structure and methods
KR20150061161A (ko) 2013-11-26 2015-06-04 삼성전자주식회사 실리콘-관통 비아들을 갖는 반도체 칩, 이를 포함하는 반도체 패키지, 및 이들의 제조 방법
US20150264813A1 (en) * 2014-03-11 2015-09-17 United Microelectronics Corp. Chip-stack interposer structure including passive device and method for fabricating the same
US11011315B2 (en) * 2018-06-20 2021-05-18 Tdk Corporation Thin film capacitor, manufacturing method therefor, and multilayer circuit board embedded with thin film capacitor

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006165025A (ja) * 2004-12-02 2006-06-22 Nec Electronics Corp 半導体装置およびそれを用いた半導体モジュール、ならびに半導体装置の製造方法
JP2007234843A (ja) * 2006-03-01 2007-09-13 Fujitsu Ltd 薄膜キャパシタ素子、インターポーザ、半導体装置、及び、薄膜キャパシタ素子或いはインターポーザの製造方法
JP2007266182A (ja) * 2006-03-28 2007-10-11 Fujitsu Ltd 半導体装置及び半導体装置の製造方法
US20080284037A1 (en) * 2007-05-15 2008-11-20 Andry Paul S Apparatus and Methods for Constructing Semiconductor Chip Packages with Silicon Space Transformer Carriers
WO2009110288A1 (ja) * 2008-03-04 2009-09-11 日本電気株式会社 貫通電極付きキャパシタおよびその製造方法、並びに半導体装置
US20100308435A1 (en) * 2009-06-08 2010-12-09 Qualcomm Incorporated Through Silicon Via With Embedded Decoupling Capacitor
US20150200242A1 (en) * 2014-01-15 2015-07-16 Globalfoundries Inc. Method and device for an integrated trench capacitor

Also Published As

Publication number Publication date
GB2590643B (en) 2022-08-03
US11889615B2 (en) 2024-01-30
JP7379666B2 (ja) 2023-11-14
US20210195729A1 (en) 2021-06-24
CN114008777A (zh) 2022-02-01
WO2021123015A1 (en) 2021-06-24
US10820409B1 (en) 2020-10-27
TW202143433A (zh) 2021-11-16
GB2590643A (en) 2021-07-07
KR20220008878A (ko) 2022-01-21
GB201919083D0 (en) 2020-02-05
EP3973573A1 (en) 2022-03-30
KR102682384B1 (ko) 2024-07-09

Similar Documents

Publication Publication Date Title
US10423877B2 (en) High memory bandwidth neuromorphic computing system
KR101706444B1 (ko) 가변 칩 간격을 갖는 램프-스택 칩 패키지
US10304809B2 (en) Methods and systems for improving power delivery and signaling in stacked semiconductor devices
US20200279842A1 (en) Double side mounted large mcm package with memory channel length reduction
US11894366B2 (en) Trench capacitor assembly for high capacitance density
JP7379666B2 (ja) コンピュータデバイス及びその製造方法
US10804208B2 (en) Interposer for an integrated system and corresponding design method
US9824954B2 (en) Semiconductor package comprising stacked integrated circuit chips having connection terminals and through electrodes symmetrically arranged
TWI790734B (zh) 一種電容器結構及其形成電容器結構的方法
US11410981B2 (en) Graphics processing unit and high bandwidth memory integration using integrated interface and silicon interposer
US20230282630A1 (en) Providing Capacitors in Analogue Circuits
KR20220044903A (ko) 패키지 구조, 장치, 보드 카드 및 집적회로를 레이아웃하는 방법
CN219716851U (zh) 半导体封装和半导体结构
US20240072022A1 (en) Stacked capacitors for semiconductor devices and associated systems and methods
US11398429B2 (en) Electronic package and manufacturing method thereof
CN118215391A (zh) 封装结构及其制造方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231101

R150 Certificate of patent or registration of utility model

Ref document number: 7379666

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150