JP2007514317A - 装置及びプロセッサー - Google Patents

装置及びプロセッサー Download PDF

Info

Publication number
JP2007514317A
JP2007514317A JP2006543849A JP2006543849A JP2007514317A JP 2007514317 A JP2007514317 A JP 2007514317A JP 2006543849 A JP2006543849 A JP 2006543849A JP 2006543849 A JP2006543849 A JP 2006543849A JP 2007514317 A JP2007514317 A JP 2007514317A
Authority
JP
Japan
Prior art keywords
die
logic
unit
processor
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006543849A
Other languages
English (en)
Inventor
ブラック,ブライアン
サムラ,ニコラス
ウェブ,エム,クレア
Original Assignee
インテル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテル コーポレイション filed Critical インテル コーポレイション
Publication of JP2007514317A publication Critical patent/JP2007514317A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7828Architectures of general purpose stored program computers comprising a single central processing unit without memory
    • G06F15/7832Architectures of general purpose stored program computers comprising a single central processing unit without memory on one IC chip (single chip microprocessors)
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L25/00Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
    • H01L25/03Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes
    • H01L25/04Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers
    • H01L25/065Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L25/0657Stacked arrangements of devices
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/02Bonding areas; Manufacturing methods related thereto
    • H01L2224/04Structure, shape, material or disposition of the bonding areas prior to the connecting process
    • H01L2224/05Structure, shape, material or disposition of the bonding areas prior to the connecting process of an individual bonding area
    • H01L2224/0554External layer
    • H01L2224/05573Single external layer
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/02Bonding areas; Manufacturing methods related thereto
    • H01L2224/04Structure, shape, material or disposition of the bonding areas prior to the connecting process
    • H01L2224/05Structure, shape, material or disposition of the bonding areas prior to the connecting process of an individual bonding area
    • H01L2224/0554External layer
    • H01L2224/05599Material
    • H01L2224/056Material with a principal constituent of the material being a metal or a metalloid, e.g. boron [B], silicon [Si], germanium [Ge], arsenic [As], antimony [Sb], tellurium [Te] and polonium [Po], and alloys thereof
    • H01L2224/05638Material with a principal constituent of the material being a metal or a metalloid, e.g. boron [B], silicon [Si], germanium [Ge], arsenic [As], antimony [Sb], tellurium [Te] and polonium [Po], and alloys thereof the principal constituent melting at a temperature of greater than or equal to 950°C and less than 1550°C
    • H01L2224/05647Copper [Cu] as principal constituent
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/12Structure, shape, material or disposition of the bump connectors prior to the connecting process
    • H01L2224/13Structure, shape, material or disposition of the bump connectors prior to the connecting process of an individual bump connector
    • H01L2224/13001Core members of the bump connector
    • H01L2224/1302Disposition
    • H01L2224/13025Disposition the bump connector being disposed on a via connection of the semiconductor or solid-state body
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/12Structure, shape, material or disposition of the bump connectors prior to the connecting process
    • H01L2224/13Structure, shape, material or disposition of the bump connectors prior to the connecting process of an individual bump connector
    • H01L2224/13001Core members of the bump connector
    • H01L2224/13099Material
    • H01L2224/131Material with a principal constituent of the material being a metal or a metalloid, e.g. boron [B], silicon [Si], germanium [Ge], arsenic [As], antimony [Sb], tellurium [Te] and polonium [Po], and alloys thereof
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/12Structure, shape, material or disposition of the bump connectors prior to the connecting process
    • H01L2224/14Structure, shape, material or disposition of the bump connectors prior to the connecting process of a plurality of bump connectors
    • H01L2224/141Disposition
    • H01L2224/1418Disposition being disposed on at least two different sides of the body, e.g. dual array
    • H01L2224/14181On opposite sides of the body
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/15Structure, shape, material or disposition of the bump connectors after the connecting process
    • H01L2224/16Structure, shape, material or disposition of the bump connectors after the connecting process of an individual bump connector
    • H01L2224/161Disposition
    • H01L2224/16135Disposition the bump connector connecting between different semiconductor or solid-state bodies, i.e. chip-to-chip
    • H01L2224/16145Disposition the bump connector connecting between different semiconductor or solid-state bodies, i.e. chip-to-chip the bodies being stacked
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/73Means for bonding being of different types provided for in two or more of groups H01L2224/10, H01L2224/18, H01L2224/26, H01L2224/34, H01L2224/42, H01L2224/50, H01L2224/63, H01L2224/71
    • H01L2224/732Location after the connecting process
    • H01L2224/73251Location after the connecting process on different surfaces
    • H01L2224/73253Bump and layer connectors
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2225/00Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
    • H01L2225/03All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
    • H01L2225/04All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
    • H01L2225/065All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L2225/06503Stacked arrangements of devices
    • H01L2225/06513Bump or bump-like direct electrical connections between devices, e.g. flip-chip connection, solder bumps
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2225/00Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
    • H01L2225/03All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
    • H01L2225/04All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
    • H01L2225/065All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L2225/06503Stacked arrangements of devices
    • H01L2225/06555Geometry of the stack, e.g. form of the devices, geometry to facilitate stacking
    • H01L2225/06562Geometry of the stack, e.g. form of the devices, geometry to facilitate stacking at least one device in the stack being rotated or offset
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2225/00Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
    • H01L2225/03All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
    • H01L2225/04All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
    • H01L2225/065All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
    • H01L2225/06503Stacked arrangements of devices
    • H01L2225/06555Geometry of the stack, e.g. form of the devices, geometry to facilitate stacking
    • H01L2225/06565Geometry of the stack, e.g. form of the devices, geometry to facilitate stacking the devices having the same size and there being no auxiliary carrier between the devices
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L24/00Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
    • H01L24/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L24/10Bump connectors ; Manufacturing methods related thereto
    • H01L24/15Structure, shape, material or disposition of the bump connectors after the connecting process
    • H01L24/16Structure, shape, material or disposition of the bump connectors after the connecting process of an individual bump connector
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2924/00Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
    • H01L2924/0001Technical content checked by a classifier
    • H01L2924/00013Fully indexed content
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2924/00Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
    • H01L2924/10Details of semiconductor or other solid state devices to be connected
    • H01L2924/11Device type
    • H01L2924/14Integrated circuits
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Power Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Advance Control (AREA)
  • Semiconductor Integrated Circuits (AREA)
  • Internal Circuitry In Semiconductor Integrated Circuit Devices (AREA)

Abstract

本願明細書は、マルチダイプロセッサー装置及びシステムを説明する。1つ以上の命令を実行するプロセッサーロジックは、2つ以上の向かい合わせに積み重ねられたダイに配分される。プロセッサーは、積み重ねられたダイの間に導電性インターフェースを有し、ダイ間通信を可能にする。

Description

本願明細書は、一般に情報処理システムに関連し、より詳細には、ロジックが複数の積み重ねられたダイに区分化されているプロセッサーに関する。
携帯電話及びノートパソコンのような電子機器は、一般に、プリント基板(PCB)に搭載された複数の集積回路(IC)パッケージを有する。ICパッケージは、一般に、基板又はリードフレーム上の単一のICダイを有する。ダイ及び基板は、プラスチックのような素材に封入される。封入したパッケージは、そして、PCBのような別の基板に搭載される。種々のパッケージ方法が、このような電子素子の性能を向上するために利用されている。
マルチチップモジュール(MCM)は、共通基板に相互接続された2つ以上の「裸の」又はパッケージされていない集積回路ダイを有することができるICパッケージである。MCMは一般に、横方向に隣接するよう単一のパッケージに組み込まれた複数の個別ICダイを有するので、MCMを利用する電子素子の大きさは削減できる。
システムオンチップ(SoC)技術は、単一のICダイ上の(携帯電話又はデジタルカメラのような)「システム」に必要な電子回路及び部品の大部分又は全てのパッケージ化である。例えば、音声検出装置のシステムオンチップは、音声受信機、アナログデジタル変換器、マイクロプロセッサー、メモリー、及び入出力制御ロジックを単一のICダイに有して良い。
ICパッケージの専有面積と体積を削減しようとする別の種類のICパッケージ構成は、スタックドチップスケールパッケージ(スタックドCSP)として知られる。スタックドCSPは、元来、空間効率的なMCMであり、複数のダイが(一方向を向いて)積み重ねられ、単一パッケージに統合される。スタックドCSPパッケージングは、単一パッケージ内に、フラッシュ及びSRAM(スタティックランダムアクセスメモリー)のような、異種のダイを垂直に積み重ねることにより、携帯電話及び他のポータブル機器の製造者に、彼らの製品を小型化可能にさせる。2つ以上の異種ICダイを単一パッケージに垂直に組み込んだスタックドCSPを利用することにより、無線機器は、従来の単一ダイパッケージで構成される機器より、低コスト、軽量、及び小さい基板空間を有する。
本願明細書は、単一パッケージにプロセッサー装置を共に実装する、複数のダイを積み重ねるパッケージ方法を述べる。
例えば、プロセッサーの性能(例えば、クロック周期当たりの命令数により測定される)及び熱及び電力管理の効率は、連携して命令を実行するよう共に機能する2つの積み重ねられたダイの間で、プロセッサーのコアを分離することにより、実現される。
本発明は、以下の図を参照して理解される。図中の類似の参照符号は、類似の要素を示す。これらの図は、本発明を制限するものではなく、プロセッサーのロジックが複数ダイの間で区分化されているマルチダイプロセッサーの装置及びシステムの選択的な実施例を説明するためのものである。
本願明細書は、マルチダイプロセッサー装置及びシステムの選択的な実施例を説明する。以下の説明では、要素間通信の仕組み、特定のパイプラインステージ、分割されたロジックの重なり構成等の多くの特定の詳細が述べられ、本発明の完全な理解を提供する。しかしながら、当業者は、本発明がそのような特定の詳細にかかわらず実施されて良いことを理解するだろう。更に、いくつかのよく知られた構造、回路等は、本発明を不必要に不明瞭にすることを避けるため、詳細に示されない。
図1は、1つ以上の命令を実行するマルチダイプロセッサーコア100のブロック図である。プロセッサーコアは、汎用又は特定用途向けプロセッサー、デジタルシグナルプロセッサー、画像処理プロセッサー、通信プロセッサー、ネットワークプロセッサー、又は1つ以上の命令を実行する他のプロセッサーであって良い。図1は、第1のダイ102及び第2のダイ104を有するプロセッサーパッケ―ジ100を示す。第1及び第2のダイは、連携して動作し命令を実行する。つまり、ダイ102、104のどちらも完全に機能するプロセッサーではなく、プロセッサーの機能は、2つのダイ102、104の間で「分離」されている。
第1のダイ102及び第2のダイ104のそれぞれの少なくとも1つの実施例は、表面と裏面を有する。「表面」は、形成された集積回路を有する側のダイの面を指す。この表面は、シリコン活性層を有する側のダイの面を指す。ダイの「裏面」は、(シリコン基板のような)非活性層を有する側であり、放熱板、C4 I/Oバンプ、基板等の別の構造と結合されて良い。
図1が示すように、第1のダイ102及び第2のダイ104の少なくとも1つの実施例は、向かい合う方向で共に結合されている。エポキシ樹脂又は他の接着剤を用いた結合機構よりむしろ、第1のダイ102と第2のダイ104の表面は、導電性インターフェースを経由して共に結合される。少なくとも1つの実施例では、第1のダイ102の表面にある導電素子106は、第2のダイ104の表面にある導電素子と結合される。例えば、対応する導電素子106、108は、共に結合され導電性のダイ間インターフェース(図2の275を参照)を作る銅バイアスであって良い。
図6は、第1のダイ602及び第2のダイ604上の導電素子106、108の配置の選択の範囲を更に示す。図6は、第1のダイ602及び第2のダイ604の表面を示す。留意すべきは、導電素子106、108は、それぞれダイ602、604の表面の如何なる位置に置かれても良いことである。図6は、各ダイ602、604の全体を覆う複数の導電素子106、108を示すが、当業者は、各ダイ602、604の表面の領域の如何なるサブセットも、導電素子106、108を有して良いことを理解するだろう。
図6は、各ダイ602、604は、周辺領域606及び中央領域608を有することを示す。第2のダイ602の導電素子106は、ダイの中央領域608a内に及び/又はダイの周辺領域606aに沿って配置されて良い。同様に、第2のダイ604の導電素子108はまた、ダイ604の中央領域及び/又は周辺領域を含む、ダイ604の表面のどこに配置されて良い。結果として、どちらのダイの表面にも、「禁止」領域はない。従って、第1及び第2のダイ602、604は、同一の大きさ及び形状であって良い。それらは、従って、積み重ねられたとき、完全に重なり合う。他の実施例では、異なる大きさ及び形状が利用され、及び/又は重ね合わせは限定的又は部分的であって良い。
図2は、開示された技術に従い作成されたマルチダイプロセッサーの少なくとも1つの実施例200の更に詳細を示すブロック図である。第1のダイ102の表面は、シリコン活性層203及び1つ以上の金属層214を有する。第2のダイ104の表面も、シリコン活性層205及び1つ以上の金属層216を有する。
図2は、ダイ102、104のそれぞれの裏面は、非活性のバルクシリコン220、230をそれぞれ有することを更に示す。第1のダイ102の裏面はまた、1つ以上の裏面バイアス233を有し、第1のダイ102のシリコン活性層203から金属の入出力(I/O)である半田バンプ212への通信経路を提供する。バイアス233は、例えば、銅でできていて良い。
I/O212バンプは、処理システムのインターフェース部(図17の1704を参照)のような、マルチダイプロセッサーの外部の構造と通信するための手段を提供する。インターフェース部は、両方のダイに存在して良い、I/Oバンプ212と結合されて良い。代案として、I/Oバンプ212は、図2に示された第1のダイ102のように、2つのダイの1つにのみ存在して良い。従って、インターフェース部は、複数のダイの1つのみと結合される。インターフェース部は、I/Oバンプ212との通信で、処理システムの他の要素と通信するためのマルチダイプロセッサー200の機構を提供する。例えば、インターフェース部及びI/Oバンプ212は、プロセッサーからのメモリーアクセス要求を処理するための、プロセッサー200とメモリーシステム(図17の1750を参照)の間の通信を促進する。
図2は、非活性層のシリコン230の裏面が放熱板210と結合されて良いことを示す。
図3は、プロセッサーの命令パイプライン300の例を示すブロックフロー図である。図3に示された説明のため命令パイプライン300は、以下のステージを有する。命令ポインタ生成302、命令フェッチ304、命令デコード306、レジスターリネーム308、スケジューリング312、実行313、及び命令退避314である。図3に示されたパイプライン300は、単に説明を目的としたものであり、本願明細書で説明される技術は、如何なるプロセッサーにおいて利用されて良い。プロセッサーが命令パイプライン300を利用する実施例では、パイプライン300のステージは、図3と異なる順序で出現して良く、又はより多くの異なる又は他のステージに分離されて良い。
本願明細書で開示される技術は、パイプライン300が図3と異なる又は多くのパイプラインステージを有するプロセッサーに利用されても良い。例えば、パイプライン300の別の実施例は、ローテーション、例外検出等の追加のパイプラインステージを有して良い。更に、EPIC型(明示的並列コンピューティング)プロセッサーは、命令セットに種々の長さの命令を有するプロセッサーのパイプラインに現れるよりむしろ、ワードラインデコードステージ、構造的リネーム等のような、異なるパイプラインステージを有して良い。また、いくつかのプロセッサーは、命令をマイクロ動作にデコードするデコード段階306を有さなくて良い。
図4及び5は、命令の実行中に、パイプライン300を通る種々のデータパスが生じて良いことを示す。これらパスのいくつかは、性能を決定づけるデータループを構成する。例えば、図4は、ロード命令の実行中に、ロードアクセスデータパス420が、命令パイプラインステージ313のロード/ストア演算実行部(図示されない)からデータキャッシュ365へ生じて良いことを示す。このようなロードアクセスデータパス420は、ソフトウェアコードに固有のデータ依存性のため、つまりいくつかの後に起こる命令は、前のロード命令からのデータがメモリーから読み出され、後の命令が利用可能になるまで実行できないため、性能を決定づけるデータループである。
同様に、他の性能を決定づけるループは、プロセッサーの命令の実行中に生じて良い。例えば、図5は、スケジュール実行データパス520も性能を決定づけるループであることを示す。同様に、このようなスケジュール実行データパス520は、ソフトウェアコードに固有のデータ依存性のため、つまりいくつかの後に起こる命令(コンシューマ)は、前の命令(プロデューサー)がコンシューマ命令により利用されるべきレジスター値を計算完了するまで実行できないため、性能を決定づけるループである。
例えば図1及び2にそれぞれ示された実施例100、200のような、マルチダイプロセッサーは、クリティカルデータパスを短縮するよう、複数のダイの間で区分化され良い。例えば、図4及び5にそれぞれ示されたロードアクセスパス420及びスケジュール実行パス520は、第1及び第2の向かい合うダイの間で、プロセッサーのロジックを賢明に区分化及び配置することにより、短縮されて良い。
図7は、例えば、スカラープロセッサーのレイアウトの例を示す。この例では、プロセッサーのロジックは、単一のダイ700に配分される。図7は、図4及び5にそれぞれ示されるデータパス420、520を示す。ロードアクセスデ―タパス420は、汎用レジスターファイル702で開始し、ロジック704の演算実行部ブロック内のロード/ストア演算実行部を通り、そしてデータキャッシュ3706へ進みロードデータを取得する。データキャッシュ706に到達するため、演算実行部ロジック704を横切ることによる時間遅延は、参照符号732により示される。一旦、ロードデータがデータキャッシュ706から読み出されると、データは、実行ロジック704の前に戻される。データキャッシュ706から実行ロジック704の前へ所望のロードデータを得ることによる時間遅延は、参照符号730により示される。
スケジュール実行データパス520に関し、図7は、スカラープロセッサーロジック700の例におけるパス520を示す。図7は、このようなパス520は、スケジューリングロジック708で開始し、汎用レジスターファイル702、実行ロジック704、データキャッシュ706を通り、そしてスケジューリングロジック708へ戻ることを示す。
図8は、プロセッサーロジックの少なくとも1つの実施例を、図7に示されたプロセッサーロジックの例のように示す。図8の例では、プロセッサーロジックは、2つの分離したダイ802、804の間に配分されている。図8はロジック特定の配置を示すが、図8は、プロセッサーの命令処理ロジックが2つ以上のダイに分離されて良いことを示す、単に一般的な目的のためのものであると理解されるべきである。図8に示される、第1及び第2のダイ802、804のプロセッサーロジックの特定の配置は、限定的なものではない。
プロセッサーロジックを2つのダイ802、804に分離する少なくとも1つの方法は、例えば、電力密度の問題を改善するよう設計されて良い。つまり、プロセッサーは多くの場合、面積当たりの電流値を所定の閾値に又はそれより低くするために努力している。比較的高い電力密度の領域は、比較的大きい電流量を必要とする。高電力密度領域のロジックの部分を第1のダイに配置し、高電力密度領域のロジックの残りの部分を第2のダイに配置することにより、領域の実装要件は緩和され、低電力密度設計になる。高電力密度領域のロジックを区分けし、その専有面積を削減し、そしてその電力消費を低減するこの能力は、図8に示される積み重ね方法の唯一の利点である。以下に説明されるように、他の利点もまた、このような方法から実現される。
図8は、図7に示されたスカラープロセッサーダイ700の命令処理ロジックが分割され、実行ロジック704が第1のダイ802に、及びデータキャッシュ706が第2のダイ804に分割されるようにして良いことを示す。実行ロジック704は第1のダイ802の表面に配置されて良く、データキャッシュ706は第2のダイ804の表面に配置されて良い。データキャッシュ706及び実行ロジック704は、更に分割され、第1のダイ802が第2のダイ804の上に積み重なる時、データキャッシュロジック706が実行ロジック704に重なり合うようにして良い。例えば、ロジックは、2つのダイ802、804が積み重なる時、データキャッシュ706の先端830が実行ロジック704の先端820と重なり合うように分割されて良い。
更にスカラープロセッサーのロジックの分割は、図8にも示される。例えば、図7に示されたスケジューリングロジック708は、別のダイに配分された2つのロジック部分708a及び708bに分割されている。更に、図8は、L3キャッシュは、メモリー制御部(「mem」)、L2キャッシュ、退避ロジック(「ret」)、整数レジスターファイル(「ireg」)、浮動小数点レジスターファイル(「freg」)、入出力ロジック(「I/O」)、フェッチロジック(「fetch」)、浮動小数点演算実行ロジック(「fp」)、及び命令キューロジック(「iq」)と同様に、2つのダイに分割されて良いことを示す。
図9を参照すると、図4及び7に示されたロードアクセスループ420の新しいデータパス420aは短縮され、図8に示されたマルチダイ方式において、時間効率が良くなっている。特に、図9は、データキャッシュ706の先端830が実行ロジック704の先端820と重なり合い、第2のダイの第904のデータキャッシュ706が第1のダイ902の実行ロジック704と重なり合うよう、プロセッサーロジックが分割される実施例における、ロードアクセスデータパス420を示す。(図9には図示されないが、当業者は、汎用レジスターファイル702は、例えば図8に示されるように2つのダイ902、904に分割されても良いことを理解するだろう。)
図9に示される新しいデータパス420aは、ロードデータがデータキャッシュ706から読み出された後、データは、実行ロジック704の先端820に到達するために、実行ロジック704の全体に沿って伝送される必要がないため、効率的である。その代わり、データは、導電性のダイ内インターフェース275を経由して実行ロジック704の先端820へ直接送信されて良い。このように、データは実行ロジック704を横切る時間を必要とせず、従って、所望のロードデータをデータキャッシュ706から実行ロジック704の先端(図7の730)へ得るための時間遅延が回避又は削減される。同様に時間遅延の削減は、図7の参照番号732により示されるデータパスの部分において実現されて良い。
図9に示される実施例はまた、以上に説明された時間の効率化に加え、有利な熱管理効果を提供する。つまり、少なくともいくつかのプロセッサーの実施例では、実行ロジック704の演算実行部には、比較的「熱い」ロジックブロックがある。つまり、それらはかなりの内部トランジスタースイッチを有し及び従って比較的多くの熱を生じる。対照的に、少なくともいくつかの実施例では、データキャッシュ706は、「熱い」ブロックほど多くの熱を生じない、比較的「冷たい」ロジックブロックである。従って、図9に示される実施例は、「熱い」ブロックと「冷たい」ブロックが少なくとも部分的に重なり合うよう積み重ねるという更なる利点がある。このような熱い/冷たいブロックの積み重ねは、不利な熱的効果を最小限に抑え、「熱い」ブロックが互いに重なり合うようマルチダイプロセッサー内で積み重ねられることを防ぐことができる。つまり、冷たいブロックは、熱いブロックから熱を消散させる放熱板として効率的に利用されて良い。
図10を参照する。スケジューリングロジック708の、異なるダイ1002、1004にそれぞれ配分される2つの部分708a、708bへの分割も、図5及び7に示されたスケジュール実行データパス520を効率化する。図10は、新しいスケジュール実行データパス520aも、ダイ内インターフェースを通じたダイ間通信の効率化されていることを示す。ダイ内通信のそれぞれは、互いに重なり合うロジック要素、708a及び708b、704及び706の間のダイ間インターフェース275を通じた通信に関係する時間のみを有する。
図11は、マルチダイプロセッサー1100の実施例を示す。マルチダイプロセッサー1100は、命令パイプライン300(例えば図3を参照)のステージ302、304、306、308、312、313、314のロジック部分が、2つのダイ1102、1104に配分されるよう分割されている。パイプラインステージのロジックは、2つのダイ1102、1104に配分され、パイプラインの通信信号は、ダイ間インターフェース275を経由し、第1のダイ1102及び第2のダイ1104の間のジグザグのパス1106を辿り、パイプラインステートロジックの割り当てられた部分にアクセスする。このような配置は、ジグザグのパスに沿ったダイ間通信がパス長を削減し従って性能を向上させる点でより効率的なので、いくつかの実施例において有利である。
更に、図11は、マルチダイプロセッサーの少なくとも1つの実施例1100は、以上に説明したように、I/Oバンプ212及び放熱板210を有して良いことを示す。
図12は、マルチダイプロセッサーの少なくとも1つの実施例を示す。図12では、スカラー配置図1200の配列1208は、分割され、2つのダイ1202、1204に配分される。配列1208は、汎用レジスターファイル、キャッシュ、浮動小数点レジスターファイル、又はマイクロコードROM(リードオンリーメモリー)を含む、如何なる配列でも良い。図12は、配列は、それぞれ異なるダイ1202、1204に配分されて良い、第1の部分1208a及び第2の部分1208bに分割されて良いことを示す。2つのダイ1202、1204が積み重ねられる時、2つのロジック部分1208a、1208bは、少なくとも部分的に重なり合って良い。このような場合、重なり合っている部分1208a、1208bの間の通信を促進させるダイ間インターフェース(図2の275を参照)を利用することにより、配列の全長が減少するので、配列のアクセス時間は、削減される。これは、例えば、レジスター間の全体の最悪の伝送時間を減少させるため、配列がレジスターファイル配列である、いくつかの実施例において有利である。
留意すべき点は、勿論、2つの部分1208a、1208bは、必ずしも完全に互いに重なり合う必要はない。例えば、「熱い」プロセッサーロジックブロックの重なり合う部分と関連する、可能性のある熱的効果を相殺するため、重なり合う部分は、部分1208a、1208bの一部のみが互いに重なり合うよう補正されて良い。
図13は、マルチダイプロセッサーのレイアウトの少なくとも1つの実施例を示す。図13は、スカラープロセッサー1300の配置図は、整数演算実行部1306、ロード/ストア演算実行部1308、及び浮動小数点演算実行部1310を有することを示す。演算実行部のロジックブロック1306、1308及び1310は、2つのダイ1302及び1304の表面に配分されて良い。図13は、整数演算実行部1306及びロード/ストア演算実行部1308が第1のダイ1302に配分され浮動小数点演算実行部1310が第2のダイ1304に配分され、第1のダイ1302と第2のダイ1304が積み重ねられた時、それらが互いに少なくとも部分的に重なり合うよう、演算実行部のロジックブロック1306、1308、1310は配分されて良いことを示す。少なくとも演算実行部1306、1308、1310を2つのダイ1302、1304に分割することは、演算実行部のトランジスター密度を最大2倍にし、従ってパス長による遅延を短縮し性能を向上させるので、このような配置は、いくつかの実施例において有利である。
図14は、マルチダイプロセッサーのレイアウトの少なくとも1つの実施例を示す。図14は、スケジューリングロジック1408を有するスカラープロセッサー1400の配置図を示す。スケジューリングロジック1408は、2つのロジック部分1408a及び1408bに分割されて良い。スケジューリングロジック1408は、例えば、演算スケジューリング部1408a及びメモリー要求スケジューリング部1408bに分割されて良い。2つのロジック部分1408a及び1408bは、それぞれ第1のダイ1402及び第2のダイ1404に、第1のダイと第2のダイが積み重ねられた時、それらが少なくとも部分的に重なり合うよう、分割され良い。このような重ね合う部分は、命令実行のためのスケジュール動作を連係して達成するよう動作して良い。このような配置は、少なくともスケジューリングロジック1408の信号帯域が増加するので、いくつかの実施例において有利である。従って、これは、1つ以上の信号をスケジューリング部分1408a、1408bの間で同時に送信させるので、性能を向上させる。
図15は、マルチダイプロセッサーのレイアウトの少なくとも1つの実施例を示す。図15は、浮動小数点実行ロジック1508を有するスカラープロセッサー1500の配置図を示す。浮動小数点実行ロジック1508は、2つのロジック部分1508a及び1508bに分割されて良い。ロジック1508は、例えば、非SIMD(単一命令多重データ)浮動小数点実行ロジック部1508a及びSIMD浮動小数点実行ロジック部1508bに分割されて良い。2つのロジック部分1508a及び1508bは、それぞれ第1のダイ1502及び第2のダイ1504に、第1のダイ1502と第2のダイ1504が積み重ねられた時、それらが少なくとも部分的に重なり合うよう、分割され良い。このような配置は、少なくとも以上に説明されたように、トランジスター密度の増加及び信号帯域の増加のため、いくつかの実施例において有利である。
図16は、マルチダイプロセッサーのレイアウトの少なくとも1つの実施例を示す。図16は、アドレス生成1608を有するスカラープロセッサー1600の配置図を示す。アドレス生成ロジック1608は、2つのロジック部分1608a及び1608bに分割されて良い。2つのロジック部分1608a及び1608bは、それぞれ第1のダイ1602及び第2のダイ1604に、第1のダイ1602と第2のダイ1604が積み重ねられた時、それらが少なくとも部分的に重なり合うよう、分割され良い。同様に、このような配置は、少なくとも以上に説明されたように、トランジスター密度の増加及び信号帯域の増加のため、いくつかの実施例において有利である。
図8−16は、マルチダイプロセッサーの種々の実施例を示す。これらの例では、プロセッサーの命令処理ロジックは、2つのダイに配分される。このような実施例は説明を目的として提供され、限定するものではない。例えば、図8―16に示された1つ以上の分割及び/又は配置の実施例は、単独で又は他の実施例と組み合わせて実施されて良い。つまり、単一のマルチダイプロセッサーでは、例として図9に示された分割は、図12、13、14、15及び/又は16に示された分割と共に実施されて良い。
また例えば、2つのダイのプロセッサーの図示された実施例では、プロセッサーのロジック部分が各ダイに配置されているが、プロセッサーのロジックは、複数のダイに分割されて良い。例えば、向かい合うダイは、第1の上側のダイの部分及び第2の上側のダイの部分が第3の下側のダイと重なり合うよう、重なり合って良い。複数のダイに分割されたロジックは、いくつであっても、1つ以上の命令を実行するよう連携して動作する。
つまり、本願明細書に説明されたように、それぞれ複数のダイに配分されたロジック部分は、命令と関連付けられた1つ以上の実行動作を実行するよう、呼び出されて良い。ロジック部分は、命令パイプライン(例えば、図3に示された例であるパイプライン300を参照)のような、実行動作を連携して完了するよう動作する。これらの実行動作は、アドレス生成、命令ポインタ生成、命令フェッチ、命令のマイクロ動作へのデコード、特定のデータ依存性を除去するためのレジスターリネーム、デスパッチ、スケジューリング、実行、及び退避を有して良いが、これらに限定されない。このように、実行動作は、命令に応じて実行されるサブ命令段階のタスクを有して良い。
ロジック部分は、特定の機能が分離されるよう、複数のダイに配分されて良い。つまり、アドレス生成部ロジックは、第1の部分は第1のダイに配分され、第2の部分は第2のダイに配分されるよう、第1の部分と第2の部分に分離されて良い。第1及び第2のロジック部分は、少なくとも部分的に重なり合い、アドレス生成部の動作を連携して実行するよう共に動作して良い。同様に、スケジューリング部は、汎用レジスターファイル、キャッシュ、浮動小数点レジスターファイル、又はマイクロコードメモリー配列のような配列に分離されて良い。メモリー制御部も、キャッシュ、変換検索バッファ、デコードロジック、リネームロジック、フェッチロジック、退避ロジック、及び浮動小数点演算実行部ロジックに分離されて良い。
以上に示されたように、ロジック部分は、ロジックブロックを分離するというより、連続するパイプラインステージの原型を保ったロジックブロックが、プロセッサーの複数のダイに配分されるよう、配分されて良い。パイプラインステージのためのロジックのこのような配置の結果、図11に示されたように、ダイ間インターフェース275を通るジグザグの通信経路1106が作られる。
命令パイプラインの実行ステージと関連付けられた実行動作は、演算実行部による、整数又は浮動小数点命令コードのような、演算命令コードの実行を有して良い。本願明細書で用いられるように、「命令コード」という語は、浮動小数点演算実行部、演算ロジック部、又はロ―ド/ストア演算実行部のような、演算実行部により理解され実行され得る如何なる処理部も包含する。命令コードは、マイクロ動作であって良い。
命令パイプラインステージと関連付けられた実行動作は、演算実行部による、メモリーリード又はメモリーライト命令コードのような、メモリー命令コードの実行を有して良い。
以上の説明は、マルチダイプロセッサーの選択的な実施例を開示した。本願明細書に説明されたようなマルチダイプロセッサー1702は、図17に示される処理システム1700のような処理システムにおいて利用されても良い。システム1700は、例えば、命令セットの1つ以上の命令を実行するために利用されて良い。この開示を目的として、処理システムは、例えば、デジタルシグナルプロセッサー(DSP)、マイクロコントローラー、特定用途向け集積回路(ASIC)、又は以上の説明の実施例に示されたマルチダイプロセッサーのようなマイクロプロセッサーのようなプロセッサーを有する処理システムを含む。処理システム1700は、全てインテル社から入手可能な、Itanium(商標)及びItanium(商標)2マイクロプロセッサー、及びPentium(登録商標)、Pentium(登録商標)Pro、Pentium(登録商標)II、Pentium(登録商標)III、及びPentium(登録商標)4マイクロプロセッサーに基づく処理システムの代表である。他のシステム(他のマイクロプロセッサーを有するパーソナルコンピューター(PC)、エンジニアリングワークステーション、パーソナルデジタルアシスタント及び他の手持ちサイズの機器、セットトップボックス等を含む)が利用されても良い。システム1700の少なくとも1つの実施例は、マイクロソフト社のWindows(登録商標)オペレーティングシステムの1つを実行して良い。しかしながら、例えば、他のオペレーティングシステム及びグラフィカルユーザーインターフェースが利用されても良い。
処理システム1700は、メモリーシステム1705及びプロセッサー1702を有する。メモリーシステム1705は、プロセッサー1702の動作を制御するための命令1740及びデータ1741を格納してよい。メモリーシステム1705は、メモリーの一般的な表現であり、ハードドライブ、CD−ROM、ランダムアクセスメモリー(RAM)、ダイナミックランダムアクセスメモリー(DRAM)、スタティックランダムアクセスメモリー(SRAM)、フラッシュメモリー及び関連する回路のような、メモリーの種々の形態を含んで良い。メモリーシステム1705は、プロセッサー1702により実行されて良いデータ信号により表せられる命令1740及びデータ1741を格納して良い。
処理システム1700は、インターフェース部分1704を有する。プロセッサー1702の第1のダイ102と第2のダイ104の間のダイ間インターフェース275というより、インターフェース部分1704は、ダイ102、104の1つのみ又は両方と結合されて良い。インターフェース部分1704は、プロセッサー1702とシステム1700の他の要素の間の要素間信号を生成する。例えば、インターフェース部分1704は、プロセッサー1702とシステム1705の間の要素間信号を生成して良い。例えば、インターフェース部分1704は、メモリーからのデータ検索リード動作又はメモリーへのデータライトのような、メモリートランザクションを実行するため、プロセッサー1702とシステム1705の間の信号を生成して良い。インターフェース部分1704はまた、プロセッサー1702とRF部、キーボード、外部記憶装置、モニター、マウス等のような他のシステム要素1707の間の信号を生成して良い。
以上の説明で、マルチダイプロセッサーの装置及びシステムの種々の特徴が開示された。説明を目的とし、特定の数値、例、システム及び構成が、完全な理解のために説明された。しかしながら、当業者は、説明された装置及びシステムが特定の詳細にかかわらず実施されて良いことを理解するだろう。当業者には、本発明から逸脱することなく、本発明の広範な特徴の範囲内で、変化及び変更がなされ得ることが明らかである。本発明の特定の実施例が示され説明されたが、請求の範囲は、その範囲に、本発明の真の範囲に収まる全ての変化及び変更を包含する。
開示される特長を示すマルチダイプロセッサーの少なくとも1つの実施例のブロック図である。 マルチダイプロセッサーの少なくとも1つの実施例の更に詳細を示すブロック図である。 命令実行パイプラインを示す少なくとも1つの実施例を説明するデータフロー図である。 ロードアクセスパスを示すデータフロー図である。 スケジュール実行データパスを示すデータフロー図である。 マルチダイの表面の導電素子を示すブロック図である。 単一ダイのスカラープロセッサーのロジックのスカラー配置図の例を示すブロック図である。 図7に示されるロジックを2つの向かい合うスタックドダイの間に区分及び配置する、少なくとも1つの実施例を示すブロック図である。 マルチダイプロセッサーの少なくとも1つの実施例の距離を削減したロードアクセスデータパスの平面図である。 マルチダイプロセッサーの少なくとも1つの実施例の距離を削減したスケジュール実行データパスの平面図である。 少なくとも1つの実施例による、2つの向かい合うスタックドダイの間に区分化されたプロセッサーロジックのブロック間のジグザグ状のデータパスを示すブロック図である。 2つの向かい合うスタックドダイの間に区分化された分離された配列の少なくとも1つの実施例を示すブロック図である。 2つの向かい合うスタックドダイの間に区分化された分離された演算ロジックの少なくとも1つの実施例を示すブロック図である。 2つの向かい合うスタックドダイの間に区分化された分離されたスケジューリングロジックの少なくとも1つの実施例を示すブロック図である。 2つの向かい合うスタックドダイの間に区分化された分離された浮動小数点演算ロジックの少なくとも1つの実施例を示すブロック図である。 2つの向かい合うスタックドダイの間に区分化された分離されたアドレス生成ロジックの少なくとも1つの実施例を示すブロック図である。 マルチダイプロセッサーを有する処理システムの少なくとも1つの実施例を示すブロック図である。

Claims (47)

  1. 装置であって、
    第1の表面及び第1の裏面を有し、第1のロジック部を有する第1のダイ、
    第2の表面及び第2の裏面を有し、第2のロジック部を有する第2のダイ、
    を有し、
    前記第1及び第2のダイは、それらの表面を向かい合わせ互いに結合され、
    前記第1のロジック部及び前記第2のロジック部は、連携して命令を実行する、
    装置。
  2. 前記第1及び第2のダイは、前記第1のロジック部及び前記第2のロジック部が少なくとも部分的に重なり合うよう、更に結合される、
    請求項1記載の装置。
  3. 連携して命令を実行することは、命令に応じてサブ命令段階のタスクを更に連携して完了することである、
    請求項1記載の装置。
  4. 前記第1及び第2のダイの向かい合う表面の間に導電性のダイ間インターフェース
    を更に有する、請求項1記載の装置。
  5. 前記ダイ間インターフェースは、前記第1のダイの表面のサブセット及び前記第2のダイの表面のサブセットの間に配置される、
    請求項4記載の装置。
  6. 前記第1のダイの表面のサブセットは、中央領域である、
    請求項5記載の装置。
  7. 前記第2のダイの表面のサブセットは、中央領域である、
    請求項5記載の装置。
  8. 前記第1のダイの表面のサブセットは、周辺領域である、
    請求項5記載の装置。
  9. 前記第2のダイの表面のサブセットは、周辺領域である、
    請求項5記載の装置。
  10. インターフェース部を更に有し、
    前記インターフェース部は、少なくとも1つの前記第1のロジック部及び前記第2のロジック部に、プロセッサー及び要素の間の要素間信号を生成するよう機能的に結合される、
    請求項4記載の装置。
  11. 前記インターフェース部は、前記第1のダイに結合される、
    請求項10記載の装置。
  12. 前記要素は、メモリーシステムである、
    請求項10記載の装置。
  13. 前記第1のロジック部及び前記第2のロジック部は、共同でアドレス生成ロジックを形成する、
    請求項1記載の装置。
  14. 前記第1のロジック部及び前記第2のロジック部は、共同でスケジューリングロジックを形成する、
    請求項1記載の装置。
  15. 前記第1のロジック部は、演算スケジューリングロジックを有し、及び前記第2のロジック部は、メモリー要求スケジューリングロジックを有する、
    請求項14記載の装置。
  16. 前記第1のロジック部は、配列の第1の部分を有し、及び前記第2のロジック部は、配列の第2の部分を有する、
    請求項1記載の装置。
  17. 前記配列は、レジスターファイルの配列である、
    請求項16記載の装置。
  18. 前記配列は、マイクロコードメモリーの配列である、
    請求項16記載の装置。
  19. 前記第1のロジック部は、熱いロジックブロックを有し、及び前記第2のロジック部は、冷たいロジックブロックを有する、
    請求項1記載の装置。
  20. 前記第1のロジック部は、少なくとも部分的に前記第2のロジック部と重なり合う、
    請求項19記載の装置。
  21. 前記第1のロジック部は、演算実行部を更に有し、及び前記第2のロジック部は、データキャッシュを更に有する、
    請求項19記載の装置。
  22. 前記第1のロジック部は、第1の演算実行部を有し、及び前記第2のロジック部は、第2の演算実行部を有する、
    請求項1記載の装置。
  23. 前記第1の演算実行部は、整数演算実行部を有し、及び前記第2の演算実行部は、浮動小数点演算実行部を有する、
    請求項22記載の装置。
  24. 前記第1の演算実行部は、浮動小数点演算実行部を有し、及び前記第2の演算実行部は、単一命令多重データ(SIMD)演算実行部を有する、
    請求項22記載の装置。
  25. 前記第1のロジック部は、前記第1のダイの表面に配置される、
    請求項1記載の装置。
  26. 前記第2のロジック部は、前記第2のダイの表面に配置される、
    請求項1記載の装置。
  27. 前記第1のロジック部は、命令を実行する第1のパイプラインステージを実行するロジックを有し、及び
    前記第2のロジック部は、命令を実行する第2のパイプラインステージを実行するロジックを有する、
    請求項1記載の装置。
  28. 追加のパイプラインステージのためのロジックブロックは、パイプラインの信号経路が第1及び第2のダイの間でジグザグの経路を辿るよう前記第1及び第2のダイに配置される、
    請求項27記載の装置。
  29. プロセッサーであって、
    第1のダイの第1の区画、
    第2のダイの第2の区画、及び
    前記第1の区画及び前記第2の区画を呼び出し、命令に関連する実行動作を実行する演算ロジック、
    を有する、プロセッサー。
  30. 前記実行動作は、スケジューリング動作を更に有する、
    請求項29記載のプロセッサー。
  31. 前記実行動作は、アドレス生成動作を更に有する、
    請求項29記載のプロセッサー。
  32. 前記演算ロジックは、命令に応じて、前記第1のダイの区画を更に読み出し、前記命令に関連した第2の実行動作を呼び出し、及び前記第2のダイの区画を呼び出し、前記命令に関連した第3の実行動作を実行する、
    請求項29記載のプロセッサー。
  33. 前記第2の実行動作は、命令パイプラインの実行ステージと関連する動作を更に有する、
    請求項32記載のプロセッサー。
  34. 前記第2の実行動作は、命令ポインタ生成動作を更に有する、
    請求項32記載のプロセッサー。
  35. 前記実行動作は、命令フェッチ動作を更に有する、
    請求項29記載のプロセッサー。
  36. 前記第2の実行動作は、デコード動作を更に有する、
    請求項29記載のプロセッサー。
  37. 前記第2の実行動作は、リネーム動作を更に有する、
    請求項29記載のプロセッサー。
  38. 前記第2の実行動作は、退避動作を更に有する、
    請求項29記載のプロセッサー。
  39. 装置であって、
    演算実行部及び第1の配列の一部を有する第1のダイ、
    前記第1のレジスターファイルの一部とダイ間結合により結合され前記第1の配列の一部と共に配列として連携して動作する第2の配列の一部を有する第2のダイ、
    を有する、装置。
  40. 前記第1のダイは、第1のスケジューリング部の一部を更に有し、及び
    前記第2のダイは、前記第1のダイとダイ間結合により結合される第2のスケジューリング部の一部を更に有し、前記第1のスケジューリング部の一部と共にスケジューリング部として連携して動作する、
    請求項39記載の装置。
  41. 前記第1のダイは、第1のアドレス生成部の一部を更に有し、及び
    前記第2のダイは、第2のアドレス生成部の一部を更に有し、
    前記第1のアドレス生成の一部は、前記第2のアドレス生成部の一部と結合され、前記第2のアドレス生成部の一部と共にアドレス生成部として連携して動作する、
    請求項39記載の装置。
  42. 前記配列は、レジスターファイルである、
    請求項39記載の装置。
  43. 前記配列は、マイクロコードメモリーの配列である、
    請求項39記載の装置。
  44. マイクロプロセッサーは、前記第1の区画を有する前記第1のダイ、前記第2の区画を有する前記第2のダイと共に前記第1のダイに配置されたインターフェースを有し、及び
    前記装置は、前記マイクロプロセッサーの前記インターフェース部と結合されたメモリーを更に有するシステムであり、前記メモリーは、マイクロプロセッサーにより実行された時に、前記マイクロプロセッサーに前記第1のダイの前記第1の区画及び前記第2のダイの前記第2の区画を呼び出させる命令を格納する、
    請求項39記載の装置。
  45. RF部を有する追加のシステム要素
    を更に有する、請求項38記載のシステム。
  46. 前記第1のロジック部は、低電力密度領域を有し、及び前記第2のロジック部は、高電力密度領域を有する、
    請求項1記載の装置。
  47. 前記第1のロジック部は、少なくとも部分的に前記第2のロジック部と重なり合う、
    請求項46記載の装置。
JP2006543849A 2003-12-16 2004-11-24 装置及びプロセッサー Pending JP2007514317A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/738,680 US20050127490A1 (en) 2003-12-16 2003-12-16 Multi-die processor
PCT/US2004/039236 WO2005062190A1 (en) 2003-12-16 2004-11-24 Multi-die processor

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010225469A Division JP2011029663A (ja) 2003-12-16 2010-10-05 装置及びプロセッサー

Publications (1)

Publication Number Publication Date
JP2007514317A true JP2007514317A (ja) 2007-05-31

Family

ID=34654251

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2006543849A Pending JP2007514317A (ja) 2003-12-16 2004-11-24 装置及びプロセッサー
JP2010225469A Pending JP2011029663A (ja) 2003-12-16 2010-10-05 装置及びプロセッサー
JP2013173544A Expired - Fee Related JP5847773B2 (ja) 2003-12-16 2013-08-23 装置及びプロセッサー

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2010225469A Pending JP2011029663A (ja) 2003-12-16 2010-10-05 装置及びプロセッサー
JP2013173544A Expired - Fee Related JP5847773B2 (ja) 2003-12-16 2013-08-23 装置及びプロセッサー

Country Status (5)

Country Link
US (2) US20050127490A1 (ja)
JP (3) JP2007514317A (ja)
CN (1) CN1630080B (ja)
TW (1) TWI284410B (ja)
WO (1) WO2005062190A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012511263A (ja) * 2008-12-10 2012-05-17 クアルコム,インコーポレイテッド 3dマイクロアーキテクチャのシステムにおいて結合する平行プレーンメモリおよびプロセッサ

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050127490A1 (en) 2003-12-16 2005-06-16 Black Bryan P. Multi-die processor
JP4799157B2 (ja) 2005-12-06 2011-10-26 エルピーダメモリ株式会社 積層型半導体装置
DE102006028719B4 (de) * 2006-06-20 2008-05-08 Infineon Technologies Ag Halbleiterbauteil mit Halbleiterchipstapel und Verbindungselementen sowie Verfahren zur Herstellung des Halbleiterbauteils
US20080122061A1 (en) * 2006-11-29 2008-05-29 Texas Instruments Incorporated Semiconductor chip embedded in an insulator and having two-way heat extraction
US8110899B2 (en) * 2006-12-20 2012-02-07 Intel Corporation Method for incorporating existing silicon die into 3D integrated stack
US7692946B2 (en) 2007-06-29 2010-04-06 Intel Corporation Memory array on more than one die
US8679861B2 (en) 2007-11-29 2014-03-25 International Business Machines Corporation Semiconductor chip repair by stacking of a base semiconductor chip and a repair semiconductor chip
US7777330B2 (en) * 2008-02-05 2010-08-17 Freescale Semiconductor, Inc. High bandwidth cache-to-processing unit communication in a multiple processor/cache system
US8597960B2 (en) 2008-03-04 2013-12-03 International Business Machines Corporation Semiconductor chip stacking for redundancy and yield improvement
US8418115B1 (en) * 2010-05-11 2013-04-09 Xilinx, Inc. Routability based placement for multi-die integrated circuits
CN103681639B (zh) * 2012-09-25 2017-02-08 格科微电子(上海)有限公司 系统级封装结构及其封装方法
US9041220B2 (en) 2013-02-13 2015-05-26 Qualcomm Incorporated Semiconductor device having stacked memory elements and method of stacking memory elements on a semiconductor device
US20170083063A1 (en) * 2015-09-21 2017-03-23 Qualcomm Incorporated Circuits and methods providing temperature mitigation for computing devices using in-package sensor
US10600691B2 (en) 2016-10-07 2020-03-24 Xcelsis Corporation 3D chip sharing power interconnect layer
US10593667B2 (en) 2016-10-07 2020-03-17 Xcelsis Corporation 3D chip with shielded clock lines
US10762420B2 (en) 2017-08-03 2020-09-01 Xcelsis Corporation Self repairing neural network
US10672743B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D Compute circuit with high density z-axis interconnects
US10586786B2 (en) 2016-10-07 2020-03-10 Xcelsis Corporation 3D chip sharing clock interconnect layer
US10600735B2 (en) 2016-10-07 2020-03-24 Xcelsis Corporation 3D chip sharing data bus
US10600780B2 (en) 2016-10-07 2020-03-24 Xcelsis Corporation 3D chip sharing data bus circuit
US10580735B2 (en) 2016-10-07 2020-03-03 Xcelsis Corporation Stacked IC structure with system level wiring on multiple sides of the IC die
CN110088897A (zh) 2016-10-07 2019-08-02 艾克瑟尔西斯公司 直接键合原生互连件和有源基部管芯
US10580757B2 (en) 2016-10-07 2020-03-03 Xcelsis Corporation Face-to-face mounted IC dies with orthogonal top interconnect layers
US10672744B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D compute circuit with high density Z-axis interconnects
US10672745B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D processor
US10672663B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D chip sharing power circuit
WO2019079625A1 (en) * 2017-10-20 2019-04-25 Xcelsis Corporation HIGH DENSITY 3D CALCULATION CIRCUIT FOR Z-AXIS INTERCONNECTIONS
FR3082656B1 (fr) 2018-06-18 2022-02-04 Commissariat Energie Atomique Circuit integre comprenant des macros et son procede de fabrication
KR20200109521A (ko) * 2019-03-13 2020-09-23 삼성전자주식회사 패키지 온 패키지 및 이를 포함하는 패키지 연결 시스템
US11599299B2 (en) 2019-11-19 2023-03-07 Invensas Llc 3D memory circuit
US11238206B1 (en) 2021-03-26 2022-02-01 Xilinx, Inc. Partition wire assignment for routing multi-partition circuit designs

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04158565A (ja) * 1990-10-22 1992-06-01 Seiko Epson Corp プログラム命令語長可変型計算装置及びデータ処理装置
JPH04196159A (ja) * 1990-11-26 1992-07-15 Kawasaki Steel Corp 半導体装置
JPH05283607A (ja) * 1992-02-03 1993-10-29 Hitachi Ltd 半導体集積回路装置及びそれを利用した計算機システム
JPH11168185A (ja) * 1997-12-03 1999-06-22 Rohm Co Ltd 積層基板体および半導体装置
JP2000223657A (ja) * 1999-02-03 2000-08-11 Rohm Co Ltd 半導体装置およびそれに用いる半導体チップ
JP2000227457A (ja) * 1999-02-05 2000-08-15 Rohm Co Ltd 半導体装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995009438A1 (en) 1993-09-30 1995-04-06 Kopin Corporation Three-dimensional processor using transferred thin film circuits
JPH1022449A (ja) * 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 半導体装置
US5909587A (en) * 1997-10-24 1999-06-01 Advanced Micro Devices, Inc. Multi-chip superscalar microprocessor module
US6093969A (en) * 1999-05-15 2000-07-25 Lin; Paul T. Face-to-face (FTF) stacked assembly of substrate-on-bare-chip (SOBC) modules
US6093938A (en) * 1999-05-25 2000-07-25 Intel Corporation Stacked die integrated circuit device
US6559531B1 (en) * 1999-10-14 2003-05-06 Sun Microsystems, Inc. Face to face chips
US6605875B2 (en) * 1999-12-30 2003-08-12 Intel Corporation Integrated circuit die having bond pads near adjacent sides to allow stacking of dice without regard to dice size
JP3871853B2 (ja) * 2000-05-26 2007-01-24 株式会社ルネサステクノロジ 半導体装置及びその動作方法
US6917219B2 (en) * 2003-03-12 2005-07-12 Xilinx, Inc. Multi-chip programmable logic device having configurable logic circuitry and configuration data storage on different dice
JP4190961B2 (ja) * 2003-06-26 2008-12-03 株式会社ルネサステクノロジ マルチチップモジュール
US20050127490A1 (en) 2003-12-16 2005-06-16 Black Bryan P. Multi-die processor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04158565A (ja) * 1990-10-22 1992-06-01 Seiko Epson Corp プログラム命令語長可変型計算装置及びデータ処理装置
JPH04196159A (ja) * 1990-11-26 1992-07-15 Kawasaki Steel Corp 半導体装置
JPH05283607A (ja) * 1992-02-03 1993-10-29 Hitachi Ltd 半導体集積回路装置及びそれを利用した計算機システム
JPH11168185A (ja) * 1997-12-03 1999-06-22 Rohm Co Ltd 積層基板体および半導体装置
JP2000223657A (ja) * 1999-02-03 2000-08-11 Rohm Co Ltd 半導体装置およびそれに用いる半導体チップ
JP2000227457A (ja) * 1999-02-05 2000-08-15 Rohm Co Ltd 半導体装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012511263A (ja) * 2008-12-10 2012-05-17 クアルコム,インコーポレイテッド 3dマイクロアーキテクチャのシステムにおいて結合する平行プレーンメモリおよびプロセッサ

Also Published As

Publication number Publication date
CN1630080B (zh) 2010-05-05
US8860199B2 (en) 2014-10-14
US20050127490A1 (en) 2005-06-16
TWI284410B (en) 2007-07-21
TW200532895A (en) 2005-10-01
US20090138688A1 (en) 2009-05-28
JP2011029663A (ja) 2011-02-10
JP2013258425A (ja) 2013-12-26
JP5847773B2 (ja) 2016-01-27
WO2005062190A1 (en) 2005-07-07
CN1630080A (zh) 2005-06-22

Similar Documents

Publication Publication Date Title
JP5847773B2 (ja) 装置及びプロセッサー
Ozaki et al. Cool mega-arrays: Ultralow-power reconfigurable accelerator chips
US8386690B2 (en) On-chip networks for flexible three-dimensional chip integration
Siegl et al. Data-centric computing frontiers: A survey on processing-in-memory
Puttaswamy et al. Thermal herding: Microarchitecture techniques for controlling hotspots in high-performance 3D-integrated processors
US6630731B2 (en) Semiconductor device
US20100140750A1 (en) Parallel Plane Memory and Processor Coupling in a 3-D Micro-Architectural System
Homayoun et al. Dynamically heterogeneous cores through 3D resource pooling
US20040019765A1 (en) Pipelined reconfigurable dynamic instruction set processor
EP2645263A2 (en) Memory device and method of operating the same
US8539153B2 (en) System on chip and electronic system having the same
JP2009510617A (ja) 多コア・プロセッサの電力供給及び電力管理
TWI706527B (zh) 動態隨機存取記憶體(dram)安裝技術
Loh et al. The next era for chiplet innovation
Chacin et al. COOL interconnect low power interconnection technology for scalable 3D LSI design
CN111209246B (zh) 一种基于多芯片封装技术的微型可编程片上计算机
Matsumoto et al. Cool System scalable 3-D stacked heterogeneous Multi-Core/Multi-Chip architecture for ultra low-power digital TV applications
US20170168829A1 (en) Processor, computing system comprising the same and method for driving the processor
US20230315334A1 (en) Providing fine grain access to package memory
US20230318825A1 (en) Separately storing encryption keys and encrypted data in a hybrid memory
US20230418604A1 (en) Reconfigurable vector processing in a memory
US20220214972A1 (en) Integrated Circuit with 3D Partitioning
US20230317561A1 (en) Scalable architecture for multi-die semiconductor packages
US20150145122A1 (en) Integrated circuits with internal pads
Linderman et al. A dependable high performance wafer scale architecture for embedded signal processing

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090609

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090908

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090915

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091008

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100907

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101005

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110607