JPH05283607A - 半導体集積回路装置及びそれを利用した計算機システム - Google Patents

半導体集積回路装置及びそれを利用した計算機システム

Info

Publication number
JPH05283607A
JPH05283607A JP4319802A JP31980292A JPH05283607A JP H05283607 A JPH05283607 A JP H05283607A JP 4319802 A JP4319802 A JP 4319802A JP 31980292 A JP31980292 A JP 31980292A JP H05283607 A JPH05283607 A JP H05283607A
Authority
JP
Japan
Prior art keywords
integrated circuit
semiconductor integrated
lsi
computer system
circuit device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4319802A
Other languages
English (en)
Inventor
Satoru Kokuni
哲 小國
Kazumichi Yamamoto
一道 山本
Noboru Masuda
昇 益田
Eiki Kamata
栄樹 釜田
Minoru Yamada
稔 山田
Keiichiro Nakanishi
敬一郎 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPH05283607A publication Critical patent/JPH05283607A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/15Structure, shape, material or disposition of the bump connectors after the connecting process
    • H01L2224/16Structure, shape, material or disposition of the bump connectors after the connecting process of an individual bump connector
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2924/00Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
    • H01L2924/30Technical effects
    • H01L2924/301Electrical effects
    • H01L2924/3011Impedance

Abstract

(57)【要約】 【目的】計算機実装技術における従来のモジュール実装
技術のいくつかの欠点を克服し、より高密度な実装を実
現する半導体集積回路装置及び、より高速な計算機シス
テムの構成方法を提供する。 【構成】1個のLSIチップ2イ〜2ヘとほぼ同数の回
路素子を集積した大型LSI1上に、複数のLSIチッ
プ例えば6個としてLSIチップ2イ〜2ヘを搭載し、
各LSIチップ2イ〜2ヘは大型LSI1に設けられた
論理回路を介して接続する。計算機システムを構成する
場合は、複数台の命令処理装置を構成する複数のLSI
チップを、システム制御装置の調停回路やキャッシュデ
ィレクトリ記憶装置等を構成する大型LSIの主面上に
搭載し、さらにキャッシュ記憶装置を構成するLSIチ
ップも搭載し、それらの間を電気的に接続する。 【効果】大規模なシステムをコンパクト化することがで
き、命令処理装置からシステム制御装置へのアクセスも
高速に行なえる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、半導体集積回路装置に
係り、特に大型の集積回路基板上に複数の半導体集積回
路素子を搭載した半導体集積回路装置に関し、さらに、
その製造方法及びそれを用いた計算機システムに関す
る。
【0002】
【従来の技術】まず、計算機システムに関する従来の実
装技術について述べる。大型汎用計算機の実装技術とし
て従来知られているものに、例えば、日経エレクトロニ
クス、1990年12月10日号(No.515)「大型コン
ピュ−タM−880の処理方式とハ−ドウエア技術」で
述べられている実装がある。ここで述べられている実装
は、1個のLSIチップが半田バンプを介して1個のセ
ラミック配線基板上にフェイスダウンで搭載されてLS
Iパッケ−ジと呼ばれているものに封止され、複数個の
LSIパッケ−ジが半田バンプを介して1個のセラミッ
ク配線基板上に搭載されてモジュ−ルと呼ばれているも
のを形成し、モジュ−ルの下面に構成された入出力ピン
がプリント配線基板に構成されたスル−ホ−ルに差し込
まれることにより、モジュ−ルがプリント配線基板上に
搭載されてボ−ドを形成している、といったものであ
る。以下、本明細書中では、このような実装技術をモジ
ュール実装技術と呼び、また、ある程度量産されている
LSIの中で最も高度な加工技術を用いて生産され、許
容範囲内の歩留まりを確保できる程度の寸法を持ったL
SIを「LSIチップ」と呼ぶことにする。
【0003】モジュール実装技術では、LSIチップが
セラミック配線基板の1つの平面上に配置されるため、
LSIチップ数が増加するとセラミック配線基板の面積
が増大し、LSIチップ間を接続する配線の配線長が増
加するという傾向がある。このような長距離の配線によ
り高速信号伝送を行う場合には、配線の終端における信
号の反射を防ぐため、整合伝送を行う必要がある。図5
は、モジュールにおける信号伝送の様子を示す模式図で
ある。例えば、LSIチップ2cからLSIチップ2d
への信号の伝送は、セラミック配線基板上の配線101
を経由して行われる。この場合、LSIチップ2dの入
力端での反射を防ぐため、配線101には、終端抵抗1
02が必要となる。
【0004】また、モジュール実装技術よりもさらに高
密度に実装を実現する手段として、ウエーハ・スケール
集積回路装置を用いる方法が知られている。このウエー
ハ・スケール集積回路装置を用いて複数のLSIを同一
のウエーハ上に集積し、かつLSI間の配線も同一ウエ
ーハ上で行うことにより、モジュール実装技術より高密
度な実装が期待できる。しかしながら、ウエーハ・スケ
ール集積回路装置ではプロセス段階で発生する欠陥が、
ある確率で必ず存在するという、いわゆる歩留りの問題
があり、高密度に回路を集積しても、満足に動作する確
率が極めて低いという問題がある。この点に関しては、
設計の際、冗長な論理回路を予めウエーハ上に配置して
おき、プロセス段階で発生した欠陥を回避、救済する技
術が検討されている。
【0005】他方、特開平2−181465号公報において
は、あらかじめ良品検査の終了したLSIチップを複数
個ウエーハ上に垂直に固定するなどして実装し、ウエー
ハとチップをあわせたシステムとして歩留りを向上させ
る、いわゆるハイブリッド型のウエーハ・スケール集積
回路装置の実装構造が提案されている。この方法によれ
ば、モジュール実装技術に比べて配線ピッチを微細化で
き、実装効率を向上させることができるなどの点で有利
である。
【0006】また他方、特開平3−69150号公報におい
ては、あるLSI上に他の1個のLSIを搭載してボン
ディングするLSI実装構造が開示されている。この方
法によれば、あるLSIとそれに搭載されたLSIとの
間では、配線基板を介さずに接続可能であると同時に、
LSI間の配線距離を短縮できるため、動作を高速化す
ることができる。
【0007】次に、従来の大型汎用計算機システムにつ
いて考えると、計算機システムは、複数の命令処理装置
(=IP)と、複数のシステム制御装置(=SC)と、
1個の主記憶装置(=MS)、入出力制御装置(=IO
P)及び入出力装置(=IO)から構成されている。各
IPでは命令の実行が行なわれ、MSにはプログラムや
データが格納されている。IOPはIOとSCとの接続
及びデータの転送の制御を行い、IOは、例えばディス
クなどの大容量記憶装置や拡張記憶装置、コンソール端
末装置などとの情報の入出力を行う。また、SCは、各
IP、MS及びIOPの接続状態を制御し、各装置間で
のデータの転送等の制御を行なう。比較的小規模な計算
機システムにおいてはSCの機能をIPが分散して持っ
ている場合もある。
【0008】IPは頻繁にMS上のデータを読み出した
りMSへ書き込んだりするが、MSのデ−タ読み出しや
書き込み速度は、IPの命令処理速度に比べて遅いの
で、今日では、通常、MSに比べて小容量であるが高速
なデ−タの読み出しや書き込みの行えるキャッシュ記憶
装置を設け、ここにMS上の一部のデータの写しを格納
している。このキャッシュ記憶装置をIPやSCに設置
した場合、それぞれバッファストレジ(=BS)、ワ−
クストレジ(=WS)と呼ばれている。計算機システム
の記憶方式として、BSとWSの両方設けるいわゆる3
階層記憶方式と、BSのみ設けるいわゆる2階層記憶方
式とがある。
【0009】IPの内部には、命令を読み出しデコード
する命令処理回路(=IU)、BS及びそれを管理する
回路からなるバッファ回路(=BU)、命令の実行を行
なう演算回路(=EU)及びマイクロプログラムを格納
している制御記憶回路(=CS)がある。
【0010】計算機システムにおける動作は通常次のよ
うに行なわれる。IPにおいて、IUは、その内部にあ
るプログラムカウンタの指示する命令をBSから読み出
し命令をデコードし、命令のデコード結果の内容に従っ
てIUもしくはEU内にあるレジスタまたはBSよりオ
ペランドを読み出す。次にEUは、読み出されたオペラ
ンドを用い命令のデコード結果に従って演算を行なう。
この時、演算を行なうための制御情報としてCSからマ
イクロプログラムの読み出しを行なう。そして、演算の
結果をレジスタもしくはBSに格納する。なお、プログ
ラムカウンタは命令の実行毎に更新される。
【0011】IPは以上のような一連の動作を繰り返し
て命令を実行していく。今日の多くの計算機システムで
は、この一連の動作をいくつかのステージに分割して、
ある命令の1ステージが完了すれば次の命令のそのステ
ージの実行を開始することにより、数命令をオーバラッ
プさせて順次実行している。これは命令パイプライン方
式(先行制御方式)と呼ばれている。
【0012】ところで、IPは命令実行中に、命令とデ
ータをBSに読み出しや書き込みのためにアクセスする
が、アクセスした時に所望の命令やデータがBSにある
(=INBS)場合には上記のように命令実行が行われ
るが、BSにない(=NIBS)場合には、命令実行は
中断され、WSにブロック転送要求信号を出す。
【0013】このように、アクセスした時に所望の命令
やデータがBSにない(NIBS)時やブロック転送要
求に対する命令やデータが存在しない(NIWS)時に
は命令実行が中断されるために計算機システムの処理性
能を低下させる。
【0014】
【発明が解決しようとする課題】LSI技術の進歩によ
るLSIチップの高集積化と、セラミック配線基板作成
技術の向上によるセラミック配線基板の大型化、多層化
により、モジュール当たりに搭載できる回路規模が増大
している。
【0015】上記したモジュ−ル実装においては、LS
Iチップ間での信号伝送(=チップ渡り)を行う場合に
は、同一モジュ−ル内にあるLSIチップ間であると信
号は次のような配線経路をたどり、配線上の伝搬に要す
る時間が長くなる。 1)出力バッファを経由する 2)LSIチップ外へ出て、半田バンプを通過する 3)セラミック配線基板の配線を伝搬する 4)LSIパッケ−ジ外へ出て、半田バンプを通過する 5)セラミック配線基板の配線を伝搬する 6)半田バンプを通過して、別のLSIパッケ−ジ内へ
入る 7)セラミック配線基板の配線を伝搬する 8)半田バンプを通過してLSIチップ内へ入る 9)入力バッファを経由する さらに、同一ボ−ド内にあって異なるモジュ−ル内にあ
るLSIチップ間で、信号を伝送する場合には、上記
5)の部分が以下のようになる。 5−1)セラミック基板の配線を伝搬する 5−2)モジュ−ル外へ出て、入出力ピンを通過する 5−3)プリント基板の配線を伝搬する 5−4)入出力ピンを通過して、モジュ−ル内へ入る 5−5)セラミック基板の配線を伝搬する これら1)から9)までに要される時間(=チップ渡り
時間)の長さは、LSIチップ内での信号の伝送される
時間の最大値の数倍程度に相当し、また、チップ渡り時
間の長さの内訳についてみれば、3)、5)、7)、5
−1)、5−3)及び5−5)のような配線上の伝搬に
要される時間は、入出力バッファ、半田バンプ及び入出
力ピンの通過に要される時間と同程度である。配線上の
伝搬に要される時間を小さくするためには、同一の実装
技術の下では配線長を短くすることが最も効果的であ
る。しかし、モジュ−ル実装によって計算機システムを
構成する場合には、LSIチップが配線基板上で平面的
に配置されているために、LSIチップ間の距離により
LSIチップ間を接続する配線の配線長は決まり、さら
に、このLSIチップ間の距離は、接続するLSIチッ
プの個数、LSIチップ自体の寸法あるいはLSIパッ
ケ−ジの寸法により決定されるので、配線長の短縮には
限界がある。これが本発明が解決しようとする第1の課
題である。
【0016】ところで、モジュール当たりの回路規模の
増大に伴い、モジュールから取り出す信号、または電源
供給用の端子数をより増やしたいとの要求が強くなって
きている。しかし、モジュール実装技術における端子の
ピッチは、セラミック基板との接続強度の都合上、あま
り小さくすることはできない。このため、モジュール実
装技術では、取り出し可能な端子数によって、実現しよ
うとする装置の規模が決められてしまうという、いわゆ
るピンネックの問題が次第に大きくなってきている。こ
の点は、例えば、複数の命令処理装置を持つ主記憶共有
型の計算機システムにおけるシステム制御装置SCのよ
うに、他の装置からの信号線が集中するような装置の実
装では、更に大きな問題となる。これが、本発明の解決
しようとする第2の課題である。
【0017】また、一般に、信号伝送する場合、信号の
立ち上がり、または立ち下がり時間と信号の反射波が送
端に戻ってくるまでの時間では後者の方が長い場合、つ
まり、長距離の配線の場合には終端抵抗を用いて整合伝
送する必要がある。モジュール実装技術では、LSI間
を伝わる信号を整合伝送するため、各配線ごとに終端抵
抗が必須であり、この終端抵抗によってかなり大きな電
力が消費されるという問題がある。これが、本発明の解
決しようとする第3の課題である。
【0018】一方、モジュール実装技術よりも、更に高
集積化を実現する技術として、ウエーハ・スケール集積
回路技術が検討されている。例えば、4台のIPと、S
C等を一つのウエーハ・スケール集積回路装置に集積す
ることを想定する。この時、このウエーハ・スケール集
積回路装置から取り出すべき信号端子は、少なくなり、
上記のモジュール実装技術の場合に比べ、ピンネックの
問題は大幅に緩和される。しかし、ウエーハ・スケール
集積回路装置上の配線は、LSIチップ上の配線と比較
して、配線距離の長い配線が多くなる。長距離の配線
は、配線抵抗が大きくなり、配線抵抗と配線容量の積に
よって決まる伝送信号の遅延時間、つまり、配線遅延時
間が増大する。よって、モジュール実装技術に比較して
回路の性能が低下してしまうという問題がある。また、
抵抗の大きい配線を給電に用いることによる電圧ドロッ
プも問題となる。これが、本発明の解決しようとする第
4の課題である。
【0019】また、従来のウエーハ・スケール集積回路
装置では、冗長回路等によって歩留りを確保する工夫を
した上で、LSIと同程度の素子の集積密度を得ようと
するため、回路としての集積密度を上げることが困難で
あるという問題点がある。これが、本発明の解決しよう
とする第5の課題である。
【0020】ところで、計算機システムを構成した場
合、命令実行中に起こるNIBS(アクセスした時に所
望の命令やデータがない)やNIWS(転送要求時にワ
ークストレージに命令やデータが存在しない)などが原
因となる性能低下が問題となっている。このようなオー
バヘッドに伴う性能低下を軽減させることが本発明の第
6の課題である。
【0021】また、LSIチップの集積度により、IP
を数チップから構成する場合にはIUやEUとBSやC
Sを別チップに構成することが多いが、その場合には、
IUやEUからBSやCSへのアクセス時間が長いこと
により計算機システムの処理性能が制限される。これ
が、本発明の解決しようとする第7の課題である。
【0022】
【課題を解決するための手段】上記第1・第2及び第3
の課題を解決するために、本発明の半導体集積回路装置
または計算機システムは、モジュール実装技術における
セラミック配線基板の代わりに、能動素子を集積した大
型LSIを用意し、この上にLSIチップを複数個搭載
し、能動素子を介して相互に接続することによって構成
される。
【0023】また、上記第4の課題を解決するために本
発明の半導体集積回路装置における大型LSI上の配線
は、単位長さ当たりの抵抗が低くなるように、つまり従
来のLSI上の配線より厚くなるように構成される。ま
たその厚い配線を形成する手段として、例えば、銅等の
金属をめっき材料とするめっき工程が用いられる。
【0024】さらに、上記第5の課題を解決するために
本発明の半導体集積回路装置は、大型LSIに集積する
回路素子数を、通常の1つのLSIに集積する回路素子
数とほぼ同程度か、または少なくする。あるいは、配線
幅、配線間隔に対する制限を緩める。
【0025】また、第6の課題を解決するために、3階
層記憶方式の計算機システムを以下のように構成する。
IP(命令処理装置)1台を1個の上記LSIチップ内
に構成し、WSをLSIチップ内に設置し、これらのL
SIチップを上記大型LSIの主面上に搭載し、上記大
型LSI内に、SC(システム制御装置)内の回路であ
る調停回路・WAA・制御回路・RA・LCA・LKA
・FLKA・FAA・EXA等を設置する。そして、W
SからIPへデ−タを送る信号配線を大型LSI内に構
成してその信号配線上にラッチを構成する(なお、各回
路の詳細は実施例の中で述べる)。
【0026】また、第7の課題を解決するために、IP
の構成方法として、1個のLSIチップ内にIUやEU
を構成し、別のLSIチップ内にBSやCSを構成し
て、これらのLSIを上記大型のLSIの主面上に搭載
し、BSやCSから命令処理装置IPへデ−タを送る信
号配線を大型LSI内に構成してその信号配線上にラッ
チを構成する。
【0027】
【作用】上記大型LSIと上記LSIチップ間を、能動
素子を介して電気的に接続した場合、これら2個のLS
Iの間での信号伝送は次のようになる。 1)出力バッファを経由する 2)半田バンプ等のピンを通過する 3)入力バッファを経由する つまり、モジュ−ル実装の場合と比較して、配線基板上
の配線を信号が伝搬することがない。このことにより、
信号のチップ渡り時間は、モジュ−ル実装の場合のチッ
プ渡り時間の数分の1とすることができる。
【0028】また、大型LSI上に、LSIを搭載して
接続することにより、その接する面に信号ピンを配置す
ることができるため、例えば大型LSIの4辺での信号
ピンの集中を緩和できる。
【0029】大型LSI上に集積される能動素子を用い
て信号配線の途中にバッファやラッチ等を設けることが
できるので、伝達すべき配線の長さを整合伝送の必要が
無くなるまで短くすることができる。よって、終端抵抗
を無くすことができる。
【0030】一方、大型LSIに、LSIチップで用い
られる配線よりも厚い配線を形成することにより、大型
LSI上に低抵抗の配線を構成することができる。
【0031】また、大型LSIに集積する回路素子数
を、1つのLSIの回路素子数とほぼ同程度か、それ以
下にすることによって、大型LSIの歩留りを確保する
ことができる。
【0032】従来のモジュ−ル実装であれば、LSIチ
ップを搭載する基板上には配線のみであったが、本発明
では能動素子をも備えることにより、従来のIPとWS
間の伝送路上に調停回路・WAA等を配置することがで
き、WSの起動が従来よりも高速に行え、またライン転
送要求信号も高速に生成することができる。また、IP
がSCへストア要求やRESETLOCKを行う場合、
また、異なるIP間でのBSの内容及び異なるSCのW
S間での内容の一致制御を行う場合についても同様に高
速な処理を行うことができる。
【0033】また、大型LSI上に搭載されたLSIチ
ップ間では、その配線を大型LSI内に構成することに
より配線上にラッチを構成することが可能となる。ラッ
チを構成することによりパイプライン伝送ができ、配線
のスループットを向上させることができる。
【0034】また、IPをIUやEUを構成するLSI
チップとBSやCSを構成する別のLSIチップを大型
LSI上に搭載して両LSI間の信号線上にラッチを設
けることにより、IUやEUとBS間の配線あるいはI
UやEUとCS間の配線でパイプライン伝送ができ、I
UやEUからBSやCSへのアクセス時間により計算機
システムの性能が制限されるのを緩和することができ、
また、配線のスループットを向上させることができる。
【0035】
【実施例】以下、図面を用い本発明を詳細に説明する。
図1は、本発明における半導体集積回路装置の第1の実
施例を示す概観図である。図2には、図1に示した半導
体集積回路装置におけるA−A’部分での断面図を示
す。
【0036】図において、1は複数のLSIチップを主
面上に搭載できるような寸法の大型のLSI(=大型L
SI)であって、内部に回路素子が形成されている。大
型LSI1は配線基板5上に搭載され、大型LSI内の
回路素子と配線基板5に形成された配線とは、TAB
(テープ・オートメーティド・ボンディング)リード3
により電気的に接続されている。また、大型LSI1の
主面上には、例えば6個のLSIチップ2イ・2ロ・2
ハ・2ニ・2ホ・2ヘをフェイスダウンで搭載してい
る。そして、大型LSI1内の回路素子とLSIチップ
2内の回路素子は、必要に応じて半田バンプ電極4によ
り電気的に接続される。このような構造により、大型L
SIとその上に搭載されたLSIチップとは、その間で
の信号伝送に要する時間は、通常のモジュール実装の場
合のチップ間での信号伝送に要する時間の数分の1とな
る。
【0037】上記大型LSIと上記LSIチップ間を、
半田バンプを用いて電気的に接続した場合、これら2個
のLSIの間での信号伝送は次のようになる。 1)出力バッファを経由する 2)半田バンプ等のピンを通過する 3)入力バッファを経由する つまり、モジュ−ル実装の場合と比較して、配線基板上
の配線を信号が伝搬することがない。このことにより、
信号のチップ渡り時間は、モジュ−ル実装の場合のチッ
プ渡り時間の数分の1とすることができる。
【0038】本実施例において、LSIチップ2イ・2
ロ・2ハ・2ニ・2ホ・2ヘは、通常用いられるLSI
チップであって、例えば寸法20mm角の集積回路素子で
ある。また、大型LSI1は、LSIチップ2イ・2ロ
・2ハ・2ニ・2ホ・2ヘ等複数個搭載するため、例え
ば50mm×70mmといった大きな面積の主面を有する集
積回路素子である。このため、大型LSIではピン数を
LSIチップと比較して多くすることが可能である。ま
た、本実施例ではLSIチップの数を例えば6個とする
が、必ずしも6個に限定しない。
【0039】大型LSI1には、1個のLSIチップ
(例えば2イ)に集積される回路素子の数とほぼ同数、
あるいは、それ以下の数の回路素子を集積する。集積回
路素子上では欠陥が一様に分布するものと考えた場合、
このように大型LSI1に形成される回路素子の個数を
制限することにより、大型LSI1上の論理回路に不良
が発生する確率を、LSIチップ2イ上の論理回路に不
良が発生する確率に等しいか、またはそれ以下とするこ
とができる。さらに、上述したように、大型LSI1は
LSIチップ2イの少なくとも2倍以上の面積を有する
から、大型LSI1の単位面積当りの回路素子数は、L
SIチップ2イの単位面積当りの回路素子数よりも少な
いものとなる。このため、大型LSI1内に形成される
配線の幅、または、間隔に対する制約をLSIチップ2
イのそれよりも緩くすることができる。従って、本実施
例における大型LSI1では、大面積を有する半導体集
積回路装置で問題となる歩留りを確保することができ
る。
【0040】さて、本実施例では、大型LSI1とし
て、上述したように例えば寸法50mm×70mmの集積回
路を考えているが、このような大面積の半導体集積回路
装置では、LSIチップ内の配線よりも長距離の配線、
即ち、従来のセラミック配線基板やプリント配線基板に
形成されてきたような、例えば、LSIチップ2イ〜2
ヘの対角線の長さよりも長い配線が必要になる。
【0041】通常、LSIチップ内に形成される配線
は、微細なアルミニウム配線であり、セラミック配線基
板やプリント配線基板に形成される配線と比較して単位
長さあたりの配線抵抗が大きい。従って、従来のよう
に、微細なアルミニウム配線を用いて大型LSI1上の
長距離配線を構成すると、その配線抵抗は、セラミック
配線基板やプリント配線基板の配線抵抗より大きなもの
となる。さらに、伝送遅延時間は配線抵抗と配線容量の
積によって決まるため、微細なアルミニウム配線では伝
送遅延時間も増えることになる。よって、大型LSI1
内の配線として、従来の微細なアルミニウム配線のみを
用いると、大型LSI1内に形成される論理回路の性能
が、LSIチップ2イ内に形成される論理回路、または
モジュール実装技術による論理回路の性能よりも低下し
てしまう。
【0042】このような問題点を改善するために本実施
例では、例えば、配線材料として銅等の金属を用いて厚
さの厚い配線を大型LSI1に形成する。銅配線はメッ
キ工程等を用いて形成できるため、数μm以上の厚い膜
を形成することが可能であり、アルミニウム配線に比べ
て配線抵抗を格段に下げることができる。このような銅
を用いた配線を、本明細書中では、厚膜銅配線とよぶ。
厚膜銅配線を少なくとも1層以上設け、大型LSI1上
の長距離の配線を構成することにより、大型LSI1内
の長距離の配線を低抵抗化し、伝送遅延時間を短縮する
ことができる。さらに、この厚膜銅配線を信号配線のみ
でなく、電源給電用に用いることによって効率的に電力
を供給することもできる。
【0043】図3は、本発明の半導体集積回路装置の第
2の実施例による半導体集積回路装置の断面の様子を示
す模式図である。本実施例では、第1の実施例における
大型LSI1内に、LSIチップ相互の間を接続、切替
を行うためのネットワーク論理回路が形成されている。
101は、大型LSI1に形成されたLSIチップの信
号端子間を接続する信号配線である。信号配線101の
適当な箇所にバッファ100が設けられており、例え
ば、LSIチップ2aからの出力信号は、大型LSI1
内に形成されたこのバッファ100により中継されてL
SIチップ2bへ伝送される。
【0044】なお、バッファ100としては、例えば図
4に示すようなC−MOS回路によって構成する。
【0045】従来のモジュール実装技術では図5に示す
ように、例えば、LSIチップ2cから出力された信号
は、セラミック配線基板上の信号配線101を経由して
LSIチップ2dへ伝送される。このような信号の伝送
は、配線端における反射の影響をなくすため整合伝送に
よって行なわれる。通常、整合伝送では、終端抵抗10
2が必要となる。終端抵抗102そのものは信号の反射
を防ぐ重要な部品であるが、基板上の信号配線101の
電位がゼロ以外で定常状態にあるときは、終端抵抗によ
って信号伝送とは無関係に無駄な電力が消費されること
になる。
【0046】これに対して、本実施例によれば、バッフ
ァ100によって、LSIチップ2a、2b間の信号配
線101を反射による悪影響が無くなるまで短く分割で
き、LSIチップ間の信号配線に整合伝送を用いる必要
がなくなる。このため、終端抵抗における無駄な電力の
消費をなくすことができ、半導体集積回路装置の消費電
力を低減することができる。ここで、信号配線を「反射
による悪影響が無くなるまで短くする」とは、つまり、
信号の立ち上がり、または立ち下がり時間より、信号の
反射波が送端に戻って来るまでの時間の方が短くなるよ
うに信号配線を短くすることをいう。
【0047】図6は、図3のようにバッファを用いた本
発明の伝送方法と、図5のような単なる配線による従来
の伝送方法の伝達遅延時間を比較したシミュレーション
結果の一例を示すものである。なお、シミュレーション
条件は次のとおりである。 0.3μmルールCMOS LSI p型FETのソースドレイン間電流:7.5mA n型FETのソースドレイン間電流:3.8mA 配線抵抗: 15Ω/mm 配線容量:0.22pF/mm 図6によれば、図3における2aから2bまでの配線の
長さが約15mm以上ならば、バッファを用いて伝送す
る方がより高速であることが明らかである。
【0048】図7は、本発明の半導体集積回路装置の第
3の実施例による半導体集積回路装置の断面の様子を示
す模式図である。
【0049】本実施例では、例えば、大型LSI1内に
形成された信号配線101によりLSIチップ2eの出
力信号をLSIチップ2fに伝送する。信号配線101
の途中には、バッファ100、ラッチ103などを配置
している。ラッチ103には、やはり、大型LSI1に
形成されたクロック分配配線104からクロック信号が
供給されている。
【0050】LSIチップ2eからの出力信号は、ラッ
チ103に入力され、大型LSI1内のクロック分配配
線104から供給されるクロック信号に同期してラッチ
される。そして、ラッチ103の出力は、LSIチップ
2fへ入力される。LSIチップ2e内に形成された出
力信号をラッチするための出力ラッチ(図示せず)、L
SIチップ2f内に形成された入力信号を受けるラッチ
(図示せず)、及び、ラッチ103とはクロック分配配
線104により分配されるクロック信号により同期して
動作するようになっている。このように、信号伝送路上
にラッチ103を配置することにより、いわゆるパイプ
ライン伝送が可能になる。LSIチップ2eから2fへ
の伝送路をラッチ103により分割するため、1クロッ
クの間に、ラッチにより分割された伝送路の一区間分の
距離のみを信号伝送すればよい。本実施例では、1個の
ラッチ103により伝送路を2つに分割しているが、大
型LSI1内の伝送路上にラッチを複数段設けて一区間
分の距離をさらに短くすることも可能である。伝送路上
の一区間の距離を短くすることにより周期の短いクロッ
ク信号を用いて信号伝送をすることができるようにな
る。
【0051】これに対し、従来のモジュール実装では、
例えば、図4におけるLSIチップ2cから2dまでの
伝送路を1クロックで伝送しなければならず、従ってク
ロックの周期を短くすることが難しい。
【0052】なお、図1から図3及び図7では省略して
あるが、LSIチップの発熱が問題となる場合には、L
SIチップ2イ〜ヘの背面(半田バンプを形成する面の
反対側の面)に、冷却用フィンもしくは水冷用構造体等
を取付けることになる。
【0053】さらに、以上のような半導体集積回路装置
を適用したシステムの一例として、互いに主記憶を共有
する複数の命令処理装置からなるマルチプロセッサ型の
汎用計算機システムを考える。図8には、このようなマ
ルチプロセッサ型の汎用計算機システムの構成の一例を
示す。図において、1000は命令処理装置(IP)、
1001はシステム制御装置の論理回路部分、1002
はキャッシュ・メモリー装置、1003は主記憶装置、
1004は入出力装置である。なお、入出力装置は入出
力制御装置を介してシステム制御と接続されている場合
もある。
【0054】まず、各装置の説明をする。命令処理装置
1000は、主記憶装置1003から命令とデータを読
み出し、命令を解釈、実行し、その結果変更を受けたデ
ータを主記憶装置に戻すという動作を繰り返す。キャッ
シュ・メモリー装置1002は、主記憶装置1003よ
りも高速にアクセス可能なメモリーであり、主記憶装置
1003内の一部の写しを保持している。命令処理装置
1000は、主記憶装置1003を直接アクセスせずに
キャッシュ・メモリー装置1002をアクセスする。こ
れにより、主記憶装置1003へのアクセスを見かけ上
高速化することができる。
【0055】システム制御装置の論理回路部分1001
は、各命令処理装置1000とキャッシュ・メモリー装
置1002、入出力装置1004間の接続状態を制御
し、アクセス順序の制御を行う。また、キャッシュ・メ
モリー装置1002と、主記憶装置1003との内容の
交換及び内容の一致制御も行う。主記憶装置1003
は、命令処理装置1000で処理される命令及びデータ
を蓄える。入出力装置1004は、例えばディスクなど
の大容量記憶装置や拡張記憶装置、コンソール端末装置
などとの情報の入出力を行う。
【0056】本実施例では、例えば実施例1で説明した
大型LSI1にシステム制御装置の論理回路部分100
1とキャッシュ・メモリー装置1002を集積し、1個
のLSIチップ2(以下でLSIチップ2イ〜ヘを区別
する必要のない場合には、単にLSIチップと呼ぶこと
にする。)を用いて1台の命令処理装置1000を構成
し、4個のLSIチップ2を大型LSI1に搭載して接
続することで、上記のマルチプロセッサ型の汎用計算機
システムの命令処理装置1000と、システム制御装置
の論理回路部分1001と、キャッシュ・メモリー装置
1002を構成する。このようにして構成した半導体集
積回路装置と、主記憶装置1003、入出力装置100
4などを組み合わせて、互いに主記憶を共有する複数の
命令処理装置からなるマルチプロセッサ型の汎用計算機
システムを構成する。さらに、このような汎用計算機シ
ステムを複数用意し、各々のシステム制御装置の論理回
路部分1001間を接続することにより、より多数の命
令処理装置からなるマルチプロセッサ型の汎用計算機シ
ステムを実現することもできる。
【0057】ところで、システム制御装置の論理回路部
分1001には、命令処理装置1000、主記憶装置1
003、入出力装置1004、他のシステム制御装置な
どからの多数の信号線が集中する。このような性質のた
め、システム制御装置を集積化して実現する場合には、
いかに大量の信号ピンを取り出すか、ということが問題
となる。
【0058】本発明では、命令処理装置1000をLS
Iチップ2で構成し、これをシステム制御装置の論理回
路部分1001を集積した大型LSI1上に搭載する。
この構成により、LSIチップ2と、大型LSI1との
接続に、例えば半田バンプ電極を用いるフェィスダウン
法を適用することが可能になり、大型LSI1とLSI
チップ2とが向い合う面に信号ピンを配置することがで
きる。このため、大型LSI1の4辺に設ける信号ピン
は、主記憶装置1003、入出力装置1004への接続
に必要なものに限ることができ、4辺における信号ピン
の集中を緩和することが可能になる。従って、上に述べ
たような信号ピン数の制限によるシステム全体の規模に
対する制限が緩和されることになる。
【0059】また、大型LSI1にシステム制御装置の
論理回路部分1001を集積し、1個のLSIチップ2
あたりに1台の命令処理装置1000を構成し、さら
に、少なくとも1個以上のLSIチップ2によりキャッ
シュ・メモリー装置1002を構成し、以上の全てのL
SIチップ2を大型LSI1に搭載して接続する半導体
集積回路装置を構成する。なお、キャッシュ・メモリー
装置1002の一部を大型LSI1内に集積してもよ
い。
【0060】このような半導体集積回路装置と、主記憶
装置1003、入出力装置1004などを組み合わせ
て、互いに主記憶を共有する複数の命令処理装置からな
るマルチプロセッサ型の汎用計算機システムを構成す
る。さらに、第1の構成例と同様に、上記汎用計算機シ
ステムを複数接続することにより、より多数の命令処理
装置からなるマルチプロセッサ型の汎用計算機システム
を実現することもできる。このような構成をとることに
よって、大型LSI1に集積する回路の量を減らすこと
ができ、大型LSI1の歩留りを向上させることができ
る。
【0061】また、本発明を適用した汎用計算機システ
ムの構成方法として、大型LSI1にシステム制御装置
の論理回路部分1001とキャッシュ・メモリー装置1
002を集積し、2個以上のLSIチップ2を大型LS
I1に搭載して接続する半導体集積回路を構成し、さら
に、この半導体集積回路装置と、主記憶装置1003、
入出力装置1004などを組み合わせて、互いに主記憶
を共有する複数の命令処理装置からなるマルプロセッサ
型の汎用計算機システムを構成する。さらに、前記した
構成例と同様に、上記汎用計算機システムを複数接続す
ることにより、より多数の命令処理装置からなるマルチ
プロセッサ型の汎用計算機システムを実現することもで
きる。このような構成によって、1台の命令処理装置1
000が2個以上のLSIチップで構成される場合にも
対応することができる。
【0062】さらに、汎用計算機システムの構成方法と
して、大型LSI1にシステム制御装置の論理回路部分
1001を集積し、2個以上のLSIチップ2により構
成する命令処理装置1000を少なくとも1台以上用意
し、少なくとも1個以上のLSIチップ2によりキャッ
シュ・メモリー装置1002を構成し、以上の全てのL
SIチップ2を大型LSI1に搭載して接続する半導体
集積回路装置を構成し、さらに、この半導体集積回路装
置と、主記憶装置1003、入出力装置1004などを
組み合わせて、互いに主記憶を共有する複数の命令処理
装置からなるマルチプロセッサ型の汎用計算機システム
を構成することができる。なお、キャッシュ・メモリー
装置1002の回路の一部を大型LSI1内に集積して
もよい。さらに、前記した実施例同様、上記汎用計算機
システムを複数接続することにより、より多数の命令処
理装置からなるマルチプロセッサ型の汎用計算機システ
ムを実現することもできる。
【0063】このような構成によって、1台の命令処理
装置1000が2個以上のLSI1チップで構成される
場合にも対応することができる。また、大型LSI1内
に集積する回路の量を減らすことができ、大型LSI1
の歩留りを向上させることができる。
【0064】次に、図8に示した半導体集積回路装置を
適用した計算機システムの例に関して、より詳細に説明
する。すなわち、互いに主記憶を共有する複数の命令処
理装置からなるマルチプロセッサ型の計算機システムを
取り上げ、その実装方法を図面を用いて説明する。
【0065】まず、図9を用いて、第1の実装方法を説
明する。半導体集積回路装置の第1の実施例で説明した
大型LSI1に、SC2000内の回路の内WSを除い
た回路部分(以降では、SC論理部分と呼ぶことにす
る)を集積し、1個のLSIチップあたりに1台のIP
を構成し、さらに、少なくとも1個以上のLSIチップ
によりWS2050を構成し、以上の全てのLSIチッ
プを大型LSI1に搭載して接続する半導体集積回路装
置を構成する。なお、WS2050の回路の一部を大型
LSI1内に集積しても良い。
【0066】例えば、図9に示すようにIPおよびSC
を実装する。すなわち、SCの論理部分であるFAA2
010〜2013(2011〜2013は図示せず)、
WAA2020、RA2021、LCA2022、EX
A2023、LKA2030、FLKA2031、調停
回路2040及び制御回路2041を、大型LSI1内
に設置し、4台のIP1000・1100・1200・
1300を、それぞれLSIチップ2イ・2ロ・2ハ・
2ニ内に構成し、WS2050を、2個のLSIチップ
2ホ・2ヘ内に設置する。そして、6個のLSIチップ
2イ・2ロ・2ハ・2ニ・2ホ・2ヘは大型LSI1上
に搭載されている。LSIチップと大型LSI間では半
田バンプ4により電気的に接続されており1クロック周
期で信号伝送ができるようになっている。また、大型L
SI内に、WS2050・BS1043間の命令及びデ
ータの伝送信号配線を大型LSI内に形成し、必要なら
ばその信号配線上にラッチ103aを形成する。
【0067】ここで、SC内部の各回路の説明をする。
調停回路とは、複数の命令処理装置からシステム制御装
置へ送られてくる処理要求信号を受け付け一時的に蓄え
て、複数の未処理の処理要求信号を蓄えている場合には
あらかじめ決まっている優先度に従うなどして1個の処
理要求信号を選択し適切な処理要求信号を生成し適切な
回路装置に送り出す回路である。また、WAAとは、キ
ャッシュ・ディレクトリ記憶装置ワーク・ストレジ・ア
ドレス・アレイのことである。また、制御回路とは、主
にシステム制御装置内の制御を行う回路である。また、
RAとは、リプレースメント・アレイのことで、ワーク
・ストレジ上のデータを主記憶上の別のデータと入れ替
えを行う場合にワーク・ストレジ上のどのデータと入れ
替えを行うべきかを決定するために用いる情報を格納し
ている記憶装置である。また、LCAとは、ライン・チ
ェンジビット・アレイのことで、ワーク・ストレジ上の
データが変更されたかどうかを判定するために用いる情
報を格納している記憶装置である。
【0068】また、LKAとは、ロック・アレイのこと
で、ある命令処理装置が主記憶上のあるデータ領域への
他の命令処理装置のアクセスを禁止するアドレスを格納
している記憶装置である。また、FLKAとは、フロン
ト・ロック・アレイのことで、他のシステム制御装置に
接続されている命令処理装置が主記憶上のあるデータ領
域への命令処理装置のアクセスを禁止するアドレスを格
納している記憶装置である。また、FAAとは、フロン
ト・アドレス・アレイのことで、あるデータが命令処理
装置内にあるキャッシュ記憶装置バッファ・ストレジ上
に存在するかどうかを決定するために用いる情報を格納
している記憶装置とデータが存在する命令処理装置にブ
ロック無効化要求信号を送る回路装置とを有する装置で
ある。また、EXAとは、イクスクルーシブビット・ア
レイのことで、あるデータが他のシステム制御装置内の
ワーク・ストレジ上、あるいは他のシステム制御装置に
接続されている命令処理装置内のバッファ・ストレジ上
に存在するかどうかを決定するために用いる情報を格納
している記憶装置である。
【0069】このような半導体集積回路装置と、MS3
000やIOP4000とをTAB3や基板上の配線を
介して接続するなどして、互いに主記憶を共有する複数
の命令処理装置からなるマルチプロセッサ型の計算機シ
ステムを構成する。また、上記半導体集積回路装置をT
AB3や基板上の配線を介して複数接続することによ
り、より多数の命令処理装置からなるマルチプロセッサ
型の計算機システムを実現することもできる。
【0070】SC論理部分には、IP1000・110
0・1200・1300、WS2050、MS300
0、IOP4000、他のSC2100などからの多数
の信号線が集中する。このようなことから、SCを例え
ば1個のLSIチップに集積化して実現する場合には、
そのLSIチップに大量の信号ピンを構成することが必
要となる。
【0071】ところが、大型LSIに集積して構成する
ことを考えた場合、大型LSIと、このような大型LS
Iを搭載する基板との接続にフリップチップ接続を用い
たフェイスダウン法は適用できない。なぜなら、大型L
SIは通常用いられるLSIの数倍以上の面積を有する
ため、熱膨張に起因して半田バンプ電極にかかるひずみ
が大きく、半田バンプが破壊される可能性が高いからで
ある。このため、大型LSIからは、ワイヤー・ボンデ
ィングまたはTAB等によってその4辺からしか信号ピ
ンを取り出すことができない。上記第1の実装方法の様
にSC論理部分を大型のLSIチップによって実現する
と、このように取り出し可能な信号ピン数の上限によっ
て、SC2000に接続できる他の装置の数や規模が制
限されてしまう。
【0072】本発明では、IP1000・1100・1
200・1300をLSIチップ2イ・2ロ・2ハ・2
ニで構成し、さらに、WS2050をLSIチップ2ホ
・2ヘで構成し、これらのLSIチップをSC論理部分
を集積した大型LSI1上に搭載する。この構成によ
り、LSIチップ2イ・2ロ・2ハ・2ニと、大型LS
I1との接続に、例えば半田バンプ電極を用いるフェイ
スダウン法を適用することが可能になり、大型LSI1
とLSIチップ2イ〜2ヘとが向いあう面に信号ピンを
配置することができる。このため、大型LSI1の4辺
に設ける信号ピンは、SC2100、MS3000、I
OP4000への接続に必要なものに限ることができ、
4辺における信号ピンの集中を緩和することが可能にな
る。従って、上に述べたような信号ピン数の制限による
システム全体の規模に対する制限が緩和されることにな
る。
【0073】次に、本実装方法の効果をより明確にする
ために、本実装方法のLSIと集積度及び配線・ゲート
遅延に関して同一のチップ性能を持つLSIチップのみ
を用いて、従来方式のモジュ−ル実装した場合について
の実装方法及びその動作を述べることにする。
【0074】図17及び18に、LSIチップのみを用
いてモジュ−ル実装した場合の従来方式の計算機システ
ムの実装方法を示す。本発明で用いる大型LSI1とL
SIチップ2イ〜2ヘは集積度が同程度であるので、モ
ジュ−ル実装においてそれぞれLSIチップ5001と
LSIチップ5002〜5007となる(上で述べたよ
うに、SC論理部分を構成するLSIにはピン数が多く
必要なため、単に大型LSIをLSIチップに置き換え
られない場合が考えられるが、ここでは大型LSIと同
程度のピン数を形成できると仮定する)。すなわち、図
17を用いて説明すると、IP1000・1100・1
200・1300をそれぞれLSIチップ5002・5
003・5004・5005内に構成し、SC論理部分
をLSIチップ5001内に構成し、WS2050をL
SIチップ5006・5007内に構成する。図18に
IPの内部及びSC論理部分の内部について詳細に示す
(但し、IP01やWS1、また、FAA2011〜2
013は省略している)。これらのLSIチップ500
1〜5007は、セラミック配線基板等の、配線と抵抗
のみが構成されている配線基板上に搭載されており、図
9中にあるラッチ103aは形成できない。LSIチッ
プと配線基板とは、半田バンプ等のピンで電気的に接続
されている。このモジュ−ル実装においてチップ渡りに
要する時間は、上記「作用」で述べたように、本実施例
での大型LSIとLSIチップの間でのチップ渡り時間
の数倍となり、ここでは2クロック周期であるとする。
【0075】次に、図19〜21に示したタイムチャ−
トと図18の計算機システムの構成を用いてモジュ−ル
実装の場合の具体的な動作を説明する。
【0076】最初に、図19を用いて読み出し及び書き
込みの場合の動作について説明する。まず読み出しの場
合について説明する。IP1000でデ−タあるいは命
令の読み出し動作中にNIBSであると、IP1000
を構成する5002からSC論理部分を構成するLSI
チップ5001にブロック転送要求信号が送られる。こ
のブロック転送要求はチップ渡りをするので、2クロッ
ク周期要して、SC論理部分のLSIチップ5001に
到達し、調停回路2040に入る。調停回路2040
は、他のIPからの様々な要求信号との調停を行い、そ
の結果1〜数クロック周期後には当該ブロック転送要求
信号を選択する(以下では、最短の1クロック周期後に
選択されるとする)。選択されると直ちに制御回路20
41にブロック転送要求信号が送られ、制御回路204
1はLKA2030・FLKA2031により当該デ−
タのアドレスが他IPによりアクセスが禁止されている
(=ロックされている)アドレスと一致するか否か検索
し、また、WAA2020により当該デ−タがWS20
50に存在するか否か検索する。各検索結果に基づいて
制御回路2041は以下の動作を制御する。
【0077】当該データのアドレスがロックされている
場合には、ロックが解除されるまでは後続の処理は行わ
ない。
【0078】または、ロックされていなくてINWSの
場合には、制御回路2041は、当該デ−タを含むライ
ンが同一カラム中の他のラインよりも後にアクセスされ
たことを示すようにRA2021の更新を行ない、WS
2050を構成するLSIチップ5006・5007に
ブロック転送要求信号を出す。このブロック転送要求信
号はチップ渡りをするので、WS2050を構成するL
SIチップ5006・5007に2クロック周期後に到
達する。そして、WS2050はBS1043へブロッ
ク転送を行ない、ブロック転送動作は完了する。
【0079】または、ロックされていなくてNIWSの
場合には、制御回路2041はMS3000ヘライン転
送要求信号を出し、また、RA2021を検索して、当
該ラインを書き込もうとするカラム上にあるラインの
内、最も長い間アクセスされていないラインを決定し
(LRUアルゴリズム)、同時にLCA2022を検索
してWS2050上のそのラインに書き込みがなされて
いる場合には、MS3000への書き戻しを行う。そし
て、MS3000からライン転送されてきたデータをW
S2050は、WS2050内のRAM内に格納する。
一方、制御回路2041は、WS2050を構成するL
SIチップ5006・5007にライン転送されてきた
ラインのアドレスの登録をWAA2020に行ない、L
CA2022には転送されてくるラインに書き込みがな
されていないことを示すように更新を行ない、また、R
A2021には転送されてくるラインが最も最近アクセ
スされたことを示すように更新を行なう。その後、WS
2050は、IP1000が所望するブロックを、BS
1043のあるLSIチップ5002へブロック転送を
行ない、ブロック転送動作は完了する。
【0080】なお、読み出しがSETLOCK付きの読
み出しであった場合には、上記動作で、INWS時なら
ば制御回路2041がWSへブロック転送要求信号を送
る時点、あるいは、NIWSならば制御回路2041が
MSへライン転送要求信号を送る時点で、制御回路20
41はLKA2030へ当該ブロックのアドレスを登録
する。
【0081】以上の動作から、IP1000を構成する
LSIチップ5002よりブロック転送要求信号が送り
出されてから、WS2050を構成するLSIチップ5
006・5007へブロック転送要求信号が到着するま
でに、信号のチップ渡りの4クロック周期を含む7クロ
ック周期が費やされ、また、ライン転送要求信号を生成
するまでに、信号のチップ渡りの2クロック周期を含む
5クロック周期が費やされる。
【0082】同様に、書き込みの場合について説明す
る。IP1000を構成するLSIチップ5002がW
S2050を構成するLSIチップ5006・5007
上のデ−タを書き替えるストア要求信号を出した場合に
は次のようになる。すなわち、IP1000を構成する
LSIチップ5002より送り出されたストア要求信号
は、チップ渡りをするので、2クロック周期を経た後に
SC論理部分を構成するLSIチップ5001に到達し
調停回路2040に入る。調停回路2040は、当該ス
トア要求信号を選択すると直ちに制御回路2041にス
トア要求信号に送る。そうすると制御回路2041は、
LKA2030・FLKA2031・WAA2020を
検索し、その結果に基づき制御回路2041は以下のよ
うに制御を行なう。
【0083】ロックされていればロックが解除されるま
で後続の処理は行わない。また、ロックされていなくて
INWSならばWS2050を構成するLSIチップ5
006・5007にストア要求信号を出す。このストア
要求信号は、チップ渡りをするので2クロック周期を経
てWS2050を構成するLSIチップ5006・50
07へ到達する。そして、WS2050はデ−タの書き
込みを行なう。一方、制御回路2041は、RA202
1を当該ラインが最も最近アクセスされたことを示すよ
うに更新し、また、LCA2022を当該ラインに書き
込みが行なわれたことを示すように更新し、ストア動作
は完了する。
【0084】または、ロックされていなくてNIWSな
らば、制御回路2041はライン転送要求信号を生成し
てMS3000へ送り、RA2021を検索して置き換
えるラインを決定し、LCA2022を検索して置き換
えるラインに書き込みが行なわれている場合にはMS3
000へ書き戻しを行なう。そして、MS3000から
のライン転送後、WS2050はデ−タの書き込みを行
い、ストア動作は完了する。
【0085】従って、IP1000を構成するLSIチ
ップ5002よりストア要求信号が送り出されてから、
WS2050を構成するLSIチップ5006・500
7にストア要求信号が到着するまでに、信号のチップ渡
りの4クロック周期を含む7クロック周期が費やされ
る。そして、ストア要求信号が送り出されてからライン
転送要求信号を生成するまでに2クロック周期を含む5
クロック周期が費やされる。
【0086】次に図20を用いてキャッシュ間一致制御
を行なう場合の動作を説明する。ストアを行なう際に
は、キャッシュ間一致制御を行なうために、他のBS内
あるいは他のSC内のWS内に同一デ−タの写しが存在
する場合にはそれを無効化する必要がある。そこで、S
C2000にて上記のストア動作が行なわれる時に、ま
ず、調停回路2010はFAA1〜3・2011〜20
13とEXA2023を検索する。その結果、例えば、
FAA1・2011に当該データが登録されていればF
AA1・2011は当該デ−タの登録を無効化し、デ−
タが存在するBSを持つIPであるIP01・1100
へ無効化要求信号を出す。そして、その無効化要求信号
を受け取ったIP1・1100はBS内の当該デ−タの
登録を無効化する。また、調停回路2010はEXA2
023を検索し、当該ラインのイクスクルーシブ・ビッ
ト=0であった場合、つまり、他のSC2100内のW
Sあるいは他のSC2100に接続されているIP14
00〜1700内のBSに当該データが存在する場合に
は制御回路2041は、他のSC2100へ無効化要求
信号を送り、EXA2023の当該ラインのイクスクル
ーシブ・ビットを1にセットする。そして、無効化要求
信号を受け取ったSC2100は、WS内の当該ライン
を無効化し、IP1400〜1700内のBS上のブロ
ックについても上記と同様にして無効化が行なわれる。
【0087】従って、IP1000を構成するLSIチ
ップ5002からストア要求信号が送り出されてから、
無効化要求信号を生成するまでに、信号のチップ渡りの
4クロック周期を含む7クロック周期が費やされ、さら
に、無効化信号が同じSCに接続されている他のIPに
到達するまでにチップ渡りに2クロック周期費やされ
る。
【0088】次に図21を用いて、ロックをリセットす
るRESETLOCKでの動作について説明する。IP
1000がRESETLOCKを行う場合、RESET
LOCK信号はチップ渡りをするので2クロック周期を
経た後に調停回路2040に到達する。調停回路204
0でRESETLOCK信号が選択されると、制御回路
2041はLKAに登録されている当該アドレスを無効
化し、完了信号をRESETLOCK信号の発信元であ
るIP1000へ完了信号を送る。この完了信号は、チ
ップ渡りをするので2クロック周期後にIP1000に
到達し、RESETLOCK動作は完了する。
【0089】従って、IPがRESETLOCK信号を
出してから、完了信号を受け取るまでに、信号のチップ
渡りの4クロック周期を含む6クロック周期が費やされ
る。
【0090】以上が、モジュ−ル実装した場合の動作で
ある。次に、本発明の実装方法による1実装例について
の動作を図10〜13のタイムチャ−トを用いて説明す
る。動作の大半は、上記モジュ−ル実装の場合の動作と
同じであるので、本発明の特徴的な部分についてのみ述
べる。
【0091】図10には読み出し及び書き込みの動作の
タイムチャートが示されているが、読み出しの場合で
は、IP00・1000を構成するLSIチップ2イか
らブロック転送要求信号が出されてから、WS0・20
50を構成するLSIチップ2ホ・2ヘにブロック転送
要求信号の到着するまでに、信号のチップ渡りの2クロ
ック周期を含む5クロック周期が費やされ、あるいは、
ライン転送要求信号を生成するまでに、信号のチップ渡
りの1クロック周期を含む4クロック周期が費やされ
る。また、図13には、WS0・2050からBS10
43へのブロック転送時のタイムチャートが示されてい
る。図9に示されるように、WS2050とBS104
3間の伝送信号配線S1上には、ラッチ103aが構成
されており、このことにより、ブロック転送時には、図
13に示すように、信号配線S1でのデータの伝送を1
クロックづつ区切ることができる。従来のモジュール実
装では、このようなラッチ103aが構成できないため
に、2クロック周期毎に伝送し、スループットを大きく
するためにWSとIPとの間の配線が多くなったり、W
SとBS間の配線遅延のためにクロック周期が長くな
り、計算機システムの処理性能が低下したりした。
【0092】また、書き込みの場合には、IP00・1
000を構成するLSIチップ2イよりストア要求信号
が送り出されてから、WS2050を構成するLSIチ
ップ2ホ・2ヘにストア要求信号が到着するまでに、信
号のチップ渡りの2クロック周期を含む5クロック周期
が費やされる。そして、ストア要求信号が送り出されて
からライン転送要求信号を生成するまでに1クロック周
期を含む4クロック周期が費やされる。
【0093】また、図11に示すように、キャッシュ間
一致制御を行なう際には、IP00・1000を構成す
るLSIチップ2イからストア要求信号が送り出されて
から、無効化要求信号を生成するまでに、信号のチップ
渡りの2クロック周期を含む5クロック周期が費やされ
るのみであり、さらに、無効化信号が同じSCに接続さ
れている他のIPに到達するまでにチップ渡りに1クロ
ック周期費やされるのみである。
【0094】また、図12に示すように、RESETL
OCKを行う場合、IPがRESETLOCK命令を出
してから完了信号を受け取るまでに、信号のチップ渡り
の2クロック周期を含む4クロック周期しか費やされな
い。
【0095】以上、第1の実装方法に基づく1実装例に
おける動作を説明した。以上より明らかなように、各動
作において、信号がチップ渡りに費やす時間がモジュ−
ル実装の場合と比較して2分の1になっており、したが
って、本発明には計算機システムとしての動作を高速化
する効果がある。
【0096】また、WS2050とBS1040間での
データ伝送配線上にラッチ103aを置くことにより、
パイプライン伝送を行なうことができる。ここでは、L
SIチップと大型LSI間でのチップ渡り時間が、同じ
チップ性能のLSIを用いたモジュ−ル実装でのチップ
渡り時間の数分の1になることを利用して、IPとSC
の制御回路(調停回路・WAAやLKA等)の間、ある
いは、WSとSCの制御回路(調停回路・WAAやLK
A等)の間の信号伝送を高速化している。したがって、
上記第1の実装方法に基づく実装例においてチップ渡り
時間を1クロック周期としたこと、また、WAAやLK
A等の特定の制御方法(例えばLRUアルゴリズム、キ
ャッシュ間の一致制御方法、BSとWS間ではストアス
ルー方式を、またWSとMS間ではストアイン方式を用
いたこと等)が本発明の効果を限定するものではない。
【0097】また、大型LSI内の配線上に1個のラッ
チを形成しているが、ラッチの個数は必要に応じ複数で
も本発明の効果は本質的に変わらず得られるし、従来の
ようにラッチを形成しない構成方法も可能である。ま
た、SCの回路の一部を複数のLSIチップ内に構成
し、その間の信号線を大型LSI内に形成し、その信号
線上にラッチを設けパイプライン伝送を行っても同様に
本発明の効果を得ることができる。また、第1の実装方
法に基づく実装例では3階層記憶方式の計算機システム
を構成したが、2階層記憶方式の計算機システムにおい
ても上記した中のいくつかの動作(キャッシュ間一致制
御及びRESETLOCK)で同様に効果がある。
【0098】次に、計算機システムの第2の実装方法を
説明する。第1の実装方法では、WS2050を2個の
LSIチップ2ホ・2ヘに設置したが、ここではWS2
050を大型LSI内に設置する。すなわち、大型LS
I1にSC2000を集積し、4個のLSIチップ2イ
・2ロ・2ハ・2ニを用いて、それぞれ1台のIP10
00・1100・1200・1300を構成し、これら
を大型LSI1に搭載して電気的に接続することで、マ
ルチプロセッサ型の計算機システムの命令処理装置とシ
ステム制御装置を構成する。例えば、図14に示すよう
に構成する。ここで用いた半導体集積回路装置は、図1
に示した半導体集積回路装置と同様のものであるが、大
型LSIの主面上には4個のLSIチップを搭載してい
る。そして、このようにして構成した半導体集積回路装
置と、別途用意したMS3000・IOP4000・I
O4100などを組み合わせて、互いに主記憶を共有す
る複数の命令処理装置からなるマルチプロセッサ型の計
算機システムを構成する。さらに、このような計算機シ
ステムを複数用意し、各々のSC間を接続することによ
り、より多数の命令処理装置からなるマルチプロセッサ
型の計算機システムを実現することもできる。
【0099】上記第1の実装方法と比較して、第2の実
装方法ではWS2050を大型LSI内に設置すること
により、大型LSIの主面上に形成するピン数を少なく
することができる。しかし、大型LSIの集積度が大き
くなるため、歩留りが低下する可能性がある。
【0100】また、図14に示すような構成をとること
により、WSとSC論理部分の間とWSとIPとの間で
の信号伝送が高速にできるようになる。調停回路204
0とWS2050との間、制御回路2041とWS20
50との間、IPとWSとの間の信号の伝送は高速にな
り、第1の実装方法での1実装例ではそれぞれ1、1、
2クロック周期要していたところが、それぞれ0、0、
1クロック周期となり、第1の実装方法での1実装例で
述べた動作それぞれについて高速化することができる。
例えば、IP00・1000からブロック転送要求信号
が出された場合、INWS時に、制御回路から出された
WSへのブロック転送要求信号により、直ちにWS20
50は起動され、WS2050から読み出されたデータ
は、1クロック周期後にIP00・1000に到達する
(したがって、図9のラッチ103aのような、WS0
・2050からBS1043へのデータ転送用の信号配
線上の中間ラッチは不必要となる)。
【0101】次に、本発明を適用した計算機システムの
第3・第4の実装方法を説明する。まず、第3の実装方
法では、大型LSI1にSC論理部分を集積し、2個以
上のLSIチップにより構成するIPを少なくとも1台
以上用意し、少なくとも1個以上のLSIチップにより
WS2050を構成し、以上の全てのLSIチップを大
型LSI1に搭載して接続する半導体集積回路装置を構
成し、さらに、この半導体集積回路装置と、MS300
0、IOP4000などを組み合わせて、互いに主記憶
を共有する複数の命令処理装置からなるマルチプロセッ
サ型の計算機システムを構成することができる。なお、
WS2050の回路の一部を大型LSI1内に集積して
も良い。さらに、第1・第2の実装方法と同様、上記計
算機システムを複数接続することにより、より多数の命
令処理装置からなるマルチプロセッサ型の計算機システ
ムを実現することもできる。
【0102】また、第4の実装方法としては、大型LS
I1にSC2000を集積し、2個以上のLSIチップ
により構成するIPを少なくとも1台以上用意し、これ
ら複数のLSIチップを大型LSI1に搭載して接続す
る半導体集積回路装置を構成し、さらに、この半導体集
積回路装置と、MS3000、IOP4000などを組
み合わせて、互いに主記憶を共有する複数の命令処理装
置からなるマルチプロセッサ型の計算機システムを構成
する。さらに、第1・第2・第3の実装方法と同様に、
上記計算機システムを複数接続することにより、より多
数の命令処理装置からなるマルチプロセッサ型の計算機
システムを実現することもできる。
【0103】本発明では、このような実装方法によっ
て、1台のIPが2個以上のLSIチップで構成される
場合にも対応することができる。第3の実装方法では、
第4の実装方法と比較して、WS2050を大型LSI
内に設置しない分、大型LSIに集積する回路数を少な
くすることができ歩留りを向上させることができる。
【0104】第3及び第4の実装方法は、例えば図15
に示すように構成する。IP00は、IU1010・E
U1020・CS1030を1個のLSIチップ2イ内
に構成し、BU1040を別の1個のLSIチップ2ロ
内に構成し、大型LSI1内では、信号配線S2・S3
・S4・S5・S6上にそれぞれラッチ103e・10
3f・103c・103d・103bを構成する。ま
た、IP01についてもLSIチップ2ハ・2ニを用い
て同様に構成する(回路は図示せず)。SCの構成方法
については、例えば、第1の実装方法の例のようにWS
2050をLSIチップに設置したり(第3の実装方
法)、第2の実装方法の例のようにSCの回路全てを大
型LSI内に構成してもよい(第4の実装方法)。但
し、以下では、SCの構成方法と動作については第1及
び第2の実装方法で説明したので、IP内で行なわれる
動作についてのみ説明する。この例では2台のIPが1
台のSCに接続されている実装例を示し、ここで用いた
半導体集積回路装置は、図1に示した半導体集積回路装
置と同様のものであるが、大型LSIの主面上には4個
のLSIチップを搭載している。
【0105】図15のように構成された計算機システム
での命令実行は、例えば図16のようなパイプラインス
テージの構成をとることが可能である。図15と図16
を用いて各ステージでの動作について説明する。
【0106】「命令読み出し」ステージはいくつかの小
ステージからなり、まず、「命令アドレス計算」小ステ
ージでは、IU1010が、IU1010内にあるプロ
グラムカウンタにセットされている値から、読み出す命
令のアドレスを生成し、そのアドレスが命令読み出し要
求信号とともに、アドレスと命令読み出し要求信号とを
ラッチ103eにセットする。次に「命令アドレス転
送」小ステージでは、ラッチ103eにセットされたア
ドレスが、TLB1041・BAA1042・BS10
43・BU制御回路1044に送られ、さらにBU制御
回路1044には命令読み出し要求信号も送られる。次
に「BSアクセス」小ステージでは、BU制御回路10
44が、TLB1041・BAA1042・BS104
3を検索し、その結果に基づいて、もしINBSであれ
ば、読み出された命令をラッチ103fにセットする。
次に「命令転送」小ステージでは、IU1010が、ラ
ッチ103fにセットされた命令をIU1010内にあ
る命令バッファに格納する(NIBSであれば、IPは
ブロック転送要求信号をSCに送る。また、命令読み出
し方式として、1回の読み出し毎に数命令を読み出し、
IU1010内にある命令バッファに格納するといった
方式があり、このような方式であれば、1命令毎に命令
読み出しを行なう必要はない)。
【0107】「デコード」ステージでは、IU1010
が、プログラムカウンタによって指定される命令バッフ
ァから命令を読み出し、デコードする。
【0108】「オペランド読み出し」ステージもいくつ
かの小ステージからなり、まず、「オペランドアドレス
計算」ステージでは、IU1010が、命令のデコード
結果に従ってオペランドアドレスを計算し(但し、命令
によってはオペランドがレジスタを指定する場合もある
が、ここではMS上のデータを指定する場合についての
動作を述べる)、このアドレスとオペランド読み出し要
求信号をラッチ103cにセットする。次に「オペラン
ドアドレス転送」小ステージでは、ラッチ103cにセ
ットされたアドレスが、TLB1041・BAA104
2・BS1043に送られ、BU制御回路1044には
オペランド読み出し要求信号ともに送られる。次に「B
Sアクセス」小ステージでは、BU制御回路1044
が、TLB1041・BAA1042・BS1043を
検索し、その結果に基づいて、もしINBSであれば、
読み出されたデータをラッチ103dにセットする(N
IBSであれば、IPはブロック転送要求信号をSCに
送る)。次に「オペランド転送」小ステージでは、ラッ
チ103dにセットされたデータを、EU1020内に
あるワークレジスタに転送される。
【0109】「実行」ステージでは、EU1020が、
ワークレジスタにセットされたデータを、デコードされ
た命令に従ってEU1020内にある演算器を用いて演
算を行なう。演算は命令により数ステージ要することが
ある。そして、その演算結果を、MSへ書き込む命令で
あれば、結果であるデータをラッチ103bにセット
し、命令フィールドのオペランド指定部分から書き込み
アドレスと書き込み要求信号をラッチ103cにセット
する(但し、命令が格納先がレジスタであるような命令
の場合には、IU1010にあるレジスタへの書き込み
が行なわれて、命令の実行は完了する)。
【0110】「書き込み」ステージはいくつかの小ステ
ージからなる。まず、「書き込みデータ転送」小ステー
ジでは、ラッチ103bにセットされたデータがBS1
043に送られ、103cにセットされたアドレスがT
LB1041・BAA1042・BS1043に送ら
れ、アドレスと書き込み要求信号はBU制御回路104
4に送られる。「BAA検索」小ステージでは、BU制
御回路1044が、TLB1041・BAA1042を
検索し、その結果に従って、INBSかどうか判定す
る。もしINBSであれば、「BSアクセス」小ステー
ジでは、BU制御回路1044により書き込み用データ
がBS1043に書き込まれる。(NIBSであれば、
ブロック転送要求信号が生成される。また、BSへの書
き込みに伴ってWSやMS等への書き込み要求信号をS
C等に送る場合もある。)以上のようなパイプライン構
成において、モジュール実装ではチップ渡りとなる配線
上に、本実装方法の例では中間ラッチを構成することに
より、基本的には1ステージ毎に次の命令の実行を開始
させることが可能となる。また、中間ラッチは必要に応
じ、配線上に複数個形成することもできる。モジュール
実装であれば、このような中間ラッチ構成することがで
きないために、例えば2ステージ毎に次の命令の実行を
開始するとか、あるいはチップ渡りの配線を2倍にして
1ステージ毎に交互に切り換えて信号の伝送を行なうな
どの対策が必要となり、前者では処理性能を低下させる
であろうし、後者では制御が複雑になり配線及びピンを
増大させることになる。なお、NIBS時は、ライン転
送動作中は命令パイプラインの実行が中断されるが、そ
れ以外には上記ステージの動作には影響を与えない。ラ
イン転送動作は計算機システムの第1あるいは第2の実
装方法での1実装例で述べた場合の動作と同様であるの
でここでは述べないことにする。
【0111】また、上記ではIP1台当たり1個のBS
を用い、命令とデータを混在させて格納している。この
ために、命令の読み出し、オペランドの読み出しや書き
込みで、BSへのアクセスが競合することがありえる。
この場合、あらかじめ決まっている優先度によって逐次
に処理されることになる。しかし、今日では命令用のB
Sとデータ用のBSの2個のBSを構成することが多
い。こうすることによって、命令読み出しとオペランド
読み出し・書き込みとが競合するのを避けることができ
る。本実装方法の1実装例での上記構成にこういった構
成方法を適用させることは容易である。
【0112】また、このようにBS1043をIU10
10やEU1020とは別のLSIチップ内に構成する
以外に、CS1030を別のLSIチップで構成する方
法がある。CS1030についても、BS1020と同
様に、大型LSIの配線上にラッチを設けることによ
り、パイプライン伝送を行うことで同様の効果を得るこ
とができる。
【0113】また、第3・4の実装方法において、IP
の回路の一部を大型LSI内に構成する実装方法があ
る。例えば、IU1010やEU1020をLSIチッ
プ内に構成し、そのLSIチップを搭載した大型LSI
内にBS1043あるいはCS1030を構成する。こ
うすることにより、第3・4の実装方法の例と比較し
て、BS1043やCS1030へのアクセスを高速化
させることができ、例えば、BS読み出しあるいはCS
読み出しの際のパイプラインのステージ数を削減するこ
とができる。そして、1個のLSIでIPを構成する場
合と比較して、歩留りを向上させることができる。
【0114】すでに述べたことから明らかなように、本
発明では、計算機システムの構成要素例えばシステム制
御装置を大型LSI1またはLSIチップ2の上に実装
する種々の形態が考えられる。
【0115】例えば計算機システムにおけるシステム制
御装置が、キャッシュ記憶装置ワ−ク・ストレジと、複
数の上記命令処理装置から上記システム制御装置へ送ら
れてくる処理要求信号を受け付け一時的に蓄えて複数の
未処理の処理要求信号を蓄えている場合にはあらかじめ
決まっている優先度に従うなどして1個の該処理要求信
号を選択し適切な処理要求信号を生成し適切な回路装置
に送り出す調停回路と、該ワ−ク・ストレジ中に上記主
記憶上のデ−タの写しが格納されているかどうかの情報
を格納しているキャッシュ・ディレクトリ記憶装置ワー
ク・ストレジ・アドレス・アレイと、該ワーク・ストレ
ジ上のデ−タを該主記憶上の別のデ−タと入れ替えを行
う場合に該ワーク・ストレジ上のどのデ−タと入れ替え
を行うべきかを決定するために用いる情報を格納してい
る記憶装置リプレースメント・アレイと、該ワ−ク・ス
トレジ上のデ−タが変更されたかどうかを判定するため
に用いる情報を格納している記憶装置ライン・チェンジ
ビット・アレイと、ある該命令処理装置が該主記憶上の
あるデ−タ領域への他の上記命令処理装置のアクセスを
禁止するアドレスを格納している記憶装置ロック・アレ
イと、他の上記システム制御装置に接続されている上記
命令処理装置が該主記憶上のあるデ−タ領域への該命令
処理装置のアクセスを禁止するアドレスを格納している
記憶装置フロント・ロック・アレイと、あるデ−タが該
命令処理装置内にあるキャッシュ記憶装置バッファ・ス
トレジ上に存在するかどうかを決定するために用いる情
報を格納している記憶装置とデ−タが存在する該命令処
理装置にブロック無効化要求信号を送る回路装置とを有
する装置フロント・アドレス・アレイと、あるデ−タが
他の上記システム制御装置内のワ−ク・ストレジ上ある
いは他の該システム制御装置に接続されている上記命令
処理装置内のバッファ・ストレジ上に存在するかどうか
を決定するために用いる情報を格納している記憶装置イ
クスクルーシブビット・アレイと、様々な該回路装置か
らの信号を受け付けそれに基づき適切な制御を主に該シ
ステム制御装置内の記憶装置及び回路装置に対して行う
制御回路、の内の少なくとも1つまたは全部から構成さ
れるようにしてもよい。
【0116】あるいは、上記計算機システムにおける上
記ワ−ク・ストレジと、上記調停回路と、上記ワーク・
ストレジ・アドレス・アレイと、上記リプレースメント
・アレイと、上記ライン・チェンジビット・アレイと、
上記ロック・アレイと、上記フロント・ロック・アレイ
と、上記フロント・アドレス・アレイと、上記イクスク
ルーシブビット・アレイと、上記制御回路の内少なくと
も1つを上記第2の半導体集積回路装置に実装してもよ
い。
【0117】
【発明の効果】本発明によれば、大型LSI上に搭載さ
れているLSIチップ同士での信号伝送において信号の
チップ渡り時間を大幅に減少させることができ、大型L
SIとLSIチップ間での信号伝送が高速に行なえる。
さらに、このような実装技術を用いて、命令処理装置か
らシステム制御装置への信号の伝送を高速化することが
でき、計算機システム全体としての処理性能を向上させ
ることができる。
【0118】また、ピンネックの問題を解決し、計算機
システムのシステム制御装置のように、取り出すことの
できる信号ピン数によって装置の規模が制限されてしま
うような大規模な装置のコンパクト化を実現することが
できる。
【図面の簡単な説明】
【図1】本発明による半導体集積回路装置の一実施例を
示す概観図である。
【図2】図1の集積回路装置のA−A’部分における断
面図である。
【図3】本発明の第2の実施例による半導体集積回路装
置の断面の様子を示す模式図である。
【図4】図3の実施例におけるバッファの一例を示す図
である。
【図5】従来のモジュール実装技術におけるLSI間の
信号伝送の様子を示す断面図である。
【図6】図3に示す本発明と従来方式の効果を比較した
図である。
【図7】本発明の第3の実施例による半導体集積回路装
置の断面の様子を示す模式図である。
【図8】本発明によるマルチプロセッサ型の計算機シス
テムの構成例を示すブロック図である。
【図9】本発明による計算機システムの実装方法の1実
装例を示すブロック図である。
【図10】図9の1実装例についての読み出し(NIB
S)及び書き込み時の動作を示すタイムチャートであ
る。
【図11】図9の実装例についてのFAA/BAA/W
AA内の登録の無効化動作を示すタイムチャートであ
る。
【図12】図9の実装方法の1実装例についてのRES
ET LOCK時の動作を示すタイムチャートである。
【図13】図9の実装方法の1実装例についてのWSか
らBSへのブロック転送時の動作を示すタイムチャート
である。
【図14】本発明による計算機システムの他の実装方法
の1実装例を示すブロック図である。
【図15】本発明による計算機システムの他の実装方法
の1実装例を示すブロック図である。
【図16】図15の実装例におけるパイプラインステー
ジを示す図である。
【図17】従来のモジュ−ル実装を用い、かつ、図9の
実装例で用いたLSIチップと同じ集積度のLSIチッ
プを用いて構成した計算機システムの構成例の概観を示
すブロック図である。
【図18】図17の従来の計算機システムの構成例の詳
細を示すブロック図である。
【図19】図18に示した計算機システムの読み出し
(NIBS)及び書き込み時の動作を示すタイムチャー
トである。
【図20】図18に示した計算機システムのFAA/B
AA/WAA内の登録の無効化動作を示すタイムチャー
トである。
【図21】図18に示した計算機システムのRESET
LOCK時の動作を示すタイムチャートである。
【符号の説明】
1…大型LSI、2イ・2ロ・2ハ・2ニ・2ホ・2へ
…LSIチップ、3…TABリード、4…半田バンプ電
極、5…セラミック配線基板、100…バッファ、10
1…配線、102…終端抵抗、103…ラッチ、104
…クロック分配配線、1000・1100・1200・
1300・1400・1500・1600・1700…
命令処理装置、1001…システム制御装置の論理回路
部分、1002…キャッシュ・メモリ装置、1003…
主記憶装置、1004…入出力装置、1010…IU、
1020…EU、1030…CS、1040…BU、1
041…TLB、1042…BAA、1043…BS、
1044…BU制御回路、2010・2012…FA
A、2020…WAA、2021…RA、2022…L
CA、2023…EXA、2030…LKA、2031
…FLKA、2041…制御回路、2050…WS、2
000…システム制御装置、3000…主記憶装置、S
1〜6…信号配線、103a・b・c・d・e・f…中
間ラッチ、5001〜5007…LSIチップ、500
9…配線基板。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 釜田 栄樹 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 山田 稔 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 中西 敬一郎 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】第1の半導体集積回路装置の主面上に複数
    の第2の半導体集積回路装置を搭載してなる半導体集積
    回路装置において、上記第1の半導体集積回路装置内
    に、上記第2の半導体集積回路装置内の論理回路間を相
    互に接続するための能動素子を含む接続回路を設けたこ
    とを特徴とする半導体集積回路装置。
  2. 【請求項2】請求項1記載の半導体集積回路装置におい
    て、上記第1の集積回路装置に集積される論理回路素子
    の数は、上記第2の半導体集積回路装置のうちの1個の
    それと同程度もしくはそれ以下であることを特徴とする
    半導体集積回路装置。
  3. 【請求項3】請求項1または請求項2記載の半導体集積
    回路装置において、上記第1の半導体集積回路装置は、
    配線基板上に搭載され、上記第1の半導体集積回路装置
    と上記配線基板とがTAB接続されていることを特徴と
    する半導体集積回路装置。
  4. 【請求項4】請求項1または請求項2に記載の半導体集
    積回路装置において、上記第1の半導体集積回路装置
    は、厚さが概ね1μm以下の高密度配線層を少なくとも
    1層以上と、厚さが概ね2μm以上の低抵抗配線層を少
    なくとも1層以上有することを特徴とする半導体集積回
    路装置。
  5. 【請求項5】請求項4記載の半導体集積回路装置におい
    て、上記高密度配線層の配線はアルミニウムをその材料
    とし、上記低抵抗配線層の配線は銅をその材料とするこ
    とを特徴とする半導体集積回路装置。
  6. 【請求項6】能動素子を含む回路と低抵抗配線層とを備
    えた第1の半導体集積回路装置を形成し、 各々論理回路を有する複数の第2の半導体集積回路装置
    を形成し、これらを前記第1の半導体集積回路装置の主
    面上に搭載し、 上記第2の半導体集積回路装置の各論理回路を、上記第
    1の半導体集積回路装置の上記回路及び低抵抗配線層を
    介して接続することを特徴とする半導体集積回路装置の
    製造方法。
  7. 【請求項7】請求項6記載の半導体集積回路装置の製造
    方法において、上記低抵抗配線層は金属メッキにより形
    成することを特徴とする半導体集積回路装置の製造方
    法。
  8. 【請求項8】請求項7記載の半導体集積回路装置の製造
    方法において、上記低抵抗配線層は銅メッキにより形成
    することを特徴とする半導体集積回路装置の製造方法。
  9. 【請求項9】命令処理装置と、主記憶装置と、入出力装
    置と、該入出力装置が接続されている入出力制御装置
    と、上記命令処理装置、上記主記憶装置及び上記入出力
    制御装置を相互に接続するシステム制御装置とを備えた
    計算機システムにおいて、 第1の半導体集積回路装置の主面上に複数の第2の半導
    体集積回路装置を搭載した半導体集積回路装置に、上記
    命令処理装置と上記システム制御装置を設けたことを特
    徴とする計算機システム。
  10. 【請求項10】請求項9記載の計算機システムにおい
    て、上記第2の半導体集積回路装置により上記命令処理
    装置を構成し、さらに上記システム制御装置を上記第1
    の半導体集積回路装置に設けたことを特徴とする計算機
    システム。
  11. 【請求項11】請求項9記載の計算機システムにおい
    て、上記システム制御装置を構成する回路の一部を上記
    第2の半導体集積回路装置内に構成したことを特徴とす
    る計算機システム。
  12. 【請求項12】請求項9または請求項10または請求項
    11に記載の計算機システムにおいて、上記複数の第2
    の半導体集積回路装置に実装される上記命令処理装置内
    の回路間の信号経路及び該信号経路上の論理回路を上記
    第1の半導体集積回路装置に形成したことを特徴とする
    計算機システム。
  13. 【請求項13】請求項9または請求項11に記載の計算
    機システムにおいて、上記複数の第2の半導体集積回路
    装置に実装される上記命令処理装置と上記システム制御
    装置の一部との間の信号経路及び該信号経路上の論理回
    路を上記第1の半導体集積回路装置に形成したことを特
    徴とする計算機システム。
  14. 【請求項14】請求項9または請求項11に記載の計算
    機システムにおいて、上記複数の第2の半導体集積回路
    装置に実装される上記システム制御装置内の回路間を接
    続する信号経路及び該信号経路上の論理回路を上記第1
    の半導体集積回路装置に形成したことを特徴とする計算
    機システム。
  15. 【請求項15】請求項12または請求項13または請求
    項14に記載の計算機システムにおいて、上記第1の半
    導体集積回路装置に形成された信号経路上の論理回路が
    少なくともラッチを含んでおり、パイプライン伝送を可
    能とすることを特徴とする計算機システム。
  16. 【請求項16】請求項9または請求項10または請求項
    11に記載の計算機システムにおいて、上記システム制
    御装置を実装した第1の半導体集積回路装置を複数個備
    え、上記各システム制御装置の間を相互に接続したこと
    を特徴とする計算機システム。
  17. 【請求項17】請求項11記載の計算機システムにおい
    て、上記命令処理装置と上記システム制御装置を構成す
    る回路の一部とを同一の上記第2の半導体集積回路装置
    内に構成したことを特徴とする計算機システム。
  18. 【請求項18】請求項11記載の計算機システムにおい
    て、上記システム制御装置を構成する回路の一部を上記
    複数の第2の半導体集積回路装置の1つに構成し、上記
    命令処理装置を他の上記第2の半導体集積回路装置内に
    構成したことを特徴とする計算機システム。
JP4319802A 1992-02-03 1992-11-30 半導体集積回路装置及びそれを利用した計算機システム Pending JPH05283607A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1745292 1992-02-03
JP4-17452 1992-02-03

Publications (1)

Publication Number Publication Date
JPH05283607A true JPH05283607A (ja) 1993-10-29

Family

ID=11944417

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4319802A Pending JPH05283607A (ja) 1992-02-03 1992-11-30 半導体集積回路装置及びそれを利用した計算機システム

Country Status (1)

Country Link
JP (1) JPH05283607A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175184A (ja) * 1997-12-12 1999-07-02 Fujitsu Ltd 半導体集積回路におけるクロック分配回路
JP2002516033A (ja) * 1997-04-04 2002-05-28 グレン ジェイ リーディ 三次元構造メモリ
US7112468B2 (en) 1998-09-25 2006-09-26 Stmicroelectronics, Inc. Stacked multi-component integrated circuit microprocessor
JP2007514317A (ja) * 2003-12-16 2007-05-31 インテル コーポレイション 装置及びプロセッサー
US8928119B2 (en) 1997-04-04 2015-01-06 Glenn J. Leedy Three dimensional structure memory

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002516033A (ja) * 1997-04-04 2002-05-28 グレン ジェイ リーディ 三次元構造メモリ
US8928119B2 (en) 1997-04-04 2015-01-06 Glenn J. Leedy Three dimensional structure memory
US8933570B2 (en) 1997-04-04 2015-01-13 Elm Technology Corp. Three dimensional structure memory
US9401183B2 (en) 1997-04-04 2016-07-26 Glenn J. Leedy Stacked integrated memory device
JPH11175184A (ja) * 1997-12-12 1999-07-02 Fujitsu Ltd 半導体集積回路におけるクロック分配回路
US7112468B2 (en) 1998-09-25 2006-09-26 Stmicroelectronics, Inc. Stacked multi-component integrated circuit microprocessor
JP2007514317A (ja) * 2003-12-16 2007-05-31 インテル コーポレイション 装置及びプロセッサー
JP2013258425A (ja) * 2003-12-16 2013-12-26 Intel Corp 装置及びプロセッサー

Similar Documents

Publication Publication Date Title
Leon et al. A power-efficient high-throughput 32-thread SPARC processor
JP3358171B2 (ja) 集積回路のクロック・スキューを最小にするシステムおよび方法
Pasricha Exploring serial vertical interconnects for 3D ICs
Rusu et al. The first IA-64 microprocessor
US6467004B1 (en) Pipelined semiconductor devices suitable for ultra large scale integration
US9696379B2 (en) Three-dimensional processing system having at least one layer with circuitry dedicated to scan testing and system state checkpointing of other system layers
US20060081971A1 (en) Signal transfer methods for integrated circuits
US5408676A (en) Parallel data processing system with plural-system bus configuration capable of fast data communication between processors by using common buses
Benschneider et al. A 300-MHz 64-b quad-issue CMOS RISC microprocessor
Rusu et al. A 1.5-GHz 130-nm Itanium/sup/spl reg//2 Processor with 6-MB on-die L3 cache
US4839820A (en) Monolithic semi-custom LSI
WO2023028042A1 (en) Scalable system on a chip
CN112582390A (zh) 具有包含存储器资源的小芯片的经封装的装置
Dobberpuhl et al. A 200-MHz 64-bit dual-issue CMOS microprocessor
JPH05283607A (ja) 半導体集積回路装置及びそれを利用した計算機システム
JP2674462B2 (ja) 半導体装置
Xie et al. Die-stacking architecture
US6532544B1 (en) High gain local clock buffer for a mesh clock distribution utilizing a gain enhanced split driver clock buffer
JPH1139279A (ja) マイクロコンピュータおよびマルチチップモジュール
US20220107808A1 (en) Method to reduce register access latency in split-die soc designs
Doettling et al. S/390 Parallel Enterprise Server Generation 3: A balanced system and cache structure
US6032229A (en) Semiconductor memory device and information processor using the same
US20090300411A1 (en) Implementing Redundant Memory Access Using Multiple Controllers for Memory System
Kapil et al. A chip multithreaded processor for network-facing workloads
US20230315334A1 (en) Providing fine grain access to package memory