JP2001051957A - オンチップマルチプロセッサ - Google Patents

オンチップマルチプロセッサ

Info

Publication number
JP2001051957A
JP2001051957A JP11221728A JP22172899A JP2001051957A JP 2001051957 A JP2001051957 A JP 2001051957A JP 11221728 A JP11221728 A JP 11221728A JP 22172899 A JP22172899 A JP 22172899A JP 2001051957 A JP2001051957 A JP 2001051957A
Authority
JP
Japan
Prior art keywords
processors
linear axis
pair
chip
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11221728A
Other languages
English (en)
Inventor
Takeshi Kato
猛 加藤
Michitaka Yamamoto
通敬 山本
Hiromichi Kaino
博通 戒能
Teruhisa Shimizu
照久 清水
Masayuki Obayashi
正幸 大林
Hiroki Yamashita
寛樹 山下
Noboru Masuda
昇 益田
Tatsuya Saito
達也 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11221728A priority Critical patent/JP2001051957A/ja
Publication of JP2001051957A publication Critical patent/JP2001051957A/ja
Priority to US10/832,446 priority patent/US20040210738A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)

Abstract

(57)【要約】 【課題】 オンチップマルチプロセッサにおいてマルチ
プロセッサ間を効率的に制御するためのチップレイアウ
ト(フロアプラン)を提供する。 【解決手段】 複数のプロセッサとプロセッサ間共用部
を所望の直線軸に対して線対称に配置し、マルチプロセ
ッサ間制御部を前記直線軸を含む領域に配置する。プロ
セッサと制御部間の距離が均等化且つ短縮され、さらに
制御部と共用部間の距離の偏差が減ることにより、これ
らの間の高速信号処理が可能になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本願発明は独立に動作可能な
複数のプロセッサを同一チップに集積したオンチップマ
ルチプロセッサに関するものである。更に、本願発明
は、特に高性能化に好適なチップフロアプラン(レイア
ウト)に関するものである。
【0002】
【従来の技術】半導体プロセス技術の極微細化に伴って
LSIチップの高集積化、高速化が著しく進展してい
る。この高集積度を活かしてプロセッサを高性能化する
手段として、同一チップ上に複数のプロセッサを搭載し
たオンチップマルチプロセッサが提案されている。将来
的に半導体プロセスに比べてLSI実装技術の性能向上
が追いつかず、両者の格差が広がる方向にあるため、オ
ンチップシステム化がさらに重要になると予想される。
【0003】従来提案されたオンチップマルチプロセッ
サとして、例えば(1)特開平5−61768号(記事
1)(2)特開平8−212185号(記事2)に記載
の技術などが知られている。
【0004】記事1には、複数のプロセッサと、各プロ
セッサに専属の1次キャッシュメモリと、データ交換回
路との機能ブロック構成図が提示されている。データ交
換回路を介して複数のプロセッサと外部2次キャッシュ
メモリ及び外部メインメモリとの間のデータ転送を制御
することにより、LSIチップのI/Oピン数を削減し
ている。
【0005】記事2には複数のメモリセル領域と複数の
プロセッサが互いにバス接続されたチップフロアプラン
が示されている。メモリセル領域の間にプロセッサを配
置することにより、バス配線長を短縮して高速化を図
り、バス面積を削減している。
【0006】オンチップではないがチップ実装技術によ
るマルチプロセッサとして(3)特開平7−44502
号(記事3)に記載のデュアルプロセッサが知られてい
る。面対称なマスクパターンで作成された2個のプロセ
ッサチップを裏面同士貼り合わせてパッケージに実装
し、2個のプロセッサのI/Oピンをパッケージの共通
外部バス端子に接続している。これによりパッケージの
面積とI/Oピン数を削減している。
【0007】シングルプロセッサだが、チップフロアプ
ランの関連技術として(4)IEEE Micro、M
arch−April、1999、pp.12−23
(記事4)に記載の冗長二重化プロセッサが知られてい
る。このプロセッサは命令ユニット、固定小数点演算ユ
ニット(FXU)、浮動小数点演算ユニット(FP
U)、1次キャッシュを含むバッファ制御ユニット(B
CE)、リカバリユニット(RU)から成る。信頼性向
上のためにIUとFXUとFPUを二重化し、RUでエ
ラー検出を行なっている。開示されたチップ写真では二
重化部のレイアウトパターンがチップの2等分線に対し
てミラー対称になっている。
【0008】
【発明が解決しようとする課題】オンチップマルチプロ
セッサの高性能化に向けた主要課題は、各々のプロセッ
サに対して独立で等価な動作を保証しながらマルチプロ
セッサ間を効率的に制御することである。即ち、プロセ
ッサとその制御部との間のデータ転送や調停制御等の処
理を、各プロセッサに対してバランス良く高速化するこ
とである。
【0009】また、チップ上に集積されるキャッシュメ
モリやI/Oピン等の共有資源をマルチプロセッサで効
率的に活用するためには、制御部と共有部間の信号処理
も高速化する必要がある。プロセッサ、共有部、制御部
間のインターコネクションの高速化はこれらのチップ上
のレイアウトに深く依存しており、相互距離をいかに均
等に短縮するかが重要な鍵を握っている。
【0010】そこで、本願発明はマルチプロセッサ間制
御の高速化、高性能化を可能にするチップフロアプラン
を提供することを狙いとする。
【0011】本願発明の第1の目的は、オンチップマル
チプロセッサの高性能化に向けたフロアプランとして、
複数のプロセッサ、プロセッサ間制御部/共用部の具体
的な配置を提供することにある。
【0012】さらに、本願は、要求される性能と設計階
層に応じて、ユニットレベル、ブロックレベル、回路レ
ベル、トランジスタレベルにおけるレイアウトを提供す
る。
【0013】第2の目的は、上記第1の目的を達成する
ためにプロセッサ、制御部、共用部を配置する際のより
具体的な位置基準を提供することにある。
【0014】第3の目的は、冗長二重化プロセッサをオ
ンチップマルチ化した場合に適したプロセッサ同士の配
置とプロセッサ内部の二重化部の配置とを提供すること
にある。
【0015】第4の目的は、マルチプロセッサの代表的
な制御部や共用部として、共有キャッシュメモリとその
制御部、I/O回路群とその制御部、グローバルクロッ
クの生成部、電源制御部等の配置を提供することにあ
る。
【0016】第5の目的は、本願発明によるフロアプラ
ンに対応して、クロックツリー、電源配線、I/Oピン
等の配置を提供することにある。これらのグローバルパ
ターンはチップの基本特性を左右する重要因子であるた
め、上位設計階層において設計される。
【0017】第6の目的は、本願発明に基いて設計され
たオンチップマルチプロセッサを製造する際の製造工数
とコストを削減するための手段を提供することにある。
【0018】第7の目的は、本願発明のオンチップマル
チプロセッサを実装するのに適した配線基板、例えばパ
ッケージ基板やマルチチップモジュール基板を提供する
ことにある。
【0019】
【課題を解決するための手段】最初の本願発明の骨子の
諸形態を説明し、次いで本願発明の諸形態を列挙し、そ
の詳細を説明する。
【0020】本願発明の主たる形態の第1は、独立に動
作可能な複数のプロセッサを有し、前記複数のプロセッ
サの中の少なくとも一対のプロセッサがチップ平面上の
所定の直線軸または所定の原点に対して互いに対称に配
置されていることを特徴とするオンチップマルチプロセ
ッサである。
【0021】本願明細書における「対称」とは、当該プ
ロッセサ領域の、少なくともユニットレベルの平面配置
が対称であることである。一般に、設計階層は、ユニッ
トレベル、ブロックレベル、回路レベル、トランジスタ
レベル等の多数の階層が考えられる。勿論、本願発明の
対称が成立する階層が、前記各階層のより下位の階層に
まで及ぶことが好ましい。しかし、本願発明の初期の目
的は、少なくともユニットレベルの平面配置が対称であ
ることで達成される。
【0022】対称には、いわゆる線対称と点対称(18
0度回転対称)が考えられるが、いずれの場合も目的を
達成することが出来る。更に、特別な形態、例えば4個
のプロセッサをオンチップとなす場合、90度の回転対
称も使用し得る。更に、前記線対称や点対称の形態を有
する平面配置に対して、平行移動を施しても初期の目的
を達成することが出来る。これらについての詳細は後述
される。この平行移動は前記直線軸に平行な方向、ある
いは点対称の場合、対象となる複数プロセッサ領域等の
相互に対向する面と平行な方向に平行移動がなされる。
90度回転対称の場合も、こうした平行移動が考えられ
る。この場合も、同様に考えて良い。また、平行移動の
範囲は、通例、概ね対象プロセッサのマシンサイクル時
間の2割5分程度の範囲でなされる。この平行移動の範
囲が小さい方が本来の目的には好ましく、前記マシンサ
イクル時間の2割以下がより好ましい。しかし、平行移
動の手段を用いる事によって、オンチップマルチプロセ
ッサの各種設計の容易性を増大し、又、その設計裕度を
大きくすることが出来る。
【0023】本願発明の主たる形態の第2は、独立に動
作可能な複数のプロセッサを有し、前記複数のプロセッ
サの中の少なくとも一対のプロセッサがチップ平面上の
所定の直線軸または所定の原点に対して互いに対称に配
置され、前記一対のプロセッサに対する制御部が前記直
線軸または前記原点を含む領域に配置されていることを
特徴とするオンチップマルチプロセッサである。
【0024】形態の第2は、前記形態の第1に、一対の
プロセッサに対する制御部の配置に関する思想が加えら
れたものである。制御部が前記直線軸または前記原点を
含む領域に配置されることによって、これら相互の遅延
時間を略等しくすることが出来る。
【0025】即ち、言葉を変えれば、本願発明の主たる
形態の第3は、独立に動作可能な複数のプロセッサを有
し、前記複数のプロセッサの中の少なくとも一対のプロ
セッサがチップ平面上の所定の直線軸または所定の原点
に対して互いに対称に配置され、前記一対のプロセッサ
に対する制御部が、当該制御部から双方のプロセッサま
での遅延時間が略等しいことを特徴とするオンチップマ
ルチプロセッサである。遅延時間の相違の許容範囲は、
そのオンチップマルチプロッセサの設計仕様によって異
なる。実用的には、概ねマシンサイクル時間の2割5分
程度以下、より好ましくは2割程度以下を多用する。
【0026】制御部から双方のプロセッサまでの遅延時
間が略等しいことは、言葉を変えれば、距離が概ね等価
であること意味している。具体的には、例えば制御部内
のピン配置等の関係で、第1のプロセッサと制御部との
距離と第2のプロセッサと制御部との距離とが若干の相
違を呈することがある。しかし、現実には、現在のオン
チップマルチプロセッサでの制御部の占める領域の幅か
らみて、略等価と見なして十分である。
【0027】本願発明の主たる形態の第4は、独立に動
作可能な複数のプロセッサを有し、前記複数のプロセッ
サの中の少なくとも一対のプロセッサがチップ平面上の
所定の直線軸または所定の原点に対して互いに対称に配
置され、前記一対のプロセッサに対する制御部が前記直
線軸または原点を含む領域に配置され、当該制御部から
双方のプロセッサまでの距離が概ね等価であることを特
徴とするオンチップマルチプロセッサである。
【0028】本願発明の主たる形態の第5は、独立に動
作可能な複数のプロセッサを有し、前記複数のプロセッ
サの中の少なくとも一対のプロセッサがチップ平面上の
所定の直線軸または所定の原点に対して互いに対称に配
置され、前記一対のプロセッサに対する制御部が、当該
制御部から双方のプロセッサまでの遅延時間が略等し
く、前記一対のプロセッサに前記制御部を介して接続さ
れる共用部が前記直線軸または前記原点を含んで配置さ
れていることを特徴とするオンチップマルチプロセッサ
である。更には、前記共用部が前記直線軸または前記原
点に対して概ね対称に配置されていることがより好まし
い。問題とする遅延時間の差異を最小限にすることが出
来る。尚、ここで、前記共用部とは、具体的には、例え
ば、具体例としては共有キャッシュ・メモリやI/O手
段等を指している。
【0029】以上、本願発明の主な形態を列挙説明した
が、次いで、前記した目的との関わりを含めて、更に本
願発明の諸形態を列挙し、その詳細を説明する。
【0030】上記第1の目的を達成するための手段とし
て、本願発明のオンチップマルチプロセッサは複数のプ
ロセッサをチップ平面上の仮想的な位置基準(直線軸ま
たは原点)に対して互いに対称に配置し、プロセッサ間
制御部をこの位置基準を含む領域に配置し、さらにプロ
セッサ間共用部がある場合にはこれを位置基準に対して
概ね対称に配置したものである。これにより制御部が置
かれる領域はプロセッサ間の概ね中点に位置するため、
制御部から各プロセッサまでの距離が均等化且つ短縮さ
れる。
【0031】また、制御部から共用部までの距離の偏差
が減り平準化される。なお、レイアウトの対称性は、タ
イミング設計や半導体プロセスの歩留りに対する要求に
応じて、より下位の設計階層に展開される。例えば論理
ユニットとキャッシュメモリ、論理ブロックとメモリマ
ット、論理/メモリ回路群、回路セル、トランジスタ、
トランジスタの構成要素(MOSトランジスタならばソ
ース、ゲート、ドレイン)の配置に対して対称性の要否
を選択することができる。
【0032】対称変換をトランジスタレベルで実施する
場合には、半導体プロセスばらつきの影響を抑えるため
の工夫が必要である。トランジスタ構造の点では、例え
ばMOSトランジスタの1本のゲートの両側にソースと
ドレインの両方を設けるか、または1本のドレインの両
側にゲートとソースを設ける。これは或る意味でトラン
ジスタ構成要素のミクロな対称構造と言える。このミク
ロ対称構造はゲート長方向に関する位置ずれが生じても
その影響を相殺するので、プロセッサに伴って対称変換
したトランジスタ同士の特性を等しく保つことができ
る。
【0033】上記第2の目的に係る一つの手段はMOS
トランジスタ回路でチップを設計した場合の位置基準と
してゲート方向をとったものである。そして、チップ上
のレイアウトをゲート方向に平行または垂直な直線軸に
対して線対称とするか、または仮想的な原点に対する点
対称(180度の回転対称)とする。これにより、ゲー
ト方向が平行な向きに揃うので、半導体プロセスばらつ
きの影響を抑えることができる。
【0034】上記第2の目的に係るもう一つの手段は、
論理構造に応じた位置基準としてデータ系論理のデータ
フロー方向をとり、上記と同じくレイアウトの対称性を
定義したものである。これにより、プロセッサ同士のデ
ータが直交することなく互いに平行に流れるので、プロ
セッサ間制御部とのデータの授受が行ない易くなる。例
えば演算処理はデータフローの上流側から下流側に進む
ため、両方のプロセッサの上流側にキャッシュ制御ユニ
ットやインタフェース制御ユニット等のプロセッサ間制
御部を配置すれば、データフローがスムーズになる。な
お、データフロー方向が平行であればトランジスタの入
出力線方向も揃うので、トランジスタがMOS、BiC
MOS、バイポーラ等の何れであるかに拘わらず、トラ
ンジスタ特性のばらつきを抑え込むことができる。
【0035】上記第3の目的に係る手段は、複数のプロ
セッサを第1の直線軸に対して線対称に配置し、プロセ
ッサ間制御部を第1の直線軸を含む領域に配置し、プロ
セッサ内部の冗長二重化された論理ユニットまたはキャ
ッシュメモリを第2の直線軸に対して線対称に配置した
ものである。これにより、複数のプロセッサとプロセッ
サ間制御部との距離を均等化し、且つプロセッサ内部で
二重部分と一重部分との距離を均等化するという二つの
要求を両立させることができる。
【0036】上記第3の手段を実施した場合において、
二重部分の制御を掌る一重部分がプロセッサ領域の一辺
の中点近傍に位置しているとすれば、この一重部分とプ
ロセッサ間制御部とを近付けるためには第1の直線軸と
第2の直線軸が直交していることが望ましい。これらの
直線軸の方向としてゲート長方向とゲート幅方向を考え
ると、前者を対称軸にとる方が半導体プロセスばらつき
の影響が少ない。一般的にプロセッサ内部のタイミング
設計の方がプロセッサ間に比べてより厳しいので、第2
の直線軸をゲート長方向とする手段が有効である。ま
た、二重部分同士のデータフローは同一方向に流れるこ
とが望ましいので(平行でも互い違いに逆流させるとプ
ロセッサ内部の制御が困難になる)、第2の直線軸をデ
ータフロー方向とする手段が有効である。
【0037】上記第4の目的に係る手段は、上述の手段
にしたがって具体的なマルチプロセッサ間制御部/共用
部を配置したものである。マルチプロセッサでキャッシ
ュメモリを共有する場合、プロセッサ、共有キャッシ
ュ、外部記憶等の間のデータ転送や調整を行なうための
記憶制御ユニットを上記第1の手段で述べた位置基準を
含む領域に配置する。記事2のバス結合や記事3のネッ
トワーク結合に対して高性能化を図るには、各々のプロ
セッサと記憶制御ユニットとを1対1で結合するのが良
い。各プロセッサが個別に1次キャッシュを備えている
場合、共有キャッシュは1次より下位レベルの1.5次
キャッシュや2次キャッシュとして働く(例えば1.5
次キャッシュは1次キャッシュと同時にアクセスされる
がレイテンシが1次より余分にかかる)。この場合、各
プロセッサの内部で1次キャッシュ制御ユニットを位置
基準側に寄せて配置し、記憶制御ユニットを1次キャッ
シュ制御ユニットの間に挟むように配置するという手段
により高性能化を図れる。
【0038】上記第4の手段に係りI/O回路群を共用
する場合、プロセッサとチップ外部との信号伝送や優先
権設定を行なうためのI/O制御ユニットを上記と同様
に配置する。I/O回路群の共用によりI/Oピン数が
削減される。I/O制御ユニットはインタフェース仕様
に応じて1対1伝送、双方向伝送、バス接続、ネットワ
ーク通信等の制御を担う。より望ましい配置手段として
は、プロセッサ自身に在るI/O制御ユニットをプロセ
ッサ領域の位置基準側の1辺に寄せて配置し、プロセッ
サ間I/O制御ユニットをプロセッサ内ユニットの間に
配置する方法がある。
【0039】以上の他に上記第4の目的に係る手段とし
ては、上記位置基準を含む領域にグローバルクロック生
成回路部(PLL、初段クロックドライバ等)や電源制
御回路部(低電力/テストモード制御、基板バイアス制
御等)を配置したものである。これにより、前者では複
数のプロセッサへ均等にクロックを供給でき、後者では
偏りのない電源制御が可能になる。また、第4の手段
は、プロセッサ、制御部、共用部のそれぞれに対して独
立にクロックや電源を調整、停止するのにも適してい
る。
【0040】上記第5の目的に係る手段は、上述した手
段によるプロセッサの対称性にしたがって、クロックツ
リー、電源配線、I/Oピン等各対象部位毎のグローバ
ルパターンにも対称変換を実施するものである。これに
より、クロックツリーに関しては各プロセッサに対して
同等のスキューでクロックが分配される。プロセッサに
対してプロセッサ間制御部/共用部より優先的にクロッ
クを供給すれば、プロセッサ内部のスキューを低減して
高速化を図ることもできる。
【0041】尚、ここで、クロックツリーが直線軸ある
いは原点に対して対称であることは、基本的ツリー構成
がこの対称性を有しておれば、初期の目的を達成するこ
とが出来る。クロックツリーの構成には、グローバルレ
ベルとしては、上層の配線レベル、Hツリーで言えば
「H」の初段から数段目、例えば3より4段目までのレ
ベルが考えられる。一方、ローカルレベルとしては、下
層の配線レベルを挙げることが出来る。そして、現実の
設計において、当該構成の局所的な領域に対称性の乱れ
が見られることも当然あるが、本願発明の基本思想は、
基本的ツリー構成にこの対称性を導入することである。
又、本願発明においては、少なくともプロセッサ領域の
上部のクロックツリーの対称性がわけても重要である。
勿論、より下位のレベルにまで対称性を確保すること
が、本願発明の目的からより好ましいことは言うまでも
ない。
【0042】電源配線に関しては、各プロセッサの電圧
ドロップやノイズ等の電源特性が均等になる上、ノイズ
検証やタイミング解析等をプロセッサ毎に行なう必要が
なくなって設計工数を省ける。I/Oピンとして特にチ
ップ表面にバンプを設ける場合には、プロセッサ領域表
面における電源/グランド用バンプの数と配列がプロセ
ッサの対称性に応じて維持されるので、上記電源配線と
同様に電源特性が等しくなる。
【0043】上記第6の目的に係る手段は、上述した手
段によるオンチップマルチプロセッサを半導体プロセス
で製造する場合に、所定のプロセッサ領域のマスクパタ
ーンをマスターとして、このマスターパターンを対称変
換したマスクパターンを他のプロセッサ領域に流用した
ものである。マスクパターンの生成や修正をプロセッサ
毎に行なう必要がなくなる。本手段は特にトランジス
タ、要素回路、プロセッサ内部配線を形成するためのマ
スクパターンに対して適用でき、マスクパターン生成に
関わるコストと工数が削減される。
【0044】上記第7の目的に係る手段は、上述した手
段によるオンチップマルチプロセッサをパッケージ基板
やマルチチップモジュール基板等に実装する場合に、基
板の配線パターンにもプロセッサに対応した対称変換を
実施するものである。これにより、上記第6の手段で述
べたような電源特性の均等性が維持される上、配線パタ
ーン生成にかかる設計工数を省くことができる。
【0045】
【発明の実施の形態】以下、本願発明の実施例を図面と
共に説明する。
【0046】先ず、本願発明の第1実施例として、同一
チップ上にデュアルプロセッサを搭載し、高信頼化のた
めに各プロセッサの内部を二重化したオンチップマルチ
プロセッサについて説明する。図1と図2は第1実施例
のオンチップマルチプロセッサのフロアプラン図と機能
ブロック構成図を示す。図1中の略称文字(FU、GU
等)はレイアウトの対称性を示すために意図的に反転、
回転させて表示している。例えば、反転した略称文字の
部分は、その幾何学的平面構成が反転して配置されてい
ることを示している。図1に左下に示したXY座標軸の
意味については図3、図4に関連して説明する。
【0047】図1及び図2に示した例では、オンチップ
マルチプロセッサ1は、独立に動作可能な命令プロセッ
サ(IP:Instruction Processo
r)10、20と、マルチプロセッサ間の記憶制御やI
/Oインタフェース制御を行なう記憶制御ユニット(S
U)30と、このSU30を介してプロセッサ間で共有
されるグローバルバッファ記憶(GS、1.5次キャッ
シュ)32、33及びI/O回路群(I/O)34、3
5と、チップ1内部にクロックを供給するクロック生成
回路部(PLL)31から構成されている。このデュア
ルプロセッサ1は0.13μm世代のいわゆるCMOS
プロセスで製造されており、クロック周波数1.2GH
zで動作する。約17mm□のチップの中に約250M
トランジスタが集積されており、IP10、20内のバ
ッファ記憶(BS、1次キャッシュ)とGS32、33
の容量はそれぞれ256KBx2と2MBに及ぶ。I/
O34、35はI/O回路セルがストライプ状に配列さ
れた回路セルアレイから成り、合計I/O数は約100
0ピンである。
【0048】IP10は、命令フェッチ、デコード、ア
ドレス生成、分岐予測を行なう命令ユニット(IU:I
nstruction Unit)11、12と、バッ
ファ記憶に対して命令語やデータの読出し/書込みと記
憶制御を行なうバッファ制御ユニット(BU:Buff
er Control Unit)13と、固定小数点
演算命令、論理演算命令を実行する汎用演算ユニット
(GU:GenaralPurpose Excuti
on Unit)14、15と、浮動小数点演算命令を
実行する浮動小数点演算ユニット(FU:Floati
ng Point Unit)16、17と、演算結果
のエラー検出と復元処理を行なうリカバリーユニット
(RU:Recovery Unit)18から構成さ
れている。このIP10の構成は図2に例示されてい
る。IU11、12、GU14、15、FU16、17
は二重化されており、これらの処理結果がRU18によ
り比較チェックされる。IP10と同様に、IP20は
IU21、22、BU23、GU24、25、FU2
6、27、RU28から構成されている。
【0049】次ぎに、図1を参酌しつつ、本願発明の特
徴点を第1実施例に即して説明する。命令プロセッサI
P10とIP20がチップ平面上の仮想的な直線軸40
に対して互いに線対称に配置されている。更に、記憶制
御ユニットのSU30が直線軸40を含む領域に配置さ
れている。
【0050】また、命令プロセッサIP10と20の内
部にあって同一機能で対を成している命令ユニットIU
11と21、命令ユニットIU12と22、バッファ制
御ユニットBU13と23、汎用演算ユニットGU14
と24、汎用演算ユニットGU15と25、浮動小数点
演算ユニットFU16と26、浮動小数点演算ユニット
FU17と27、リカバリーユニットRU18と28が
前記直線軸40に対して互いに線対称に配置されてい
る。
【0051】さらに、BU13とBU23はそれぞれI
P10とIP20のレイアウト領域において直線軸40
に近い側の1辺に寄せて配置されている。
【0052】これらのレイアウト上の配慮により、記憶
制御を担っているSU30とBU13、23とが互いに
均等な距離に近接して配置されるので、タイミング設計
の点で等価な動作を保証できると共に、ディレイを短縮
して高速制御を行なわせることができる。
【0053】ディレイ上の観点から再度レイアウトを定
義すれば、BU13と23両者の中心部を源とする等デ
ィレイ線同士が交わる領域にSU30が配置されている
と言うこともできる。
【0054】チップ上の信号転送ディレイは、集積度や
配線物量とのトレードオフに配慮して実用的範囲で考え
ると、高速な配線系を用いても数10ps/mmかか
る。第1実施例のようにマシンサイクルが1000ps
を切るGHz級プロセッサでは、チップ上の配置と距離
がマシンサイクルを左右するため、本願発明によるフロ
アプラニングが極めて有効なのである。
【0055】IP10と20の共有キャッシュであるG
S32、33や、IP10と20の共通I/O34、3
5は直線軸40に対して概ね線対称に配置されると共
に、直線軸41に対しても線対称に配置されている。直
線軸41は直線軸40に直交する直線である。従って、
直線軸40を含む領域に配置されたSU30からGS3
2、33、I/O34、35までの配線接続が対称的に
なり、ディレイの偏差が抑えられて平準化されるので、
こられの共用部をマルチプロセッサ間で等価的に活用す
ることが可能になる。
【0056】二重化されたユニットでは、IU11と1
2、IU21と22、GU14と15、GU24と2
5、FU16と17、FU26と27が直線軸41に対
して互いに線対称に配置されている。これにより、二重
化ユニットとBU13、23、RU18、28の間の距
離が均等になり、二重部分と一重部分の間で等価なタイ
ミングでデータ転送を行なわせることができる。
【0057】なお、第1実施例ではIP10と20の対
称軸40と二重化ユニットの対称軸41とを直交させて
いるが、これも発明の一つである。例えば第1実施例に
従わずに二重化ユニットの対称軸41と平行な軸でIP
同士を線対称に配置した場合を想定してみよう。この場
合、BU同士の間に2個のIUが挟まって間隔が広が
り、これに伴ってBUからSUまでの距離も長くなって
しまうので、ディレイが増加する問題が起きる。BUと
IUを置換してBU同士を近付けると、IP内部の二重
化ユニットとBUとの配置のバランスが崩れるので、二
重化ユニットのタイミング設計に悪影響が及ぶ。したが
って、IPの対称軸と二重化ユニットの対称軸を平行に
することは得策でなく、第1実施例のように対称軸同士
を直交させることが重要である。
【0058】クロック供給源であるPLL31が生成し
たクロック信号は、直線軸40または41に沿って張ら
れたHツリー、フィッシュボーン、メッシュ等のクロッ
ク分配配線とクロックドライバを介してチップ1内部に
供給される。PLL31はSU30と同じく直線軸40
を含む領域に配置されているので、PLL31からIP
10、20までの距離が同じになり、両者に等価なクロ
ックスキューでクロックを供給できる。すなわち、IP
10と20でタイミング設計基準を変更する必要はな
い。PLL31からIP10、20へ優先的にクロック
分配配線を行なってスキューを低減すれば、IP10と
20の高速化を図ることができる。また、IP10と2
0に対して独立にクロックを供給して制御するような場
合にも等価性の点で本願発明による配置が望ましい。こ
のことは、クロックだけでなく電源制御回路にも当ては
まる。
【0059】以上から第1実施例のフロアプランによれ
ば、命令プロセッサIP10、20に対して独立で等価
な動作を保証しながら、これらのプロセッサと共有キャ
ッシュGS32、33と共通I/O34、35との間を
記憶制御ユニットSU30を介して効率的且つ高速に制
御できるという効果がある。また、マルチプロセッサ間
制御だけでなく、IP10、20内部の冗長二重化ユニ
ットに対しても等価タイミング動作を保証しており、プ
ロセッサ内/間両者の高性能、高信頼化にとって極めて
有効である。なお、これらの第1実施例の効果は、図2
に示す機能ブロック構成図をそのまま単純にチップにレ
イアウトしても得られるものではなく、第1実施例で説
明した発明によってはじめて実現し得るのである。
【0060】図3は上記第1実施例の論理ユニット内部
のブロック配置の一例として、汎用演算ユニットGU1
4、15、24、25を拡大した模式的なレイアウトの
例を示す図である。汎用演算ユニット内の下位のブロッ
クを模式的に例示している。図3に(a)〜(d)と示
したのは、汎用演算ユニットGU14、15、24、2
5の各々拡大したレイアウト図である。図3のXY座標
軸の方向は図1の座標軸に対応しており、4つのGUを
XY座標の4つの象限に振り分けて描いてある。二重化
されたGU14と15、24と25がX軸(図1の直線
軸41)に対称、更に、IP10と20に対応する14
と24、15と25がY軸(図1の直線軸40)に対称
である。なお、GU14と25、15と24は座標原点
(即ち、図1の直線軸40と41の交点)に対して点対
称になっている。
【0061】図3において、GU14は大別してデータ
系論理部201、制御系論理部203、レジスタ20
5、206から構成されており、データ系論理部201
はブロック群202、制御系論理はブロック群204か
ら成る。ブロック群202、204はデータ系論理部2
01のデータフローが図面右から左(−X軸方向)に流
れるように配置されている。他のGU15、24、25
の構成要素もGU14と同じであるが、直線軸40、4
1をはさんで同じ機能の構成要素同士が互いに対称に並
ぶように配置されている。したがって、GU15、2
4、25のデータフロー方向はそれぞれ−X、X、X軸
方向になっている。
【0062】データフロー方向をこのようにとると、G
U14、15のデータフローの上流側とGU24、25
の上流側とが互いに向き合う形になる。第1実施例では
記憶制御を行なうBU、SUがGUの上流側に配置され
ているから、これらの間でGU14、15←BU13←
SU30→BU23→GU24、25というようにSU
30を源とするスムーズなデータフローを実現すること
ができる。すなわち、マルチプロセッサ間制御を効率的
且つ高速に行なうことが可能になる。また、二重化した
GU14と15、GU24と25ではデータフローが同
一方向に流れているので、逆流させた場合に比べると、
プロセッサ内部のGUとBU間の制御も効率的に行なえ
る効果がある。
【0063】図4は上記第1実施例の論理ブロック内部
のトランジスタ回路群の配置の一例として、図3を部分
的に拡大したレイアウト図である。図4中の(a)〜
(d)は図3における(a)〜(d)の汎用演算ユニッ
トに各々対応している。但し、分かりやすくするために
トランジスタ回路を模式化して描いている。図4のXY
座標軸の方向は図1と図3に対応しており、X軸が図1
の直線軸41、Y軸が図1の直線軸40に平行である。
前述の通り、図4の4つの象限は図3の4つの象限に対
応しており、(a)がGU14、(b)がGU15、
(c)がGU24、(d)がGU25の対称性を引き継
いでいる。図4中の小矢印はトランジスタ回路への信号
入力方向を示している。
【0064】図4に示したトランジスタ回路群はCMO
S回路セルから成り、ここでは一例としてインバータ、
2入力NAND、2−1入力AOIを配列した場合を示
している。各回路セルはpMOSトランジスタ222、
nMOSトランジスタ223、ゲート224、電源配線
220、221、セル内配線225、信号配線226か
ら構成されている。トランジスタ222、223におい
て、電源配線220、221に接続された部分がソー
ス、各回路セルの出力に接続された部分がドレインであ
る。これらの回路構成要素は、ゲート長方向がX軸すな
わち二重化ユニットの対称軸41に平行、ゲート幅方向
がY軸すなわちIP10と20の対称軸40に平行にな
るように配置されている。
【0065】このような配置を選択した理由は、第1実
施例では命令プロセッサIP内部のタイミング設計の方
が命令プロセッサIP間より厳しかったからである。半
導体プロセスにおける製造ばらつきによるトランジスタ
特性の変動は、p/nウェルに対するゲート位置がゲー
ト長方向にずれた場合の方がゲート幅方向にずれた場合
に比べて大きい。そこで、図4に示すようにトランジス
タを配置することにより、同じIP内部で二重化された
回路群((a)と(b)、(c)と(d))の特性ばら
つきを抑え込んでいる。すなわち、チップフロアプラン
における対称軸とゲート長/幅方向との関係を適切に選
択することによって、プロセッサを高速化できる効果が
ある。
【0066】第1実施例ではさらにゲート露光/描画プ
ロセスのばらつきも考慮して、レイアウトの対称性を、
ゲート長/幅方向の何れかに平行な直線軸に対する線対
称か、(a)と(d)または(b)と(d)の関係のよ
うな点対称(180ー回転対称)に制限している。
【0067】これら以外の対称性、例えば45ー傾いた
軸に対する線対称、90ーの回転対称、平行移動と線対
称の合成写像等も本願発明に係る選択肢として考え得る
が、これらはオンチップに搭載するプロセッサ数や要求
性能と、半導体プロセス技術の進展に応じたトランジス
タ特性、集積度、歩留りを総合的に勘案して選択される
べきである。
【0068】なお、図4にしたがってトランジスタ回路
を配置した場合の信号伝播方向(図中の小矢印)は、図
3で説明したデータフロー方向に一致している。これは
すなわちマルチプロセッサ間制御の高効率化(図3の効
果)と半導体プロセスばらつきの抑制によるプロセッサ
内部の高速化(図4の効果)とを矛盾無く両立できるこ
とを意味している。
【0069】図5は本願発明の第2実施例のMOSトラ
ンジスタの模式的レイアウト図である。本願発明による
対称変換をMOSトランジスタ回路レベルで実施した場
合に半導体プロセスばらつきの影響を抑制するための手
段として、図4では回路配列方向に適した対称変換の位
置/方向基準について説明した。一方、図5に示す第2
実施例ではMOSトランジスタの内部構成要素の対称性
について説明する。図5のXY座標軸と(a)〜(d)
の4つの象限は図4に対応している。そして、その
(a)に対して(b)がX軸対称、(c)がY軸対称、
(d)が点対称である。(a)と(b)または(c)と
(d)の組が同一プロセッサ内の二重化部分に相当す
る。
【0070】図5の(a)〜(d)にそれぞれ3タイプ
のMOSトランジスタを示している。Nタイプは通常一
般のトランジスタであり、XタイプとSタイプが本願発
明によるものである。図5の(a)で説明すると、Nタ
イプはソース(S)240とゲート(G)241とドレ
イン(D)242から構成されている。Xタイプではゲ
ート245の左側にソース243とドレイン247、右
側にドレイン246とソース244がクロスするように
配置され、トランジスタ内部で点対称構造を成してい
る。Sタイプではドレイン252がゲート250、25
1とソース248、249によってサンドイッチのよう
に挟まれ、ドレインに対するミラー対称構造を成してい
る。
【0071】図5の(a)〜(d)でゲートを二重に描
いたのは、プロセスばらつきによってウェル(ドレイ
ン、ソース)に対してゲート位置が相対的に(図中で右
下に)ずれた場合を表している。図5の(a)において
Nタイプではソース240の幅が広がり、ドレイン24
2の幅が狭まっている。図5の(b)は(a)と同様に
変動するので、(a)と(b)のトランジスタ特性は等
しい。しかし、(c)と(d)は、(a)や(b)と逆
にドレインが広がってソースが狭まるため、その特性が
異なってしまう。
【0072】Xタイプでは二対のソースとドレインをク
ロスさせて持っているため、片側のソースとドレインの
幅が広がればもう片側のドレインとソースの幅が必ず狭
まることになる。この変動の仕方は図5の(a)〜
(d)の対称変換に対して同様に起こるので、(a)〜
(d)の特性も等しくなる。Sタイプでは図5の(a)
〜(d)でゲートに挟まれたドレインの幅が一定であ
り、2つのソースに対する変動の仕方が同じなので、
(a)〜(d)の特性も均等である。
【0073】以上から、第2実施例に示すXタイプとS
タイプは、本願発明の対称変換に対してトランジスタ特
性を均一化させるのに効果がある。Nタイプに比べてX
タイプは構造が若干複雑であり、Sタイプは面積が広が
る等の短所があるが、特にプロセッサ間で特性を合わせ
たい箇所、例えばクロックドライバ、フリップフロップ
/ラッチ回路やRAMのクロック入力部、RAMのセン
スアンプ等に選択的に導入することが有用である。
【0074】図6A〜図6Cはそれぞれ本願発明の第3
実施例のクロックツリー、電源配線、I/Oピンの概略
レイアウト図である。マルチプロセッサとその制御部の
対称性に基づいてこれらのグローバルパターンにも対称
変換を行なった場合について、ここでは第1実施例のオ
ンチップマルチプロセッサを例にとって説明する。
【0075】図6Aのクロック分配ツリーは、IP10
と20にクロックを分配するHツリー300と、GS3
2、33及びI/O34、35への変形ツリー301、
SU30への変形ツリー302から構成されている。チ
ップ全体に一様なツリー形式でクロックを分配するので
はなく、PLL31からIP10、20へ優先的に短距
離で配線することによって、IP10と20内部のクロ
ックスキューを低減している。
【0076】Hツリー300はIP10と20の対称変
換の基準である直線軸40に対して線対称に配置されて
おり、さらにHツリー300のパターンはIP内部の二
重化部分の対称軸41に対しても線対称である。したが
って、IP10と20両者と二重化部分に対して均一な
スキューでクロックを供給することができ、個別にタイ
ミング設計を行なう手間を省くことができる。
【0077】ツリー301は、IP10と20の共有G
S32、33、共通I/O34、35の対称性に従って
直線軸40、41に対して線対称である。図中で上下に
分かれているが、Hツリーまたはフィッシュボーン形式
の変形と見ることもできる。ツリー302は、両側のH
ツリー300の枝から派生させたツリーをSU31の上
空でつないで形成されている。第3実施例ではIP内部
へのクロック供給を優先させたため、Hツリー300と
ツリー301、302のクロックの位相が異なっている
が、この位相差はプロセッサ間制御部/共用部のタイミ
ング設計に積極的に活用できる。
【0078】図6Bには多層配線の上層部の電源配線パ
ターンを示しており、X軸方向の配線310とY軸方向
の配線311でメッシュを構成している。IP10、2
0、SU31上空のメッシュパターンと、GS32、3
3、I/O34、35上空のメッシュパターンとは、D
Cドロップや切替ノイズに配慮して使い分けている。前
者はIPの対称性に倣って線対称であるから、IP両者
に均等な電源特性を保証できる上、電源設計をIP、S
U共通で行なうことで設計工数を減らせる。後者はRA
M、I/O等特定回路用の電源設計基準に合わせてい
る。
【0079】図6CはI/Oピンであるバンプの配列を
示している。多数のI/Oピンを取り出すために周辺I
/O方式でなくバンプアレイ方式を採用している。図中
の白丸320がI/O34、35に接続される信号用バ
ンプ、黒丸321が図6Bに示した電源配線に接続され
る電源/グランド用バンプである。IP10、20、S
U31の上空と、GS32、33の上空と、I/O3
4、35の上空とで消費電力を考慮してバンプ配列を変
えている。信号バンプが有る部分の信号/電源ピン数比
は1であるが、無い部分(BU13、23、RU18、
28等IP内の二重化されていない部分、PLL31、
I/O34、35等の上空)では電源を強化している。
IP10、20、SU31上空のバンプ配列は電源配線
と同様に線対称であり、IP両者へ均等に給電すること
ができる。
【0080】以上から、第3実施例によれば、本願発明
によるプロセッサやその制御部/共用部の対称性に適し
たクロック分配と電源供給を行なうことができ、しかも
複数のプロセッサに対して共通設計を行なえるので工数
を削減できる効果がある。
【0081】ここまで本願発明について第1実施例を基
に、第2、3実施例を合わせて説明してきたが、第4実
施例では2つのRISCマイクロプロセッサを同一チッ
プ上に集積したオンチップマルチプロセッサについて説
明する。図7にそのフロアプラン図を示す。図7左下の
XY軸は、第1実施例と同じくX軸がゲート長方向、Y
軸がゲート幅方向を表している。
【0082】図7においてオンチップマルチプロセッサ
50は、プロセッサユニット(PU)60、例えばRI
SCプロセッサユニット、70と、PU60と70間の
記憶制御や外部バスとのインタフェース制御を行なうバ
スインタフェースユニット(BIU)80と、BIU8
0によりPU間で共有される2次キャッシュ85、86
と、同じく共用される内部ストライプI/O回路列(I
/O)82〜84と、クロック生成回路(PLL)81
から構成されている。このプロセッサ50は第1実施例
と同じく0.13μm世代CMOSプロセスで製造され
ており、概略仕様は内部動作周波数1.25GHz、チ
ップサイズ約14mm□、集積度約150Mトランジス
タ、1次キャッシュ128KBx2、2次キャッシュ1
MB、I/O約500ピンである。内部クロックはPL
L81からPU60、70、SU80、2次キャッシュ
85、86に均等に分配されるが、I/O周波数は外部
バス仕様に合わせて選択的に分周される。
【0083】プロセッサユニットPU10は、主に命令
並列ディスパッチ、フェッチ、分岐予測等を行なう命令
ユニット(IU)61と、演算命令を並列実行する固定
小数点演算ユニット(FXU)62と、単精度/倍精度
演算を行なう浮動小数点演算ユニット(FPU)63
と、命令語とデータが格納された1次キャッシュ65へ
のアクセスやメモリマネージメントを行なうロード/ス
トアユニット(LSU)64から構成されている。PU
20もPU10と同様にIU71、FXU72、FPU
73、LSU74、1次キャッシュ75から構成されて
いる。
【0084】第4実施例ではプロセッサユニットPU6
0と70が仮想的な直線軸90に対して互いに線対称に
配置されており、PU60と70に共有される2次キャ
ッシュ85、86とI/O82〜84も同様に線対称に
配置されている。これらの共有部を制御するBIU80
は直線軸90を含む領域に配置されており、LSU64
と74がそれぞれPU60と70の内部領域において直
線軸90側すなわちBIU80側の1辺に近付けて配置
されている。したがって、第4実施例ではBIU80と
LSU64、74とが互いに均等な距離で近接して配置
され、2次キャッシュ85、86とI/O82〜84が
BIU80から見てバランス良く配置されるので、PU
間に優劣なく高速なプロセッサ間制御を行なわせること
が可能になる。
【0085】なお、第4実施例では第1実施例のような
PU内部の二重化を行なっていないので、二重化部分と
プロセッサ間の対称変換の優先度について考慮する必要
がない。そこで、PU60と70の対称軸90を有利な
ゲート長方向にとることにより、半導体プロセスばらつ
きによるPU間の特性変動を抑制している。これはすな
わち高速化と歩留りの向上双方に寄与している。
【0086】以上から、RISCプロセッサをオンチッ
プマルチ化した第4実施例においても本願発明は有効で
あり、プロセッサアーキテクチャや論理ユニット構成に
よらず、普遍的にマルチプロセッサ性能の向上に効果が
あることが分かる。
【0087】次に、本願発明による第5実施例として、
半導体プロセス技術が進んでチップ集積度がさらに向上
しプロセッサ数が増加した場合について説明する。図8
は第5実施例のフロアプラン図を示す。
【0088】図8においてオンチップマルチプロセッサ
100は、8個のプロセッサユニット(PU)101〜
108と、記憶制御ユニット(SC)111〜112、
ワーク記憶(WS、2次キャッシュ)114〜117、
内部ストライプI/O(I/O)120〜123、クロ
ック生成回路(PLL)113から構成されている。S
C111〜112はバンク分割されたWS114〜11
7の共有記憶制御とI/Oインタフェース制御を行なっ
ている。本第5実施例は、第1実施例や第3実施例より
さらに進んだサブ0.1μm世代CMOS技術で試作さ
れている。チップサイズ約23mm□の中にPU101
〜108それぞれの集積度として論理約8Mトランジス
タと1次キャッシュ128KB、WS114〜117の
合計容量で8MB、I/O約1800ピンを集積してお
り、クロック周波数1.5GHzで動作する。PLL1
13はSC110の図中左下に配置されているが、ここ
から直線軸130と131の交点にあるクロックドライ
バを経て、チップ100内部に分配されている。
【0089】図8から明らかなようにプロセッサユニッ
トPU101〜108は直線軸130、131に対して
互いに線対称に配置されている(それぞれの対称性を示
すために三角形のマーカーを表示している)。例えばP
U101に対して、PU104は軸130に関する線対
称、PU105は軸131に関する線対称、PU108
は軸130と軸131の交点に関する点対称(180ー
回転対称、軸130と131の2回線対称変換)になっ
ている。
【0090】プロセッサユニットPU101の内部では
記憶制御ユニットSC110〜112との間で信号転送
を行なう制御部が図中下辺側(SC側)に配置されてお
り、本願発明による対称的レイアウトによって他のPU
102〜108の制御部もSC側に向いて配置される。
本願発明によらず無作為に配置した場合に比べて、第5
実施例では各PU内部の制御部とSC111〜112と
を近接して配置することができる。また、ワーク記憶W
S114〜117やI/O120〜123もSC111
〜112に対して遠近の偏りを抑えて配置されている。
【0091】したがって、第1から第4実施例で繰り返
し説明してきたことと同じく、本願発明はオンチッププ
ロセッサ数が増加した第5実施例においてもマルチプロ
セッサ間制御の高効率化にとって大いに効果がある。
【0092】さらに半導体プロセス技術が進んでプロセ
ッサ数が増えた場合においても、一対のプロセッサを単
位として対称変換を施してゆけば、本願発明を適用でき
ることは言うまでもない。また、第5実施例ではチップ
100の上下2辺にPU101〜108を配置している
が、マルチプロセッサの結合方式に応じて、例えば縞模
様、ジグザク、チェック、マトリックス、クロス、同心
形等のように、最適な配置を選択することが可能であ
る。
【0093】図8左下のX軸はゲート長方向、Y軸はゲ
ート幅方向を表している。第5実施例では直線軸130
をゲート長方向にとっているが、これは近接して並んだ
PU同士(101〜104の組、105〜108の組)
の特性が優先的に揃うように配慮したからである。幾つ
かのプロセッサでクラスタを構成する場合、全プロセッ
サに等価な動作を行なわせるのではなく重み付けする場
合等には、優先度に応じて軸方向を合わせることが可能
である。
【0094】図9では本願発明の第6実施例として、こ
こまでの実施例で説明してきたようなハイエンドカスタ
ムLSIでなく、低コストのシステムLSIに本願発明
を適用した場合について説明する。そして、この例は、
他の例と異なって、チップ全体が対称性を有して構成さ
れてはいない例である。しかし、CPUコア(PU)1
51とPU152が直線軸167を軸とする線対称を有
している。更に、SRAM153と154も直線軸16
7を軸とする線対称を有している。この形態によって
も、本願発明の目的を十分奏することが出来る。
【0095】図9のフロアプラン図において、オンチッ
プマルチプロセッサ150は、2個のCPUコア(P
U)151、152と、PU151、152にそれぞれ
専属するSRAM153、154と、内部バスインタフ
ェース制御を兼ねるメモリマネジメントユニット(MM
U)160と、PU151と152の共有主記憶として
働くDRAM164と、他のオンチップマルチプロセッ
サとのネットワーク結合の制御を行なうノード制御ユニ
ット(NC)162と、ディスクやチャネル等の入出力
装置とのインタフェース制御を行なうIO制御ユニット
(IO)163と、PU/NC/IO間を接続する内部
バス165と、クロック生成回路(PLL)161と、
NC162及びIO163とチップ外部との入出力を行
なうための周辺I/O回路列166から構成されてい
る。第6実施例はチップ150内のPU151と152
で共有記憶システムを構成し、他チップとの間でネット
ワーク結合によって分散記憶システムを構成している。
【0096】第6実施例は、システムLSI部品である
IP(IntellectualProperty)を
活用してPU151、152、SRAMマクロ153、
154、DRAMマクロ164、I/Oマクロ166等
をチップ上にインプリメントしたものである。但し、本
願発明に基づいて、提供されたCPUコアとSRAMマ
クロのIPをミラー反転して配置している。これにより
PU151と152及びSRAMマクロ153と154
を直線軸167に対して線対称に配置し、MMU160
を直線軸167上の領域に設けている。直線軸167が
チップ150の等分線に対してオフセットしている理由
は、比較的大きなIPであるDRAMマクロ164の配
置と、NC162やIO163からI/O166への配
線性とを考慮したからである。このオフセットは本願発
明の障害にならず、PUとMMU間を等距離で近接させ
るという効果は遺憾なく発揮される。したがって、シス
テムLSIにおいても本願発明によりIPのレイアウト
を対称変換することで、低コスト化とプロセッサ間制御
の高性能化という2つの課題を解決することが可能にな
る。
【0097】図10は本願発明の第7実施例のフロアプ
ラン図を示す。第6実施例までは主に線対称または点対
称のレイアウトを見てきたが、ここでは別の対称変換を
実施した場合について言及する。
【0098】図10においてオンチップマルチプロセッ
サ170は、4個のプロセッサユニット(PU)171
〜174と、記憶制御ユニット(SCU)175と、2
次キャッシュ176〜179、ROM180、ストライ
プI/O181〜184から構成されている。PU17
1はプロセッサコア194と、PU171専用の1次キ
ャッシュ193と、バスインタフェース制御ユニット1
95から構成されており、他のPU172〜174の構
成も同じである。各PUにあるバスインタフェース制御
ユニットは、図中矢印185〜188で示すPU間リン
グバス接続と、矢印189〜192で示すPUとSCU
間の相互接続を制御している。SCU175は、PU1
71〜174と共有2次キャッシュ176〜179及び
共通I/O181〜184の間の記憶制御とI/Oイン
タフェース制御を行なっている。
【0099】第7実施例では、プロセッサユニットPU
間で分散処理を行わせて記憶制御ユニットSCU175
への配線集中を軽減し、チップ170の配線層数を抑え
る目的で上記のような相互接続方式を採用している。図
10から明らかなように、PU171〜174は互いに
チップ中心の仮想的原点193に対して90ーの回転対
称に配置されており、SCU175はその原点193を
含む領域に配置されている。言わば風車型の配置によ
り、SCU175から4つのPU171〜174及び2
次キャッシュ176〜179までの距離が全て等しくな
る上、リングバス上で隣接するPUまでの中継距離も等
しくなるので、これらのタイミング設計を共通化し、最
適な配線系を選択することができる。また、1個のPU
に対する配線パターンを他の3個のPUに流用できるの
で、配線設計の工数も削減することができる。したがっ
て、第7実施例によれば、チップの配線層数すなわち製
造コストを抑え、設計工数を省き、且つプロセッサ間の
効率的な制御を実現できる効果がある。
【0100】なお、ここまでで線対称、点対称(180
度の回転対称)、90度の回転対称のレイアウトについ
て説明してきたが、第7実施例からも分かるように本願
発明の効果が対称変換の方法によって減ぜられることは
ない。例えば上記以外の角度の回転対称や、幾つかの対
称変換、平行移動との組合せ等が有り得るが、本願発明
の要件を満たせばその効果を享受することができる。
【0101】図11に示す第8実施例は、本願発明によ
るオンチップマルチプロセッサを実装したマルチチップ
モジュール基板の概略レイアウト図である。ここでは第
1実施例のチップを実装した場合を例にとって説明す
る。
【0102】図11のモジュール配線基板350は薄膜
/厚膜セラミック複合多層配線基板から成る。この基板
350には12個のデュアルプロセッサチップ(DP、
チップ1に同じ)351と、2個の記憶制御用チップ
(SC)352と、12個のワーク記憶チップ(WS、
2次キャッシュ)353がフリップチップ実装されてい
る。多層配線によってDP、WS、SCが相互に接続さ
れており、これで24ウェイのマルチプロセッサシステ
ムが構成されている。SC352は、主に、プロセッサ
チップ351とWS353間やWS353と主記憶(図
示せず)間のデータ転送、アクセス競合の調整、チップ
351内のBS、GSとの記憶内容の同期化等の記憶制
御を行なう。
【0103】第8実施例のマルチプロセッサシステム
は、図中の線354を境に左右2つのクラスタに大別さ
れる。左右のチップ配列と基板350の配線パターンは
基本的に点対称(180度の回転対称)になっている。
DP、SC、WS個々のチップ配置方向は、各チップの
I/Oピン(バンプ)の配置、他チップとの相対的な配
置と配線距離、基板350上の配線混雑度等を考慮して
90ー乃至180ー回転されている。各チップに対するI
/O引出し配線や電源配線のパターンは、所定の配線層
においてチップ種毎に共通化されている。また、DP直
下の電源配線パターンは、本願発明によるDP内部のプ
ロセッサの対称性すなわち図6で述べたDPチップ内の
電源構造やバンプ配列の対称性を反映しているため、こ
れも共通化されている。
【0104】したがって、第8実施例によれば、チップ
から基板全体まで各配線階層に応じて設計の共通化を実
施できるので、設計コストを削減できる効果がある。さ
らに、チップ内の複数のプロセッサに対しても、このチ
ップのモジュール上の実装位置に対しても、これらに依
らない等価な動作を保証できるので、システム全体とし
て高い信頼性を獲得することができる。
【0105】以上図面を交えて実施例を説明してきたよ
うに、本願発明の第1の手段によってチップ上の複数の
プロセッサとプロセッサ間制御部と共用部とを対称的に
レイアウトすれば、プロセッサと制御部間のディレイを
均等に短縮し、制御部と共用部間のディレイの偏差を抑
えることができる。したがって、プロセッサ間の効率的
制御を実現できるので、従来技術に比べてマルチプロセ
ッサ性能が格段に向上する効果がある。また、第1の手
段は、要求性能と半導体製造技術やLSI実装技術から
来る制約条件に応じて、ユニットからブロック、回路
群、回路セル、トランジスタまでの各設計階層に展開で
きるので、設計技術としても適用範囲が広いという利点
がある。
【0106】トランジスタレベルにまで対称変換を行な
う場合、MOSトランジスタにミクロ対称構造を導入し
ておけば、半導体プロセスばらつきによる特性変動をト
ランジスタ内部で相殺することができるので、トランジ
スタ特性の均一化と歩留り向上に有効である。特に、特
性変動を嫌うクロック系回路、RAMセンスアンプ等の
アナログ回路に適している。
【0107】本願発明の第2の手段によりMOSトラン
ジスタのゲート方向を位置基準として線対称または点対
称なレイアウトを採用すれば、チップ内のゲートを所定
の方向に平行に揃えることができるので、半導体プロセ
スばらつきがトランジスタ特性に与える影響を回避でき
る効果がある。また、第2の手段においてデータ系論理
のデータフロー方向を位置基準にとれば、プロセッサ間
制御部から複数のプロセッサへのデータフローが迂回や
遅滞を起こさずに平行に流れるようになるので、マルチ
プロセッサ性能をさらに向上させることができる。
【0108】信頼性の高い冗長二重化プロセッサをオン
チップマルチ化する場合、本願発明の第3の手段によっ
てプロセッサ相互だけでなくプロセッサ内部の二重化部
分も線対称に配置すれば、非対称な場合に比べて二重化
部分のディレイを均等に且つ短縮できるので、ユニプロ
セッサ性能が向上する効果がある。また、プロセッサ間
の対称軸と二重化部分の対称軸を直交させることによ
り、プロセッサ間距離と二重部間距離の双方を短縮した
レイアウトが可能になるので、マルチプロセッサ性能と
ユニプロセッサ性能の間のトレードオフを起こさずに両
者共高性能化できる効果がある。
【0109】代表的なプロセッサ間制御部や共用部のレ
イアウトを定めた第4の手段によれば、マルチプロセッ
サの配置に対して、記憶制御ユニットと共有キャッシ
ュ、I/Oインタフェース制御ユニットとI/O回路
群、グローバルクロック生成回路部、電源制御回路部等
の配置が最適化される。これには、ディレイ、クロック
スキュー、電源等の基本特性に対するプロセッサ間ばら
つきを低減できる効果がある。さらに、プロセッサ内部
にある1次キャッシュ制御部や入出力制御部の配置につ
いても最適化を行なうことによって、より一層の高速化
を実現できる。
【0110】第5の手段では、プロセッサの対称性に倣
ってクロックツリー、電源配線、I/Oピン等のグロー
バルパターンにも対称変換を実施することにより、クロ
ックスキューや電源特性の均一化を図れる上、タイミン
グ設計やノイズ解析等の設計工数を省力化できる効果が
ある。
【0111】第6の手段では、複数のプロセッサ領域に
対応する半導体プロセス用マスクパターンを対称変換に
よって生成することにより、マスクパターン生成にかか
る工数を削減できる効果がある。
【0112】第7の手段では、パッケージ基板やマルチ
チップモジュール基板等の配線パターンにも対称変換を
適用することにより、実装時において各々のプロセッサ
に対して等価な動作を保証できる上、配線パターン生成
にかかる設計工数を省けるという効果がある。
【0113】以上まとめて総括すれば、本願発明に基づ
くオンチップマルチプロセッサは、マルチプロセッサ性
能とユニプロセッサ性能の双方を総合的に向上させ、ト
ランジスタからチップ、パッケージ、モジュールに至る
までの基本特性を安定化し、設計及び製造に関わるコス
トを削減できるという多大な効果を奏する。
【0114】なお、本願発明の効果はプロセッサ、制御
部、共用部等のレイアウトの対称性において普遍的に発
揮されるものであって、メインフレーム/CISC/R
ISC等のプロセッサアーキテクチャ、ユニット/ブロ
ック等の論理分割、データ系/制御系等の論理構造、論
理/メモリ回路形式、スタティックCMOS/ダイナミ
ックCMOS/BiCMOS/バイポーラ等の論理/メ
モリ回路形式、半導体プロセス、論理/回路設計ツール
等々の要素技術によって制限を受けるものではない。
【0115】以上、詳細に説明してきた本願発明の諸形
態を表1、表2および表3に取りまとめる。
【0116】
【表1】
【0117】
【表2】
【0118】
【表3】
【0119】表1はプロセッサ等の対象ブロック領域が
線対称、表2は点対称(180度の回転対称)および表
3は90度の回転対称の諸事例を示している。枠体の領
域が前記プロセッサ等の対象ブロック領域を示し、各枠
体の角には丸と三角形の記号によって、それら相互の対
称関係が理解出来るように示している。各表中、一点鎖
線は所定の仮想的な直線軸、×印は回転対称の所定の仮
想的な原点を示す。各表中、斜線部は制御部等を示す。
【0120】更に、各々の対称の関係には、プロセッサ
等の各ブロック領域を平行移動した形態をも示してい
る。これらの諸形態もその効用が認められる。各表には
「&平行移動」の欄として示した。平行移動は、線対称
では所定の仮想的な直線軸に平行な方向、点対称、90
度の回転対称では各ブロックの対向する辺に平行な方向
が好ましい。
【0121】オンチッププロセッサの各構成領域の平面
構成の形態は、各種のものがある。これらを、各表で
は、H型、Π型、Z型、U型、及びO型と表示して示し
た。
【0122】90度の回転対称の形態は、プロッセサが
2個のオンチップマルチプロセッサでは通例採用する形
態ではないが、プロセッサが4個の場合に有用な形態で
ある。この実例は図10を持って具体的に示した通りで
ある。
【0123】表1、表2、および表3に見られるよう
に、本願発明は様々な形態に適用可能であり、回転角度
やトランジスタの方向に対しても表に示された以外のバ
リエーションを取りうる。また、偶数や奇数を問わず多
数のプロセッサに対称変換を全体的または部分的に実施
する場合や、プロセッサ内部領域を分割して分割領域毎
に対称変換を実施する場合、対称変換を行うプロセッサ
や分割領域毎に位置基準を変換する場合にも適宜応用す
ることが出来る。
【0124】尚、本願明細書には、プロセッサが2個な
いし4個の例が例示されているが、奇数個を搭載する場
合にも、本願発明が適用可能なことは言うまでもない。
例えば、3個のプロセッサを用いる場合を考える。第1
の形態例は、3個のプロセッサ(A、B,C)の内の2
個毎(例えば、AとB,およびAとC)の相互に本願発
明の対称性を有させることである。第2の形態例は2個
のプロセッサのみ(例えば、AとB)に本願発明の対称
性を有させることである。残るプロセッサはそのまま搭
載すれば良い。こうした形態は図9を持って示したチッ
プの部分的領域に本願発明を適用した例と基本思想は同
様である。プロセッサ自体の用い方としては、前記1個
のプロセッサはその他とは別の目的に用いたり、あるい
は予備として搭載する場合等もある。
【0125】最後に、本願諸発明と上記した従来技術と
の若干の比較を行なおう。
【0126】上記従来技術の記事1は制御部(データ交
換回路)によるI/Oピン数の削減を目的としており、
プロセッサと制御部間の高速化は慮外である。機能ブロ
ック構成図にはプロセッサをチップ上へどのようにレイ
アウトするかという具体的手段には触れていない。機能
ブロック構成図をそのままチップにインプリメントして
も、実際にはプロセッサから制御部への入出力位置に局
所性があるため、プロセッサと制御部間の距離すなわち
ディレイにばらつきが出てしまう。
【0127】前記記事2では複数のプロセッサと複数の
メモリセル領域とが単一バスに接続されているため、そ
れぞれに個別にバスインタフェース制御部を設けてやる
必要がある。本例のマルチプロセッサ性能はバスのスル
ープットに依存するが、バスバンド幅を拡大すると制御
部面積のオーバーヘッドが大きくなり、チップ資源の有
効活用という点で得策でない。フロアプランに関しては
全てのプロセッサやメモリ領域が同じ向きに単純に並べ
られており、プロセッサ内部の論理構成やメモリ領域の
入出力位置に対する配慮がない。このように、記事2の
技術は本願発明が目指すような高性能マルチプロセッサ
に向いていない。
【0128】前記記事3では2個のプロセッサチップが
ネットワーク結合されて分散記憶システムを構成してお
り、2個のチップのI/Oピンは共通外部バスに接続さ
れている。このため、各プロセッサチップ毎に分散メモ
リ、ネットワークインターフェース制御部、外部バスイ
ンタフェース制御部を設ける必要がある。従って、記事
3の技術をオンチップ化してもチップ資源の点で無駄が
多い。また、2個のチップのレイアウトをそのまま1個
のチップに移植しても、レイアウトがチップの両側に完
全に分離してしまうため、マルチプロセッサ間の効率的
制御を行なえない。
【0129】前記記事4のシングルプロセッサでは、二
重化したIU、FXU、FPUをチップの二等分線に対
してミラー対称に配置し、二重化していないBCEとR
Uを二等分線上に配置している。これにより二重部分と
一重部分との距離とディレイを均等化し、効率的制御を
行なっている。しかし、記事4は元来シングルプロセッ
サとして提供された技術であって、オンチップマルチプ
ロセッサにおけるプロセッサ、制御部、共用部等のレイ
アウトに対する示唆を与えてくれない。例えば記事4の
技術をマルチプロセッサ化するとしても、プロセッサの
パターンは単純な平行移動、線対称、点対称、回転対
称、これらの合成写像等の何れなのか、プロセッサをチ
ップの四辺のどの方向に並べるのか、並んだプロセッサ
に対して制御部や共用部をどこに置くのかについて何も
開示されていない。したがって、オンチップマルチプロ
セッサ技術として新たな発想が必要なのである。
【0130】
【発明の効果】本願発明は、複数のプロセッサに対して
独立で等価な動作を保証しながらマルチプロセッサ間を
効率的に制御することが出来る。本願発明によれば、プ
ロセッサとその制御部との間のデータ転送や調停制御等
の処理を、各プロセッサに対してバランス良く高速化す
ることが出来る。
【0131】下記に各具体的手段の各々の効果について
略述する。
【0132】本願発明の第1の手段によってチップ上の
複数のプロセッサとプロセッサ間制御部と共用部とを対
称的にレイアウトすれば、プロセッサと制御部間のディ
レイを均等に短縮し、制御部と共用部間のディレイの偏
差を抑えることができる。
【0133】トランジスタレベルにまで対称変換を行な
う場合、MOSトランジスタにミクロ対称構造を導入し
ておけば、半導体プロセスばらつきによる特性変動をト
ランジスタ内部で相殺することができる。
【0134】本願発明の第2の手段によりMOSトラン
ジスタのゲート方向を位置基準として線対称または点対
称なレイアウトを採用すれば、チップ内のゲートを所定
の方向に平行に揃えることができるので、半導体プロセ
スばらつきがトランジスタ特性に与える影響を回避でき
る。
【0135】本願発明の第3の手段によってプロセッサ
相互だけでなくプロセッサ内部の二重化部分も線対称に
配置すれば、非対称な場合に比べて二重化部分のディレ
イを均等に且つ短縮できるので、ユニプロセッサ性能が
向上する。
【0136】代表的なプロセッサ間制御部や共用部のレ
イアウトを定めた第4の手段によれば、マルチプロセッ
サの配置に対して、記憶制御ユニットと共有キャッシ
ュ、I/Oインタフェース制御ユニットとI/O回路
群、グローバルクロック生成回路部、電源制御回路部等
の配置が最適化される。
【0137】第5の手段は、プロセッサの対称性に倣っ
てクロックツリー、電源配線、I/Oピン等のグローバ
ルパターンにも対称変換を実施することにより、クロッ
クスキューや電源特性の均一化を図れる。
【0138】第6の手段は、複数のプロセッサ領域に対
応する半導体プロセス用マスクパターンを対称変換によ
って生成することにより、マスクパターン生成にかかる
工数を削減できる。
【0139】第7の手段は、パッケージ基板やマルチチ
ップモジュール基板等の配線パターンにも対称変換を適
用することにより、実装時において各々のプロセッサに
対して等価な動作を保証できる。
【図面の簡単な説明】
【図1】図1は本願発明の第1実施例のオンチップマル
チプロセッサのチップレイアウトを示すフロアプラン図
である。
【図2】図2は第1実施例の機能ブロック構成図であ
る。
【図3】図3は第1実施例の論理ユニット内部における
論理ブロックのレイアウト図である。
【図4】図4は第1実施例の論理ブロック内部のMOS
トランジスタ回路群のレイアウト図である。
【図5】図5は本願発明の第2実施例のMOSトランジ
スタ回路のレイアウト図である。
【図6A】図6Aは本願発明の第3実施例のオンチップ
マルチプロセッサのクロックツリーのレイアウト図であ
る。
【図6B】図6は本願発明の第3実施例のオンチップマ
ルチプロセッサの電源配線のレイアウト図である。
【図6C】図6は本願発明の第3実施例のオンチップマ
ルチプロセッサのI/Oピンのレイアウト図である。
【図7】図7は本願発明の第4実施例のオンチップマル
チプロセッサのフロアプラン図である。
【図8】図8は本願発明の第5実施例のオンチップマル
チプロセッサのフロアプラン図である。
【図9】図9は本願発明の第6実施例のオンチップマル
チプロセッサのフロアプラン図である。
【図10】図10は本願発明の第7実施例のオンチップ
マルチプロセッサのフロアプラン図である。
【図11】図11は本願発明の第8実施例のオンチップ
マルチプロセッサを搭載したマルチチップモジュール配
線基板のレイアウト図である。
【符号の説明】
1、50、100、150、170はIンチップマルチ
プロセッサ、10、20、60、70、101〜10
8、151、152、171〜174はプロセッサ、3
0、80、110〜112、160、175はマルチル
チプロセッサ間制御部、31、81、113、161は
Nロック生成回路部、32〜35、82〜86、114
〜117、120〜123、162〜166、176〜
184はマルチプロセッサ間共用部、40、41、9
0、130、131、167は直線軸、193は原点、
11〜18、21〜28、61〜64、71〜74は処
理ユニット、13、23、65、75、153、154
は二次キャッシュメモリ、32、33、85、86、1
14〜117、164、176〜179は共有キャッシ
ュメモリ、34、35、82〜84、120〜123、
166、181〜184はI/O回路群、201はデー
タ系論理部、203hが制御系論理部、202、204
は論理ブロック群、205、206はレジスタ、22
2、223はMOSトランジスタ、224、245、2
50、251はゲートは220、221、225、22
6は配線、243、244、248、249はソース、
246、247、252はドレイン、300〜302は
Nロックツリー、310、311は電源配線、320、
321はアンプ、350はマルチチップモジュール基板
である。
フロントページの続き (72)発明者 戒能 博通 神奈川県秦野市堀山下1番地 株式会社日 立製作所エンタープライズサーバ事業部内 (72)発明者 清水 照久 東京都青梅市新町六丁目16番地の3 株式 会社日立製作所デバイス開発センタ内 (72)発明者 大林 正幸 東京都青梅市新町六丁目16番地の3 株式 会社日立製作所デバイス開発センタ内 (72)発明者 山下 寛樹 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 益田 昇 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 齊藤 達也 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B045 KK08

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称に配置されていることを特徴とする
    オンチップマルチプロセッサ。
  2. 【請求項2】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称に配置され、前記一対のプロセッサ
    に対する制御部が前記直線軸または原点を含む領域に配
    置されていることを特徴とするオンチップマルチプロセ
    ッサ。
  3. 【請求項3】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称に配置され、前記一対のプロセッサ
    に対する制御部が、当該制御部から双方のプロセッサま
    での遅延時間が略等しいことを特徴とするオンチップマ
    ルチプロセッサ。
  4. 【請求項4】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称に配置され、前記一対のプロセッサ
    に対する制御部が前記直線軸または原点を含む領域に配
    置され、当該制御部から双方のプロセッサまでの遅延時
    間が略等しいことを特徴とするオンチップマルチプロセ
    ッサ。
  5. 【請求項5】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称に配置され、前記一対のプロセッサ
    に対する制御部が、当該制御部から双方のプロセッサま
    での遅延時間が略等しく、前記一対のプロセッサに前記
    制御部を介して接続される共用部が前記直線軸または原
    点を含んで配置されていることを特徴とするオンチップ
    マルチプロセッサ。
  6. 【請求項6】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称関係を有する位置より相互に前記直
    線軸又は前記プロセッサ領域の対向する面と平行な方向
    に平行移動した位置に配置されていることを特徴とする
    オンチップマルチプロセッサ。
  7. 【請求項7】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称関係を有する位置より相互に前記直
    線軸又は前記プロセッサ領域の対向する面と平行な方向
    に平行移動した位置に配置され、前記一対のプロセッサ
    に対する制御部が前記直線軸または原点を含む領域に配
    置されていることを特徴とするオンチップマルチプロセ
    ッサ。
  8. 【請求項8】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称関係を有する位置より相互に前記直
    線軸又は前記プロセッサ領域の対向する面と平行な方向
    に平行移動した位置に配置され、前記一対のプロセッサ
    に対する制御部が、当該制御部から双方のプロセッサま
    での遅延時間が略等しいことを特徴とするオンチップマ
    ルチプロセッサ。
  9. 【請求項9】 独立に動作可能な複数のプロセッサを有
    し、前記複数のプロセッサの中の少なくとも一対のプロ
    セッサがチップ平面上の所定の直線軸または所定の原点
    に対して互いに対称関係を有する位置より相互に前記直
    線軸又は前記プロセッサ領域の対向する面と平行な方向
    に平行移動した位置に配置され、前記一対のプロセッサ
    に対する制御部が前記直線軸または原点を含む領域に配
    置され、当該制御部から双方のプロセッサまでの遅延時
    間が略等しいことを特徴とするオンチップマルチプロセ
    ッサ。
  10. 【請求項10】 独立に動作可能な複数のプロセッサを
    有し、前記複数のプロセッサの中の少なくとも一対のプ
    ロセッサがチップ平面上の所定の直線軸または所定の原
    点に対して互いに対称関係を有する位置より相互に前記
    直線軸又は前記プロセッサ領域の対向する面と平行な方
    向に平行移動した位置に配置され、前記一対のプロセッ
    サに対する制御部が、当該制御部から双方のプロセッサ
    までの遅延時間が略等しく、前記一対のプロセッサに前
    記制御部を介して接続される共用部が前記直線軸または
    原点を含んで配置されていることを特徴とするオンチッ
    プマルチプロセッサ。
  11. 【請求項11】 前記プロセッサが論理ユニットとキャ
    ッシュメモリとを有し、前記一対のプロセッサに関して
    同一機能で対を成す論理ユニット同士またはキャッシュ
    メモリ同士が前記直線軸または前記原点に対して互いに
    対称に配置されていることを特徴とする請求項1より請
    求項10のいずれかに記載のオンチップマルチプロセッ
    サ。
  12. 【請求項12】 前記論理ユニットと前記キャッシュメ
    モリがそれぞれ論理ブロックとメモリマットとを有し、
    前記一対のプロセッサに関して同一機能で対を成す論理
    ブロック同士またはメモリマット同士が前記直線軸また
    は前記原点に対して互いに対称に配置されていることを
    特徴とする請求項11に記載のオンチップマルチプロセ
    ッサ。
  13. 【請求項13】 前記論理ブロックと前記メモリマット
    がそれぞれ論理回路群とメモリ回路群とを有し、前記一
    対のプロセッサに関して同一機能で対を成す論理回路群
    同士またはメモリ回路群同士が前記直線軸または原点に
    対して互いに対称に配置されていることを特徴とする請
    求項11に記載のオンチップマルチプロセッサ。
  14. 【請求項14】 前記論理回路群と前記メモリ回路群が
    MOSトランジスタ回路から成り、前記回路群の内部の
    ソースとゲートとドレインの配列、またはpMOSとn
    MOSの配列が前記直線軸または原点に対して互いに対
    称であることを特徴とする請求項11に記載のオンチッ
    プマルチプロセッサ。
  15. 【請求項15】 前記一対のプロセッサにある少なくと
    も一部のMOSトランジスタが、1本のゲートと、ゲー
    トの片側に配されたソース及びドレインと、該ソース及
    びドレインに対してゲートのもう片側でそれぞれ向かい
    合うドレイン及びソースとを有し、または同じ信号が入
    力される2本のゲートと、該ゲートの間に挟まれた1つ
    のドレインと、ゲートの外側に配された2つのソースと
    を有することを特徴とする請求項14に記載のオンチッ
    プマルチプロセッサ。
  16. 【請求項16】 前記プロセッサがMOSトランジスタ
    回路から成り、前記一対のプロセッサがMOSトランジ
    スタのゲートに平行または垂直な直線軸に対してミラー
    対称、または前記原点に対して点対称であることを特徴
    とする請求項1より請求項10にのいずれかに記載のオ
    ンチップマルチプロセッサ。
  17. 【請求項17】 前記一対のプロセッサが前記論理ユニ
    ットのデータフロー方向に平行または垂直な直線軸に対
    して線対称、または前記原点に対して点対称であること
    を特徴とする請求項11に記載のオンチップマルチプロ
    セッサ。
  18. 【請求項18】 独立に動作可能な複数のプロセッサと
    その制御部を有し、プロセッサを構成する論理ユニット
    またはキャッシュメモリの一部が冗長二重化されおり、
    少なくとも一対のプロセッサに関して同一機能で対を成
    す論理ユニット同士またはキャッシュメモリ同士がチッ
    プ平面上の所定の第1の直線軸に対して互いに線対称に
    配置されており、前記一対のプロセッサに対する制御部
    が第1の直線軸を含む領域に配置され、該制御部から双
    方のプロセッサまでの距離が概ね等価であり、各々のプ
    ロセッサに含まれる二重化された論理ユニット同士また
    はキャッシュメモリ同士が所定の第2の直線軸に対して
    互いに線対称に配置されていることを特徴とするオンチ
    ップマルチプロセッサ。
  19. 【請求項19】 前記第1の直線軸と第2の直線軸が互
    いに直交していることを特徴とする請求項18に記載の
    オンチップマルチプロセッサ。
  20. 【請求項20】 前記プロセッサがMOSトランジスタ
    回路から成り、前記第1の直線軸がMOSトランジスタ
    のゲート幅方向に平行であり、前記第2の直線軸がゲー
    ト長方向に平行であることを特徴とする請求項18に記
    載のオンチップマルチプロセッサ。
  21. 【請求項21】 前記第1の直線軸が前記論理ユニット
    のデータフロー方向に垂直であり、前記第2の直線軸が
    データフロー方向に平行であることを特徴とする請求項
    18に記載のオンチップマルチプロセッサ。
  22. 【請求項22】 前記一対のプロセッサがキャッシュメ
    モリを共有しており、該共有キャッシュメモリと前記一
    対のプロセッサとの間の信号処理を調整する記憶制御ユ
    ニットが前記領域に配置されていることを特徴とする請
    求項1より請求項10にのいずれかに記載のオンチップ
    マルチプロセッサ。
  23. 【請求項23】 前記プロセッサが個別に1次キャッシ
    ュメモリを備え、複数のプロセッサで下位レベルのキャ
    ッシュメモリを共有していることを特徴とする請求項2
    2に記載のオンチップマルチプロセッサ。
  24. 【請求項24】 前記一対のプロセッサがI/O回路群
    を共用しており、該I/O回路群と前記一対のプロセッ
    サとの間の信号転送を調停するI/O制御ユニットが前
    記領域に配置されていることを特徴とする請求項1より
    請求項10のいずれかに記載のオンチップマルチプロセ
    ッサ。
  25. 【請求項25】 前記一対のプロセッサ、前記制御部、
    前記共用部に対して共通または独立にクロックを供給す
    るクロック生成回路部が前記領域に配置されていること
    を特徴とする請求項1より請求項10のいずれかに記載
    のオンチップマルチプロセッサ。
  26. 【請求項26】 前記一対のプロセッサ、前記制御部、
    前記共用部に対して共通または独立に給電を行なう電源
    制御回路部が前記領域に配置されていることを特徴とす
    る請求項1より請求項10のいずれかに記載のオンチッ
    プマルチプロセッサ。
  27. 【請求項27】 前記プロセッサが個別に1次キャッシ
    ュメモリとこれを制御する1次キャッシュ制御ユニット
    を備え、複数のプロセッサで下位レベルキャッシュメモ
    リをその制御ユニットを介して共有しており、前記一対
    のプロセッサにおいて1次キャッシュ制御ユニットが各
    々のプロセッサ領域の前記直線軸または原点に近い側の
    1辺に寄せて配置され、対を成す1次キャッシュ制御ユ
    ニット同士の間に下位レベルキャッシュ制御ユニットが
    配置されていることを特徴とする請求項1より請求項1
    0のいずれかに記載のオンチップマルチプロセッサ。
  28. 【請求項28】 前記プロセッサが個別に自身の入出力
    信号を制御する第1の制御ユニットを備え、複数のプロ
    セッサがI/O回路群を第2の制御ユニットを介して共
    用しており、前記一対のプロセッサにおいて第1の制御
    ユニットが各々のプロセッサ領域の前記直線軸または原
    点に近い側の1辺に寄せて配置され、対を成す第1の制
    御ユニット同士の間に第2の制御ユニットが配置されて
    いることを特徴とする請求項1より請求項10のいずれ
    かに記載のオンチップマルチプロセッサ。
  29. 【請求項29】 前記一対のプロセッサにクロックを分
    配するクロックツリーのパターンが前記直線軸または前
    記原点に対して互いに対称であることを特徴とする請求
    項1より請求項10のいずれかに記載のオンチップマル
    チプロセッサ。
  30. 【請求項30】 前記一対のプロセッサに給電する電源
    配線のパターンが前記直線軸または前記原点に対して互
    いに対称であることを特徴とする請求項1より請求項1
    0のいずれかに記載のオンチップマルチプロセッサ。
  31. 【請求項31】 前記プロセッサのI/Oピンがバンプ
    アレイから成り、前記一対のプロセッサの表面上に設け
    られたバンプの配列が前記直線軸または前記原点に対し
    て互いに対称であることを特徴とする請求項1より請求
    項10のいずれかに記載のオンチップマルチプロセッ
    サ。
  32. 【請求項32】 前記一対のプロセッサの一方が第1の
    半導体マスクパターンを用いて製造され、他方が第1の
    マスクパターンを対称変換した第2の半導体マスクパタ
    ーンを用いて製造されていることを特徴とする請求項1
    より請求項10のいずれかに記載のオンチップマルチプ
    ロセッサ。
  33. 【請求項33】 請求項1より請求項10のいずれかに
    記載のオンチップマルチプロセッサが実装され、且つ前
    記一対のプロセッサの一方に対する配線基板の第1の配
    線パターンと、他方に対する第2の配線パターンとが配
    線基板上の所定の直線軸または前記原点に対して互いに
    対称であることを特徴とする配線基板。
JP11221728A 1999-08-04 1999-08-04 オンチップマルチプロセッサ Withdrawn JP2001051957A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11221728A JP2001051957A (ja) 1999-08-04 1999-08-04 オンチップマルチプロセッサ
US10/832,446 US20040210738A1 (en) 1999-08-04 2004-04-27 On-chip multiprocessor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11221728A JP2001051957A (ja) 1999-08-04 1999-08-04 オンチップマルチプロセッサ

Publications (1)

Publication Number Publication Date
JP2001051957A true JP2001051957A (ja) 2001-02-23

Family

ID=16771338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11221728A Withdrawn JP2001051957A (ja) 1999-08-04 1999-08-04 オンチップマルチプロセッサ

Country Status (2)

Country Link
US (1) US20040210738A1 (ja)
JP (1) JP2001051957A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193838A (ja) * 2007-04-02 2007-08-02 Ricoh Co Ltd Simd型マイクロプロセッサ
WO2007096984A1 (ja) * 2006-02-24 2007-08-30 Fujitsu Limited バッファ装置、バッファ配置方法および情報処理装置
WO2008120393A1 (ja) * 2007-03-29 2008-10-09 Fujitsu Limited 情報処理装置、情報処理装置設計方法、情報処理装置設計プログラム
US7676669B2 (en) 2004-06-15 2010-03-09 Fujitsu Limited Multi-core processor control method
JP2022140387A (ja) * 2021-03-10 2022-09-26 インベンション アンド コラボレーション ラボラトリー プライベート リミテッド 単一半導体ダイにおけるモノリシック集積および/または不均一集積の最適化のための統合スケーリングおよびストレッチングプラットフォーム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7996843B2 (en) 1999-08-25 2011-08-09 Qnx Software Systems Gmbh & Co. Kg Symmetric multi-processor system
US7350117B2 (en) * 2004-10-05 2008-03-25 International Business Machines Corporation Management of microcode lock in a shared computing resource
US7570844B2 (en) * 2005-01-18 2009-08-04 Doron Handelman Photonic integrated circuit device and elements thereof
US8732368B1 (en) * 2005-02-17 2014-05-20 Hewlett-Packard Development Company, L.P. Control system for resource selection between or among conjoined-cores
KR100736902B1 (ko) * 2005-06-23 2007-07-10 엠텍비젼 주식회사 복수의 프로세서에 의한 메모리 공유 방법 및 장치
US20070150658A1 (en) * 2005-12-28 2007-06-28 Jaideep Moses Pinning locks in shared cache
US7917730B2 (en) * 2008-04-01 2011-03-29 International Business Machines Corporation Processor chip with multiple computing elements and external i/o interfaces connected to perpendicular interconnection trunks communicating coherency signals via intersection bus controller
US7865650B2 (en) * 2008-04-01 2011-01-04 International Business Machines Corporation Processor with coherent bus controller at perpendicularly intersecting axial bus layout for communication among SMP compute elements and off-chip I/O elements
US8120938B2 (en) * 2008-04-18 2012-02-21 Vns Portfolio Llc Method and apparatus for arranging multiple processors on a semiconductor chip
US10395748B2 (en) * 2016-06-15 2019-08-27 Micron Technology, Inc. Shared error detection and correction memory

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8002787A (nl) * 1980-05-14 1981-12-16 Philips Nv Multiprocessor-rekenmachinesysteem voor het uitvoeren van een recursief algorithme.
US4773038A (en) * 1986-02-24 1988-09-20 Thinking Machines Corporation Method of simulating additional processors in a SIMD parallel processor array
US4910669A (en) * 1987-04-03 1990-03-20 At&T Bell Laboratories Binary tree multiprocessor
US5339396A (en) * 1987-11-18 1994-08-16 Hitachi, Ltd. Interconnection network and crossbar switch for the same
JPH01278041A (ja) * 1988-04-30 1989-11-08 Hitachi Ltd 半導体集積回路装置
US5083265A (en) * 1990-04-17 1992-01-21 President And Fellows Of Harvard College Bulk-synchronous parallel computer
JP3479538B2 (ja) * 1991-12-26 2003-12-15 テキサス インスツルメンツ インコーポレイテツド 半導体集積回路を製作する方法
US5833945A (en) * 1992-09-30 1998-11-10 Sakuma; Moto Animal model of pathological behavior
JPH07134395A (ja) * 1993-04-22 1995-05-23 Samsung Electron Co Ltd マスクパターン及びこれを使用した微細パターンの形成方法
US5600822A (en) * 1994-04-05 1997-02-04 International Business Machines Corporation Resource allocation synchronization in a parallel processing system
US5645516A (en) * 1994-06-15 1997-07-08 Foster; Betty J. Therapeutic lower extremity exerciser and foot rest
JPH08212185A (ja) * 1995-01-31 1996-08-20 Mitsubishi Electric Corp マイクロコンピュータ
US5742180A (en) * 1995-02-10 1998-04-21 Massachusetts Institute Of Technology Dynamically programmable gate array with multiple contexts
US5998270A (en) * 1997-05-15 1999-12-07 Advanced Micro Devices Formation of oxynitride and polysilicon layers in a single reaction chamber

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676669B2 (en) 2004-06-15 2010-03-09 Fujitsu Limited Multi-core processor control method
WO2007096984A1 (ja) * 2006-02-24 2007-08-30 Fujitsu Limited バッファ装置、バッファ配置方法および情報処理装置
US7865635B2 (en) 2006-02-24 2011-01-04 Fujitsu Limited Buffer device, buffer arrangement method, and information processing apparatus
WO2008120393A1 (ja) * 2007-03-29 2008-10-09 Fujitsu Limited 情報処理装置、情報処理装置設計方法、情報処理装置設計プログラム
JP4894915B2 (ja) * 2007-03-29 2012-03-14 富士通株式会社 情報処理装置設計方法、情報処理装置設計プログラム
US8799684B2 (en) 2007-03-29 2014-08-05 Fujitsu Limited Apparatus, method and process to determine a threshold voltage so that leakage power of a plurality of transistors is inversely proportional to a plurality of processor cores
JP2007193838A (ja) * 2007-04-02 2007-08-02 Ricoh Co Ltd Simd型マイクロプロセッサ
JP4537420B2 (ja) * 2007-04-02 2010-09-01 株式会社リコー Simd型マイクロプロセッサ
JP2022140387A (ja) * 2021-03-10 2022-09-26 インベンション アンド コラボレーション ラボラトリー プライベート リミテッド 単一半導体ダイにおけるモノリシック集積および/または不均一集積の最適化のための統合スケーリングおよびストレッチングプラットフォーム

Also Published As

Publication number Publication date
US20040210738A1 (en) 2004-10-21

Similar Documents

Publication Publication Date Title
Riedlinger et al. A 32 nm, 3.1 billion transistor, 12 wide issue itanium® processor for mission-critical servers
Leon et al. A power-efficient high-throughput 32-thread SPARC processor
JP2001051957A (ja) オンチップマルチプロセッサ
Xie et al. Design space exploration for 3D architectures
Pham et al. Overview of the architecture, circuit design, and physical implementation of a first-generation cell processor
US5734921A (en) Advanced parallel array processor computer package
JP2938424B2 (ja) レイアウト・コンパイル方法および設計システム
US8386690B2 (en) On-chip networks for flexible three-dimensional chip integration
Heald et al. A third-generation SPARC V9 64-b microprocessor
Fick et al. Centip3De: A cluster-based NTC architecture with 64 ARM Cortex-M3 cores in 3D stacked 130 nm CMOS
US5588152A (en) Advanced parallel processor including advanced support hardware
US5765011A (en) Parallel processing system having a synchronous SIMD processing with processing elements emulating SIMD operation using individual instruction streams
US5625836A (en) SIMD/MIMD processing memory element (PME)
KR20150132371A (ko) 집적 회로의 상이한 티어들상에 판독/기록 포트들 및 액세스 로직을 가진 3차원(3d) 메모리 셀
US11934313B2 (en) Scalable system on a chip
Mounce et al. Chiplet based approach for heterogeneous processing and packaging architectures
Thorolfsson et al. Design automation for a 3DIC FFT processor for synthetic aperture radar: A case study
US11239227B2 (en) Semiconductor devices, methods of designing layouts of semiconductor devices and methods of fabricating semiconductor devices
Youn et al. On implementing large binary tree architectures in VLSI and WSI
Konstadinidis et al. Architecture and physical implementation of a third generation 65 nm, 16 core, 32 thread chip-multithreading sparc processor
Kakoee et al. A resilient architecture for low latency communication in shared-L1 processor clusters
Wendel et al. IBM POWER7 processor circuit design
EP4398114A2 (en) Scalable system on a chip
US20230280906A1 (en) Memory organization for multi-mode support
EP4398115A2 (en) Scalable system on a chip

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060801

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060801

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20080116