JP2003316749A - 分散型のリンク・モジュール - Google Patents
分散型のリンク・モジュールInfo
- Publication number
- JP2003316749A JP2003316749A JP2003079913A JP2003079913A JP2003316749A JP 2003316749 A JP2003316749 A JP 2003316749A JP 2003079913 A JP2003079913 A JP 2003079913A JP 2003079913 A JP2003079913 A JP 2003079913A JP 2003316749 A JP2003316749 A JP 2003316749A
- Authority
- JP
- Japan
- Prior art keywords
- central processing
- link
- link module
- processing unit
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000011084 recovery Methods 0.000 claims abstract description 7
- 230000008439 repair process Effects 0.000 description 16
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003090 exacerbative effect Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7828—Architectures of general purpose stored program computers comprising a single central processing unit without memory
- G06F15/7832—Architectures of general purpose stored program computers comprising a single central processing unit without memory on one IC chip (single chip microprocessors)
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03L—AUTOMATIC CONTROL, STARTING, SYNCHRONISATION OR STABILISATION OF GENERATORS OF ELECTRONIC OSCILLATIONS OR PULSES
- H03L7/00—Automatic control of frequency or phase; Synchronisation
- H03L7/06—Automatic control of frequency or phase; Synchronisation using a reference signal applied to a frequency- or phase-locked loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04J—MULTIPLEX COMMUNICATION
- H04J3/00—Time-division multiplex systems
- H04J3/02—Details
- H04J3/06—Synchronising arrangements
- H04J3/0635—Clock or time synchronisation in a network
- H04J3/0685—Clock or time synchronisation in a node; Intranode synchronisation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Dram (AREA)
- Bus Control (AREA)
- Microcomputers (AREA)
- Information Transfer Systems (AREA)
Abstract
(57)【要約】
【課題】分散型のリンク・モジュールを提供すること。
【解決手段】リンク・モジュール・アーキテクチャ48
が、クロスバースイッチ52を有するマルチコア中央演
算装置を伴った使用のために公開される。リンク・モジ
ュール・アーキテクチャ48は、中央演算装置に動作可
能に結合されたタイミング修復回路58を含み、前記タ
イミング修復回路はクロスバースイッチ52の近くに配
置される。リンク・モジュールは、中央演算装置に動作
可能に接続されたビット・レシーバとビット出力ドライ
バをさらに含む。ビット・レシーバは、好ましくは広帯
域幅増幅器を含み、ビットドライバは好ましくは広大な
オンチップRAM54と一体化する。
が、クロスバースイッチ52を有するマルチコア中央演
算装置を伴った使用のために公開される。リンク・モジ
ュール・アーキテクチャ48は、中央演算装置に動作可
能に結合されたタイミング修復回路58を含み、前記タ
イミング修復回路はクロスバースイッチ52の近くに配
置される。リンク・モジュールは、中央演算装置に動作
可能に接続されたビット・レシーバとビット出力ドライ
バをさらに含む。ビット・レシーバは、好ましくは広帯
域幅増幅器を含み、ビットドライバは好ましくは広大な
オンチップRAM54と一体化する。
Description
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に、マルチコ
ア中央処理装置(multi−core centra
l processing unit)に関し、詳細に
は、中央処理装置のリンク・レイアウト・アーキテクチ
ャに関する。 【0002】 【従来の技術】新しいコンピュータ・アーキテクチャ、
特にマルチプロセッサ技術を利用するアーキテクチャ
は、高速シリアル二点間リンク相互接続ストラテジを使
用している。そのようなリンクは、一般に、高周波(2
GHzを超える)信号を有し、この信号は、伝送媒体
(プリント回路基板とコネクタ)における損失によっ
て、送り先チップの入力で受け取られる信号が小さくな
る。そのような小さい振幅の信号は、通常、リンクの信
頼性を高めかつリンクの同相雑音からの影響を小さくす
るために差動的に送られる。また、リンク・モジュール
は、一般に、双方向モードに動作する1〜20ビットの
データからなる。リンク・モジュールは、また、一般
に、タイミング修復回路(多重フェーズ・ロック・ルー
プ)と電圧復元回路(積分レシーバ(integrating rece
iver))を含む。このアーキテクチャは、多くの利点を
有する。 【0003】そのような利点の中でも特に、このアーキ
テクチャは、大きいマルチコア・マルチリンク中央処理
装置のチップ設計図を単純化する。そのような利点に
は、さらに、リンク・タイミング修復の集中化と、リン
クとクロス・バーの同期の単純化がある。このアーキテ
クチャのさらに他の利点には、クロック生成に必要なフ
ェーズ・ロック・ループが少ないこと、クロスバー・ス
イッチ、リンクおよびコア・クロック生成の共用があ
る。しかしながら、このアーキテクチャの詳細は、少な
くとも部分的には高速リンク要件によって決定される。 【0004】そのような高速リンクの不可欠な信号要件
は、感度の高いアナログ・レシーバおよびトランスミッ
タ回路と、感度の高いタイミング修復ブロックを必要と
する。そのようなアナログ・ブロックの配置とグループ
化は、いくつかの問題による制約を受ける。そのような
問題には、次のようなものがある。 【0005】共通アナログ電源 共通外部参照構成要素(common external reference co
mponents) C4バンプ密度、パッケージ経路密度およびピン密度の
問題 クロックとデータのスキュー 例えばクロスバー・スイッチのような他のオンチップ入
力出力モジュールに対するリンク・レシーバおよびトラ
ンスミッタの配置 オンチップ経路および経路伝播遅延 広大なオンチップ・キャッシュ・ランダム・アクセス・
メモリ内における配置 これらの問題は、高性能なリンク・ベース中央処理装置
の特性によって大きくなる。 【0006】高性能マルチコア中央処理装置は、アナロ
グ・ブロックの配置とグループ化を制約する問題を大き
くするという特徴を有する。例えば、大量のオンチップ
・キャッシュ・ランダム・アクセス・メモリを有する高
性能マルチコア中央処理装置は、ダイ・サイズが大きく
なる。そのような高性能な中央処理装置は、また、多数
の高速リンクと、多数の外部コア電子部品の必要なしに
より大きなマルチプロセッサ・コンピュータ・システム
の構築を可能にするためにオンチップ・クロス・バー・
スイッチとを有する。リンクが6つ以上ある大きいダイ
・サイズの中央処理装置は、高速リンクのレイアウトを
悪化させる。 【0007】図1は、6つの高速リンク・モジュール1
2、クロスバー・スイッチ14、および大きなオンチッ
プ・キャッシュ・ランダム・アクセス・メモリ16を備
えたデュアル・コア中央処理装置10の代表的なレイア
ウト方式を示す。既存のリンク・レイアウト・アーキテ
クチャによれば、キャッシュ・ランダム・アクセス・メ
モリの制約内にC4バンプ、パッケージ経路および共存
を適合させるために、個々のリンク・モジュール12は
それぞれ、ダイの縁に配置される。リンク・モジュール
がそのような細長い長方形の幾何学形状で配列されると
きにできる大きい距離のために、各リンク・モジュール
は、それ自体のフェーズ・ロック・ループ(IO−PL
L)18を含む。このIO−PLL18は、入ってくる
小さいアナログ信号をタイミング変更(retime)するた
めに必要なローカル・クロック・フェーズを生成し、タ
イミング・ジッタとルーティング・スキューの問題を最
小にするためにリンク・レシーバのすぐ近くに配置され
なければならない。IO−PLL18のクロック・フェ
ーズは、各リンクのすべての個々のビットの間で共用さ
れる。 【0008】中央処理装置1つ当たりのリンクの数が多
いため、リンクをダイの複数の辺に配置しなければなら
ない。また、タイミングと同期の問題を軽減するため
に、クロスバー・スイッチ14は、すべてのリンク・モ
ジュール12の近くにする必要がある。したがって、ク
ロスバー・スイッチ14は、中央処理装置コア22の配
置によって表されている中央部分の2つの中央処理装置
コア22の間にある。また、クロスバー・スイッチ14
は、システム・フェーズ・ロック・ループ(SYS−P
LL)20の隣りにある。SYS−PLL22は、2つ
のコア22とクロスバー・スイッチ14のタイミングを
生成する。 【0009】このリンク12およびコア22のレイアウ
ト・アーキテクチャは、多数の別々のフェーズ・ロック
・ループ回路を有する。全部で7つのフェーズ・ロック
・ループ回路があり、これらのフェーズ・ロック・ルー
プはそれぞれ、外部のグローバル・クロックによって駆
動される。このアーキテクチャは、クロスバー・スイッ
チ14からダイの縁にあるリンク・モジュール12まで
ダイ全体にわたるタイミング遅延と同期の問題を有す
る。 【0010】リンク・モジュール12は、リンク・モジ
ュール12にありかつレシーバのC4バンプの近くにあ
るデータを修復しかつタイミング変更する。しかしなが
ら、各リンク・モジュール12が細長い長方形であるた
め、個別のビットを組み合わせてリンクが受け取ったデ
ータのバスを構成するときに、余分なタイミング・スキ
ューが生じる。 【0011】図2に、従来のリンク・モジュールの電気
ブロック図24を示す。このリンク・モジュールは、レ
シーバと出力ドライバの両方を含む。各ビットの出力ド
ライバ26は、出力レベル・プリエンファシス段28を
備えたソース終端差動ドライバからなる。出力プリエン
ファシス段28は、IO−PLL30の位相を使用し
て、出力信号を遅延させ、レベル強調または軽減が必要
かどうかを決定する。 【0012】リンク・モジュールにおける各ビットは、
ストローブ・サンプラかまたは積分レシーバ増幅器32
を利用する。また、リンク・モジュールのタイミング修
復部分は、1ビットずつ実行される。IO−PLL30
は、入ってくるビット・レートで四相出力クロックを生
成する。各ビットは、最高条件のストローブを推定する
ために起動期間中に仕込まれる補間回路ブロック34を
抑制し、またこのストローブは、ラッチ構成要素36に
よって積分レシーバ増幅器32の出力をラッチするため
に使用される。デスキュー回路(deskew cir
cuitry)38は、最終的なバスの結果を生成する
ために、レシーバの出力において個々のビットを位置合
わせする。 【0013】リンク・レイヤ制御ブロック40は、リン
ク電気レイヤとリンク・プロトコル・レイヤとクロスバ
ー・スイッチ42を結合する他のリンク制御機能とバッ
ファリング機能を実行する。 【0014】この方法の通信経路44と通信経路46は
長く、タイミングとスキューの問題が生じる。これらの
経路は、データが、システム・クロックと同期して転送
されるクロスバー・スイッチ42とリンク・レイヤ制御
モジュール40の間にある。経路44と46の全体にわ
たるクロック・スキューの管理は、難しい問題である。 【0015】 【発明が解決しようとする課題】したがって、以上の問
題を解決する必要が残っている。本発明は、そのような
解決策を提供する。 【0016】 【課題を解決するための手段】第1の態様において、本
発明は、クロスバー・スイッチを有するマルチコア中央
処理装置と共に使用するためのリンク・モジュールであ
る。このリンク・モジュールは、中央処理装置に動作可
能に結合されたタイミング修復回路を含み、このタイミ
ング修復回路は、クロスバー・スイッチの近くに配置さ
れる。リンク・モジュールは、さらに、中央処理装置に
動作可能に結合されたビット・レシーバと、中央処理装
置に動作可能に結合されたビット出力ドライバとを含
む。 【0017】もう1つの態様において、本発明は、ダイ
の中央領域の近くに配置されかつ広大なキャッシュ・ラ
ンダム・アクセス・メモリによって囲まれた複数のコア
中央処理装置を有するダイを構成するリンク・ベース中
央処理装置である。この中央領域に、クロスバー・スイ
ッチ、システム・フェーズ・ロック・ループおよびリン
ク・タイミング修復回路がすべて配置されている。複数
のビット・レシーバとビット出力ドライバの対が、広大
なキャッシュ・ランダム・アクセス・メモリ内の中央領
域から遠くに配置される。 【0018】本発明の適用性のさらに他の部分は、以下
に示す詳細な説明から明らかになるであろう。詳細な説
明と特定の例は、本発明の好ましい実施形態を示すが、
単に例示のためのものであり、本発明の適用範囲を限定
するものではないことを理解されたい。 【0019】本発明は、詳細な説明と添付図面からさら
に十分に理解されよう。 【0020】 【発明の実施の形態】好ましい実施形態の以下の説明
は、本質的に単に例示であり、本発明とその応用例およ
び用途を限定するものではない。 【0021】図3を参照して、本発明によるリンク・レ
イアウト・アーキテクチャ48を示す。この方式では、
ビット・レシーバとビット出力ドライバ50(そのプリ
エンファシス回路と共に)だけが、クロスバー・スイッ
チ52から遠くに配置されている。すべてのリンクの残
りのリンク・モジュール回路は、クロスバー・スイッチ
52の近くに配置される。このリモート・リンク回路
は、既存の方法よりはるかに小さいため、この回路を、
広大なキャッシュ・ランダム・アクセス・メモリ54に
容易に一体化することができる。図3に示したように、
ビット・レシーバとビット出力ドライバ50は、4つの
領域にグループ化される。しかしながら、このようなリ
モート・アナログ領域を配置する場所に関する大きな制
約は、C4とパッケージの制約以外にはないので、さら
に多数の領域が可能である。したがって、C4バンプと
パッケージの配置において、これらのリモート・アナロ
グ領域を、より小さくかつ制約がないように最適化する
ことができる。 【0022】このアーキテクチャ48の特徴は、ダイの
中心にあるクロスバー/リンク・ロジックとリモート・
アナログ回路との間のリモート通信が、ディジタル非同
期であることである。リモート・ディジタル非同期信号
は、タイミングとスキューを犠牲にすることなくダイ全
体にわたって転送しかつバッファすることができる。 【0023】タイミング修復、デスキューおよびバス・
アセンブリはすべて、ダイの1つの領域で実行される。
この集中化によって、フェーズ・ロック・ループの数を
1つに減らすことができる。言い換えると、SYS−P
LL56がクロスバー・スイッチ52とリンク・モジュ
ール・タイミング修復回路58のすぐ近くにあるので、
SYS−PLL56を使用して、タイミング修復のため
にすべてのクロック・フェーズを供給することができ
る。これにより、リンクとクロスバー・スイッチ52と
の間の同期が単純になる。 【0024】この構成により、入力レシーバと出力ドラ
イバを、対称的でかつC4バンプ対の下になるように位
置決めすることができ、それにより性能が最適化され、
同相雑音の影響を受けにくくなる。 【0025】図4を参照して、本発明によるリンク・モ
ジュールの電気的アーキテクチャ60を示す。この電気
システムでは、電圧情報を再構成するために、積分増幅
器が、広帯域幅増幅器62と置き換えられている。この
増幅器の有限の利得帯域幅積によって、その機能は、本
来、積分増幅器と同じであり、再設定する必要がない。
この方式は、また、今日の最新型高速集積回路プロセス
の高い利得帯域幅を活用して、負荷終端差動増幅器が、
入ってきた小さいアナログ信号を再生し、かつレール間
ディジタル出力信号を生成できるようにする。以上のよ
うに、このとき、受け取った信号は、その電圧レベルが
修復されており、その信号を、経路64を介してクロス
バー・スイッチ66および残りのリンク・ブロックに送
って、タイミングのスキューをなくすことができる。ダ
イを横切るときに増幅信号に生じる追加の雑音またはタ
イミング・ジッター(アクティブ・リピータによる)
は、クロスバー・スイッチ66にあるタイミング修復回
路によって除去される。 【0026】すべてのリモート信号と非同期信号は、ダ
イ上の1つの領域に集中する。この領域は、SYS−P
LL76、残りのリンク・モジュール・ブロック、およ
びクロスバー・スイッチ66を含む。入ってくる信号
は、多重フェーズ出力SYS−PLL76を使用してタ
イミング変更される。受け取った信号は、本質的にディ
ジタルであるため、この新しい方式は、1つのディジタ
ル補間回路78を使用してストローブ・ポイントを決定
するのに向いており、リタイマ要素は、単純なD型フリ
ップフロップでよい。この発明は、例として次のような
実施形態を含む。 【0027】(1)クロスバー・スイッチを有するマル
チコア中央処理装置と共に使用するリンク・モジュール
であって、前記マルチコア中央処理装置に動作可能に結
合されており、クロスバー・スイッチの近くに配置され
たタイミング修復回路と、前記マルチコア中央処理装置
に動作可能に結合されたビット・レシーバと、前記マル
チコア中央処理装置に動作可能に結合されたビット出力
ドライバと、を含むリンク・モジュール。 【0028】(2)前記ビット・レシーバが、広帯域幅
増幅器を含む(1)に記載のリンク・モジュール。 【0029】(3)前記ビット出力ドライバが、出力レ
ベル・プリエンファシス回路を有するソース終端差動ド
ライバを含む(1)に記載のリンク・モジュール。 【0030】(4)前記タイミング修復回路が、システ
ム・フェーズ・ロック・ループを含み、前記システム・
フェーズ・ロック・ループが、前記出力ドライバにクロ
ック出力を提供する(1)に記載のリンク・モジュー
ル。 【0031】(5)前記タイミング修復回路が、リンク
・レイヤ制御ブロックと、デスキュー回路(deske
w circuitry)と、ラッチと、を含む(1)
に記載のリンク・モジュール。 【0032】(6)前記マルチコア中央処理装置が、広
大なランダム・アクセス・メモリを有し、前記ビット・
レシーバと前記ビット出力ドライバが、前記広大なラン
ダム・アクセス・メモリと一体化された(1)に記載の
リンク・モジュール。 【0033】(7)クロスバー・スイッチを有するリン
ク・ベースのマルチコア中央処理装置においてビットを
経路指定する方法であって、前記マルチコア中央処理装
置の第1のリンク・モジュールの第1のビット・レシー
バにおいて第1のビットを受け取るステップと、前記マ
ルチコア中央処理装置の第2のリンク・モジュールの第
2のビット・レシーバにおいて第2のビットを受け取る
ステップと、前記クロスバー・スイッチの近くに配置さ
れた第1のタイミング修復回路と第2のタイミング修復
回路に前記第1のビットと前記第2のビットを経路指定
するステップと、を含む方法。 【0034】(8)前記第1のビットを受け取るステッ
プが、広帯域幅増幅器において前記第1のビットを受け
取るステップを含む(7)に記載の方法。 【0035】(9)前記タイミング修復回路のリンク・
レイヤ制御ブロックから前記第1のリンク・モジュール
の出力ドライバのプリエンファシス回路に第3のビット
を経路指定するステップと、前記第1のタイミング修復
回路のシステムフェーズ・ロック・ループから前記プリ
エンファシス回路にクロック信号を経路指定するステッ
プと、をさらに含み、前記第3のビットと前記クロック
信号がマッチ(match)する(7)に記載の方法。 【0036】(10)システム・フェーズ・ロック・ル
ープに基づいて前記第1のビットと前記第2のビットの
タイミング修復を実行するステップをさらに含む(7)
に記載の方法。
ア中央処理装置(multi−core centra
l processing unit)に関し、詳細に
は、中央処理装置のリンク・レイアウト・アーキテクチ
ャに関する。 【0002】 【従来の技術】新しいコンピュータ・アーキテクチャ、
特にマルチプロセッサ技術を利用するアーキテクチャ
は、高速シリアル二点間リンク相互接続ストラテジを使
用している。そのようなリンクは、一般に、高周波(2
GHzを超える)信号を有し、この信号は、伝送媒体
(プリント回路基板とコネクタ)における損失によっ
て、送り先チップの入力で受け取られる信号が小さくな
る。そのような小さい振幅の信号は、通常、リンクの信
頼性を高めかつリンクの同相雑音からの影響を小さくす
るために差動的に送られる。また、リンク・モジュール
は、一般に、双方向モードに動作する1〜20ビットの
データからなる。リンク・モジュールは、また、一般
に、タイミング修復回路(多重フェーズ・ロック・ルー
プ)と電圧復元回路(積分レシーバ(integrating rece
iver))を含む。このアーキテクチャは、多くの利点を
有する。 【0003】そのような利点の中でも特に、このアーキ
テクチャは、大きいマルチコア・マルチリンク中央処理
装置のチップ設計図を単純化する。そのような利点に
は、さらに、リンク・タイミング修復の集中化と、リン
クとクロス・バーの同期の単純化がある。このアーキテ
クチャのさらに他の利点には、クロック生成に必要なフ
ェーズ・ロック・ループが少ないこと、クロスバー・ス
イッチ、リンクおよびコア・クロック生成の共用があ
る。しかしながら、このアーキテクチャの詳細は、少な
くとも部分的には高速リンク要件によって決定される。 【0004】そのような高速リンクの不可欠な信号要件
は、感度の高いアナログ・レシーバおよびトランスミッ
タ回路と、感度の高いタイミング修復ブロックを必要と
する。そのようなアナログ・ブロックの配置とグループ
化は、いくつかの問題による制約を受ける。そのような
問題には、次のようなものがある。 【0005】共通アナログ電源 共通外部参照構成要素(common external reference co
mponents) C4バンプ密度、パッケージ経路密度およびピン密度の
問題 クロックとデータのスキュー 例えばクロスバー・スイッチのような他のオンチップ入
力出力モジュールに対するリンク・レシーバおよびトラ
ンスミッタの配置 オンチップ経路および経路伝播遅延 広大なオンチップ・キャッシュ・ランダム・アクセス・
メモリ内における配置 これらの問題は、高性能なリンク・ベース中央処理装置
の特性によって大きくなる。 【0006】高性能マルチコア中央処理装置は、アナロ
グ・ブロックの配置とグループ化を制約する問題を大き
くするという特徴を有する。例えば、大量のオンチップ
・キャッシュ・ランダム・アクセス・メモリを有する高
性能マルチコア中央処理装置は、ダイ・サイズが大きく
なる。そのような高性能な中央処理装置は、また、多数
の高速リンクと、多数の外部コア電子部品の必要なしに
より大きなマルチプロセッサ・コンピュータ・システム
の構築を可能にするためにオンチップ・クロス・バー・
スイッチとを有する。リンクが6つ以上ある大きいダイ
・サイズの中央処理装置は、高速リンクのレイアウトを
悪化させる。 【0007】図1は、6つの高速リンク・モジュール1
2、クロスバー・スイッチ14、および大きなオンチッ
プ・キャッシュ・ランダム・アクセス・メモリ16を備
えたデュアル・コア中央処理装置10の代表的なレイア
ウト方式を示す。既存のリンク・レイアウト・アーキテ
クチャによれば、キャッシュ・ランダム・アクセス・メ
モリの制約内にC4バンプ、パッケージ経路および共存
を適合させるために、個々のリンク・モジュール12は
それぞれ、ダイの縁に配置される。リンク・モジュール
がそのような細長い長方形の幾何学形状で配列されると
きにできる大きい距離のために、各リンク・モジュール
は、それ自体のフェーズ・ロック・ループ(IO−PL
L)18を含む。このIO−PLL18は、入ってくる
小さいアナログ信号をタイミング変更(retime)するた
めに必要なローカル・クロック・フェーズを生成し、タ
イミング・ジッタとルーティング・スキューの問題を最
小にするためにリンク・レシーバのすぐ近くに配置され
なければならない。IO−PLL18のクロック・フェ
ーズは、各リンクのすべての個々のビットの間で共用さ
れる。 【0008】中央処理装置1つ当たりのリンクの数が多
いため、リンクをダイの複数の辺に配置しなければなら
ない。また、タイミングと同期の問題を軽減するため
に、クロスバー・スイッチ14は、すべてのリンク・モ
ジュール12の近くにする必要がある。したがって、ク
ロスバー・スイッチ14は、中央処理装置コア22の配
置によって表されている中央部分の2つの中央処理装置
コア22の間にある。また、クロスバー・スイッチ14
は、システム・フェーズ・ロック・ループ(SYS−P
LL)20の隣りにある。SYS−PLL22は、2つ
のコア22とクロスバー・スイッチ14のタイミングを
生成する。 【0009】このリンク12およびコア22のレイアウ
ト・アーキテクチャは、多数の別々のフェーズ・ロック
・ループ回路を有する。全部で7つのフェーズ・ロック
・ループ回路があり、これらのフェーズ・ロック・ルー
プはそれぞれ、外部のグローバル・クロックによって駆
動される。このアーキテクチャは、クロスバー・スイッ
チ14からダイの縁にあるリンク・モジュール12まで
ダイ全体にわたるタイミング遅延と同期の問題を有す
る。 【0010】リンク・モジュール12は、リンク・モジ
ュール12にありかつレシーバのC4バンプの近くにあ
るデータを修復しかつタイミング変更する。しかしなが
ら、各リンク・モジュール12が細長い長方形であるた
め、個別のビットを組み合わせてリンクが受け取ったデ
ータのバスを構成するときに、余分なタイミング・スキ
ューが生じる。 【0011】図2に、従来のリンク・モジュールの電気
ブロック図24を示す。このリンク・モジュールは、レ
シーバと出力ドライバの両方を含む。各ビットの出力ド
ライバ26は、出力レベル・プリエンファシス段28を
備えたソース終端差動ドライバからなる。出力プリエン
ファシス段28は、IO−PLL30の位相を使用し
て、出力信号を遅延させ、レベル強調または軽減が必要
かどうかを決定する。 【0012】リンク・モジュールにおける各ビットは、
ストローブ・サンプラかまたは積分レシーバ増幅器32
を利用する。また、リンク・モジュールのタイミング修
復部分は、1ビットずつ実行される。IO−PLL30
は、入ってくるビット・レートで四相出力クロックを生
成する。各ビットは、最高条件のストローブを推定する
ために起動期間中に仕込まれる補間回路ブロック34を
抑制し、またこのストローブは、ラッチ構成要素36に
よって積分レシーバ増幅器32の出力をラッチするため
に使用される。デスキュー回路(deskew cir
cuitry)38は、最終的なバスの結果を生成する
ために、レシーバの出力において個々のビットを位置合
わせする。 【0013】リンク・レイヤ制御ブロック40は、リン
ク電気レイヤとリンク・プロトコル・レイヤとクロスバ
ー・スイッチ42を結合する他のリンク制御機能とバッ
ファリング機能を実行する。 【0014】この方法の通信経路44と通信経路46は
長く、タイミングとスキューの問題が生じる。これらの
経路は、データが、システム・クロックと同期して転送
されるクロスバー・スイッチ42とリンク・レイヤ制御
モジュール40の間にある。経路44と46の全体にわ
たるクロック・スキューの管理は、難しい問題である。 【0015】 【発明が解決しようとする課題】したがって、以上の問
題を解決する必要が残っている。本発明は、そのような
解決策を提供する。 【0016】 【課題を解決するための手段】第1の態様において、本
発明は、クロスバー・スイッチを有するマルチコア中央
処理装置と共に使用するためのリンク・モジュールであ
る。このリンク・モジュールは、中央処理装置に動作可
能に結合されたタイミング修復回路を含み、このタイミ
ング修復回路は、クロスバー・スイッチの近くに配置さ
れる。リンク・モジュールは、さらに、中央処理装置に
動作可能に結合されたビット・レシーバと、中央処理装
置に動作可能に結合されたビット出力ドライバとを含
む。 【0017】もう1つの態様において、本発明は、ダイ
の中央領域の近くに配置されかつ広大なキャッシュ・ラ
ンダム・アクセス・メモリによって囲まれた複数のコア
中央処理装置を有するダイを構成するリンク・ベース中
央処理装置である。この中央領域に、クロスバー・スイ
ッチ、システム・フェーズ・ロック・ループおよびリン
ク・タイミング修復回路がすべて配置されている。複数
のビット・レシーバとビット出力ドライバの対が、広大
なキャッシュ・ランダム・アクセス・メモリ内の中央領
域から遠くに配置される。 【0018】本発明の適用性のさらに他の部分は、以下
に示す詳細な説明から明らかになるであろう。詳細な説
明と特定の例は、本発明の好ましい実施形態を示すが、
単に例示のためのものであり、本発明の適用範囲を限定
するものではないことを理解されたい。 【0019】本発明は、詳細な説明と添付図面からさら
に十分に理解されよう。 【0020】 【発明の実施の形態】好ましい実施形態の以下の説明
は、本質的に単に例示であり、本発明とその応用例およ
び用途を限定するものではない。 【0021】図3を参照して、本発明によるリンク・レ
イアウト・アーキテクチャ48を示す。この方式では、
ビット・レシーバとビット出力ドライバ50(そのプリ
エンファシス回路と共に)だけが、クロスバー・スイッ
チ52から遠くに配置されている。すべてのリンクの残
りのリンク・モジュール回路は、クロスバー・スイッチ
52の近くに配置される。このリモート・リンク回路
は、既存の方法よりはるかに小さいため、この回路を、
広大なキャッシュ・ランダム・アクセス・メモリ54に
容易に一体化することができる。図3に示したように、
ビット・レシーバとビット出力ドライバ50は、4つの
領域にグループ化される。しかしながら、このようなリ
モート・アナログ領域を配置する場所に関する大きな制
約は、C4とパッケージの制約以外にはないので、さら
に多数の領域が可能である。したがって、C4バンプと
パッケージの配置において、これらのリモート・アナロ
グ領域を、より小さくかつ制約がないように最適化する
ことができる。 【0022】このアーキテクチャ48の特徴は、ダイの
中心にあるクロスバー/リンク・ロジックとリモート・
アナログ回路との間のリモート通信が、ディジタル非同
期であることである。リモート・ディジタル非同期信号
は、タイミングとスキューを犠牲にすることなくダイ全
体にわたって転送しかつバッファすることができる。 【0023】タイミング修復、デスキューおよびバス・
アセンブリはすべて、ダイの1つの領域で実行される。
この集中化によって、フェーズ・ロック・ループの数を
1つに減らすことができる。言い換えると、SYS−P
LL56がクロスバー・スイッチ52とリンク・モジュ
ール・タイミング修復回路58のすぐ近くにあるので、
SYS−PLL56を使用して、タイミング修復のため
にすべてのクロック・フェーズを供給することができ
る。これにより、リンクとクロスバー・スイッチ52と
の間の同期が単純になる。 【0024】この構成により、入力レシーバと出力ドラ
イバを、対称的でかつC4バンプ対の下になるように位
置決めすることができ、それにより性能が最適化され、
同相雑音の影響を受けにくくなる。 【0025】図4を参照して、本発明によるリンク・モ
ジュールの電気的アーキテクチャ60を示す。この電気
システムでは、電圧情報を再構成するために、積分増幅
器が、広帯域幅増幅器62と置き換えられている。この
増幅器の有限の利得帯域幅積によって、その機能は、本
来、積分増幅器と同じであり、再設定する必要がない。
この方式は、また、今日の最新型高速集積回路プロセス
の高い利得帯域幅を活用して、負荷終端差動増幅器が、
入ってきた小さいアナログ信号を再生し、かつレール間
ディジタル出力信号を生成できるようにする。以上のよ
うに、このとき、受け取った信号は、その電圧レベルが
修復されており、その信号を、経路64を介してクロス
バー・スイッチ66および残りのリンク・ブロックに送
って、タイミングのスキューをなくすことができる。ダ
イを横切るときに増幅信号に生じる追加の雑音またはタ
イミング・ジッター(アクティブ・リピータによる)
は、クロスバー・スイッチ66にあるタイミング修復回
路によって除去される。 【0026】すべてのリモート信号と非同期信号は、ダ
イ上の1つの領域に集中する。この領域は、SYS−P
LL76、残りのリンク・モジュール・ブロック、およ
びクロスバー・スイッチ66を含む。入ってくる信号
は、多重フェーズ出力SYS−PLL76を使用してタ
イミング変更される。受け取った信号は、本質的にディ
ジタルであるため、この新しい方式は、1つのディジタ
ル補間回路78を使用してストローブ・ポイントを決定
するのに向いており、リタイマ要素は、単純なD型フリ
ップフロップでよい。この発明は、例として次のような
実施形態を含む。 【0027】(1)クロスバー・スイッチを有するマル
チコア中央処理装置と共に使用するリンク・モジュール
であって、前記マルチコア中央処理装置に動作可能に結
合されており、クロスバー・スイッチの近くに配置され
たタイミング修復回路と、前記マルチコア中央処理装置
に動作可能に結合されたビット・レシーバと、前記マル
チコア中央処理装置に動作可能に結合されたビット出力
ドライバと、を含むリンク・モジュール。 【0028】(2)前記ビット・レシーバが、広帯域幅
増幅器を含む(1)に記載のリンク・モジュール。 【0029】(3)前記ビット出力ドライバが、出力レ
ベル・プリエンファシス回路を有するソース終端差動ド
ライバを含む(1)に記載のリンク・モジュール。 【0030】(4)前記タイミング修復回路が、システ
ム・フェーズ・ロック・ループを含み、前記システム・
フェーズ・ロック・ループが、前記出力ドライバにクロ
ック出力を提供する(1)に記載のリンク・モジュー
ル。 【0031】(5)前記タイミング修復回路が、リンク
・レイヤ制御ブロックと、デスキュー回路(deske
w circuitry)と、ラッチと、を含む(1)
に記載のリンク・モジュール。 【0032】(6)前記マルチコア中央処理装置が、広
大なランダム・アクセス・メモリを有し、前記ビット・
レシーバと前記ビット出力ドライバが、前記広大なラン
ダム・アクセス・メモリと一体化された(1)に記載の
リンク・モジュール。 【0033】(7)クロスバー・スイッチを有するリン
ク・ベースのマルチコア中央処理装置においてビットを
経路指定する方法であって、前記マルチコア中央処理装
置の第1のリンク・モジュールの第1のビット・レシー
バにおいて第1のビットを受け取るステップと、前記マ
ルチコア中央処理装置の第2のリンク・モジュールの第
2のビット・レシーバにおいて第2のビットを受け取る
ステップと、前記クロスバー・スイッチの近くに配置さ
れた第1のタイミング修復回路と第2のタイミング修復
回路に前記第1のビットと前記第2のビットを経路指定
するステップと、を含む方法。 【0034】(8)前記第1のビットを受け取るステッ
プが、広帯域幅増幅器において前記第1のビットを受け
取るステップを含む(7)に記載の方法。 【0035】(9)前記タイミング修復回路のリンク・
レイヤ制御ブロックから前記第1のリンク・モジュール
の出力ドライバのプリエンファシス回路に第3のビット
を経路指定するステップと、前記第1のタイミング修復
回路のシステムフェーズ・ロック・ループから前記プリ
エンファシス回路にクロック信号を経路指定するステッ
プと、をさらに含み、前記第3のビットと前記クロック
信号がマッチ(match)する(7)に記載の方法。 【0036】(10)システム・フェーズ・ロック・ル
ープに基づいて前記第1のビットと前記第2のビットの
タイミング修復を実行するステップをさらに含む(7)
に記載の方法。
【図面の簡単な説明】
【図1】従来技術による既存のリンク・レイアウト・ア
ーキテクチャのブロック図。 【図2】従来技術によるリンク・モジュールの既存の電
気的アーキテクチャのブロック図。 【図3】本発明によるリンク・レイアウト・アーキテク
チャのブロック図。 【図4】本発明によるリンク・モジュールの電気的アー
キテクチャのブロック図。
ーキテクチャのブロック図。 【図2】従来技術によるリンク・モジュールの既存の電
気的アーキテクチャのブロック図。 【図3】本発明によるリンク・レイアウト・アーキテク
チャのブロック図。 【図4】本発明によるリンク・モジュールの電気的アー
キテクチャのブロック図。
フロントページの続き
(72)発明者 トーマス・エヌ・インダーモール
アメリカ合衆国80206コロラド州デンバー、
ジャクソン・ストリート 657
Fターム(参考) 5B045 BB16
5B061 GG11 RR02
5B077 GG03 GG07 MM01
Claims (1)
- 【特許請求の範囲】 【請求項1】クロスバー・スイッチを有するマルチコア
中央処理装置と共に使用するリンク・モジュールであっ
て、 前記マルチコア中央処理装置に動作可能に結合されてお
り、クロスバー・スイッチの近くに配置されたタイミン
グ修復回路と、 前記マルチコア中央処理装置に動作可能に結合されたビ
ット・レシーバと、 前記マルチコア中央処理装置に動作可能に結合されたビ
ット出力ドライバと、を含むリンク・モジュール。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/109,480 US7194651B2 (en) | 2002-03-28 | 2002-03-28 | Distributed link module architecture |
US10/109,480 | 2002-03-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003316749A true JP2003316749A (ja) | 2003-11-07 |
JP2003316749A5 JP2003316749A5 (ja) | 2006-04-06 |
Family
ID=28789764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003079913A Withdrawn JP2003316749A (ja) | 2002-03-28 | 2003-03-24 | 分散型のリンク・モジュール |
Country Status (2)
Country | Link |
---|---|
US (1) | US7194651B2 (ja) |
JP (1) | JP2003316749A (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7599489B1 (en) * | 2004-02-09 | 2009-10-06 | Sun Microsystems Inc. | Accelerating cryptographic hash computations |
US7512204B1 (en) * | 2005-03-18 | 2009-03-31 | Altera Corporation | Multi-phase-locked loop (PLL) solution for multi-link multi-rate line card applications |
US8250500B1 (en) * | 2005-10-17 | 2012-08-21 | Altera Corporation | Method and apparatus for deriving signal activities for power analysis and optimization |
JP4846486B2 (ja) * | 2006-08-18 | 2011-12-28 | 富士通株式会社 | 情報処理装置およびその制御方法 |
US20080270653A1 (en) * | 2007-04-26 | 2008-10-30 | Balle Susanne M | Intelligent resource management in multiprocessor computer systems |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4849751A (en) * | 1987-06-08 | 1989-07-18 | American Telephone And Telegraph Company, At&T Bell Laboratories | CMOS Integrated circuit digital crossbar switching arrangement |
JP2002505533A (ja) * | 1997-09-19 | 2002-02-19 | フジツウ ネットワーク コミュニケーションズ,インコーポレイテッド | 一定位相クロスバ交換機 |
US6636932B1 (en) * | 1998-05-27 | 2003-10-21 | Micron Technology, Inc. | Crossbar switch and control for data networks switching |
EP1284587B1 (en) * | 2001-08-15 | 2011-09-28 | Sound Design Technologies Ltd. | Low-power reconfigurable hearing instrument |
-
2002
- 2002-03-28 US US10/109,480 patent/US7194651B2/en not_active Expired - Fee Related
-
2003
- 2003-03-24 JP JP2003079913A patent/JP2003316749A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US7194651B2 (en) | 2007-03-20 |
US20030194032A1 (en) | 2003-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8149979B2 (en) | Method and apparatus for handling of clock information in serial link ports | |
US7490187B2 (en) | Hypertransport/SPI-4 interface supporting configurable deskewing | |
US8654864B2 (en) | System and method for selectively performing single-ended and differential signaling | |
US6208667B1 (en) | Constant phase crossbar switch | |
US8352774B2 (en) | Inter-clock domain data transfer FIFO circuit | |
EP1670199B1 (en) | Design of channel alignment, error handling, and clock routing using hard-wired blocks for data transmission within programmable logic integrated circuits | |
Schinkel et al. | Low-power, high-speed transceivers for network-on-chip communication | |
US7254797B2 (en) | Input/output cells with localized clock routing | |
US6792003B1 (en) | Method and apparatus for transporting and aligning data across multiple serial data streams | |
JP3693974B2 (ja) | マルチチップ超伝導体回路用の高感度自己クロック式受信機 | |
US7450535B2 (en) | Pulsed signaling multiplexer | |
US7474612B1 (en) | Multi-function bypass port and port bypass circuit | |
US7426632B2 (en) | Clock distribution for interconnect structures | |
KR101266805B1 (ko) | 데이터 처리장치에서의 전력 소모 제어 | |
US6714058B2 (en) | Reduced jitter clock generator circuit and method for applying properly phased clock signals to clocked devices | |
JPH086913A (ja) | コンピュータ・プロセッサのネットワーク及びデータ半同期伝送方法 | |
JP2003316749A (ja) | 分散型のリンク・モジュール | |
EP1798887B1 (en) | Isochronous synchronizer | |
US7466787B1 (en) | Multi-stage phase detector | |
US6839856B1 (en) | Method and circuit for reliable data capture in the presence of bus-master changeovers | |
US7603579B2 (en) | Semiconductor chip and semiconductor integrated circuit device for relaying a reference clock from one hard macro to another | |
Alser et al. | Design and modeling of low-power clockless serial link for data communication systems | |
WO2012082572A2 (en) | Providing a feedback loop in a low latency serial interconnect architecture | |
US7536666B1 (en) | Integrated circuit and method of routing a clock signal in an integrated circuit | |
JP3214447B2 (ja) | クロックスキュー補償機能付きioバッファ回路及びそれを用いた半導体集積回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060216 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060216 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070131 |