JP2013528970A - ネットワークで使用される方法、装置及びシステム - Google Patents
ネットワークで使用される方法、装置及びシステム Download PDFInfo
- Publication number
- JP2013528970A JP2013528970A JP2013502712A JP2013502712A JP2013528970A JP 2013528970 A JP2013528970 A JP 2013528970A JP 2013502712 A JP2013502712 A JP 2013502712A JP 2013502712 A JP2013502712 A JP 2013502712A JP 2013528970 A JP2013528970 A JP 2013528970A
- Authority
- JP
- Japan
- Prior art keywords
- port
- voltage
- packet
- virtual channel
- buffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 239000000872 buffer Substances 0.000 claims abstract description 64
- 238000012545 processing Methods 0.000 claims description 15
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 7
- 239000004065 semiconductor Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/30—Flow control; Congestion control in combination with information about buffer occupancy at either end or at transit nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/10—Packet switching elements characterised by the switching fabric construction
- H04L49/109—Integrated on microchip, e.g. switch-on-chip
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/40—Constructional details, e.g. power supply, mechanical construction or backplane
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/39—Credit based
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Power Sources (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Information Transfer Systems (AREA)
Abstract
一実施形態による方法は、ルータのポートのバッファの占有レベルを閾値と比較し、その比較に少なくとも部分的に基づいてポートが第1の電圧及び周波数で動作するように制御し、ルータの他のポートの少なくとも1つは第2の電圧及び周波数で動作するように制御される。他の形態も開示される。
Description
開示される発明はネットワークで使用される方法、装置及びシステム等に関連する。
多くのコンピュータシステムは、例えばシステムのマザーボード又はその他の回路基板に結合された集積回路(IC)のような個別素子から形成されている。単独のICに組み込むことが可能な処理ユニット数及び処理能力の増大により、システムオンチップ(system−on−chip:SoC)のような単独のICで形成されるシステムは、移動装置、内蔵システム等のような様々な装置に組み込まれることが可能である。
素子同士を接続するため、あるタイプの相互接続ネットワークが使用され、1つ以上のルータが存在してもよい。現在、システム内の複数のルータは非常に同質又は一様(homogeneous)であり、ルータの異なるポートが同じ速度で操作し、ポートの異なる仮想チャネル(virtual channels:VC)や他の独立した経路(パスウェイ)についても同様である。これはSoCの用法の不整合又はミスマッチとなる(ポート間でトラフィックが釣り合っていることや仮想チャネル間の重要度又はクリティカリティ(criticality)が同じであることは、実際には希なケースである)。ポート及びVC間で一様な設計は、低速が許容可能な素子については電力消費を次善のものにし(最適ではないようにしてしまい)、重要なメッセージが非常に高い処理速度から恩恵を受ける素子についてはパフォーマンスのペナルティを被ってしまう。
開示される発明の課題は、従来の問題を少なくとも軽減する方法、装置及びシステムを提供することである。
開示される発明による方法は、
複数のルータ及び少なくとも1つのプロセッサに結合されたルータの第1のポート内の第1のバッファの占有度を判定するステップと、
前記第1のバッファの前記占有度を第1の閾値との比較を行うステップと、
前記比較の結果の少なくとも一部に基づいて前記第1のポートが第1の電圧及び周波数で動作するように制御するステップと
を有し、前記ルータの他のポートの少なくとも1つは第2の電圧及び周波数で動作するように制御される、方法である。
複数のルータ及び少なくとも1つのプロセッサに結合されたルータの第1のポート内の第1のバッファの占有度を判定するステップと、
前記第1のバッファの前記占有度を第1の閾値との比較を行うステップと、
前記比較の結果の少なくとも一部に基づいて前記第1のポートが第1の電圧及び周波数で動作するように制御するステップと
を有し、前記ルータの他のポートの少なくとも1つは第2の電圧及び周波数で動作するように制御される、方法である。
様々な実施の形態において、ヘテロジーニアスルータマイクロアーキテクチャ(heterogeneous router micro-architecture)が提供される。概して、ルータの様々なポート、ポートの様々な仮想チャネル及び/又は1つの仮想チャネルを共有する異なるパケットでさえ、処理要素及びパケットソフトウェア動作における固有の不均一性に対処するように、異なるクロック(又は周波数)及び電圧で動作できるようになる。ヘテロジーニアス制御(heterogeneous control)を実現するため、ルータの1つ以上の電力コントローラを用いて、ポート、チャネル及び/又はパケットの各々において優れたパフォーマンス/電力消費を行うように、周波数-電圧のペア各々を提供する。
実施の形態は多種多様なシステムに使用可能である。一実施形態において、ネットワークオンチップ(network−on−a−chip:NoC)のようなシステムオンチップ(SoC)は、メッシュ型の相互接続システムを介して結合された多くのコアを含んでよい。図1を参照するに、本発明の実施の形態によるシステムのブロック図が示されている。図1に示されているように、システム100は複数の処理エンジン1100,0-110n,mを含むシステムオンチップであってもよい。様々な実施の形態において、これらの処理エンジンは、マルチコアプロセッサの比較的簡易な整列したマイクロアーキテクチャの汎用コアのようなコアであってもよい。或いは、処理エンジンは、デコード処理、パケット処理等のような特殊な機能又はその他の機能を備えたホモジーニアス又はヘテロジーニアス処理エンジンとすることもできる。図示されているように、複数の処理エンジン110はメッシュ状に相互に結合され、各々のプロセッサは、複数のルータ1200,0-120n,mの内の対応するルータに結合される。
そのようなルータの各々は複数のポートを含み、各々のポートは複数の仮想チャネルを有し、これらの点については後述する。これらの様々なルータは、例えば様々な電圧及び周波数レベルのような様々な動作パラメータを有するように制御され、ルータによる通信の相違を認識する。図1に示されているように、メモリコントローラ130も存在している。
図1の例に示されているように、ルータを通じて異なる方向に進む異なるタイプのトラフィックに起因して、ルータの個々のポートは、電力消費に対して重み付けされた必要な処理能力を実現するように独立に制御される。例えば、メモリコントローラ130からプロセッサP1へのトラフィックは、図中の太線で示されているように、ある1つの方向で支配的である。この状況はライトバックキャッシュ(write-back caches)のメモリ優先順位(memory hierarchy)の状況を表し、この場合、メインメモリから読み取るトラフィックはトラフィックをメモリに書き込むより何倍も多いのが通常的である。例えば、ルータR1の場合、メモリコントローラからの入力ポートは、ルータ1202,1からの入力ポートよりもかなり高いクロックの方が有用である。
更に、キャッシュコヒーレントシステムにおける或るパケットタイプは、様々なレベルのクリティカリティ(varying levels of criticalities)に分類できる。それらのクリティカリティを用いてパケットが仮想チャネルにマッピング又は対応付けられる場合、全てのパケットについて1つのクロックしか使用しない設計は、次善又は準最適となる。以下の表1は、ある通信プロトコルのパケットに対する3つレベルのクリティカリティ又は重要度を示す。表1に示されているように、キャッシュコヒーレントマルチプロセッサのメッセージタイプは、アプリケーションのパフォーマンスに対して異なるクリティカリティ性又は重要性を有する。表1に示す例の場合、パケットクリティカリティ又はパケット重要度の3つのレベルはパケットの内容に基づいてもよい。一般に、最もクリティカルなパケット又は最重要パケットは、キャッシュコヒーレンシーメッセージタイプに関するものであり、様々なレスポンス(Rsp)、スヌープパケット(snoop packet:Snp)及びコンフリクトのアクノリッジメント(acknowledgement of conflict:AckCnflt)を含む。次に、中程度の重要度のパケットは、データ転送の他のレスポンス、所定の読み取りリクエスト(Rd)及び無効メッセージ(Inv)等に関連する。そして、ライトバックレスポンス(Wb)タイプのメッセージは最低の優先度を有してもよい。例えば、RspIパケットを遅延させることは、通常、キャッシュヒットレイテンシを伸ばす一方、WbMtolを遅延させることはしばしば無害(harmless)である。
表1
図示されているように、到来するデータは、ポート内の入力マルチプレクサ222によりバッファに入力されるように到来するパケットが分配される。入力マルチプレクサ222は、到来するパケットの仮想チャネル識別子に基づいて、対応するバッファに与える出力を、到来する入力の中から選択する。同様に、バッファ225の出力は出力マルチプレクサ226に結合され、出力マルチプレクサは仮想チャネルアロケータ240により制御される。図示されているように、到来するクレジット(incoming credits)が、例えばルータ200に結合されている他のルータから仮想チャネルアロケータ240に与えられる。そして、有効なクレジットを有していた場合、所与の仮想チャネルバッファは自身の出力を選択してもらう。スイッチアロケータ245は、他のルータの所与のポートに送信するパケットを、様々な入力の中から選択する。一実施形態において、これらのアロケータは単独の論理装置又はコントローラ内に統合されてもよい。この判定を行う際に様々なルータアルゴリズムを使用できる。例えば、ソースルーティングの場合、パケットのソースは経路全体を特定し、スイッチアロケータがパケットに含まれている経路情報を分析できるようにする。他のタイプのルーティングアルゴリズムはダイナミックルーティングであり、その場合、パケットは完全な経路の情報を有しておらず、宛先ノードの識別子(ID)を含んでいるだけである。その場合、スイッチアロケータはルーティングの仕方を決定するためにルーティングテーブルにアクセスする。同様に、ルータ200はパケットのプロバイダにクレジットを返す。すなわち、所与の仮想チャネルバッファからパケットが出力される場合、その仮想チャネルに対応するクレジットが、そのパケットをルータに与えたエンティティ又は機能要素に返される。様々なポートからの出力は、クロスバー230を通じて、ルータに結合されている選択されたエンティティ(例えば、他の同様なルータ、処理エンジン等)に、双方向ノード間リンク299を介して提供される。
様々なポートが動作する周波数を独立に制御するため、電力コントローラ210が設けられている。図示されているように、電力コントローラ210は、動作周波数に対応するグローバルクロック信号を受信するように結合される。更に、電力コントローラ210は、後述するように静的又は動的に設定される複数の分周比又は分周率(divide ratio)を受信する。一実施形態において、ポートの各々には自身の分周率がある。電力コントローラ210は、SoCの動作電圧に対応するグローバル電圧信号を受信するように更に結合されている。そして、受信した分周率並びにグローバルクロック及び電圧に基づいて、電力コントローラ210は、各々のポートに与えるクロック-電圧信号ペアを生成する。図2に示す実施の形態では、ルータ1つに付き1つの電力コントローラ210が示されているが、本発明の範囲はこの例に限定されず、一実施形態では各々のポートに個別の電力コントローラが備わっていてもよい。
このように、図2に示す実施の形態は、ポート毎にクロック-電圧制御を実現できるヘテロジーニアスルータを示す。図2に示す形態における周波数及び電圧のペアの選択は、バッファ占有度に基づいて動的に制御されてもよいし又は静的に制御されてもよい。一実施形態において、1つ以上のポートが静的に制御され、1つ以上の他のポートが動的に制御されてもよい。静的な場合の実現手段は、トラフィックがルータを通じてどのように流れる傾向があるかについての経験的な予備知識に基づいていてもよい。例えば、メモリコントローラから出力されるトラフィックがメモリコントローラに入力されるトラフィックよりも多くなる傾向がある、ということが分かっていた場合、メモリコントローラからデータを出力するポートは、メモリコントローラに入る方向のポートよりも高い周波数で動作するように制御される。
一実施形態において、電力コントローラ210は、バッファ占有度監視論理装置250からの情報に基づいて、ポート各々に適切な周波数及び電圧のペアを選択してもよい。一実施形態において、バッファ占有度監視論理装置250は分周率を動的に制御するために分周率信号を提供する。別の実施の形態において、システムソフトウェアは、例えばポートを経由するトラフィックの予想トラフィックパターンに関する経験的な予備知識に基づいて、分周率を設定する。より具体的に言えば、一実施形態において、論理装置は、ポートのバッファエントリの数と閾値との比較を実行する。この比較は、ポート内の全てのバッファの占有度に基づいていてもよいし、或いは所定の1つ以上のバッファのみに基づいていてもよいことに留意を要する。この場合において、使用するバッファエントリの数がポートの所定のウォーターマーク(watermark)を超える場合、ポートのクロック/電圧が増やされる。逆に、ある拡張期間にわたってFIFOバッファが空又はエンプティであることは、アイドル状態を示し(占有度監視論理装置により検出される)、クロック/電圧は最低スタンバイ状態に制限/減らされ、実質的に電力を節約する。ランタイム制御(run time control)は、ルータが変動するトラフィックの要請に継続的に合わせるようにし、パフォーマンスと電力消費との間で適切なトレードオフを達成する。静的な制御の形態の場合、論理装置250は存在しなくてもよく、分周率信号は静的に制御されてもよいことに留意を要する。一実施形態において、例えばポート毎又はバッファ毎に、静的及び動的な制御の組み合わせが使用されてもよい。
図2の例では、クロックの粒度(granularity)及び電圧の適合性(adaptation)はポート毎に決定される。従って、電力コントローラ(及び占有度監視論理装置)はポート毎に構築されてもよいし、あるいは各々のポートが、これらの素子の1つの実現手段と通信するように構築されてもよい。理解されるように、ポート毎の電力制御に加えて、電力を節約するためにポート間のリンクも同様に制御されてもよい。更に別の実施の形態では、ヘテロジーニアスルータが電圧/周波数の優先度毎の制御と共に使用されてもよい。すなわち、ポート毎の制御以外の応用例において、制御はポート内の個々のバッファ各々に行われてもよく、例えば優先度毎に又は超精密電力管理(ultra fine-grain power management)による仮想チャネル毎に行われてもよい。図3を参照するに、本発明の別の実施の形態によるルータのブロック図が示されている。図3に示されているように、ルータ200’は図2に示すルータと同様に構築されている。しかしながら、ポート毎の制御ではなく、ルータ200’の個々のバッファ225の各々が、個別に制御される周波数及び電圧のペアを有する。このような制御を行うため、電力コントローラ228及び占有度監視論理装置229が、ポート毎に設けられ、例えば、静的なソース(図3には図示せず)又は占有度監視論理装置229から提供されてもよい到来する選択信号に基づいて、個々のクロック-電圧制御信号を仮想チャネルバッファ225の各々に出力する。
一実施形態において、第1の仮想チャネルが最重要パケットに関連付けられ、第2の仮想チャネルが次に重要なパケットに関連付けられ、以下同様に関連付けられる静的な割り当てのように、システムは、メッセージの重要度に基づいて仮想チャネル各々が割り当てられるように構築されてもよい。その実施の形態の場合、第1の仮想チャネルバッファは他の仮想チャネルバッファよりも高速に動作する。重要度に基づく仮想チャネルを利用する更に別の実施の形態においては、最高優先度の仮想チャネル(1つのバッファに関連付けられている)を通じてデータが流れる場合、他のチャネル(及びそれらに関連付けられているバッファ)はディセーブルにされる、或いは低電力スタンバイ状態に入れられ、ワークロードに基づく制御を実現するように、ポート内の一群のバッファを制御することで、動的な制御が実現されてもよい。この制御を行うため、パケットの各々は、パケットの優先度を示すために、ビットフィールドのようなサービス品質(QoS)の手掛かりを含んでもよい。最高優先度のパケットが受信された場合は、バッファを通じてパケットを処理するために高い周波数が使用され、低優先度のパケットが受信された場合は、バッファリソースが低い周波数で制御されるように、バッファが制御されてもよい。第1の仮想チャネル(VC0)が最高の優先度のパケットを実際に高速に入力/出力すると仮定すると、残りのチャネル/バッファ(例えば、VC1ないしVCV)は低電力状態に置かれてもよい。この実施の形態の場合、クロック及び電圧を適応させるための基礎は、メッセージの優先度である。
クロック及び電圧の適応化は様々な方法で実行できる。ハイパフォーマンスメニーコアアーキテクチャ(high performance many core architecture)の場合、ソフトウェアトランスペアレントである設計時間判断法(design-time decision)が使用されてもよい。QoS条件と共に多くの知財(Intellectual Property:IP)ブロックを含むSoCの場合、ソフトウェアにより提供される手掛かりに基づくランタイム動的制御法が使用されてもよい。例えば、低優先度のダイレクトメモリアクセス(DMA)トランザクションは、メモリモジュール同士の間のルータを介する低電圧の低電力経路を通じて実行されてもよい。
更に別の実施の形態の場合、より繊細な制御が行われてもよい。図4を参照するに、例えば、パケット自身の優先度に従って、パケット毎に制御が行われている。この優先度は、仮想チャネル又はそのような他の識別子に属する優先度とは異なる。様々な実施の形態において、各々のフロー制御ユニット(例えば、フリット(flit)と言及される)は、ユニットのヘッダ(例えば、パケットヘッダ)の中に優先度のインジケータを優指定もよい。この情報に基づいて、バッファを共有するパケットが異なる速度で処理される。図4の実施の形態に具体的に示されているように、バッファ320は第1の位置320a及び第2の位置320bを有し、それら各々は例えば電力コントローラ310から取得した制御信号に基づいて異なる速度で制御されてもよい。図示されているように、電力コントローラ310は、パケットヘッダのフィールド内の情報により設定される分周率及び電圧信号及びグローバルクロックを受信する。この情報に基づいて、電力コントローラ310はバッファ320の特定の部分にデータを書き込み及びそこからデータを読み取るために、書き込みクロック及び読み取りクロックを生成する。図4には特定の形態が示されているが、電圧/周波数の繊細な又は緻密な制御を行う他の実施の形態も実現可能であることは理解されるであろう。一例として、プロセッサの既知の電力状態(例えば、アドバンストコンフィギュレーション及び電力インターフェース(ACPI)標準仕様におけるいわゆるP又はC状態)と同期するように機能するルータの中で、電力制御が行われてもよい。ここで、プロセッサに接続されているローカルルータ及びバッファ(そのポートにおけるバッファ)は、プロセッサの電力状態に基づいてスリープ状態(又は起動状態)で動作することができる。電力状態を認識するメモリコントローラに接続されたルータに適用可能な他の実施の形態も可能である。
実施の形態は、コードで実現され、命令を保存する記憶媒体に保存されてもよく、命令は命令を実行するようにシステムをプログラムするのに使用可能である。記憶媒体は、例えば、フロッピディスクや光ディスクを含むディスク、ソリッドステートドライブ(SSD)、コンパクトディスクリードオンリメモリ(CD-ROM)、コンパクトディスクリライタブル(CD-RW)、光磁気ディスク、半導体装置、磁気又は光カード、或いは電子命令を保存するのに相応しい他の任意のタイプの媒体のうちの任意のものであり、半導体装置は、例えば、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)(例えば、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM))、消去可能プログラム可能なリードオンリメモリ(EPROM)、フラッシュメモリ、電気的に消去可能プログラム可能なリードオンリメモリ(EEPROM)等であるが、これらに限定されない。
以上、本発明は限られた数の実施の形態に関連して説明されてきたが、当業者はそれらに対する数多くの修正例及び変形例を認識するであろう。従って添付の特許請求の範囲はそのような全ての修正例及び変形例を包含し、それらは本発明の真の精神及び範囲内にある。
Claims (20)
- 複数のルータ及び少なくとも1つのプロセッサに結合されたルータの第1のポート内の第1のバッファの占有度を判定するステップと、
前記第1のバッファの前記占有度を第1の閾値との比較を行うステップと、
前記比較の結果の少なくとも一部に基づいて前記第1のポートが第1の電圧及び周波数で動作するように制御するステップと
を有し、前記ルータの他のポートの少なくとも1つは第2の電圧及び周波数で動作するように制御される、方法。 - 前記占有度の変化に基づいて異なる電圧及び周波数で動作するように前記第1のポートを動的に制御するステップを更に有する請求項1記載の方法。
- ルータを経由すると予想されるトラフィックパターンの経験的な情報に基づいて、ルータの第2のポートが前記第2の電圧及び周波数で動作するように静的に制御するステップを更に有する請求項1記載の方法。
- 第1のパケットの仮想チャネル識別子に基づいて前記第1のパケットを前記第1のバッファにルーティングするステップを更に有する、請求項1記載の方法。
- 前記第1のバッファに対応するクレジットが有効であった場合に、前記第1のバッファの出力に結合された出力マルチプレクサから前記第1のパケットを選択し、前記第1のパケットを第2のルータの所定のポートにルーティングするステップを更に有する請求項4記載の方法。
- 前記第1のバッファが少なくとも1つのデータパケットを保存している場合、前記第1のポートの入出力リンク及び他のバッファの少なくとも1つを低電力状態にするステップを更に有する請求項1記載の方法。
- 前記第1のポート内の複数のバッファの占有度と前記第1の閾値との比較を行うステップと、
前記比較の結果の少なくとも一部に基づいて前記第1の電圧及び周波数で動作するように前記複数のバッファを制御するステップと
を更に有する請求項1記載の方法。 - 前記複数のバッファ各々に関するメッセージの重要度に基づいて個々の電圧及び周波数で動作するように前記第1のポート内の複数のバッファ各々を制御するステップを更に有する請求項1記載の方法。
- 複数のポートを有する装置であって、
前記複数のポートの各々は、入力マルチプレクサ及び出力マルチプレクサの間に並列に結合された複数の仮想チャネルバッファを含み、
前記複数のポートの各々は選択された周波数及び電圧のペアで動作するように個別の制御が行われる、装置。 - 前記個別の制御は、対応するポートの少なくとも1つの仮想チャネルバッファの占有度に基づいている、請求項9記載の装置。
- ポート内の前記複数の仮想チャネルバッファ各々は、パケット毎に異なる周波数及び電圧のペアで動作するように個別の制御が行われる、請求項10記載の装置。
- 前記複数のポートに属する第1のポート内で最高の優先度の仮想チャネルバッファが少なくとも1つのパケットを格納した場合、前記第1のポート内の他の仮想チャネルバッファは低電力状態になり、仮想チャネルバッファの各々は、対応する仮想チャネルバッファに保存されるパケットの優先度に関連付けられている、請求項9記載の装置。
- 前記複数のポートに結合され、前記第1のポートの占有度を判定し、前記占有度と閾値との比較を行う占有度監視論理装置を更に有し、前記選択された周波数及び電圧のペアは前記比較の結果の一部に少なくとも基づいている、請求項9記載の装置。
- グローバルクロック信号を受信し、前記複数のポート各々に対する比率信号及び前記グローバルクロック信号に基づいて、前記複数のポート各々に異なるクロック信号を提供するコントローラと、
電圧信号を受信し、前記比率信号及び前記電圧信号に基づいて、前記複数のポート各々に異なる調整済み電圧を出力する電圧調整部と
を更に有する請求項13記載の装置。 - 前記コントローラは、第1の入力パケットから第1の比率信号を受信し、前記第1のポートの第1の仮想チャネルバッファに前記第1の入力パケットを保存するための書き込みクロック信号を生成し、前記書き込みクロック信号は前記第1の入力パケットのヘッダにより受信した前記第1の比率信号に応じている、請求項14記載の装置。
- 前記第1の仮想チャネルバッファに保存される前記第1の入力パケット及び第2の入力パケットが、各自対応する比率信号に従って異なる速度で処理される、請求項15記載の装置。
- 前記複数のポートの個別の制御が、ルータを経由する予想されるトラフィックパターンの経験的な情報に基づいて統計的に行われる、請求項9記載の装置。
- 複数の処理エンジンと、
少なくとも1つのメモリコントローラと、
前記複数の処理エンジン及び前記少なくとも1つのメモリコントローラに相互接続ネットワークを通じて結合された複数のルータと
を有するシステムであって、
複数のルータの各々は複数のポートを有し、前記複数のポートの各々は、入力マルチプレクサ及び出力マルチプレクサの間に並列に結合された複数の仮想チャネルバッファを含み、複数のルータの各々は、
前記出力マルチプレクサに結合されたクロスバーと、
前記出力マルチプレクサ及び前記クロスバーに結合され、前記出力マルチプレクサからパケットを選択する出力選択論理装置と、前記パケットを受信する前記複数のルータの内の他のルータのポートと、
前記並列に結合された複数の仮想チャネルバッファに結合され、前記並列的に結合された複数の仮想チャネルバッファ各々占有度を判定し、対応する占有度を閾値と比較し、比較の結果を出力する占有度監視論理装置と、
前記比較の結果、グローバルクロック信号及び電圧信号を受信し、前記比較の結果の一部に少なくとも基づいて、前記並列的に結合された複数の仮想チャネルバッファ各々に周波数及び電圧のペアを提供するコントローラと
を有し、前記並列的に結合された複数の仮想チャネルバッファの各々はヘテロジーニアスな周波数及び電圧のペアで動作し、前記複数の処理エンジン、前記少なくとも1つのメモリコントローラ及び前記複数のルータは単独の半導体チップ上に形成されている、システム。 - 前記複数のルータの各々が、パケット毎に、ヘテロジーニアスな周波数及び電圧のペアで動作するように制御される、請求項18記載のシステム。
- 前記複数のルータの1つにおける少なくとも1つのポートが、少なくとも1つのポートを経由すると予想されるトラフィックパターンの経験的な情報に基づく静的な電圧及び周波数で動作する、請求項18記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/748,794 | 2010-03-29 | ||
US12/748,794 US8379659B2 (en) | 2010-03-29 | 2010-03-29 | Performance and traffic aware heterogeneous interconnection network |
PCT/US2011/030256 WO2011126816A2 (en) | 2010-03-29 | 2011-03-29 | Performance and traffic aware heterogeneous interconnection network |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013528970A true JP2013528970A (ja) | 2013-07-11 |
Family
ID=44656397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013502712A Pending JP2013528970A (ja) | 2010-03-29 | 2011-03-29 | ネットワークで使用される方法、装置及びシステム |
Country Status (7)
Country | Link |
---|---|
US (1) | US8379659B2 (ja) |
EP (1) | EP2553893B1 (ja) |
JP (1) | JP2013528970A (ja) |
CN (1) | CN102823214B (ja) |
RU (1) | RU2566330C2 (ja) |
TW (1) | TWI444023B (ja) |
WO (1) | WO2011126816A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017511529A (ja) * | 2014-03-20 | 2017-04-20 | インテル コーポレイション | リンクインタフェースの使用されていないハードウェアの電力消費を制御するための方法、装置及びシステム |
JP2017142774A (ja) * | 2015-10-26 | 2017-08-17 | エイチジーエスティーネザーランドビーブイ | ネットワークオンチップ方法によるメモリバンクのためのファブリック相互接続 |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8402295B2 (en) * | 2010-07-09 | 2013-03-19 | Qualcomm Incorporated | Techniques employing flits for clock gating |
US20120185714A1 (en) * | 2011-12-15 | 2012-07-19 | Jaewoong Chung | Method, apparatus, and system for energy efficiency and energy conservation including code recirculation techniques |
US9619006B2 (en) * | 2012-01-10 | 2017-04-11 | Intel Corporation | Router parking in power-efficient interconnect architectures |
CN103580890B (zh) * | 2012-07-26 | 2018-08-28 | 深圳市中兴微电子技术有限公司 | 一种可重配置片上网络结构及其配置方法 |
US8885510B2 (en) | 2012-10-09 | 2014-11-11 | Netspeed Systems | Heterogeneous channel capacities in an interconnect |
JP2014082713A (ja) | 2012-10-18 | 2014-05-08 | Canon Inc | データ処理装置及びその制御方法 |
US9253085B2 (en) * | 2012-12-21 | 2016-02-02 | Netspeed Systems | Hierarchical asymmetric mesh with virtual routers |
WO2014149041A1 (en) * | 2013-03-20 | 2014-09-25 | Empire Technology Development Llc | Heterogeneous router clock assignment and packet routing |
US9471726B2 (en) | 2013-07-25 | 2016-10-18 | Netspeed Systems | System level simulation in network on chip architecture |
US9473388B2 (en) | 2013-08-07 | 2016-10-18 | Netspeed Systems | Supporting multicast in NOC interconnect |
GB2521149B (en) * | 2013-12-10 | 2021-08-18 | Grass Valley Ltd | Adjusting occupancies of a set of buffers |
US9699079B2 (en) | 2013-12-30 | 2017-07-04 | Netspeed Systems | Streaming bridge design with host interfaces and network on chip (NoC) layers |
US9473415B2 (en) * | 2014-02-20 | 2016-10-18 | Netspeed Systems | QoS in a system with end-to-end flow control and QoS aware buffer allocation |
CN104022950B (zh) * | 2014-06-10 | 2017-06-06 | 复旦大学 | 一种可共享和自配置缓存的路由器结构 |
US9742630B2 (en) | 2014-09-22 | 2017-08-22 | Netspeed Systems | Configurable router for a network on chip (NoC) |
US9571341B1 (en) | 2014-10-01 | 2017-02-14 | Netspeed Systems | Clock gating for system-on-chip elements |
US9660942B2 (en) | 2015-02-03 | 2017-05-23 | Netspeed Systems | Automatic buffer sizing for optimal network-on-chip design |
US9444702B1 (en) | 2015-02-06 | 2016-09-13 | Netspeed Systems | System and method for visualization of NoC performance based on simulation output |
US9568970B1 (en) | 2015-02-12 | 2017-02-14 | Netspeed Systems, Inc. | Hardware and software enabled implementation of power profile management instructions in system on chip |
US9928204B2 (en) | 2015-02-12 | 2018-03-27 | Netspeed Systems, Inc. | Transaction expansion for NoC simulation and NoC design |
US10050843B2 (en) | 2015-02-18 | 2018-08-14 | Netspeed Systems | Generation of network-on-chip layout based on user specified topological constraints |
US10348563B2 (en) | 2015-02-18 | 2019-07-09 | Netspeed Systems, Inc. | System-on-chip (SoC) optimization through transformation and generation of a network-on-chip (NoC) topology |
US9864728B2 (en) | 2015-05-29 | 2018-01-09 | Netspeed Systems, Inc. | Automatic generation of physically aware aggregation/distribution networks |
US9825809B2 (en) | 2015-05-29 | 2017-11-21 | Netspeed Systems | Dynamically configuring store-and-forward channels and cut-through channels in a network-on-chip |
US10218580B2 (en) | 2015-06-18 | 2019-02-26 | Netspeed Systems | Generating physically aware network-on-chip design from a physical system-on-chip specification |
US10243881B2 (en) | 2015-10-27 | 2019-03-26 | Western Digital Technologies, Inc. | Multilayer 3D memory based on network-on-chip interconnection |
US10452124B2 (en) | 2016-09-12 | 2019-10-22 | Netspeed Systems, Inc. | Systems and methods for facilitating low power on a network-on-chip |
US20180159786A1 (en) | 2016-12-02 | 2018-06-07 | Netspeed Systems, Inc. | Interface virtualization and fast path for network on chip |
US10313269B2 (en) | 2016-12-26 | 2019-06-04 | Netspeed Systems, Inc. | System and method for network on chip construction through machine learning |
US10063496B2 (en) | 2017-01-10 | 2018-08-28 | Netspeed Systems Inc. | Buffer sizing of a NoC through machine learning |
US10084725B2 (en) | 2017-01-11 | 2018-09-25 | Netspeed Systems, Inc. | Extracting features from a NoC for machine learning construction |
US10469337B2 (en) | 2017-02-01 | 2019-11-05 | Netspeed Systems, Inc. | Cost management against requirements for the generation of a NoC |
US10298485B2 (en) | 2017-02-06 | 2019-05-21 | Netspeed Systems, Inc. | Systems and methods for NoC construction |
WO2018154494A1 (en) | 2017-02-23 | 2018-08-30 | Cerebras Systems Inc. | Accelerated deep learning |
EP3607503B1 (en) | 2017-04-17 | 2022-03-09 | Cerebras Systems Inc. | Task activating for accelerated deep learning |
US11488004B2 (en) | 2017-04-17 | 2022-11-01 | Cerebras Systems Inc. | Neuron smearing for accelerated deep learning |
WO2018193353A1 (en) | 2017-04-17 | 2018-10-25 | Cerebras Systems Inc. | Neuron smearing for accelerated deep learning |
US11144457B2 (en) | 2018-02-22 | 2021-10-12 | Netspeed Systems, Inc. | Enhanced page locality in network-on-chip (NoC) architectures |
US10547514B2 (en) | 2018-02-22 | 2020-01-28 | Netspeed Systems, Inc. | Automatic crossbar generation and router connections for network-on-chip (NOC) topology generation |
US10983910B2 (en) | 2018-02-22 | 2021-04-20 | Netspeed Systems, Inc. | Bandwidth weighting mechanism based network-on-chip (NoC) configuration |
US10896476B2 (en) | 2018-02-22 | 2021-01-19 | Netspeed Systems, Inc. | Repository of integration description of hardware intellectual property for NoC construction and SoC integration |
US11176302B2 (en) | 2018-02-23 | 2021-11-16 | Netspeed Systems, Inc. | System on chip (SoC) builder |
US11023377B2 (en) | 2018-02-23 | 2021-06-01 | Netspeed Systems, Inc. | Application mapping on hardened network-on-chip (NoC) of field-programmable gate array (FPGA) |
WO2019220692A1 (ja) * | 2018-05-15 | 2019-11-21 | 三菱電機株式会社 | 演算装置 |
CN109062508A (zh) * | 2018-07-19 | 2018-12-21 | 郑州云海信息技术有限公司 | 一种数据处理的方法及装置 |
RU2685969C1 (ru) * | 2018-08-07 | 2019-04-23 | Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы" (АО НПЦ "ЭЛВИС") | Способ управления энергопотреблением в гетерогенной системе на кристалле |
WO2020044152A1 (en) | 2018-08-28 | 2020-03-05 | Cerebras Systems Inc. | Scaled compute fabric for accelerated deep learning |
WO2020044208A1 (en) | 2018-08-29 | 2020-03-05 | Cerebras Systems Inc. | Isa enhancements for accelerated deep learning |
US11328208B2 (en) | 2018-08-29 | 2022-05-10 | Cerebras Systems Inc. | Processor element redundancy for accelerated deep learning |
US11533277B2 (en) * | 2021-02-16 | 2022-12-20 | Hewlett Packard Enterprise Development Lp | Method and system for virtual channel remapping |
WO2022256737A1 (en) * | 2021-06-04 | 2022-12-08 | Drexel University | Energy efficiency of heterogeneous multi-voltage domain deep neural network accelerators through leakage reuse for near-memory computing applications |
CN116775418B (zh) * | 2023-08-22 | 2023-12-19 | 北京象帝先计算技术有限公司 | 一种片上网络中的路由节点、频率调整方法及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08186600A (ja) * | 1995-01-05 | 1996-07-16 | Nippon Telegr & Teleph Corp <Ntt> | 蓄積交換網における中継輻輳検出方法 |
JPH1155276A (ja) * | 1997-08-01 | 1999-02-26 | Oki Electric Ind Co Ltd | シェーピング装置 |
JP2003069607A (ja) * | 2001-08-23 | 2003-03-07 | Nec Corp | Atm交換機およびその省電力方法 |
JP2007074607A (ja) * | 2005-09-09 | 2007-03-22 | Alaxala Networks Corp | クロック制御を用いた低消費電力化データ処理回路 |
JP2007097126A (ja) * | 2005-09-05 | 2007-04-12 | Alaxala Networks Corp | ネットワーク接続装置の消費電力低減方法及び装置 |
JP2009077377A (ja) * | 2007-08-27 | 2009-04-09 | Alaxala Networks Corp | ネットワーク中継装置 |
JP2009147615A (ja) * | 2007-12-13 | 2009-07-02 | Alaxala Networks Corp | パケット転送装置 |
JP2009253481A (ja) * | 2008-04-03 | 2009-10-29 | Alaxala Networks Corp | パケット転送装置 |
JP2009267546A (ja) * | 2008-04-23 | 2009-11-12 | Nec Corp | 情報通信機器、低消費電力回路及びそれらに用いる消費電力削減方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6009488A (en) | 1997-11-07 | 1999-12-28 | Microlinc, Llc | Computer having packet-based interconnect channel |
US7222147B1 (en) * | 2000-05-20 | 2007-05-22 | Ciena Corporation | Processing network management data in accordance with metadata files |
US7173906B2 (en) * | 2001-09-28 | 2007-02-06 | Nec Corporation | Flexible crossbar switching fabric |
EP1428361B1 (de) * | 2001-09-20 | 2010-09-01 | Nokia Siemens Networks GmbH & Co. KG | Verkehrsbegrenzung mittels zulässigkeitsprüfung für ein paketorientiertes verbindungsloses netz mit qos niveau übertragung |
GB0211764D0 (en) * | 2002-05-22 | 2002-07-03 | 3Com Corp | Automatic power saving facility for network devices |
US7181544B2 (en) | 2002-09-03 | 2007-02-20 | Intel Corporation | Network protocol engine |
US7324540B2 (en) | 2002-12-31 | 2008-01-29 | Intel Corporation | Network protocol off-load engines |
US20040158752A1 (en) * | 2003-02-04 | 2004-08-12 | Michael Borza | Power management system and method for electronic circuits |
KR101090440B1 (ko) * | 2003-12-08 | 2011-12-06 | 삼성전자주식회사 | 데이터 통신 시스템의 수신기에서 버퍼 데이터량 조정장치및 방법, 적응적 클럭 동기부를 갖는 실시간 데이터재생장치 및 방법 |
US20050165985A1 (en) | 2003-12-29 | 2005-07-28 | Vangal Sriram R. | Network protocol processor |
US7650285B2 (en) * | 2004-06-25 | 2010-01-19 | Numerex Corporation | Method and system for adjusting digital audio playback sampling rate |
CN101167373A (zh) * | 2005-04-21 | 2008-04-23 | 英特尔公司 | 交换机体系结构中的功率降低 |
US7461190B2 (en) * | 2005-08-11 | 2008-12-02 | P.A. Semi, Inc. | Non-blocking address switch with shallow per agent queues |
US20070133588A1 (en) * | 2005-12-09 | 2007-06-14 | Electronics And Telecommunications Research Institute | Scheduling apparatus and method in channel bonding transmission system |
WO2007077739A1 (ja) * | 2005-12-28 | 2007-07-12 | Matsushita Electric Industrial Co., Ltd. | 送信装置、及び受信装置 |
US8332793B2 (en) * | 2006-05-18 | 2012-12-11 | Otrsotech, Llc | Methods and systems for placement and routing |
US8108545B2 (en) * | 2007-08-27 | 2012-01-31 | International Business Machines Corporation | Packet coalescing in virtual channels of a data processing system in a multi-tiered full-graph interconnect architecture |
US8140830B2 (en) * | 2008-05-22 | 2012-03-20 | International Business Machines Corporation | Structural power reduction in multithreaded processor |
US7930373B2 (en) * | 2008-06-30 | 2011-04-19 | Broadcom Corporation | System and method for controlling a PHY attached to a MAC interface for energy efficient ethernet |
US8271811B2 (en) * | 2009-11-05 | 2012-09-18 | Lsi Corporation | Methods and apparatus for load-based power management of PHY logic circuits of a SAS device based upon a current workload |
-
2010
- 2010-03-29 US US12/748,794 patent/US8379659B2/en active Active
-
2011
- 2011-03-02 TW TW100106886A patent/TWI444023B/zh active
- 2011-03-29 WO PCT/US2011/030256 patent/WO2011126816A2/en active Application Filing
- 2011-03-29 EP EP11766442.5A patent/EP2553893B1/en active Active
- 2011-03-29 JP JP2013502712A patent/JP2013528970A/ja active Pending
- 2011-03-29 CN CN201180017347.1A patent/CN102823214B/zh active Active
- 2011-03-29 RU RU2012145865/08A patent/RU2566330C2/ru not_active IP Right Cessation
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08186600A (ja) * | 1995-01-05 | 1996-07-16 | Nippon Telegr & Teleph Corp <Ntt> | 蓄積交換網における中継輻輳検出方法 |
JPH1155276A (ja) * | 1997-08-01 | 1999-02-26 | Oki Electric Ind Co Ltd | シェーピング装置 |
JP2003069607A (ja) * | 2001-08-23 | 2003-03-07 | Nec Corp | Atm交換機およびその省電力方法 |
JP2007097126A (ja) * | 2005-09-05 | 2007-04-12 | Alaxala Networks Corp | ネットワーク接続装置の消費電力低減方法及び装置 |
JP2007074607A (ja) * | 2005-09-09 | 2007-03-22 | Alaxala Networks Corp | クロック制御を用いた低消費電力化データ処理回路 |
JP2009077377A (ja) * | 2007-08-27 | 2009-04-09 | Alaxala Networks Corp | ネットワーク中継装置 |
JP2009147615A (ja) * | 2007-12-13 | 2009-07-02 | Alaxala Networks Corp | パケット転送装置 |
JP2009253481A (ja) * | 2008-04-03 | 2009-10-29 | Alaxala Networks Corp | パケット転送装置 |
JP2009267546A (ja) * | 2008-04-23 | 2009-11-12 | Nec Corp | 情報通信機器、低消費電力回路及びそれらに用いる消費電力削減方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017511529A (ja) * | 2014-03-20 | 2017-04-20 | インテル コーポレイション | リンクインタフェースの使用されていないハードウェアの電力消費を制御するための方法、装置及びシステム |
JP2017142774A (ja) * | 2015-10-26 | 2017-08-17 | エイチジーエスティーネザーランドビーブイ | ネットワークオンチップ方法によるメモリバンクのためのファブリック相互接続 |
Also Published As
Publication number | Publication date |
---|---|
RU2012145865A (ru) | 2014-05-10 |
CN102823214A (zh) | 2012-12-12 |
EP2553893B1 (en) | 2014-10-08 |
TW201210275A (en) | 2012-03-01 |
WO2011126816A3 (en) | 2012-03-22 |
US20110235531A1 (en) | 2011-09-29 |
EP2553893A4 (en) | 2013-11-13 |
RU2566330C2 (ru) | 2015-10-20 |
CN102823214B (zh) | 2016-06-29 |
EP2553893A2 (en) | 2013-02-06 |
US8379659B2 (en) | 2013-02-19 |
WO2011126816A2 (en) | 2011-10-13 |
TWI444023B (zh) | 2014-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013528970A (ja) | ネットワークで使用される方法、装置及びシステム | |
Fu et al. | An abacus turn model for time/space-efficient reconfigurable routing | |
Kim et al. | Flattened butterfly topology for on-chip networks | |
CN107454003B (zh) | 一种可动态切换工作模式的片上网络路由器及方法 | |
Chang et al. | Path-congestion-aware adaptive routing with a contention prediction scheme for network-on-chip systems | |
JP4456154B2 (ja) | キャッシュメモリの動的再設定 | |
Guz et al. | Efficient link capacity and QoS design for network-on-chip | |
Catania et al. | Improving energy efficiency in wireless network-on-chip architectures | |
JP2012226776A (ja) | 中継器およびチップ回路 | |
CN112152932B (zh) | 片上网络路由控制方法、片上网络路由器及可读存储介质 | |
Baharloo et al. | ChangeSUB: a power efficient multiple network-on-chip architecture | |
Zoni et al. | Cutbuf: Buffer management and router design for traffic mixing in vnet-based nocs | |
Yin et al. | Energy-efficient non-minimal path on-chip interconnection network for heterogeneous systems | |
Neishaburi et al. | Reliability aware NoC router architecture using input channel buffer sharing | |
Xiang et al. | Bufferless network-on-chips with bridged multiple subnetworks for deflection reduction and energy savings | |
Kim et al. | A holistic approach to designing energy-efficient cluster interconnects | |
Ahn et al. | Low-power hybrid memory cubes with link power management and two-level prefetching | |
Xu et al. | Improving power and performance of on-chip network through virtual channel sharing and power gating | |
Keramati et al. | Thermal management in 3d networks-on-chip using dynamic link sharing | |
Li et al. | Latency criticality aware on-chip communication | |
US11108406B2 (en) | System, apparatus and method for dynamic priority-aware compression for interconnect fabrics | |
Rahmani et al. | Forecasting-based dynamic virtual channel management for power reduction in network-on-chips | |
Palumbo et al. | A novel non-exclusive dual-mode architecture for mpsocs-oriented network on chip designs | |
Fu et al. | The abacus turn model | |
Farrokhbakht | Reducing Reliance on Buffering and Virtual Channels in Networks-on-Chip |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140401 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140902 |