JP2013048413A - 拡張可能なネットワーク・オン・チップ - Google Patents

拡張可能なネットワーク・オン・チップ Download PDF

Info

Publication number
JP2013048413A
JP2013048413A JP2012182975A JP2012182975A JP2013048413A JP 2013048413 A JP2013048413 A JP 2013048413A JP 2012182975 A JP2012182975 A JP 2012182975A JP 2012182975 A JP2012182975 A JP 2012182975A JP 2013048413 A JP2013048413 A JP 2013048413A
Authority
JP
Japan
Prior art keywords
integrated circuit
serial
network
array
load balancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012182975A
Other languages
English (en)
Other versions
JP6116830B2 (ja
Inventor
Michel Harrand
ミシェル、アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kalray SA
Original Assignee
Kalray SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kalray SA filed Critical Kalray SA
Publication of JP2013048413A publication Critical patent/JP2013048413A/ja
Application granted granted Critical
Publication of JP6116830B2 publication Critical patent/JP6116830B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • G06F15/7825Globally asynchronous, locally synchronous, e.g. network on chip

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】プロセッサ・アレイの既存の開発ツールを変更することなく、計算能力を向上させる。
【解決手段】アレイ状に配置された計算ノードと、計算ノードを相互に接続するトーラス・トポロジのネットワーク・オン・チップと、アレイの各行または列の各端部にあって、2つの計算ノード間のネットワーク・リンクに挿入されたネットワーク拡張ユニットとを含む集積回路において、当該拡張ユニットは、2つの対応する計算ノード間にネットワーク・リンクの導通を確立する通常モードと、ネットワーク・リンクを、集積回路の外部からアクセス可能な2つの独立したセグメントに分割する拡張モードとを有する。
【選択図】図5

Description

本発明は、プロセッサがネットワーク・オン・チップ(NoC)によって相互に接続された、集積プロセッサ・アレイに関する。より詳細には、本発明は、プログラマからの最小限の支援で、開発ツールがアレイのプロセッサの数に適合することができるような規則性を有するプロセッサ・アレイのアーキテクチャに関する。
図1は、特許文献1に記載されるように、折畳みトーラス・トポロジ(folded torus topology)のネットワーク・オン・チップに配列された4×4の計算ノードNを含んだプロセッサ・アレイPAを概略的に示している。アレイ・トポロジでは、各ノードが、同じ行の2つの他のノード、および同じ列の2つの他のノードに、ポイント・ツー・ポイントの双方向リンクによって接続される。トーラス・トポロジでは、アレイのノードはまた、各行および各列でループ状に接続され、したがってすべてのノードが、アレイの縁端部に位置するノードを含めて、その相互接続に関して同じ物理構造を有する。図1に示す折畳みトポロジでは、各ノードが(アレイの縁端部に位置していない限り)、行および列において同じパリティの2つの他のノードに接続され、したがって、ノード間のリンクは実質的に同じ長さを有する。
各ノードNは、行および列の次のノードとの4つのリンク、すなわち北、南、東、および西のリンクと、例えば共有バスを介して相互に接続されたプロセッサ群など、処理ユニットとのリンクとを管理する5wayルータを含む。
プロセッサ・アレイPAは、単一の集積回路として製造される。外界と通信するために、プロセッサ・アレイは、アレイの縁端部でネットワーク・オン・チップに挿入された入力/出力IOユニットを含む。図のように、このようなIOユニットは、各行および各列の両端部に設けられることが可能である。より詳細には、各ユニットは、同じ行または同じ列の2つの末端ノードNを接続するリンクに挿入される。
各IOユニットは、ノードNとの2つのリンク、および入力/出力インタフェースとのリンクを管理する3wayルータを有する。入力/出力インタフェースは、プリント回路基板またはその他の基板の導電トラック(conductive track)と接触するように意図され、集積回路の金属パッドを介した回路の外部との通信を可能にする。
このようなプロセッサ・アレイのプログラミングを容易にするために、すべての計算ノードNは同様の特性を有し、開発ツールが自動モードでノードのいずれにもタスクをマップできるようにする。これを実現するために、IOユニットは、ネットワーク・オン・チップの内部通信にトランスペアレントに設計される。特許文献1はまた、内部通信のためにIOユニットのルータを介した待ち時間を削減するための解決法についても記載している。
集積回路を販売する際の標準化の目的で、プロセッサ・アレイのサイズは、比較的狭い範囲(range)で提供されることになる。したがって、この範囲の最大のアレイによってもたらされる計算能力は、さらに多くを求めるアプリケーションには不十分となる恐れがある。
米国特許出願公開第2011/0058569号公報
したがって、範囲の最大のプロセッサ・アレイで利用可能なものよりも大きな計算能力を提供する必要性がある。結果として、プロセッサ・アレイの既存の開発ツールを変更することなく、計算能力を向上させる必要性が生じる。
こうした必要性は、アレイ状に配置された計算ノードと、この計算ノードを相互に接続するトーラス・トポロジのネットワーク・オン・チップと、アレイの各行または列の各端部にあるネットワーク拡張ユニットとを含む集積回路によって対処される。拡張ユニットは、2つの対応する計算ノード間にネットワーク・リンクの導通(continuity)を確立する通常モードと、ネットワーク・リンクを、集積回路外からアクセス可能な2つの独立したセグメントに分割する拡張モードとを有する。
一実施形態によれば、ネットワーク・リンクは、パラレルのバスを含み、拡張ユニットは、セグメントに対して、セグメントにおいて並列に与えられるデータを、回路の第1の外部端子において直列に送信するための出(outgoing)シリアル・チャネルを形成する並列/直列変換器と、集積回路の第2の外部端子において直列に到着するデータを、セグメントにおいて並列に送信するための入(incoming)シリアル・チャネルを形成する直列/並列変換器とを含む。
一実施形態によれば、集積回路は、行または列の端部にある計算ノード間のリンクに位置し入力/出力端子を介して集積回路の外部と通信するように構成された、入力/出力インタフェースを含み、拡張ユニットは、拡張モードでは、上記入力/出力端子を上記セグメントに接続するように構成される。
一実施形態によれば、集積回路は、出伝送(outgoing transmission)が進行中の複数のセグメント間に利用可能な出シリアル・チャネル(outgoing serial channnel)を割り当てるように構成された、アレイの同じ縁端部の拡張ユニットに共通の負荷分散装置を含む。
一実施形態によれば、負荷分散装置は、各出シリアル伝送のヘッダに送信元セグメントの識別情報を挿入するように構成される。
一実施形態によれば、負荷分散装置は、各入シリアル伝送(incoming serial channnel)のヘッダを解析(parse)し、対応するシリアル・チャネルをヘッダで識別されるセグメントに切り換えるように構成される。
一実施形態によれば、シリアル・チャネルは、データをパケットで送信し、伝送待ちのパケットを格納するための待ち行列(queue)を含み、負荷分散装置は、最も空いている待ち行列を有するシリアル・チャネルにパケットを転送する(routing)ように構成される。
他の利点および特徴は、例示の目的のみで提供され、添付の図面に示される本発明の特定の実施形態についての次の説明から、より明らかになるであろう。
前述の、折畳みトーラス・トポロジのネットワーク・オン・チップによって相互に接続されたプロセッサ・アレイを表す図である。 複数のプロセッサ・アレイで形成されたマクロ・アレイを示す図である。 トポロジを保存しながらネットワークを拡張することができる、マクロ・アレイの2つの隣接するアレイ間の望ましい相互接続を示す図である。 ネットワーク拡張ユニットの一実施形態を示す図である。 ネットワーク拡張ユニットの別の実施形態を示す図である。
図2は、標準的な集積回路の形態で、単一のプロセッサ・アレイによって提供される利用可能な計算能力が不十分であるとき、この利用可能な計算能力を向上させるための考えられる解決法を示している。図示されるように、要求される計算能力を実現するために十分なサイズのマクロ・アレイで、いくつかのプロセッサ・アレイPA1、PA2、……が、プリント回路基板などの基板上に組み立てられる。
各PAアレイは、個々にプログラムされて使用されることが可能であるが、これは、タスクを計算能力に関して個々のバランスの取れたサブタスクに分割するために、プログラマの側に労力を要することになる。アレイは通常、それ独自のオペレーティング・システムを実行し、したがって自律的であるように設計されていながら、アレイ間でサブタスクを分散させるために、オペレーティング・システムがアレイ外で実行される必要もある。
この複雑さを避けるために、マクロ・アレイが、開発ツールの観点からただ1つのプロセッサ・アレイとしてみなされることが望まれる。これを実現するために、すべてのPAアレイの計算ノードが一体となってただ1つのネットワークを形成することが好ましい。
これについての考えられる解決法は、PAアレイをその入力/出力インタフェースによって互いに接続し、2つの隣接するアレイのインタフェース間で2wayネットワーク接続をエミュレートすることである。それでもやはり、このようなエミュレーションは、マクロ・アレイを形成するアレイのサイズおよび数に左右される、さらなるソフトウェアの複雑さを伴う。
また、この解決法は、入力/出力インタフェースがすべて同一であること、およびすべての行および列の端部がこのようなインタフェースを取り付けられることが必要となる。実際には、標準的なプロセッサ・アレイには、限られた数の入力/出力インタフェースしかなく、これらは困難である。
図3は、折畳みトーラス・トポロジのアレイの状況で、2つの隣接するアレイ、すなわちPA1およびPA2の間で望まれる、2つのアレイのネットワーク・オン・チップが同じトポロジの単一ネットワークを形成することができるようになる接続のタイプを示している。図示した例は、アレイの行によってネットワークの拡張に対応しており、同じ原理が列についても言えることに注意されたい。
アレイPA1の各列では、最後の2つのノードNとその入力/出力ユニットIOとのリンクはオープンである(この位置にIOユニットがない場合、最後の2つのノード間のリンクがオープンである)。同様に、アレイPA2の相応する行では、初めの2つのノードNとその入力/出力ユニットIOとの間のリンクはオープンである(この位置にIOユニットがない場合、最初の2つのノード間のリンクがオープンである)。点線で図示された、このようにオープンされた内部リンクは、外部リンクLe1およびLe2で置き換えられ、アレイPA1の行とアレイPA2の相応する行との接合部を確保して、内部の行と同じトポロジの拡張された行を形成する。これを実現するために、リンクLe1は、アレイPA1の行の最後から2番目のノードをアレイPA2の行の1番目のノードに接続し、リンクLe2は、アレイPA1の行の最後のノードをアレイPA2の行の2番目のノードに接続する。
実際の実施では、このように外部リンクで「置き換えられる」各内部リンクは、外部から別々にアクセス可能なようにされた2つのセグメントに分割される。したがって、入力/出力ユニットIOを横切る場合、行の最後の2つのノード間の内部リンクは、2つのセグメントに分割されて、それぞれ外部リンクLe1およびLe2によって、隣接する回路の相応する(homologous)セグメントと接続する。
この拡張には折畳みトーラス・トポロジが特に適切であることに注意されたい。実際に、アレイの各行の外部リンクによって影響を及ぼされる2つのノードは、縁端部に最も近いノードである。
また、アレイPA1およびPA2の対向縁端部のIOユニットは、もはや使用されないことに注意されたい。これは、IOユニットが周辺部にある、個々のアレイと同じトポロジを有するマクロ・アレイを作成したいという要望と合致するものである。
したがって、拡張される列および行が、個々のPA回路の行および列と同じ折畳みトーラス・トポロジを有する構成で、いくつかの隣接するPA回路にわたって行および列を拡張することが可能である。
このように形成されるマクロ・アレイは、従来のPAアレイのものと同じ開発ツールを使用してプログラムされることが可能である。実際には、従来のアレイの規則性およびノードNの互換性を考えると、開発ツールは、アレイの寸法で構成され、自動化された方法で様々なノード上にタスクをマップし、ネットワーク・オン・チップを介してノード間のコミュニケーション図を構築するだけでよい。従来のアレイのトポロジを全体にわたって有するマクロ・アレイの場合には、既存の開発ツールは、計算ノードに関してマクロ・アレイの新しい寸法で構成されるだけでよい。
図4は、2つの隣接するアレイPA1およびPA2の2つの行間の外部接続Le1およびLe2を確立するための構造の詳細な実施形態を示している。通常、ノードN間の内部リンクは、多くの導電線を有するバスである。アレイを組み込んでいる集積回路は、多くの場合十分な外部接触端子を有することはないので、外部リンクLe1およびLe2が同数の線を有することによってこうしたバスを拡張することは、実際には可能ではない。この複雑化を避けるために、各外部リンクLe1、Le2が、高速シリアル・リンクの形態で提供される。要するに、内部リンクは双方向なので、各外部リンクLe1、Le2は、図示されるように、反対方向の2つのシリアル・リンクを含む。各外部リンクLe1、Le2は、それゆえ各集積回路PA上に2つの接触端子40を必要とするだけである。こうした端子は、リンクLe2について示すように、使用されない入力/出力インタフェースIOから取り込まれることが可能である。
端子40を適切に配置することによって、すなわち、2つの隣接する回路PAの間で相互に接続するための端子が向かい合うようにして、回路は、互いの近くに配置されて、回路間のシリアル・リンクの導電トラックを短くすることが可能である。このようにトラックを(ミリメートルの水準まで)短くすることによって、またシリアル・インタフェースは標準に従う必要がないので、シリアル信号には約10Gb/sの、特に高伝送レートが達成されることが可能である。
アレイPAの行および列の各端部は、拡張ユニット42を装備されている。ユニット42は、各外部リンクLe1、Le2用のシリアル/パラレル/シリアル変換器(SERDES)を含んでおり、これは、出シリアル・リンク上で内部パラレル・データをシリアル・ストリームに変換し、シリアルの入データをパラレルの内部データ・フローに変換する。パラレル・フローは、外部リンクLe1、Le2とそれぞれ関連するスイッチS1、S2を通過する。スイッチS1およびS2は、ネットワーク拡張信号EXTによって制御される。
信号EXTが非アクティブであるとき、ユニット42は通常モードである。スイッチS1およびS2は、アレイPAの従来の独立型(standalone)の構成で、ノードNの最後のペアをその入力/出力ユニットIOに接続する。ユニットIOがない場合、スイッチS1とS2との間に直接リンクがある。
信号EXTがアクティブであるとき、ユニット42は「ネットワーク拡張」モードである。スイッチS1およびS2は、図3の構成で回路PAを配置して、ノードのペアをそのそれぞれのSERDES変換器に接続する。
信号EXTは、回路PAの同じ縁端部のすべての拡張ユニット42に共通であることが好ましい。したがって、回路PAごとに4つの信号EXTが提供され、マクロ・アレイにおける回路PAの位置に基づいて、回路の各縁端部で拡張ユニット42を別々に制御する。信号EXTの状態は、例えばプログラム可能な構成レジスタに格納される。
2つの隣接するPA回路間では高速シリアル接続が実現されることが可能であるが、場合によっては、内部のパラレル・リンクの流量(flow rate)を達成しない。その場合、拡張されたネットワークは、2つのPA回路間の境界(frontier)で帯域幅の制限を有する可能性があり、それによって、マクロ・アレイにより実現される性能は、PA回路の数に比例しない可能性がある。
図5は、2つのPA回路間の境界における平均帯域幅を増大させるための実施形態を示している。この図では、ユニット42はその「ネットワーク拡張」モードで示されており、明確にするために、ユニットIOなど、通常モードで使用される要素は示されていない。この実施形態は、外部リンクの使用を最適化することを目指しており、しばしばリンク間で、詳細には出リンク間で、有用な帯域幅が不均一に分配されるという仮定に基づいている。出シリアル・チャネルの帯域幅は、実際の出伝送間で動的に割り当てられる。各行(または列)については、回路の同じ縁端部に2つの出チャネルがあり、それぞれ外部シリアル・リンクLe1およびLe2と関連付けられる。PA回路がM行(または列)を有する場合、回路の1つの縁端部には2Mの出シリアル・チャネルがある。
アレイの縁端部のすべての拡張ユニット42のスイッチS1およびS2は、出シリアル・チャネルの利用可能性に応じて、出パラレル・フローを1つまたは複数のSERDES変換器に切り換えることを担う負荷分散装置LBによって置き換えられる。
図5の例では、リンクLe2を通って第1の行から出る伝送は、並行してリンクLe1の利用可能な出チャネルを借用する。例えばパケットによって負荷分散が実現され、回路PA1の右上のノードからの一部のパケットはリンクLe1を利用し、他のパケットはリンクLe2を利用する。
この図はまた、4番目の行のリンクLe2を通って出る伝送を示しており、これは、並行して2番目の行および3番目の行のリンクLe2の出チャネルを借用する。
シリアル伝送は、通常パケット化される。各シリアル・チャネルは、送信されるパケットがスタックされる送信待ち行列を有する。負荷分散に割り当てられる可能性があるシリアル・チャネルの決定は、例えばチャネルの待ち行列充填レベル(queue fill level)を使用して実現されることが可能であり、アウトバウンド(outbound)のパケットは、負荷分散装置に到着時に最も空いている待ち行列に転送されることになる。
送信PA回路(PA1)によって実行される、負荷分散機能の一部については、上述した。機能の残りの部分は、受信回路(PA2)の負荷分散装置LBによって行われる。送信回路、すなわち出シリアル・チャネルを割り当てられた回路(PA1)の負荷分散装置は、進行中の送信およびその出所の内部リンクを識別する。受信回路(PA2)の負荷分散装置は、識別情報を検索し、入シリアル・チャネルを識別された内部リンクへリダイレクト(redirect)する。
この識別情報は、Interlakenプロトコルのような標準的なシリアル伝送プロトコルに従って、シリアル伝送に含まれるヘッダに挿入されることが可能である。
回路PA2が回路PA1に送信するデータを有する場合、送信は、回路PA1およびPA2について説明した役割を逆にすることによって実現される。一方向および他方向の送信は、別個のシリアル・チャネルを借用し、それによって、両方の送信が同時にかつ独立して行われることが可能である。
説明したように、動作中の負荷分散装置LBを動的に使用することによって、内部リンクよりも少ない双方向シリアル・チャネルを提供することが可能である。一部の応用では、例えば、2つまたは4つの内部リンクに対して1つの双方向シリアル・チャネルを提供すれば十分である場合がある。これにより、回路の外部端子の数、および特にSERDES変換器に占められる表面積を削減する。負荷分散装置は、上述と同じ方法で動作し、割り当てるシリアル・チャネルのプールがより小さくなるだけである。
外部から拡張できるネットワーク・オン・チップの諸実施形態が、個々の回路に設計された既存の開発ツールとの互換性を維持しながら、プロセッサ・アレイの無限の拡張性を実現するという文脈で提示された。こうした開発ツールは、拡張されたアレイのサイズで構成されるだけでよい。
開発ツールが進化して、回路間の外部リンクの特異性を考慮に入れる可能性があることは排除されない。この場合、負荷分散装置を使用して出パケットを動的に転送する代わりに、パケットのヘッダに配置された経路情報を使用して、シリアル・チャネルが、プログラム時に静的に割り当てられることが可能である。負荷分散装置は、ヘッダの情報に基づいてパッケージをシリアル・チャネルに向けるルータに置き換えられる。
40 端子
42 拡張ユニット
N 計算ノード
PA プロセッサ・アレイ
IO 入力/出力ユニット
Le1,Le2 外部リンク
S1,S2 スイッチ
EXT ネットワーク拡張信号
LB 負荷分散装置

Claims (12)

  1. 集積回路であって、
    アレイ状に配置された計算ノードと、
    パラレルのバス・リンクを介して前記計算ノードを相互に接続するトーラス・トポロジのネットワーク・オン・チップと、
    前記アレイの各行または列の各端部にあり、かつ2つの計算ノード間の前記バスに挿入されたネットワーク拡張ユニットであって、前記2つの対応する計算ノード間に前記バスの導通を確立する通常モード、および前記バスを2つの独立したバス・セグメントに分割する拡張モードを有する、ネットワーク拡張ユニットと、
    バス・セグメントにおいて並列に与えられるデータを、前記集積回路の第1の外部端子において直列に送信するための出シリアル・チャネルをそれぞれ形成する一連の並列/直列変換器と、
    前記集積回路の第2の外部端子において直列に到着するデータを、バス・セグメントにおいて並列に送信するための入シリアル・チャネルをそれぞれ形成する一連の直列/並列変換器と、
    前記アレイの同じ縁端部の前記ネットワーク拡張ユニットに共通の負荷分散装置であって、アウトバウンド送信が進行中である複数の前記バス・セグメント間に利用可能な出シリアル・チャネルを割り当てるように構成された、負荷分散装置と、
    を備える、集積回路。
  2. 前記集積回路の前記第1および第2の外部端子が、通常モードで、前記行または列の前記端部にある計算ノード間のリンクに位置する入力/出力インタフェースに接続された、請求項1に記載の集積回路。
  3. 前記負荷分散装置が、各出シリアル伝送のヘッダに、送信元の前記バス・セグメントの識別子を挿入するように構成された、請求項1に記載の集積回路。
  4. 前記負荷分散装置が、各入シリアル伝送のヘッダを解析し、前記対応するシリアル・チャネルを前記ヘッダで識別されるバス・セグメントに切り換えるように構成された、請求項3に記載の集積回路。
  5. 前記シリアル・チャネルが、データをパケットで送信し、伝送待ちのパケットの待ち行列を含み、前記負荷分散装置が、最も空いている待ち行列を有する前記シリアル・チャネルにパケットを転送するように構成された、請求項1に記載の集積回路。
  6. 集積回路であって、
    アレイ状に配置された計算ノードと、
    前記計算ノードを相互に接続するトーラス・トポロジのネットワーク・オン・チップと、
    前記アレイの各行または列の各端部にあり、かつ2つの計算ノード間のネットワーク・リンクに挿入されたネットワーク拡張ユニットであって、
    前記2つの対応する計算ノード間に前記ネットワーク・リンクの導通を確立する通常モードと、
    前記ネットワーク・リンクを、前記集積回路の外部からアクセス可能な2つの独立したセグメントに分割する拡張モードと、
    を有する、ネットワーク拡張ユニットと、
    を備える、集積回路。
  7. 前記ネットワーク・リンクがパラレルのバスを備え、前記ネットワーク拡張ユニットがセグメントに対して、
    前記セグメントにおいて並列に与えられるデータを、前記集積回路の第1の外部端子において直列に送信するための出シリアル・チャネルを形成する並列/直列変換器と、
    前記集積回路の第2の外部端子において直列に到着するデータを、前記セグメントにおいて並列に送信するための入シリアル・チャネルを形成する直列/並列変換器と
    を備える、請求項6に記載の集積回路。
  8. 前記行または列の前記端部にある計算ノード間の前記ネットワーク・リンクに位置する入力/出力インタフェースであって、入力/出力端子を介して前記集積回路の前記外部と通信するように構成された、入力/出力インタフェースを備え、前記ネットワーク拡張ユニットが、拡張モードでは、前記入力/出力端子を前記セグメントに接続するように構成された、請求項6に記載の集積回路。
  9. 前記アレイの同じ縁端部の前記ネットワーク拡張ユニットに共通の負荷分散装置であって、出伝送が進行中である複数の前記セグメント間に利用可能な出シリアル・チャネルを割り当てるように構成された、負荷分散装置を備える、請求項7に記載の集積回路。
  10. 前記負荷分散装置が、各出シリアル伝送のヘッダに、送信元の前記セグメントの識別子を挿入するように構成された、請求項9に記載の集積回路。
  11. 前記負荷分散装置が、各入シリアル伝送の前記ヘッダを解析し、前記対応するシリアル・チャネルを前記ヘッダで識別される前記セグメントに切り換えるように構成された、請求項10に記載の集積回路。
  12. 前記シリアル・チャネルが、データをパケットで送信し、伝送待ちのパケットを格納するための待ち行列を含み、前記負荷分散装置が、最も空いている待ち行列を有する前記シリアル・チャネルにパケットを転送するように構成された、請求項9に記載の集積回路。
JP2012182975A 2011-08-23 2012-08-22 拡張可能なネットワーク・オン・チップ Active JP6116830B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1157471 2011-08-23
FR1157471A FR2979444A1 (fr) 2011-08-23 2011-08-23 Reseau sur puce extensible

Publications (2)

Publication Number Publication Date
JP2013048413A true JP2013048413A (ja) 2013-03-07
JP6116830B2 JP6116830B2 (ja) 2017-04-19

Family

ID=46604236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012182975A Active JP6116830B2 (ja) 2011-08-23 2012-08-22 拡張可能なネットワーク・オン・チップ

Country Status (5)

Country Link
US (1) US9064092B2 (ja)
EP (1) EP2562654B1 (ja)
JP (1) JP6116830B2 (ja)
CN (1) CN103020009B (ja)
FR (1) FR2979444A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8885510B2 (en) 2012-10-09 2014-11-11 Netspeed Systems Heterogeneous channel capacities in an interconnect
US9130856B2 (en) * 2013-01-28 2015-09-08 Netspeed Systems Creating multiple NoC layers for isolation or avoiding NoC traffic congestion
US9471726B2 (en) 2013-07-25 2016-10-18 Netspeed Systems System level simulation in network on chip architecture
US9473388B2 (en) 2013-08-07 2016-10-18 Netspeed Systems Supporting multicast in NOC interconnect
US9501449B2 (en) * 2013-09-10 2016-11-22 Sviral, Inc. Method, apparatus, and computer-readable medium for parallelization of a computer program on a plurality of computing cores
US9699079B2 (en) 2013-12-30 2017-07-04 Netspeed Systems Streaming bridge design with host interfaces and network on chip (NoC) layers
US9473415B2 (en) 2014-02-20 2016-10-18 Netspeed Systems QoS in a system with end-to-end flow control and QoS aware buffer allocation
US9553762B1 (en) * 2014-06-26 2017-01-24 Altera Corporation Network-on-chip with fixed and configurable functions
US9742630B2 (en) 2014-09-22 2017-08-22 Netspeed Systems Configurable router for a network on chip (NoC)
US9571341B1 (en) 2014-10-01 2017-02-14 Netspeed Systems Clock gating for system-on-chip elements
US9660942B2 (en) 2015-02-03 2017-05-23 Netspeed Systems Automatic buffer sizing for optimal network-on-chip design
US9444702B1 (en) 2015-02-06 2016-09-13 Netspeed Systems System and method for visualization of NoC performance based on simulation output
US9568970B1 (en) 2015-02-12 2017-02-14 Netspeed Systems, Inc. Hardware and software enabled implementation of power profile management instructions in system on chip
US9928204B2 (en) 2015-02-12 2018-03-27 Netspeed Systems, Inc. Transaction expansion for NoC simulation and NoC design
US10050843B2 (en) 2015-02-18 2018-08-14 Netspeed Systems Generation of network-on-chip layout based on user specified topological constraints
US10348563B2 (en) 2015-02-18 2019-07-09 Netspeed Systems, Inc. System-on-chip (SoC) optimization through transformation and generation of a network-on-chip (NoC) topology
US9825809B2 (en) 2015-05-29 2017-11-21 Netspeed Systems Dynamically configuring store-and-forward channels and cut-through channels in a network-on-chip
US9864728B2 (en) 2015-05-29 2018-01-09 Netspeed Systems, Inc. Automatic generation of physically aware aggregation/distribution networks
US10218580B2 (en) 2015-06-18 2019-02-26 Netspeed Systems Generating physically aware network-on-chip design from a physical system-on-chip specification
CN105187313B (zh) * 2015-09-25 2018-05-01 东北大学 一种片上网络拓扑结构及其自适应路由方法
US10924416B2 (en) * 2016-03-23 2021-02-16 Clavister Ab Method for traffic shaping using a serial packet processing algorithm and a parallel packet processing algorithm
US10452124B2 (en) 2016-09-12 2019-10-22 Netspeed Systems, Inc. Systems and methods for facilitating low power on a network-on-chip
US20180159786A1 (en) 2016-12-02 2018-06-07 Netspeed Systems, Inc. Interface virtualization and fast path for network on chip
US10313269B2 (en) 2016-12-26 2019-06-04 Netspeed Systems, Inc. System and method for network on chip construction through machine learning
US10063496B2 (en) 2017-01-10 2018-08-28 Netspeed Systems Inc. Buffer sizing of a NoC through machine learning
US10084725B2 (en) 2017-01-11 2018-09-25 Netspeed Systems, Inc. Extracting features from a NoC for machine learning construction
US10469337B2 (en) 2017-02-01 2019-11-05 Netspeed Systems, Inc. Cost management against requirements for the generation of a NoC
US10298485B2 (en) 2017-02-06 2019-05-21 Netspeed Systems, Inc. Systems and methods for NoC construction
US10547514B2 (en) 2018-02-22 2020-01-28 Netspeed Systems, Inc. Automatic crossbar generation and router connections for network-on-chip (NOC) topology generation
US10983910B2 (en) 2018-02-22 2021-04-20 Netspeed Systems, Inc. Bandwidth weighting mechanism based network-on-chip (NoC) configuration
US10896476B2 (en) 2018-02-22 2021-01-19 Netspeed Systems, Inc. Repository of integration description of hardware intellectual property for NoC construction and SoC integration
US11144457B2 (en) 2018-02-22 2021-10-12 Netspeed Systems, Inc. Enhanced page locality in network-on-chip (NoC) architectures
US11176302B2 (en) 2018-02-23 2021-11-16 Netspeed Systems, Inc. System on chip (SoC) builder
US11023377B2 (en) 2018-02-23 2021-06-01 Netspeed Systems, Inc. Application mapping on hardened network-on-chip (NoC) of field-programmable gate array (FPGA)
US11665776B2 (en) * 2019-12-27 2023-05-30 Arteris, Inc. System and method for synthesis of a network-on-chip for deadlock-free transformation
US11921668B2 (en) * 2020-09-30 2024-03-05 Beijing Tsingmicro Intelligent Technology Co., Ltd. Processor array and multiple-core processor
CN113438301B (zh) * 2021-06-22 2023-06-06 北京百度网讯科技有限公司 网络负载均衡器、请求消息分配方法、程序产品及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6373736A (ja) * 1986-09-17 1988-04-04 Fujitsu Ltd 方路内回線選択制御方式
JPH04153864A (ja) * 1990-10-18 1992-05-27 Sanyo Electric Co Ltd 並列処理計算機
JPH06290158A (ja) * 1993-03-31 1994-10-18 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JPH06325005A (ja) * 1993-05-14 1994-11-25 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JPH09153889A (ja) * 1995-11-13 1997-06-10 Cselt Spa (Cent Stud E Lab Telecomun) 高速デジタル信号用のシリアル化−パラレル化回路
JP2006215816A (ja) * 2005-02-03 2006-08-17 Fujitsu Ltd 情報処理システムおよび情報処理システムの制御方法
JP2008131602A (ja) * 2006-11-24 2008-06-05 Kddi Corp パス選択装置およびパス選択方法、通信中継装置
JP2011061775A (ja) * 2009-09-04 2011-03-24 Kalray 入出力ノードオンチップネットワーク

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942517A (en) * 1987-10-08 1990-07-17 Eastman Kodak Company Enhanced input/output architecture for toroidally-connected distributed-memory parallel computers
US5689647A (en) * 1989-03-14 1997-11-18 Sanyo Electric Co., Ltd. Parallel computing system with processing element number setting mode and shortest route determination with matrix size information
US5134690A (en) * 1989-06-26 1992-07-28 Samatham Maheswara R Augumented multiprocessor networks
US5701434A (en) * 1995-03-16 1997-12-23 Hitachi, Ltd. Interleave memory controller with a common access queue
US5892962A (en) * 1996-11-12 1999-04-06 Lucent Technologies Inc. FPGA-based processor
US6205532B1 (en) * 1998-05-22 2001-03-20 Avici Systems, Inc. Apparatus and methods for connecting modules using remote switching
KR100277167B1 (ko) * 1998-06-05 2001-01-15 윤덕용 가상버스들을사용한연결망을갖는분산컴퓨팅시스템및데이터통신방법
US20040236891A1 (en) * 2003-04-28 2004-11-25 International Business Machines Corporation Processor book for building large scalable processor systems
US7598958B1 (en) * 2004-11-17 2009-10-06 Nvidia Corporation Multi-chip graphics processing unit apparatus, system, and method
US7965725B2 (en) * 2005-05-31 2011-06-21 Stmicroelectronics, Inc. Hyper-ring-on-chip (HyRoC) architecture
KR100730279B1 (ko) * 2005-12-16 2007-06-19 삼성전자주식회사 스타 토로스 토폴로지를 이용하여 칩 상의 디바이스를연결한 컴퓨터 칩
WO2008004185A2 (en) * 2006-07-05 2008-01-10 Nxp B.V. Electronic device, system on chip and method for monitoring data traffic
WO2008080122A2 (en) * 2006-12-22 2008-07-03 The Trustees Of Columbia University In The City Of New York Systems and method for on-chip data communication
US8531943B2 (en) * 2008-10-29 2013-09-10 Adapteva Incorporated Mesh network
US20100158005A1 (en) * 2008-12-23 2010-06-24 Suvhasis Mukhopadhyay System-On-a-Chip and Multi-Chip Systems Supporting Advanced Telecommunication Functions
FR2951868B1 (fr) * 2009-10-28 2012-04-06 Kalray Briques de construction d'un reseau sur puce
US20140237156A1 (en) * 2012-10-25 2014-08-21 Plx Technology, Inc. Multi-path id routing in a pcie express fabric environment

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6373736A (ja) * 1986-09-17 1988-04-04 Fujitsu Ltd 方路内回線選択制御方式
JPH04153864A (ja) * 1990-10-18 1992-05-27 Sanyo Electric Co Ltd 並列処理計算機
JPH06290158A (ja) * 1993-03-31 1994-10-18 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JPH06325005A (ja) * 1993-05-14 1994-11-25 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JPH09153889A (ja) * 1995-11-13 1997-06-10 Cselt Spa (Cent Stud E Lab Telecomun) 高速デジタル信号用のシリアル化−パラレル化回路
JP2006215816A (ja) * 2005-02-03 2006-08-17 Fujitsu Ltd 情報処理システムおよび情報処理システムの制御方法
JP2008131602A (ja) * 2006-11-24 2008-06-05 Kddi Corp パス選択装置およびパス選択方法、通信中継装置
JP2011061775A (ja) * 2009-09-04 2011-03-24 Kalray 入出力ノードオンチップネットワーク

Also Published As

Publication number Publication date
US20130054811A1 (en) 2013-02-28
JP6116830B2 (ja) 2017-04-19
CN103020009A (zh) 2013-04-03
FR2979444A1 (fr) 2013-03-01
CN103020009B (zh) 2017-06-09
US9064092B2 (en) 2015-06-23
EP2562654A1 (fr) 2013-02-27
EP2562654B1 (fr) 2014-10-22

Similar Documents

Publication Publication Date Title
JP6116830B2 (ja) 拡張可能なネットワーク・オン・チップ
KR101937211B1 (ko) 상호 연결에서 이종 채널 용량
US8284766B2 (en) Multi-core processor and method of communicating across a die
KR100600928B1 (ko) 프로세서 북 및 데이터 처리 시스템
US9825809B2 (en) Dynamically configuring store-and-forward channels and cut-through channels in a network-on-chip
EP1891778B1 (en) Electronic device and method of communication resource allocation.
US6275975B1 (en) Scalable mesh architecture with reconfigurable paths for an on-chip data transfer network incorporating a network configuration manager
US20200236064A1 (en) FPGA-based virtual fabric for data center computing
US20080209163A1 (en) Data processing system with backplane and processor books configurable to suppprt both technical and commercial workloads
CN107957967A (zh) 经高速串行链路的配置
CN112214445A (zh) RapidIO交换网络数据速率可重配置硬件电路
US7987313B2 (en) Circuit of on-chip network having four-node ring switch structure
CN116260760A (zh) 一种在多芯粒互连网络中基于流量感知的拓扑重构方法
US20190075158A1 (en) Hybrid io fabric architecture for multinode servers
Ahmed et al. Contention-free routing for hybrid photonic mesh-based network-on-chip systems
TWI417741B (zh) 動態調整通道方向之方法及使用其之晶片網路架構
Ellinidou et al. MicroLET: A new SDNoC-based communication protocol for chipLET-based systems
KR20150028520A (ko) 메모리 중심 시스템 인터커넥트 구조
Lusala et al. A hybrid router combining sdm-based circuit swictching with packet switching for on-chip networks
WO2015147840A1 (en) Modular input/output aggregation zone
JP2005157653A (ja) データ処理装置および処理方法
Darbani et al. A reconfigurable Network-on-Chip architecture to improve overall performance and throughput
JP5943115B1 (ja) 集積回路、半導体装置、カード及びデータ転送方法
WO2019193598A1 (en) A rapidio® network for achieving load balancing
US20230280907A1 (en) Computer System Having Multiple Computer Devices Each with Routing Logic and Memory Controller and Multiple Computer Devices Each with Processing Circuitry

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170322

R150 Certificate of patent or registration of utility model

Ref document number: 6116830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250