JP7239099B2 - TSV Error Tolerant Router Device for 3D Network-on-Chip - Google Patents
TSV Error Tolerant Router Device for 3D Network-on-Chip Download PDFInfo
- Publication number
- JP7239099B2 JP7239099B2 JP2017218953A JP2017218953A JP7239099B2 JP 7239099 B2 JP7239099 B2 JP 7239099B2 JP 2017218953 A JP2017218953 A JP 2017218953A JP 2017218953 A JP2017218953 A JP 2017218953A JP 7239099 B2 JP7239099 B2 JP 7239099B2
- Authority
- JP
- Japan
- Prior art keywords
- router
- tsv
- routers
- cluster
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002950 deficient Effects 0.000 claims description 27
- 229910052710 silicon Inorganic materials 0.000 claims description 5
- 239000010703 silicon Substances 0.000 claims description 5
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 2
- 239000010410 layer Substances 0.000 description 16
- 230000007547 defect Effects 0.000 description 13
- 238000000034 method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 239000011229 interlayer Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 235000012431 wafers Nutrition 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、3DネットワークオンチップのためのTSV誤り耐容ルータ装置に関する。 The present invention relates to a TSV error tolerant router device for 3D network-on-chip.
スルーシリコンビア(Through Silicon Via,以降、TSV)は、3Dネットワークオンチップ(3D-NoCs)並びに3D-集積回路(以降、3D-ICs)においてレイヤ間ワイヤとして機能する。ビアを形成し、ウェハーを薄くし、熱圧縮を実行することによりTSVが確立され、二つのウェハーがTSVを通して接続される。TSVは、通常、規則的にグループ、即ちクラスタに形成され、あるいは、不規則的にランダム位置に形成される。 Through Silicon Vias (TSVs) serve as inter-layer wires in 3D networks on chips (3D-NoCs) as well as 3D-integrated circuits (3D-ICs). A TSV is established by forming a via, thinning the wafer, performing thermal compression, and connecting the two wafers through the TSV. TSVs are usually formed into groups, or clusters, on a regular basis, or irregularly in random locations.
TSVは、3D-NoCsに対する多くの優位性を与えるが、その主要な欠点の一つが信頼性である。TSVを有する3D-NoCsの生産性が、製造工程における不完全性による重大な要素として考えられている。 Although TSV offers many advantages over 3D-NoCs, one of its major drawbacks is reliability. The productivity of 3D-NoCs with TSVs is considered a critical factor due to imperfections in the manufacturing process.
TSVの欠陥率は、0.63%と報告されている(非特許文献1)。さらに、3D-NoCsは、製造物質間の熱拡張係数の差に基づくストレスの影響を受ける。2つのレイヤ間の温度変化は10℃に達し、時間依存誘電破壊(Time Dependent Dielectric Breakdown)と熱サイクル(Thermal Cycling)に悪影響を与えることが報告されている。電界移動がまた主要な関心であるというも忘れてはならない。 The defect rate of TSV is reported to be 0.63% (Non-Patent Document 1). In addition, 3D-NoCs are subject to stress based on differences in thermal expansion coefficients between materials of manufacture. It has been reported that the temperature change between the two layers can reach 10°C, adversely affecting Time Dependent Dielectric Breakdown and Thermal Cycling. It should also be remembered that electric field transfer is also of major interest.
結果として、3D-NoCsにおけるTSVは、製造段階のみでなく動作時間中において、より欠陥になり易い。したがって、製造中及び製造後においての3D-NoCsにおける欠陥耐容の必要性は、避けられないことである。 As a result, TSVs in 3D-NoCs are more prone to defects not only during manufacturing, but also during operation. Therefore, the need for defect tolerance in 3D-NoCs during and after fabrication is inevitable.
TSVの欠陥は、3つのタイプに分類でき、オープン(空)、ブリッジと縮退故障である。オープン欠陥は、TSVが破壊され、その両端が電気的に非接続の時に生じる。ブリッジ欠陥は、2又はそれ以上のTSVが接続したときに現れる。結果として、これらのTSVは、異なる値を伝達できない。縮退故障は、TSVをグランド、または、出力が常時‘1’又は‘0’になるVddに短絡する。もしTSVが、部分的に欠陥であると、極端な遅延が生じ、時間要件を満たさなくなる。 TSV defects can be classified into three types: open (empty), bridging and stuck-at faults. An open defect occurs when a TSV is broken and both ends are electrically disconnected. A bridging defect appears when two or more TSVs are connected. As a result, these TSVs cannot convey different values. A stuck-at fault shorts TSV to ground or Vdd where the output is always '1' or '0'. If the TSV is partially defective, excessive delay will occur and the time requirement will not be met.
これまでの研究は、異なるアプローチでTSVの高い欠陥率を扱っている:信頼性のための製造工程の改良(非特許文献2);設計段階での可能性ある欠陥のアカウンティング(非特許文献3);サポート回路(非特許文献4,5);冗長(非特許文献5)または誤り符号コード(非特許文献6)を用いて欠陥TSVsの修正;及び代替のチャネルを用いて欠陥TSVチャネルの回避(例えば、3D-NoCsにおける欠陥耐容ルートの使用(非特許文献7))。 Previous studies have addressed the high defect rate of TSVs with different approaches: manufacturing process refinement for reliability (2); accounting of potential defects during the design stage (3). ); support circuitry [4, 5]; correction of defective TSVs using redundant [5] or error code codes [6]; and avoiding defective TSV channels using alternate channels. (For example, the use of defect-tolerant routes in 3D-NoCs (Non-Patent Document 7)).
図1は、冗長を用いる従来の方法を示す図である。N個の欠陥TSVを扱うために、少なくともN個の冗長TSVを必要とする。図1において、(a)は、一つの欠陥TSV;Dの場合であり、(b)は、二つの欠陥TSV;2Dの場合、更に(c)は、四つの欠陥TSV;4Dの場合である。検出される欠陥TSVと同じ数の冗長TSVが必要である。 FIG. 1 illustrates a conventional method of using redundancy. To handle N defective TSVs, we need at least N redundant TSVs. In FIG. 1, (a) is for one defective TSV; D, (b) is for two defective TSVs; 2D, and (c) is for four defective TSVs; 4D. . We need as many redundant TSVs as there are defective TSVs to be detected.
上記の従来研究はTSVベースのシステムの信頼性を印象的に拡大してきたが、欠陥配分における問題が未だ存在する。第一の行われた研究の多くはランダム配分に言及している(非特許文献8)。そして、クラスタ欠陥の配分(非特許文献9)は、最近、最も現実的なものとして考えられている。 Although the above previous work has impressively expanded the reliability of TSV-based systems, problems in fault allocation still exist. Most of the first studies performed refer to random allocation (8). And cluster defect allocation (Non-Patent Document 9) is currently considered as the most realistic one.
クラスタTSVの欠陥を扱うために、多くの研究は最適なグルーピング構成(非特許文献10)を選択して異なる位置にTSVを配置する(非特許文献11)あるいは冗長修正率を拡大する(非特許文献9)ことを目指している。 To deal with defects in cluster TSVs, many studies choose the optimal grouping configuration (Non-Patent Document 10) and place TSVs in different positions (Non-Patent Document 11) or increase the redundancy correction rate (Non-Patent Document 11). Reference 9) is aimed at.
これらの方法はシステムの信頼性を向上することが可能であるが、大きな冗長及び複雑な調整を加えることは結果として、エリアコスト、ワイヤ遅延及び消費電力に対するペナルティとなる。図1に示したように、クラスタ欠陥が生じると、グループ(4TSVs)のすべてのTSVが、欠陥となる。したがって、欠陥耐容システムが、接続を確保するために二倍の数のTSVが必要である。さらに、欠陥TSVの数が割り振られた冗長TSVの数を超えると、縦接続は破壊されることになる。 While these methods can improve system reliability, adding significant redundancy and complex coordination results in penalties in area cost, wire delay and power consumption. As shown in Figure 1, when a cluster defect occurs, all TSVs of a group (4 TSVs) become defective. Therefore, a fault tolerant system requires twice as many TSVs to ensure connectivity. Furthermore, if the number of defective TSVs exceeds the number of allocated redundant TSVs, the cascade will be broken.
したがって、より良い管理解決が、特に3D-NoCsに対してこの問題の処理を助けるとみられ、TSVsの少ない使用率が報告されている(非特許文献12,13)。 Better management solutions are therefore likely to help address this problem, especially for 3D-NoCs, where low utilization of TSVs has been reported (12, 13).
よって、本発明の目的は、スマート管理で層間接続が維持され、大きな冗長のTSVsの追加を回避する3Dネットワークオンチップに対するTSV誤り耐容ルータ装置を提供することにある。 SUMMARY OF THE INVENTION It is therefore an object of the present invention to provide a TSV fault tolerant router device for 3D network-on-chip that maintains inter-layer connectivity with smart management and avoids adding large redundant TSVs.
本発明の一側面は、複数のレイヤのそれぞれに配置される複数のルータを有し、レイヤ間のルータがスルーシリコンビアにより接続される3DネットワークオンチップのためのTSV誤り耐容ルータ装置であって、前記スルーシリコンビアの各々は、一つの対応するルータに属し、前記対応するルータを中心に複数のクラスタを有し、前記対応するルータに属する複数のクラスタの一つが欠陥であるとき、前記対応するルータに隣接するルータが選択され、前記選択されたルータの一つのクラスタが、前記欠陥クラスタの代わりに置き換えられ、前記レイヤ間の接続を維持することを特徴とする。 One aspect of the present invention is a TSV fault tolerant router device for a 3D network-on-chip having a plurality of routers arranged in each of a plurality of layers, the routers between layers being connected by through silicon vias, , each of the through-silicon vias belongs to one corresponding router and has a plurality of clusters around the corresponding router, and when one of the plurality of clusters belonging to the corresponding router is defective, the corresponding neighboring routers are selected and one cluster of the selected routers is replaced in place of the defective cluster to maintain connectivity between the layers.
前記本発明の一側面に従う3DネットワークオンチップのためのTSV誤り耐容ルータ装置の一例は、前記複数のルータにそれぞれ重みが設定され、前記隣接するルータの選択が、前記複数のルータに割り当てられた重みに応じて実行されることを特徴とする。 An example of a TSV error tolerant router device for a 3D network-on-chip according to one aspect of the present invention, wherein weights are respectively set for the plurality of routers, and selection of the adjacent router is assigned to the plurality of routers. It is characterized in that it is executed according to the weight.
前記本発明の一側面に従う3DネットワークオンチップのためのTSV誤り耐容ルータ装置の更に一例は、前記選択される隣接するルータが、クラスタが欠陥であるルータの重みより大きい重みを有することを特徴とする。 A further example of a TSV error tolerant router device for a 3D network-on-chip according to one aspect of the present invention is characterized in that the selected neighboring router has a weight greater than the weight of the router whose cluster is defective. do.
前記本発明の一側面に従う3DネットワークオンチップのためのTSV誤り耐容ルータ装置の更なる一例は、前記複数のルータに設定される重みが、一のレイヤの中心におけるルータが最大の重みを有し、重みが減少し、前記レイヤの端で最小となることを特徴とする。 A further example of the TSV error tolerant router device for a 3D network-on-chip according to one aspect of the present invention is characterized in that the weights set in the plurality of routers are such that a router in the center of one layer has the largest weight , the weights decrease and are minimized at the edge of the layer.
本発明の実施例を図面に従い以下に説明する。実施例は、発明のより良い理解のためのものであり、したがって、発明の適用は実施例に制限されるものでない。発明の範囲は、請求の範囲に記載のものと、それに均等なものにも及ぶ。 An embodiment of the present invention will be described below with reference to the drawings. The examples are for a better understanding of the invention, and therefore the application of the invention is not limited to the examples. The scope of the invention extends to what is recited in the claims and their equivalents.
図2は、本発明に従う3Dネットワークオンチップ用の誤り耐容ルータ装置の原理を説明する図である。グループAの全てのTSVが欠陥であるとき、装置は、データは、隣接のグループBにより処理される。スマート管理により、装置は、双方の接続を維持し、冗長のTSVの大量の追加を回避することができる。 FIG. 2 is a diagram illustrating the principle of a fault tolerant router device for 3D network on chip according to the present invention. When all TSVs in group A are defective, the device will process the data by neighboring group B. Smart management allows the device to maintain both connections and avoid adding a large amount of redundant TSVs.
TSVの欠陥は、欠陥検出(Fault Detection),診断(Diagnosis)及び回復アルゴリズム等により検知される。 Faults in TSVs are detected by Fault Detection, Diagnosis and Recovery Algorithms and the like.
3D-NoCsにおけるTSVクラスタの欠陥を扱うために、本発明による解決は、隣接ルータ間でTSVを共用することである。したがって、TSVクラスタが誤ると、そのルータは隣接の一つから正常なクラスタを借りて、接続を維持することができる。 To deal with the shortcomings of TSV clusters in 3D-NoCs, our solution is to share TSVs among neighboring routers. Therefore, if the TSV cluster fails, the router can borrow a healthy cluster from one of its neighbors to maintain connectivity.
図3は、ルータR1-R3とルータR1-R3に隣接するルータR2-R4のレイヤ間相互接続を示し、本発明に従うTSVクラスタ耐容を示す図である。 FIG. 3 shows the inter-layer interconnection of routers R1-R3 and routers R2-R4 adjacent to routers R1-R3, illustrating TSV cluster tolerance according to the present invention.
図3(b)に示すように、ルータR1-R3の接続の一つのクラスタDCが欠陥であると、接続維持のためにルータR2-R4の接続から一つの健全なクラスタHCを借りて、接続を維持する。図3(c)に示すように、もし借りる健全なクラスタがなければ、欠陥クラスタDCシリアル化モードに変えることができる(例えば、二つのみの正常なクラスタがあると、ルータR1-R3の接続は、1:2シリアルを用いる。)。 As shown in FIG. 3(b), if one cluster DC in the connection of routers R1-R3 is defective, one healthy cluster HC is borrowed from the connection of routers R2-R4 to maintain the connection. to maintain As shown in Figure 3(c), if there are no healthy clusters to borrow, it can be changed to defective cluster DC serialization mode (for example, if there are only two healthy clusters, the connection of router R1-R3 uses a 1:2 serial).
ここで、本発明のより容易な理解のためにTSVを使用するレイヤ0,1,2の三層の3D-NoCの簡単なレイアウト例を考える。図4は、本発明に従うTSV利用の3×3×3の3D-NoCの単純化レイアウトを示す。図4において、40はルータ、41はTSVランディングパッド、42はTSVクラスタであり、43は、TSV共用エリアを示す。ルータ40は、3×3×3に配置されているので、それぞれ(x,y,z)の座標が割り当てられる。
Now consider a simple layout example of a three-layer 3D-NoC with
それぞれの縦接続に対し、一つのルータは、TSVの組が必要である。すべてのTSVを一緒にグループ化する代わりに、それらは4つのグループに分けられる。その結果、ルータ40は、4つのTSVクラスタ41を,前記ルータ40を中心にして有し、更に最大4つの隣接のルータに属するTSVクラスタを有する。ルータの一つのTSVクラスタが欠陥であると、当該ルータは、TSVクラスタを冗長に持つ必要がなく、代替として前記4つの隣接するルータに属するクラスタの一つを選択することが可能である。
For each cascade connection, one router needs a set of TSVs. Instead of grouping all TSVs together, they are divided into four groups. As a result,
時間制約を満たすために、ルータは隣接のクラスタのうち、最も近いTSVクラスタを選択する。接続を確立するために必要な長いワイヤ避けるため、更なるTSVクラスタを考慮することは考えられない。それぞれのルータに対してTSVを4つのクラスタに構成することにより、3D-NoCsの大きさが維持され、長いワイヤ遅延が回避される。 To meet the time constraint, the router selects the closest TSV cluster among the neighboring clusters. To avoid the long wires required to establish a connection, it is not conceivable to consider further TSV clusters. By configuring TSVs into four clusters for each router, the size of 3D-NoCs is preserved and long wire delays are avoided.
隣接のルータからTSVクラスタを借りるため、ルータは、支持モジュールが必要である。図5は、3Dルータのラッパー(wrapper)を示す図である。図5の3Dルータは、座標(1,1,1)に位置し、本発明に従う提案のアルゴリズムを管理する調整器である追加の共用回路(S-UP及びS-Down)50,51を備える。 A router needs a support module to borrow a TSV cluster from a neighboring router. FIG. 5 shows a wrapper for the 3D router. The 3D router of Fig. 5 is located at coordinates (1,1,1) and comprises additional shared circuits (S-UP and S-Down) 50, 51 which are coordinators managing the proposed algorithm according to the invention. .
二つの縦上方向及び縦下方向の接続のため、二つの同一の共用モジュール(S-UP及びS-Down)50,51が供えられ、それぞれの接続は、トライステートゲート(tristate gate)を用いる制御回路54,55の入力及び出力ポートに対して二つの制御レジスタCR52U,52D(CR53U,53D)を有する。前記制御レジスタCR52U,52D(CR53U,53D)は、ルータのTSVアクセスを許容するCR値を格納する。前記CR値は、制御回路54,55により読まれる。
Two identical shared modules (S-UP and S-Down) 50, 51 are provided for the two vertical and vertical connections, each using a tristate gate. There are two control registers CR52U, 52D (CR53U, 53D) for the input and output ports of the
先に図4に示したように、ルータR(1,1,1)は、四つの隣接ルータR(1,1,0),R(1,1,2),R(1,0,1)及びR(1,2,1)との間で、TSVクラスタを共用する。 As previously shown in FIG. 4, router R(1,1,1) has four neighboring routers R(1,1,0), R(1,1,2), R(1,0,1 ) and R(1,2,1) share the TSV cluster.
図6は、二つのレイヤ間の接続を示す図である。図6において、“w”は、フリッツ(flit)幅を意味する。このTSVクラスタの入力は、レイヤ2上でR(2,1,0)とR(2,1,1)の間で共用され、TSVクラスタの出力は、レイヤ1上でR(1,1,1)とR(1,1,0)の間で共用される。
FIG. 6 is a diagram showing connections between two layers. In FIG. 6, "w" means the flit width. The input of this TSV cluster is shared between R(2,1,0) and R(2,1,1) on
このTSVクラスタが欠陥であるか、借りられている場合、データは、四つの隣接クラス
タ60のうちの一つを用いて送られる。制御レジスタCR52U,52D(53U,53D)にセットされているリトルエンディアンフォーマットの6ビットCR値(6ビットに対してCR[5:0]と表記する)に基づき、制御回路54の入出力ポートが、(1)オリジナルのTSVクラスタから(第1ビット)、または(2)隣接する四つのクラスタの一つから(第2ビット)データを選択でき、あるいは(3)データは非接続とされる(代替のクラスタが、残りの4ビットの一つで示される)。
If this TSV cluster is defective or borrowed, the data is sent using one of the four
図6に示されるように、R(2,1,1)からの出力データは、最下位ビット(Least Significant Bit)が“1”(CR[0]=1)であるとき、当該TSVクラスタに送られる。最下位ビットを“0” (CR[0]=0)にして、オリジナルのTSVクラスタをR(2,1,1)から非接続とする。 As shown in FIG. 6, the output data from R (2, 1, 1) is in the TSV cluster when the least significant bit (Least Significant Bit) is “1” (CR[0]=1) Sent. Disconnect the original TSV cluster from R(2,1,1) by setting the least significant bit to "0" (CR[0]=0) .
第2ビットが“1”(CR[1]=1)にセットされると、隣接のルータR(2,1,0)が当該クラスタにアクセスする。オリジナルのTSVが欠陥であるとき、あるいは置き換えられているときは、当該ルータは隣接のルータの一つに代わり、CRの残りの4ビット(CR[5:1])に基づいて接続を維持する。受信2側ルータR(1,1,1)では、同様のCRが接続を維持するために使用される。このCRの値は、送信側ルータのCRと同一である。 When the second bit is set to "1" (CR[1]=1) , the neighbor router R(2,1,0) accesses the cluster. If the original TSV is defective or replaced, the router replaces one of the neighboring routers and maintains the connection based on the remaining 4 bits of CR (CR[5:1]). do. At the receiving 2 router R(1,1,1), a similar CR is used to maintain the connection. The value of this CR is the same as the CR of the sending router.
CRは接続を管理するのみであるから、その値はTSVクラスタの使用における衝突の可能性を避け、最適のパフォーマンスを得るべく、注意してセットされなければならない。 Since CR only manages connections, its value must be set carefully to avoid possible conflicts in the use of TSV clusters and to obtain optimal performance.
この目的のため、適応共用アルゴリズムが必要である。 For this purpose an adaptive sharing algorithm is needed.
上記において、ルータがどのように隣接のTSVクラスタを使用してレイヤ上の接続と動作を維持できるかを説明した。CR値は、TSV欠陥を扱うために構成されることが必要である。この目的のための単純な方法は、オンラインを実行し、構成をTSVグループにヒューズすることである(非特許文献9)。 Above, we described how routers can use neighboring TSV clusters to maintain connectivity and operations on layers. CR values need to be configured to handle TSV defects. A simple method for this purpose is to go online and fuse the configuration to the TSV group [9].
しかし、接続を固定することは、二つの欠点がある。第一に、新規に欠陥であるTSVの回復は、システムを停止し、マッピングを再実施することが必要である。第二に、それぞれのアプリケーションが縦方向接続において異なる配分となり、オンラインマッピングでは最適化されないタスクの実行に依存する変化を有する。 However, fixed connections have two drawbacks. First, recovery of a newly defective TSV requires stopping the system and re-performing the mapping. Second, each application has a different distribution in the vertical connection and has variations depending on task execution that are not optimized for online mapping.
したがって、システムがすぐに新規の欠陥TSVクラスタに反応でき、3D-NoCシステムの接続性を考慮できるように、マッピングオンラインを実行することを目指す。こうして、システムに実施できる共用TSVのためのオンラインアルゴリズムが提供される。 Therefore, we aim to perform mapping online so that the system can immediately react to novel defective TSV clusters and consider the connectivity of 3D-NoC systems. Thus, an online algorithm for shared TSVs is provided that can be implemented in the system.
図7は、本発明に従う共用メカニズムのための提案の共用アルゴリズムを示すフロー図である。それぞれのルータは、縦接続のそれぞれに対して一つの重みが割り当てられる。この重みは共用/借用の際の優先度を決定する。重みは、設計時に割り当て、あるいは決定されたモジュールにより更新することができる。
FIG. 7 is a flow diagram illustrating a proposed sharing algorithm for the sharing mechanism according to the invention. Each router is assigned a weight for each cascade connection. This weight determines the priority when sharing/borrowing. Weights can be assigned at design time or updated by modules determined.
ルータの重みを変更して異なるマッピングを生成できる。初期段階で、ネットワークにおける全てのルータは、それぞれの重みとTSVクラスタの状態を隣接のルータと交換する(ステップS1,YesからS3まで)。次のステップで、アルゴリズムは、マッピングプロセスを実行する。TSVクラスタが欠陥であると(ステップS4,Yes)、対応するルータは以下の条件に依存して隣接するルータから可能の候補を見つける(ステップS5)。 You can change the router weights to generate different mappings. At the initial stage, all routers in the network exchange their weights and TSV cluster states with neighboring routers (steps S1, Yes to S3). In the next step the algorithm performs the mapping process. If the TSV cluster is defective (step S4, Yes), the corresponding router finds possible candidates from neighboring routers depending on the following conditions (step S5).
・候補の重みは、現在のルータより小さくなければならない。
・候補のTSVクラスタは、健全で、借りられていないものでなければならない。
・最終の候補の重みは、全ての可能な候補の中で最小であること。
• The weight of the candidate must be less than the current router.
• Candidate TSV clusters must be healthy and not borrowed.
• The weight of the final candidate should be the smallest among all possible candidates.
アルゴリズムの最終で、ルータは、借りる可能な候補を見出す(ステップS6)。もし、候補が見つからなければ、ルータの縦接続は不能とされる(ステップS7,S8)。候補がある場合、ルータは、借りるルータに要求を送り、そのTSVクラスタを欠陥のTSVクラスタに置き換え使用する。借りたTSVクラスタを有するルータは、隣接の一つの置き換えを探す(ステップS9)。重み付けシステムを用いて、不能のTSVクラスタは、より小さな重みのルータに注目する。 At the end of the algorithm, the router finds possible candidates to borrow (step S6). If no candidate is found, cascade connection of routers is disabled (steps S7 and S8). If there is a candidate, the router sends a request to the borrowing router to use that TSV cluster as the replacement for the defective TSV cluster. A router with a borrowed TSV cluster looks for a replacement of one of its neighbors (step S9). Using a weighting system, disabled TSV clusters focus on routers with lower weights.
ここで、共用アルゴリズムにおける最も重要なパラメータの一つは、ルータの重み値である。重みは、アルゴリズムがどのルータが借りるに適しているかの決定を助ける。小さな重みを持つルータは共用のチェーンが確立したあと不能になる。重みが、共用プロセスにおけるルータの優先度を決めるため、重みは、最大のシステムパフォーマンスを得るために最適化される必要がある。そうするために、最良の解決は、縦接続の優先度が通信トラフィックに依存する場合の統計に基づく解決を用いることである(非特許文献14、15)。 Here, one of the most important parameters in the shared algorithm is the router weight value. Weights help the algorithm decide which routers are eligible to borrow. Routers with small weights are disabled after the shared chain is established. Since weights determine the router's priority in shared processes, weights need to be optimized for maximum system performance. To do so, the best solution is to use a statistical solution where cascade priority depends on communication traffic [14, 15].
換言すると、より多くのデータ通信を有する縦接続に、より高い重みが割り当てられる。そうでなければ小さな重みが割り当てられる。単純な方法は、本発明の例として、レイヤの中央にあるルータが最大の重みを有する。ルータの重みは減少し、レイヤの端部で最小となる。式1は、この使用される重み値の割り当てを示す。
Weight router (x, y) = min(x, cols -x) + min (y, rows - y) + 1
In other words, higher weights are assigned to cascades with more data communication. Otherwise a small weight is assigned. A simple method is that the router in the middle of the layer has the highest weight as an example of the invention. The weight of the router is reduced and is lowest at the edge of the layer.
Weight router (x, y) = min(x, cols - x) + min (y, rows - y) + 1
TSVが借りられると,借りるルータにより管理される。しかし、借りるルータが、不能のレイヤであると、借りられたクラスタを解放し、元のルータに戻さなければならない。結果として、借りられたTSVクラスタが、借りるチェーンを形成すると、元に戻すチェーンが生成される。 When a TSV is borrowed, it is managed by the borrowing router. However, if the borrowing router is layer disabled, the borrowed cluster must be released and returned to the original router. As a result, when a borrowed TSV cluster forms a borrowing chain, an undoing chain is generated.
ルータの接続の重みは、他の接続中のルータの縦接続の優先度を緩和するように設計される。以下の3つの理由が提示される。 A router's connection weight is designed to deprioritize a router's cascade connection over other connections. The following three reasons are presented.
(1)調整の容易;二つのルータ間に、調整メカニズムの必要がある。他の装置/システムと異なり、ネットワーク内のルータは、マスター/スレーブの状態の認識なしに、並列に動作する。TSVクラスタへのアクセス性をルータに解釈させるために、重みをもつことは、ルータが借りる能力を知ることを助ける。 (1) Ease of coordination; there is a need for a coordination mechanism between two routers. Unlike other devices/systems, routers in a network operate in parallel without knowledge of master/slave status. Having a weight helps the router know the capacity it borrows, in order to let the router interpret the accessibility to the TSV cluster.
一方、重みを持たないと、ルータは、ハンドシェーク機能を必要とし、複雑なアーキテクチャとコストの掛かる動作時間を要求する。重みのおかげで、ルータは、自身の重みと他の重みを比較でき、借りられるか否かを決定する。これらの重みはルータ間で、絶対的に衝突がないことを確実にする。借りる要求は、プロトコル発行要求の保証のため、受信側ルータではチェックされない。結果として、借りる状態は、重みが更新されるまで変更されない。そして、多重スレッド及び配分システム/プログラムにおいて、最も有名なバグである競合状態(永久の貸し借りのケース)はない。 On the other hand, without weights, routers require handshake functions, requiring complex architectures and costly uptime. Weights allow routers to compare their own weights with other weights and decide whether or not they can be borrowed. These weights ensure absolutely no collisions between routers. Requests to borrow are not checked at the receiving router due to the security of protocol issue requests. As a result, the borrowing state does not change until the weights are updated. And there is no race condition (the forever lend-and-borrow case), which is the most famous bug in multi-threaded and distributed systems/programs.
(2)不能のルータを同じ領域にシフト;重みを使用して、より大きい重みを持つルータは、活性クラスタを持ち易い。一方、不能のクラスタはより低い重みのルータにシフトされる。重みシステムなしでは、共用/借りる処理が不能ルータの焦点を生成することができない。 (2) Shift disabled routers to the same region; using weights, routers with higher weights are more likely to have active clusters. On the other hand, disabled clusters are shifted to lower weight routers. Without the weight system, it is not possible to create a focal point for routers incapable of sharing/borrowing processing.
(3)異なる構成に適応する;アプリケーションに依存して、設計者は、異なる構成を使用することができる。結果として、同じアーキテクチャ及びアルゴリズムを修正なしに、重みを調整するだけで、複数のアプリケーションに適用できる。さらに、オンライン適用システムに対して適用が開かれている。構成を最適にするためにアルゴリズムにおける調整が必要である。 (3) Accommodates different configurations; depending on the application, the designer can use different configurations. As a result, the same architecture and algorithm can be applied to multiple applications without modification, just by adjusting the weights. Furthermore, the application is open to online application systems. Adjustments in the algorithm are needed to optimize the configuration.
共用メカニズムを適用した後、不能のTSVクラスタは小さい重みのルータを有する領域にシフトされる。しかし、不能のルータがより大きい重みの隣接ルータから借りて完全な接続を得る場合がある。借りるプロセスは禁止される(小さい重みのルータは大きい重みのルータから借りる)ので、重みはルータが不能した後に調整される。ルータの重みが小さくされた後、小さい重みのルータは、新規のクラスタを借りて縦の接続を得ることができる。 After applying the sharing mechanism, disabled TSV clusters are shifted to regions with lower weight routers. However, an incapable router may borrow from a higher weight neighbor to get full connectivity. Since the borrowing process is inhibited (lower weight routers borrow from higher weight routers), weights are adjusted after a router fails. After a router's weight is reduced, the router with lower weight can borrow a new cluster to get a vertical connection.
冗長の追加なしで、欠陥クラスタの周囲で動作するTSVクラスタを借りることにより、いくつかのルータは、四つのアクセス可能のクラスタを減らすことになる。結果として、これらのルータの通信が不能とされる。この問題に対処するため、本来の解決は欠陥耐性ルーティングアルゴリズムを使用して隣接ルータにパケットを迂回する。上記に述べたように、この解決は、ネットワークにおける非最短のルートと競合を導くことになる。したがって、本発明者等は、欠陥耐性ルーティングアルゴリズムを使用することなしに、これらのルータが接続を維持するために一時的に借りるTSVである仮想TSVを提案する。仮想TSVが実行不能の場合、連続(Serialization)技術が実行され、縦接続によりただ一つあるいは二つのTSVクラスタを確立する。 By renting a TSV cluster that operates around a defective cluster, without adding redundancy, some routers will be reduced to four accessible clusters. As a result, these routers are disabled for communication. To address this problem, the original solution uses a fault-tolerant routing algorithm to divert packets to neighboring routers. As mentioned above, this solution leads to non-shortest routes and conflicts in the network. Therefore, we propose a virtual TSV, which is a TSV that these routers temporarily borrow to maintain connectivity without using fault-tolerant routing algorithms. If the virtual TSV is infeasible, a serialization technique is implemented to establish only one or two TSV clusters by cascading.
ルータが、四つのTSVクラスタにアクセスが許されない時、不能となる。しかし、縦通信を維持するために十分な、近くのTSVの数が4以上であると、接続を確立するために使用される。四つのTSVクラスタを要求する可能な接続は、隣接ルータに属するクラスタを必要とする。これらのルータは、クラスタを使用しないと、不能のルータが、それらを短時間借りて通信を確立する。 When a router is not allowed access to four TSV clusters, it becomes disabled. However, if the number of nearby TSVs, which is sufficient to maintain longitudinal communication, is greater than or equal to 4, it will be used to establish the connection. A possible connection that requires four TSV clusters requires clusters belonging to neighboring routers. If these routers do not use the cluster, incapable routers will borrow them for a short time to establish communication.
大きい優先度のルータが長い通信時間、TSVを占有する場合があるので、小さい重みのルータが接続を確立するためのTSVへのアクセスが不能である。さらに、大きい欠陥率で、小さな重みのルータが仮想TSVに対する適切な候補を見つけられない。これらの問題を解決するために、本発明者等は、連続技術(非特許文献6)を適応して接続を維持する。 A high priority router may occupy the TSV for a long communication time, so that a low weight router cannot access the TSV to establish a connection. Moreover, with a large failure rate, routers with small weights fail to find good candidates for virtual TSVs. To solve these problems, the inventors adapt the continuous technique [6] to maintain the connection.
仮想TSVが、不能のルータが縦接続を維持することを助けることができるが、仮想TSVが実行されない2つの状況がある:
(a)四つの健全なTSVクラスタがある。(b)候補のTSVがより大きい優先度のルータが定常的に占有される。
Virtual TSV can help disabled routers maintain cascading connections, but there are two situations in which virtual TSV is not implemented:
(a) There are four healthy TSV clusters. (b) The router with the higher priority TSV of the candidate is regularly occupied.
これらのケースを解決するために、連続技術(非特許文献16)が使用され、接続が維持される。連続技術のため、ルータは少なくとも一つのTSVクラスタを必要とし、接続を維持する。一つの可能なクラスタあると、1:4連続が用いられ、二つの可能なクラスタがあると、1:2連続が確立される。上方向及び下方向のクラスタ出力がレジスタに格納され、連続モジュールが残りのクラスタ上にフリッツを送信する。 To solve these cases, a serial technique [16] is used to keep the connection alive. For continuous technology, a router needs at least one TSV cluster to maintain connectivity. With one possible cluster, 1:4 continuity is used, and with two possible clusters, 1:2 continuity is established. The up and down cluster outputs are stored in registers and the successive modules send flits on the remaining clusters.
図8は、TSV誤り検出から代替までのTSV誤り耐容のフローチャートを示す図である。システムは、重みとTSV状態の初期化でスタートする。新規の欠陥が検出されると(ステップS10)、システムは、図7で説明した共用アルゴリズムを動作し、重みによりルータの優先度を決定する(ステップS11)。ネットワークが確立すると、共用/借りがなくなり(ステップS12)、システムはTSV供用アルゴリズムを最適化する(ステップS13)。その後、システムは終了し、その構成をCRレジスタに格納する(ステップS14)。CRレジスタ(図5参照)の値に基づいて、ルータは特定の共用、仮想あるいは 連続化方法を実行できる。
FIG. 8 is a diagram showing a flow chart of TSV error resilience from TSV error detection to substitution. The system starts with the initialization of weights and TSV states. When a new defect is detected (step S10), the system runs the shared algorithm described in FIG. 7 to determine router priority by weight (step S11). Once the network is established, there is no sharing/borrowing (step S12 ) and the system optimizes the TSV sharing algorithm (step S13). The system then exits and stores its configuration in the CR register (step S14). Based on the value of the CR register (see Figure 5), routers can implement specific sharing, virtualization, or serialization methods.
Claims (3)
前記スルーシリコンビアの各々は、一つの対応するルータに属し、前記対応するルータを中心に複数のクラスタを有し、
前記対応するルータに属する複数のクラスタの一つが欠陥であるとき、前記対応するルータに隣接するルータが選択され、前記選択されたルータの一つのクラスタが、前記欠陥クラスタの代わりに置き換えられ、前記レイヤ間の接続を維持し、更に、
前記複数のルータには、それぞれ重みが設定され、前記隣接するルータの選択が、前記複数のルータに割り当てられた重みに応じて実行される、
ことを特徴とする3DネットワークオンチップのためのTSV誤り耐容ルータ装置。 In a TSV fault tolerant router device for a 3D network-on-chip having a plurality of routers arranged in each of a plurality of layers, the routers between layers being connected by through silicon vias,
each of the through silicon vias belongs to one corresponding router and has a plurality of clusters around the corresponding router;
when one of a plurality of clusters belonging to the corresponding router is defective, a router adjacent to the corresponding router is selected, and one cluster of the selected router is replaced in place of the defective cluster; maintain connectivity between layers, and
A weight is set for each of the plurality of routers, and selection of the neighboring router is performed according to the weight assigned to the plurality of routers.
A TSV fault tolerant router device for a 3D network on chip, characterized by:
前記選択される隣接するルータは、クラスタが欠陥であるルータの重みより小さい重みを有する、
ことを特徴とする3DネットワークオンチップのためのTSV誤り耐容ルータ装置。 In claim 1 ,
the selected neighboring router has a weight less than the weight of the router whose cluster is defective;
A TSV fault tolerant router device for a 3D network on chip, characterized by:
前記複数のルータに設定される重みは、一のレイヤの中心におけるルータが、最大の重みを有し、重みが減少し、前記レイヤの端で最小となる、
ことを特徴とする3DネットワークオンチップのためのTSV誤り耐容ルータ装置。 In claim 1 ,
The weights set for the plurality of routers are such that a router at the center of one layer has the highest weight, the weight decreases, and the weight is lowest at the edge of the layer.
A TSV fault tolerant router device for a 3D network on chip, characterized by:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017218953A JP7239099B2 (en) | 2017-11-14 | 2017-11-14 | TSV Error Tolerant Router Device for 3D Network-on-Chip |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017218953A JP7239099B2 (en) | 2017-11-14 | 2017-11-14 | TSV Error Tolerant Router Device for 3D Network-on-Chip |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2019092020A JP2019092020A (en) | 2019-06-13 |
| JP2019092020A5 JP2019092020A5 (en) | 2022-12-01 |
| JP7239099B2 true JP7239099B2 (en) | 2023-03-14 |
Family
ID=66836708
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017218953A Active JP7239099B2 (en) | 2017-11-14 | 2017-11-14 | TSV Error Tolerant Router Device for 3D Network-on-Chip |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7239099B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7277682B2 (en) * | 2019-07-03 | 2023-05-19 | 公立大学法人会津大学 | Spiking Neural Network with 3D Network-on-Chip |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20170229381A1 (en) | 2016-02-05 | 2017-08-10 | Industry-Academic Cooperation Foundation, Yonsei University | Three-dimensional integrated circuit |
-
2017
- 2017-11-14 JP JP2017218953A patent/JP7239099B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20170229381A1 (en) | 2016-02-05 | 2017-08-10 | Industry-Academic Cooperation Foundation, Yonsei University | Three-dimensional integrated circuit |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019092020A (en) | 2019-06-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10681136B2 (en) | Memory network methods, apparatus, and systems | |
| US8601423B1 (en) | Asymmetric mesh NoC topologies | |
| JP2023544288A (en) | Multi-die integrated circuit with data processing engine array | |
| Dang et al. | Scalable design methodology and online algorithm for TSV-cluster defects recovery in highly reliable 3D-NoC systems | |
| Wang et al. | A new cellular-based redundant TSV structure for clustered faults | |
| Ebrahimi et al. | Fault-tolerant method with distributed monitoring and management technique for 3D stacked meshes | |
| CN105095148B (en) | A kind of mixed type network on three-dimensional chip | |
| Taheri et al. | ReD: A reliable and deadlock-free routing for 2.5-D chiplet-based interposer networks | |
| JP7239099B2 (en) | TSV Error Tolerant Router Device for 3D Network-on-Chip | |
| US9081891B2 (en) | Reconfigurable crossbar networks | |
| Taheri et al. | Cool elevator: A thermal-aware routing algorithm for partially connected 3D NoCs | |
| Jiang et al. | Fault-Tolerant 3D-NoC architecture and design: recent advances and challenges | |
| Salamat et al. | CoBRA: Low cost compensation of TSV failures in 3D-NoC | |
| Ouyang et al. | A TSV fault-tolerant scheme based on failure classification in 3D-NoC | |
| Abdallah et al. | A low-overhead fault tolerant technique for TSV-based interconnects in 3D-IC systems | |
| Wu et al. | Algorithms for reconfiguring NoC-based fault-tolerant multiprocessor arrays | |
| Ebrahimi | Reliable and adaptive routing algorithms for 2d and 3d networks-on-chip | |
| Rezaei et al. | Fault-tolerant 3-D network-on-chip design using dynamic link sharing | |
| Pasca et al. | Configurable serial fault-tolerant link for communication in 3D integrated systems | |
| Yang et al. | A fault tolerance noc topology and adaptive routing algorithm | |
| Ben Abdallah | 3D integration technology for multicore systems on-chip | |
| Ren et al. | Efficient fault-tolerant topology reconfiguration using a maximum flow algorithm | |
| JP6846027B2 (en) | Defect-tolerant router for network-on-chip | |
| JP2025508954A (en) | Computer Systems | |
| Chatterjee et al. | A strategy for fault tolerant reconfigurable Network-on-Chip design |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201023 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210630 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210902 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220118 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220318 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220809 |
|
| A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20221101 |
|
| C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20221101 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20221101 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20221121 |
|
| C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20221122 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230221 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7239099 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |