JPH06274521A - Parallel arithmetic unit - Google Patents

Parallel arithmetic unit

Info

Publication number
JPH06274521A
JPH06274521A JP8414993A JP8414993A JPH06274521A JP H06274521 A JPH06274521 A JP H06274521A JP 8414993 A JP8414993 A JP 8414993A JP 8414993 A JP8414993 A JP 8414993A JP H06274521 A JPH06274521 A JP H06274521A
Authority
JP
Japan
Prior art keywords
node
nodes
line
group
end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8414993A
Other languages
Japanese (ja)
Inventor
Kenji Mori
健次 盛
Original Assignee
Nippon Steel Corp
新日本製鐵株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp, 新日本製鐵株式会社 filed Critical Nippon Steel Corp
Priority to JP8414993A priority Critical patent/JPH06274521A/en
Publication of JPH06274521A publication Critical patent/JPH06274521A/en
Application status is Withdrawn legal-status Critical

Links

Abstract

PURPOSE: To provide a parallel arithmetic operation device capable of quickly calculating simultaneous equations for which plural nodes are linearly, two- dimensionally or three-dimensionally arrayed and equations for deciding the variables of the respective nodes from the variable of the most adjacent node are defined for the respective nodes.
CONSTITUTION: This unit is provided with a means (P) for dividing the respective nodes into plural node groups composed of plural adjacent nodes linearly, two-dimensionally and three-dimensionally, plural registers (R1-R4) arrayed corresponding to the arrays of the respective node groups for holding the initial values of the variables of the respective nodes in the corresponding group, arithmetic results and required constants and plural, arithmetic circuits (C1-C4) for executing arithmetic operations for the variables of the respective nodes within the respective node groups successively within the respective node groups and parallelly among the respective node groups.
COPYRIGHT: (C)1994,JPO&Japio

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【産業上の利用分野】本発明は、物理現象に関するコンピュータシミュレーションなどに利用される連立方程式の並列演算方法に関するものであり、特に、合理的な並列化の採用により処理時間の短縮を図った並列演算方法及び装置に関するものである。 BACKGROUND OF THE INVENTION This invention relates to parallel computation method of simultaneous equations to be used to the computer simulations of physical phenomena, in particular, parallel with shortened processing time by adopting reasonable parallelization it relates arithmetic method and apparatus.

【0002】 [0002]

【従来の技術】流体、電磁気、熱などに関する物理現象の解明に際しては、コンピュータシミュレーションの手法が採用される。 BACKGROUND ART Fluid, electromagnetic, upon clarification of physical phenomena related to such heat, the method of computer simulation is employed. このコンピュータシミュレーションに際しては、まず、解析対象の物理現象が温度や速度などの物理量を変数とする微分方程式などによってモデル化される。 In this computer simulation it is first modeled by such differential equations physical phenomenon to be analyzed is a variable physical quantity such as temperature or speed. 次に、一次元、二次元あるいは三次元空間内に規則的に配列された離散的なノード(節点)の概念を導入することにより、微分方程式を差分方程式に置換するなどの離散化が行われ、各ノードの物理量を変数とする連立方程式が作成される。 Next, one-dimensional, by introducing the concept of regularly arranged discrete node in a two-dimensional or three-dimensional space (nodes), is performed discretization such as replacing the differential equations to differential equations , simultaneous equations for the physical quantity of each node and variable is created. 最後に、これらの連立方程式が行列演算などによって解く数値解析が行われる。 Finally, numerical analysis solved by including these simultaneous equations is a matrix operation is performed.

【0003】解析対象の物理現象や社会現象は、流体や温度や熱などの物理量の伝播や経済指標や心理状態の波及などに関するものが多いことから、数値解析対象の連立方程式のそれぞれは、各ノードの物理量などの変数が最隣接のノードの変数のみから決定されるという特徴、 [0003] physical phenomena and social phenomena to be analyzed, since it is often related to such spillover of the physical quantity of propagation and economic and psychological states, such as a fluid, temperature and heat, each of the simultaneous equations of the numerical analysis target, the characterized variables such as the physical quantity of the node is determined from the variables only nearest neighbor nodes,
すなわち、数式上では次隣接のノードの変数の影響を受けないという特徴を有する場合が多い。 That is, often it has a feature that is not affected by the variables of the next adjacent node on the formula. 例えば、図8に示すように、ライン上に配列された8個のノードN 1 For example, as shown in FIG. 8, eight nodes N 1 ~ arrayed on line
8のそれぞれの変数をx 1 〜x 2とすれば、数値解析対象の8個の連立方程式は、 If each variable of N 8 and x 1 ~x 2, eight simultaneous equations numerical analysis target, となる。 To become. 但し、b 1 〜b 8は各ノードの境界条件である。 However, b 1 ~b 8 is a boundary condition of each node.

【0004】上述した連立方程式は、説明や思考の便宜上、行列式の形式で表現されることが多い。 [0004] simultaneous equations described above, for convenience of explanation and thinking is often expressed by a matrix equation of the form. 例えば、 For example,
(1)式の連立方程式を行列式で表現すれば、図9に示すように、三重対角行列を含む行列式となる。 It expressed the simultaneous equations of (1) a matrix type, as shown in FIG. 9, the determinant comprising tridiagonal matrix. この場合、連立方程式の演算は行列演算と称される。 In this case, calculation of the simultaneous equations is referred to as a matrix operation. このように、連立方程式を行列式で表現することにより、行列式に関する既知の知識を利用してこれを変形し、行列演算を簡略できるという利点がある。 Thus, by representing the simultaneous equations in matrix equation, deform it by utilizing the known knowledge determinant, there is an advantage that the matrix operation can be simplified. 例えば、図9の三重対角行列を下三角行列と上三角行列の積に分解するLU分解法や、行や列を入替えることによって分解可能な形式に変換したりする手法が利用される。 For example, a tridiagonal matrix or a lower triangular matrix and decomposed into the product of upper triangular matrix LU decomposition method of FIG. 9, a technique or convert into degradable form by interchanging the rows and columns are used.

【0005】(1)式の連立方程式の演算手法の典型的なものでは、まず、一方の端点(ノードN 1 )を除く全てのノードN 2 〜N 7の変数x 2 〜x 7に対して初期値が設定され、変数x 2の初期値から変数x 1が演算され、この演算結果のx 1とx 3の初期値とからx 2が算定され、この演算結果のx 2とx 4の初期値とからx 3 [0005] (1) typical of calculation method of the simultaneous equations of expression, first, for the variable x 2 ~x 7 of all the nodes N 2 to N 7 except one of the end points (nodes N 1) the initial value is set, the variable x 1 is calculated from the initial value of the variable x 2, from the initial value of x 1 and x 3 of the calculation result x 2 is calculated, the x 2 and x 4 of the calculation result x 3 from the initial value
が演算されるという具合に、各ノードの変数の関係を表す連立方程式が各ノードの配列順に順次演算される。 There so on is calculated, simultaneous equations representing the relationship between variable of each node is sequentially computed in the arrangement order of each node. このようにして全てのノードの変数が求まると、この求まった変数から、上記と同様の順序で新たな変数を演算してゆくという演算処理が、解が収斂するまで、すなわち、新たな演算結果が直前の演算結果とほぼ同一となるまで、反復される。 Thus the variables of all nodes determined by the, from the Motoma' variables, until processing that slide into calculating a new variable in the same order as above, the solution converges, i.e., a new calculation result There until approximately the same as the operation result immediately before is repeated.

【0006】(1)式の連立方程式の演算手法の他の例としては、これを行列式で表現し、前述したLU分解法などを適用するものがある。 [0006] Other examples of calculation methods (1) of the simultaneous equations, which was expressed by the matrix equation, there is one that applies the like LU decomposition method described above. このLU分解を含む演算手法も、基本的には、各ノードの変数に関する連立方程式をノードの配列順に順次演算するという点では同様である。 Computing method including the LU decomposition is also basically the same in terms of the simultaneous equations relating variables of each node sequentially computing in the arrangement order of the nodes. ノードが二次元空間内や三次元空間内に配列される場合でも、各ノードの変数の関係を表す連立方程式が各ノードの配列順に順次演算されるという点では、上述した一次元の場合と同様である。 Even if the node is arranged in two-dimensional space or a three-dimensional space, in that the system of equations representing the relationship between variable of each node is sequentially computing in the arrangement order of each node, as in the case of one-dimensional as described above it is.

【0007】上記連立方程式の演算あるいは対応の行列計算においては、演算所要時間がノードの総数の2乗ないし3乗のオーダーで増大する。 [0007] In the calculation or the corresponding matrix calculation of the simultaneous equations, computing time required is increased to the square not the total number of nodes in the cube of order. また、三次元空間の流体についての数値解析などでは、ノードの総数が10 6 Further, in such numerical analysis of a fluid of a three-dimensional space, the total number of nodes 106
程度もの大きな値になり、演算所要時間が極めて長くなる。 The degree also becomes a large value of, the calculation time required is extremely long. 行列演算の所要時間を短縮するための方策としては、高速のスーパーコンピュータを使用したり、並行して動作する複数の計算機のそれぞれに行列演算の処理単位を割当てる並列計算機システムなどが知られている。 The measures for reducing the time required for matrix operations, or using a high speed supercomputer, such a parallel computer system for allocating processing unit matrix operation on each of the plurality of computers operating in parallel are known .
並列計算機システムに関しては、各計算機に割当てる処理単位として、各行ないし各列などがあることが「行列計算ソフトウェアーWS,スーパーコン,並列計算機ー」(小国力ほか4名著、1991年丸善株式会社発行)などに記載されている。 For the parallel computer system, as a processing unit to be assigned to each computer, each row or each column there is such "matrix calculation software WS, supercomputers, parallel computers over" (small country force other 4 famous book, 1991 by Maruzen Co., Ltd. ) are described in, for example.

【0008】 [0008]

【発明が解決しようとする課題】上記従来の並列計算機システムでは、連立方程式に対応する行列式に対し行や列の置換などによって分解可能なブロック化を行い、各ブロックごとに更には各ブロック内の各行ごとに並列処理可能な処理単位に分解することが必要になる。 In THE INVENTION to be solved INVENTION The above conventional parallel computer system, perform a degradable blocked against determinant corresponding to simultaneous equations, such as by substitution of rows and columns, even in each block for each block it is necessary to decompose in parallel processable processing units for each of the row. しかしながら、行列式をどのように変形すればそのような分解可能なブロック化が達成できるを見い出すことが困難であるという問題がある。 However, there is a problem that such a decomposable blocking How can deform the matrix equation is difficult to find can be achieved. 例えば、図9の行列式をどのように変形すれば、各行ごとに並列処理可能な形になるかを見い出すことは、容易ではない。 For example, it is not easy to find whether How can deform the determinant of FIG. 9, the parallel processing a form for each row. 従って、本発明の目的は、並列処理のための分解可能なブロック化を容易に達成できる並列演算装置を提供することにある。 Accordingly, an object of the present invention is to provide a parallel arithmetic unit can be easily achieved degradable blocks for parallel processing.

【0009】 [0009]

【課題を解決するための手段】本発明に係わる並列演算装置は、従来の行列式の行や列の入れ替えによる分解可能なブロック化に相当する処理がノード番号の変更に相当する点に着目し、このノード番号の変更を行列表現の前段階で行うことにより、並列処理可能な適宜な大きさの処理単位を容易に見い出せるようにしている。 Parallel operation device according to the present invention SUMMARY OF THE INVENTION, the processing corresponding to the degradable blocks by replacement of rows or columns of a conventional matrix type is focused on a point corresponding to a change of the node number by performing the previous step of the matrix representation of the change of the node number, so that that easily Miidase processing units of the parallel processing can be appropriately sized.

【0010】すなわち、本発明の並列演算装置を、一次元モデルの場合について説明すれば(a) ラインの一方の端のノードから他方の端のノードに向けてn跳び(n [0010] That is, the parallel operation apparatus of the present invention, jump n toward will describe the case of a one-dimensional model (a) to one end of the line node to node of the other end (n
は2以上の自然数)に通し番号を付与してゆき、他方の端のノード又はそのn個手前のノードから前記一方の端の最隣接ノードに復帰してここから再度他方の端のノードに向けてn跳びの通し番号を付与することをライン上の全ノードについてm回反復することにより通し番号の大小に応じたm個のノード群を形成する手段と、(b) Is directed to two or more Yuki by a serial number given to a natural number), the other end of the node, or a n-number from the previous node again other end from here returns to its nearest neighbor nodes of one end said node means for forming m number of nodes in accordance with the magnitude of the serial numbers by repeated m times for all nodes on a line that which imparts n jump serial number, (b)
前記各ノードについて定義された連立方程式を前記各ノードに付与された通し番号を行番号及び列番号とする行列式で表現することにより前記m個のノード群単位にブロック化された部分行列を含む行列式を得、これを前記ノード群単位のm個の部分行列式に分解する手段と、 Matrix containing the said m nodes blocked submatrix in group units by expressing a serial number that has been granted the simultaneous equations defined for each node to each node in the determinant of the row and column numbers the resulting equation, decomposing means this in m partial determinant of the node group units,
(c)前記m個の部分行列式を一つずつ順にかつ行単位に分解して並列演算する演算する手段とを備えている。 (C) and a said m partial determinant means for calculating parallel operation is decomposed into row units and one by one order of.

【0011】 [0011]

【作用】上記構成に従ってライン上の各ノードをm個の群に分割すると、各群内の各ノードに対する最隣接ノードは、必ず他の群内の各ノードとなる。 SUMMARY OF] Dividing each node on the line into m groups in accordance with the above configuration, the nearest neighbor nodes for each node in each group is always the each node in the other group. これにより、以下の2点が保証される。 Thus, the following two points is ensured. (1)他の群内の各ノードの変数が初期値や直前の演算結果として定まっていれば、これらを用いてある群内の各ノードの変数の演算を実行できる。 (1) If definite as the operation result of the variable initial value and immediately before each node in the other group, can perform calculation of variables for each node in the group are using them. (2)同一群内の各ノードはn個のノードを介在させながら離散的に配列されているため、影響し合わない。 (2) Each node in the same group because it is discretely arranged while interposing the n nodes, without Awa affected. 従って、同一の群内の各ノードについては演算を同時に(並列的にあるいは並行して)実行できる。 Thus, for each node within the same group operation simultaneously (in parallel or in parallel) can be executed. これは、行列式が分解可能なブロック化が行われたことを意味する。 This means that the matrix equation degradable blocks were made. これは、二次元、三次元の場合で容易に拡張できる。 This can be easily extended in case of a two-dimensional, three-dimensional.

【0012】この並列演算の結果、一次元の場合には、 [0012] The result of this parallel operation, in the case of one-dimensional,
m個の処理装置を用いて1個のノードに費やす処理時間の(n+1)倍の処理時間を費やして全ノード(N個) the m processing apparatus of the processing time spent in a single node with (n + 1) spends twice as much processing time all nodes (N pieces)
の処理を終了できる。 It can be processed end of. すなわち、処理時間が(n+1) That is, the processing time (n + 1)
/N倍に短縮される。 / N times are shortened to. 同様に、二次元、三次元の場合には、それぞれm 2個とm 3個の演算回路を用いて、処理時間をそれぞれ〔(n+1)/N〕 2倍と〔(n+1) Similarly, two-dimensional, in the case of three dimensions, using two and m 3 pieces of arithmetic circuits m respectively, the processing time of each [(n + 1) / N] doubled [(n + 1)
/N〕 3倍に短縮できる。 / N] can be reduced to 3 times. 以下、本発明を実施例と共に更に詳細に説明する。 It will be described in more detail in conjunction with the present invention embodiment.

【0013】図1(A)は、本発明の並列演算装置を一次元モデルの解法に適用した実施例のブロック図である。 [0013] Figure 1 (A) is a block diagram of the applied examples solution of one-dimensional model of parallel computation apparatus of the present invention. まず、図1(B)に示すように、ライン上の左から右に17個のノードが配列され、各ノードには、最隣接のノードの変数のみで決定される変数が与えられる。 First, as shown in FIG. 1 (B), is 17 nodes arranged from left to right on the line, each node variables determined only by the variable nearest neighbor nodes is given. 各16個のノードに対し、所定の順序で通し番号が付与される。 For each 16 nodes, the serial number is applied in a predetermined order. すなわち、図1(B)に示すように、ラインの左端ノードから他端のノードに向けて4跳びに通し番号1,2,3,4を付与してゆき、右端のノード又はその4個手前のノードに達したため次の4跳び不能になると、そのノードから左端のノードの最隣接ノードに復帰し、このノードから再度右端ノードに向けて4跳びの通し番号5,6,7,8を付与してゆく。 That is, as shown in FIG. 1 (B), from the left end node of the line Yuki by a serial number 1, 2, 3, 4 and applied to 4 jump toward the node at the other end, the right end of the node or of the four front When the next 4 jump impossible due to reaching node, returning from the node to the nearest neighbor node of the leftmost node, the 4 jump serial numbers 5, 6, 7, 8 towards the back right edge node from this node to grant go. このような4跳びの通し番号の付与と、復帰をライン上の全てのノードについて5回反復することにより通し番号の大小に応じた5個のノード群を形成する。 And such fourth jump serial number imparted to form five nodes in accordance with the magnitude of the serial numbers by repeated 5 times for all nodes on a line return. すなわち、第1の群(1,2,3,4)、第2の群(5,6,7,8)、第3の群(9,10,11)、第4の群(12,13,1 That is, the first group (1,2,3,4), a second group (5,6,7,8), a third group (9, 10, 11), the fourth group (12, 13 , 1
4)及び第5の群(15,16,17)に群分けされる。 They are grouped into 4) and the fifth group (15, 16, 17).

【0014】このようにして通し番号が付与された各ノードの変数に関する連立方程式を、この通し番号を行番号及び列番号とする行列式で表現すると、図2に示すように、17行17列の行列を含む行列式が得られる。 [0014] The simultaneous equations relating variables of each node serial number in this way is granted, when expressed by a matrix equation for the serial number and the row and column numbers, as shown in FIG. 2, a matrix of 17 rows and 17 columns matrix formula that includes is obtained. ただし、図2では図示の便宜上、17行17列の行列中に出現する非ゼロ要素のみが*で代表して表示されている。 However, for convenience of illustration in FIG. 2, only the non-zero elements that appear in the matrix of 17 rows and 17 columns is displayed as a representative in *. この行列式は、非ゼロ要素を含む4行4列の4個の部分行列と、ゼロ要素のみから成る4行3列の4個の部分行列と、ゼロ要素のみから成る3行4列の4個の部分行列と、ゼロ要素のみから成る3行3列の2個の部分行列とにブロック化されている。 This matrix equation, and four sub-matrices of four rows and four columns containing the non-zero elements, and four sub-matrices of four rows and three columns consisting of only zero elements, 4 of three rows and four columns consisting of only zero elements and number of partial matrix is ​​blocked into the two portions 3 × 3 matrix consisting of only zero elements. 上記各部分行列を一つの要素A ijで表現すると共に、17個の変数x 1 〜x 17をx 1から順に第1群から第5群までのノード群に対応したブロックに区切り、各ブロックを第1の群のX 1 〜第5の群の変数X 5で表現する。 Together to represent each submatrix in one element A ij, separate the 17 variables x 1 ~x 17 into blocks corresponding to nodes from x 1 from the first group to the fifth group in order, each block expressed by the variable X 5 of X 1 ~ fifth group of the first group.

【0015】すなわち、 [0015] In other words,

【0016】これにより、図2の行列式は、図3に示すような各群の変数X iを用いた行列式で表現され、これが図4に示すように分解される。 [0016] Thus, the determinant of 2 is expressed by a matrix equation using the variable X i of each group as shown in FIG. 3, which is decomposed, as shown in FIG. 図4において、右辺に出現する各群の変数が初期値や直前の演算結果によって確定されていれば、右辺はそれぞれ各群の定数B 1 ', 4, if each group of variables that appear in the right-hand side is determined by the initial value and the immediately preceding calculation results, constant in each of the right-hand side in each group B 1 ',
2 ',B 3 ',B 4 ',B 5 'となる。 B 2 ', B 3', B 4 ', B 5' becomes. 従って、第1 Therefore, the first
の群の変数X 1の場合で代表して図5に示すように、第1のノード群に属する4個のノードの変数x 1 ,x 2 On behalf in the case of variable X 1 group of as shown in FIG. 5, the variables x 1, x 2 of the four nodes belonging to the first group of nodes,
3 ,x 4は、以下の式に従って並列演算が可能となる。 x 3, x 4 is parallel operation is possible according to the following formula. 1 =b 1 '/ a 11 , x 2 =b 2 '/ a 22 , x 3 x 1 = b 1 '/ a 11, x 2 = b 2' / a 22, x 3 =
3 '/ a 33 ,x 4 =b 4 '/ a 44第2のノード群に属する4個のノードの変数x 5 b 3 '/ a 33, x 4 = b 4' / a 44 variable x 5 in four nodes belonging to the second group of nodes,
6 ,x 7 ,x 8は、以下の式に従って並列演算が可能となる。 x 6, x 7, x 8, the parallel operation is possible according to the following formula.

【0017】以上ライン上に配列されたノードにn跳びに通し番号を付与してゆくことによりm個の群を形成する一次元モデルについて本発明を説明した。 [0017] The present invention has been described for the one-dimensional model to form a m-number group of by slide into applying a serial number to jump n the sequence node on lines or more. しかしながら、そのようなラインを複数配列し、各ラインにn跳びに通し番号を付与してゆくことによりm個のライン群を形成するという二次元モデルに本発明を容易に拡張できる。 However, such a line a plurality of rows, the present invention can be readily extended to 2D models that form the m-number of line groups by slide into applying a serial number to jump n each line. この二次元モデルでは、各ライン上のノードについては、上述した一元モデルの場合と同様にn跳びの通し番号の付与による群分けとこれに基づく群ごとの並列演算を併用してもよいし、各ライン上の各ノードについては順に演算を実行するようにしてもよい。 In the two-dimensional model, for the nodes on each line, it may be used together in parallel operation for each group based on this and grouping by application of serial number of the jump n as with centralized model described above, each it may be executed the operation in sequence for each node on the line. また、そのようなプレーンを複数配列し、各プレーンにn跳びに通し番号を付与してゆくことによりm個の群をプレーン群を形成するという三次元モデルに本発明を容易に拡張できる。 Further, such a plane a plurality of rows can be easily extended present invention to a three-dimensional model of the m-number group to form a plain group by slide into applying a serial number to jump n in each plane.

【0018】本発明の並列演算装置の原理を、上述のような行列式の概念を導入せずに説明することができる。 [0018] The principle of the parallel operation apparatus of the present invention, can be described without introducing determinant concept as described above.
以下、これについて説明する。 This will be explained. 図1(C)に示すように、ライン上に配列された17個のノードに左端から右端に向けて配列順に通し番号を付与すると共に、左端から5個ずつのノードをグループ化してゆき、最後の2個のノードについては2個だけでグループ化する。 As shown in FIG. 1 (C), from the left end to the 17 nodes arranged in a line while giving serial numbers in the arrangement order toward the right end, Yuki by grouping nodes one by five from the left end, the last for two nodes grouped by only two. まず、 First of all,
各グループI〜IV内のノードの左端のものを除く全てのノードに初期値を設定し、各グループ内の左端のノードの変数を全てのグループI〜IVで同時に(並行して、並列に)演算する。 Set the initial value to all the nodes except those of the leftmost node in each group I-IV, at the same time the variable of the leftmost node in each group for all groups I-IV (in parallel, in parallel) operation to. 各グループ内の演算が終了すると、左端のノードについて得られた演算結果と、左端から3番号のノードに設定された初期とを用いて左端から2番目のノードの変数を全てのグループI〜IVについて並列演算を実行する。 When the calculation in each group is completed, the calculation results obtained for the leftmost node, the second node from the left by using the initial set in nodes 3 numbers from the left variable all groups I~IV for performing parallel operations.

【0019】以下、同様にして、各グループ内で左端から3番目,4番目,5番目のノードについて順次変数の並列演算を実行する。 [0019] In the same manner, the third from the left in each group, 4 th, perform parallel operations sequentially variable for the fifth node. ただし、IV番目のグループについてはノードが2個しか存在しないので、他のグループが3番目乃至5番目のノードについて並列演算を実行中は演算を行わずに他のグループが最後の(5番目の)ノードについて並列演算を終了するまで待ち状態になる。 However, since for the IV th group nodes only exist two other groups without operation executing parallel operations other groups for the third through fifth node is the last (fifth ) becomes a wait state until the end of the parallel operation for the node. 各グループによる1番目のノードから5番目までの並列演算は、直前の演算結果を用いて適宜な回数、例えば解が収束するまで、すなわち各ノードについて得られた新たな演算結果がそのノードについて直前に得られた演算結果とほぼ一致するまで、反復される。 Immediately before the parallel operation to the fifth from the first node according to each group, appropriate number using the previous calculation result, for example, until the solution converges, i.e. new calculation results obtained for each node for the node calculation results obtained until approximately matches are repeated.

【0020】図1(B)と(C)に示した一次元モデルの並列演算装置の構成は、図1(A)のブロック図に示すように、4個の演算回路C1,C2,C3,C4と4 The configuration of the parallel computing device of the one-dimensional model shown in FIG. 1 and (B) (C), as shown in the block diagram of FIG. 1 (A), 4 pieces of arithmetic circuits C1, C2, C3, C4 and 4
個のレジスタR1,R2,R3,R4と、プロセッサP Number of registers R1, R2, R3, and R4, the processor P
と、このプロセッサPと演算回路C1〜C4とレジスタR1〜R4との間を接続するバスBSから構成される。 When, a bus BS that connects between the processor P and the arithmetic circuit C1~C4 and register R1 to R4.
このバスBSは、データ信号線とアドレス信号線とデータの保持や演算の開始などを指令する各種の制御信号が出力される制御信号線から構成されている。 The bus BS is a control signal line for various control signals for commanding such initiation of the holding and operation of the data signal lines and address signal lines and the data are output. 図1(C) Figure 1 (C)
の場合の通し番号付けと群分けに従えば、演算回路C1 According to the serial number with the grouping in the case of the arithmetic circuit C1
はグループI内の5個のノードの変数x 1 〜x 5を演算対象としており、演算回路C2はグループII内の5個のノードの変数x 6 〜x 10を演算対象としており、演算回路C3はグループIII 内の5個のノードの変数x 11 〜x The variable x 1 ~x 5 of five nodes in the group I and the computed target, the arithmetic circuit C2 is of a variable x 6 ~x 10 of five nodes in the group II candidate operation, the arithmetic circuit C3 variables x 11 5 nodes in the group III is ~x
15を演算対象としており、演算回路C4はグループIV内の2個のノードの変数x 16,17を演算対象としている。 15 has an operation target, operation circuit C4 is the variable x 16, x 17 two nodes in the group IV candidate operation.

【0021】演算の開始に先立って、プロセッサPからバスBS上に変数の初期値と、演算に必要な全ての定数が順次出力される。 [0021] Prior to the start of the operation, the initial value of the variable from the processor P on the bus BS, all constants required for the operation are sequentially outputted. レジスタR1〜R4はバス上に出現する変数の初期値と定数のうち最隣接の演算回路が演算に必要とするもののみを保持する。 Register R1~R4 holds only those nearest neighbor calculation circuit of an initial value and a constant of the variable appearing on the bus requires the calculation. 図1(C)の場合の通し番号付けに従えば、レジスタR1は4個の変数x 1 According to the serial number with the case of FIG. 1 (C), the register R1 is four variables x 1
〜x 4の演算に必要な全ての定数と変数x 2 〜x 4の初期値を保持し、レジスタR2は4個の変数x 5 〜x 8の演算に必要な全ての定数と変数x 5 ,x 6 ,x 8の初期値を保持するという具合である。 Retains all the initial values of constants and variables x 2 ~x 4 required for the operation of ~x 4, the register R2 is four variables x 5 all constants required for the operation of ~x 8 and variables x 5, and so that holds the initial value of x 6, x 8.

【0022】レジスタR1〜R4へのデータの初期値と必要な全ての定数の保持が終了すると、演算回路C1〜 [0022] holding the initial value and all the constants required data to the register R1~R4 ends, the arithmetic circuit C1~
C4は、プロセッサPから出力される演算開始指令に同期して演算を開始する。 C4 starts synchronization with operation to the operation start command output from the processor P. すなわち、演算回路C1は、隣接のレジスタR1と内蔵の乗算器、加算器、除算器との間を接続するゲートを所定のタイミングで開閉することによりレジスタR1からx 2の初期値と定数a 11 That is, the arithmetic circuit C1, internal multiplier and a register R1 of adjacent adders, dividers initial value of x 2 from the register R1 by opening and closing a gate at a predetermined timing which connects the the constant a 11 ,
12 ,b 1を転送させながら、 x 1 =(b 1 −a 12 while transferring a 12, b 1, x 1 = (b 1 -a 12
2 )/a 11の演算を実行し、演算結果x 1をレジスタR1の所定の箇所に転送する。 x 2) / a 11 performs an operation of, and transfers the calculation result x 1 at a predetermined point register R1. 同様に、演算回路C2も、隣接のレジスタR2と内蔵の乗算器、加算器、除算器との間を接続するゲートを所定のタイミングで開閉することによりレジスタR2から変数x 5 ,x 7の初期値と変数x 6の演算に必要な定数を転送させながら、(1)式に記載されたような対応の演算を実行し、演算結果x 6をレジスタR2の所定の箇所に転送する。 Similarly, the arithmetic circuit C2 also adjacent registers R2 and internal multiplier, adder, from the initial stage register R2 of the variable x 5, x 7 by a gate which connects the opening and closing at a predetermined timing a divider while transferring the constants required for the operation of values and variables x 6, (1) performs the corresponding operation as described in equation transfers a calculation result x 6 at a predetermined point register R2.

【0023】このようにして、演算結果x 1 ,x 6 ,x [0023] In this way, the operation result x 1, x 6, x
11 ,x 16のレジスタR1〜R4への転送が終了すると、 When 11, transferred to the register R1~R4 of x 16 is completed,
演算回路C1〜C4は、この演算結果と変数x 3 Arithmetic circuit C1~C4, this calculation result and a variable x 3,
8 ,x 13 ,x 16の初期値を用いて変数x 2 ,x 7 ,x x 8, x 13, variable x 2 using the initial value of x 16, x 7, x
12 ,x 17の演算を開始し、演算結果を対応のレジスタR 12, to start the operation of x 17, the operation result corresponding register R
1〜R4に転送する。 And transfers it to the 1~R4. このようにして、各グループ内では順次かつ各グループ間で並列的に各グループ内のノードの変数が演算され、各演算回路C1〜C4で解の収束が判定されるとその旨がプロセッサPに通知され、演算が終了する。 Thus, within each group are parallel computation the variable nodes in each group are sequentially and among the groups, the convergence of the solution in each arithmetic circuit C1~C4 is determined to that effect processors P the notified operation is completed.

【0024】上記一次元モデルを、二次元モデルに容易に拡張できる。 [0024] The above one-dimensional model can be easily extended to the two-dimensional model. 例えば、図6に例示するように、6個のノードN 1 〜N 6が配列された6本のラインL1〜L6 For example, as illustrated in FIG. 6, six of six nodes N 1 to N 6 are arranged line L1~L6
が等間隔で平行に配列された二次元モデルを想定する。 There is assumed the two-dimensional model arranged parallel to at equal intervals.
総数36個の各ノードをライン上でもライン間でも隣接するどうしを3個ずつグループ化することにより、それぞれが9個の隣接ノード群から構成される四つのグループI,II,III,IV を形成し、四つのグループのそれぞれに対応した4個の演算回路と4個のレジスタとを備えた図1(A)に示すような並列演算装置を構成し、各グループ内の9個のノードについて同一グループ内では順次かつ異なるグループ間では並行して実行すればよい。 By grouping three by three adjacent each other even between total number of lines 36 each node at any on line, four Group I consisting respectively of nine neighboring nodes, II, III, and IV formed and constitute a parallel operation device as shown in FIG. 1 (a) that includes a four arithmetic circuits and four registers corresponding to each of the four groups, identical for nine nodes in each group it may be executed in parallel in between successive and different groups within a group.

【0025】上記二次元モデルを、容易に三次元モデルに拡張できる。 [0025] The above-mentioned two-dimensional model, can be easily extended to three-dimensional model. 例えば、図6に例示するように、図7の二次元モデルによって形成される6枚のプレーンP1〜 For example, as illustrated in FIG. 6, six planes P1~ formed by a two-dimensional model of FIG. 7
P6を等間隔で平行に配列した三次元モデルを想定する。 Assuming a three-dimensional model arranged parallel to the P6 at equal intervals. 総計216個の各ノードをライン上でもライン間でもプレーン間でも隣接するどうしを3個ずつグループ化することにより、それぞれが27個の隣接ノード群から構成される八つのグループを形成し、八つのグループのそれぞれに対応した8個の演算回路と8個のレジスタとを備えた図1(A)に示すような並列演算装置を構成し、各グループ内の27個のノードの演 をグループ内では順次かつグループ間で並行して実行すればよい。 By grouping three each of the adjacent even between even planes between the lines a total 216 pieces each node even on line, each form a group of eight consisting of 27 contiguous nodes, eight up parallel computing device as shown in FIG. 1 (a) that includes a eight arithmetic circuits and eight registers corresponding to each group, the Starring 27 nodes in each group in the group sequentially and it may be executed in parallel between the groups.

【0026】 [0026]

【発明の効果】以上説明したように、本発明の並列演算装置によれば、従来の行列式の行や列の入れ替えによる分解可能なブロック化に相当する処理がノード番号の変更に相当する点に着目し、このノード番号の変更を行列表現の前段階で行う構成であるから、並列処理可能な適宜な大きさの処理単位を容易に見い出すことができるという効果が奏される。 As described in the foregoing, according to the parallel operation apparatus of the present invention, that the process corresponding to degradable blocks by replacement of rows or columns of a conventional matrix type corresponds to the change of node number focusing on, because the change of the node number is configured to perform in the preceding stage of the matrix representation, the effect that can be found easily processing units of the parallel processing can be appropriately sized are obtained.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の一実施例を一次元モデルの場合について説明するためのブロック図と概念図である。 1 is a block diagram and conceptual diagram for illustrating the one-dimensional case model of one embodiment of the present invention.

【図2】図1の一次元モデルについて得られるブロック化された行列式を示す概念図である。 2 is a conceptual diagram illustrating blocked matrix equation obtained About one-dimensional model of FIG.

【図3】図2の行列式をブロックに区切って示す概念図である。 3 is a conceptual diagram showing a determinant of 2, it separated into blocks.

【図4】図3の行列式を分解した行列式を示す概念図である。 4 is a conceptual diagram showing an exploded determinant the determinant of FIG.

【図5】図4の行列式の一部を詳細に示す概念図である。 5 is a conceptual diagram illustrating in detail a portion of the determinant in Fig.

【図6】本発明を二次元モデルの場合について説明するための概念図である。 [6] The present invention is a conceptual diagram for explaining the case of a two-dimensional model.

【図7】本発明を三次元モデルの場合について説明するための概念図である。 7 is a conceptual diagram for explaining the case of the three-dimensional model of the present invention.

【図8】従来の一次元モデルを説明するための概念図である。 8 is a conceptual diagram for explaining a conventional one-dimensional model.

【図9】図8の一次元モデルについて作成される行列式である。 9 is a matrix equation is created for the one-dimensional model of FIG.

【符号の説明】 DESCRIPTION OF SYMBOLS

X1〜X17 ノードの変数 C1〜C4 演算回路 R1〜R4 レジスタ P プロセッサ X1~X17 node variables C1~C4 arithmetic circuit R1~R4 register P processor

Claims (4)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 複数のノードが配列されたラインによってノードの一次元配列が定義されると共に、各ノードの変数を各ライン上の最隣接ノードの変数から決定するための方程式が各ノードについて定義された連立方程式を行列表現で演算する演算装置において、(a) 前記ラインの一方の端のノードから他方の端のノードに向けてn跳び(nは2以上の自然数)に通し番号を付与してゆき、他方の端のノード又はそのn個手前のノードから前記一方の端の最隣接ノードに復帰してここから再度他方の端のノードに向けてn跳びの通し番号を付与することをライン上の全ノードについてm回反復することにより通し番号の大小に応じたm個のノード群を形成する手段と、(b)前記各ノードについて定義された連立方程式を前記各ノードに付与さ With defined one-dimensional array of nodes by 1. A plurality of nodes are arranged line, defined for equations for determining the nearest node variables each node on each line a variable for each node in arithmetic unit for calculating the simultaneous equations is a matrix representation, by applying a serial number (a) jump n direction from the node of one end to the node of the other end of the line (n is a natural number of 2 or more) Yuki, other end nodes or the n from the previous node of one end the nearest neighbor and returns to the node again one from here the end node to grant the serial number of the jump n on line toward the It means for forming m number of nodes in accordance with the magnitude of the serial numbers by repeated m times for all nodes, (b) applying of the simultaneous equations defined for each node to each node れた通し番号を行番号及び列番号とする行列式で表現することにより前記m個のノード群単位にブロック化された部分行列を含む行列式を得、 Obtain a determinant comprising partial matrices are blocked into the m nodes units by expressing serial numbers in determinant of the row and column numbers,
    これを前記ノード群単位のm個の部分行列式に分解する手段と、(c)前記m個の部分行列式を一つずつ順にかつ行単位に分解して並列演算する演算する手段とを備えたことを特徴とする並列演算装置。 Comprising decomposing means this in m partial determinant of the node group unit, and means for calculating parallel operation is decomposed into row units and one by one the order of (c) wherein m partial determinant parallel operation and wherein the a.
  2. 【請求項2】複数のノードが配列されたラインが形成され、このようなラインが複数配列されたプレーンによってノードの二次元配列が定義されると共に、各ノードの変数を各ライン上及びライン間の最隣接ノードの変数から決定するための方程式が各ノードについて定義された連立方程式を行列表現で演算する演算装置において、 2. A plurality of nodes are arranged line is formed, such a line with two-dimensional array of nodes are defined by a plurality arrayed plane, each line on the variable of each node and between lines in arithmetic unit equation for determining the nearest node of the variable is calculated by matrix representation the defined system of equations for each node,
    (a) 一方の端のラインから他方の端のラインに向けてn跳び(nは2以上の自然数)に通し番号を付与してゆき、他方の端のライン又はそのn個手前のラインから前記一方の端のラインの最隣接ラインに復帰してここから再度他方の端のラインに向けてn跳びの通し番号を付与することを全てのラインについてm回反復することにより通し番号の大小に応じたm個のライン群を形成する手段と、(b)前記各ライン上のノードについて定義された連立方程式を前記各ラインに付与された通し番号を行番号及び列番号とする行列式で表現することにより前記m個のライン群単位にブロック化された部分行列を含む行列式を得、これを前記ライン群単位のm個の部分行列式に分解する手段と、(c)前記m個の部分行列式を一つずつ順にかつ行単 Towards the line of the other end (a) to one end of the line n jump (n is a natural number of 2 or more) Yuki by applying a serial number, the one from the other end of the line or the n front of the line m-number corresponding to the magnitude of the serial number by and returns to the uppermost adjacent lines of the end of the line repeated m times for all the lines to grant the serial number of the jump n towards the line again other end from here wherein m of means for forming a line group, by expressing a matrix equation to (b) the row number and column number the serial number of the simultaneous equations defined given to each line for the node on the line obtain a determinant containing pieces of line groups units blocked submatrix, decomposing means this in m partial determinant of the line group units, the (c) the m partial determinant one One by and in order Gyotan に分解して並列演算する演算する手段とを備えたことを特徴とする並列演算装置。 Parallel operation apparatus characterized by comprising a means for calculating parallel calculation decomposed.
  3. 【請求項3】複数のノードが配列されたラインが形成され、このようなラインが複数配列されたプレーンが形成され、このようなプレーンが複数配列されることによりノードの三次元配列が定義されると共に、各ノードの変数を各ライン上、ライン間及びプレーン間の最隣接ノードの変数から決定するための方程式が各ノードについて定義された連立方程式を行列表現で演算する演算装置において、(a) 一方の端のプレーンから他方の端のプレーンに向けてn跳び(nは2以上の自然数)に通し番号を付与してゆき、他方の端のプレーン又はそのn個手前のプレーンから前記一方の端のプレーンの最隣接プレーンに復帰してここから再度他方の端のプレーンに向けてn跳びの通し番号を付与することを全てのプレーンについてm回反復するこ 3. A plurality of nodes are arranged line is formed, such lines are multiple arrayed planes formed, three-dimensional array of nodes by such planes are arrayed is defined Rutotomoni, variables on each line of each node, the arithmetic unit equation for determining the nearest node of the variable is calculated by matrix representation the defined system of equations for each node between lines and between planes, (a ) toward the plane of one of the planes of the end other end n jump (n is 2 or more so on are applied to serial natural numbers), plane or the one end from the n pieces before the plane of the other end nearest plane m times for all planes to grant a serial number of the jump n towards the plane of the return to again other end from here to repeat child of planes により通し番号の大小に応じたm m depending on the size of the serial number by
    個のプレーン群を形成する手段と、(b)前記各プレーン上のノードについて定義された連立方程式を前記各プレーンに付与された通し番号を行番号及び列番号とする行列式で表現することにより前記m個のプレーン群単位にブロック化された部分行列を含む行列式を得、これを前記プレーン群単位のm個の部分行列式に分解する手段と、(c)前記m個の部分行列式を一つずつ順にかつ行単位に分解して並列演算する演算する手段とを備えたことを特徴とする並列演算装置。 Means for forming a number of plane group, wherein by representing a matrix equation to (b) the node defined simultaneous equations line serial numbers assigned to the respective plane number and column number for on each plane obtain a determinant comprising m-plane group units blocked submatrix, decomposing means this in m partial determinant of the plane group unit, the (c) the m partial determinant parallel operation apparatus characterized by comprising a means for calculating parallel operation is decomposed into row units and in one by one.
  4. 【請求項4】複数のノードが一次元、二次元又は三次元的に配列され、各ノードの変数を最隣接のノードの変数から決定するための方程式が各ノードについて定義された連立方程式の演算装置において、(a) 前記各ノードを一次元、二次元、三次元的にも複数個の隣接ノードから成る複数のノード群に分割する手段と、(b)前記各ノード群の配列に対応して配列され、対応の群内の各ノードの変数の初期値及び演算結果並びに演算に必要な定数を保持する複数のレジスタと(b)前記各ノード群内の各ノードの変数についての演算を各ノード群内では順次にかつ各ノード群間では並列的に実行する複数の演算回路とを備えたことを特徴とする並列演算装置。 4. A plurality of nodes one-dimensional, two-dimensionally or three-dimensionally arranged, the calculation of simultaneous equations equations is defined for each node to determine the variables of each node from the nearest node of the variable in the device, (a) the one-dimensional each node corresponds to a two-dimensional, it means for dividing into a plurality of nodes comprising a plurality of adjacent nodes in three dimensions, (b) the sequence of each node group It is arranged Te, the calculation for a plurality of registers and (b) the variable for each node in each node group that holds the initial value and operation results and constants required for the operation of the variable for each node in the group of corresponding respective parallel operation apparatus being characterized in that a plurality of arithmetic circuits for performing parallel is between sequentially and each node group in the node group.
JP8414993A 1993-03-18 1993-03-18 Parallel arithmetic unit Withdrawn JPH06274521A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8414993A JPH06274521A (en) 1993-03-18 1993-03-18 Parallel arithmetic unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8414993A JPH06274521A (en) 1993-03-18 1993-03-18 Parallel arithmetic unit

Publications (1)

Publication Number Publication Date
JPH06274521A true JPH06274521A (en) 1994-09-30

Family

ID=13822454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8414993A Withdrawn JPH06274521A (en) 1993-03-18 1993-03-18 Parallel arithmetic unit

Country Status (1)

Country Link
JP (1) JPH06274521A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4893972A (en) * 1988-11-18 1990-01-16 Pittsburgh Tube Company Cutting tool

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4893972A (en) * 1988-11-18 1990-01-16 Pittsburgh Tube Company Cutting tool

Similar Documents

Publication Publication Date Title
Jou et al. Fault-tolerant matrix arithmetic and signal processing on highly concurrent computing structures
Kung et al. Wavefront array processor: Language, architecture, and applications
Winget et al. Solution algorithms for nonlinear transient heat conduction analysis employing element-by-element iterative strategies
Nassimi et al. Data broadcasting in SIMD computers
Lai et al. A survey of solved problems and applications on bandwidth, edgesum, and profile of graphs
Kung The structure of parallel algorithms
Agarwal et al. A three-dimensional approach to parallel matrix multiplication
JP2647327B2 (en) Massively parallel computing system device
JP4430544B2 (en) Multi-adaptive computing system with enhanced parallel performance
US5285524A (en) Neural network with daisy chain control
Fich et al. Relations between concurrent-write models of parallel computation
US5392429A (en) Method of operating a multiprocessor computer to solve a set of simultaneous equations
Thompson Fourier transforms in VLSI
Wang A parallel method for tridiagonal equations
EP0237571B1 (en) Memory-linked wavefront array processor
EP0228915B1 (en) Method and apparatus for simulating systems described by partial differential equations
EP0100511B1 (en) Processor for fast multiplication
Brandt Multigrid solvers on parallel computers
Ranka et al. Hypercube algorithms: with applications to image processing and pattern recognition
Fincham Parallel computers and molecular simulation
US5274832A (en) Systolic array for multidimensional matrix computations
Rosendale On the impact of communication complexity on the design of parallel numerical algorithms
Hayes et al. Hypercube supercomputers
US5280607A (en) Method and apparatus for tolerating faults in mesh architectures
EP0298658A2 (en) Computational apparatus

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000530