SU1399763A1 - Node processor - Google Patents
Node processor Download PDFInfo
- Publication number
- SU1399763A1 SU1399763A1 SU864154634A SU4154634A SU1399763A1 SU 1399763 A1 SU1399763 A1 SU 1399763A1 SU 864154634 A SU864154634 A SU 864154634A SU 4154634 A SU4154634 A SU 4154634A SU 1399763 A1 SU1399763 A1 SU 1399763A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- input
- output
- decision block
- processor
- inputs
- Prior art date
Links
Landscapes
- Complex Calculations (AREA)
Abstract
Изобретение относитс к вычислительной технике и может быть исполь - зовано при решении сеточных уравнений , к которым привод тс уравнени с частными производными второго пор дка . Цель изобретени - повышение быстродействи . Поставленна цепь достигаетс тем, что в узловой процесг сор, содержащий первый решающий блок 1, регистр 3 сдвига данных, блок 4 пам ти коэффициентов и элемент И 5, введены второй решающий блок 1 и узел 2 св зи. 1 з.п. ф-лы 2 ил.The invention relates to computing and can be used in solving grid equations, to which second-order partial differential equations are reduced. The purpose of the invention is to increase speed. The delivered chain is achieved by the fact that a second decision unit 1 and a communication node 2 are entered in the node process containing the first decision unit 1, the data shift register 3, the coefficient memory unit 4 and the element 5. 1 hp f-ly 2 ill.
Description
0000
со со о ооco co oo
Изобретение относитс к вычислительной технике и предназначено дл решени сеточных уравнений, к которым привод тс уравнени с частными про- изводными второго пор дка.The invention relates to computing and is intended to solve grid equations, to which equations with second-order partial derivatives are reduced.
Цель изобретени - увеличение быстродействи .The purpose of the invention is to increase speed.
Па фиг.1 изображена схема узлового процессора; на фиг.2 - схема блока управлени .Pa figure 1 shows a diagram of the nodal processor; 2 is a control block diagram.
Узловой процессор (фиг.1) содержит первый и второй решающие блоки 1, узел 2 св зи, регистр 3 сдвига начальных данных, блок 4 пам ти коэффи- циентов, элемент И 5 и блок 6 управлени в сеточном процессоре.The node processor (FIG. 1) contains the first and second decision blocks 1, the communication node 2, the initial data shift register 3, block 4 of the coefficient memory, AND 5 and control block 6 in the grid processor.
Каждый решающий блок 1 включает два сдвигател 7 и 8, с +1 элементов И 9, где с - число соседних, узловых процессоров дп данного узлового процессора , (с + 2)-и элемент И 10 и сумматор 11.Each decision block 1 includes two shifters 7 and 8, with +1 elements And 9, where c is the number of neighboring, node processors dp of the given node processor, (c + 2) is And the element 10 and adder 11.
Узел 2 св зи состоит из элемента И 12, триггера 13 и элемента 2И-ИЛИ 14, служащих дл вьщачи в течение определенного времени в соседние узловые процессоры кода очередного младшего разр да решени .Communication node 2 consists of an AND 12 element, a trigger 13 and an II-OR 14 element, which serve for a certain time to the next node processor of the next least significant solution code.
Сеточный процессор содержит сетку узловых процессоров и блок 6 управлени .The grid processor contains a grid of nodal processors and a control unit 6.
Блок 6 управлени (фиг.2) состоит из первого 15, второго 16 и третьего :17 счетчиков,триггера 18, первого 19 ;второго 20, третьего 21 и четвертого I22 элементов И.The control unit 6 (FIG. 2) consists of the first 15, second 16 and third: 17 counters, trigger 18, first 19; second 20, third 21 and fourth I22 elements I.
: Сеточный процессор предназначен I дл решени сеточных уравнений, к Iкоторым привод тс дифференциальные уравнени с частными производными второго пор дка. Пор док решаемых ce точных уравнений не превьшает числа узловых точек сеточного процессора. Узловые точки, например, плоского сеточного процессора располагаютс fS виде плоской равномерной сетки, между соседними узлами которой имеютс ; двухсторонние информационные св зи. В каждой узловой точке расположен узловой процессор, который вычисл ет значение функции по формуле: A grid processor is designed I for solving grid equations, to which I use second-order partial differential equations. The order of solvable ce exact equations does not exceed the number of nodal points of the grid processor. The nodal points, for example, of a flat grid processor, are located fS in the form of a flat uniform grid, between which adjacent nodes exist; two-way information communications. At each node, there is a node processor, which calculates the value of the function using the formula
jg jg
5 five
0 0
5 five
00
0 с 0 s
00
,j - значени координат узлового, j - nodal coordinates
процессора; I - свободный член уравнени .processor; I is the free term of the equation.
Вычислительный процесс носит итерационный характер и завершаетс , когда максимальное приращение искомой функции от итерации к итерации становитс меньше заданной величины.The computational process is iterative in nature and ends when the maximum increment of the desired function from iteration to iteration becomes less than a specified value.
При решении практических задач, требующих большого количества узловых точек, с погрешностью, определ емой значением младшего разр да исходных данных, требуетс оперировать с числами, разр дность которых превы- щает разр дность исходных данных. Это объ сн етс тем, что в последовательных умножени х, когда результат предьщущего умножени используетс дл получени следующего произведени , участвуют только старшие разр ды произведений. Остальные младшие разр ды произведений отбрасываютс и в вычислени х не принимают участие, в результате чего быстро увеличиваетс погрешность вычислений. Дл уменьшени погрешности вычислений необхо- Р(ИМО увеличивать число разр дов сеточного процессора, однако при этом увеличиваетс врем выполнени операции умножени , а следовательно, и врем работы сеточного процессора.When solving practical problems that require a large number of nodal points, with an error determined by the value of the lower bit of the source data, it is required to operate with numbers whose size exceeds the size of the source data. This is due to the fact that in successive multiplications, when the result of the previous multiplication is used to obtain the next product, only the higher bits of the products are involved. The remaining minor bits of the products are discarded and are not involved in the calculations, as a result of which the calculation error increases rapidly. To reduce the calculation error of the need for P (IMO to increase the number of bits of the grid processor, however, this increases the time of the multiplication operation, and consequently, the time of the grid processor operation.
В сеточном процессоре операции выполн ютс с 2а-разр дными числами и учитъшаютс переносы, возникающие при сложении младших разр дов За-разр д- ных частичных сумм произведений. Дл уменьшени времени вычислени сетка раздел етс на два сло путем введени в каждый узловой процессор второго решающего блока 1 и узла 2 св зи между решаюшдми блоками 1. В верхнем слое вычисл ютс а старших разр дов результата. В нижнем слое параллельно во времени вычисл ютс младшие разр ды а разр дов 2а - разр дных результатов, которые складываютс с результатами вычислени верхнего сло сетки в следующей итерации. За счет распараллеливани во времени вычислений врем одного пор зр дного умножени 2а-разр дных чисел уменьшаетс в oi, раз, гдеIn the grid processor, the operations are performed with 2a-bit numbers and take into account the transfers that occur when adding the lower bits of the Over-bit partial sums of products. To reduce the computation time, the grid is divided into two layers by introducing into each nodal processor a second decision block 1 and a node 2 connection between the decision blocks 1. In the upper layer, the higher bits of the result are calculated. In the lower layer, in parallel, in time, the lower bits are calculated and the bits 2a are the discharge results, which are added to the results of the calculation of the upper grid layer in the next iteration. Due to the parallelization in time of computations, the time of one pore of the multiplication of a 2a-digit number is reduced by oi, times
К.TO.
4 ij , K;,j +q,4,,j -,ч,., + 0. К; - +4 ij, K;, j + q, 4,, j -, h,., + 0. К; - +
T .J- iJ-1T .J-iJ-1
где К - коэффициент передачи;where K is the transfer coefficient;
Ч м., K,.j, 4- H m., K, .j, 4-
d.d.
to(2n)to (2n)
4,four,
где t - врем одного такта умножени .where t is the time of one multiplication cycle.
При подключении b слоев сетки м вычислени уменьшаетс в b раз.When connecting b layers of the grid, the m calculation decreases b times.
Выполнение распараллеленного во времени умножени рассмотрим в течение двух итераций дл двух трехразр дных узловых процессоров, коэффициенты передачи между ними одинаковы и равны К. В первом узловом процессоре вычисл етс произведение С Cf-K:Perform time-parallel multiplication for two iterations for two three-bit nodal processors, the transfer coefficients between them are the same and equal to K. In the first node processor, the product C Cf-K is calculated:
ifi ifi
«"
О, К, K,j к,O, K, K, j K,
вре ,К, q.,K д., К, (f,-K, q.K, Cf,K, (f,K, (f, KI g, K,time, K, q., K d., K, (f, -K, q.K, Cf, K, (f, K, (f, KI g, K,
Oj C( Сц Cj C|| Cf Cg сOj C (Sc Cj C || Cf Cg with
Младаие разр ды C CjC произведени по мере их образовани используютс во втором узловом процессоре дл вычислени частичной суммы произведени D « С К:The mlady of the C CjC product bit of the product as it is formed is used in the second node processor to calculate a partial sum of the product D ' C:
С К. I f 1 9 3 Ъ К 4 2 4 Э C K. I f 1 9 3 b K 4 2 4 Oe
D D.D D.
...D, Dy Dg D, g ..,... D, Dy Dg D, g ..,
Во второй итерации в первом слое второго узлового процессора вычисл - произведениеIn the second iteration in the first layer of the second nodal processor, the computation is the product
етс is
О, С, С, С,O, C, C, C,
разр ды D D 5 Dg , полученные в первой итерации. В ре ультате получаетс произведение D О, младших разр дов ,, но с учетом переносов, возникших, при вычислении этих разр дов.bits D D 5 Dg, obtained in the first iteration. The result is the product of D O, the lower bits, but taking into account the transfers that have arisen in the calculation of these bits.
..
о еции ре :about the issue of the re:
10ten
ни ни no no
1515
е - e -
J3997634J3997634
ре Узловой процессор работает следующим образом.The nodal processor operates as follows.
На регистр 3 и блок 4 поочередно занос тс коды исходной информации. На первьй вход блока 6 управлени выдаетс последовательность тактовых сигналов.Register 3 and block 4 are alternately loaded with the codes of the initial information. A sequence of clock signals is output to the first input of control unit 6.
Вычислительный процесс в процессоре осуществл етс итерационно. В те- чейие каждой итерации определ етс очередное более точное решение сеточной функции, код которой в конце итерации переписьшаетс со сдвигател - 7 на сдвигатель 8. Через элемент И 5 информаци в конце итерации выдаетс , за пределы процессора дл контрол . Если в выбранной узловой точке процессора приращение значени кода наThe computational process in the processor is iterative. At each iteration, another more accurate solution of the grid function is determined, the code of which at the end of the iteration is copied from the shifter - 7 to the shifter 8. Through the And 5 element, the information at the end of the iteration is outputted outside the processor for control. If at the selected nodal point of the processor, the increment of the code value by
20 вторых выходах решающих блоков 1 становитс меньше заданной величины, то решение прекращаетс путем блокировки выдачи тактовых сигналов на первый вход блока 6 управлени . В течениеIf the 20 second outputs of decision blocks 1 become less than a predetermined value, the solution is terminated by blocking the output of clock signals to the first input of control block 6. During
25 каждой итерации выполн етс а циклов по определению очередного приближени решени . В каждом цикле за а тактов определ етс очередна а-разр дна частична сумма и затем за р тактов25 each iteration is carried out in cycles to determine the next approximation of the solution. In each cycle, the next a-bit of the partial sum is determined for the cycles and then for the cycles
30 завершаютс .переносы и определ ютс старшие р разр дов частичной суммы. Число р зависит от числа входов сумматора 11. Так, дл числа входов сумматора 11, не превышающего 8, .30, the transfers are completed and the upper partial bits of the partial amount are determined. The number p depends on the number of inputs of the adder 11. Thus, for the number of inputs of the adder 11, not exceeding 8,.
В блоке 6 управлени формируютс следующие сигналы.In control block 6, the following signals are generated.
С выхода элемента И 19 выдаетс в течение всего вычислительного процесса непрерывна сери сигналов сдвиговFrom the output of the element And 19 is issued during the entire computational process a continuous series of shift signals
Q на вход сдвигател 7. С выхода эле-чQ to the input of the shifter 7. From the output of the eleh
3535
4545
5050
ой м oh m
5555
Мента И 20 выдаетс за один цикл итерации а сигналов сдвига на вход блока 4 П 1м ти коэффициентов. С инверсного выхода триггера 18 по завершении а сдвигов в блоке 4 пам ти коэффициентов вьщаетс сигнал, блокирующий поступление информации через элементы И 9 и 10 на входы сумматора 11. Этим же сигналом обнул етс счетчик 15, снимаетс блокировка со счетчика 16 и прибавл етс единица к содержимому счетчика 17. Счетчик 16 обеспечивает удлинение цикла вычислени на р тактов, необходимых дл завершени переносов в сумматоре П. Если про- моделируетс плоска об- р не превышает 8 и сигнал с выхода четвертого разр цессором ласть, то снимаетс Ment And 20 is given in one iteration cycle and the shift signals to the input of block 4 P 1m of these coefficients. From the inverse output of the trigger 18, upon completion of the shifts in the coefficient memory 4, the signal blocking the flow of information through the elements 9 and 10 to the inputs of the adder 11 is inserted. With the same signal, the counter 15 is reset, the lock is removed from the counter 16 and one is added to the contents of counter 17. Counter 16 provides an extension of the calculation cycle by p cycles required to complete the transfers in adder P. If a flat scale is simulated does not exceed 8 and the signal from the output of the fourth discharge stage is removed
да счетчика 16. Этим сигналом устаНавливаетс в О триггер 18, производитс сдвиг кода в регистре 3 сдвига начальных данных и через элемент И 21 сдвиг кодов в сдвигател х.8.Yes counter 16. With this signal, the trigger 18 is set in O, the code is shifted in the initial data shift register 3 and, through the AND 21 element, the code shift in the shift x.8.
По завершении а циклов итерации сигнал с выхода счетчика 17 блокирует 1 аботу элемента И 21 и через элемент И 22 заносит код с выходов сдвигате- л 7 на сдвигатель 8, а также сбрасывает в О счетчик 17. В элементах И 10 выполн етс поразр дное зт ноже- Ние входной информации на соответствующие коэффициенты. В сумматоре 11Upon completion of the iteration cycles, the signal from the output of counter 17 blocks 1 operation of the element 21 and through element 22 enters the code from the outputs of the shifter 7 on the shifter 8, and also resets the counter 17. In the elements of the 10 input-related information on the corresponding coefficients. In the adder 11
Производитс сложение получаемых раз- |5 вход установки узлового процессораThe addition of the received | 5 input of the installation of the nodal processor is made
произведени , В начале каждого Цикла с первого выхода второго реша- кйцего блока 1 через элемент И 12 уз- Л|а 2 св зи на вход сумматора 11 пос- т|упает очередной разр д корректирую- ш|его кода. Кроме того, с выхода сдви- Г|ател 7 через элемент И 9 на вход с|умматора И поступает поразр дно код Ч|астичной суммы искомого решени , по- Л|ученный за врем предьщущих циклов итерации. В процессе вычислений в течение циклов в сдвигателе 7 образуютс а младших разр дов искомой функции, а в течение а-го цикла по- тактно формируютс старшие а разр - функции. В начале каждого из а-1 п|ервых циклов образующийс младший разр д искомой функции фиксируетс на триггере 13 и вьщаетс через элемент 2И-ИЛИ 14 узла 2 св зи на соот- В гтствующий вход второго решающего блока 1 соседних узловых процессоров, во вторьпс решающих блоках 1 вьшолн - ю гс операции с а младшими разр дами product, At the beginning of each Cycle from the first output of the second block of block 1 through the element And 12 knot - L | a 2 links to the input of the adder 11 after | falls another bit of the corrective | sh | its code. In addition, from the output of the shifting generator, through the element I 9, to the input from the ummator I, the code H | astic sum of the sought solution enters the input, L-learned, during the previous iteration cycles. In the course of computations, the lower bits of the desired function are formed in the shifter 7 during the cycles, and the senior ones and the discharge functions are formed during the a-th cycle. At the beginning of each of the a-1 p | first cycles, the lowest-order bit generated by the function sought is fixed on the trigger 13 and delivered through the 2I-OR 14 element of the communication node 2 to the corresponding input of the second decisive block 1 of the neighboring nodal processors, during the second decade blocks 1 in the execution of the rf operation with a low-order bits
2а .разр дных чисел. Результаты вычис- 40 узлового процессора, второй выход лений искомой функции, полученные на первого решающего блока подключен к2a. Bit numbers. The results of the computation are 40 nodal processors, the second output of the desired function obtained on the first decision block is connected to
первого и второго ре1 , в конце итерации пес;{1вигател х 7 шлющих блоков рфписьгеаютс на сдвигатели 8 этих же решающих блоков 1. Код в сдвигателе 8 второго решающего блока 1 в следующий итерации будет использован как кйрректирующий код во врем вычислений в первом решающем блоке 1.the first and second pe1, at the end of the iteration, dog; {1 engine 7 sending blocks are written to the shifters 8 of the same decision blocks 1. The code in the shift 8 of the second decision block 1 in the next iteration will be used as the correction code during the calculations in the first decision block 1 .
второму входу элемента И, при этом первый решающий блок содержит первы и второй сдвигатели, сумматор и груthe second input element And, with the first decision block contains the first and second shifters, the adder and the group
45 пу из с + 2 элементов И, причем пер вый и второй управл ющие входы перв го решающего блока подключены соответственно к входам записи и сдвига первого сдвигател , выход которого45 pu of from + 2 elements And, and the first and second control inputs of the first decisive block are connected respectively to the recording and shift inputs of the first shifter, the output of which
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864154634A SU1399763A1 (en) | 1986-12-01 | 1986-12-01 | Node processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864154634A SU1399763A1 (en) | 1986-12-01 | 1986-12-01 | Node processor |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1399763A1 true SU1399763A1 (en) | 1988-05-30 |
Family
ID=21270323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU864154634A SU1399763A1 (en) | 1986-12-01 | 1986-12-01 | Node processor |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1399763A1 (en) |
-
1986
- 1986-12-01 SU SU864154634A patent/SU1399763A1/en active
Non-Patent Citations (1)
Title |
---|
Авторское свидетельство СССР 982008, кл. G 06 F 15/32, 1982. Авторское свидетельство СССР № 1132295, кл. G 06 F 15/31, 1984. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US3878985A (en) | Serial-parallel multiplier using booth{3 s algorithm with combined carry-borrow feature | |
US4142242A (en) | Multiplier accumulator | |
SU1399763A1 (en) | Node processor | |
CA1192315A (en) | Systolic computational array | |
US5948051A (en) | Device improving the processing speed of a modular arithmetic coprocessor | |
EP0499412A2 (en) | Serial-input multiplier circuits | |
JPS6186872A (en) | Apparatus for real time processing of digital signal by folding | |
SU1756887A1 (en) | Device for integer division in modulo notation | |
SU960807A2 (en) | Function converter | |
SU942037A1 (en) | Correlation meter of probability type | |
SU1132295A2 (en) | Computation node of digital network | |
SU763904A1 (en) | Matrix microprocessor | |
SU857987A1 (en) | Integro-computing structure | |
SU596952A1 (en) | Arrangement for solving differential simultaneous equations | |
SU1024914A1 (en) | Device for computing simple functions | |
SU1751751A1 (en) | Device for calculating square root from sum of squarers | |
SU1156067A1 (en) | Device for calculating value of log z with base 2 | |
SU1027722A1 (en) | Conveyer-type device for computing logarithmic and exponential function | |
RU1795456C (en) | Device for division of numbers | |
SU1413625A1 (en) | Series-parallel number-multiplying device | |
SU742945A1 (en) | Parallel computing device for solving difference equations of field theory problems | |
SU894717A1 (en) | Computing unit of digital network model for solving partial differential equations | |
SU928348A1 (en) | Device for calculating trigonometric functions | |
SU1242925A1 (en) | Device for multiplying by coefficients | |
SU1536374A1 (en) | Device for multiplying numbers |