SU736107A1

SU736107A1 - Uniform parallel processor

Info

Publication number: SU736107A1
Application number: SU782583315A
Authority: SU
Inventors: Ивери Варламович Прангишвили; Кемер Борисович Норкин; Игорь Иванович Паишев; Иван Петрович Мышкин
Original assignee: Ордена Ленина Институт Проблем Управления
Priority date: 1978-02-22
Filing date: 1978-02-22
Publication date: 1980-05-25

Description

II

Изобретение относитс к области вычислительной техники и может быть ис-/ пользовано при создании высокопроизво-. дительных вычислительных систем дл групповой обработки больших массивов данных в реальном масштабе времени.The invention relates to the field of computer technology and can be used to create high-performance. dative computing systems for group processing of large data arrays in real time.

Известны однородные параллельные, процессоры, построенные на базе однородной вычислительной среды с переменкой структурой ji.Known homogeneous parallel processors, built on the basis of a homogeneous computing environment with a variable structure ji.

Облада свойством перестраиваемости структур как процессорных элементов, так и вычислительной среды (решающего пол ) в целом, такие процессоры позвол ют более экономным, чем на ЭВМ традиционной структуры, путем достигнуть распараллеливани вычислительных процессов и способны показать весьма высокое эффективное быстродействие, исчисл емое сотн ми и более миллионов операций в секунду.Possessing the ability to rebuild the structures of both the processor elements and the computing environment (decisive floor) as a whole, such processors allow more economical than on a traditional structure computer by achieving parallelization of computational processes and are able to show a very high effective speed, calculated in hundreds and more than millions of operations per second.

Наиболее близким к предлагаемому вл етс однородный параллельный процессор , который представл ет собой со-The closest to the proposed is a homogeneous parallel processor, which is a

вокупность взаимосв занных процессорных элементов с перестраиваемыми св з ми , управл емую общим устройством .управлени , и предназначен дл решени задач групповой обработки больших массивов данных в реальном .масштабе времени . Распараллеливание вычислительного процесса в этом процессоре достигаетс благодар использованию распределенных управлений с широким использованием настроек и принципа микропрограммного управлени , реализуемого при помощи локальных микропрограммных устройств, а также программного устройства управлени . При этом в посто нных запоминающих устройствах микропрограммных устройств хран тс массивы микрокоманд. Кажпа микрокоманда задает .определенное состо ние процессорного элемента, а каждый массив микрокоманд представл ет собой микропрограмму выполнени одной какой-нибудь команды (оператора), например сложени , умножени , делени , Ъдвига и т. д. Тогда посто нное запоми37 нающее устройство должно содержать столько массивов, сколько команд содержит система команд данного процессора, а размерность управл ющего слова (микрокоманды ) в массиве определ етс числом точек управлени процессорным элементом и количеством сопровождающей служебной информации. При этом одни и те же микрокоманды (состо ни микропроцессора ) могут многократно входить различные микропрограммы, поэтому они будут записаны в пам ть микропрограммного устройства столько раз, сколько раз встречаютс в массивах микрокоманд . (микропрограммах) 21. Существенный недостаток такой схемы управлени состоит в том, что дл ее реализации необходимости многократной записи микрокоманд требуетс неоправданно завышенный объем посто нного запоминающего устройства. Цель изобретени - уменьшение объем посто нных запоминающих устройств, тре бующихс дл реализации микропрограммного управлени параллельным процессором . Указанна цель достигаетс тем, что в известный однородный параллельный процессор, содержащий блок программного управлени , л устройств обработки данных, каждое из которых содержит входной регистр, блок оперативных регистров , выходной регистр, блок управл емых элементов И, арифметико-логический блок и блок микропрограммного управлени , причем первый вход входного регистра каждого устройства обработки даннъЕХ соединен с соответствующим выходом блока коммутации, а выход вход ного регистра подключен к первому входу блока управл емых элементов И, первый вход - выход которого соединен с выходом - входом блока оперативных регистров, второй вход-выход блока управлени элементов И подключен к выходу - входу арифметико-логического блока, первъй выход которого соединен с первым входом блока микропрограммно го управлени , а второй вькод арифметико-логического блока подключен к первому входу выходного регистра, а выход выходного регистра каждого устройства обработки данных подключен к соответст вующему входу блока коммутации, выход блока микропрограммного управлени каж дого устройства обработки данньрс подклю чен к соответствующему входу блока про раммного управлени , первый вход-выход 7 которого вл етс входом-выходом процессора , вход блока приема информации вл етс входом процессора, а вьсход блока приема информации подключен к ин- формацион}1ому входу блока коммутации, а выход блока диспетчеризации соединен с управл ющими входами блока приема инфqэмaции, блока программного управлени и блока микропрограммного управлени каждого устройства обработки данныХ; введен блок пам ти, а в каждое устройство обработки данных введена посто нна пам ть, при этом вход- выход посто нной пам ти соединен со входом-выходом блока микропрограммного управлени , первый выход посто нной пам ти подключен ко второму входу входного регистра, второй выход посто нной пам ти подключен ко второму входу блока управл емых элементов И, третий выход посто нной пам ти соединен со входом арифметико-логического блока, четвертый выход посто нной пам ти подключен ко второму входу выходного регистра , второй вход блока микропрограммного управлени каждого устройства обработки данных соединен с соответствующим выходом блока пам ти, вход-, выход которого подключен ко второму выходу-входу блока программного управлени , а управл ющий выход блока пам ти подключен к управл ющему входу блока коммутации. Благодар введению посто нных запоминающих устройств удаетс избежать повторений записи микрокоманд в пам ть (имеет место в известном процессоре). Во вновь вводимое посто нное запоминающее устройство записьюаетс вс совокупность микрокоманд, встречающихс хот бы в из микропрограмм. При этом микрокоманда записываетс только один раз и имеет свой строго фиксированный адрес в пределах посто нного запоминающего устройства. Благодар этому по вл етс возможность составл ть микропрограммы реализации команд процессора просто в виде перечней имен микрокоманд с указанием правил перехода к очередному имени. Таким образом, требуема совокупность микропрограмм, реализующих команды процессора, определена на заранее заданном множестве микрокоманд. Составленные таким образом микропрограммы , имеющие более сжатый вид, чем аналогичные микропрограммы известного процессора, хран тс в посто нномThe combination of interconnected processor elements with tunable links, controlled by a common control device, is intended for solving problems of group processing of large data arrays in real time. Parallelization of the computational process in this processor is achieved through the use of distributed controls with extensive use of settings and the principle of microprogram control, implemented using local microprogram devices, as well as a software control device. In this case, arrays of microinstructions are stored in permanent memory devices of microprogram devices. Each microcommand specifies a certain state of the processor element, and each array of microcommands represents the microprogram of executing one command (operator), for example, addition, multiplication, division, shift, etc. Then the constant memory should contain arrays, how many commands are contained in the command system of a given processor, and the dimension of the control word (microcommand) in the array is determined by the number of control points of the processor element and the number of accompanying service oh information. At the same time, the same microcommands (microprocessor states) can repeatedly enter different microprograms, so they will be written into the memory of the firmware as many times as they occur in arrays of microinstructions. (microprograms) 21. A significant disadvantage of such a control scheme is that for its realization the need for multiple recording of micro-instructions requires an unnecessarily high amount of permanent memory. The purpose of the invention is to reduce the amount of persistent storage devices required to implement firmware control of a parallel processor. This goal is achieved by the fact that a known homogeneous parallel processor containing a software control unit, l data processing devices, each of which contains an input register, operational register block, output register, AND controllable element block, arithmetic logic unit, and microprogram control unit , the first input of the input register of each data processing device is connected to the corresponding output of the switching unit, and the output of the input register is connected to the first input of the control unit x elements I, the first input — the output of which is connected to the output — the input of the operational register unit; the second input-output of the control unit of the elements I connected to the output — the input of the arithmetic logic unit, the first output of which is connected to the first input of the microprogram control unit, and the second The code of the arithmetic logic unit is connected to the first input of the output register, and the output register output register of each data processing device is connected to the corresponding input of the switching unit, the output of the microprogram control unit The second data processing device is connected to the corresponding input of the software control unit, the first input-output 7 of which is the input-output of the processor, the input of the information receiving unit is the input of the processor, and the output information of the information receiving unit is connected to the first input a switching unit, and the output of the dispatching unit is connected to the control inputs of the information receiving unit, the program control unit and the microprogram control unit of each data processing device; a memory block is inserted, and a constant memory is inserted into each data processing device, the input / output of the permanent memory is connected to the input-output of the microprogram control unit, the first output of the permanent memory is connected to the second input of the input register, the second output the fixed memory is connected to the second input of the controllable element block And, the third output of the fixed memory is connected to the input of the arithmetic logic unit, the fourth output of the permanent memory is connected to the second input of the output register, the second input of the mic block The program control of each data processing device is connected to the corresponding output of the memory block, the input-output of which is connected to the second output-input of the program control block, and the control output of the memory block is connected to the control input of the switching unit. By introducing persistent storage devices, it is possible to avoid repeating the recording of micro-instructions in the memory (takes place in a known processor). In the newly introduced Permanent Memory, an entire set of micro-instructions are recorded, at least in the firmware. In this case, the microinstruction is recorded only once and has its strictly fixed address within the permanent storage. Due to this, it is possible to compile the firmware implementation of the processor commands simply in the form of lists of names of microinstructions with instructions for transition to the next name. Thus, the required set of firmware that implements processor commands is defined on a predetermined set of microinstructions. Firmware compiled in this way, having a more compressed look than similar firmware of a known processor, are stored in a constant

запоминающем устройстве микропрограммного устройства.memory device firmware.

В блоке пам ти хранитс Множество различньос сочетаний команд (микропрограммы ) , которые встречаютс в данной задаче и задают режимы работ устройств обработки в каждом такте работы процессора. Например, строка массива может иметь следующий смысл: первому устройству обработки выполнить сложение, второму - умножение, третьему - деление и т. д., а , h4-му - ничего не делать. В следующем такте сочетание команд в строке будет другое и, соответственно, устройства обработки будут работать уже в других режимах. Каждое сочетание команд дл устройств обработки записываетс в блок пам ти один раз и получает при этом свой адрес . Благодар этому по вл етс возможность составл ть программу решени задачи в виде перечн различных сочетаний команд аналогично управлению на уровне микрокоманд, а сами программы , составленные таким образом, хранить в оперативном запоминающем устройстве блока программного управлени . При этом длина команд программы такж сократитс по сравнению с известным процессором.The memory block contains a number of different combinations of commands (firmware) that are encountered in this task and set the operating modes of the processing devices in each processor clock cycle. For example, an array string can have the following meaning: the first processing device should perform addition, the second - multiplication, the third - division, etc., and, h4, do nothing. In the next cycle, the combination of commands in the line will be different and, accordingly, the processing devices will already work in other modes. Each combination of instructions for processing devices is written to the memory block once and at the same time receives its address. Due to this, it is possible to compile a problem solving program in the form of a list of various combinations of commands similar to the control at the microinstruction level, and the programs themselves, thus composed, are stored in the operational memory of the program control unit. At the same time, the length of the program commands is also reduced compared with the known processor.

На чертеже представлена блок-схема однородного параллельного процессора, построенного на базе четырех устройств обработки данных (f 4).The drawing shows a block diagram of a homogeneous parallel processor built on the basis of four data processing devices (f 4).

Однородный параллельный процессор состоит из блока 1 приема информации, блока 2 коммутации, блока 3 диспетчеризации , блока 4 пам ти (например, полупосто нной пам ти), блока 5 программного управлени , VI устройств 6-9 обработки данных, каждое из которых: содержит входной регистр 10, блок 11 управл емых элементов И, блок 12 оперативных регистров, арифметико-логический блок 13, выходной регистр 14, посто нную пам ть 15 и блок 15 микропрограммного управлени .The homogeneous parallel processor consists of information receiving unit 1, switching unit 2, scheduling unit 3, memory unit 4 (for example, semi-permanent memory), program control unit 5, data processing devices 6–9 VI, each of which contains an input the register 10, the unit 11 of the controlled elements I, the unit 12 of the operational registers, the arithmetic logic unit 13, the output register 14, the permanent memory 15 and the unit 15 of the microprogram control.

Блок 1 приема информации служит дл приема данньрс извне, временного их хранени и передачи их по командам из устройства управлени на выход блока коммутации.The information receiving unit 1 serves to receive data from outside, temporarily store them and transmit them on commands from the control device to the output of the switching unit.

Блок 2 коммутации служит дл установлени нужных св зей между входами и вькодами устройств 6-9 обработки, а также выходом блока 1 приема информации и входами устройств обработки. Нужное состо ние блока коммутации уста- ном The switching unit 2 serves to establish the necessary connections between the inputs and codes of the processing devices 6-9, as well as the output of the information receiving unit 1 and the inputs of the processing devices. The desired state of the switching unit is set to

навливаетс при помощи информации, снимаемой с блока 4 пам ти по командам из блока 5 программного управлени .It is generated using information removed from memory block 4 by commands from software control block 5.

Устройства 6-9 обработки служат дл реализации элементарных вычислительных операций (команд). В качестве эле- ментарньк операций прин ты, например, такие операции, какProcessing devices 6-9 serve to implement elementary computational operations (commands). For example, such operations as

алгебраическое сложение чисел с фиксированной зап той;algebraic addition with fixed comma;

00

алгебраическое сложение чисел с плавающей зап той;algebraic addition of floating point numbers;

умножение чисел с фиксированнойmultiplication of numbers with a fixed

зап той;commented;

5five

умножение чисел с плавающей зап той;multiplying floating point numbers;

деление чисел с фиксированной зап той;dividing fixed-point numbers;

деление чисел с плавающей зап той;dividing floating point numbers;

00

умножение чисел с фиксированной зап той с произвольным форматом и т. д.multiplication of numbers with a fixed comma with an arbitrary format, etc.

В качестве эле ментарньк операций могут быть прин ты также вычислени Calculations can also be taken as elementary operations.

5 значений таких функций, как F Ах + В F - АЧ, +YH5 values of functions such as F Ax + B F - AF, + YH

Y А + Ч,Н Y A + H, N

Эти функции обычно вы вл ютс при де0 композиции алгоритмов решени конкретных классов задач. These functions are usually found when deciding the composition of algorithms for solving specific classes of problems.

Входной регистр 10 служит дл оперативного приема данных от входного устройства и от устройств обработки.Input register 10 is used to operatively receive data from the input device and from processing devices.

5five

Выходной регистр 14 служит дл оперативной выдачи результатов на входы устройств обработки, а также на другие внешние потребители информациейOutput register 14 is used to promptly output results to the inputs of processing devices, as well as to other external users with information.

Арифметико-логический блок 13 непосредственнореализует , команды, т. е. элементарные вычислительные и логические операции.The arithmetic logic unit 13 directly implements commands, i.e., elementary computational and logical operations.

Блок 12 оперативных регистров обслуживает нуждь арифметико-логического блока.Block 12 operational registers serves the need arithmetic logic unit.

Блок 11 управл емых элементов И служит дл задани режимов pa6otbi, т. е. типов выполн емых элементарных операций устройств отработки.The unit 11 of the controlled elements I serves to set the pa6otbi modes, i.e., the types of elementary operations performed by the mining devices.

Посто нна пам ть 15 служит дл хранени множества микрокоманд. Информаци в пам ть 15 заноситс один раз (например, при изготовлении устройства обработки) и, как правило, в дальнейшем не мен етс , хот это и не исключаетс .Permanent memory 15 serves to store a variety of micro-instructions. The information in the memory 15 is entered once (for example, in the manufacture of a processing device) and, as a rule, does not change in the future, although this is not excluded.

Блок 16 микропрограммного управлени служит дл хранени в своем посто нзапоминающем устройстве библиоте- ки микропрограмм, а также вызова из библиотеки нужных микропрограмм н уп равлени их вьшолнением. По окончании выполнени команды выдаетс сигнал в блок програм шого управлени . Так как совокупность микропрограмм может обновл тьс , то часть пам ти дл хранени микропрограмм может быть вьшолне на на полупосто нном принципе. Блок 4 пам ти служит дл хранени множества различных сочетаний команд на устройстве обработки, которые встре чаютс при решении данной задачи. Информаци в блок 4 записьшаетс перед пуском процессора на решение задачи. Блок 5 программного управлени служит дл реализации программы решени задачи в целом. Очевидно, что при рассмотренном способе организации счета программа состоит в задании правил че редовани имен указанных сочетаний микропрограмм (назовем их командами программы, т. е. командами более высо кого «уровн ). Ошгородный параллельный процессор функционирует следующим образом. D пам ти блока 3 диспетчеризации находитс управл юща программа-диспетчер , котора осуществл ет управление работой процессора во всех режимах и ситуаци х. В посто нную пам ть 15 устройств обработки раз и навсегда записано множество микрокоманд. Программа пишетс на алгоритмическом- зыке. После трансл ции и сборки получаетс готова программа на зы ке загрузки, содержаща полный обьем настроечной информации дл всех блоков При этом настройками будут коды различных сочетаний команд дл блока 4 и новые микропрограммы, которые должны быть добавлены в имеющуюс библиотеку блока 16 микропрограммного управлени . llispeu решением задачи собранна программа под управлением диспетчера загружаетс в оперативную пам ть блока 5 программного управлени . Одновременно загружаютс вышеназванные настройки программы в блок 4. Дл решени задачи диспетчер передает управление блоку 5 программного управлени , которое начинает поочередно вызывать из своего оперативного запоми нающего устройства команды (операторы программы. Вызванна команда засылает с в местное устройство управлени блока -{ пам ти, в котором она дешифруетс И интерпретируетс уже конкретным сочетанием команд дл устройств обработки. Дальше эти команды проход т в блоки микропрограммного управлени соответствующих устройств обработки и вызьшают к действию соответствующие микропрограммы , их реализующие. Блоки микропрограммного управлени считьшают имена микрокоманд из данной микропрограммы и посылают их в посто нную пам ть 15, где они будут интерпретированы как одна из хран щихс там микрокоманд. Об окончании вьтолнени микропрограммы блок микропрограммного управлени сигнализирует блоку программного управлени . Блок программного управлени вызьшает следующую команду программы и процесс повтор етс . Задание микропрограмм в виде всевозможных списков микрокоманд над заранее заданным множеством микрокоманд позвол ет выделить общую часть микропрограмм в самосто тельньй массив управл ющей информации, что позвол ет сократить длину управл ющих слов микропрограмм , а благодар этому и значительно сократить обьем пам ти, необходимой дл реализации микропрограммного управлени . Например, N-общее количество микрокоманд; ц- разр дность микрокоманды, т. е. длина управл ющего слова; Nv- общее количество команд в системе команд процессора; ti- количество разр дов в имени микрокоманды в микропрограмме; очевидно УП - р - среднее количество микрокоманд в микропрограмме. Объем пам ти, необходимой дл реализации микропрограммного управлени в известном процессоре, определ етс выражением Т., Мрп. Будем считать, что объем пам ти дл лужебной информации дл обоих случаев динаков, поэтому в ц не входит раз дность служебной информации. Обьем пам ти, необходимъШ дл реаизации микропрограммного .управлени предлагаемом процессоре, определ ют о формуле 1l.-Nv -vNVplg-,. . огда выигрыш в объеме пам ти оцениают при помощи выражени U Nn -Nvpuog-jjH N-1000, И--200, 200, устьFirmware control unit 16 serves for storing in the library of the microprograms in its memory and for calling the required microprograms from the library to control their execution. At the end of the execution of the command, a signal is issued to the program control unit. Since the entirety of the firmware may be updated, a portion of the memory for storing the firmware may be on a semi-permanent basis. The memory unit 4 serves to store a plurality of different combinations of instructions on the processing device that are encountered in solving this task. The information in block 4 is recorded before starting the processor to solve the problem. The program control unit 5 serves to implement the program for solving the problem as a whole. Obviously, with the considered method of organizing an account, the program consists in setting rules for alternating the names of the specified combinations of microprograms (let's call them program commands, that is, commands of a higher “level”). Oshgorodny parallel processor operates as follows. The D memory of the dispatching unit 3 is a dispatcher control program that controls the operation of the processor in all modes and situations. A multitude of microinstructions are written once and for all into a fixed memory of 15 processing devices. The program is written in algorithmic language. After translation and assembly, a program is ready for download, containing a full amount of configuration information for all blocks. The settings will be codes for various combinations of commands for block 4 and new firmware that should be added to the existing library of block 16 of firmware control. By solving the task, the assembled program under the control of the dispatcher is loaded into the RAM of the program control unit 5. At the same time, the above-mentioned program settings are loaded into block 4. To solve the task, the dispatcher transfers control to the program control block 5, which starts alternately calling commands from the operating memory of the device (program operators. The called command sends to the local control unit of the block {memory, where it is decrypted and interpreted by a specific combination of commands for processing devices, and then these commands are passed to the firmware control blocks of the corresponding devices. processing programs and the corresponding microprograms implement them. The microprogram control units find out the names of micro-instructions from this microprogram and send them to the permanent memory 15, where they will be interpreted as one of the micro-commands stored there. On the end of the microprogram execution, the microprogram control unit it signals to the program control unit. The program control block executes the next program command and the process repeats. Setting microprograms in the form of various lists of micro-commands over a predetermined set of micro-commands allows you to select a common part of the micro-programs into an independent array of control information, which allows you to reduce the length of the micro-program control words, and therefore significantly reduce the memory required to implement the micro-program management For example, N is the total number of microinstructions; cb-bit microcommand, i.e. the length of the control word; Nv is the total number of commands in the processor instruction set; ti- the number of bits in the microinstruction name in the firmware; obviously UE - p - the average number of microinstructions in the microprogram. The amount of memory required to implement firmware control in a known processor is determined by the expression T., MP. We assume that the amount of memory for the relevant information for both cases is dinak, therefore, the distribution of service information is not included in c. The amount of memory required for re-firmware firmware control of the proposed processor is determined by the formula 1l.-Nv -vNVplg- ,. . When the gain in the memory size is estimated using the expression U Nn -Nvpuog-jjH N-1000, I - 200, 200, ust

m 2ogr2 100O 10, p 50. Эти данные не противоречат соответствующим параметрам современньк процессоров.m 2ogr2 100O 10, p 50. These data do not contradict the corresponding parameters of modern processors.

Тогда, подставив эти данные, получим раз. Таким образом, дл данного случа выигрыш составл ет 6 раз.Then, substituting this data, we get times. Thus, for this case, the gain is 6 times.

Claims

1. USSR Author's Certificate No. 479114, cl. q O6F 15/00, 1974.

2. Medvedev I. A. and others. Multiprocessor computing systems with a tunable structure. M., 1975 (prototype).

ABOUT

eight .

/

sh "and

AND

/ 3

Y6

but