RU2720553C1 - Method of organizing a system network in the form of a fail-safe non-blocking three-dimensional sparse p-ary hypercube - Google Patents
Method of organizing a system network in the form of a fail-safe non-blocking three-dimensional sparse p-ary hypercube Download PDFInfo
- Publication number
- RU2720553C1 RU2720553C1 RU2019133094A RU2019133094A RU2720553C1 RU 2720553 C1 RU2720553 C1 RU 2720553C1 RU 2019133094 A RU2019133094 A RU 2019133094A RU 2019133094 A RU2019133094 A RU 2019133094A RU 2720553 C1 RU2720553 C1 RU 2720553C1
- Authority
- RU
- Russia
- Prior art keywords
- switch
- line
- switches
- processors
- nodes
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/803—Three-dimensional arrays or hypercubes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
- H04L45/028—Dynamic adaptation of the update intervals, e.g. event-triggered updates
Abstract
Description
Изобретение относится к построению отказоустойчивых неблокируемых самомаршрутизируемых системных сетей для многопроцессорных систем с сотнями абонентов-процессоров.The invention relates to the construction of fail-safe, non-blocking, self-routing system networks for multiprocessor systems with hundreds of processor subscribers.
Отказоустойчивость в предлагаемой сети обеспечивается наличием нескольких разных прямых каналов между любыми процессорами. Неблокируемость на произвольной перестановке пакетов означает возможность параллельной их передачи от источников к приемникам по прямым каналам (без их буферизации в промежуточных узлах), что повышает быстродействие системы. Самомаршрутизация предполагает возможность прокладки путей локально по узлам без взаимодействия последних между собой.Fault tolerance in the proposed network is ensured by the presence of several different direct channels between any processors. Non-blocking at arbitrary permutation of packets means the possibility of their parallel transmission from sources to receivers on direct channels (without buffering in intermediate nodes), which increases the system performance. Self-routing involves the possibility of laying paths locally over nodes without the latter interacting with each other.
В изобретении предложен способ организации отказоустойчивой неблокируемой самомаршрутизируемой системной сети в виде 3-мерного р-ичного разреженного гиперкуба на базе сетей с топологией p-ичного квазиполного графа, обеспечивающих канальную отказоустойчивость. В дальнейшем для простоты изложения полученную сеть будем называть и сокращенно «Отказоустойчивый неблокируемый трехмерный разреженный р-ичный гиперкуб».The invention provides a method for organizing a fault-tolerant, non-blocking, self-routing system network in the form of a 3-dimensional sparse sparse hypercube based on networks with the topology of a p-quasicomplete graph providing channel fault tolerance. In the future, for simplicity of presentation, we will call the resulting network the abbreviation “Fail-safe, non-blocking three-dimensional sparse r-ical hypercube”.
Построенный неблокируемый разреженный гиперкуб может иметь несколько сотен абонентов (процессорных ядер) при двух-трех разных прямых каналах между ними. Наличие нескольких каналов не только обеспечивает отказоустойчивость данного гиперкуба, но и открывает возможность дальнейшего повышения его быстродействия за счет их параллельного использования.The constructed non-blocking sparse hypercube can have several hundred subscribers (processor cores) with two to three different direct channels between them. The presence of several channels not only ensures the fault tolerance of this hypercube, but also opens up the possibility of further increasing its speed due to their parallel use.
Обобщенный r-мерный p-ичный гиперкуб («Bhuyan L.N. and Agrawal D.P. Generalized Hypercube and Hyperbus Structures for a Computer Network // IEEE Trans, on Computers. - 1984. - Vol. C - 33. No 4. - P. 323-333») со степенью узлов m=rp и числом узлов N=pr используется как системная сеть в некоторых современных многопроцессорных вычислительных системах («Alverson R., Froese Е., Kaplan L., and Roweth D. Cray® XC™ Series Network. - URL: https://www.cray.com/sites/default/files/resources/CrayXCNetwork.pdf (дата обращения 12.10.2018)». Однако эти сети не являются неблокируемыми.Generalized r-dimensional p-egg hypercube (“Bhuyan LN and Agrawal DP Generalized Hypercube and Hyperbus Structures for a Computer Network // IEEE Trans, on Computers. - 1984. - Vol. C - 33.
Введенные в работе «Каравай М.Ф., Подлазов В.С. Распределенный полный коммутатор как «идеальная» системная сеть для многопроцессорных вычислительных систем // Управление большими системами. - 2011. - Вып. 34. - С. 92-116» сети обладают свойством неблокируемости. Эти сети имеют топологию квазиполных графа или орграфа и обладают квадратичной зависимостью числа узлов от их степени (сетевые узлы в этих сетях образованы объединением в одном узле процессора с одноименным коммутатором). Самомаршрутизация в этих сетях является статической, при которой маршрут из любого источника в любой приемник для произвольной перестановки пакетов данных между узлами однозначно определяется номерами узлов и поэтому любой источник самостоятельно прокладывает весь бесконфликтный путь к приемнику для произвольной перестановки пакетов данных между узлами. Главный недостаток этих сетей - малое число узлов в них. Топологию квазиполного орграфа имели сети в виде 2-мерного обобщенного гиперкуба и 2-мерного полного мультикольца, а топологию квазиполного графа имели сети, названные плоскими.Introduced in the work “Karavay M.F., Podlazov V.S. Distributed full switch as an “ideal” system network for multiprocessor computing systems // Management of large systems. - 2011. - Issue. 34. - S. 92-116 "networks have the property of non-blocking. These networks have the topology of a quasi-complete graph or digraph and have a quadratic dependence of the number of nodes on their degree (network nodes in these networks are formed by combining a processor with the same switch in one node). Self-routing in these networks is static, in which the route from any source to any receiver for arbitrary permutation of data packets between nodes is uniquely determined by the numbers of nodes and therefore any source independently paves the entire conflict-free path to a receiver for arbitrary permutation of data packets between nodes. The main drawback of these networks is the small number of nodes in them. Networks in the form of a 2-dimensional generalized hypercube and 2-dimensional complete multiring had the topology of a quasicomplete digraph, and networks called flat planes had the topology of a quasicomplex graph.
В работе «Подлазов B.C. Бесконфликтная самомаршрутизация для трехмерного обобщенного гиперкуба // Проблемы управления. - 2018. - №3. - С. 26-32.» на базе 2-мерного гиперкуба был построен неблокируемый 3-мерный p-ичный гиперкуб, для которого был предложен алгоритм динамической локальной самомаршрутизации. Он позволяет параллельно прокладывать бесконфликтные пути при произвольной перестановке пакетов данных между узлами на основе только локальной информации в промежуточных узлах без взаимодействия между ними. Эта сеть в виде неблокируемого 3-мерного p-ичного гиперкуба, предложенная в данной работе выбрана в качестве прототипа.In the work “Podlazov B.C. Conflict-free self-routing for a three-dimensional generalized hypercube // Control Problems. - 2018. - No. 3. - S. 26-32. " On the basis of a 2-dimensional hypercube, a non-blocking 3-dimensional p-ary hypercube was built, for which an algorithm of dynamic local self-routing was proposed. It allows you to simultaneously run conflict-free paths for arbitrary rearrangement of data packets between nodes based on only local information in intermediate nodes without interaction between them. This network in the form of a non-blocking 3-dimensional p-ary hypercube, proposed in this paper, was selected as a prototype.
Главный недостаток сети, описанной в прототипе, заключается в том, что, будучи неблокируемой и самомаршрутизируемой, она не имеет канальной отказоустойчивости.The main disadvantage of the network described in the prototype is that, being non-blocking and self-routing, it does not have channel fault tolerance.
Технической задачей изобретения является разработка такого способа организации 3-мерной сети, который бы обеспечивал наряду со свойствами неблокируемости и самомаршрутизизации, также и заданную канальную отказоустойчивость в виде нескольких (σ) разных прямых путей передачи пакетов между процессорами.An object of the invention is the development of such a method of organizing a 3-dimensional network, which would provide, along with the properties of non-blocking and self-routing, also a given channel fault tolerance in the form of several (σ) different direct transmission paths of packets between processors.
Техническим результатом изобретения является возможность достижения (σ-1)-кратной канальной отказоустойчивости системной сети.The technical result of the invention is the ability to achieve (σ-1) -fold channel fault tolerance of the system network.
Технический результат достигается тем, что предложен новый способ организации системной сети в виде отказоустойчивого неблокируемого самомаршрутизируемого трехмерного p-ичного разреженного гиперкуба, характеризующегося тем, что R=Np узлов сети, пронумерованных от 0 до Np-1 (0, 1, 2, …, Np-1) располагают по N узлов в порядке их нумерации на гранях XYk (1≤k≤р) 3-х мерного p-ичного обобщенного гиперкуба,The technical result is achieved by the fact that a new method for organizing a system network in the form of a fault-tolerant, non-blocking, self-routing three-dimensional p-ary sparse hypercube is proposed, characterized in that R = Np network nodes, numbered from 0 to Np-1 (0, 1, 2, ..., Np-1) have N nodes in the order of their numbering on the faces XY k (1≤k≤p) of a 3-dimensional p-ary generalized hypercube,
причем каждая группа разбивается на р групп gi (1≤i≤p) с х узлами в первой группе (i=1) и по у узлов в остальных группах (i=2, 3, …, р) при соблюдении условия x+y(p-1)=N, после чего каждая группа gi располагается на пересечении грани XYk с гранью XZj (1≤j≤р), номер которой вычисляется по формуле j=modp(i+k-1),and each group is divided into p groups g i (1≤i≤p) with x nodes in the first group (i = 1) and for nodes in the remaining groups (i = 2, 3, ..., p) subject to the condition x + y (p-1) = N, after which each group g i is located at the intersection of the face XY k with the face XZ j (1≤j≤р), the number of which is calculated by the formula j = mod p (i + k-1),
при этом каждый узел сети включает процессор и коммутатор, связанные дуплексной линией, для связи с другими узлами сети в процессоре организуют группы OIXY, OIXZ по (р-1) дуплексных портов и группу SYZ из (р-1) симплексных выходов, а в коммутаторе организуют группы OIXY, OIXZ, MYZ, DYZ, CYZ, I XZ по (p-1) дуплексных портов и группу SYZ из (р-1) симплексных входов входных портов,wherein each network node includes a processor and a switch connected by a duplex line, for communication with other network nodes in the processor organize groups OI XY , OI XZ on (p-1) duplex ports and group S YZ from (p-1) simplex outputs, and in the switch, OI XY , OI XZ , M YZ , D YZ , C YZ , I XZ groups of (p-1) duplex ports and S YZ group of (p-1) simplex inputs of the input ports are organized,
при этом (р-1) дуплексных портов OIXY каждого из N коммутаторов граней XYk соединяют по одному (р-1) дуплексными линиями с (р-1) портами разных (р-1) процессоров той же грани, и аналогично (р-1) дуплексных портов OIXZ каждого из N коммутаторов граней XZj соединяют по одному (р-1) дуплексными линиями с (p-1) портами разных (р-1) процессоров той же грани в соответствии со схемой соединений N коммутаторов и N процессоров, полученной из неполной симметричной блок-схемы заменой блоков на коммутаторы, элементов на процессоры, инцидентность блоков, и элементов на соединения коммутаторов и процессоров и имеющей вид таблицы из N строк и р+1 столбцов, каждая строка которой содержит номер одного коммутатора и номера р подсоединенных к нему процессоров, и согласно которой к каждому коммутатору подсоединено р различных процессоров, а каждый процессор подсоединен к р разным коммутаторам, и каждая пара процессоров подсоединена к σ разным коммутаторам так, что N=p(p-1)/σ+1, и σ задает число разных путей между любыми двумя процессорами через разные коммутаторы,at the same time, (p-1) duplex ports OI XY of each of the N switch faces XY k are connected one by one (p-1) with duplex lines with (p-1) ports of different (p-1) processors of the same face, and similarly (p -1) the duplex ports OI XZ of each of the N face switch XZ j are connected one by one (p-1) with duplex lines with (p-1) ports of different (p-1) processors of the same face in accordance with the connection diagram of N switches and N processors obtained from an incomplete symmetric block diagram by replacing blocks with switches, elements with processors, incidence of blocks, and elements with connecting switches and processors and having the form of a table of N rows and p + 1 columns, each row of which contains the number of one switch and the number p of processors connected to it, and according to which p different processors are connected to each switch, and each processor is connected to p different switches, and each pair of processors is connected to σ different switches so that N = p (p-1) / σ + 1 , and σ defines the number of different paths between any two processors through different switches,
или в соответствии со схемой соединений N* коммутаторов и N* процессоров, полученной аналогично из расширенной блок-схемой в виде таблицы N* строк и р+1 столбцов, и согласно которой к каждому коммутатору подсоединено р различных процессоров, а каждый процессор подсоединен к р разным коммутатора, а каждая пара процессоров подсоединена к σ или к σ+1 разным коммутаторам так, что N*<p(p-1)/σ+1, и σ или σ+1 задают число разных путей между любыми двумя процессорами через разные коммутаторы;or in accordance with the connection diagram of N * switches and N * processors, obtained similarly from the extended block diagram in the form of a table of N * rows and p + 1 columns, and according to which p different processors are connected to each switch, and each processor is connected to p different switches, and each pair of processors is connected to σ or to σ + 1 different switches so that N * <p (p-1) / σ + 1, and σ or σ + 1 specify the number of different paths between any two processors through different switches
(р-1) портов одноименных групп MYZ, DYZ, CYZ коммутаторов, расположенных на р разных гранях XZj (1≤j≤р) в узлах, имеющих равные по модулю N номера, то есть na≡nb (mod N) и na, nb ∈ [0, Np-1], соединяют группами по (р-1) дуплексных линий, то есть каждая пара коммутаторов в одноименной группе связана дуплексной линией;(p-1) ports of the groups of the same name M YZ , D YZ , C YZ commutators located on p different faces XZ j (1≤j≤p) at nodes that have equal numbers N modulo, i.e., n a ≡n b ( mod N) and n a , n b ∈ [0, Np-1], are connected by groups of (p-1) duplex lines, that is, each pair of switches in the same group is connected by a duplex line;
(р-1) дуплексных портов коммутаторов группы I XZ соединяют дуплексными линиями параллельно линиям между узлами, которые соединены линиями OIXZ,(p-1) duplex ports of the group I XZ switches are connected by duplex lines parallel to the lines between nodes that are connected by OI XZ lines,
а (р-1) симплексных выходов коммутаторов группы SYZ соединяют с симплексными входами процессоров параллельно линиям между узлами, которые соединены линиями группы MYZ;and (p-1) the simplex outputs of the switches of the group S YZ are connected to the simplex inputs of the processors parallel to the lines between nodes that are connected by lines of the group M YZ ;
при этом внутри каждого коммутатора для маршрутизации организуют полнокоммутаторные связи от входов OXY к выходам IXY, IXZ, MYZ, DYZ (OXY и IXY - входы и выходы дуплексных портов OIXY, IXZ - выходы дуплексных портов OIXZ), от входов MYZ к выходам IXZ, от входов DYZ к выходам CYZ, от входов CYZ к выходам IXZ, от входов IXZ к выходам SYZ,at the same time, inside each switch, for routing, full-switch communications are organized from the inputs O XY to the outputs I XY , I XZ , M YZ , D YZ (O XY and I XY are the inputs and outputs of the duplex ports OI XY , I XZ are the outputs of the duplex ports OI XZ ), from inputs M YZ to outputs I XZ , from inputs D YZ to outputs C YZ , from inputs C YZ to outputs I XZ , from inputs I XZ to outputs S YZ ,
причем порты и идентичные им линии в названных группах пронумерованы от 1 до р-1 (1, 2, …, р-1) (номер 0 указывает на внутриузловую связь в группах OXY, OXZ или на отсутствие связи в группе MYZ) и задаются при маршрутизации в группе OXY числами m1 (0≤m1≤р-1), в группах IXZ и I XZ числами m3 (0≤m3≤р-1), в группе MYZ числами m2 (0≤m2≤р-1), в группе DYZ числами m* 2 (0≤m* 2≤р-1), в группах CYZ и SYZ числами m* 3 (0≤m* 3≤р-1), (числа m2, m* 2, m* 3=j-i, если (j-i)≥0, и m2, m* 2, m* 3=p+j-i, если (j-i)<0), i и j - номера граней XZ, на которых расположен узел-источник и узел-приемник),moreover, ports and lines identical to them in the named groups are numbered from 1 to p-1 (1, 2, ..., p-1) (
а установление прямых путей при маршрутизации осуществляют методом червоточины посредством коммутаторов узлов независимо друг от друга с учетом параметров маршрутов, заданных числами m1, m2, m3, m* 2=m1, m* 3=⏐m2-m* 2⏐ в заголовках пилотных пакетов, полученных коммутаторами, и наличия конфликтов на линиях групп MYZ и CYZ следующим образом:and the establishment of direct paths during routing is carried out by the wormhole method using node switches independently of each other, taking into account the parameters of the routes given by the numbers m 1 , m 2 , m 3 , m * 2 = m 1 , m * 3 = ⏐ m 2 -m * 2 ⏐ in the headers of the pilot packets received by the switches and the presence of conflicts on the lines of the groups M YZ and C YZ as follows:
параметры кратчайшего маршрута m1, m2, m3 в заголовке пилотного пакета, сформированном процессором, при отсутствии конфликтов задают три этапа прокладки прямого пути пакетом, а именно, от узла-источника по линии OXY(m1) в следующий узел сети (при m1=0 путь прокладывается в коммутатор исходного узла), коммутатор которого устанавливает путь по линии MYZ(m2) в следующий узел сети (при m2=0 второй этап отсутствует), коммутатор которого устанавливает путь по линии IXZ(m3) в узел-приемник (при m3=0 узел-приемник находится в том же узле, что и коммутатор),the parameters of the shortest route m 1 , m 2 , m 3 in the header of the pilot packet generated by the processor, in the absence of conflicts, specify three stages of laying the direct path by the packet, namely, from the source node on the O XY (m 1 ) line to the next network node ( when m 1 = 0, the path is laid to the switch of the source node), the switch of which sets the path along the line M YZ (m 2 ) to the next network node (when m 2 = 0 there is no second stage), the switch of which sets the path along the line I XZ (m 3 ) to the receiving node (with m 3 = 0, the receiving node is in the same node as the switch),
если коммутатор обнаруживает конфликт при передаче пилотного пакета на линию MYZ(m2), то прокладывает путь на линию DYZ(m* 2),if the switch detects a conflict during the transmission of the pilot packet to the line M YZ (m 2 ), then paves the way to line D YZ (m * 2 ),
если коммутатор получает пилотный пакет по линии DYZ(m* 2) и не обнаруживает конфликт на линии CYZ(m* 3), то прокладывает путь на эту линию, или при обнаружении конфликта прокладывает путь на линию I XZ(m3),if the switch receives a pilot packet on the D YZ line (m * 2 ) and does not detect a conflict on the C YZ line (m * 3 ), then it paves the way to this line, or if a conflict is detected, paves the way on the I XZ line (m 3 ),
если коммутатор получает пилотный пакет по линии CYZ(m* 3), то прокладывает путь на линию IXZ(m3), а если коммутатор получает пилотный пакет по линии I XZ(m3), то прокладывает путь на линию SYZ(m* 3).if the switch receives a pilot packet on line C YZ (m * 3 ), it paves the way on line I XZ (m 3 ), and if the switch receives a pilot packet on line I XZ (m 3 ), it paves the way on line S YZ ( m * 3 ).
Техническая сущность и принцип действия предложенной сети поясняются чертежами.The technical nature and principle of operation of the proposed network are illustrated by drawings.
На фиг. 1 приведен квазиполный граф c N=7, p=4 и σ=2 (квадраты - коммутаторы).In FIG. Figure 1 shows a quasi-complete graph with N = 7, p = 4, and σ = 2 (squares are commutators).
На фиг. 2 приведена Таблица 1 со схемами соединений для двух квазиполных графов с N=7, р=4, σ=1 и N=7, p=4, σ=2In FIG. Table 2 shows the connection diagrams for two quasi-complete graphs with N = 7, p = 4, σ = 1 and N = 7, p = 4, σ = 2
На фиг. 3 представлены неблокируемые плоские сети ПС(7, 3, 1) и ПС(7, 4, 2).In FIG. Figure 3 shows the non-blocking flat networks PS (7, 3, 1) and PS (7, 4, 2).
На фиг. 4 приведена Таблица 2 параметров блок-схем BD(N, р, σ) при малых значениях р и σ.In FIG. Figure 4 shows Table 2 of the parameters of the flowcharts BD (N, p, σ) for small values of p and σ.
На фиг. 5 приведена Таблица 3 параметров блок-схем BD(N, p, σ) и 1-расширенных блок-схем BD(N*, р, σ|σ+1) при малых значениях р и σ.In FIG. Figure 5 shows Table 3 of the parameters of the BD (N, p, σ) flowcharts and 1-extended BD (N * , p, σ | σ + 1) flowcharts for small values of p and σ.
На фиг. 6 приведены 3-х мерный неблокируемый гиперкуб и пример неблокируемого маршрута в нем из узла 10 в узел 26.In FIG. Figure 6 shows a 3-dimensional non-blocking hypercube and an example of a non-blocking route in it from
На фиг. 7 приведен разреженный троичный гиперкуб из плоских сетей на плоскостях XYi и XZj.In FIG. Figure 7 shows a sparse ternary hypercube of flat networks on the planes XY i and XZ j .
На фиг. 8 и фиг. 9 приведены Таблицы 4 и 5 размещения плоских сетей ПС(7, 3, 1) и ПС(7, 3, 2) по плоскостям XY и XZ разреженного гиперкуба.In FIG. 8 and FIG. Fig. 9 shows Tables 4 and 5 of the arrangement of flat networks PS (7, 3, 1) and PS (7, 3, 2) along the planes XY and XZ of a sparse hypercube.
На фиг. 10 и фиг. 11 приведены соответственно Таблицы 6 и 7 размещения по группам для плоских сетей, изоморфных ПС(N, р, 2) и ПС(N р, 3).In FIG. 10 and FIG. 11 are shown respectively Tables 6 and 7 of the placement by groups for flat networks isomorphic to PS (N, p, 2) and PS (N p, 3).
На фиг. 12 приведена структура коммутатора узла разреженного гиперкуба на пересечении плоскостей XY и XZ.In FIG. Figure 12 shows the structure of the commutator of a sparse hypercube node at the intersection of the XY and XZ planes.
На фиг. 13 приведены структура троичного разреженного гиперкуба с секущими ребрами MYZ и пример 3-х этапного маршрута в нем.In FIG. 13 shows the structure of a ternary sparse hypercube with secant ribs M YZ and an example of a 3-stage route in it.
На фиг. 14 и на фиг. 15 приведены соответственно структура коммутаторов узлов в разреженном отказоустойчивом гиперкубе и структура коммутаторов узлов в разреженном отказоустойчивом неблокируемом гиперкубе.In FIG. 14 and in FIG. Figure 15 shows the structure of the node switches in a sparse fail-safe hypercube and the structure of the node switches in a sparse fail-safe non-blocking hypercube.
На фиг. 16 приведен граф прокладывания пути в разреженном отказоустойчивом неблокируемом гиперкубе.In FIG. Figure 16 shows the graph of the path in a sparse fail-safe, non-blocking hypercube.
На фиг. 17 и на фиг. 18 приведены соответственно иллюстрации конфликтов первого и второго типа и их разрешения.In FIG. 17 and in FIG. Figure 18 shows, respectively, illustrations of conflicts of the first and second types and their resolution.
На фиг. 19 приведена Таблица 8 с числом узлов R(p, σ) в 3-мерных разреженных гиперкубах.In FIG. Table 8 shows the number of nodes R (p, σ) in 3-dimensional sparse hypercubes.
Опишем способ организации предложенной системной сети.We describe a method for organizing the proposed system network.
Рассмотрим сначала сети, которые будем использовать для построения из них 3-х мерных разреженных р-ичных гиперкубов. В главе 2.3 работы «Каравай М.Ф., Подлазов B.C. Распределенный полный коммутатор как «идеальная» системная сеть для многопроцессорных вычислительных систем // Управление большими системами. - 2011. - Вып. 34. - С. 92-116» предложены сети, схемы соединения которых представляют собою особый двудольный граф, одну долю которого составляют коммутаторы, а другую - процессоры. Число вершин в каждой доле N, а степень всех вершин в каждой доле одинакова и равна р. Значение р выбирается минимальным, при котором любые два узла в одной доле связаны а путями длины два через разные узлы в другой доле. Каждый такой путь проходит через один коммутатор, и разные пути проходят через разные коммутаторы. Двудольный однородный граф с описанными свойствами мы называем минимальным квазиполным графом («Каравай М.Ф., Пархоменко П.П., Подлазов B.C. Комбинаторные методы построения двудольных однородных минимальных квазиполных графов (симметричных блок-схем) // АиТ. - 2009. - №2. - С. 153-170»). Пример такого графа приведен на фиг. 1 для р=4, N=7 и σ=2. Нетрудно видеть, что каждая пара абонентов связана двумя путями через разные коммутаторы. Здесь возникает вопрос о существовании, нахождении минимальных квазиполных графов и об их параметрах.We first consider the networks that we will use to construct from them 3-dimensional sparse p-ary hypercubes. In chapter 2.3 of the work “Karavay MF, Podlazov B.C. Distributed full switch as an “ideal” system network for multiprocessor computing systems // Management of large systems. - 2011. - Issue. 34. - S. 92-116 ”networks are proposed whose connection diagrams are a special bipartite graph, one part of which is made up of switches, and the other part is processors. The number of vertices in each lobe is N, and the degree of all vertices in each lobe is the same and equal to p. The value of p is chosen to be the minimum at which any two nodes in one lobe are connected and paths of length two through different nodes in another lobe. Each such path goes through one switch, and different paths go through different switches. We call a bipartite homogeneous graph with the described properties a minimal quasi-complete graph (Karavay MF, Parkhomenko PP, Podlazov BC Combinatorial methods for constructing bipartite homogeneous minimal quasi-complete graphs (symmetric flowcharts) // Autom. - 2009. -
Оказывается, что он уже давно решен в комбинаторике. Такие графы описываются на языке неполных уравновешенных блок-схем, в частности, симметричных блок-схем («Холл М. Комбинаторика // Главы 10-12. Мир. М. 1970. 424 С.»). Симметричная блок-схема BD(N, р, σ) задает размещение N элементов по N блокам, при котором каждый блок содержит по р различных элементов, каждый элемент содержится в р разных блоках, а каждая пара элементов содержится в p разных блоках и соблюдается равенство N=р(р-1)/σ+1. Заменяя блоки на коммутаторы, элементы на процессоры, инцидентность блоков и элементов на соединения коммутаторов и процессоров, мы получаем минимальный квазиполный граф. Схемы соединений, полученные таким образом из симметричных блок-схем, совпадают со схемами соединения квазиполных графов и представлены в табл. 1 на фиг. 2. Таблица 1 со схемами соединений для двух квазиполных графов с N=7, р=4, σ=1 и N=7, р=4, σ=2. В каждой строке первая ячейка задает номер коммутатора, а остальные ячейки - номера процессоров, связанных с данным коммутатором ребром в виде дуплексного канала (двух встречных симплексных каналов).It turns out that he has long been resolved in combinatorics. Such graphs are described in the language of incomplete balanced flowcharts, in particular, symmetric flowcharts ("Hall M. Combinatorics // Chapters 10-12. World. M. 1970. 424 S."). The symmetric block diagram BD (N, p, σ) defines the placement of N elements in N blocks, in which each block contains p different elements, each element is contained in p different blocks, and each pair of elements is contained in p different blocks and the equality N = p (p-1) /
Если объединить одноименные коммутатор с процессором квазиполного графа в одном сетевом узле, то мы получим плоскую сеть ПС(N, р, σ). Она является неблокируемой сетью с бесконфликтной статической самомаршрутизацией и обладает (σ-1)-канальной отказоустойчивостью при σ>1. На фиг. 3 представлены неблокируемые сети ПС(7, 3, 1) и ПС(7, 4, 2).If we combine the switch of the same name with the processor of a quasi-complete graph in one network node, then we get a flat network PS (N, p, σ). It is a non-blocking network with conflict-free static self-routing and has (σ-1) -channel fault tolerance for σ> 1. In FIG. Figure 3 shows the non-blocking networks of PS (7, 3, 1) and PS (7, 4, 2).
Самомаршрутизация в HC(N, р, σ). осуществляется по схеме соединений (табл. 1) с использованием номеров узлов абонента-источника и абонента-приемника. В таблице находятся номера коммутаторов, связанных дуплексными каналами с абонентами-приемниками. Среди этих коммутаторов находятся тот, который связан таким же каналом с абонентом-источником. По свойствам квазиполных графов таких коммутаторов σ.Self-routing in HC (N, p, σ). carried out according to the connection diagram (table. 1) using the node numbers of the subscriber-source and subscriber-receiver. The table contains the numbers of the switches connected by duplex channels to the subscriber-receivers. Among these switches are one that is connected in the same channel to the subscriber source. By the properties of quasi-complete graphs of such commutators, σ.
Однако симметричные блок-схемы BD(N, р, σ) существуют и, тем более, построены не для всех значений параметров р и σ. В табл. 2 на фиг. 4 приводится значения N для блок-схем при малых значениях этих параметров. Пустые клетки отмечают блок-схемы, которые не существуют по определению. Прочерки в клетках отмечают блок-схемы, которые не могут существовать по теории, а перечеркнутые значения отмечают блок-схемы, которые еще не построены.However, symmetric block diagrams of BD (N, p, σ) exist and, moreover, are not constructed for all values of the parameters p and σ. In the table. 2 in FIG. 4 shows the values of N for block diagrams at small values of these parameters. Empty cells mark flowcharts that do not exist by definition. Dashes in cells indicate flowcharts that cannot exist in theory, and crossed out values indicate flowcharts that have not yet been constructed.
Необходимость построения отказоустойчивых сетей ПС(N, р, σ) требует некоторого эффективного заполнения пустых клеток в табл. 2. Для этого в работе «Каравай М.Ф., Подлазов B.C. Расширенные блок-схемы для идеальных системных сетей // Проблемы управления. - 2012. - №4. - С. 45-51.» были предложены и построены 1-расширенные блок-схемы BD(N*, p, σ|σ+1), задающие таблицы соединений для 1-расширенных плоских сетей ПС(N*,p, σ|σ+1), в которых малая часть абонентов связаны σ+1 разными путями, а остальные - точно σ разными путями. Значения N и N* числа узлов в вышеупомянутых блок-схемах приводится в табл. 3 на фиг. 5, где последние выделяются подчеркиванием.The need to build fault-tolerant networks PS (N, p, σ) requires some effective filling of empty cells in the table. 2. For this, in the work “Karavay MF, Podlazov BC Extended block diagrams for ideal system networks // Control Problems. - 2012. - No. 4. - S. 45-51. " 1-extended block diagrams BD (N * , p, σ | σ + 1) were proposed and constructed, defining connection tables for 1-extended flat PS networks (N *, p, σ | σ + 1), in which the Some of the subscribers are connected by σ + 1 in different ways, and the rest are exactly σ in different ways. The values N and N * of the number of nodes in the above block diagrams are given in table. 3 in FIG. 5, where the latter are underlined.
Теперь покажем, как из этих отказоустойчивых неблокируемых самомаршрутизируемых плоских сетей строить 3-х мерный разреженный гиперкуб. Напомним, что в неблокируемом 3-мерном p-ичном гиперкубе, предложенном в прототипе, между двумя вершинами можно проложить неблокируемый прямой путь. Однако этот путь единственный и не имеет резервных путей. На фиг. 6 показан 3-х мерный гиперкуб и пример такого неблокируемый маршрута в нем из узла 10 в узел 26. Начальным этапом маршрута является симплексный канал на грани XY2 параллельно оси X от процессора узла 10 до коммутатора узла 11, вторым этапом - симплексный канал на грани XY2 параллельно оси Y от коммутатора узла 11 до коммутатора узла 17 и заключительным этапом - симплексный канал на грани XZ3 параллельно оси Z от коммутатора узла 17 до процессора узла 26, сокращенно 10→11→17→26.Now we show how to build a three-dimensional sparse hypercube from these fault-tolerant non-blocking self-routing flat networks. Recall that in the non-blocking 3-dimensional p-ary hypercube proposed in the prototype, a non-blocking straight path can be laid between two vertices. However, this path is unique and has no backup paths. In FIG. Figure 6 shows a 3D hypercube and an example of such an unblockable route from
В предложенном способе организации отказоустойчивой неблокируемой сети в виде самомаршрутизируемого разреженного 3-х мерного p-ичного гиперкуба можно выделить следующие фрагменты:In the proposed method of organizing a fault-tolerant non-blocking network in the form of a self-routing sparse 3-dimensional p-ary hypercube, the following fragments can be distinguished:
- размещение отказоустойчивых плоских сетей на гранях XY и XZ 3-х мерного гиперкуба таким образом, чтобы идентичные локальные номера узлов плоских сетей граней XY и XZ совпадали на пересечении граней, объединение идентичных коммутаторов в узлах,- placement of fault-tolerant flat networks on the XY and XZ faces of a 3D hypercube so that the identical local node numbers of the flat networks of XY and XZ faces coincide at the intersection of the faces, combining identical switches in the nodes,
- введение дополнительных линий между коммутаторами граней XZ с идентичными локальными номерами узлов для обеспечения полносвязности узлов разреженного гиперкуба,- the introduction of additional lines between the XZ face commutators with identical local node numbers to ensure fully connected nodes of the sparse hypercube,
- введение дополнительных линий в разреженный отказоустойчивый 3-х мерный гиперкуб для обеспечения неблокируемости полученной сети.- the introduction of additional lines in a sparse fault-tolerant 3-dimensional hypercube to ensure non-blocking of the resulting network.
Продемонстрируем предлагаемый способ на примере построения 3-х мерного гиперкуба из плоских сетей ПС(7, 3, 1) без нарушения общности.We demonstrate the proposed method by the example of constructing a 3-dimensional hypercube from flat PS networks (7, 3, 1) without loss of generality.
Пусть строим сеть с R=Np узлами. Пронумеруем их от 0 до Np-1 (0, 1, 2, …, Np-1) и расположим их по N узлов в порядке возрастания на вертикальных гранях XYk (1≤k≤р) 3-х мерного p-ичного обобщенного гиперкуба. Так на фиг. 7 приведен разреженный троичный гиперкуб с размещенными на плоскостях XYi и XZj плоскими сетями (связи в плоских сетях не показаны, но они такие как на фиг. 3).Let us build a network with R = Np nodes. We number them from 0 to Np-1 (0, 1, 2, ..., Np-1) and arrange them in N nodes in ascending order on the vertical faces XY k (1≤k≤p) of a 3-dimensional p-ary generalized hypercube. So in FIG. Figure 7 shows a sparse ternary hypercube with planar networks located on the XY i and XZ j planes (connections in planar networks are not shown, but they are such as in Fig. 3).
В полученном разреженном гиперкубе кроме общей нумерации узлов введем значения этих номеров по mod N. Полученные номера, означают нумерацию узлов в пределах каждой грани и приведены на фиг. 7 в скобках. Заметим, что на всех гранях XY и XZ мы в результате получили по N узлов, пронумерованных от 0 до N. Эту нумерацию в отличие от общей назовем локальной.In the obtained sparse hypercube, in addition to the general numbering of nodes, we introduce the values of these numbers by mod N. The numbers obtained mean the numbering of nodes within each face and are shown in FIG. 7 in brackets. Note that on all faces XY and XZ, as a result, we received N nodes each, numbered from 0 to N. We will call this numbering, in contrast to the general, local.
Видно, что узлы с 0-го по 6-ой расположены на вертикальной грани XY1, узлы с 7-го по 13-ый на грани XY2, узлы с 14-го по 20-ый на грани XY3. При этом каждую серию из N узлов распределим по горизонтальным граням XZj (1≤j≤р) определенным образом. Так, на фиг. 7 видно, что узлы грани XY1 распределены по горизонтальным граням следующим образом: узлы 0, 1, 2 на грани XZ1, узлы 3, 4 на грани XZ2, узлы 5, 6 на грани XZ3, а каждая следующая серия из N узлов распределена по горизонтальным граням аналогично предыдущей, но с циклическим сдвигом на одну горизонтальную грань вверх. В общем виде способ разбиения по горизонтальным граням формулируется так: каждая серия N узлов разбивается на р групп gi (1≤i≤р) с х узлами в первой группе (i=1) и по у узлов в остальных группах (i=2, 3, …, p) при соблюдении условия х+у(р-1)=N, после чего каждая группа gi располагается на пересечении грани XYk с гранью XZj (1≤j≤р), номер которой вычисляется по формуле j=modp(i+k-1). Такое разбиение на группы gi (1≤i≤р), задаваемое парой (х, у) назовем d разбиением.It can be seen that the nodes from the 0th to the 6th are located on the vertical XY 1 face, the nodes from the 7th to the 13th on the XY 2 face, the nodes from the 14th to the 20th on the XY 3 face. Moreover, each series of N nodes is distributed over the horizontal faces XZj (1≤j≤p) in a certain way. So in FIG. Figure 7 shows that the nodes of the XY 1 face are distributed along the horizontal faces as follows:
Пример такого размещения узлов ПС(7, 3, 1) по плоскостям XY и XZ в привязке к локальным номерам (LN), задаваемого d разбиением (3, 2) представлено в Таблице 4 на фиг. 8 (в общем случае d разбиение задается парой (р, р-1)). Пример аналогичного размещения для ПС(7, 4, 2), задаваемого d разбиением (1, 2) представлено в Таблице 5 на фиг. 9.An example of such an arrangement of PS nodes (7, 3, 1) along the XY and XZ planes in relation to the local numbers (LN) specified by the d partition (3, 2) is presented in Table 4 in FIG. 8 (in the general case d, the partition is defined by the pair (p, p-1)). An example of a similar arrangement for PS (7, 4, 2) defined by d by partition (1, 2) is presented in Table 5 in FIG. 9.
Разбиение d по группам для остальных сетей ПС(N, р, 2) представлено в таблице 6 на фиг. 10, а для сетей ПС(N, p, 3) в таблице 7 на фиг. 11.The partitioning of d into groups for the remaining PS networks (N, p, 2) is presented in Table 6 in FIG. 10, and for PS networks (N, p, 3) in table 7 in FIG. eleven.
Мы получили разреженный гиперкуб, у которого идентичные локальные номера N узлов сетей разных граней совпадают. Напомним, что в разреженном гиперкубе на фиг. 7 использована плоская сеть ПС(7, 3, 1), в общем случае узлы на каждой грани являются узлами плоской сети ПС(N, р, σ) (или расширенной плоской сети ПС(N*, р, σ|σ+1)) с σ|σ+1 разными путями.We got a sparse hypercube in which identical local numbers of N nodes of networks of different faces coincide. Recall that in the rarefied hypercube of FIG. 7, a flat PS network is used (7, 3, 1), in the general case, the nodes on each face are nodes of a flat PS network (N, p, σ) (or an extended flat PS network (N *, p, σ | σ + 1) ) with σ | σ + 1 in different ways.
Каждый коммутатор плоской сети на гранях XY также принадлежит некоторой плоской сети на гранях XZ. Эти коммутаторы обеспечивают пути между абонентами-источниками и абонентами-приемниками на этих гранях. Названные пути состоят из двух дуг - выходная дуга Oxy на грани XY от абонента-источника к коммутатору и либо входная дуга IXY от коммутатора к абоненту-приемнику на той же грани XY, либо входная дуга IXZ к абоненту-приемнику на гранях XZ (12).Each switch of a flat network on XY faces also belongs to a certain flat network on XZ faces. These switches provide paths between source and destination subscribers on these faces. The named paths consist of two arcs - the output arc Oxy on the XY edge from the source subscriber to the switch and either the input arc I XY from the switch to the destination subscriber on the same XY edge, or the input arc I XZ to the destination subscriber on the XZ edges ( 12).
Однако построенный разреженный отказоустойчивый гиперкуб не является полносвязным, т.к. в нем нет путей между частью абонентов, которые находятся в разных вертикальных и горизонтальных плоскостях, например, между абонентами 0 и 11 или 0 и 16 на фиг. 7.However, the constructed sparse fail-safe hypercube is not fully connected, because there are no paths between part of the subscribers who are in different vertical and horizontal planes, for example, between
Для обеспечения полносвязности дополнительно проложим ребра между узлами плоскостей XY и XZ, которые имеют одинаковый локальный номер как это сделано на фиг. 13. Такие ребра мы назовем секущими MYZ, т.к. они пересекают плоскости XY и XZ. Также они образуют полный граф между узлами с одинаковыми локальными номерами, то есть номерами na≡nb (mod N), где na, nb ∈ [0, Np-1],To ensure full connectivity, we additionally lay edges between the nodes of the XY and XZ planes, which have the same local number as is done in FIG. 13. We call such edges secant M YZ , because they intersect the planes XY and XZ. They also form a complete graph between nodes with identical local numbers, that is, the numbers n a ≡n b (mod N), where n a , n b ∈ [0, Np-1],
При этом дуплексные каналы, соответствующие секущим ребрам, прокладываются только между коммутаторами узлов.In this case, duplex channels corresponding to secant edges are laid only between the node switches.
Теперь любой кратчайший путь, который не покрывается плоскими сетями XY и XZ, можно представить как трехэтапный, состоящий из линий групп OXY, MYZ и IXZ. Пусть узел абонента-источника находится на грани XYi,, а узел абонента-приемника - на грани XZj. Первая линия OXY находится на грани XYi и проходит от абонента-источника в коммутатор первого промежуточного узла, находящегося на грани XYi и грани XZk. Второе ребро MYZ проходит от грани XZk к грани XZj - от коммутатора первого промежуточного узла к коммутатору второго промежуточного узла. Третья линия IXZ находится на грани XZj и проходит от коммутатора второго промежуточного узла к абоненту-приемнику.Now, any shortest path that is not covered by flat networks XY and XZ can be represented as a three-stage one consisting of lines of the groups O XY , M YZ, and I XZ . Let the node of the subscriber-source is on the verge XY i ,, and the node of the subscriber-receiver is on the verge XZ j . The first line O XY is located on the XY i edge and passes from the source subscriber to the switch of the first intermediate node located on the XY i edge and the XZ k edge. The second edge M YZ extends from the edge XZ k to the edge XZ j - from the switch of the first intermediate node to the switch of the second intermediate node. The third line I XZ is on the verge XZ j and passes from the switch of the second intermediate node to the subscriber-receiver.
Рассмотрим пример маршрута в разреженном гиперкубе, построенном на базе ПС(7, 3, 1) (табл. 1 и рис. 2). Пусть узлы абонента-источника и абонента-приемника имеют номера 0 и 16(2). Они лежат на разных гранях - XY1 и XZ3 соответственно. Трехдуговой путь, пример которого приведен на фиг. 13 справа, содержит линию от процессора в узле 0 к коммутатору в узле 3 в плоской сети ПС(7, 3, 1) грани XY1, далее линию секущего ребра между коммутаторами в узлах 3 и 10(3) и линию от коммутатора в узле 10(3) к приемнику в узле 16(2) плоской сети ПС(7, 3, 1) грани XZ3. Сокращенно этот маршрут запишем в виде цепочки узлов 0→3→10(3)→16(2) или цепочки линий где значки в скобках указывают номера портов коммутаторов узлов 0, 3 и 10, к которым подсоединены одноименные линии. Для плоских сетей с σ>1 и выше в гиперкубе аналогично будут проложены резервные параллельные пути с использованием резервных путей содержащихся в исходных плоских сетях.Let us consider an example of a route in a rarefied hypercube constructed on the basis of a substation (7, 3, 1) (Table 1 and Fig. 2). Let the nodes of the subscriber-source and subscriber-receiver have
Для поддержания возможности построения таких 3-х этапных маршрутов в коммутатор кроме выше описанных связей, отображенных на фиг. 12, вводятся дополнительные связи с линии Oxy от абонентов на линию MYZ к коммутаторам и с линии MYZ от коммутаторов на линию IXZ к абонентам, что отображено на фиг. 14.In order to maintain the possibility of constructing such 3-stage routes to the switch, in addition to the above-described connections shown in FIG. 12, additional communications are introduced from the Oxy line from subscribers to the M YZ line to the switches and from the M YZ line from the switches to the I XZ line to the subscribers, as shown in FIG. 14.
Таким образом, построена отказоустойчивая сеть в виде 3-мерного полносвязного разреженного гиперкуба. Однако в такой сети могут возникать конфликты при произвольной перестановке пакетов данных между узлами. Для обеспечения неблокируемости в гиперкуб введены дополнительные группы DYZ, CYZ, MYZ, SYZ, I XZ no p-1 линий и соответствующие дополнительные порты и линии коммутации в структуру коммутатора, что отображено на фиг. 15. Линии групп DYZ, CYZ, в гиперкубе проложены между коммутаторами параллельно MYZ, линии групп SYZ проложены между теми же узлами, что и MYZ, но от коммутаторов к абонентам. Линии групп I XZ проложены между теми же узлами, что и линии IXZ, но между коммутаторами узлов. Покажем, что эти дополнения обеспечивают требуемую неблокируемость.Thus, a fault-tolerant network is constructed in the form of a 3-dimensional fully-connected rarefied hypercube. However, in such a network, conflicts can occur during arbitrary rearrangement of data packets between nodes. To ensure non-blocking, additional groups of D YZ , C YZ , M YZ , S YZ , I XZ no p-1 lines and corresponding additional ports and switching lines are introduced into the structure of the switch, as shown in FIG. 15. The lines of the groups D YZ , C YZ , in the hypercube are laid between the switches parallel to M YZ , the lines of the groups S YZ are laid between the same nodes as M YZ , but from the switches to the subscribers. The lines of I XZ groups are laid between the same nodes as the I XZ lines, but between the node switches. We show that these additions provide the required non-blocking.
На фиг. 16 приведен граф маршрутов в полученной сети, демонстрирующий работу коммутаторов узлов при прокладывании неблокируемых 3-х этапных путей с учетом возможных конфликтов методом червоточины. Для прокладки прямого пути из узла s в узел d пилотный пакет должен содержать пять чисел m1, m2, m3, и m* 2, m* 3, где m* 2=m1, а m* 3=⏐m2-m* 2⏐. Числа указывают номера портов коммутаторов и совпадающие с ними номера линий в группах, которые будут использованы коммутаторами при самомаршрутизации, и вычисляются каждым источником заранее. На фиг. 16 можно проследить прокладывание 3-х вариантов путей: 1) в отсутствии конфликтов, 2) в случае конфликта первого рода на линии MYZ(m2), 3) в случае конфликта первого рода на линии MYZ(m2) и второго рода на линии CYZ(m* 3).In FIG. Figure 16 shows the route graph in the resulting network, demonstrating the operation of the node switches when laying non-blocking 3-stage paths taking into account possible conflicts using the wormhole method. To lay a direct route from node s to node d, the pilot packet must contain five numbers m 1 , m 2 , m 3 , and m * 2 , m * 3 , where m * 2 = m 1 and m * 3 = ⏐m 2 -m * 2 ⏐. The numbers indicate the port numbers of the switches and the matching line numbers in the groups that the switches will use in self-routing, and are calculated by each source in advance. In FIG. 16, one can trace the laying of 3 options of paths: 1) in the absence of conflicts, 2) in the event of a conflict of the first kind on the line M YZ (m 2 ), 3) in the case of a conflict of the first kind on the line M YZ (m 2 ) and the second kind on line C YZ (m * 3 ).
В первом случае коммутаторы прокладывают путь, заданный тремя числами m1, m2, m3, который запишем в виде последовательности узлов и линий соответственно s→t→i→d и Во втором случае прокладывается обходной путь с использованием линий DYZ(m* 2) и CYZ(m* 3), а именно, s→t→h→i→d и В третьем случае прокладывается обходной путь с использованием линий DYZ(m* 2), I XZ(m3) и SYZ(m* 3), а именно, s→t→h→e→d и In the first case, the switches pave the path given by three numbers m 1 , m 2 , m 3 , which we write in the form of a sequence of nodes and lines, respectively, s → t → i → d and In the second case, a workaround is made using the lines D YZ (m * 2 ) and C YZ (m * 3 ), namely, s → t → h → i → d and In the third case, a workaround is made using the lines D YZ (m * 2 ), I XZ (m 3 ) and S YZ (m * 3 ), namely, s → t → h → e → d and
Рассмотрим подробнее причины возникновения конфликтов и способы их преодоления.Let us consider in more detail the causes of conflicts and ways to overcome them.
Будем задавать линии OXY, MYZ и IXZ номерами портов m1, m2 и m3 (0≤m1, m2, m3≤р-1), из которых они выходят. Для линий MYZ эти порты нумеруются в порядке возрастания длин линий, задаваемых следующим образом. Пусть линия MYZ проходит из плоскости XZi в плоскость XZj, тогда ее длина L(i, j)=j-i, если (j-i)≥0, и L(i, j)=p+j-i, если (j-i)<0. Порты групп линий DYZ, CYZ и SYZ нумеруются одинаково с MYZ, а линий OXY и IXZ единым образом для всех портов, из которых они выходят. Линии IXZ(m3) нумеруются аналогично линиям IXZ(m3).We will set the lines O XY , M YZ, and I XZ with the port numbers m1, m2, and m3 (0≤m1, m2, m3≤р-1) from which they exit. For M YZ lines, these ports are numbered in ascending order of line lengths, defined as follows. Let the line M YZ pass from the plane XZ i to the plane XZ j , then its length L (i, j) = ji if (ji) ≥0, and L (i, j) = p + ji if (ji) < 0. The ports of the group of lines D YZ , C YZ, and S YZ are numbered the same as M YZ , and the lines O XY and I XZ in the same way for all ports from which they exit. The lines I XZ (m 3 ) are numbered similarly to the lines I XZ (m 3 ).
Ситуация, при которой на одну вторую линию MYZ претендуют несколько путей, считается конфликтом первого типа. Такой конфликт имеет место, если на прохождение через узел t претендует несколько путей (фиг. 17) из разных узлов-источников s и s*. Здесь и далее для краткости мы обозначаем только два таких узла, которых на самом деле может быть любое количество от 2 до р-1. На фиг. 17 конфликтная линия обозначена жирным точечным пунктиром.A situation in which several paths claim one second line M YZ is considered a conflict of the first type. Such a conflict occurs if several paths claim to pass through node t (Fig. 17) from different source nodes s and s * . Hereinafter, for brevity, we denote only two such nodes, which in fact can be any number from 2 to p-1. In FIG. 17, the conflict line is indicated by a bold dotted line.
Разрешение конфликта осуществляется следующим образом: по заведомо разным линиям DYZ, определяемым для каждого пилотного пакета своим параметром m* 2=m1, из узла t прокладываются пути в разные обходные узлы h и h* (фиг. 17) и осуществляется возврат из них в узел i по встречным линиям CYZ. Если на линиях CYZ нет конфликтов, то проложенные пути являются бесконфликтными. Они останутся бесконфликтными и на последних линиях IXZ от коммутатора узла i к приемникам в узлах d и d*. Линии DYZ являются заведомо разными, так как выходят из тех же по номерам портов, что и линии OXY из узлов s и s* в узел t. Разные и возвратные линии CYZ. Пусть конфликтная линия MYZ из узла t в узел i выходит из порта с номером m2, а линия DYZ - из порта с номером m* 2. Тогда в качестве возвратной линии из узла h в узел i выбирается линия CYZ с номером m* 3=⏐m2-m* 2⏐. Такая линия всегда найдется, т.к. линии CYZ образуют полный граф.The conflict resolution is carried out as follows: on deliberately different lines D YZ , determined for each pilot packet by its parameter m * 2 = m 1 , paths to different bypass nodes h and h * are laid from node t (Fig. 17) and return from them to node i along the oncoming lines C YZ . If there are no conflicts on the C YZ lines, the paved paths are conflict-free. They will remain conflict free on the last lines I XZ from the switch of node i to the receivers in nodes d and d * . Lines D YZ are obviously different, because they go from the same port numbers as the lines O XY from nodes s and s * to node t. Different and return lines C YZ . Let the conflicting line M YZ from node t to node i leave the port with the number m 2 , and the line D YZ from the port with the number m * 2 . Then, as the return line from node h to node i, line C YZ with number m * 3 = ⏐m 2 -m * 2 ⏐ is selected. Such a line will always be found, because lines C YZ form a complete graph.
Однако и на линиях CYZ могут возникать конфликты второго типа. Каждый из них происходит в том случае, если на проход через узел i на втором этапе претендует несколько путей из разных узлов t и t* после первого этапа (фиг. 18) и после возникновения конфликта первого типа.However, conflicts of the second type may also arise on the C YZ lines. Each of them occurs if several paths from different nodes t and t * pretend to pass through node i in the second stage after the first stage (Fig. 18) and after a conflict of the first type occurs.
Конфликт второго типа разрешается следующим образом (фиг. 18). Из промежуточного узла h пути прокладывается в обходные узлы е и е* по тем линиям I XZ, которые имеют одинаковые номера m3 с линиями IXZ из узла i соответственно к приемникам узлов d и d*. Все эти линии IXZ различны, т.к. они завершают прямые пути из узла i. Поэтому различны и линии I XZ, а пути прокладываются в разные обходные узлы е и е*, из которых они завершаются бесконфликтно по разным линиям SYZ, но проложенным от коммутаторов к абонентам. Это наглядно отображено и на фиг. 16.The conflict of the second type is resolved as follows (Fig. 18). From the intermediate node h, the paths are laid to bypass nodes e and e * along those lines I XZ that have the same numbers m 3 with lines I XZ from node i to the receivers of nodes d and d *, respectively. All these lines I XZ are different, because they complete the direct paths from node i. Therefore, the lines I XZ are also different, and the paths are laid in different bypass nodes e and e * , from which they end without conflict on different lines S YZ , but laid from the switches to the subscribers. This is clearly shown in FIG. sixteen.
В качестве иллюстрации, объясняющей работу полученной сети, приведем Алгоритм динамической самомаршрутизации, по которому прокладывается прямой путь методом червоточины (wormhole routing).As an illustration explaining the operation of the resulting network, we present the Dynamic Self-Routing Algorithm, which draws a direct path using the wormhole routing method.
1. Если m1=0, то путь прокладывается по локальной линии в узле абонента-источника к коммутатору. Переход к п. 3.1. If m 1 = 0, then the path is laid along the local line in the node of the subscriber-source to the switch. Go to step 3.
Если m1>0, то путь прокладывается от абонента-источника по линии ОХУ(m1). Переход к п. 2.If m 1 > 0, then the path is laid from the subscriber-source on the line О ХУ (m 1 ). Go to step 2.
2. Если m2=0 и m3=0, то путь прокладывается по локальной линии в узле абонента-приемника от коммутатора к абоненту. Конец алгоритма.2. If m 2 = 0 and m 3 = 0, then the path is laid along the local line in the node of the subscriber-receiver from the switch to the subscriber. The end of the algorithm.
3. Если m2=0 и m3≠0, то путь прокладывается по линии IXZ(m3) к абоненту-приемнику. Конец алгоритма.3. If m 2 = 0 and m 3 ≠ 0, then the path is laid along line I XZ (m 3 ) to the subscriber-receiver. The end of the algorithm.
Если m2≠0 и m3=0, то путь прокладывается по линии MYZ(m2) к коммутатору узла абонента-приемника и по локальной линии к абоненту-приемнику. Конец алгоритма.If m 2 ≠ 0 and m 3 = 0, then the path is laid along the line M YZ (m 2 ) to the switch node of the subscriber-receiver and through a local line to the subscriber-receiver. The end of the algorithm.
Если m2>0, то проверяется наличие конфликта на линии MYZ(m2). Если конфликта нет, то путь прокладывается по этой линии MYZ(m2). Переход к п. 4.If m 2 > 0, then the presence of a conflict on the line M YZ (m 2 ) is checked. If there is no conflict, then the path is laid along this line M YZ (m 2 ). Go to step 4.
Если m2>0 и имеет место конфликт, то путь прокладывается по линии DYZ(m* 2). Переход к п. 5.If m 2 > 0 and there is a conflict, then the path is laid along the line D YZ (m * 2 ). Go to step 5.
4. Путь прокладывается по линии IXZ(m3) к абоненту-приемнику. Конец алгоритма.4. The path is laid on line I XZ (m 3 ) to the subscriber-receiver. The end of the algorithm.
5. Проверяется конфликтность пути по линии CYZ(m* 3).5. The path conflict along the line C YZ (m * 3 ) is checked.
Если конфликта нет, то путь прокладывается по линии CYZ(m* 3). Переход к п. 4.If there is no conflict, then the path is laid along the line C YZ (m * 3 ). Go to step 4.
Если же конфликт имеет место, то переход к п. 6.If the conflict takes place, then go to
6. Путь прокладывается по линии I XZ(m3). Переход к п. 7.6. The path is laid along line I XZ (m 3 ). Go to step 7.
7. Путь прокладывается по линии SYZ(m* 3). Конец алгоритма.7. The path is laid along the line S YZ (m * 3 ). The end of the algorithm.
Отметим, что прокладка прямых путей по приведенному алгоритму может содержать до четырех этапов. Однако передача всех пакетов данных по прямым путям осуществляется за один скачок. Последнее свойство позволяет утверждать, что полученная сеть практически (по задержкам передачи) имеет единичный диаметр.Note that the laying of direct paths according to the above algorithm can contain up to four stages. However, the transmission of all data packets on direct paths is carried out in one hop. The latter property allows us to state that the resulting network practically (in terms of transmission delays) has a unit diameter.
Предложена новая сеть в виде трехмерного неблокируемого отказоустойчивого гиперкуба на базе плоских сетей с топологией квазиполного графа. Данный гиперкуб назван разреженным p-ичным гиперкубом, т.к. он содержит меньше узлов, чем неблокируемый 3-мерный p-ичный гиперкуб, используемый в прототипе, но позволяет разменивать число узлов на число разных каналов между ними, что обеспечивает его канальную отказоустойчивость. Передача данных в предложенной сети осуществляется по прямым каналам между абонентами, что обеспечивает его наибольшее быстродействие. Внутриузловой коммутатор в полученной сети имеет в 9/8 больше большее число портов, чем в неблокируемом гиперкубе или мультикольце.A new network is proposed in the form of a three-dimensional non-blocking fault-tolerant hypercube based on flat networks with the topology of a quasi-complete graph. This hypercube is called a sparse p-egg hypercube, because it contains fewer nodes than the non-blocking 3-dimensional p-ary hypercube used in the prototype, but allows exchanging the number of nodes by the number of different channels between them, which ensures its channel fault tolerance. Data transmission in the proposed network is carried out through direct channels between subscribers, which ensures its greatest performance. The intra-node switch in the resulting network has 9/8 more ports than in the non-blocking hypercube or multi-ring.
Построенная сеть может иметь несколько сотен абонентов (процессорных ядер) при двух-трех разных прямых каналов между ними. Наличие нескольких каналов не только обеспечивает отказоустойчивость данной сети, но и открывает возможность дальнейшего повышения ее быстродействия за счет их параллельного использования.The constructed network can have several hundred subscribers (processor cores) with two or three different direct channels between them. The presence of several channels not only ensures the fault tolerance of this network, but also opens up the possibility of further increasing its speed due to their parallel use.
Областью применимости данного разреженного гиперкуба является системная сеть в многоядерном однокристальном процессоре-ускорителе.The field of applicability of this sparse hypercube is a system network in a multi-core single-chip processor accelerator.
На фиг. 18 в табл. 8 приведено число узлов R(р, σ) в построенных 3-мерных разреженных гиперкубах, определяющих топологию сетей, полученных предложенным способом. В ней подчеркнутые значения относятся к гиперкубам, поостренным на 1-расширенных плоских сетях HC(N*, р, σ|σ+1), в которых N*<N. Остальные значения задаются формулой R(p, σ)=N(p, σ)р, т.е. R(p, 1)=р3-р2+р, R(p, 2)=р3/2-р2/2+р и R(p, 3)=р3/3-р2/3+р.In FIG. 18 in the table. Figure 8 shows the number of nodes R (p, σ) in the constructed 3-dimensional sparse hypercubes that determine the topology of the networks obtained by the proposed method. In it, the underlined values refer to hypercubes sharpened on 1-extended flat HC networks (N * , p, σ | σ + 1) in which N * <N. The remaining values are given by the formula R (p, σ) = N (p, σ) p, i.e. R (p, 1) = p 2 p 3 + p, R (p, 2) = p 3/2 P-2/2 + p and R (p, 3) = r 3/3-p 2/3 + p.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2019133094A RU2720553C1 (en) | 2019-10-18 | 2019-10-18 | Method of organizing a system network in the form of a fail-safe non-blocking three-dimensional sparse p-ary hypercube |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2019133094A RU2720553C1 (en) | 2019-10-18 | 2019-10-18 | Method of organizing a system network in the form of a fail-safe non-blocking three-dimensional sparse p-ary hypercube |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2720553C1 true RU2720553C1 (en) | 2020-05-12 |
Family
ID=70735092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2019133094A RU2720553C1 (en) | 2019-10-18 | 2019-10-18 | Method of organizing a system network in the form of a fail-safe non-blocking three-dimensional sparse p-ary hypercube |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2720553C1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2815332C1 (en) * | 2023-02-14 | 2024-03-13 | Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук | Method for constructing switched control networks with quasi-complete digraph topology |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5717943A (en) * | 1990-11-13 | 1998-02-10 | International Business Machines Corporation | Advanced parallel array processor (APAP) |
US5963746A (en) * | 1990-11-13 | 1999-10-05 | International Business Machines Corporation | Fully distributed processing memory element |
RU2420897C2 (en) * | 2005-09-12 | 2011-06-10 | Майкрософт Корпорейшн | Fault-tolerant communication in routed networks |
RU2556458C2 (en) * | 2013-03-21 | 2015-07-10 | Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук | Network having extended generalised hypercube topology |
RU2626350C1 (en) * | 2016-04-11 | 2017-07-26 | Андрей Сергеевич Моляков | Method of functioning computer device operating system of software and hardware complex |
-
2019
- 2019-10-18 RU RU2019133094A patent/RU2720553C1/en active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5717943A (en) * | 1990-11-13 | 1998-02-10 | International Business Machines Corporation | Advanced parallel array processor (APAP) |
US5963746A (en) * | 1990-11-13 | 1999-10-05 | International Business Machines Corporation | Fully distributed processing memory element |
RU2420897C2 (en) * | 2005-09-12 | 2011-06-10 | Майкрософт Корпорейшн | Fault-tolerant communication in routed networks |
RU2556458C2 (en) * | 2013-03-21 | 2015-07-10 | Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук | Network having extended generalised hypercube topology |
RU2626350C1 (en) * | 2016-04-11 | 2017-07-26 | Андрей Сергеевич Моляков | Method of functioning computer device operating system of software and hardware complex |
Non-Patent Citations (1)
Title |
---|
М. Ф. Каравай, В. С. Подлазов, "Метод инвариантного расширения системных сетей многопроцессорных вычислительных систем. Идеальная системная сеть", Автомат. и телемех., 2010. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2815332C1 (en) * | 2023-02-14 | 2024-03-13 | Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук | Method for constructing switched control networks with quasi-complete digraph topology |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9137098B2 (en) | T-Star interconnection network topology | |
US7486619B2 (en) | Multidimensional switch network | |
US20040156322A1 (en) | Network and method of configuring a network | |
Zahavi et al. | Quasi fat trees for HPC clouds and their fault-resilient closed-form routing | |
CN108111410A (en) | Deadlock freedom routing in lossless multidimensional Cartesian Topology Structure with minimum number virtual buffering region | |
RU2720553C1 (en) | Method of organizing a system network in the form of a fail-safe non-blocking three-dimensional sparse p-ary hypercube | |
Youssef | Design and analysis of product networks | |
Yasudo et al. | Designing low‐diameter interconnection networks with multi‐ported host‐switch graphs | |
Karavay et al. | An extended generalized hypercube as a fault-tolerant system area network for multiprocessor systems | |
Coll et al. | Scalable hardware-based multicast trees | |
JP2019047160A (en) | Mpp network, construction method of mpp network, design device and design metho of mpp network | |
Grigoryan | Problems related to broadcasting in graphs | |
Valerio et al. | Fault-tolerant orthogonal fat-trees as interconnection networks | |
Sharma et al. | Terminal and broadcast reliability analysis of direct 2-D symmetric torus network | |
CN1729661A (en) | Return path derivation in packet-switched networks | |
RU2703351C1 (en) | Method of organizing a system network in the form of a non-blocking self-routable three-dimensional p-ary multi-ring | |
RU2753147C1 (en) | Method for organizing optimal fault-tolerant multidimensional tori based on low-port routers and duplex channel splitters | |
Chen et al. | Rearrangeable nonblocking optical interconnection network fabrics with crosstalk constraints | |
Yuan et al. | On folded-clos networks with deterministic single-path routing | |
RU2580100C2 (en) | Generalized two-stage non-blocking clos network | |
Hwang et al. | On noninterruptive rearrangeable networks | |
Das et al. | Two-aggregator network topology optimization with splitting | |
Jiang et al. | Rearrangeable f-cast multi-log 2 N networks | |
RU2556458C2 (en) | Network having extended generalised hypercube topology | |
Liu et al. | A simple incremental network topology for wormhole switch-based networks |