RU2699254C1 - Reconfigurable computer system with a multilevel monitoring and control subsystem - Google Patents
Reconfigurable computer system with a multilevel monitoring and control subsystem Download PDFInfo
- Publication number
- RU2699254C1 RU2699254C1 RU2018138289A RU2018138289A RU2699254C1 RU 2699254 C1 RU2699254 C1 RU 2699254C1 RU 2018138289 A RU2018138289 A RU 2018138289A RU 2018138289 A RU2018138289 A RU 2018138289A RU 2699254 C1 RU2699254 C1 RU 2699254C1
- Authority
- RU
- Russia
- Prior art keywords
- computing
- pci
- express
- monitoring
- control
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Power Sources (AREA)
Abstract
Description
ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY
Изобретение относится к области вычислительной техники, в частности, реконфигурируемым вычислительным системам кластерного типа, предназначенных для решения вычислительно сложных, трудоемких задач и высокоскоростной обработки больших информационных массивов.The invention relates to the field of computer technology, in particular, reconfigurable cluster-type computing systems designed to solve computationally complex, time-consuming tasks and high-speed processing of large information arrays.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
Известен патент US 9037833, G06F 15/80, G06F 9/50, опубл. 19.05.2015 г. (ЕР 1814029, US 20050235092), в котором вычислительная система содержит множество объединенных вычислительных узлов. Каждый вычислительный узел состоит из вычислителя общего назначения, включающего в свой состав процессоры общего назначения для выполнения высокопроизводительных вычислений, оперативные памяти и коммутатор, предназначенный для связи вычислительных узлов вычислительной системы между собой. Процессоры общего назначения попарно соединены между собой посредством интерфейса Hyper Transport. Каждый из процессоров общего назначения в вычислителе общего назначения соединен через мост HYPERTRANSPORT™/PCI с адаптером НСА (Host Channel Adapter), который, в свою очередь, связан с коммутатором. Вычислительные узлы высокопроизводительной системы связаны между собой в единую сеть. Для управления работой вычислительной системы в кластере один узел является управляющим, в его задачи входит мониторинг состояния системы (обнаружение неисправных узлов), планирование задач между узлами кластера, управление правами доступа пользователей. Между управляющим узлом и вычислительными узлами системы может использоваться коммуникационная сеть Ethernet.Known patent US 9037833,
Недостатком данной вычислительной системы является невысокая оперативность работы подсистемы мониторинга и управления состоянием компонент.The disadvantage of this computing system is the low efficiency of the subsystem for monitoring and controlling the state of components.
Причиной, препятствующей достижению технического результата, является высокая загрузка управляющего узла, при большом количестве объектов для мониторинга и управления внутри кластера вычислительной системы. Это обусловлено необходимостью обработки узлом управления большого потока данных мониторинга состояния контролируемых объектов в вычислительных узлах и последовательным алгоритмом работы системы мониторинга.The reason that impedes the achievement of the technical result is the high load of the control unit, with a large number of objects for monitoring and control inside the cluster of the computing system. This is due to the need for the control node to process a large flow of monitoring data on the state of controlled objects in the computing nodes and the consistent algorithm of the monitoring system.
Наиболее близким устройством того же назначения, к заявленному изобретению, по совокупности признаков, принятой за прототип, является реконфигурируемая вычислительная система (RU №156778 U1, МПК G06F 15/16, заявлено 10.04.2015, опубликовано 20.11.2015 Бюл. №32), содержащая сетевой коммутатор Ethernet 1 управления, ведущий сервер 2, сетевой коммутатор Ethernet 5 мониторинга, группу из К ведомых вычислительных узлов 41, …, 4K, каждый из которых содержит компьютер 8, коммутатор PCI-Express 11 и группу из N реконфигурируемых вычислительных устройств 131, …, 13N, каждое из которых содержит коммутатор PCI-Express 19, группу из М вычислительных ПЛИС 201, …, 20M, интерфейсную ПЛИС 22, блок 30 управления режимом коммутатора PCI-Express 19 и память 24 конфигураций ПЛИС, причем ведущий сервер 2 соединен сетевым интерфейсом Ethernet 6 с сетевым коммутатором Ethernet 5 мониторинга и сетевым интерфейсом Ethernet 3 с сетевым коммутатором Ethernet 1 управления, который соединен по соответствующим сетевым интерфейсам Ethernet 71, …, 7K с компьютерами 8 вычислительных узлов 41, …, 4K, в которых коммутатор PCI-Express 11, соединен соответствующими высокоскоростными последовательными интерфейсами PCI-Express 161, …, 16N с коммутаторами PCI-Express 19 в соответствующих реконфигурируемых вычислительных устройствах 131, …, 13N, в которых интерфейсная ПЛИС 22 соединена с памятью 24 конфигураций ПЛИС, а коммутатор PCI-Express 19 соединен с блоком 30 управления режимом коммутатора PCI-Express 19, с интерфейсной ПЛИС 22 по высокоскоростному последовательному интерфейсу PCI-Express 17 и с вычислительными ПЛИС 201, …, 20M по соответствующим высокоскоростным последовательным интерфейсам 211, …, 21M.The closest device of the same purpose to the claimed invention, in terms of features adopted for the prototype, is a reconfigurable computer system (RU No. 156778 U1, IPC G06F 15/16, announced April 10, 2015, published November 20, 2015 Bull. No. 32), comprising a control
Недостатком данной реконфигурируемой вычислительной системы является невысокая отказоустойчивость и высокие энергетические затраты при решении вычислительно сложных и трудоемких задач.The disadvantage of this reconfigurable computing system is its low fault tolerance and high energy costs when solving computationally complex and time-consuming tasks.
Причиной, препятствующей достижению технического результата, являются большое время опроса при мониторинге и управлении компонентами, связанное с последовательным опросом ведущим сервером 2 по сетевому интерфейсу 6 через коммутатор мониторинга Ethernet 5 данных мониторинга от каждого из вычислительных узлов 41, …, 4К.The reason that impedes the achievement of the technical result is the long polling time during monitoring and component management, associated with the sequential polling by the leading
ЗАДАЧА ИЗОБРЕТЕНИЯOBJECT OF THE INVENTION
Задача, на решение которой направлено предлагаемое изобретение, заключается в создании реконфигурируемой вычислительной системы с эффективной системой мониторинга и управления.The problem to which the invention is directed, is to create a reconfigurable computing system with an effective monitoring and control system.
Техническим результатом предлагаемого изобретения является повышение отказоустойчивости и снижение мощности потребления реконфигурируемой вычислительной системы.The technical result of the invention is to increase fault tolerance and reduce the power consumption of a reconfigurable computing system.
КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Указанный технический результат при осуществлении изобретения достигается тем, что в реконфигурируемую вычислительную систему с многоуровневой подсистемой мониторинга и управления содержащую сетевой коммутатор Ethernet 1 управления, ведущий сервер 2, сетевой коммутатор Ethernet 24 мониторинга, группу из К вычислительных узлов 41, …, 4K, каждый из которых содержит вычислитель общего назначения 6, коммутатор PCI-Express 7 и группу из N вычислительных модулей 81, …, 8N, каждый из которых содержит коммутатор PCI-Express 10, группу из М вычислительных ПЛИС 131, …, 13M, системную ПЛИС 18, блок 15 управления режимом коммутатора PCI-Express 10 и память 17 стартовой конфигураций системной ПЛИС 18,The specified technical result in the implementation of the invention is achieved by the fact that in a reconfigurable computer system with a multi-level monitoring and control subsystem containing a network switch Ethernet 1 control, a
причем ведущий сервер 2 соединен сетевым интерфейсом Ethernet 57 с сетевым коммутатором Ethernet 24 мониторинга и сетевым интерфейсом Ethernet 25 с сетевым коммутатором Ethernet 1 управления, который соединен по соответствующим сетевым интерфейсам Ethernet 261, …, 26K с вычислителями общего назначения 6 вычислительных узлов 41, …, 4K,moreover, the
в которых коммутатор PCI-Express 7 соединен соответствующими высокоскоростными последовательными интерфейсами PCI-Express 31, …, 31N с коммутаторами PCI-Express 10 в соответствующих вычислительных модулях 81, …, 8N,in which the PCI-Express 7 switch is connected by the corresponding high-speed serial PCI-Express 31, ..., 31 N interfaces to the PCI-Express 10 switches in the corresponding computing modules 8 1 , ..., 8 N ,
в которых системная ПЛИС 18 соединена с памятью 17 стартовой конфигурации системной ПЛИС 18 шиной 45 конфигурирования системной ПЛИС 18, а коммутатор PCI-Express 10 соединен с блоком 15 управления режимом коммутатора PCI-Express 10 по шине 36 режима коммутатора PCI-Express 10, с системной ПЛИС 18 по высокоскоростному последовательному интерфейсу PCI-Express 48 и с вычислительными ПЛИС 131, …, 13 м по соответствующим высокоскоростным последовательным интерфейсам PCI-Express 331, …, 33M,in which the
дополнительно введены коммутатор PCI-Express 3 и блок 23 контроля и управления питанием вычислительных узлов 41, …, 4K,additionally introduced a PCI-
в каждый из которых дополнительно введены коммутатор PCI-Express 9 вычислительных модулей, блок 21 мониторинга и управления, блок 22 контроля и управления вентиляторами охлаждения, блок 20 контроля и управления питанием вычислительных модулей и группа из N памятей 51, …, 5N состояния вычислительных модулей 81, …, 8N,each of which additionally includes a PCI-Express switch 9 computing modules, a monitoring and
в каждый из которых дополнительно введены группа из М памятей 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M, группа из М совычислителей 141, …, 14M с индивидуальным питанием, группа из М блоков 121, …, 12M управления режимом совычислителей 141, …, 14M, блок 16 мониторинга и управления и блок 19 конфигурирования вычислительных ПЛИС 131, …, 13M и их памятей 111, …, 11M стартовых конфигураций,each of which additionally contains a group of
причем ведущий сервер 2 также соединен высокоскоростным последовательным интерфейсом PCI-Express 27 с коммутатором PCI-Express 3 вычислительных узлов, который соединен с коммутаторами PCI-Express 9 вычислительных модулей вычислительных узлов 41, …, 4K, по соответствующим высокоскоростным последовательным интерфейсам PCI-Express 281, …, 28K, а сетевой коммутатор Ethernet 24 мониторинга соединен сетевым интерфейсом 56 управления питанием вычислительных узлов с блоком 23 контроля и управления питанием и соответствующими сетевыми интерфейсами Ethernet 551, …, 55K мониторинга с блоками 21 мониторинга и управления вычислительных узлов 41, …, 4K,moreover, the
в каждом из которых памяти 51, …, 5N состояния вычислительных модулей 81, …, 8N соединены с вычислителем общего назначения 6 по общей шине взаимодействия 29, который соединен высокоскоростным последовательным интерфейсом PCI-Express 30 с коммутатором PCI-Express 7, коммутатор PCI-Express 9 вычислительных модулей также соединен с коммутаторами PCI-Express 10 в соответствующих вычислительных модулях 81, …, 8N по соответствующим высокоскоростным последовательным интерфейсам PCI-Express 321, …, 32N, а блок 21 мониторинга и управления соединен с блоком 22 контроля и управления вентиляторами охлаждения шиной 54 контроля и управления вентиляторами охлаждения, с блоком 20 контроля и управления питанием шиной 53 контроля и управления питанием и соответствующими шинами 521, …, 52N мониторинга и управления состоянием с блоками 16 мониторинга и управления в соответствующих вычислительных модулях 81, …, 8N,in each of which the memory 5 1 , ..., 5 N states of the computing modules 8 1 , ..., 8 N are connected to a general-purpose calculator 6 via a
в каждом из которых системная ПЛИС 18 также соединена с блоком 19 конфигурирования вычислительных ПЛИС 131, …, 13M и их памятей 111, …, 11M стартовых конфигураций шиной 49 управления записью, с блоком 16 мониторинга и управления шиной 47 локального мониторинга и управления состоянием и с памятью 17 стартовой конфигурации шиной 46 оперативной записи,in each of which the
кроме того вычислительные ПЛИС 131, …, 13M также соединены шинами 381, …, 38M управления режимом с соответствующими блоками 121, …, 12M управления режимом совычислителей 141, …, 14M, индивидуальными шинами 341, …, 34M записи и индивидуальными шинами 351, …, 35M оперативной реконфигурации с соответствующими памятями 111, …, 11M стартовых конфигураций, шинами 371, …, 37M локального управления индивидуальным питанием и шинами 391, …, 39M взаимодействия с соответствующими совычислителями 141, …, 14M in addition, the
кроме того блок 16 мониторинга и управления в вычислительных модулях 81, …, 8N соединен шиной 42 управления режимом с блоком 15 управления режимом коммутатора PCI-Express 10, шинами 411, …, 41M локального управления индивидуальным питанием с соответствующими вычислительными ПЛИС 131, …, 13M, а также соединен шиной 43 первичной записи с памятью 17 стартовой конфигурации системной ПЛИС 18 и шиной 44 управления первичной записью с блоком 19 конфигурирования вычислительных ПЛИС 131, …, 13M и их памятей 111, …, 11M стартовых конфигураций,in addition, the monitoring and
причем блок конфигурирования 19 в вычислительных модулях 81, …, 8N также соединен общей шиной конфигурирования 50 с вычислительными ПЛИС 131, …, 13M и общей шиной 51 записи с памятями 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M, а блоки 121, …, 12M управления режимом совычислителей соединены шинами 401, …, 40M режима с соответствующими совычислителями 141, …, 14M.moreover, the
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
На фиг. 1 приведена функциональная схема реконфигурируемой вычислительной системы с многоуровневой подсистемой мониторинга и управления.In FIG. 1 is a functional diagram of a reconfigurable computing system with a multi-level monitoring and control subsystem.
На фиг. 1 и в тексте приняты следующие сокращения и обозначения:In FIG. 1 and in the text the following abbreviations and designations are adopted:
РВС - реконфигурируемая вычислительная система;RVS - reconfigurable computing system;
ВУ - вычислительный узел;VU - computing node;
ВМ - вычислительный модуль;VM - computing module;
СВ - совычислитель;SV - co-calculator;
ОС - операционная система;OS - operating system;
K - количество вычислительных узлов в реконфигурируемой вычислительной системе;K is the number of computing nodes in a reconfigurable computing system;
N - количество вычислительных модулей в вычислительном узле;N is the number of computing modules in the computing node;
М - количество вычислительных ПЛИС и совычислителей в вычислительном модуле;M - the number of computing FPGAs and calculators in the computing module;
1 - сетевой коммутатор Ethernet управления реконфигурируемой вычислительной системы;1 - network switch Ethernet control reconfigurable computing system;
2 - ведущий сервер;2 - master server;
3 - коммутатор PCI-Express вычислительных узлов;3 - switch PCI-Express computing nodes;
41, …, 4K - группа из K вычислительных узлов;4 1 , ..., 4 K - a group of K computing nodes;
51, …, 5N - группа из N памятей состояния вычислительных модулей;5 1 , ..., 5 N - a group of N memories of the state of computing modules;
6 - вычислитель общего назначения вычислительного узла;6 - general-purpose calculator computing node;
7 - коммутатор PCI-Express вычислительного узла;7 - switch PCI-Express computing node;
81, …, 8N - группа из N вычислительных модулей;8 1 , ..., 8 N - a group of N computing modules;
9 - коммутатор PCI-Express вычислительных модулей вычислительного узла;9 - switch PCI-Express computing modules of the computing node;
10 - коммутатор PCI-Express вычислительного модуля;10 - switch PCI-Express computing module;
111, …, 11M - группа из М памятей стартовых конфигураций вычислительных ПЛИС 131, …, 13M вычислительного модуля;11 1 , ..., 11 M - a group of M memories of starting configurations of
121, …, 12M - группа из М блоков управления режимом совычислителей 141, …, 14M вычислительного модуля;12 1 , ..., 12 M - a group of M counting
131, …, 13M - группа из М вычислительных ПЛИС вычислительного модуля с индивидуальным питанием;13 1 , ..., 13 M - a group of M computing FPGAs of a computing module with individual power supply;
141, …, 14M - группа из М совычислителей вычислительного модуля с индивидуальным питанием;14 1 , ..., 14 M - a group of M calculators of a computing module with individual power supply;
15 - блок управления режимом коммутатора PCI-Express 10 вычислительного модуля;15 - control unit mode switch PCI-Express 10 computing module;
16 - блок мониторинга и управления вычислительного модуля;16 - block monitoring and control of the computing module;
17 - память стартовой конфигурации системной ПЛИС 18 вычислительного модуля;17 - memory starting configuration of the
18 - системная ПЛИС вычислительного модуля;18 - system FPGA computing module;
19 - блок конфигурирования вычислительных ПЛИС 131, …, 13M и их памятей 111, …, 11M стартовых конфигураций вычислительного модуля;19 - configuration
20 - блок контроля и управления питанием вычислительных модулей;20 - block control and power management of computing modules;
21 - блок мониторинга и управления вычислительного узла;21 - block monitoring and control of the computing node;
22 - блок контроля и управления вентиляторами охлаждения вычислительного узла;22 is a control unit for controlling cooling fans of a computing unit;
23 - блок контроля и управления питанием вычислительных узлов;23 - control unit and power management of computing nodes;
24 - сетевой коммутатор Ethernet мониторинга реконфигурируемой вычислительной системы;24 - network switch Ethernet monitoring reconfigurable computing system;
25 - сетевой интерфейс Ethernet между коммутатором управления Ethernet 1 и ведущим сервером 2;25 is an Ethernet network interface between an
261, …, 26K - K сетевых интерфейсов между коммутатором управления Ethernet 1 и вычислительными узлами 41, …, 4K;26 1 , ..., 26 K - K network interfaces between the
27 - высокоскоростной последовательный интерфейс PCI-Express между коммутатором PCI-Express 3 и ведущим сервером 2;27 is a high-speed serial PCI-Express interface between the PCI-
281, …, 28K - K высокоскоростных последовательных интерфейсов PCI-Express между коммутатором PCI-Express 3 и коммутаторами PCI-Express 9;28 1 , ..., 28 K - K high-speed serial PCI-Express interfaces between the PCI-
29 - общая шина взаимодействия вычислителя общего назначения 6 и группой из N памятей состояния вычислительных модулей 81, …, 8N;29 - a common interaction bus of a general-purpose calculator 6 and a group of N state memories of computing modules 8 1 , ..., 8 N ;
30 - высокоскоростной последовательный интерфейс PCI-Express между коммутатором PCI-Express 7 и вычислителем общего назначения 6;30 — high-speed serial PCI-Express interface between a PCI-
311, …, 31N - N высокоскоростных последовательных интерфейсов PCI-Express между коммутатором PCI-Express 7 и коммутаторами PCI-Express 10 вычислительных модулей 81, …, 8N;31 1 , ..., 31 N - N high-speed serial PCI-Express interfaces between the PCI-
321, …, 32N - N высокоскоростных последовательных интерфейсов PCI-Express между коммутатором PCI-Express 9 и коммутаторами PCI-Express 10 вычислительных модулей 81, … 8N;32 1 , ..., 32 N - N high-speed serial PCI-Express interfaces between the PCI-Express 9 switch and the PCI-Express switches 10 computing modules 8 1 , ... 8 N ;
331, …, 33M - М высокоскоростных последовательных интерфейсов PCI-Express вычислительных ПЛИС 131, …, 13M;33 1 , ..., 33 M - M high-speed serial interfaces PCI-
341, …, 34M - М индивидуальных шин записи памятей 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, … 13M;34 1 , ..., 34 M - M individual
351, …, 35M - М индивидуальных шин оперативной реконфигурации вычислительных ПЛИС 131, …, 13M;35 1 , ..., 35 M - M individual buses for operational reconfiguration of
36 - шина режима коммутатора PCI-Express 10;36 - bus mode switch PCI-
371, …, 37M - М шин локального управления индивидуальным питанием совычислителей 141, …, 14M;37 1 , ..., 37 M - M buses of local control for individual power supply of
381, …, 38M - М шин управления режимом совычислителей 141, …, 14M;38 1 , ..., 38 M - M bus
391, …, 39M - М шин взаимодействия между вычислительными ПЛИС 131, …, 13M и соответствующими совычислителей 141, …, 14M;39 1 , ..., 39 M - M buses of interaction between
401, …, 40M - М шин режима совычислителей 141, …, 14M;40 1 , ..., 40 M - M bus mode counters 14 1 , ..., 14 M ;
411, …, 41M - М шин локального управления индивидуальным питанием вычислительных ПЛИС 131, …, 13M;41 1 , ..., 41 M - M buses of local control of individual power supply of
42 - шина управления режимом коммутатора PCI-Express 10;42 - PCI-
43 - шина первичной записи памяти 17 стартовой конфигурации системной ПЛИС 18 блоком 16 мониторинга и управления вычислительного модуля;43 - bus
44 - шина управления первичной записью памятей 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M блоком 16 мониторинга и управления вычислительного модуля;44 - control bus for primary recording of
45 - шина конфигурирования системной ПЛИС 18 из памяти 17 стартовой конфигурации;45 - bus
46 - шина оперативной записи памяти 17 стартовой конфигурации системной ПЛИС 18;46 -
47 - шина локального мониторинга и управления состоянием вычислительного модуля системной ПЛИС 18;47 - bus local monitoring and control of the state of the computing module of the
48 - высокоскоростной последовательный интерфейс PCI-Express системной ПЛИС 18;48 - high-speed serial interface PCI-
49 - шина управления записью памятей 111, …, 11M стартовых конфигураций и конфигурированием вычислительных 131, …, 13M системной ПЛИС 18;49 - a bus for managing the storage of
50 - общая шина конфигурирования вычислительных ПЛИС 131, …, 13M;50 - a common bus for configuring
51 - общая шина записи памятей стартовых конфигураций 111, …, 11M вычислительных ПЛИС 131, …, 13M;51 - a common bus for recording memories of starting
521, …, 52N - N шин мониторинга и управления состоянием вычислительных модулей 81, …, 8N;52 1 , ..., 52 N - N buses for monitoring and controlling the state of computing modules 8 1 , ..., 8 N ;
53 - шина контроля и управления питанием вычислительных модулей 81, …, 8N;53 - bus control and power management of computing modules 8 1 , ..., 8 N ;
54 - шина контроля и управления вентиляторами охлаждения вычислительных узлов 41, …, 4K;54 - bus for monitoring and controlling cooling fans of computing nodes 4 1 , ..., 4 K ;
551, …, 55K - K сетевых интерфейсов мониторинга Ethernet вычислительных узлов 41, …, 4K;55 1 , ..., 55 K - K network interfaces for monitoring Ethernet computing nodes 4 1 , ..., 4 K ;
56 - сетевой интерфейс Ethernet управления питанием вычислительных узлов 41, …, 4K; 57 - сетевой интерфейс Ethernet между коммутатором мониторинга Ethernet 24 и ведущим сервером 2.56 - network interface Ethernet power management computing nodes 4 1 , ..., 4 K ; 57 is an Ethernet network interface between an
ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
Ведущий сервер 2 реконфигурируемой вычислительной системы предназначен для организации загрузки операционных систем в вычислители общего назначения 6 ВУ 41, …, 4K, организации управления потоками задач для ВУ 41, …, 4K через сетевой коммутатор Ethernet 1 управления РВС, организации мониторинга состояния компонент и управления режимами реконфигурируемой вычислительной системы через сетевой коммутатор Ethernet 24 мониторинга РВС, а также для организации взаимодействия вычислительных узлов 41. …, 4K между собой через коммутатор PCI-Express 3 по высокоскоростным последовательным интерфейсам PCI-Express 281, …, 28K и вычислительных модулей 81, …, 8N между собой через коммутатор PCI-Express 9 по высокоскоростным последовательным интерфейсам PCI-Express 321, …, 32N при построении различных вычислительных структур РВС. Кроме того ведущий сервер 2 с использованием ресурсов коммутаторов PCI-Express 3 и 9, а также коммутаторов PCI-Express 10 и 7 обеспечивает прямой доступ к памятям 51, …, 5N состояния вычислительных модулей. Также за счет взаимодействия с блоком 23 контроля и управления питанием ВУ через сетевой коммутатор Ethernet 24 мониторинга РВС ведущий сервер 2 осуществляет управление подачей первичного питания на соответствующие ВУ 41, …, 4K, и через сетевой коммутатор Ethernet 1 управления РВС осуществляет управление включением вычислителей общего назначения 6.The leading
Вычислительные узлы 41, …, 4K предназначены для высокоскоростной обработки данных в процессе решения трудоемких вычислительных задач.Computing nodes 4 1 , ..., 4 K are designed for high-speed data processing in the process of solving labor-intensive computing problems.
Каждый вычислитель общего назначения 6 ВУ 41, …, 4K содержит процессор общего назначения, оперативную память, шину ввода-вывода PCI-Express, сетевые интерфейсы и предназначен для подготовки данных и обработки результатов вычислений от ВМ 81, …, 8N, а также для анализа и передачи на ведущий сервер 2 РВС данных о состоянии компонент из памятей 51, …, 5N состояния ВМ 81, …, 8N с использованием сетевого коммутатора Ethernet 1 по сетевым интерфейсам 261, …, 26K. Обмен данными между вычислителем общего назначения 6 и ВМ 81, …, 8N осуществляется при помощи коммутатора PCI-Express 7 по высокоскоростному последовательному интерфейсу PCI-Express 30.Each general-purpose calculator 6 VU 4 1 , ..., 4 K contains a general-purpose processor, RAM, PCI-Express I / O bus, network interfaces and is designed to prepare data and process the results of calculations from VM 8 1 , ..., 8 N , as well as for analysis and transmission of the state of the component from memories 5 1 , ..., 5 N of the state of the VM 8 1 , ..., 8 N using the
Вычислительные ПЛИС 131, …, 13M с индивидуальным питанием, взаимодействуют с вычислителем общего назначения 6 через коммутаторы PCI-Express 7 и 10, и по шинам 391, …, 39M с соответствующими СВ 141, …, 14M, предназначены для осуществления обмена данными и результатами и выполнения предварительной обработки данных с последующей дообработкой результатов, получаемых от СВ 141, …, 14M при решении вычислительно сложных задач различного типа. Вычислительные ПЛИС 131, …, 13M осуществляют запись соответствующих памятей 111, …, 11M стартовых конфигураций по индивидуальным шинам 341, …, 34M записи, и таким образом выполняют оперативное самореконфигурирование необходимыми рабочими конфигурациями по соответствующим индивидуальным шинам 351, …, 35M оперативной реконфигурации, используя только собственные ресурсы без использования ресурсов системной ПЛИС 18. Кроме того вычислительные ПЛИС 131, …, 13M управляют индивидуальным питанием и режимами работы соответствующих СВ 141, …, 14M при помощи соответствующих шин 371, …, 37M локального управления индивидуальным питанием СВ и шин 381, …, 38M управления режимом. Стартовые конфигурации вычислительных ПЛИС 131, …, 13M предназначены для обеспечения взаимодействия по высокоскоростному последовательному интерфейсу PCI-Express и осуществления перезаписи соответствующих памятей 111, …, 11M стартовых конфигураций требуемыми рабочими конфигурациями.
Совычислители 141, …, 14M с индивидуальным питанием предназначены для выполнения основного объема обработки данных в процессе решения вычислительно сложных задач. В качестве СВ 141, …, 14M могут использоваться ПЛИС с большим количеством конфигурируемых логических блоков, заказные СБИС с аппаратной или программной логикой, а также системы на кристалле, которые могут совмещать в своем составе универсальные программируемые вентильные матрицы и процессорные ядра. Совычислители 141, …, 14M, определяют производительность РВС, обладают наиболее высокой удельной вычислительной мощностью, работают на предельно высоких частотах и, как следствие, характеризуются высокими энергопотреблением и тепловыделением.Co-calculators 14 1 , ..., 14 M with individual power supply are designed to perform the bulk of data processing in the process of solving computationally complex problems. As
Блок 16 мониторинга и управления ВМ предназначен для сбора данных о состоянии вычислительных ПЛИС 131, …, 13M, совычислителей 141, …, 14M и системной ПЛИС 18, программирования порогов срабатывания температурной защиты, управления индивидуальными питаниями вычислительных ПЛИС 131, …, 13M по шинам 411, …, 41M локального управления индивидуальным питанием вычислительных ПЛИС 131, …, 13M ВМ, управления режимом работы коммутатора PCI-Express 10 путем взаимодействия с блоком 15 управления режимом коммутатора PCI-Express 10 по шине 42 управления режимом коммутатора PCI-Express 10. Также блок 16 мониторинга и управления ВМ осуществляет первичную запись памятей 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M по шине 44 управления первичной записью через блок 19 и памяти 17 стартовой конфигурации системной ПЛИС 18 по шине 43 первичной записи памяти 17. Кроме того блок 16 мониторинга и управления ВМ по соответствующим шинам 521, …, 52N осуществляет взаимодействие с блоком 21 мониторинга и управления ВУ, что обеспечивает доступ к мониторингу и управлению вычислительными модулями 81, …, 8N от сервера управления 2. Первичная запись памятей 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M и памяти 17 стартовой конфигурации системной ПЛИС 18 осуществляется на этапе изготовления и наладки вычислительных модулей.The VM monitoring and
Системная ПЛИС 18 вычислительных модулей предназначена для анализа информации о состоянии вычислительных ПЛИС 131, …, 13M и совычислителей 141, …, 14M, полученной от блока 16 мониторинга и управления ВМ по шине 47 локального мониторинга и управления состоянием ВМ, формирования текущих кадров состояния компонент ВМ и передачи этих кадров по высокоскоростному интерфейсу PCI-Express 48 через коммутаторы PCI-Express 10 и 7 в соответствующую память 51, …, 5N состояния ВМ 81, …, 8N. При помощи блока 19 конфигурирования вычислительных ПЛИС 131, …, 13M и их памятей 111, …, 11M стартовых конфигураций и шины 49 управления записью системная ПЛИС 18 осуществляет конфигурирование как вычислительных ПЛИС 131, …, 13M, так и запись памятей стартовых конфигураций 111, …, 11M. Кроме того системная ПЛИС 18 по шине 46 оперативной записи из памяти 17 стартовой конфигурации осуществляет запись системной ПЛИС 18, а за счет взаимодействия по шине 47 с блоком 16 мониторинга и управления ВМ осуществляет установку порогов срабатывания температурной защиты компонент ВМ. Стартовая конфигурация системной ПЛИС 18 предназначена для обеспечения всех вышеперечисленных функций, но может изменяться в процессе эксплуатации, что отражается в ее памяти 17 стартовой конфигурации путем перезаписи.
Блок 21 мониторинга и управления ВУ предназначен для мониторинга и управления вычислительными модулями 81, …, 8N, питанием ВУ и вентиляторами охлаждения ВУ, за счет взаимодействия с блоками 16 мониторинга и управления ВМ, блоком 20 контроля и управления питанием ВУ и блоком 22 контроля и управления вентиляторами охлаждения ВУ по соответствующим шинам 521, …, 52N мониторинга и управления состояния ВМ 81, …, 8N, шине 53 контроля и управления питанием ВМ 81, …, 8N и шине 54 контроля и управления вентиляторами охлаждения ВУ41, …, 4к и передачи данных через сетевой коммутатор Ethernet 24 мониторинга РВС на ведущий сервер 2 РВС. При этом за счет взаимодействия с блоком 20 контроля и управления питанием ВУ и блоком 22 контроля и управления вентиляторами охлаждения ВУ блок 21 мониторинга и управления ВУ осуществляет управление подачей питания на ВМ 81, …, 8N и управление скоростью вращения вентиляторов охлаждения ВУ, а за счет взаимодействия с блоками 16 мониторинга и управления ВМ блок 21 мониторинга и управления ВУ осуществляет установку порогов срабатывания температурной защиты компонент ВМ 81, …, 8N, и, при необходимости, может осуществлять первичную запись памятей 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M и памяти 17 стартовой конфигурации системной ПЛИС 18 ВМ 81, …, 8N.The WU monitoring and
Предлагаемая реконфигурируемая вычислительная система работает следующим образом.The proposed reconfigurable computer system operates as follows.
При включении питания первыми включаются сетевой коммутатор Ethernet 1 управления РВС, сетевой коммутатор Ethernet 24 мониторинга РВС и ведущий сервер 2. После загрузки ведущего сервера 2 осуществляется включение питания на вычислительные узлы 41, …, 4K уже по программе от ведущего сервера 2 через блок 23 контроля и управления питанием ВУ. Далее ведущий сервер 2 РВС через блок 21 мониторинга и управления ВУ осуществляет поочередное включение питания вычислительных модулей 81, …, 8N.When the power is turned on, the PBC control
После загрузки системной ПЛИС 18 из памяти 17 стартовой конфигурации системной ПЛИС 18, осуществляется включение индивидуальных питаний вычислительных ПЛИС 131, …, 13M. Вычислительные ПЛИС 131, …, 13M конфигурируются стартовыми конфигурациями из соответствующих памятей 111, …, 11M стартовых конфигураций. Стартовые конфигурации вычислительных ПЛИС 131, …, 13M используются для загрузки рабочих конфигураций в памяти 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M. Одновременно блок 21 через блок 16 мониторинга и управления ВУ выполняет настройку порогов срабатывания температурной защиты системной ПЛИС 18, вычислительных ПЛИС 131, …, 13M и СВ 141, …, 14M.After loading the
Далее ведущий сервер 2 осуществляет включение питаний на вычислителях общего назначения 6 ВУ и загрузку операционных систем.Next, the
После загрузки ОС в вычислители общего назначения 6 ВУ, которые могут выполняться по сети Ethernet или с автономных дисков, осуществляется распределение адресного пространства между вычислительными ПЛИС 131, …, 13M. Одновременно блок 21 мониторинга ВУ осуществляет проверку напряжений питания системной ПЛИС 18, вычислительных ПЛИС 131, …, 13M и СВ 141, …, 14M через блок 16 мониторинга и управления ВМ.After loading the OS in general-purpose computers 6 WUs, which can be performed via Ethernet or from autonomous disks, the address space is distributed between
Вычислители общего назначения 6 ВУ распределяют задачи пользователей между вычислительными ПЛИС 131, …, 13M и конфигурируют их рабочими программами с использованием ресурсов только самих вычислительных ПЛИС 131, …, 13M. После этого вычислительные ПЛИС 131, …, 13M подготовлены для решения задач пользователей. При этом вычислительные ПЛИС 131, …, 13M осуществляют управление индивидуальными питаниями соответствующих СВ 141, …, 14M и динамическое управление их рабочими режимами. В зависимости от используемых СВ 141, …, 14M и характера задач, обрабатываемых на них и вычислительных ПЛИС 131, …, 13M, управление рабочими режимами СВ 141, …, 14M включает конфигурирование СВ, управление их рабочими частотами и установку требуемых режимов работы. Вычислительные ПЛИС 131, …, 13M также осуществляют запись новых рабочих конфигураций в памяти 111, …, 11M стартовых конфигураций вычислительных ПЛИС 131, …, 13M, тем самым организуя оперативную самореконфигурацию с использованием только собственных ресурсов.General purpose computers 6 WUs distribute user tasks between
Наличие у вычислительных ПЛИС 131, …, 13M возможности оперативного самореконфигурирования с использованием собственных памятей 111, …, 11M стартовых конфигураций и индивидуальных шин их записи 341, …, 34M и оперативной реконфигурации 351, …, 35M, а также наличие у вычислительных ПЛИС 131, …, 13M и СВ 141, …, 14M индивидуального питания и возможности индивидуального управления питанием, позволяет проводить распределение вычислительных ресурсов для решения текущих задач пользователей с точностью до одного вычислительного ПЛИС 131, …, 13M с соответствующим СВ 141, …, 14M, что позволяет оптимизировать распределение задач по вычислительным модулям и узлам для повышения средней скорости обмена по каналам PCI Express и выравнивания энергопотребления и нагревания компонент ВМ. В связи с этим, если в потоке задач пользователей все задачи имеют одинаковый приоритет к исполнению, то в первую очередь из потока задач могут выбираться к исполнению те задачи, которые в комбинации приводят к уменьшению суммарного потребления и увеличению средней скорости обмена по каналам PCI Express, то есть наилучшим образом сочетающимися между собой при реализации.
В предлагаемой РВС организована многоуровневая подсистема мониторинга и управления РВС, которая осуществляет мониторинг и управление по четырем параллельно работающими уровнями.In the proposed RVS, a multilevel subsystem of monitoring and control of the RVS is organized, which monitors and controls four parallel operating levels.
Первый уровень подсистемы мониторинга и управления РВС отвечает за локальное управление индивидуальными питаниями СВ 141, …, 14M вычислительными ПЛИС 131, …, 13M, которое предполагает отключение вычислительными ПЛИС 131, …, 13M индивидуальных питаний от соответствующих СВ 141, …, 14M в периоды их простоя, то есть когда ресурсы СВ 141, …, 14M оказываются временно невостребованными. Такие ситуации могут возникать в случаях, когда ресурсы СВ 141, …, 14M не задействуются при обработке вычислительных алгоритмов. Результатом данного управления индивидуальными питаниями СВ 141, …, 14M является сокращение их потребляемой мощности при решении вычислительно сложных задач.The first level of the subsystem of monitoring and control of the RVS is responsible for the local management of individual power supplies of
Второй уровень подсистемы мониторинга и управления РВС отвечает за локальный мониторинг и управление состоянием отдельных ВМ 81, …, 8N. На данном уровне системная ПЛИС 18 осуществляет сбор данных о текущем состоянии компонент ВМ задействованных в процессе выполнения вычислений, а именно вычислительных ПЛИС 131, …, 13M и соответствующих СВ 141, …, 14M. По полученным данным системная ПЛИС 18 осуществляет управление индивидуальными питаниями вычислительных ПЛИС 131, …, 13M , а также путем взаимодействия с вычислительными ПЛИС 131, …, 13M через блок 16 мониторинга и управления ВМ управление индивидуальными питаниями и динамическую настройку рабочих режимов СВ 141, …, 14M, к которым в первую очередь относится управление рабочей частотой в зависимости от их текущей температуры. Для управления индивидуальными питаниями СВ 141, …, 14M и динамической настройки их рабочих режимов в зависимости от их текущих температурных режимов и режимов питания в основном используются ресурсы системной ПЛИС 18, а вычислительные ПЛИС 131, …, 13M используются для ретрансляции управляющих сигналов, формируемых системной ПЛИС 18. За счет этого обеспечивается высокая оперативность управления состоянием компонент ВМ на этапе решения задач.The second level of the subsystem of monitoring and control of the RVS is responsible for local monitoring and state management of individual VMs 8 1 , ..., 8 N. At this level,
Из собранных данных мониторинга системная ПЛИС 18 формирует кадры состояния вычислительных модулей 81, …, 8M. Кадры состояния ВМ представляют собой пакеты данных небольшого объема, содержащие лишь минимальные сведения о состоянии компонент реконфигурируемой вычислительной системы, на основании которых проводится оценка вероятности отказов в работе компонент ВМ 81, …, 8N. При помощи коммутаторов PCI-Express 7 и 10 кадры состояния ВМ транслируются в соответствующую память 5 состояния ВМ 81, …, 8N, из которой посредством вычислителя общего назначения 6 ВУ и сетевого коммутатора Ethernet 1 управления РВС поступают на ведущий сервер 2 РВС. Так как оперативные данные мониторинга являются достаточно малообъемными, то их поток практически не нагружает коммуникационную среду, используемую для нужд обработки вычислительных задач. В случае, когда вычислители общего назначения 6, заняты интенсивной передачей данных и результатов задач пользователей, для передачи кадров состояния из памятей 51, …, 5N могут использоваться ресурсы ведущего сервера 2 и коммутаторы PCI-Express 7, 10, 9 и 3.From the collected monitoring data, the
Третий уровень подсистемы мониторинга и управления состоянием РВС отвечает за мониторинг и управление состоянием ВУ 41, …, 4K. На этом уровне основные функции мониторинга и управления возлагаются на блоки 21 мониторинга компонент ВУ. Данные блоки осуществляют сбор и обработку расширенных данных о состоянии ВУ 41, …, 4K, а именно вычислительных ПЛИС 131, …, 13M, СВ 141, …, 14M, системных ПЛИС 18, коммутаторов PCI-Express 9, систем питания и охлаждения ВУ 41, …, 4K. Расширенные данные мониторинга представляют детальную информацию о состоянии компонент ВМ 81, …, 8N. По полученным данным о состоянии компонент ВМ 81, …, 8N, блок 21 мониторинга ВУ осуществляет регулирование скорости вращения вентиляторов охлаждения ВУ 41, …, 4K с помощью блока 22 контроля, что приводит к сокращению потребляемой мощности ВУ 41, …, 4K, а также управление питанием ВУ 41, …, 4K с помощью блока 23 контроля и управления питанием ВУ. Подача питания на соответствующие ВМ 81, …, 8N осуществляется поочередно, за счет чего уменьшаются выбросы в цепях питания ВМ 81, …, 8N в момент их включения. Таким образом, за счет эффективной работы системы охлаждения, снижается ее энергопотребление, и, за счет наличия возможности поочередного включения и экстренного отключения питаний ВМ 81, …, 8N, уменьшается вероятность выхода из строя их компонент. Обработанная информация о состоянии ВУ 41, …, 4K с блоков 21 мониторинга ВУ через сетевой коммутатор Ethernet 26 мониторинга состояния РВС передается на ведущий сервер 2 РВС.The third level of the subsystem of monitoring and state control of the RVS is responsible for monitoring and state management of the VU 4 1 , ..., 4 K. At this level, the main monitoring and control functions are assigned to the
Четвертый уровень подсистемы мониторинга и управления состоянием РВС отвечает за мониторинг и управление состоянием всей РВС. На данном уровне ведущий сервер 2 осуществляет централизованный сбор информации о состоянии всех компонент РВС и по этим данным осуществляется оптимальное перераспределение задач между ВУ, в зависимости от их текущего энергопотребления и температурного режима. Анализируя информацию мониторинга, полученную с помощью средств мониторинга второго уровня, ведущий сервер 2 РВС может регулировать период запросов расширенных данных мониторинга с блоков 21 мониторинга ВУ для оперативного отслеживания текущего состояния ВУ, имеющих наиболее высокие показатели энергопотребления и температуры их компонент. Таким образом, обеспечивается высокая оперативность работы подсистемы мониторинга и управления состоянием РВС, что приводит к уменьшению вероятности перегрева компонент ВУ 41, …, 4K и их аварийного отключения их питания, а также увеличивает отказоустойчивость РВС в целом. Кроме того, ведущий сервер 2 осуществляет поочередное включение питаний ВУ 41, …, 4K путем взаимодействия с блоком 23 контроля и управления питанием, за счет чего уменьшаются выбросы в цепях питания ВУ 41, …, 4K в момент их включения.The fourth level of the subsystem for monitoring and managing the status of the RVS is responsible for monitoring and managing the state of the entire RVS. At this level, the leading
Подсистемы мониторинга и управления предлагаемой реконфигурируемой вычислительной системы предназначены для обслуживания только системных и вычислительных ПЛИС и СВ, так как остальные компоненты РВС имеют штатные средства мониторинга, обеспечивающие достаточный уровень отказоустойчивости.The monitoring and control subsystems of the proposed reconfigurable computing system are intended for servicing only system and computing FPGAs and CBs, since the other components of the RCS have regular monitoring tools that provide a sufficient level of fault tolerance.
ПРИМЕР ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯMODE FOR CARRYING OUT THE INVENTION
Предлагаемая реконфигурируемая вычислительная система может быть реализована на следующих элементах:The proposed reconfigurable computing system can be implemented on the following elements:
В качестве ведущего сервера 2 РВС может быть использован сервер фирмы Kraftway на базе платформы Kraftway Express 200: процессор Intel(R) Xeon(R) E2620V4 2.10 GHz 8 cores; оперативная память 64 Gb; жесткий диск 1 Tb.A Kraftway server based on the Kraftway Express 200 platform can be used as the
Вычислители общего назначения 6 ВУ: процессор Intel(R) Xeon(R) E2620V4 2.10 GHz 8 cores; оперативная память 64 Gb; жесткий диск 1 Tb; восемь вычислительных модулей 8, содержащих по четыре вычислительных ПЛИС 131, …, 13M и четыре заказных СБИС в качестве СВ 141, …, 14M.General purpose computers 6 WUs: Intel (R) Xeon (R) processor E2620V4 2.10 GHz 8 cores; RAM 64 Gb;
Вычислительные модули 8: системная ПЛИС 18 и вычислительные ПЛИС 131, …, 13M - на микросхемах фирмы Xilinx типа XC7A100T-FGG484; коммутатор PCI-Express 9 - на микросхеме коммутатора РЕХ8732 фирмы PLX Technology; блок 16 контроля состояния компонент ВМ - на микросхемах МАХ6656 фирмы Maxim Integrated, TMP461AIRUNT фирмы Texas Instruments; блоки 12 управления режимом СВ 141, …, 14M - с использованием микросхем SI570; блок 21 конфигурирования вычислительных ПЛИС и их памятей стартовых конфигураций - на микросхеме CPLD ХС2С64А фирмы Xilinx; памяти стартовых конфигураций 11, 17 вычислительных и системной ПЛИС - на микросхемах SPI-памяти М25Р64 фирмы Micron Technology.Computing modules 8:
Блок 21 мониторинга и управления ВУ - на микросхеме фирмы Xilinx типа XC7Z007S-1CLG400C.
В предлагаемой реконфигурируемой вычислительной системе, в сравнении с прототипом, применение многоуровневой подсистемы мониторинга и управления состоянием РВС значительно уменьшает время опроса состояния компонентов и передачи данных на ведущий сервер 2. В прототипе время опроса и передачи данных составляет Тпрототипа = M*N*T1O+M*N*T1D, где T1O и T1D - времена опроса состояния (например, температуры и напряжения) и передачи данных для одного вычислительного ПЛИС, М -количество вычислительных ПЛИС в модуле, N -количество вычислительных модулей в вычислительном узле, при условии, что компьютеры 8 параллельно и независимо доставляют свои данные на ведущий сервер 2. В предлагаемой реконфигурируемой вычислительной системе данное время составляет Т=2*М*T1O+2*N*M*T1D, где коэффициент "двойка" связан с введением в вычислительные модули 8 совычислителей 14. Данное время в предлагаемом изобретении значительно меньше, чем у прототипа, за счет независимого и параллельного формирования системными ПЛИС 18 кадров состояния вычислительных модулей 81, …, 8N в памятях 51, …, 5N состояния в вычислительных узлах 41, …, 4K через коммутаторы PCI-Express 7, 10, и независимой параллельной передачи данных кадров состояния вычислителями общего назначения 6 и формирования расширенных данных мониторинга блоками 21 мониторинга и управления ВУ соответственно через коммутаторы Ethernet 1 и 24 и соответствующие связи на ведущий сервер 2. В связи с этим также уменьшается и интервал обслуживания каждого конкретного компонента, что повышает отказоустойчивость реконфигурируемой вычислительной системы в целом.In the proposed reconfigurable computer system, in comparison with the prototype, the use of a multi-level subsystem for monitoring and controlling the state of the PBC significantly reduces the time of polling the state of the components and transmitting data to the leading
Кроме того, в сравнении с прототипом, предлагаемая реконфигурируемая вычислительная система с многоуровневой подсистемой мониторинга и управления обладает меньшим энергопотреблением за счет эффективного управления вращением вентиляторов охлаждения вычислительных узлов 41, …, 4K в зависимости от текущих температур компонент вычислительных модулей 81, …, 8N и оперативного отключения индивидуальных питаний от неиспользуемых вычислительных ПЛИС 131, …, 13M и совычислителей 141, …, 14M.In addition, in comparison with the prototype, the proposed reconfigurable computing system with a multi-level monitoring and control subsystem has lower power consumption due to the efficient control of the rotation of the cooling fans of the computing nodes 4 1 , ..., 4 K , depending on the current temperatures, the components of the computing modules 8 1 , ..., 8 N and operational disconnection of individual power from
Вышеизложенные сведения позволяют сделать вывод, что предлагаемая реконфигурируемая вычислительная система с многоуровневой подсистемой мониторинга и управления решает поставленную задачу и соответствует заявляемому техническому результату - повышение отказоустойчивости реконфигурируемой вычислительной системы и снижение мощности потребления.The above information allows us to conclude that the proposed reconfigurable computer system with a multi-level monitoring and control subsystem solves the problem and meets the claimed technical result - increasing the fault tolerance of the reconfigurable computer system and reducing the power consumption.
Claims (13)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018138289A RU2699254C1 (en) | 2018-10-30 | 2018-10-30 | Reconfigurable computer system with a multilevel monitoring and control subsystem |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018138289A RU2699254C1 (en) | 2018-10-30 | 2018-10-30 | Reconfigurable computer system with a multilevel monitoring and control subsystem |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2699254C1 true RU2699254C1 (en) | 2019-09-04 |
Family
ID=67851507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018138289A RU2699254C1 (en) | 2018-10-30 | 2018-10-30 | Reconfigurable computer system with a multilevel monitoring and control subsystem |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2699254C1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2748454C1 (en) * | 2020-10-02 | 2021-05-25 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Reconfigurable computing system with multi-level monitoring subsystem and automatic control |
RU2780169C1 (en) * | 2021-11-29 | 2022-09-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Computing module for multitasking computing systems |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050044284A1 (en) * | 2003-08-18 | 2005-02-24 | Pescatore John C. | Multi-host virtual bridge input-output switch |
US20060195848A1 (en) * | 2005-02-25 | 2006-08-31 | International Business Machines Corporation | System and method of virtual resource modification on a physical adapter that supports virtual resources |
US20130103929A1 (en) * | 2004-04-15 | 2013-04-25 | Raytheon Company | Coupling processors to each other for high performance computing (hpc) |
RU156778U1 (en) * | 2015-04-10 | 2015-11-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | RECONFIGURABLE COMPUTER SYSTEM |
-
2018
- 2018-10-30 RU RU2018138289A patent/RU2699254C1/en active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050044284A1 (en) * | 2003-08-18 | 2005-02-24 | Pescatore John C. | Multi-host virtual bridge input-output switch |
US20130103929A1 (en) * | 2004-04-15 | 2013-04-25 | Raytheon Company | Coupling processors to each other for high performance computing (hpc) |
US20060195848A1 (en) * | 2005-02-25 | 2006-08-31 | International Business Machines Corporation | System and method of virtual resource modification on a physical adapter that supports virtual resources |
RU156778U1 (en) * | 2015-04-10 | 2015-11-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | RECONFIGURABLE COMPUTER SYSTEM |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2748454C1 (en) * | 2020-10-02 | 2021-05-25 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Reconfigurable computing system with multi-level monitoring subsystem and automatic control |
RU2780169C1 (en) * | 2021-11-29 | 2022-09-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Computing module for multitasking computing systems |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9606588B2 (en) | Closed-loop cooling system for high-density clustered computer system | |
US10268262B2 (en) | Dynamic peak power limiting to processing nodes in an information handling system | |
US7761622B2 (en) | Centralized server rack management using USB | |
RU156778U1 (en) | RECONFIGURABLE COMPUTER SYSTEM | |
RU168565U1 (en) | RECONFIGURABLE COMPUTER MODULE | |
US10809779B2 (en) | Managing power in a high performance computing system for resiliency and cooling | |
US20140282584A1 (en) | Allocating Accelerators to Threads in a High Performance Computing System | |
CN104601684A (en) | Cloud server system | |
JP2004078929A (en) | System which optimizes performance in processor level, method, and apparatus | |
RU2699254C1 (en) | Reconfigurable computer system with a multilevel monitoring and control subsystem | |
EP3295275B1 (en) | Managing power in a high performance computing system for resiliency and cooling | |
RU2677363C1 (en) | Reconfigurable computing system | |
US9250826B2 (en) | Enhanced performance monitoring method and apparatus | |
CN117041184A (en) | IO expansion architecture, IO switch and PCIe device | |
RU2686004C1 (en) | Computing module | |
RU2713757C1 (en) | Reconfigurable computing system | |
US11809893B2 (en) | Systems and methods for collapsing resources used in cloud deployments | |
RU2748454C1 (en) | Reconfigurable computing system with multi-level monitoring subsystem and automatic control | |
US11733762B2 (en) | Method to allow for higher usable power capacity in a redundant power configuration | |
US20190171276A1 (en) | Efficient utilization of spare datacenter capacity | |
RU2798443C1 (en) | Reconfigurable computing system | |
Andres et al. | IBM zEnterprise energy management | |
US9933826B2 (en) | Method and apparatus for managing nodal power in a high performance computer system | |
RU2748299C1 (en) | Autonomous computing module with submodules | |
RU182316U1 (en) | Problem-oriented computing device |