RU2686004C1 - Computing module - Google Patents

Computing module Download PDF

Info

Publication number
RU2686004C1
RU2686004C1 RU2018127532A RU2018127532A RU2686004C1 RU 2686004 C1 RU2686004 C1 RU 2686004C1 RU 2018127532 A RU2018127532 A RU 2018127532A RU 2018127532 A RU2018127532 A RU 2018127532A RU 2686004 C1 RU2686004 C1 RU 2686004C1
Authority
RU
Russia
Prior art keywords
module
computational
fpga
group
vlsi
Prior art date
Application number
RU2018127532A
Other languages
Russian (ru)
Inventor
Ольга Анатольевна Будкина
Константин Игоревич Воротников
Федор Вячеславович Демин
Виктор Викторович Парамонов
Аркадий Васильевич Симонов
Александр Георгиевич Титов
Александр Альбертович Цыбов
Original Assignee
Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" filed Critical Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант"
Priority to RU2018127532A priority Critical patent/RU2686004C1/en
Application granted granted Critical
Publication of RU2686004C1 publication Critical patent/RU2686004C1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change

Abstract

FIELD: computer equipment.
SUBSTANCE: invention relates to computer engineering, particularly to computing devices with a reconfigurable architecture. Computing module comprises PCI-Express 1 switch, PLD interface 2, a group of computational PLD 31, …, 3N, external PCI-Express port 4, a group of computer VLSI 51, …, 5N, JTAG external monitoring and control port 6, unit 7 of operational configuration of interface PLD 2, memory 8 configuration of interface PLD 2, unit 9 of operational reconfiguration of memory of starting configurations of computational PLD 31, …, 3N, group of start configurations memory 101, …, 10N computational PLD 31, …, 3N, individual monitoring and power control units 111, …, 11N computational VLSI 51, …, 5N, module monitoring module 17, individual tuning units of operating frequencies 121, …,12n of computational VLSI 51, …, 5N, individual monitoring units 131, …, 13N, Ethernet network switch 21, random access memory 201, …, 20N, unit for control and power supply of module 14, module interface units with power control and monitoring system 15 and with monitoring system 18, external network port 22, external monitoring port 19, external control and power control port 16.
EFFECT: technical result is higher efficiency of the computing module.
1 cl, 1 dwg

Description

ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD

Изобретение относится к области вычислительной техники, в частности, к вычислительным устройствам с перестраиваемой архитектурой, использующим программируемые логические интегральные схемы (ПЛИС) и заказные СБИС.The invention relates to the field of computing, in particular, to computing devices with a tunable architecture, using programmable logic integrated circuits (FPGAs) and custom-made VLSI.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИPRIOR ART

Известен вычислительный модуль (RU №168565 U1, МПК G06F 15/16, заявлен 21.11.2016, опубликован 8.02.2017 Бюл. №4), содержащий внешний порт PCI-Express для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, блок оперативного конфигурирования интерфейсной ПЛИС, блок контроля и управления питанием, блок мониторинга, внешний порт контроля и управления JTAG, память конфигурации интерфейсной ПЛИС, двунаправленную общую шину конфигурирования вычислительных ПЛИС, группу из N вычислительных СБИС, группу из N памятей стартовых конфигураций вычислительных ПЛИС, блок оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС и блок синхронизации.A computational module is known (RU # 168565 U1, IPC G06F 15/16, announced on 11/21/2016, published on February 8, 2017, Bulletin No. 4), which contains an external PCI-Express port for information exchange, a PCI-Express switch, an interface and N computing FPGAs , each of which contains a high-speed serial interface PCI-Express, an interface FPGA operational configuration block, a power control and monitoring unit, a monitoring block, an external JTAG monitoring and control port, an FPGA interface configuration memory, a bi-directional common FPGA computing bus, a group ny of VLSI computing N, a group of N memories starting FPGA configurations computing unit operative rearranging memories starting configurations and FPGA computational sync block.

Недостатками данного вычислительного модуля являются не эффективное использование его вычислительной мощности при решении вычислительно сложных задач, требующих высокой интенсивности обмена информацией вычислительных ПЛИС по внешнему порту PCI-Express, и неравномерное энергопотребление модуля, зависящее от характера решаемых задач.The disadvantages of this computational module are the inefficient use of its computational power in solving computationally complex tasks that require a high intensity of FPGA computing information exchange over the external PCI-Express port, and the uneven power consumption of the module, depending on the nature of the tasks being solved.

Причинами, препятствующими достижению технического результата, являются использование внешнего порта PCI-Express как для обмена данными и результатами вычислительных ПЛИС в ходе выполнения задач, так и для передачи информации о состоянии блоков модуля, и отсутствие возможности в данном модуле решать в текущий момент времени задачи с различной интенсивностью обмена и различным энергопотреблением, что связано с единой системой синхронизации и конфигурирования.The reasons hindering the achievement of the technical result are the use of an external PCI-Express port both for exchanging data and FPGA computational results in the course of performing tasks, and for transmitting information about the state of the module blocks, and the inability of this module to solve tasks at the current time point different exchange rate and different power consumption, which is associated with a single system of synchronization and configuration.

Наиболее близким устройством того же назначения, к заявленной полезной модели, по совокупности признаков является принятый за прототип вычислительный модуль (RU №174347 U1, МПК G06F15/00, G06F15/177, G06F 17/00, заявлен 18.05.2017, опубликован 11.10.2017 Бюл. №29), содержащий внешний порт PCI-Express для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, блок оперативного конфигурирования интерфейсной ПЛИС, группу из N блоков индивидуального контроля и управления питанием, группу из N блоков индивидуального мониторинга, внешний порт контроля и управления JTAG, память конфигурации интерфейсной ПЛИС, двунаправленную общую шину конфигурирования вычислительных ПЛИС, группу из N вычислительных СБИС, группу из N памятей стартовых конфигураций вычислительных ПЛИС, блок оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС, группу из N блоков индивидуальной настройки рабочих частот вычислительных СБИС и блок мониторинга.The closest device of the same purpose to the claimed utility model, on the basis of a combination of features, is the computational module adopted as a prototype (RU # 174347 U1, IPC G06F15 / 00, G06F15/177, G06F 17/00, announced on 05/18/2017, published on 11.10.2017 Bulletin # 29) containing an external PCI-Express port for information exchange, a PCI-Express switch, an interface and N computational FPGAs, each of which contains a high-speed PCI-Express serial interface, an online FPGA configuration block, a group of N individual control blocks and control feed e, group of N individual monitoring units, external JTAG monitoring and control port, interface memory FPGA configuration memory, bidirectional common FPGA computing configuration bus, a group of N computational VLSI, a group of N memories of the starting FPGA computing configurations, operative reconfiguration memory section of the starting computation configurations FPGA, a group of N blocks for individual adjustment of operating frequencies of computational VLSI and monitoring unit.

Недостатками данного вычислительного модуля являются не эффективное использование его вычислительной мощности при решении вычислительно сложных задач, требующих высокой интенсивности обмена информацией вычислительных ПЛИС по внешнему порту PCI-Express, и относительная ограниченность классов решаемых вычислительно сложных задач.The disadvantages of this computational module are the inefficient use of its computational power in solving computationally complex problems, which require a high intensity of FPGA computing information exchange over the external PCI-Express port, and the relative limitedness of the classes of computationally complex problems to be solved.

Причинами, препятствующими достижению технического результата, являются использование в данном вычислительном модуле внешнего порта PCI-Express как для обмена данными и результатами вычислительных ПЛИС в ходе выполнения задач, так и для передачи информации о состоянии блоков модуля, что при больших потоках информации и большом количестве вычислительных модулей в составе реконфигурируемых вычислительных устройств, уменьшает время взаимодействия с каждой отдельной вычислительной ПЛИС, а соответственно уменьшает и объем обрабатываемых данных. Кроме того использование в данном вычислительном модуле вычислительных СБИС с прямой схемотехнической реализацией критических участков трудоемких фрагментов вычислительных алгоритмов ограничивает классы решаемых вычислительно сложных задач.The reasons hindering the achievement of the technical result are the use of the external PCI-Express port in this computing module both for exchanging the data and the results of the computational FPGAs in the course of performing tasks, and for transmitting information about the state of the modules of the module, which with large amounts of information and a large number of computing modules in the composition of reconfigurable computing devices, reduces the time of interaction with each individual FPGA, and accordingly reduces the amount of processed yes GOVERNMENTAL. In addition, the use of computational VLSI in this computational module with a direct circuit implementation of the critical sections of labor-intensive fragments of computational algorithms limits the classes of computationally complex problems to be solved.

ЗАДАЧА ИЗОБРЕТЕНИЯOBJECTIVE OF THE INVENTION

Задача, на решение которой направлено предлагаемое изобретение, заключается в создании высокопроизводительного вычислительного модуля для решения широкого класса вычислительно сложных задач.The problem to which the invention is directed, is to create a high-performance computing module for solving a wide class of computationally complex tasks.

Техническим результатом предлагаемого изобретения, является увеличение вычислительной мощности при решении вычислительно сложных задач, требующих высокой интенсивности обмена информацией вычислительных ПЛИС по внешнему порту PCI-Express и расширение классов решаемых вычислительно сложных задач.The technical result of the present invention is an increase in computational power when solving computationally complex tasks requiring high intensity of information exchange of computational FPGAs on an external PCI-Express port and the expansion of classes of computationally complex tasks to be solved.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION

Указанный технический результат при осуществлении изобретения достигается тем, что в вычислительный модуль, содержащий коммутатор PCI-Express 1, интерфейсную ПЛИС 2, группу из N вычислительных ПЛИС 31, …, 3N, внешний порт PCI-Express 4, группу из N вычислительных СБИС 51, …, 5N, внешний порт контроля и управления модуля JTAG 6, блок 7 оперативного конфигурирования интерфейсной ПЛИС 2, память 8 конфигурации интерфейсной ПЛИС 2, блок 9 оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС 31, …, 3N, группу из N памятей стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 3N, группу из N блоков индивидуального контроля и управления питанием 111, …, 11N вычислительных СБИС 51, …, 5N, блок мониторинга модуля 17, группу из N блоков индивидуальной настройки рабочих частот 121, …, 12N вычислительных СБИС 51, …, 15N, группу из N индивидуальных блоков мониторинга 131, …, 13N,This technical result in the implementation of the invention is achieved by the fact that the computing module containing the switch PCI-Express 1, interface FPGA 2, a group of N computing FPGA 3 1 , ..., 3 N , external port PCI-Express 4, a group of N computing VLSI 5 1 , ..., 5 N , external port of control and management of the JTAG 6 module, block 7 of operational configuration of interface FPGA 2, memory 8 of configuration of interface FPGA 2, block 9 of online reconfiguration of memories of starting configurations of computational FPGA 3 1 , ..., 3 N , group from N memories starting figurations 10 1, ..., 10 N computing FPGA 3 1, ..., 3 N, a group of N individual control and power management units 11 1, ..., 11 N computing VLSI 5 1, ..., 5 N, the monitoring unit module 17, a group from N blocks of individual tuning of working frequencies 12 1 , ..., 12 N computing VLSI 5 1 , ..., 15 N , a group of N individual monitoring blocks 13 1 , ..., 13 N ,

причем порты коммутатора PCI-Express 1 соединены соответствующими высокоскоростными последовательными интерфейсами PCI-Express с внешним портом модуля 4, интерфейсом 23 с интерфейсной ПЛИС 2 и группой из N интерфейсов 251, …, 25N с N вычислительными ПЛИС 31, …, 3N, каждая из которых соединена индивидуальными двунаправленными информационными шинами 321, …, 32N с соответствующими вычислительными СБИС 51, …, 5N,the ports of the PCI-Express 1 switch are connected by the corresponding high-speed PCI-Express serial interfaces with the external port of module 4, interface 23 with interface FPGA 2 and a group of N 25 interfaces 1 , ..., 25 N with N computational FPGAs 3 1 , ..., 3 N , each of which is connected by individual bi-directional information buses 32 1 , ..., 32 N with corresponding computational VLSI 5 1 , ..., 5 N ,

интерфейсная ПЛИС 2 соединена соответствующими шинами с блоком 7 оперативного конфигурирования интерфейсной ПЛИС 2, с блоком 9 оперативного реконфигурирования памятей стартовых конфигураций 101, …, 10N и с блоком мониторинга модуля 17, а также соединена двунаправленной общей шиной конфигурирования 24 с N вычислительными ПЛИС 31, …, 3N и общей шиной 34 с N блоками индивидуальной настройки рабочих частот 121, …, 12N,interface FPGA 2 is connected by the corresponding buses to the operational configuration block 7 of the interface FPGA 2, to the operational reconfiguration block 9 of the starting configuration memory 10 1 , ..., 10 N and to the monitoring module of the module 17, and also connected by a bi-directional common configuration bus 24 to N computing FPGA 3 1 , ..., 3 N and a common bus 34 with N blocks of individual tuning of working frequencies 12 1 , ..., 12 N ,

кроме того, блок 7 оперативного конфигурирования интерфейсной ПЛИС 2 соединен с памятью 8 конфигурации интерфейсной ПЛИС 2 и с внешним портом контроля и управления модуля JTAG 6,in addition, the block 7 operational configuration of the interface FPGA 2 is connected to the memory 8 of the configuration of the interface FPGA 2 and to the external monitoring and control port of the JTAG 6 module,

блок оперативного реконфигурирования памятей 9 соединен общей шиной 26 с N памятями стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 3N,The operative reconfiguration of memories 9 is connected by a common bus 26 with N memories of starting configurations 10 1 , ..., 10 N computing FPGA 3 1 , ..., 3 N ,

при этом N вычислительных ПЛИС 31, …, 3N соединены с соответствующими одноименными N памятями стартовых конфигураций 101, …, 10N группой из N индивидуальных шин реконфигурации 281, …, 28N и группой из N индивидуальных шин оперативной реконфигурации 271, …, 27N, а также группой из N индивидуальных шин 291, …, 29N контроля и управления питанием вычислительных СБИС 51, …, 5N соединены с группой из N блоков индивидуального контроля и управления питанием 111, …, 11N,at that, N computational FPGA 3 1 , ..., 3 N are connected to the corresponding N memory of the starting configurations 10 1 , ..., 10 N by a group of N individual reconfiguration tires 28 1 , ..., 28 N and a group of N individual operational reconfiguration tires 27 1 , ..., 27 N , as well as a group of N individual buses 29 1 , ..., 29 N power management and control computing VLSI 5 1 , ..., 5 N are connected to a group of N units of individual power control and management 11 1 , ..., 11 N ,

кроме того, N блоков индивидуальной настройки рабочих частот 121, …, 12N соединены соответствующими шинами с одноименными СБИС группы из N вычислительных СБИС 51, …, 5N и группой из N индивидуальных шин настройки рабочих частот 311, …, 31N с соответствующими вычислительными ПЛИС 31, …, 3N,in addition, N blocks of individual tuning of working frequencies 12 1 , ..., 12 N are connected by corresponding buses to the same VLSI groups of N computational VLSI 5 1 , ..., 5 N and a group of N individual bus operating frequency settings 31 1 , ..., 31 N with the corresponding computational FPGA 3 1 , ..., 3 N ,

блок мониторинга модуля 17 соединен общей шиной 35 с N индивидуальными блоками мониторинга 131, …, 13N, каждый из которых соединен с соответствующими одноименными вычислительными ПЛИС 31, …, 3N индивидуальными шинами мониторинга 331, …, 33N,the monitoring unit of the module 17 is connected by a common bus 35 with N individual monitoring units 13 1 , ..., 13 N , each of which is connected to the corresponding computational PLIS 3 1 , ..., 3 N of the same name with individual monitoring tires 33 1 , ..., 33 N ,

дополнительно введены сетевой коммутатор Ethernet 21, группа из N оперативных памятей 201, …, 20N, блок контроля и управления питанием модуля 14, блок сопряжения модуля с системой контроля и управления питанием 15, блок сопряжения модуля с системой мониторинга 18, внешний сетевой порт модуля 22, внешний порт мониторинга модуля 19, внешний порт контроля и управления питанием модуля 16,additionally, an Ethernet network switch 21, a group of N operative memories 20 1 , ..., 20 N , a module 14 power control and management unit, a module interface box with a power management system 15, an interface module module with a monitoring system 18, an external network port module 22, the external monitoring port of module 19, the external monitoring and power control port of module 16,

причем группа из N оперативных памятей 201, …, 20N соединена соответствующими шинами с одноименными вычислительными СБИС 51, …, 5N, которые соединены соответствующими сетевыми интерфейсами 361, …, 36N с сетевым коммутатором Ethernet 21, который также соединен с внешним сетевым портом модуля 22,moreover, a group of N operative memories 20 1 , ..., 20 N is connected by the corresponding buses to the same computing VLSI 5 1 , ..., 5 N , which are connected by the corresponding network interfaces 36 1 , ..., 36 N to the Ethernet switch 21, which is also connected to external network port of module 22,

кроме того, блок контроля и управления питанием модуля 14 соединен с интерфейсной ПЛИС 2, а также общей шиной 30 соединен с N блоками индивидуального контроля и управления питанием 111, …, 11N вычислительных СБИС 51, …, 5N и соединен с блоком сопряжения модуля с системой контроля и управления питанием 15, который соединен с внешним портом контроля и управления питанием модуля 16,in addition, the control unit and power management module 14 is connected to the interface FPGA 2, as well as the common bus 30 is connected to the N individual power control and management units 11 1 , ..., 11 N computing VLSI 5 1 , ..., 5 N and connected to the unit pairing the module with the power control and management system 15, which is connected to the external power control and control port of the module 16,

блок мониторинга модуля 17 соединен с блоком сопряжения модуля с системой мониторинга 18, который подключен к внешнему порту мониторинга модуля 19.the monitoring module of the module 17 is connected to the interface module of the module with the monitoring system 18, which is connected to the external monitoring port of the module 19.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

На фиг. 1 приведена функциональная схема вычислительного модуля.FIG. 1 shows the functional diagram of the computing module.

На фиг. 1 и в тексте приняты следующие сокращения и обозначения:FIG. 1 and the following abbreviations and notation are used in the text:

ВМ - вычислительный модуль;VM - computing module;

N - количество вычислительных ПЛИС и СБИС в ВМ;N is the number of computational FPGAs and VLSI in the VM;

i - счетная переменная.i is a countable variable.

1 - коммутатор PCI-Express;1 - PCI-Express switch;

2 - интерфейсная ПЛИС;2 - interface FPGA;

31, …, 3N - группа из N вычислительных ПЛИС;3 1 , ..., 3 N - a group of N computational FPGAs;

4 - высокоскоростной внешний порт последовательного интерфейса PCI-Express;4 - high-speed external serial port PCI-Express;

51, …, 5N - группа из N вычислительных СБИС;5 1 , ..., 5 N - a group of N computational VLSI;

6 - внешний порт контроля и управления модуля JTAG;6 - external monitoring and control port of the JTAG module;

7 - блок оперативного конфигурирования интерфейсной ПЛИС 2;7 - block operational configuration interface FPGA 2;

8 - память конфигурации интерфейсной ПЛИС 2;8 - memory configuration interface FPGA 2;

9 - блок оперативного реконфигурирования памятей стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 13N;9 - block of operational reconfiguration of memories of starting configurations 10 1 , ..., 10 N computational FPGA 3 1 , ..., 13 N ;

101, …, 10N - группа из N памятей стартовых конфигураций вычислительных ПЛИС 31, …, 13N;10 1 , ..., 10 N - a group of N memories of the starting configurations of the computational FPGA 3 1 , ..., 13 N ;

111, …, 11N - группа из N блоков индивидуального контроля и управления питанием вычислительных СБИС 51, …, 5N;11 1 , ..., 11 N - a group of N blocks of individual power control and management of computational VLSI 5 1 , ..., 5 N ;

121, …, 12N - группа из N блоков индивидуальной настройки рабочих частот вычислительных СБИС 51, …, 5N;12 1 , ..., 12 N - a group of N blocks for individual adjustment of operating frequencies of computational VLSI 5 1 , ..., 5 N ;

131, …, 13N - группа из N индивидуальных блоков мониторинга вычислительных ПЛИС 31, …, 3N и СБИС 51, …, 5N;13 1 , ..., 13 N - a group of N individual monitoring units of computational FPGA 3 1 , ..., 3 N and VLSI 5 1 , ..., 5 N ;

14 - блок контроля и управления питанием модуля;14 — module power control and management unit;

15 - блок сопряжения модуля с системой контроля и управления питанием;15 - module interfacing unit with power control and management system;

16 - внешний порт контроля и управления питанием модуля;16 - external port of control and management of power supply of the module;

17 - блок мониторинга модуля;17 — module monitoring unit;

18 - блок сопряжения модуля с системой мониторинга;18 - module interfacing unit with a monitoring system;

19 - внешний порт мониторинга модуля;19 - external monitoring port of the module;

201, …, 20N - группа из N оперативных памятей;20 1 , ..., 20 N - a group of N operational memories;

21 - сетевой коммутатор Ethernet;21 - Ethernet network switch;

22 - внешний сетевой порт модуля;22 - external network port of the module;

23 - высокоскоростной последовательный интерфейс PCI-Express между коммутатором PCI-Express 1 и интерфейсной ПЛИС 2;23 - high-speed serial interface PCI-Express between the switch PCI-Express 1 and interface FPGA 2;

24 - двунаправленная общая шина конфигурирования вычислительных ПЛИС 31, …, 3N;24 is a bidirectional common bus for configuring computational FPGAs 3 1 , ..., 3 N ;

251, …, 25N - группа из N высокоскоростных последовательных интерфейсов PCI-Express между коммутатором PCI-Express 1 и вычислительными ПЛИС 31, …, 3N;25 1 , ..., 25 N - a group of N high-speed PCI-Express serial interfaces between the PCI-Express 1 switch and FPGA 3 1 , ..., 3 N ;

26 - общая шина оперативного реконфигурирования памятей стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 3N;26 - common bus for operational reconfiguration of memories of starting configurations 10 1 , ..., 10 N computational FPGA 3 1 , ..., 3 N ;

271, …, 27N - группа из N индивидуальных шин оперативной реконфигурации памятей стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 3N;27 1 , ..., 27 N - a group of N individual tires of operational reconfiguration of memories of starting configurations 10 1 , ..., 10 N computational FPGA 3 1 , ..., 3 N ;

281, …, 28N - группа из N индивидуальных шин реконфигурации вычислительных ПЛИС 31, …, 3N;28 1 , ..., 28 N - a group of N individual bus reconfiguration computing FPGA 3 1 , ..., 3 N ;

291, …, 29N - группа из N индивидуальных шин контроля и управления питанием вычислительных СБИС 51, …, 5N;29 1 , ..., 29 N - a group of N individual power control and control buses for computational VLSI 5 1 , ..., 5 N ;

30 - общая шина контроля и управления питанием вычислительных СБИС 51, …, 5N;30 - common bus control and power management computing VLSI 5 1 , ..., 5 N ;

311, …, 31N - группа из N индивидуальных шин настройки рабочих частот вычислительных СБИС 51, …, 5N;31 1 , ..., 31 N - a group of N individual buses tuning the operating frequencies of computational VLSI 5 1 , ..., 5 N ;

321, …, 32N - группа из N двунаправленных информационных шин между одноименными вычислительными СБИС 5ь 5n и вычислительными ПЛИС 31, …, 3N;32 1 , ..., 32 N - a group of N bidirectional information buses between the same-named VLSI 5n 5n computing and FPGA 3 1 , ..., 3 N ;

331, …, 33N - группа из N индивидуальных шин мониторинга ПЛИС 31, …, 3N;33 1 , ..., 33 N - a group of N individual FPGA monitoring tires 3 1 , ..., 3 N ;

34 - общая шина настройки рабочих частот вычислительных СБИС 81, …, 8N;34 - common bus tuning operating frequency computing VLSI 8 1 , ..., 8 N ;

35 - общая шина мониторинга модуля;35 — common module monitoring bus;

361, …, 36N - группа из N сетевых интерфейсов вычислительных СБИС 51, …, 5N.36 1 , ..., 36 N - a group of N network interfaces computing VLSI 5 1 , ..., 5 N.

ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

Коммутатор PCI-Express 1 предназначен для организации обмена информацией с интерфейсной ПЛИС 2 и с N вычислительными ПЛИС 31, …, 3N по внешнему порту 4 и организации взаимодействия N вычислительных ПЛИС 31, …, 3N между собой по интерфейсам PCI-Express 251, …, 25N. Коммутатор PCI-Express 1 содержит N+2 высокоскоростных портов, которые соединены с внешним портом PCI-Express 4, с интерфейсной ПЛИС 2 по интерфейсу PCI-Express 23, с N вычислительными ПЛИС 31, …, 3N по N интерфейсам PCI-Express 251, …, 25N.The switch PCI-Express 1 is designed to organize information exchange with interface FPGA 2 and with N computing FPGA 3 1 , ..., 3 N via external port 4 and organization of interaction between N computing FPGA 3 1 , ..., 3 N among themselves via PCI-Express interfaces 25 1 , ..., 25 N. The PCI-Express 1 switchboard contains N + 2 high-speed ports that are connected to an external PCI-Express 4 port, from an interface FPGA 2 via a PCI-Express 23 interface, to N computational FPGAs 3 1 , ..., 3 N through N PCI-Express interfaces 25 1 , ..., 25 N.

Вычислительные ПЛИС 31, …, 3N предназначены для осуществления высокопроизводительной предварительной обработки поступающих входных данных, последующей дообработки результатов работы вычислительных СБИС 51, …, 5N, а также обеспечивают обмен данными и результатами с вычислительными СБИС 51, …, 5N. Кроме того, вычислительные ПЛИС 31, …, 3N осуществляют обмен информацией с индивидуальными блоками мониторинга 131, …, 13N и блоками индивидуального контроля и управления питанием 111, …, 11N, обеспечивая тем самым управление питанием вычислительных СБИС 51, …, 5N и осуществляют настройку рабочих частот вычислительных СБИС 51, …, 5N и само конфигурирование за счет собственных ресурсов и переконфигурирования собственных памятей стартовых конфигураций 101, …, 10N без использования ресурсов интерфейсной ПЛИС 2.Computational FPGAs 3 1 , ..., 3 N are intended for the implementation of high-performance preprocessing of incoming input data, the subsequent additional processing of the results of the operation of computational VLSI 5 1 , ..., 5 N , and also ensure the exchange of data and results with computational VLSI 5 1 , ..., 5 N . In addition, computational FPGA 3 1 , ..., 3 N exchange information with individual monitoring units 13 1 , ..., 13 N and individual power control and management units 11 1 , ..., 11 N , thereby ensuring the power management of computational VLSI 5 1 , ..., 5 N and configure the operating frequencies of the computational VLSI 5 1 , ..., 5 N and the configuration itself using its own resources and reconfiguring its own memory of the starting configurations 10 1 , ..., 10 N without using the resources of the interface FPGA 2.

Вычислительные СБИС 51, …, 5N могут осуществлять как прямую схемотехническую реализацию критических участков трудоемких фрагментов вычислительных алгоритмов, так и выполнять программно-аппаратную обработку данных для более широких классов вычислительно сложных задач, используя оперативную память 201, …, 20N как для хранения выполняемой программы, так и для хранения промежуточных результатов ее выполнения.Computational VLSI 5 1 , ..., 5 N can carry out both direct circuitry implementation of critical sections of laborious fragments of computational algorithms, and also perform hardware and software data processing for wider classes of computationally complex tasks using RAM 20 1 , ..., 20 N as for storage of the executed program, and for storage of intermediate results of its execution.

Интерфейсная ПЛИС 2 предназначена для организации обмена информацией с блоком мониторинга модуля 17, с блоком 9 оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС 31, …, 3N, с блоком контроля и управления питанием модуля 14, с блоками индивидуальной настройки рабочих частот 121, …, 12N вычислительных СБИС 51, …, 5N по общей шине настройки 34, а также для оперативного конфигурирования вычислительных ПЛИС 31, …, 3N по двунаправленной общей шине конфигурирования 24.Interface FPGA 2 is designed to organize the exchange of information with the monitoring module of module 17, with block 9 of the online reconfiguration of the memory of the starting configurations of the computational FPGA 3 1 , ..., 3 N , with the control and management module of the module 14 power supply, with blocks for individual setting of working frequencies 12 1 , ..., 12 N computational VLSI 5 1 , ..., 5 N on the common configuration bus 34, as well as for the operational configuration of the computation FPGA 3 1 , ..., 3 N on the bi-directional common configuration bus 24.

Блок 7 оперативного конфигурирования интерфейсной ПЛИС 2 предназначен для организации конфигурирования интерфейсной ПЛИС 2 по внешнему порту контроля и управления модуля JTAG 6 или, при включении питания модуля, из памяти 8 конфигурации интерфейсной ПЛИС 2, предназначенной для хранения ее рабочей конфигурации.Block 7 of the operational configuration of the interface FPGA 2 is designed to organize the configuration of the interface FPGA 2 via the external monitoring and control port of the JTAG 6 module or, when the module is powered up, from the memory 8 of the configuration of the FPGA 2 intended for storing its working configuration.

Группа из N памятей 101, …, 10N стартовых конфигураций вычислительных ПЛИС 31, …, 3N предназначена для хранения индивидуальных стартовых конфигураций вычислительных ПЛИС 31, …, 3N, которые могут быть как одинаковыми, так и различными.A group of N memories 10 1 , ..., 10 N starting configurations of computational FPGA 3 1 , ..., 3 N is designed to store individual starting configurations of computational FPGA 3 1 , ..., 3 N , which can be both the same and different.

Внешний порт контроля и управления модуля JTAG 6 предназначен для организации контроля и управления интерфейсной ПЛИС 2 и вычислительными ПЛИС 31, …, 3N средствами САПР от внешнего управляющего компьютера на этапе настройки вычислительного модуля и для диагностики неисправностей.The external port of control and management of the JTAG 6 module is intended for organizing the monitoring and control of the interface FPGA 2 and computational FPGA 3 1 , ..., 3 N by means of CAD from an external control computer at the stage of setting up the computation module and for diagnosing faults.

Блок 9 оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС 31, …, 3N предназначен для начальной загрузки от интерфейсной ПЛИС 2 по общей шине 26 стартовых конфигураций вычислительных ПЛИС 31, …, 3N в группу из N памятей 101, …, 10N.Block 9 online reconfiguration of the memory of the starting configurations of computational FPGA 3 1 , ..., 3 N is designed for initial loading from the interface FPGA 2 via the common bus 26 of the starting configurations of computing FPGA 3 1 , ..., 3 N into a group of N memories 10 1 , ..., 10 N.

Блок контроля и управления питанием модуля 14 предназначен для контроля уровней напряжения питания и управления включением источников питания модуля (источники питания на фиг. 1 не показаны), посредством обшей шины 30 и группы из N блоков 111, …, 11N индивидуального контроля и управления питанием вычислительных СБИС 51, …, 5N, и взаимодействия с внешней системой контроля и управления питанием посредством блока сопряжения модуля с системой контроля и управления питанием 15 через внешний порт контроля и управления питанием модуля 16.The power supply monitoring and control unit of the module 14 is designed to control the supply voltage levels and control the switching on of the module power supplies (power supplies in Fig. 1 are not shown) using the common bus 30 and a group of N units 11 1 , ..., 11 N individual control and management powering the computational VLSI 5 1 , ..., 5 N , and interaction with the external power control and control system through the module interface unit with the power control and management system 15 through the external power control and control port of the module 16.

Группа из N блоков 111, …, 11N индивидуального контроля и управления питанием вычислительных СБИС 51, …, 5N предназначена для реализации возможности независимого контроля и управления питанием вычислительных СБИС 51, …, 5N одноименными вычислительных ПЛИС 31, …, 3N, посредством группы из N индивидуальных шин 291, …, 29N.A group of N blocks 11 1 , ..., 11 N of individual power control and management of computational VLSI 5 1 , ..., 5 N is designed to realize the possibility of independent control and power management of computational VLSI 5 1 , ..., 5 N of the same name computational FPGA 3 1 , ... , 3 N , through a group of N individual tires 29 1 , ..., 29 N.

Группа из N блоков 131, …, 13N индивидуального мониторинга вычислительных ПЛИС 31, …, 3N, и СБИС 51, …, 5N предназначена для реализации возможности независимого мониторинга температурного режима вычислительных ПЛИС 31, …, 3N и вычислительных СБИС 51, …, 5N.A group of N units 13 1 , ..., 13 N of individual monitoring of computational FPGA 3 1 , ..., 3 N , and VLSI 5 1 , ..., 5 N is designed to realize the possibility of independent monitoring of the temperature mode of computational FPGA 3 1 , ..., 3 N and computing VLSI 5 1 , ..., 5 N.

Блок мониторинга модуля 17 и группа из N блоков индивидуального мониторинга 131, …, 13N предназначены для контроля температурного режима N вычислительных ПЛИС 31, …, 3N и N вычислительных СБИС 51, …, 5N по общей шине мониторинга модуля 35 и по индивидуальным шинам 331, …, 33N мониторинга от вычислительных ПЛИС 31, …, 3N, с использованием датчиков температуры, встроенных в вычислительные ПЛИС 31, …, 3N и вычислительные СБИС 51, …, 5N (датчики температуры на фиг. 1 не показаны), Блок мониторинга модуля 17 также осуществляет взаимодействие с внешней системой мониторинга посредством блока сопряжения модуля с системой мониторинга 18 через внешний порт мониторинга модуля 19.The monitoring unit of module 17 and a group of N individual monitoring units 13 1 , ..., 13 N are designed to monitor the temperature mode of N computational FPGAs 3 1 , ..., 3 N and N computational VLSI 5 1 , ..., 5 N over a common monitoring bus of module 35 and on individual tires 33 1 , ..., 33 N monitoring from computational FPGA 3 1 , ..., 3 N , using temperature sensors embedded in computation FPGA 3 1 , ..., 3 N and computational VLSI 5 1 , ..., 5 N ( temperature sensors in Fig. 1 are not shown), Module 17 monitoring module also interacts with external systems oh monitoring through the module interface unit with the monitoring system 18 through the external monitoring port of the module 19.

Блоки настройки рабочих частот 121, …, 12N предназначены для обеспечения требуемыми индивидуальными рабочими частотами соответствующих одноименных вычислительных СБИС 51, …, 5N, с управлением от интерфейсной ПЛИС 2 по общей шине настройки рабочих частот 34 вычислительных СБИС 51, …, 5N, или от одноименных вычислительных ПЛИС 31, …, 3N по индивидуальным шинам 311, …, 31N настройки рабочих частот вычислительных СБИС 51, …, 5N.The tuning blocks of the working frequencies 12 1 , ..., 12 N are designed to provide the required individual working frequencies of the corresponding computational VLSI 5 1 , ..., 5 N with the same name, controlled from the interface FPGA 2 via the common bus for setting the operating frequencies of 34 computing VLSI 5 1 , ..., 5 N , or from the same computing FPGA 3 1 , ..., 3 N on individual buses 31 1 , ..., 31 N settings of the operating frequencies of computational VLSI 5 1 , ..., 5 N.

Группа из N оперативных памятей 201, …, 20N предназначена для буферизации очередных заданий, обрабатываемых данных и полученных результатов при использовании заказных вычислительных СБИС 51, …, 5N с прямой схемотехнической реализацией критических участков трудоемких фрагментов вычислительных алгоритмов, и для хранения выполняемых программ и промежуточных результатов при использовании вычислительных СБИС с программной реализацией трудоемких фрагментов вычислительных алгоритмов.A group of N operative memories 20 1 , ..., 20 N is intended for buffering successive tasks, processed data and obtained results when using custom-made VLSI 5 1 , ..., 5 N with a direct circuit implementation of critical sections of laborious fragments of computational algorithms, and for storing executed programs and intermediate results when using computational VLSI with software implementation of time-consuming fragments of computational algorithms.

Сетевой коммутатор Ethernet 21 предназначен для обеспечения взаимодействия вычислительных СБИС 51, …, 5N по сетевым интерфейсам 361, …, 36N через внешний сетевой порт модуля 22 с другими внешними вычислительными средствами и между собой по обмену данными, результатами и программами.The network switch Ethernet 21 is designed to ensure the interaction of computational VLSI 5 1 , ..., 5 N via network interfaces 36 1 , ..., 36 N through the external network port of module 22 with other external computing facilities and among themselves for the exchange of data, results and programs.

Предлагаемый вычислительный модуль работает следующим образом.The proposed computing module works as follows.

После подачи первичного питания на вычислительный модуль, осуществляется загрузка рабочей конфигурации в интерфейсную ПЛИС 2 блоком 7 оперативного конфигурирования ПЛИС из памяти 8 конфигурации интерфейсной ПЛИС и стартовые конфигурации в вычислительные ПЛИС 31, …, 3N из памятей стартовых конфигураций 101, …, 10N, которые были изначально загружены на этапе наладки модуля.After supplying the primary power to the computing module, the working configuration is loaded into the interface FPGA 2 by the FPGA 7 operational configuration module from the FPGA interface configuration memory 8 and the starting configurations into the FPGA 3 1 , ..., 3 N configurations from the starting configuration memory 10 1 , ..., 10 N , which were initially loaded at the stage of module setup.

Рабочая конфигурация интерфейсной ПЛИС 2 должна обеспечивать все необходимые функции управления, к которым, прежде всего, относится организация взаимодействия по внешнему порту PCI-Express 4 посредством ресурсов высокоскоростного последовательного интерфейса PCI-Express 23, организация взаимодействия с блоком мониторинга модуля 17, организация взаимодействия с блоком 9 оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС 31, …, 3N, организация взаимодействия с блоком контроля и управления питанием модуля 14 и группой из N блоков индивидуального контроля и управления питанием 111, …, 13N, организация взаимодействия с группой из N блоков индивидуальной настройки рабочих частот 121, …, 12N вычислительных СБИС 51, …, 5N, а также организация оперативного конфигурирования вычислительных ПЛИС 31, …, 3N по двунаправленной общей шине 24.The working configuration of the interface FPGA 2 should provide all the necessary control functions, which primarily include the organization of interaction via the external PCI-Express 4 port through high-speed PCI-Express 23 serial interface resources, the organization of interaction with the monitoring module of module 17, the organization of interaction with the module 9 operative rearranging memories starting configurations computing FPGA 3 1, ..., 3 N, organization of the interaction with the power control module and the control unit 14 and the groups th of the N individual control and power management units 11 1, ..., 13 N, organization of the interaction with a group of N blocks customization of operating frequencies 12 1, ..., 12 N computing VLSI 5 1, ..., 5 N, and organization operative configuration FPGA 3 1 , ..., 3 N on a bi-directional common bus 24.

Стартовые конфигурации вычислительных ПЛИС 31, …, 3N должны обеспечивать взаимодействие вычислительных ПЛИС 31, …, 3N по внешнему порту PCI-Express 4, посредством ресурсов высокоскоростных последовательных интерфейсов PCI-Express 251, …, 25N, запись в память стартовых конфигураций 101, …, 10N рабочих конфигураций и организацию собственного реконфигурирования из памяти стартовых конфигураций 101, …, 10N.Starting configurations of computational FPGAs 3 1 , ..., 3 N should provide interfacing of computational FPGAs 3 1 , ..., 3 N via an external PCI-Express 4 port using high-speed PCI-Express 25 1 , ..., 25 N serial resources, writing to memory starting configurations 10 1 , ..., 10 N working configurations and organizing your own reconfiguration from the memory of starting configurations 10 1 , ..., 10 N.

Рабочие конфигурации вычислительных ПЛИС 31, …, 3N должны обеспечивать то, что делают стартовые конфигурации, а также реализовывать требуемые интерфейсы взаимодействия с одноименными вычислительными СБИС 51, …, 5N по группе шин 321, …, 32N, с блоками индивидуальной настройки рабочих частот СБИС 121, …, 12N по группе шин 311, …, 31N, с индивидуальными блоками контроля и управления питанием 111, …, 11N по группе шин 291, …, 29N, с индивидуальными блоками мониторинга 131, …, 13N вычислительных ПЛИС 31, …, 3N и СБИС 51, …, 5N по группе шин 331, …, 33N, с целью полнофункциональной и независимой работы вычислительных ПЛИС 31, …, 3N.The working configurations of computational FPGAs 3 1 , ..., 3 N should ensure what the starting configurations do, and also implement the required interfaces of interaction with the same computational VLSI 5 1 , ..., 5 N for the bus group 32 1 , ..., 32 N , with blocks individual setting of VLSI operating frequencies 12 1 , ..., 12 N for a group of tires 31 1 , ..., 31 N , with individual power control and management units 11 1 , ..., 11 N for a group of tires 29 1 , ..., 29 N , with individual monitoring units 13 1 , ..., 13 N computing FPGAs 3 1 , ..., 3 N and VLSI 5 1 , ..., 5 N for a group of tires 33 1 , ..., 33 N , with the aim of fully functional and independent operation of computational FPGA 3 1 , ..., 3 N.

После загрузки операционной системы во внешнюю управляющую вычислительную машину, в адресном пространстве которой находится предлагаемый вычислительный модуль, осуществляется распределение вычислительных ПЛИС 31, …, 3N и СБИС 51, …, 5N между пользователями (задачами), которые осуществляют реконфигурирование выделенных им вычислительных ПЛИС 31, …, 3N через памяти их стартовых конфигураций 101, …, 10N рабочими конфигурациями. После этого вычислительный модуль становится готовым к решению задач пользователей.After the operating system is loaded into an external control computer, in the address space of which the proposed computation module is located, the computation FPGA 3 1 , ..., 3 N and VLSI 5 1 , ..., 5 N are distributed among users (tasks) who reconfigure the selected FPGA 3 1 , ..., 3 N through the memory of their starting configurations 10 1 , ..., 10 N working configurations. After that, the computing module is ready to solve user problems.

При решении задач осуществляется обмен очередными данными и результатами между вычислительными ПЛИС 31, …, 3N и управляющей вычислительной машиной по высокоскоростному последовательному интерфейсу PCI-Express через внешний порт PCI-Express 4. Каждая транзакция сопровождается отправкой вычислительным ПЛИС Зь 3n слова состояния о ее завершении, для перехода к следующей транзакции. В каждое слово состояние вычислительными ПЛИС 31, …, 3N подмешивается информация о текущем температурном состоянии как самого вычислительного ПЛИС, так и одноименного с ним вычислительного СБИС 51, …, 5N. Из слов состояния вычислительных ПЛИС 31, …, 13N интерфейсной ПЛИС 2 формируется общий кадр состояния вычислительного модуля, который, в зависимости от организации системы мониторинга, может либо оставаться в памяти управляющей вычислительной машины, либо посредством блока сопряжения модуля 18 с системой мониторинга через внешний порт мониторинга модуля 19 направляться дальше для хранения, анализа и принятия решений о дальнейшем управлении вычислительным модулем. При этом, В последнем случае, высокоскоростной внешний порт последовательного интерфейса PCI-Express 4 полностью освобождается от передачи информации о мониторинге, что в среднем на 10-15% увеличивает суммарное время взаимодействия вычислительных ПЛИС 31, …, 3N на обмен данными и результатами выполнения задач пользователей по данному порту, что также увеличивает и вычислительную производительность модуля.When solving problems, the exchange of successive data and results between computational FPGA 3 1 , ..., 3 N and the control computer is performed via a high-speed PCI-Express serial interface through an external PCI-Express port 4. Each transaction is accompanied by sending computation FPGA G 3n status words about it complete, to proceed to the next transaction. In each word state computational FPGA 3 1 , ..., 3 N information is mixed about the current temperature state of both the computational FPGA itself and the same computational VLSI 5 1 , ..., 5 N. From the state words of the computational FPGA 3 1 , ..., 13 N of the interface FPGA 2, a general state frame of the computation module is formed, which, depending on the monitoring system organization, can either remain in the memory of the control computer, or by means of the interface unit of the module 18 with the monitoring system through The external monitoring port of module 19 is further forwarded for storing, analyzing and deciding on the further management of the computing module. At the same time, In the latter case, the high-speed external port of the PCI-Express 4 serial interface is completely exempt from transmitting monitoring information, which, on average, increases the total interaction time of FPGAs 3 1 , ..., 3 N for data and results exchange by 10-15% performing user tasks on this port, which also increases the computational performance of the module.

Наиболее энергопотребляющими компонентами предлагаемого вычислительного модуля являются вычислительные СБИС 51, …, 5N, имеющие большое количество внутренних компонент и работающие на высоких частотах. В связи с этим большое значение имеет уменьшение энергетических затрат холостого хода СБИС 51, …, 5N (время, когда СБИС 51, …, 5N ожидает загрузки очередных данных или выгрузки уже готовых результатов). В среднем, в зависимости от алгоритмов реализуемых задач это время может достигать 15-20% от времени вычислений (эффективной работы) СБИС 51, …, 5N. Отключение питания со СБИС 51, …, 5N на это время, уменьшает потребление более чем в четыре раза, следовательно, в среднем можно ожидать экономию по энергопотреблению до 15%.The most energy-consuming components of the proposed computational module are computational VLSI 5 1 , ..., 5 N , having a large number of internal components and operating at high frequencies. In this regard, it is of great importance to reduce the energy costs of idling the VLSI 5 1 , ..., 5 N (the time when the VLSI 5 1 , ..., 5 N is waiting for the loading of the next data or the unloading of the finished results). On average, depending on the algorithms of the tasks being implemented, this time can reach 15-20% of the computation time (efficient operation) of the SBIS 5 1 , ..., 5 N. Turning off the power from the VLSI 5 1 , ..., 5 N at this time reduces the consumption by more than four times, therefore, on average, energy savings of up to 15% can be expected.

Кроме того, в предлагаемом модуле имеется возможность отключать питание не только с вычислительных СБИС 51, …, 5N, а и с соответствующих вычислительных ПЛИС 31, …, 3N, что осуществляется интерфейсной ПЛИС 2 посредством блока 14 контроля и управления питанием модуля. Это дает еще больший энергетический выигрыш, но возможно только в случае, когда соответствующие вычислительные ПЛИС 31, …, 3N не используются для решения задач пользователей.In addition, in the proposed module it is possible to turn off the power not only from the computational VLSI 5 1 , ..., 5 N , but also from the corresponding computational FPGA 3 1 , ..., 3 N , which is performed by the interface FPGA 2 through the module 14 to monitor and control the power supply of the module . This gives an even greater energy gain, but is possible only in the case when the corresponding computational FPGAs 3 1 , ..., 3 N are not used to solve user problems.

Применение в предлагаемом вычислительном модуле вычислительных СБИС 51, …, 5N, имеющих в своем составе вычислительные ресурсы, поддерживающие программное выполнение набора некоторых трудоемких алгоритмов, взаимодействие через сетевой коммутатор Ethernet 21 и внешний сетевой порт модуля 22 с внешними вычислительными устройствами, а также введение N оперативных памятей 201, …, 20N, подключенных к вычислительным СБИС 51, …, 5N, позволяет не только значительно расширить классы решаемых модулем задач за счет их программной реализации, а и дополнительно разгрузить внешний порт последовательного интерфейса PCI-Express 4 от части транзакций, которые могут быть осуществлены по сетевому порту модуля 22, что также увеличивает время эффективной работы вычислительным СБИС 51, …, 5N, а соответственно и увеличивает производительность предлагаемого вычислительного модуля.Application in the proposed computational module computational VLSI 5 1 , ..., 5 N , having in its composition computing resources that support software execution of a set of some labor-intensive algorithms, interaction via an Ethernet network switch 21 and the external network port of module 22 with external computing devices, as well as introduction N operational memories 20 1 , ..., 20 N , connected to computational VLSI 5 1 , ..., 5 N , allows not only to significantly expand the classes of tasks solved by the module due to their software implementation, but also add It is possible to relieve the external port of the PCI-Express 4 serial interface from part of the transactions that can be carried out via the network port of module 22, which also increases the time for efficient operation of computational VLSI 5 1 , ..., 5 N , and accordingly increases the performance of the proposed computational module.

ПРИМЕР ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯAn EXAMPLE of the IMPLEMENTATION of the INVENTION

Предлагаемый вычислительный модуль может быть выполнен на следующих элементах:The proposed computing module can be performed on the following elements:

коммутатор PCI-Express 1 - на микросхеме РЕХ8732 фирмы PLX Technology; интерфейсная ПЛИС 2 и вычислительные ПЛИС 31, … 3n - на микросхемах фирмы Xilinx XC7A75T-FGG484;PCI-Express 1 switch - on the PEX8732 chip manufactured by PLX Technology; interface FPGA 2 and computational FPGA 3 1 , ... 3n - on Xilinx XC7A75T-FGG484 microcircuits;

оперативная память 201, …, 20N - на микросхемах MT46H128M16LFDD-48;RAM 20 1 , ..., 20 N - on the chips MT46H128M16LFDD-48;

сетевой коммутатор 21 - на микросхеме NXP SJA1105;network switch 21 - on the NXP SJA1105 chip;

памяти 101, …, 10N стартовых конфигураций вычислительных ПЛИС - на микросхемах на SPI-памяти N25Q064A11EF640;memory 10 1 , ..., 10 N starting configurations of computational FPGAs - on chips in SPI-memory N25Q064A11EF640;

порт контроля и управления JTAG 6 - с использованием штатного разъема MOLEX и микросхемы CPLD ХС2С64А;JTAG 6 monitoring and control port - using a standard MOLEX connector and a CPLD XC2C64A chip;

память 8 конфигурации интерфейсной ПЛИС - на SPI-памяти N25Q032A11EF640;Memory 8 configuration FPGA - on SPI-memory N25Q032A11EF640;

блоки мониторинга 17 и 131, …, 13N - на микросхемах TMP461AIRUNT и МАХ1239ЕЕЕ;monitoring units 17 and 13 1 , ..., 13 N - on TMP461AIRUNT and MAX1239EEE microcircuits;

блоки настройки рабочих частот 121, …, 12N вычислительных СБИС - на микросхемах 570FCA000133DG.12 1 , ..., 12 N computational VLSI operating frequency tuning blocks - on 570FCA000133DG microcircuits.

Предлагаемый вычислительный модуль может быть выполнен как в виде платы расширения, устанавливаемой в разъемы PCI-Express материнской платы универсального вычислителя, как правило, при N<5, что связанно с допустимыми габаритами плат расширения, так и в виде модулей, устанавливаемых в отдельные корпуса и имеющие входные порты PCI-Express. Как в первом, так и во втором случае первичное питание модулей, как правило, +12V, поступает с внешнего разъема и, как правило, от автономного источника, что связанно большой мощностью потребления модулей. Исключения могут составлять только платы расширения, устанавливаемые в разъемы PCI-Express универсальных вычислителей в ограниченном количестве и с небольшим N.The proposed computational module can be implemented either as an expansion card installed in the PCI-Express slots of a universal computer motherboard, as a rule, with N <5, which is related to the allowable dimensions of the expansion cards, and as modules installed in separate enclosures and having PCI-Express input ports. Both in the first and in the second case the primary power supply of the modules, as a rule, + 12V, comes from an external connector and, as a rule, from an independent source, which is connected with a high power consumption of the modules. The only exceptions are expansion cards installed in the PCI-Express slots of universal computers in a limited number and with a small N.

Таким образом, предлагаемый вычислительный модуль, по сравнению с прототипом, имеет более высокую вычислительную мощность при решении вычислительно сложных задач, требующих высокой интенсивности обмена информацией вычислительных ПЛИС 31, …, 3N по внешнему порту PCI-Express 4, который освобождается от необходимости передачи информации о состоянии модуля, за счет передачи данной информации по внешнему порту мониторинга модуля 19 и внешнему порту контроля и управления питанием модуля 16. Также внешний порт PCI-Express 4 разгружается от обмена некоторой части рабочей информации, в основном программной для работы вычислительных СБИС 51, …, 5N, за счет использования для этого сетевого коммутатора 21 и внешнего сетевого порта модуля 22.Thus, the proposed computational module, in comparison with the prototype, has a higher computational power when solving computationally complex tasks that require a high intensity of information exchange of computational FPGA 3 1 , ..., 3 N via an external PCI-Express 4 port, which is freed from the need to transfer information about the state of the module, by transmitting this information via the external monitoring port of module 19 and the external monitoring and control port of module 16. Also, the external PCI-Express 4 port is unloaded from the exchange of course th part of the working information, mainly software for the work of computing VLSI 5 1 , ..., 5 N , due to the use for this network switch 21 and the external network port module 22.

Кроме того, введение оперативных памятей 201, …, 20N для буферизации данных, результатов и хранения промежуточных результатов и выполняемых программ обеспечивает возможность использовать в предлагаемом модуле вычислительных СБИС с программной реализацией трудоемких фрагментов вычислительных алгоритмов, что обеспечивает расширение классов решаемых вычислительно сложных задач по сравнению с прототипом.In addition, the introduction of operational memory 20 1 , ..., 20 N for buffering data, results and storing intermediate results and running programs provides the ability to use in the proposed module computational VLSI with software implementation of laborious fragments of computational algorithms, which provides an extension of the classes of computationally complex tasks to be solved compared to the prototype.

Вышеизложенные сведения позволяют сделать вывод, что предлагаемый вычислительный модуль соответствует заявляемому техническому результату -увеличение вычислительной мощности при решении вычислительно сложных задач, требующих высокой интенсивности обмена информацией вычислительных ПЛИС по внешнему порту PCI-Express и расширение классов решаемых вычислительно сложных задач.The above information allows us to conclude that the proposed computational module corresponds to the claimed technical result — an increase in computational power in solving computationally complex problems requiring high intensity of FPGA computing information exchange through an external PCI-Express port and the expansion of classes of computationally complex tasks to be solved.

Claims (1)

Вычислительный модуль, содержащий коммутатор PCI-Express 1, интерфейсную ПЛИС 2, группу из N вычислительных ПЛИС 31, …, 3N, внешний порт PCI-Express 4, группу из N вычислительных СБИС 51, …, 5N, внешний порт контроля и управления модуля JTAG 6, блок 7 оперативного конфигурирования интерфейсной ПЛИС 2, память 8 конфигурации интерфейсной ПЛИС 2, блок 9 оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС 31, …, 3N, группу из N памятей стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 3N, группу из N блоков индивидуального контроля и управления питанием 111, …, 11N вычислительных СБИС 51, …, 5N, блок мониторинга модуля 17, группу из N блоков индивидуальной настройки рабочих частот 121, …, 12N вычислительных СБИС 51, …, 5N, группу из N индивидуальных блоков мониторинга 131, …, 13N, причем порты коммутатора PCI-Express 1 соединены соответствующими высокоскоростными последовательными интерфейсами PCI-Express с внешним портом модуля 4, интерфейсом 23 с интерфейсной ПЛИС 2 и группой из N интерфейсов 251, …, 25N с N вычислительными ПЛИС 31, …, 3N, каждая из которых соединена индивидуальными двунаправленными информационными шинами 321, …, 32N с соответствующими вычислительными СБИС 51, …, 5N, интерфейсная ПЛИС 2 соединена соответствующими шинами с блоком 7 оперативного конфигурирования интерфейсной ПЛИС 2, с блоком 9 оперативного реконфигурирования памятей стартовых конфигураций 101, …, 10N и с блоком мониторинга модуля 17, а также соединена двунаправленной общей шиной конфигурирования 24 с N вычислительными ПЛИС 31, …, 3N и общей шиной 34 с N блоками индивидуальной настройки рабочих частот 121, …, 12N, кроме того, блок 7 оперативного конфигурирования интерфейсной ПЛИС 2 соединен с памятью 8 конфигурации интерфейсной ПЛИС 2 и с внешним портом контроля и управления модуля JTAG 6, блок оперативного реконфигурирования памятей 9 соединен общей шиной 26 с N памятями стартовых конфигураций 101, …, 10N вычислительных ПЛИС 31, …, 3N, при этом N вычислительных ПЛИС 31, …, 3N соединены с соответствующими одноименными N памятями стартовых конфигураций 101, …, 10N группой из N индивидуальных шин реконфигурации 281, …, 28N и группой из N индивидуальных шин оперативной реконфигурации 271, …, 27N, а также группой из N индивидуальных шин 291, …, 29N контроля и управления питанием вычислительных СБИС 51, …, 5N соединены с группой из N блоков индивидуального контроля и управления питанием 111, …, 11N, кроме того, N блоков индивидуальной настройки рабочих частот 121, …, 12N соединены соответствующими шинами с одноименными СБИС группы из N вычислительных СБИС 51, …, 5N и группой из N индивидуальных шин настройки рабочих частот 311, …, 31N с соответствующими вычислительными ПЛИС 31, …, 3N, блок мониторинга модуля 17 соединен общей шиной 35 с N индивидуальными блоками мониторинга 131, …, 13N, каждый из которых соединен с соответствующими одноименными вычислительными ПЛИС 31, …, 3N индивидуальными шинами мониторинга 331, …, 33N, отличающийся тем, что в него дополнительно введены сетевой коммутатор Ethernet 21, группа из N оперативных памятей 201, …, 20N, блок контроля и управления питанием модуля 14, блок сопряжения модуля с системой контроля и управления питанием 15, блок сопряжения модуля с системой мониторинга 18, внешний сетевой порт модуля 22, внешний порт мониторинга модуля 19, внешний порт контроля и управления питанием модуля 16, причем группа из N оперативных памятей 201, …, 20N соединена соответствующими шинами с одноименными вычислительными СБИС 51, …, 5N, которые соединены соответствующими сетевыми интерфейсами 361, …, 36N с сетевым коммутатором Ethernet 21, который также соединен с внешним сетевым портом модуля 22, кроме того, блок контроля и управления питанием модуля 14 соединен с интерфейсной ПЛИС 2, а также общей шиной 30 соединен с N блоками индивидуального контроля и управления питанием 111, …, 11N вычислительных СБИС 51, …, 5N и соединен с блоком сопряжения модуля с системой контроля и управления питанием 15, который соединен с внешним портом контроля и управления питанием модуля 16, блок мониторинга модуля 17 соединен с блоком сопряжения модуля с системой мониторинга 18, который подключен к внешнему порту мониторинга модуля 19.Computing module containing a PCI-Express 1 switchboard, interface FPGA 2, a group of N computational FPGAs 3 1 , ..., 3 N , an external port of PCI-Express 4, a group of N computational VLSI 5 1 , ..., 5 N , external port of control and control of the JTAG 6 module, block 7 operational configuration of the interface FPGA 2, memory 8 configuration of the interface FPGA 2, block 9 operational reconfiguration of the memory of the starting configurations of the computing FPGA 3 1 , ..., 3 N , a group of N memories of the starting configurations 10 1 , ..., 10 N FPGA computational 3 1, ..., 3 N, a group of N blocks to individual ntrolya and power control 11 1, ..., 11 N computing VLSI 5 1, ..., 5 N, the monitoring unit module 17, a group of N blocks customization of operating frequencies 12 1, ..., 12 N computing VLSI 5 1, ..., 5 N , a group of N individual monitoring units 13 1 , ..., 13 N , and the ports of the PCI-Express switch 1 are connected by the corresponding high-speed PCI-Express serial interfaces to the external port of module 4, by the interface 23 to the interface FPGA 2 and by a group of N interfaces 25 1 , ..., 25 N with N computational FPGA 3 1 , ..., 3 N , each of which is connected by an individual and bidirectional information buses 32 1 , ..., 32 N with the corresponding computational VLSI 5 1 , ..., 5 N , interface FPGA 2 are connected by corresponding buses to the operational configuration block 7 of the interface FPGA 2, to the operational configuration reconfiguration block 9 of the starting configuration memory 10 1 , ... , 10 N and with the monitoring module of module 17, as well as connected by a bidirectional common configuration bus 24 with N FPGA computing 3 1 , ..., 3 N and a common bus 34 with N individual tuning frequency blocks 12 1 , ..., 12 N , in addition , block 7 operational configuring the interface FPGA 2 is connected to the memory 8 configuration interface FPGA 2 and an external port control and JTAG 6 module control unit operative rearranging memories 9 is connected to the common bus 26 with N memories starting configurations 10 1, ..., 10 N computing FPGA January 3, ... , 3 N , with N computational FPGAs 3 1 , ..., 3 N connected to the corresponding memory of the same name N starting configurations 10 1 , ..., 10 N group of N individual reconfiguration tires 28 1 , ..., 28 N and a group of N individual tires operational reconfiguration 27 1, ..., 27 N, as a group of N individual buses 29 1, ..., 29 N of control and power management of computing VLSI 5 1, ..., 5 N are connected to a group of N individual control and power management units 11 1, ..., 11 N, furthermore, N blocks individual settings of working frequencies 12 1 , ..., 12 N are connected by corresponding buses to the same VLSI groups of N computational VLSI 5 1 , ..., 5 N and a group of N individual bus settings of working frequencies 31 1 , ..., 31 N with corresponding computational FPGAs 3 1, ..., N 3, monitoring block module 17 is connected to the common bus 35 with N Individuals nymi units monitor 13 1, ..., 13 N, each of which is connected to the same corresponding computing FPGA 3 1, ..., 3 N individual tire monitor 33 1, ..., 33 N, characterized in that it additionally introduced Ethernet network switch 21 , group of N operative memories 20 1 , ..., 20 N , module 14 monitoring and power control unit, module interfacing unit with power monitoring and control system 15, module interfacing unit with monitoring system 18, external network port of module 22, external monitoring port module 19, external control port and power management module 16, with a group of N operational memories 20 1 , ..., 20 N connected to the corresponding buses with the same computing VLSI 5 1 , ..., 5 N , which are connected by the corresponding network interfaces 36 1 , ..., 36 N with an Ethernet switch 21, which is also connected to the external network port of the module 22, in addition, the power control and management unit of the module 14 is connected to the FPGA 2 interface, and the common bus 30 is connected to the N individual power control and management units 11 1 , ..., 11 N VLSI 5 1 , ..., 5 N and connected The module 17 is connected to the module interface to the monitoring system 18, which is connected to the external monitoring port of module 19.
RU2018127532A 2018-07-26 2018-07-26 Computing module RU2686004C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2018127532A RU2686004C1 (en) 2018-07-26 2018-07-26 Computing module

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018127532A RU2686004C1 (en) 2018-07-26 2018-07-26 Computing module

Publications (1)

Publication Number Publication Date
RU2686004C1 true RU2686004C1 (en) 2019-04-23

Family

ID=66314628

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018127532A RU2686004C1 (en) 2018-07-26 2018-07-26 Computing module

Country Status (1)

Country Link
RU (1) RU2686004C1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2720556C1 (en) * 2019-12-06 2020-05-12 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Autonomous computing module
RU2748299C1 (en) * 2020-10-02 2021-05-21 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Autonomous computing module with submodules
RU2780169C1 (en) * 2021-11-29 2022-09-20 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Computing module for multitasking computing systems

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282627B1 (en) * 1998-06-29 2001-08-28 Chameleon Systems, Inc. Integrated processor and programmable data path chip for reconfigurable computing
US9081501B2 (en) * 2010-01-08 2015-07-14 International Business Machines Corporation Multi-petascale highly efficient parallel supercomputer
RU166961U1 (en) * 2016-07-06 2016-12-20 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" COMPUTER MODULE
RU168565U1 (en) * 2016-11-21 2017-02-08 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" RECONFIGURABLE COMPUTER MODULE
RU174347U1 (en) * 2017-05-18 2017-10-11 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" COMPUTER MODULE
RU2643622C1 (en) * 2017-05-25 2018-02-02 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Computer module

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282627B1 (en) * 1998-06-29 2001-08-28 Chameleon Systems, Inc. Integrated processor and programmable data path chip for reconfigurable computing
US9081501B2 (en) * 2010-01-08 2015-07-14 International Business Machines Corporation Multi-petascale highly efficient parallel supercomputer
RU166961U1 (en) * 2016-07-06 2016-12-20 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" COMPUTER MODULE
RU168565U1 (en) * 2016-11-21 2017-02-08 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" RECONFIGURABLE COMPUTER MODULE
RU174347U1 (en) * 2017-05-18 2017-10-11 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" COMPUTER MODULE
RU2643622C1 (en) * 2017-05-25 2018-02-02 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Computer module

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2720556C1 (en) * 2019-12-06 2020-05-12 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Autonomous computing module
RU2748299C1 (en) * 2020-10-02 2021-05-21 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Autonomous computing module with submodules
RU2780169C1 (en) * 2021-11-29 2022-09-20 Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" Computing module for multitasking computing systems

Similar Documents

Publication Publication Date Title
RU168565U1 (en) RECONFIGURABLE COMPUTER MODULE
US20210200706A1 (en) High Speed, Parallel Configuration of Multiple Field Programmable Gate Arrays
Huebner et al. Real-time LUT-based network topologies for dynamic and partial FPGA self-reconfiguration
US9652252B1 (en) System and method for power based selection of boot images
US20080028186A1 (en) FPGA Co-Processor For Accelerated Computation
CN105279133A (en) VPX parallel DSP signal processing board card based on SoC online reconstruction
RU156778U1 (en) RECONFIGURABLE COMPUTER SYSTEM
US9934175B2 (en) Direct memory access for programmable logic device configuration
JP2000311156A (en) Reconfigurable parallel computer
RU2686004C1 (en) Computing module
US9983889B1 (en) Booting of integrated circuits
CN105103142A (en) Sharing firmware among agents in a computing node
CN110399328B (en) Control method and device for board-mounted graphics processor
RU2720556C1 (en) Autonomous computing module
Nguyen et al. PR-HMPSoC: A versatile partially reconfigurable heterogeneous Multiprocessor System-on-Chip for dynamic FPGA-based embedded systems
Costas et al. Characterization of FPGA-master ARM communication delays in zynq devices
CN103580975A (en) On-line reconfigurable generalized bus data conversion method
CN111581152A (en) Reconfigurable hardware acceleration SOC chip system
US7026840B1 (en) Programmable logic device
RU174347U1 (en) COMPUTER MODULE
RU2677363C1 (en) Reconfigurable computing system
CN104219061B (en) Request the method and device of power consumption state variation
RU144357U1 (en) RECONFIGURABLE COMPUTER MODULE
RU166961U1 (en) COMPUTER MODULE
CN111104696B (en) Multi-path safety element cluster board card