RU220370U1 - Вычислительный модуль NM QUAD в форм-факторе PCIe - Google Patents

Вычислительный модуль NM QUAD в форм-факторе PCIe Download PDF

Info

Publication number
RU220370U1
RU220370U1 RU2023119993U RU2023119993U RU220370U1 RU 220370 U1 RU220370 U1 RU 220370U1 RU 2023119993 U RU2023119993 U RU 2023119993U RU 2023119993 U RU2023119993 U RU 2023119993U RU 220370 U1 RU220370 U1 RU 220370U1
Authority
RU
Russia
Prior art keywords
pcie
chip
boards
k1879vm8ya
computing
Prior art date
Application number
RU2023119993U
Other languages
English (en)
Inventor
Андрей Анатольевич Адамов
Павел Алексеевич Павлов
Магомедвели Сийидгусенович Дадашев
Галина Константиновна Мелодиева
Мария Дмитриевна Стома
Original Assignee
Акционерное общество Научно-технический центр "Модуль"
Filing date
Publication date
Application filed by Акционерное общество Научно-технический центр "Модуль" filed Critical Акционерное общество Научно-технический центр "Модуль"
Application granted granted Critical
Publication of RU220370U1 publication Critical patent/RU220370U1/ru

Links

Abstract

Полезная модель относится к вычислительной технике, а именно к конструкциям на базе системы на кристалле (СнК) К1879ВМ8Я, которые могут быть использованы в системах обработки данных и серверных решениях, где требуется аппаратное ускорение вычислений, основанных на нейросетевых алгоритмах и классических алгоритмах цифровой обработки сигналов и изображений.
Технический результат заключается в возможности построения на одной системной плате компьютера или сервера, путем использования модулей на базе СнК К1879ВМ8Я, более производительной вычислительной системы.
Технический результат достигается тем, что вычислительный модуль в форм-факторе PCIe выполнен в продольном корпусе и содержит радиатор с установленными на его торцевой стороне вентиляторами, две связанные между собой посредством высокоскоростных соединителей многослойные печатные платы, расположенные с двух сторон радиатора напротив друг друга, установленные на платах и соединенные друг с другом высокоскоростными интерфейсами и интерфейсом PCIe четыре системы на кристалле К1879ВМ8Я, каждая из которых снабжена подсистемой оперативной памяти DDR3L и микросхемой ПЗУ, микросхему маршрутизатора PCIe, установленную на одной из плат и посредством интерфейса PCIe связанную с соединителем PCIe, и разъемы для подключения к другим вычислительным модулям, связанные высокоскоростными интерфейсами с системами на кристалле. 2 з.п. ф-лы, 5 ил.

Description

Полезная модель относится к вычислительной технике, а именно к конструкциям на базе системы на кристалле (СнК) К1879ВМ8Я, которые могут быть использованы в системах обработки данных и серверных решениях, где требуется аппаратное ускорение вычислений, основанных на нейросетевых алгоритмах и классических алгоритмах цифровой обработки сигналов и изображений. Более конкретно, полезная модель представляет собой вычислительное устройство в форм-факторе PCIe Dual-Slot Add-in Card, именуемое как NM QUAD.
Из уровня техники известен вычислительный модуль в форм-факторе PCIe (RU 2778213 C1, опубл. 15.08.2022), выбранный в качестве прототипа и содержащий многослойную печатную плату, радиатор, один вентилятор, причем на плате установлена многоядерная СнК К1879ВМ8Я, содержащая DSP-ядра и процессорные ядра общего назначения ARM Cortex-A5 и являющаяся по отношению к центральному процессору вычислительного узла, в котором установлен данный модуль, сопроцессором. Также на плате установлены подсистема оперативной памяти DDR3L общим объемом 5 ГБ, микросхема ПЗУ (постоянное запоминающее устройство) и подсистема питания и тактирования. Модуль дополнительно имеет разъем, связанный высокоскоростными интерфейсами с СнК, для подключения к другим аналогичным вычислительным модулям.
Недостатками прототипа являются относительно невысокая вычислительная мощность на один разъем расширения шины PCIe системной платы и ограниченная возможность масштабирования вычислительного узла - компьютера или сервера, в следствие того, что данное изделие при включении в состав вычислительного узла занимает один слот расширения PCIe, а их количество ограничено и, как правило, не превышает семи слотов.
Техническая проблема, на решение которой направлена настоящая полезная модель, состоит в удовлетворении существующей потребности в вычислительном модуле на базе СнК К1879ВМ8Я, который будет лишен недостатков прототипа.
Технический результат заключается в возможности построения на одной системной плате компьютера или сервера путем использования модулей на базе СнК К1879ВМ8Я более производительной вычислительной системы.
Указанная проблема решается, а технический результат достигается тем, что вычислительный модуль в форм-факторе PCIe выполнен в продольном корпусе и содержит радиатор с установленными на его торцевой стороне вентиляторами, две связанные между собой посредством высокоскоростных соединителей многослойные печатные платы, расположенные с двух сторон радиатора напротив друг друга, установленные на платах и соединенные друг с другом высокоскоростными интерфейсами и интерфейсом PCIe четыре системы на кристалле К1879ВМ8Я, каждая из которых снабжена подсистемой оперативной памяти DDR3L и микросхемой ПЗУ, микросхему маршрутизатора PCIe, установленную на одной из плат и посредством интерфейса PCIe связанную с соединителем PCIe, и разъемы для подключения к другим вычислительным модулям, связанные высокоскоростными интерфейсами с системами на кристалле.
Как правило, системы на кристалле вместе с подсистемами оперативной памяти на платах размещены зеркально симметрично относительно радиатора.
При этом общий объем оперативной памяти DDR3L модуля составляет 20 ГБ.
Заявленная конфигурация вычислительного модуля в форм-факторе PCIe позволяет компактно и эффективно с точки зрения охлаждения разместить четыре СнК К1879ВМ8Я, каждая из которых снабжена подсистемой оперативной памяти DDR3L и микросхемой ПЗУ. При этом каждая СнК благодаря применению микросхемы маршрутизатора PCIe является по отношению к центральному процессору компьютера или сервера, в котором установлен данный модуль, сопроцессором. Следовательно, удается повысить вычислительную мощность компьютера или сервера на один разъем PCIe за счет одновременного использования четырех сопроцессоров при параллельной или каскадной обработке данных, поступающих от центрального процессора. А соединение вычислительных модулей через соответствующие разъемы позволяет увеличить пропускную способность обмена данными между СнК, входящими в состав используемых модулей, в обход зачастую загруженной шины PCIe системной платы.
Таким образом, все описанные элементы модуля позволяют построить на одной системной плате компьютера или сервера путем использования модулей на базе СнК К1879ВМ8Я более производительную вычислительную систему.
Полезная модель поясняется с помощью фиг.1-4.
На фиг.1 представлена блок-схема вычислительного модуля в форм-факторе PCIe.
На фиг.2 показано размещение печатных плат на радиаторе.
На фиг.3а показан пример выполнения полезной модели в продольном корпусе с видом на его боковую поверхность с разъемами для подключения к другим модулям и торцевую поверхность с вентиляторами.
На фиг.3б показан пример выполнения полезной модели в продольном корпусе с видом на его вторую торцевую поверхность и на соединитель PCIe, расположенный на второй боковой поверхности.
На фиг.4 изображена конструкция вычислительного модуля в разборе по одному из вариантов осуществления.
Вычислительный модуль выполнен в форм-факторе PCIe Dual-Slot Add-in Card в продольном корпусе 10, который состоит из нескольких соединенных корпусных элементов (фиг.1, 3а, 3б, 4). Внутри корпуса 10 располагается продольный радиатор 20 и две связанные между собой многослойные печатные платы 1, 2, расположенные с двух наибольших по площади сторон радиатора напротив друг друга (фиг.2). К торцевой стороне радиатора 20 крепятся вентиляторы 30, как правило в количестве трех штук (фиг.3а, 4). Однако их число может меняться, специалисту очевиден принцип подбора количества вентиляторов.
На платах 1-2 установлены четыре связанные друг с другом и известные из уровня техники СнК К1879ВМ8Я, причем на плате 1 установлены две СнК 1.1 и 1.2, а на плате 2 - СнК 2.1 и 2.2 соответственно (фиг.1). Все СнК 1.1-1.2 и 2.1-2.2 соединены друг с другом высокоскоростными интерфейсами (синие тонкие стрелки на фиг.1), имеющими по 4 линии с физическим уровнем, эквивалентным физическому уровню шины PCIe Gen2, а также связаны интерфейсом PCIe с использованием маршрутизатора PCIe (желтые более широкие стрелки, идущие от/к элементу 4 на фиг.1). Указанное очевидным образом способствует повышению производительности вычислительной системы по сравнению с прототипом за счет возможности использования большего числа СнК К1879ВМ8Я на одной системной плате компьютера или сервера.
Как упоминалось ранее, СнК 1.1 и 1.2, 2.1 и 2.2 внутри вычислительного модуля, установленного в системную плату компьютера или сервера, являются сопроцессорами по отношению к центральному процессору компьютера или сервера. Каждый из четырех сопроцессоров 1.1 и 1.2, 2.1 и 2.2 снабжен подсистемой оперативной памяти DDR3L 1.11 и 1.21, 2.11 и 2.21 соответственно, имеющей по 5 банков памяти объемом по 1 ГБ каждый, таким образом, общий объем оперативной памяти модуля составляет 20 ГБ. Также каждый из сопроцессоров 1.1 и 1.2, 2.1 и 2.2 снабжен микросхемой ПЗУ 1.12 и 1.22, 2.12 и 2.22 соответственно (фиг.1).
Помимо указанных компонентов платы 1-2 содержат подсистемы тактирования 5.1-5.2, питания 6, прочие необходимые электронные компоненты 7 и коммутационные элементы (фиг.1), очевидные специалисту в данной области техники.
СнК К1879ВМ8Я вместе с подсистемами оперативной памяти на печатных платах 1-2 располагаются зеркально симметрично относительно радиатора 20, что позволяет наиболее компактно сформировать изделие и организовать эффективное охлаждение. Между собой платы 1-2 соединяются высокоскоростными соединителями 3, например, соединители фирмы Hirose серии FX18. Одна из плат дополнительно имеет в своем составе микросхему маршрутизатора PCIe (поз. 4 фиг.1), связанную с физическим соединителем PCIe x16 (поз. 40 фиг.3б) посредством интерфейса PCIe (желтые более широкие стрелки, идущие от/к элементу 4 на фиг.1). Также установлен разъем дополнительного питания PCIe 6-pin (поз. 41 фиг.3а).
На боковой стороне вычислительного модуля, противоположной боковой стороне с интерфейсом PCIe, расположены два краевых разъема 8.1, 8.2 от плат 1, 2 соответственно (фиг.2-3 и синие тонкие стрелки «к соединителю Elink» на фиг.1) для подключения к другим вычислительным модулям. Данные разъемы 8.1, 8.2 связаны высокоскоростными интерфейсами с каждой СнК 1.1-1.2 и 2.1-2.2 (синие тонкие стрелки на фиг.1) для возможности коммутации нескольких однотипных вычислительных модулей гибкими шлейфами наподобие мостов для технологии Nvidia SLI или AMD Crossfire, что позволит дополнительно повысить вычислительную мощность компьютера или сервера в том числе за счет быстрой перекоммутации и, как следствие, обеспечения возможности гибкого построения многопроцессорного вычислительного кластера.
Ниже описан пример работы полезной модели.
Модуль устанавливается в корпус системного блока компьютера и подключается к одному из разъемов шины PCIe системной платы посредством соединителя PCIe 40 (фиг.3б). При включении компьютера и подаче на модуль питания каждая СнК К1879ВМ8Я 1.1, 1.2, 2.1, 2.2 (фиг.1) считывает из соответствующей микросхемы ПЗУ 1.12, 1.22, 2.12, 2.22 код начальной инициализации, который конфигурирует внутренние управляющие регистры СнК. Центральному процессору после загрузки операционной системы благодаря применению микросхемы маршрутизатора PCIe 4 становятся доступны в качестве сопроцессора четыре СнК К1879ВМ8Я. Программное обеспечение позволяет выполнять инференс сверточной нейронной сети на аппаратуре модуля, загружая в его подсистему оперативной памяти 1.11, 1.21, 2.11, 2.21 модель соответствующей нейронной сети. От центрального процессора в память сопроцессоров по шине PCIe поступают данные для обработки, например, изображение. Поступающие данные обрабатываются на каждом доступном центральному процессору сопроцессоре. При этом на каждой СнК может быть загружено до четырех различных моделей нейронных сетей в зависимости от конкретной прикладной задачи. Обработанные данные возвращаются центральному процессору по шине PCIe. В случае применения четырех СнК для последовательной обработки данных, результаты обработки, полученные в первой СнК, передаются по высокоскоростному интерфейсу (синие тонкие стрелки на фиг.1) во вторую СнК, и так далее, пока не будет реализован весь конвейер обработки, после чего обработанные данные будут возвращены в центральный процессор по шине PCIe.
Для проверки достижения технического результата заявленная полезная модель использована при изготовлении вычислительного модуля под наименованием NM QUAD.
Далее для целей проверки в качестве вычислительной системы применялся компьютер с системной платой, на которой присутствует шесть разъемов PCIe для подключения модулей расширения, имеющие физический размер x16. При подключении вычислительных модулей прототипа центральному процессору могут быть доступны максимум шесть сопроцессоров СнК К1879ВМ8Я. А при использовании в составе того же компьютера трех заявленных вычислительных модулей NM QUAD, каждый из которых содержит четыре аналогичные СнК, центральному процессору станут доступны уже двенадцать сопроцессоров. Так, соотношение сопроцессоров для двух рассмотренных случаев может составлять 6 к 12 или 1 к 2, что очевидным образом сказывается на увеличении вычислительной мощности.
Таким образом, использование предложенной полезной модели позволит решить ранее обозначенную техническую проблему и достичь заявленный технический результат.

Claims (3)

1. Вычислительный модуль в форм-факторе PCIe, характеризующийся тем, что выполнен в продольном корпусе и содержит радиатор с установленными на его торцевой стороне вентиляторами, две связанные между собой посредством высокоскоростных соединителей многослойные печатные платы, расположенные с двух сторон радиатора напротив друг друга, установленные на платах и соединённые друг с другом высокоскоростными интерфейсами и интерфейсом PCIe четыре системы на кристалле К1879ВМ8Я, каждая из которых снабжена подсистемой оперативной памяти DDR3L и микросхемой ПЗУ, микросхему маршрутизатора PCIe, установленную на одной из плат и посредством интерфейса PCIe связанную с соединителем PCIe, и разъёмы для подключения к другим вычислительным модулям, связанные высокоскоростными интерфейсами с системами на кристалле.
2. Вычислительный модуль по п.1, характеризующийся тем, что системы на кристалле вместе с подсистемами оперативной памяти на платах размещены зеркально симметрично относительно радиатора.
3. Вычислительный модуль по п.1, характеризующийся тем, что общий объем оперативной памяти DDR3L составляет 20 ГБ.
RU2023119993U 2023-07-28 Вычислительный модуль NM QUAD в форм-факторе PCIe RU220370U1 (ru)

Publications (1)

Publication Number Publication Date
RU220370U1 true RU220370U1 (ru) 2023-09-11

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1549103A (zh) * 2000-11-10 2004-11-24 三洋电机株式会社 微型计算机
RU195051U1 (ru) * 2019-06-11 2020-01-14 Общество с ограниченной ответственностью "Прософт-Системы" Программируемый логический контроллер
RU209220U1 (ru) * 2021-10-06 2022-02-07 Акционерное общество «НАУЧНО-ПРОИЗВОДСТВЕННАЯ КОМПАНИЯ «АТРОНИК» (АО «НПК «АТРОНИК») Модуль центрального процессора
RU209555U1 (ru) * 2021-10-25 2022-03-17 Акционерное общество «НАУЧНО-ПРОИЗВОДСТВЕННАЯ КОМПАНИЯ «АТРОНИК» (АО «НПК «АТРОНИК») Модуль центрального процессора

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1549103A (zh) * 2000-11-10 2004-11-24 三洋电机株式会社 微型计算机
RU195051U1 (ru) * 2019-06-11 2020-01-14 Общество с ограниченной ответственностью "Прософт-Системы" Программируемый логический контроллер
RU209220U1 (ru) * 2021-10-06 2022-02-07 Акционерное общество «НАУЧНО-ПРОИЗВОДСТВЕННАЯ КОМПАНИЯ «АТРОНИК» (АО «НПК «АТРОНИК») Модуль центрального процессора
RU209555U1 (ru) * 2021-10-25 2022-03-17 Акционерное общество «НАУЧНО-ПРОИЗВОДСТВЕННАЯ КОМПАНИЯ «АТРОНИК» (АО «НПК «АТРОНИК») Модуль центрального процессора

Similar Documents

Publication Publication Date Title
JP2710536B2 (ja) コンピュータ・システム
US7152151B2 (en) Signal processing resource for selective series processing of data in transit on communications paths in multi-processor arrangements
JP2552076B2 (ja) コンピュータ・システム
Kandalla et al. High-performance and scalable non-blocking all-to-all with collective offload on InfiniBand clusters: a study with parallel 3D FFT
EP3896574B1 (en) System and method for computing
US6757761B1 (en) Multi-processor architecture for parallel signal and image processing
US10824423B2 (en) Computer system including reconfigurable arithmetic device with network of processor elements
US20130346933A1 (en) Prototype verification system and verification method for high-end fault-tolerant computer
Chen et al. A variable-size FFT hardware accelerator based on matrix transposition
RU220370U1 (ru) Вычислительный модуль NM QUAD в форм-факторе PCIe
CN111124995A (zh) 通过人工智能处理器处理一维复数数组的方法和设备
Sun et al. Multi-node acceleration for large-scale GCNs
US11461234B2 (en) Coherent node controller
CN111078286B (zh) 数据通信方法、计算系统和存储介质
JP2525117B2 (ja) アレイ・プロセッサ
JP2579419B2 (ja) マルチプロセッサ・メモリ・システム
JP2620487B2 (ja) コンピュータ・パッケージ
Willmann et al. Spinach: A Liberty-based simulator for programmable network interface architectures
JP2552075B2 (ja) コンピュータ・システム
JPH0652125A (ja) コンピュータ・システム
EP2015193A2 (en) Computer system with processor expansion device
Abraham Interconnection networks: Dimensions in design
JP2549240B2 (ja) コンピュータ・システム
Vogt et al. IBM BladeCenter QS22: Design, performance, and utilization in hybrid computing systems
JPH01274266A (ja) コンピュータ・システム