RU2475815C1 - ЯЧЕЙКА ОДНОРОДНОЙ ВЫЧИСЛИТЕЛЬНОЙ СРЕДЫ, ОДНОРОДНАЯ ВЫЧИСЛИТЕЛЬНАЯ СРЕДА И УСТРОЙСТВО ДЛЯ КОНВЕЙЕРНЫХ ВЫЧИСЛЕНИЙ СУММЫ м n-РАЗРЯДНЫХ ЧИСЕЛ - Google Patents
ЯЧЕЙКА ОДНОРОДНОЙ ВЫЧИСЛИТЕЛЬНОЙ СРЕДЫ, ОДНОРОДНАЯ ВЫЧИСЛИТЕЛЬНАЯ СРЕДА И УСТРОЙСТВО ДЛЯ КОНВЕЙЕРНЫХ ВЫЧИСЛЕНИЙ СУММЫ м n-РАЗРЯДНЫХ ЧИСЕЛ Download PDFInfo
- Publication number
- RU2475815C1 RU2475815C1 RU2011149511/08A RU2011149511A RU2475815C1 RU 2475815 C1 RU2475815 C1 RU 2475815C1 RU 2011149511/08 A RU2011149511/08 A RU 2011149511/08A RU 2011149511 A RU2011149511 A RU 2011149511A RU 2475815 C1 RU2475815 C1 RU 2475815C1
- Authority
- RU
- Russia
- Prior art keywords
- information
- input
- computing environment
- cell
- inputs
- Prior art date
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
Изобретения относятся к вычислительной технике и могут быть использованы при построении быстродействующих арифметических устройств ЭВМ на базе однородных вычислительных сред. Техническим результатом является повышение быстродействия и надежности. Ячейка однородной вычислительной среды содержит элемент ИСКЛЮЧАЮЩЕЕ ИЛИ, элемент И, два триггера. 3 н.п. ф-лы, 8 ил., 1 табл.
Description
Изобретение относится к вычислительной технике и предназначено для построения однородных вычислительных сред, выполняющих функцию суммирования m n-разрядных операндов путем подсчета единичных бит в разрядных срезах операндов.
Однородной вычислительной средой называется регулярная структура, состоящая из соединенных друг с другом одинаковых ячеек, выполняющая определенную функцию.
Ячейка однородной вычислительной среды - элемент регулярной структуры.
Операнд - данное, которое обрабатывается в однородной вычислительной среде.
Разрядный срез - совокупность бит i-й позиции от m участвующих в операции операндов.
Известно техническое решение ячейки однородной вычислительной среды, авторское свидетельство SU №1513471 A1 от 07.10.1988, которая содержит вход синхронизации 1, первый 2 и второй 3 информационные входы, логические входы 4-6, первый 7 и второй 8 функциональные выходы, триггеры 9, 11, элементы НЕ 10, 13, 19, элементы И 14, 16-18, элементы ИЛИ 12, 15 с соответствующими связями.
Недостатком является относительно низкое быстродействии ячейки, которое составляет 4t, где t - время задержки сигнала одним логическим элементом, в предлагаемом решении время задержки сокращено в четыре раза и подсчет количества единичных бит двоичного вектора производится сразу в двоичном, а не в унитарном коде.
Наиболее близким к заявляемому решению является техническое решение ячейки однородной вычислительной среды, запатентованное в качестве изобретения - патент RU 2284568 C2 от 27.09.2006, которое содержит два информационных и один управляющий входы, два выхода, четыре элемента И, два элемента НЕ, элемент ИЛИ с соответствующими связями. Недостаток состоит в том, что в устройстве не реализован конвейерный принцип обработки информации, что существенно снижает функциональные возможности и быстродействие устройства, а также низкое быстродействие ячейки, которое составляет 3t, где t - время задержки сигнала одним логическим элементом, в предлагаемом решении время задержки сокращено в три раза.
Технический результат заявляемого решения: предлагаемое изобретение направлено на повышение быстродействия ячейки за счет сокращения числа элементов в цепях распространения информационного сигнала и количества связей: первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента И, выход которого подключен к информационному входу первого триггера, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента ИСКЛЮЧАЮЩЕЕ ИЛИ, выход которого подключен к информационному входу второго триггера, информационные выходы первого и второго триггеров являются первым и вторым информационными выходами ячейки.
Описание технического решения ячейки: ячейка однородной вычислительной среды состоит из одного двухвходового элемента И, одного двухвходового элемента ИСКЛЮЧАЮЩЕЕ ИЛИ и двух триггеров, вход синхронизации ячейки соединен с входами синхронизации первого и второго триггеров, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента И, выход которого подключен к информационному входу первого триггера, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента ИСКЛЮЧАЮЩЕЕ ИЛИ, выход которого подключен к информационному входу второго триггера, информационные выходы первого и второго триггеров являются первым и вторым информационными выходами ячейки.
На фиг.1 приведена функциональная схема ячейки однородной структуры, где 1, 2 - информационные входы, 3 - вход синхронизации, 4, 5 - информационные выходы, 6 - элемент И, 7 - элемент ИСКЛЮЧАЮЩЕЕ ИЛИ, 8, 9 - триггеры.
Примером построения ячейки может служить ее реализация на программируемых логических интегральных схемах (ПЛИС). Вариант реализации на языке программирования аппаратуры VHDL приведен на фиг.2.
Ячейка однородной структуры реализует следующую систему логических функций:
Q1(t)=a*b
Q2(t)=a⊕b
где а, b - соответственно состояние сигналов на входах 1 и 2 ячейки;
Q1(t), Q2(t) - соответственно состояние сигналов на выходах 4 и 5 ячейки.
Ячейка работает следующим образом:
Таблица | |||
Вход а | Вход b | Q1 (t) | Q2(t) |
0 | 0 | 0 | 0 |
0 | 1 | 0 | 1 |
1 | 0 | 0 | 1 |
1 | 1 | 1 | 0 |
Второе заявляемое техническое решение - однородная вычислительная среда.
Известно техническое решение параллельного счетчика единичных сигналов, запатентованное в качестве изобретения - патент RU №2260204 C1, устройство содержит семнадцать элементов «исключающее ИЛИ» и тринадцать элементов «И», первый и второй входы r-го элемента «исключающее ИЛИ» соединены соответственно с первым и вторым входами r-го элемента «И», подключенного первым входом к (r+1)-му входу параллельного счетчика единичных сигналов, первые выход и вход которого соединены соответственно с выходом седьмого элемента «исключающее ИЛИ» и вторым входом первого элемента «И», подключенного выходом к второму входу восьмого элемента «исключающее ИЛИ», выходы первого-пятого и шестого элементов «исключающее ИЛИ» соединены соответственно с вторыми входами второго-шестого и седьмого элементов «И», подключенных выходами соответственно к первым входам восьмого-двенадцатого и тринадцатого элементов «исключающее ИЛИ», выходы которых соединены соответственно с вторыми входами девятого-тринадцатого элементов «И» и вторым выходом параллельного счетчика единичных сигналов, первый и второй входы r-го элемента «исключающее ИЛИ» соединены соответственно с первым и вторым входами r-го элемента «И», а выходы десятого-двенадцатого и тринадцатого элементов «И» подключены соответственно к первым входам четырнадцатого - шестнадцатого и семнадцатого элементов «исключающее ИЛИ», подсоединенных выходами соответственно к вторым входам пятнадцатого-семнадцатого элементов «исключающее ИЛИ» и третьему выходу параллельного счетчика единичных сигналов. Недостаток состоит в том, что в устройстве не реализован конвейерный принцип обработки информации, что существенно снижает быстродействие устройства.
Наиболее близкое к заявляемому решению является техническое решение однородной вычислительной среды, запатентованное в качестве изобретения - патент RU 2284568 C2. Устройство содержит: ячейки однородной вычислительной среды 1,1-1,m, 2,1-2,m,…,n,1-n, m, информационные входы а0-аn, b0-bm, информационные выходы ро-рn, с0-cm, управляющий вход М, соединенный с управляющими входами m, каждой ячейки однородной вычислительной среды. Недостаток состоит в том, что в устройстве не реализован конвейерный принцип обработки информации, что существенно снижает быстродействие устройства, а также состоит в значительных аппаратурных затратах.
Технический результат заявляемого решения: предлагаемое изобретение направлено на повышение надежности однородной вычислительной среды за счет сокращения числа связей между ячейками однородной вычислительной среды: второй информационный вход ячеек первого столбца однородной вычислительной среды соединен с соответствующими разрядами m-разрядного двоичного вектора, первый информационный вход ячеек первой строки однородной вычислительной среды соединен со значением логического нуля, первый информационный выход каждой (i,j)-й ячейки подключен к второму информационном входу (i,j+1)-й ячейки, второй информационный выход каждой (i,j)-й ячейки подключен к первому информационному входу (i+1,j)-й ячейки.
Описание технического решения однородной вычислительной среды: однородная вычислительная среда из ячеек рассмотренного типа обеспечивает подсчет единичных бит в двоичных векторах. Количество строк однородной вычислительной среды равно m, количество столбцов однородной вычислительной среды равно p, где p=]log2m[,] [ - округление до большего целого. На второй информационный вход ячеек первого столбца однородной вычислительной среды подаются соответствующие разряды m-разрядного вектора, первый информационный вход ячеек первой строки однородной вычислительной среды соединен со значением логического нуля, первый информационный выход каждой (i,j)-й ячейки подключен к второму информационном входу (i,j+1)-й ячейки, второй информационный выход каждой (i,j)-й ячейки подключен к первому информационному входу (i+1,j)-й ячейки, второй информационный выход ячеек последней строки однородной вычислительной среды является выходом схемы.
Описание работы устройства: на каждом такте на входы синхронизации триггеров подается сигнал синхронизации. На второй вход ячеек первого столбца подаются соответствующие разряды информационного вектора, причем каждый следующий бит подается на следующий такт работы устройства. Затем вектор передается в соседний справа столбец и соседнюю снизу строку в преобразованном виде. Значение i-го разряда в j-м столбце определяется значением (i-1)-го разряда вектора в j-м столбце, а также значением i-м разрядом вектора в (j-i)-м столбце.
В результате через m тактов работы устройства будет сформирован младший бит результата подсчета единиц входного вектора, после чего конвейер является заполненным и биты результата доступны в каждый последующий такт работы устройства. Второй информационный выход ячеек последней строки однородной вычислительной среды является выходом схемы, с которого снимается результат. Так как на каждом такте работы устройства вектор передается в соседние справа и снизу ячейки матрицы, на вход устройства на каждом такте может быть подан следующий вектор. Таким образом, устройство реализует конвейерный принцип обработки информации.
Так как в ячейке обе цепочки распространения сигнала имеют по одному логическому элементу, время задержки распространения сигнала в составляет t, где t - время задержки сигнала одним логическим элементом, что меньше в три раза по сравнению с исходным вариантом, запатентованным в качестве изобретения - патент RU 2284568 С2, равным 3t.
Примером построения однородной вычислительной среды может служить ее программирование на ПЛИС.
На фиг.3 представлена структурная схема однородной вычислительной среды в общем виде на базе ячейки однородной структуры, предназначенная для подсчета единичных бит m-мерных двоичных векторов, где CELL - ячейки однородной структуры, информационные входы X1-Xm, информационные выходы Y1-Yp.
На фиг.4 изображен пример выполнения операции подсчета единичных бит в двоичном векторе Х=101011 разрядностью m=6, подаваемого на информационные входы X1-Х6 последовательно, начиная с младших, каждый такт работы однородной вычислительной среды, начиная с младшего бита X1 и заканчивая старшим Х6. При этом на фиг.4 показана передача данных с выходов (i,j)-й ячейки на соответствующие входы (i,j+1)-й и (i+1,j) ячейки однородной вычислительной среды. Через шесть тактов работы устройства младший бит результата доступен на выходе Y1=0, на седьмом такте работы устройства доступен бит результата Y2=0, на восьмом такте работы устройства доступен старший бит результата Y3=1.
Третье заявляемое техническое решение - устройство для конвейерных вычислений суммы m n-разрядных чисел.
Известно техническое решение многоуровневой матричной суммирующей структуры вертикальной арифметики В.М.Таранухи, запатентованное в качестве изобретения - патент RU 2246128 С2 от 10.02.2005. Многоуровневевая m-мерная матричная суммирующая структура содержит узлы одноразрядного суммирования первого, второго и третьего уровней, m-мерные матричные структуры одноразрядного суммирования второго, третьего и четвертого уровней, образующих иерархическую многоуровневую суммирующую структуру вертикальной арифметики, представляющую регулярную связанную по вертикали иерархическую логарифмическую структуру с межуровневыми связями, по горизонтали иерархическую матричную структуру, в которой матричные структуры предыдущих уровней, объединенные связями, образуют матричную структуру следующего иерархического уровня многоуровневой m-мерной матричной структуры. Недостаток состоит в значительных аппаратурных затратах и большом количестве связей, что приводит к снижению надежности устройства, а также сложности масштабирования устройства.
Наиболее близкое к заявляемому решению является техническое решение параллельного асинхронного сумматора, запатентованное в качестве изобретения - патент RU 2097826 C1 от 27.11.1997. Устройство содержит: n блоков 61-6n параллельной обработки разрядных срезов, n-1 формирователей 71-7n-1 импульсов, запускающий формирователь 70 импульсов, элемент 8 ИЛИ-НЕ, каждый блок 6 содержит 4 ключа 1-4, имеющих выходы с высокоимпедансным состоянием, и арифметический полусумматор 5. Недостаток состоит в том, что в устройстве не реализован конвейерный принцип обработки информации, что существенно снижает быстродействие устройства.
Техническим результатом от использования устройства для конвейерных вычислений суммы m n-разрядных чисел является повышение быстродействия за счет замены операции сложения операцией подсчета количества единичных бит в разрядных срезах, где младший бит подсчета Y1 является i-м битом результата суммирования, каждый следующий бит Yk, где k∈[2, log2m], является переносом в i+k столбец устройства, который затем также участвует в процессе подсчета единиц в соответствующем столбце. Также появляется возможность простого масштабирования благодаря регулярности структуры.
Описание технического решения устройства для конвейерных вычислений суммы m n-разрядных чисел: устройство обеспечивает сложение m n-разрядных операндов и состоит из блока срезов, однородной вычислительной среды и блока задержки.
Массив исходных n-разрядных слагаемых количеством m помещается в блок срезов, который выполнен на базе информационных триггеров, образующих прямоугольную матрицу, вход синхронизации блока задержки соединен с входами синхронизации всех триггеров, информационный вход блока задержки соединен с соответствующими информационными входами триггеров первого столбца, информационный выход каждого (ij)-го триггера подключен к информационному входу (i,j+1)-го триггера, количество строк блока срезов равно m, количество столбцов блока срезов равно n*p+m-1, где p=]log2m+g-1[, g=]log2m[,] [ - окгругление до большего целого, информационный выход последних в строке триггеров блока задержки является выходом блока задержки.
Однородная вычислительная среда рассмотренного типа имеет размерность m+р-1 строк и р столбцов.
Выход Y2 подключен к Xm+1 входу однородной вычислительной среды. Выходы Y3-Yp подключены к соответствующим входам блока задержки, выполненного на базе информационных триггеров. Вход синхронизации блока задержки соединен с входами синхронизации всех триггеров. Информационные входы блока задержки соединены с соответствующими информационными входами триггеров первого столбца, информационный выход каждого (i,j)-го триггера подключен к информационному входу (i,j+1)-го триггера, количество строк однородной вычислительной среды равно р-2, причем в i-й строке содержится i*p триггеров, информационный выход последних в строке триггеров является выходами блока задержки, который подключен к соответствующим Xm+2-Xm+p-1 входам однородной вычислительной среды. Задержка необходима для того, чтобы распространение переноса в i-й столбец происходило в момент времени, когда идет обработка i-го столбца. Количество тактов задержки для выхода Yk равно t=(k-2)*p, k∈[2,p].
Описание работы устройства: каждое i-e двоичное позиционное слагаемое можно представить в виде последовательности бит Ai(an, an-1, …, a1), где n - разрядность числа, i∈[1, m]. Тогда m слагаемых можно представить в виде матрицы:
i-e слагаемое записывается в i-ю строку блока срезов, при этом оно предварительно сдвинуто на i-1 разрядов влево.
Устройство осуществляет подсчет количества единичных бит в столбце (разрядном срезе) приведенной выше матрицы, в результате чего вычисляется результат суммирования текущего среза Y1, а также переносы Y2-Yp в соответствующие разрядные срезы, следующие за текущим. С выхода Yr, r∈ [2,p] снимается единица переноса в (i+r)-й разрядный срез.
Пример: необходимо сложить четыре (m=4) трехбитных (n=3) операнда: a1=111, а2=101, а3=001, a4=111. Запишем их в виде матрицы с элементами aij:
Первоначально операнды записываются в строки блока срезов размерностью m=4 строк и n*p+m-1=12 столбцов в виде матрицы, где p=]log2(4+3-1)[=3. Так как производится обработка одной суммы, то между каждым из разрядов слагаемых записывается р-1=2 нуля, при этом i-e слагаемое сдвинуто на (i-1) разрядов влево:
Каждый такт информация из блока срезов (крайний правый столбец матрицы) передается на входы однородной вычислительной среды, при этом содержимое блока срезов сдвигается на один разряд вправо. Однородная вычислительная среда имеет размерность m+р-1=6 строк и р=3 столбцов.
Так как в первом разрядном срезе слагаемых четыре единицы, на выходе однородной вычислительной среды, через шесть тактов работы устройства будет сформирован бит результата s1,1=0, на седьмом такте будет сформирован перенос во второй столбец s1,2=0, на восьмом такте будет сформирован перенос в третий столбец s1,3=1, который записывается в блок задержки, размерность которого р-2=1 строка и 1*р=3 столбца. Затем происходит подсчет единиц во втором столбце матрицы с учетом переноса из первого столбца, бит результата s2,1=0, бит переноса в третий столбец s2,2=1, перенос в четвертый столбец s2,3=0. При подсчете единиц в третьем столбце учитываются перенос из первого столбца s1,3=1 (доступен с выхода блока задержки) и перенос из второго столбца s2,2=1. Так как общее количество единиц стало равно пяти, то бит результата s3,1=1, бит переноса в четвертый столбец s3,2=0, перенос в пятый столбец s3,3=1. Так как s2,3=0, то переносы s3,2 и s3,3 станут старшими битами результата суммирования, который равен (s3,3, s3,2, s3,l, s2,1, s1,1)=10100.
Для избегания простоев работы конвейера в сумматоре необходимо вычислять сразу p разных сумм, при этом разрядные срезы должны подаваться на вход сумматора друг за другом в одном и том же порядке. В этом случае быстродействие сумматора линейно зависит от разрядности слагаемых и время вычисления каждой суммы равно n тактам, в то время как время суммирования итерационным способом равно m*n тактов. При вычислении одной суммы время вычисления равно m+2*p-1+p*n тактов.
Примером построения устройства для конвейерных вычислений суммы m n-разрядных чисел может служить ее программирование на программируемых логических интегральных схемах (ПЛИС).
На фиг.5 представлена структурная схема блока задержки в общем виде, предназначенного для формирования задержки выдачи информации на определенное количество тактов. Блок задержки построен на базе информационных триггеров, где Tg - информационные триггеры, 1-3 - информационные входы блока задержки, 4 - вход синхронизации, 5-7 - информационные выходы блока задержки.
На фиг.6 представлена структурная схема блока задержки в общем виде, предназначенного для формирования задержки выдачи информации на определенное количество тактов. Блок задержки построен на базе информационных триггеров, где Tg - информационные триггеры, 1-3 - информационные входы блока задержки, 4 - вход синхронизации, 5-7 - информационные выходы блока задержки.
На фиг.7 представлена структурная схема устройства для конвейерных вычислений суммы m n-разрядных чисел в общем виде, предназначенного для вычисления суммы n-мерных двоичных векторов на базе однородной вычислительной среды, где 1 - блок срезов, 2 - однородная вычислительная среда, 3 - блок задержки, информационные входы схемы Z1-Zm, выход однородной вычислительной среды Y1 является выходом устройства, выход Y2 подключен к информационному входу Хm+1 однородной вычислительной среды, выходы однородной вычислительной среды Y3-Yp подключены к соответствующим входам блока задержки, выходы которого подключены к соответствующим входам Xm+2-Xm+p-1 однородной вычислительной среды.
На фиг.8 изображен пример построения устройства для конвейерных вычислений суммы m=4 n-разрядных чисел на базе однородной вычислительной среды, где 1 - блок срезов, 2 - однородная вычислительная среда, 3 - блок задержки, информационные входы схемы Z1-Z4, выход устройства Y1, выход однородной вычислительной среды Y2 подключен к информационному входу Х5, выход однородной вычислительной среды У3 подключен к входу блока задержки, выход которого подключен к входу Х6 однородной вычислительной среды.
Claims (3)
1. Ячейка однородной вычислительной среды, содержащая первый и второй информационные входы, вход синхронизации, два информационных выхода, двухвходовый элемент И, двухвходовый элемент ИСКЛЮЧАЮЩЕЕ ИЛИ, первый триггер с одним информационным входом и одним входом синхронизации, второй триггер с одним информационным входом и одним входом синхронизации, вход синхронизации ячейки соединен с входами синхронизации первого и второго триггеров, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента И, выход которого подключен к информационному входу первого триггера, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента ИСКЛЮЧАЮЩЕЕ ИЛИ, выход которого подключен к информационному входу второго триггера, информационные выходы первого и второго триггеров являются первым и вторым информационными выходами ячейки.
2. Однородная вычислительная среда, состоящая из ячеек, выполненных из одного двухвходового элемента И, одного двухвходового элемента ИСКЛЮЧАЮЩЕЕ ИЛИ, двух триггеров, вход синхронизации ячейки соединен с входами синхронизации первого и второго триггеров, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента И, выход которого подключен к информационному входу первого триггера, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента ИСКЛЮЧАЮЩЕЕ ИЛИ, выход которого подключен к информационному входу второго триггера, информационные выходы первого и второго триггеров являются первым и вторым информационными выходами ячейки, где вход синхронизации соединен с входами синхронизации всех ячеек, второй информационный вход ячеек первого столбца однородной вычислительной среды соединен с соответствующими разрядами m-разрядного входного вектора, первый информационный вход ячеек первой строки однородной вычислительной среды соединен со значением логического нуля, первый информационный выход каждой (i,j)-й ячейки подключен к второму информационному входу (i,j+l)-й ячейки, второй информационный выход каждой (i,j)-й ячейки подключен к первому информационному входу (i+l,j)-й ячейки, причем количество строк однородной вычислительной среды равно т, количество столбцов однородной вычислительной среды равно р, где p=]log2m[, где ][ - округление до большего целого, второй информационный выход ячеек последней строки однородной вычислительной среды является выходом схемы, с которого снимается результат.
3. Устройство для конвейерных вычислений суммы m n-разрядных чисел, состоящее из блока срезов, который выполнен на базе триггеров с одним информационным входом и одним входом синхронизации, образующих прямоугольную матрицу, где вход синхронизации блока срезов соединен с входами синхронизации всех триггеров, информационный вход блока срезов соединен с соответствующими информационными входами триггеров первого столбца, выход каждого (i,j)-го триггера подключен к информационному входу (i,j+1)-го триггера, количество строк блока срезов равно m, количество столбцов блока срезов равно n·p+m, где p=]log2(m+g-1)[, g=]log2m[, ][ - округление до большего целого, информационный выход последних в строке триггеров блока задержки является выходом блока задержки, при этом i-e слагаемое записывается в i-ю строку блока срезов и при этом оно предварительно сдвинуто на i-1 разрядов влево, а в остальные разряды записываются нули, между каждым из разрядов слагаемого записывается р-1 нулей, выходы блока срезов соединены соответственно с 1 по m информационными входами однородной вычислительной среды, состоящей из ячеек, выполненных из одного двухвходового элемента И, одного двухвходового элемента ИСКЛЮЧАЮЩЕЕ ИЛИ и двух триггеров, вход синхронизации ячейки соединен с входами синхронизации первого и второго триггеров, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента И, выход которого подключен к информационному входу первого триггера, первый и второй информационные входы ячейки подключены соответственно к первому и второму входам элемента ИСКЛЮЧАЮЩЕЕ ИЛИ, выход которого подключен к информационному входу второго триггера, информационные выходы первого и второго триггеров являются первым и вторым информационными выходами ячейки, где второй информационный вход ячеек первого столбца однородной вычислительной среды соединен с соответствующими разрядами m-разрядного входного вектора, первый информационный вход ячеек первой строки однородной вычислительной среды соединен со значением логического нуля, первый информационный выход каждой (i,j)-й ячейки подключен к второму информационному входу (i,j+1)-й ячейки, второй информационный выход каждой (i,j)-й ячейки подключен к первому информационному входу (i+l,j)-й ячейки, причем количество строк однородной вычислительной среды равно m+р-1, количество столбцов однородной вычислительной среды равно p, где p=]log2(m+g-1)[, g=]log2m[, ][ - округление до большего целого, второй информационный выход ячеек последней строки однородной вычислительной среды является выходом однородной вычислительной среды, первый выход однородной вычислительной среды является выходом устройства для конвейерных вычислений суммы m n-разрядных чисел, второй выход однородной вычислительной среды соединен с (m+1)-м информационным входом однородной вычислительной среды, остальные выходы которой подключены к соответствующим входам блока задержки, где блок задержки выполнен на базе информационных триггеров, вход синхронизации блока задержки соединен с входами синхронизации всех триггеров, информационный вход блока задержки соединен с соответствующими информационными входами триггеров первого столбца, информационный выход каждого (i,j)-го триггера подключен к информационном входу (i,j+1)-о триггера, количество строк блока задержки равно p-2, причем в i-й строке содержится i·p триггеров, информационный выход последних в строке триггеров блока задержки является выходом блока задержки, выходы блока задержки соединены с m+2 по m+p-1 информационными входами однородной вычислительной среды соответственно, вход синхронизации устройства соединен с входом синхронизации блока срезов, входом синхронизации однородной вычислительной среды и входом синхронизации блока задержки.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2011149511/08A RU2475815C1 (ru) | 2011-12-05 | 2011-12-05 | ЯЧЕЙКА ОДНОРОДНОЙ ВЫЧИСЛИТЕЛЬНОЙ СРЕДЫ, ОДНОРОДНАЯ ВЫЧИСЛИТЕЛЬНАЯ СРЕДА И УСТРОЙСТВО ДЛЯ КОНВЕЙЕРНЫХ ВЫЧИСЛЕНИЙ СУММЫ м n-РАЗРЯДНЫХ ЧИСЕЛ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2011149511/08A RU2475815C1 (ru) | 2011-12-05 | 2011-12-05 | ЯЧЕЙКА ОДНОРОДНОЙ ВЫЧИСЛИТЕЛЬНОЙ СРЕДЫ, ОДНОРОДНАЯ ВЫЧИСЛИТЕЛЬНАЯ СРЕДА И УСТРОЙСТВО ДЛЯ КОНВЕЙЕРНЫХ ВЫЧИСЛЕНИЙ СУММЫ м n-РАЗРЯДНЫХ ЧИСЕЛ |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2475815C1 true RU2475815C1 (ru) | 2013-02-20 |
Family
ID=49121120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011149511/08A RU2475815C1 (ru) | 2011-12-05 | 2011-12-05 | ЯЧЕЙКА ОДНОРОДНОЙ ВЫЧИСЛИТЕЛЬНОЙ СРЕДЫ, ОДНОРОДНАЯ ВЫЧИСЛИТЕЛЬНАЯ СРЕДА И УСТРОЙСТВО ДЛЯ КОНВЕЙЕРНЫХ ВЫЧИСЛЕНИЙ СУММЫ м n-РАЗРЯДНЫХ ЧИСЕЛ |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2475815C1 (ru) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5339447A (en) * | 1989-11-17 | 1994-08-16 | Texas Instruments Incorporated | Ones counting circuit, utilizing a matrix of interconnected half-adders, for counting the number of ones in a binary string of image data |
RU2097826C1 (ru) * | 1994-03-22 | 1997-11-27 | Курский государственный технический университет | Параллельный асинхронный сумматор |
RU2246128C2 (ru) * | 2003-01-22 | 2005-02-10 | Таганрогский государственный радиотехнический университет | Многоуровневая m-мерная матричная суммирующая структура вертикальной арифметики в.м. таранухи |
US6904114B2 (en) * | 2003-04-25 | 2005-06-07 | J. Barry Shackleford | Ones counter employing two dimensional cellular array |
RU2284568C2 (ru) * | 2004-12-14 | 2006-09-27 | Пензенский государственный университет | Ячейка однородной вычислительной среды |
-
2011
- 2011-12-05 RU RU2011149511/08A patent/RU2475815C1/ru active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5339447A (en) * | 1989-11-17 | 1994-08-16 | Texas Instruments Incorporated | Ones counting circuit, utilizing a matrix of interconnected half-adders, for counting the number of ones in a binary string of image data |
RU2097826C1 (ru) * | 1994-03-22 | 1997-11-27 | Курский государственный технический университет | Параллельный асинхронный сумматор |
RU2246128C2 (ru) * | 2003-01-22 | 2005-02-10 | Таганрогский государственный радиотехнический университет | Многоуровневая m-мерная матричная суммирующая структура вертикальной арифметики в.м. таранухи |
US6904114B2 (en) * | 2003-04-25 | 2005-06-07 | J. Barry Shackleford | Ones counter employing two dimensional cellular array |
RU2284568C2 (ru) * | 2004-12-14 | 2006-09-27 | Пензенский государственный университет | Ячейка однородной вычислительной среды |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Piestrak | Design of residue generators and multioperand modular adders using carry-save adders | |
Lee et al. | Subquadratic Space-Complexity Digit-Serial Multipliers Over $ GF (2^{m}) $ Using Generalized $(a, b) $-Way Karatsuba Algorithm | |
US11321049B2 (en) | Fast binary counters based on symmetric stacking and methods for same | |
Imana | LFSR-Based Bit-Serial $ GF (2^ m) $ G F (2 m) Multipliers Using Irreducible Trinomials | |
JPS62256034A (ja) | パイプライン演算ユニツト | |
Temenos et al. | Nonscaling adders and subtracters for stochastic computing using Markov chains | |
Kumawat et al. | Design and comparison of 8× 8 Wallace Tree Multiplier using CMOS and GDI technology | |
Imaña | Low latency $ GF (2^{m}) $ polynomial basis multiplier | |
Jamadagni et al. | An asynchronous divider implementation | |
Hong et al. | Radix-4 modular multiplication and exponentiation algorithms for the RSA public-key cryptosystem | |
RU2475815C1 (ru) | ЯЧЕЙКА ОДНОРОДНОЙ ВЫЧИСЛИТЕЛЬНОЙ СРЕДЫ, ОДНОРОДНАЯ ВЫЧИСЛИТЕЛЬНАЯ СРЕДА И УСТРОЙСТВО ДЛЯ КОНВЕЙЕРНЫХ ВЫЧИСЛЕНИЙ СУММЫ м n-РАЗРЯДНЫХ ЧИСЕЛ | |
US7693925B2 (en) | Multiplicand shifting in a linear systolic array modular multiplier | |
Lee et al. | Efficient $ M $-ary exponentiation over $ GF (2^{m}) $ using subquadratic KA-based three-operand Montgomery multiplier | |
US6484193B1 (en) | Fully pipelined parallel multiplier with a fast clock cycle | |
Ibrahim | Radix-2n multiplier structures: A structured design methodology | |
WO2020178736A1 (en) | Quantum-resistant cryptoprocessing | |
Bashagha et al. | Radix digit-serial pipelined divider/square-root architecture | |
Satyanarayana et al. | Review on compressors based approximate multipliers design | |
RU2491612C1 (ru) | Способ организации вычислений суммы n m-разрядных чисел | |
Spoorthi et al. | A decimal multiplier with improved speed using semi-parallel iterative approach | |
Parhami | Tight upper bounds on the minimum precision required of the divisor and the partial remainder in high-radix division | |
RU2485574C1 (ru) | Способ организации умножения чисел с плавающей запятой, представленных в системе остаточных классов | |
Abraham et al. | An ASIC design of an optimized multiplication using twin precision | |
Gayatri et al. | Synthesizable Implementation of 2N/N Binary Division | |
RU2498393C1 (ru) | Способ деления целых двоичных чисел без остатка начиная с младших разрядов |