RU2485574C1

RU2485574C1 - Способ организации умножения чисел с плавающей запятой, представленных в системе остаточных классов

Info

Publication number: RU2485574C1
Application number: RU2012114968/08A
Authority: RU
Inventors: Владимир Сергеевич Князьков; Илья Петрович Осинин
Priority date: 2012-04-17
Filing date: 2012-04-17
Publication date: 2013-06-20

Abstract

Изобретение относится к вычислительной технике и предназначено для построения быстродействующих параллельно-конвейерных умножителей. Техническим результатом является повышение скорости вычисления. Способ содержит этапы, на которых осуществляют параллельную запись остатка по основанию p_i множимого в элементы памяти матрицы i-го умножителя, параллельно выполняют подсчет количества единиц b_i в каждом столбце i-й матрицы, сдвигают двоичное число b₁ на один разряд вправо, суммируют с числом b₂, полученную сумму

сдвигают на один разряд вправо и суммируют с числом b₃. Аналогичным образом осуществляют сдвиг полученных сумм и суммирование их с последующими числами до получения суммы

при этом младший разряд числа b₁ является первым разрядом s₁ произведения, младший разряд каждой полученной суммы

; является i-ым разрядом произведения. Сдвигают двоичное число

младший разряд полученного числа является (2*m)-м разрядом искомого произведения s_2*m. В случае если s_i больше p_i, производится коррекция полученного произведения s_i путем последовательного вычитания из s_i основания p_i до тех пор, пока s_i не станет меньше p_i, иначе коррекция не производится, одновременно суммируют порядки сомножителей, полученная сумма является порядком искомого произведения. 2 ил.

Description

Изобретение относится к вычислительной технике и предназначено для построения быстродействующих параллельно-конвейерных умножителей, обрабатывающих массивы положительных чисел с плавающей запятой в системе остаточных классов (СОК).

Операция умножения (далее по тексту умножение) в СОК производится параллельно по нескольким основаниям p_i, их количество n определяется диапазоном Р представления чисел: Р=p₁*p₂*…*p_n, где * - знак умножения. Представление числа в СОК обеспечивается наименьшими неотрицательными остатками А_i по системе взаимно простых оснований p_i(i∈[1, n]).

Вещественные числа в системе остаточных классов представляют собой позиционный порядок и мантиссу, состоящую из набора остатков по основаниям p_i.

Известен итерационный способ умножения целых m-разрядных чисел с плавающей запятой, который применим к числам, представленным как в позиционной системе счисления, так и в системе остаточных классов. В этом способе умножение сводится к последовательности сложений с накоплением, которые выполняются последовательно. При сдвигах множителя освободившиеся разряды заполняются нулями. Если первый бит m-разрядного множителя равен единице, то первое слагаемое является множимым, иначе первое слагаемое равно нулю. Если второй бит множителя равен единице, то второе слагаемое является множимым, сдвинутым на один разряд влево, иначе второе слагаемое равно нулю. К сумме первого и второго слагаемых прибавляется множимое, сдвинутое на два разряда влево, если второй бит множителя равен единице, иначе прибавляется нуль. Затем к полученной сумме прибавляется множимое, сдвинутое на три разряда влево, если третий бит множителя равен единице, иначе прибавляется нуль. И так далее до k-го разряда множителя, к накопленной сумме прибавляется множимое, сдвинутое на k разрядов влево, если k-й бит множителя равен единице, иначе прибавляется нуль. И так далее до m-го разряда множителя, к накопленной сумме прибавляется множимое, сдвинутое на m разрядов влево, если m-й бит множителя равен единице, иначе прибавляется нуль. В итоге накопленная сумма является искомым произведением сомножителей. Недостаток этого способа состоит в том, что, во-первых, при итерационном способе умножения чисел выполняется m-1 операций суммирования, а с учетом последовательного способа переносов в старшие разряды количество тактов суммирования равно (m-1)*2*m. Во-вторых, процесс формирования суммы является последовательным процессом.

Техническим результатом от использования заявляемого способа организации умножения чисел с плавающей запятой, представленных в системе остаточных классов, является повышение скорости вычисления за счет замены серии из m-1 арифметических операций сложения 2*(m-1) параллельно исполняемыми операциями подсчета количества единичных бит в разрядных срезах, формируемых из разрядов множимого. Данная операция выполняется параллельно для всех остатков по основаниям системы остаточных классов, формирующих сомножители. На основании анализа и модификации полученных значений сумм количества единиц во всех разрядных срезах выполняется формирование значения двоичного числа, являющегося значением искомого произведения. В результате количество тактов, необходимых для формирования значения суммы массива целых двоичных чисел - произведения, будет равно (log₂m)*2*m тактов. Таким образом, предлагаемый способ обеспечивает выполнение операции формирования произведения быстрее известного итерационного способа в ((m-1)*2*m)/((log₂m)*2*m)=(m-1)/log₂m раз, например, при m=64 вычисления будут выполняться в 8 раз быстрее.

Описание работы устройства: способ организации умножения двоичных чисел с плавающей запятой, представленных в системе остаточных классов по основаниям p₁, p₂, …, p_k, …, p_n, заключается в том, что в i-м умножителе, где i∈[1,n], содержащем: 2*m-1 счетчиков единичных бит, 2*m-1 двухплечевых сумматоров, 2*m-1 сдвиговых регистров и одну матрицу на элементах памяти, размерность которой составляет (2*m-1) столбцов и m строк, где m - разрядность i-го основания системы остаточных классов, происходит параллельная запись остатка по основанию p_i множимого в элементы памяти матрицы i-го умножителя, причем каждый i-й двоичный позиционный остаток по основанию p_i можно представить в виде последовательности бит A_i(a_m,a_m-1,…,a₂,a₁), где m - разрядность остатка, i∈[1, n].

Происходит параллельная запись остатка по основанию p_i множимого в ячейки матрицы на элементах памяти. В ячейки с 1 по m первой строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда первый разряд множителя равен единице, иначе записываются нули.

В ячейки с 2 по m+1 второй строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда второй разряд множителя равен единице, иначе записываются нули.

И так далее, в ячейки с k по (m+k-1) k-й строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда k-й разряд множителя равен единице, иначе записываются нули.

И так далее, в ячейки с m по (2*m-1) второй строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда m-й разряд множителя равен единице, иначе записываются нули; во все остальные ячейки матрицы записываются нули.

В общем виде размещение множимого в ячейках матрицы на элементах памяти выглядит следующим образом:

Затем производится параллельный подсчет количества единиц в 2*m-1 двоичных векторах, являющихся столбцами приведенной выше матрицы. В результате формируется 2*m-1 двоичных чисел b_j - значений количества единиц в соответствующих m-разрядных векторах, где j∈[1,2*m-1].

В результате параллельного подсчета количества единиц в (2*m-1) столбцах матрицы формируется (2*m-1) двоичных чисел - значений количества единиц в соответствующих m-разрядных столбцах матрицы, причем первое двоичное число b₁ - значение количества единиц в первом m-разрядном столбце матрицы, второе двоичное число b₂ - значение количества единиц во втором m-разрядном столбце матрицы, …, k-e двоичное число b_k - значение количества единиц в k-ом m-разрядном столбце матрицы, …, (2*m-1)-е двоичное число b_2*m-1 - значение количества единиц в (2*m-1)-ом m-разрядном столбце матрицы.

Младший разряд числа b₁ является первым разрядом s₁ произведения m-разрядных остатков по основанию p₁ исходных чисел. Затем выполняется сдвиг двоичного числа b₁на один разряд вправо, после чего полученный результат суммируется с числом b₂, где младший разряд полученной суммы

является вторым разрядом s₂ произведения m-разрядных остатков по основанию p_i исходных чисел.

Затем выполняется сдвиг двоичного числа

на один разряд вправо, после чего полученный результат суммируется с числом b₃, младший разряд полученной суммы

является третьим разрядом s₃ произведения m-разрядных остатков по основанию p_i исходных чисел. И далее вычисления продолжаются аналогичным образом до вычисления суммы

, младший разряд которой является k-м разрядом s_k произведения m-разрядных остатков по основанию p_i исходных чисел.

Затем выполняется сдвиг двоичного числа

на один разряд вправо, после чего полученный результат суммируется с числом b_k+1, младший разряд полученной суммы

является (k+1)-м разрядом s_k+1 произведения m-разрядных остатков по основанию p_i исходных чисел. И далее вычисления продолжаются аналогичным образом до вычисления суммы

, младший разряд которой является (2*m-1)-м разрядом s_2*m-1произведения m-разрядных остатков по основанию p_i исходных чисел.

Затем выполняется сдвиг двоичного числа

, младший разряд полученного числа является (2*m)-м разрядом искомого произведения s_2*m.

В итоге будет сформировано произведение s₁ m-разрядных остатков по основанию p_i исходных чисел - число, составленное из последовательности бит: s₂, s₂, …, s_k, …, s_2*m.

В том случае если s_i больше p_i, производится коррекция полученного произведения s_i для невыхода за пределы основания путем последовательного вычитания из s_i основания p_i до тех пор, пока s_i не станет меньше p_i, иначе коррекция не производится.

Одновременно с вычислением произведения m-разрядных остатков суммируются порядки сомножителей, полученная сумма является порядком искомого произведения.

Пример: необходимо умножить два бинарных трехбитных (m=3) операнда: множимое a₁=111, множитель а₂=101 по основанию р=10011. Запишем их в виде матрицы размерностью m=3 строк и 2*m-1=5 столбцов, в ячейки с 1 по m=3 первой строки записывается множимое, так как первый бит множимого равен единице. В ячейки с 2 по m+1=4 второй строки записываются нули, так как второй бит множимого равен нулю. В ячейки с 3 по 2*m-1=5 третьей строки записывается множимое, так как третий бит множителя равен единице. Во все остальные ячейки матрицы записываются нули:

Затем параллельно подсчитывается число единиц в столбцах матрицы: b₁=001, b₂=001, b₃=010, b₄=001, b₅=001. Так как младший бит b₁ равен единице, то бит результата s₁=l.

Число b₁ сдвигается на один разряд вправо и результат сдвига

суммируется с числом b₂=001. Сумма

, ее младший разряд является вторым битом результата s₂=1.

Число

сдвигается на один разряд вправо и результат сдвига

суммируется с числом b₃=010. Сумма

, ее младший разряд является третьим битом результата s₃=0.

Число

суммируется с числом b₄=001. Сумма

, ее младший разряд является четвертым битом результата s₄=0.

Число

суммируется с числом b₅=001. Сумма

, ее младший разряд является пятым битом результата s₅=0. Число

сдвигается на один разряд вправо и младший разряд результата сдвига

является шестым битом результата s₆=1. В итоге получено произведение операндов s=(s₆,s₅,s₄,s₃,s₂,s₁)=100011. Так как s>p, необходима коррекция произведения, заключающаяся в вычитании из s основания p, то есть s'=s-p=100011-10011=10000, так как s'<p, то s' является искомым произведением исходных операндов по модулю р.

Если принять за время сложения пары m-разрядных остатков m тактов работы устройства, то время вычисления произведения в устройстве на базе описанного способа равно р*2*m тактов, где p - количество тактов, необходимых для подсчета бит в двоичном векторе, причем p=log₂m, в то время как время умножения итерационным способом равно 2*(m-1)*m тактов. Таким образом, быстродействие устройства на базе описанного способа в (m-1)/log₂m раз выше по сравнению с быстродействием устройства на базе известного итерационного способа умножения.

Примером построения устройства на базе способа организации умножения чисел с плавающей запятой, представленных в системе остаточных классов, может служить ее программирование на программируемых логических интегральных схемах (ПЛИС).

На фиг.1 представлен вариант структурной схемы устройства, реализующего операцию вычисления произведения остатков в общем виде, где: 1 - счетчик единичных бит в двоичных векторах; 2 - p-разрядный двухплечевой сумматор, где p=log₂n; 3 - сдвиговый p-разрядный регистр; a₁-a_2*m-1 - m-разрядные информационные входы схемы; s₁-s_2*m-1 - одноразрядные информационные выходы схемы; b₁-b_2*m-1 - p-разрядные выходы счетчиков 1;

- разрядные выходы сумматоров 2.

На фиг.2 представлен вариант структурной схемы матрицы на элементах памяти для трехбитного остатка (m=3), где: 1 - логический элемент И; 2 - информационный триггер с одним входом данных, одним входом синхронизации и одним выходом данных; 3 - информационный вход триггера; 4 - вход синхронизации триггера; 5 - информационный выход триггера; x₁, x₂, x₃ - входы схемы, на которые подается остаток множимого по трехбитному основанию; y_1, y₂, y₃ - входы схемы, на которые подается остаток множителя по трехбитному основанию; a_1,1÷a_1,5, a_2,1÷a_2,5, а_3,1÷а_3,5, - выходы матрицы на элементах памяти.

Claims

Способ организации умножения двоичных чисел с плавающей запятой, представленных в системе остаточных классов по основаниям р₁, р₂, …, p_k, …, p_n, заключающийся в том, что в i-м умножителе, где i∈*[1, n], содержащем: 2*m-1 счетчиков единичных бит, 2*m-1 двухплечевых сумматоров, 2*m-1 сдвиговых регистров и одну матрицу на элементах памяти, размерность которой составляет (2*m-1) столбцов и m строк, где m - разрядность i-го основания системы остаточных классов, происходит параллельная запись остатка по основанию p_i множимого в элементы памяти матрицы i-го умножителя, причем в ячейки с 1 по m первой строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда первый разряд множителя равен единице, иначе записываются нули, в ячейки с 2 по m+1 второй строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда второй разряд множителя равен единице, иначе записываются нули, …, в ячейки с k по (m+k-1) k-й строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда k-й разряд множителя равен единице, иначе записываются нули, …, в ячейки с m по (2*m-1) m-й строки матрицы записывается m-разрядный остаток по основанию p_i множимого в том случае, когда n-й разряд множителя равен единице, иначе записываются нули, во все остальные ячейки матрицы записываются нули, затем параллельно выполняется подсчет количества единиц с использованием счетчика единичных бит в первом столбце i-й матрицы, втором столбце i-й матрицы, …, k-м столбце i-й матрицы, …, (2*m-1)-м столбце i-й матрицы; в результате параллельного подсчета количества единиц в (2*m-1) столбцах i-й матрицы формируется (2*m-1) двоичных чисел - значений количества единиц в соответствующих m-разрядных столбцах i-й матрицы, причем первое двоичное число b₁ - значение количества единиц в первом m-разрядном столбце i-й матрицы, второе двоичное число b₂ - значение количества единиц во втором m-разрядном столбце i-й матрицы, …, k-е двоичное число b_k - значение количества единиц в k-м m-разрядном столбце i-й матрицы, …, m-е двоичное число b_2*m-1 - значение количества единиц в (2*m-1)-м m-разрядном столбце i-й матрицы; младший разряд числа b₁ является первым разрядом s₁ произведения m-разрядных остатков по основанию p_i исходных чисел; затем выполняется сдвиг двоичного числа b₁ на один разряд вправо, после чего полученный результат суммируется с числом b₂, где младший разряд полученной суммы
является вторым разрядом s₂ произведения m-разрядных остатков по основанию p_i исходных чисел; затем выполняется сдвиг двоичного числа
на один разряд вправо, после чего полученный результат суммируется с числом b₃, младший разряд полученной суммы
является третьим разрядом s₃ произведения m-разрядных остатков по основанию p_i исходных чисел; и так далее вычисления продолжаются аналогичным образом до вычисления суммы
, младший разряд которой является k-м разрядом s_k произведения m-разрядных остатков по основанию p_i исходных чисел; затем выполняется сдвиг двоичного числа
, на один разряд вправо, после чего полученный результат суммируется с числом b_k+1, младший разряд полученной суммы
является (k+1)-м разрядом s_k+1 произведения m-разрядных остатков по основанию p_i исходных чисел; и так далее вычисления продолжаются аналогичным образом до вычисления суммы
, младший разряд которой является (2*m-1)-м разрядом s_2*m-1 произведения m-разрядных остатков по основанию p_i исходных чисел; затем выполняется сдвиг двоичного числа
, младший разряд полученного числа является (2*m)-м разрядом искомого произведения s_2*m; в итоге будет сформировано произведение s_i m-разрядных остатков по основанию p_i исходных чисел - число, составленное из последовательности бит: s₁, s₂, …, s_k, …, s_2*m; в том случае, если s_i больше p_i, производится коррекция полученного произведения s_i для невыхода за пределы основания путем последовательного вычитания из s_i основания p_i до тех пор, пока s_i не станет меньше p_i, иначе коррекция не производится, одновременно с вычислением произведения m-разрядных остатков суммируются порядки сомножителей, полученная сумма является порядком искомого произведения.