SU1667103A1 - Параллельный процессор Хаара - Google Patents

Параллельный процессор Хаара Download PDF

Info

Publication number
SU1667103A1
SU1667103A1 SU894738804A SU4738804A SU1667103A1 SU 1667103 A1 SU1667103 A1 SU 1667103A1 SU 894738804 A SU894738804 A SU 894738804A SU 4738804 A SU4738804 A SU 4738804A SU 1667103 A1 SU1667103 A1 SU 1667103A1
Authority
SU
USSR - Soviet Union
Prior art keywords
group
subtractor
adder
processor
input
Prior art date
Application number
SU894738804A
Other languages
English (en)
Inventor
Сос Суренович Агаян
Анаит Петросовна Галантерян
Давид Завенович Геворкян
Андраник Владимирович Мелкумян
Original Assignee
Вычислительный Центр Ан Армсср
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Вычислительный Центр Ан Армсср filed Critical Вычислительный Центр Ан Армсср
Priority to SU894738804A priority Critical patent/SU1667103A1/ru
Application granted granted Critical
Publication of SU1667103A1 publication Critical patent/SU1667103A1/ru

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Изобретение относитс  к вычислительной технике и может быть использовано в системах цифровой обработки сигналов дл  построени  устройств цифровой фильтрации, сжати  изображени  и выделени  признаков, основанных на параллельном алгоритме преобразовани  Хаара. Цель изобретени  - повышение быстродействи . Дл  этого процессор содержит две группы коммутаторов, N групп сумматоров - вычитателей (N = 2N - объем входной выборки), две группы блоков задержки и блок синхронизации. Указанна  цель достигаетс  за счет применени  нового параллельного алгоритма преобразовани  Хаара. 3 ил.

Description

Изобретение относитс  к вычислительной технике и может быть использовано в системах цифровой обработки сигналов дл  построени  устройств цифровой фильтрации , сжати  изображени  и выделени  признаков , основанных на параллельном алгоритме преобразовани  Хаара.
Цель изобретени  - повышение быстродействи  путем применени  нового параллельного алгоритма преобразовани  Хаара.
На фиг.1 представлена схема параллельного процессора Хаара дл  последовательности входных выборок векторов размерами N 24 16; на фиг.2 - граф последовательности вычислени  коэффициентов Хаара дл  N 16; на фиг.За и б - схемы состо ний переключателей первой и второй групп соответственно.
Параллельный процессор Хаара (фиг.1) содержит шестнадцать информационных входов, на которые поступают отсчеты входного вектора (Xo(t) - X(t), и шестнадцать информационных выходов, на которых получаютс  коэффициенты Хаара (Yo(t-4) - Yi5()), первую группу коммутаторов 1о 1б, вторую группу коммутаторов , восемь сумматоров-вычитателей Зо-З, разбитых на четыре группы: нулева  группа lo содержит четыре сумматора-вычитател , перва  группа И - два, втора  и треть  группы 2 и з - по одному сумматору-вычитате- лю.
Устройство содержит также первую группу блоков задержки, вторую группу блоков задержки, блок 6 синхронизации , содержащий генератор 7 тактовых импульсов и делительл 8 частоты на два.
Блок синхронизации имеет два выхода 9 и 10, которые подключены соответственно к одноименным входам синхронизации блоков задержки и к управл ющим входам коммутаторов первой и второй групп
СП
с
о о VJ
о
СА
Каждый сумматор-вычитатель состоит из двух сумматоров: один дл  выполнени  операции сложени , другой - дл  выполнени  операции вычитани .
Каждый блок задержки первой группы 4| содержит один регистр сдвига и запоминает поступившее число на один такт работы сумматоров-вычитателей. Каждый блок задержки второй группы 5| так же состоит из одного регистра сдвига и запоминает поступившее число на один такт работы сумматоров-вычитателей , так как гН-3 1.
На фиг.2 р дом с каждой базовой операцией двухточечного преобразовани  указан номер такта, во врем  которого она выполн етс .
Переключатели первой и второй групп принимают первое или второе состо ние (на фиг.З показаны римскими цифрами I и II) в зависимости от управл ющего сигнала О или 1 с второго выхода 10 блока 6 синхронизации .
Вычисление коэффициентов Хаара основано на разработанном параллельном ал- горитме преобразовани  Хаара над последовательностью входны х выборок, представл емых векторами Xi, размером М 2П
(l 1,2,...),
О)
где HN - матрица преобразовани  Хаара; YI - преобразованные выборки.
Алгоритм строитс  посредством факторизации матрицы HN в виде произведени  слабо заполненных матриц.
НМ .. (2)
2-й
-V ©lN-2J
(3)
где ®- обозначает пр мую сумму матриц; - единична  матрица пор дка N21;
15
vs(
В (2)г - матрицы перестановок, определ емые следующим образом.
20
тО)(р2©52 )х
-1
xP2J + 1 6H2n-2l+1 (14)
где S 2 матрица оператора двоично-инверсной перестановки пор дка
Р 2J - матрица оператора полной тасовки пор дка 21.
Дл  примера рассмотрим факторизацию матрицы преобразовани  Хаара при N
2 ж н® н® т(3 ).
где
В соответствии с (2) преобразование Ха- ара над одной вводной выборкой Xi производитс  в п этапов, т.е.
Y, ((H®-...(H(n-1) (H(n) .уМ. xfi ...).
Сущность алгоритма заключаетс  в следующем .
Алгоритм состоит из К 2П взаимодействующих между собой ветвей. Ветви алгоритма условно разбиваютс  на о групп. В
l-ю группу (1 0,1п-2) вход т ветвей,
а в I n-1-ю группу входит одна ветвь. На очередном i-м цикле алгоритма (i 1,2,...), состо щем из двух шагов (шагу алгоритма соответствует такт работы сумматоров-вы- читателей в предлагаемом процессоре), параллельно в каждой группе ветвей I
0,1t-1 (t мин {п-1,1+1}) выполн етс  1-й
этап преобразовани , т.е. умножение матрицы Н( Т( ) на очередной вектор,  вл ющийс  при I 1,2t-1 результатом
работы предыдущей группы ветвей на предыдущем цикле, а при I 0 - новой входной выборкой XI.
Итак, на каждом цикле, т.е. через шаг, начинает обрабатыватьс  нова  входна  выборка. Начина  с п-го шага в 2 -йветви алгоритма (в n-й группе) через один шаг выполн етс  последний (п-1)й этап преобразовани  Хаара, над очередным вектором результатов, полученных в(2п 1-1)-й ветви. Тким образом, преобразование одной входной выборки осуществл етс  за п шагов, и
при этом, начина  с n-го шага через каждый шаг формируетс  результат преобразовани  очередной входной выборки.
В соответствии с приведенным алгоритмом дл  последовательности входных выбо- оок оазмерами N 2П процессор содержит 2 сумматоров-вычитателей, на каждом из которых реализуютс  вычислени , выполн емые одной ветвью алгоритма. По
аналогии с ветв ми алгоритма сумматоры- вычитатели разбиваютс  на конвейерно соединенные группы.
Рассмотрим работу процессора на примере последовательности входных выборок
размерами N 24 16. В этом случае, процессор содержит четыре группы сумматоров-вычитателей: в нулевую группу вход т четыре сумматора-вычитател , в первую группу - два сумматора-вычитател , во вторую и в третью - по одному сумматору-вы- читателю. Процессрр содержит семь коммутаторов в первой группе, четыре - во второй группе, тринадцать блоков задержки в первой группе, задерживающих информацию на один такт работы сумматоров-вычитателей , восемь блоков задержки во второй группе, задерживающих информацию также на один такт (так как n-l-З 1 при п 4, I 0) и блок синхронизации, содержащий
генератор тактовых импульсов и делитель частоты на два.
С каждым тактом на синхронизирующие входы блоков задержки первой и вто
рой групп поступают сигналы от генератора 7 тактовых импульсов блока 6 синхронизации , запомина  информацию на один такт работы сумматоров-вычитателей. На первом такте при поступлении на синхронизи- рующие входы 10 коммутаторов 2о-2з сигнала отделител  8 частоты блока 6 синхронизации они устанавливаютс  в первое состо ние и подключают к входам сумматоров-вычитателей IQ-Й группы первые восемь информационных входа процессора: Хс и У1 . Х2 и , Х4 и Xs , Хб и Х7 .
Вычисл ютс  суммы (Хо + Xi), (X2 + Хз), (Х4 + Xs) (Хе + Ху) и разности (), (), (), (). Суммы поступают на блоки 4о, 42,44,4е задержки и запоминаютс  в них, а разности- на блоки 4i, 4з, 4s, 4у. На втором такте по сигналу от блока синхронизации коммутаторы устанавливаютс  во вто- рое состо ние, коммутаторы 1о-1з в первое .
Через коммутаторы на входы сумматоров-вычитателей поступают следующие четыре пары входных сигналов: Ха , XionXn-v3i, Xi2 и , Xi4 и . Вычисл ютс  суммы (Ха + Хд). (Хю + Xn), (Xi2 + Xi3), (Xi4 + Xis) и разности (Xa-Xg), (Xю-Хи). (Xi2-Xi3). (Xi4-Xis). Разности поступают на блоки задержки первой группы 4i. 4з, 4s, 4, откуда предыдущие результаты через коммутаторы передаютс  на блоки задержки второй группы 5о, 52, 5i, 5б, где и запоминаютс  на один такт.
Суммы из сумматоров-вычитателей Зсг
33поступают на блоки задержки 4о, 42. 44, 4е, откуда предыдущие результаты передаютс  на входы сумматоров-вычитателей следующей группы И-й 34 и 3s- Таким образом базовые операции первого этапа полностью завершены.
Одновременно сумматоры-вычитатели
34и 3s продолжают преобразование первой входной выборки, т.е. вычисл ютс  соответ- ственно суммы ((Хо + Xi) + (Х2 + Хз)), ((Х4 + Xs)
+ (Хб + X)) и разности ((Хо + Xi) - (Х2 + Хз)), ((Х4 + Xs) - (Хе + X)) Суммы поступают на блоки задержки 4в и 4ю, а разности - на блоки 4д и 4ц. Двум тактам работы суммато- ров-вычитателей соответствует цикл работы процессора. С каждым циклом, т.е. через такт на вход процессора р поступает нова  входна  выборка. На третьем такте коммутаторы устанавливаютс  вновь в пер- вое состо ние, коммутаторы - во второе состо ние, коммутаторы 14 и 1s - в первое. Первый этап преобразовани  над первой половиной новой входной выборки вычисл етс  аналогично указанному.при
0
5 0
5
5
0
5
0 5
этом предыдущие результаты из блоков задержки 4i, 4з, 4s, 4у через коммутаторы 1о- 1з передаютс  на блоки задержки 5i, 5з, 5s, 5, а с блоков задержки 5о, 52, 54, 5е предыдущие результаты, т.е. (Xo-Xi), Х2-Хз), (Х4- Xs), (Хб-Ху) поступают на восьмой, дев тый, дес тый и одиннадцатый информационные выходы процессора, т.е. на выходах процессора имеетс  уже часть коэффициентов: Ye, Yg, Yio, Yn.
Информаци  с блоков задержки 4д и 4ц через коммутаторы 14 и 1s. т.е. ((Xo + Xi)-(X2 + Хз)). ((ХА + Xs) - (Хе + Ху)) поступает на четвертый и п тый информационные выходы процессора, т.е. имеютс  У4-й, Ys-й коэффициенты . На этом же такте включаетс  в работу 12-  группа сумматоров-вычитателей , т.е. в сумматоре-вычитателе Зе вычисл етс  сумма ((Хо + Xi + Х2 + Хз) + (Х4 + Xs + Хб + Ху)) и разность ((Хо + Xi + Х2 + Хз) - (Х4 + Xs + Хб + Ху)). Разность через коммутатор 1б поступает на второй выход процессора, т.е. на выходе имеетс  коэффициент Y2, а сумма поступает на блок задержки 4i2.
На следующем четвертом такте коммутаторы 2о-2з устанавливаютс  во второе состо ние , коммутаторы - в первое, коммутаторы 14, 1s, 1б - во второе состо ние . На двенадцатый, тринадцатый, четырнадцатый и п тнадцатый информационные выходы процессора поступают результаты из блоков задержки 5i, 5з. 5s, 5y, на седьмой и шестой выходы - через коммутаторы 14 и 1s из блоков задержки 4д и 4ц, т.е. на указанных выходах имеютс  Yi2, Yi3, Yis, YG, Yy коэффициенты преобразовани . На этом же такте сумматор-вычитатель Зб вычисл ет сумму ((Ха + Хд + Хю + Хц) + (Xi2 + Xis + Xi4 - Xis)) и разность ((Xs + Xg + Хю + Хц) - (Xi2 + X13 -Х14+Х15)).
Разность через коммутатор 1б поступает на первый информационный выход процессора , а сумма - непосредственно на второй вход сумматора-вычитател  ЗУ, на первый вход которого поступает предыдущий результат из блока 4i2 задержки. Сумматор-вычитатель Зу выполн ет последний этап преобразовани  Хаара, вычисл   сумму (Хо + Xi + ... Xis) и разность ((Хо + ... Ху) - (Ха + ... Xis)). Сумма поступает на нулевой выход процессора, а разность - на первый.
Таким образом на информационных выходах процессора через четыре такта работы сумматоров-вычитателей, т.е. через два цикла работы процессора, имеютс  все коэффициенты Хаара.
Конечные результаты преобразовани 
над следующими входными выборками будут готовы на каждом втором такте работы сумматоров-вычитателей, т.е. на каждом цикле процессора.
Предлагаемый процессор реализует преобразование Хаара дл  входных выборок длиной 2П (n-целое число, п з), на которое требуетс  п тактов работы сумматоров-вычитателей.
В случае N 2 16 на преобразование входной выборки требуютс  четыре такта работы сумматоров-вычитателей или два цикла работы процессора вместо дев ти тактов в базовом объекте.
Процессор производит конвейерную обработку с перекрытием во времени последовательности поступающих на каждый цикл (через такт) выборок-векторов, при этом в установившемс  режиме, начина  с п-го такта через такт (на каждый цикл), он выдает очередной вектор коэффициентов преобразовани  Хаара.

Claims (1)

  1. Формула изобретени  Параллельный процессор Хаара, содержащий п групп (N 2П -объем входной выборки ) сумматоров-вычислителей, первую группу коммутаторов и блок синхронизации , о т л и ч а ю щ и и с   тем, что. с целью повышени  быстродействи , в него введены втора  группа коммутаторов и две пы блоков задержки, причем j-й (j -- 0,2- ) информационный вход процессора соединен с 1-м (i - j mod 2 - 0 J mod N/2/2n 2 информационным входом К-го (К (j mod N/2 - j mod 2))коммутатора второй группы . S-й (S 0,1) информационный выход которого соединен с одноименным S-м входом сумматора-вычитател  первой группы, выход суммы j-ro сумматора-вычитател  первой группы через J-й блок задержки первой группы соединен с q-м (q j mod 2) входом Z-ro (Z 0 0/2) сумматора-вычитател  первой группы, выход суммы M-ro (M
    0,2
    0
    n-2-l
    1) сумматора-вычитател  1-й (I
    1,п-2) группы через М + 2П 1 - 2n l й блок задержки первой группы соединен с t-м (t
    0 М mod 2) входом R-го (R (M-t)/2) сумматора-вычитател  (I + 1)-й группы, кроме того, выход суммы сумматора-вычитател  (п-2)-й группы соединен непосредственно с вторым входом сумматора-вычитател  (п-1)-й
    5 группы, выход разности М- го су мматора вы- читател  р-й группы (р 0,п-3) через (М + 2 - 2П р)-й блок задержки первой группы соединен с информационным входом L- го (L М + 2n - коммутатора первой группы, выход разности сумматора-вычитател  ()-й группы соединен с информационным входом (2П - 1)-го коммутатора первой группы, выходы суммы и разности сумматора-вычитател  (п-1)-й группы сое5 динены соответственно с первым и вторым выходами процессора, выходы коммутаторов с ( - 5)-го по ( - 3)-й первой группы соединены соответственно с третьего по восьмой выходами процессора, а вы0 ходы коммутаторов с первого по ( - 6)-й через блоки задержки второй группы соединены с дев того по (2п-т)-й выходами процессора , первый выход блока синхронизации соединен с входами синхро5 низации всех блоков задержки, второй выход блока синхронизации соединен с управл ющими входами коммутаторов первой и второй групп.
    о
    -mgr
    3 r-i -(t-ч)
    .-.)
    $w,
    - 1
    Ю
    r,-,
    ) 3 U3(t-4)
    (tt2 Јft-«;
    -H) 1.9 r
    Фиг 1
    -ЧУ 1 г /
    yf- доьоьал операци 
    rt / t - x
    Фиг. 2
SU894738804A 1989-06-14 1989-06-14 Параллельный процессор Хаара SU1667103A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU894738804A SU1667103A1 (ru) 1989-06-14 1989-06-14 Параллельный процессор Хаара

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU894738804A SU1667103A1 (ru) 1989-06-14 1989-06-14 Параллельный процессор Хаара

Publications (1)

Publication Number Publication Date
SU1667103A1 true SU1667103A1 (ru) 1991-07-30

Family

ID=21470434

Family Applications (1)

Application Number Title Priority Date Filing Date
SU894738804A SU1667103A1 (ru) 1989-06-14 1989-06-14 Параллельный процессор Хаара

Country Status (1)

Country Link
SU (1) SU1667103A1 (ru)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Патент US N 3981443, кл. G 06 F 15/34, 1975. Авторское свидетельство СССР № 1061150,кл. G 06 F 15/332, 1983. Авторское свидетельство СССР № 1343423.кл. G 06 F 15/332. 1987. *

Similar Documents

Publication Publication Date Title
US4354249A (en) Processing unit for multiplying two mathematical quantities including at least one complex multiplier
JP2637749B2 (ja) データ処理装置とその処理方法
JPH05189471A (ja) バタフライ形演算装置
US3721812A (en) Fast fourier transform computer and method for simultaneously processing two independent sets of data
US3925646A (en) Information and process control enhancement system employing series of square wave components
SU1667103A1 (ru) Параллельный процессор Хаара
US4490805A (en) High speed multiply accumulate processor
EP0080266B1 (en) Discrete fourier transform circuit
KR0147758B1 (ko) Mpeg-2 오디오 복호화기의 합성 필터
JPS60220466A (ja) 高速フ−リエ変換装置
US20240220203A1 (en) Streaming-based compute unit and method, and artificial intelligence chip
SU1756901A1 (ru) Поточно-параллельный процессор Хаара
SU1718217A1 (ru) Устройство дл возведени в степень
SU1550513A1 (ru) Устройство дл вычислени функции @
SU1104529A1 (ru) Цифровой автокоррел тор
JPH0535773A (ja) ベクトル除算方式とその装置
SU805191A1 (ru) Устройство дл вычислени спектраМОщНОСТи
SU564638A1 (ru) Устройство дл решени систем линейных алгебраических уравлений
Alia et al. A fast near optimum VLSI implementation of FFT using residue number systems
SU1548785A1 (ru) Мультиконвейерное вычислительное устройство
JP2775307B2 (ja) 磁気共鳴診断装置のデータ収集装置
SU767703A1 (ru) Цифровой многомерный регул тор
Muniappan et al. Walsh spectrum measurement in natural, dyadic, and sequency ordering
CA1292578C (en) Side-fed superlattice for the production of linear predictor and filter coefficients
SU1325510A1 (ru) Устройство дл ортогонального преобразовани по Уолшу