SU1667103A1 - Параллельный процессор Хаара - Google Patents
Параллельный процессор Хаара Download PDFInfo
- Publication number
- SU1667103A1 SU1667103A1 SU894738804A SU4738804A SU1667103A1 SU 1667103 A1 SU1667103 A1 SU 1667103A1 SU 894738804 A SU894738804 A SU 894738804A SU 4738804 A SU4738804 A SU 4738804A SU 1667103 A1 SU1667103 A1 SU 1667103A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- group
- subtractor
- adder
- processor
- input
- Prior art date
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Изобретение относитс к вычислительной технике и может быть использовано в системах цифровой обработки сигналов дл построени устройств цифровой фильтрации, сжати изображени и выделени признаков, основанных на параллельном алгоритме преобразовани Хаара. Цель изобретени - повышение быстродействи . Дл этого процессор содержит две группы коммутаторов, N групп сумматоров - вычитателей (N = 2N - объем входной выборки), две группы блоков задержки и блок синхронизации. Указанна цель достигаетс за счет применени нового параллельного алгоритма преобразовани Хаара. 3 ил.
Description
Изобретение относитс к вычислительной технике и может быть использовано в системах цифровой обработки сигналов дл построени устройств цифровой фильтрации , сжати изображени и выделени признаков , основанных на параллельном алгоритме преобразовани Хаара.
Цель изобретени - повышение быстродействи путем применени нового параллельного алгоритма преобразовани Хаара.
На фиг.1 представлена схема параллельного процессора Хаара дл последовательности входных выборок векторов размерами N 24 16; на фиг.2 - граф последовательности вычислени коэффициентов Хаара дл N 16; на фиг.За и б - схемы состо ний переключателей первой и второй групп соответственно.
Параллельный процессор Хаара (фиг.1) содержит шестнадцать информационных входов, на которые поступают отсчеты входного вектора (Xo(t) - X(t), и шестнадцать информационных выходов, на которых получаютс коэффициенты Хаара (Yo(t-4) - Yi5()), первую группу коммутаторов 1о 1б, вторую группу коммутаторов , восемь сумматоров-вычитателей Зо-З, разбитых на четыре группы: нулева группа lo содержит четыре сумматора-вычитател , перва группа И - два, втора и треть группы 2 и з - по одному сумматору-вычитате- лю.
Устройство содержит также первую группу блоков задержки, вторую группу блоков задержки, блок 6 синхронизации , содержащий генератор 7 тактовых импульсов и делительл 8 частоты на два.
Блок синхронизации имеет два выхода 9 и 10, которые подключены соответственно к одноименным входам синхронизации блоков задержки и к управл ющим входам коммутаторов первой и второй групп
СП
с
о о VJ
о
СА
Каждый сумматор-вычитатель состоит из двух сумматоров: один дл выполнени операции сложени , другой - дл выполнени операции вычитани .
Каждый блок задержки первой группы 4| содержит один регистр сдвига и запоминает поступившее число на один такт работы сумматоров-вычитателей. Каждый блок задержки второй группы 5| так же состоит из одного регистра сдвига и запоминает поступившее число на один такт работы сумматоров-вычитателей , так как гН-3 1.
На фиг.2 р дом с каждой базовой операцией двухточечного преобразовани указан номер такта, во врем которого она выполн етс .
Переключатели первой и второй групп принимают первое или второе состо ние (на фиг.З показаны римскими цифрами I и II) в зависимости от управл ющего сигнала О или 1 с второго выхода 10 блока 6 синхронизации .
Вычисление коэффициентов Хаара основано на разработанном параллельном ал- горитме преобразовани Хаара над последовательностью входны х выборок, представл емых векторами Xi, размером М 2П
(l 1,2,...),
О)
где HN - матрица преобразовани Хаара; YI - преобразованные выборки.
Алгоритм строитс посредством факторизации матрицы HN в виде произведени слабо заполненных матриц.
НМ .. (2)
2-й
-V ©lN-2J
(3)
где ®- обозначает пр мую сумму матриц; - единична матрица пор дка N21;
15
vs(
В (2)г - матрицы перестановок, определ емые следующим образом.
20
тО)(р2©52 )х
-1
xP2J + 1 6H2n-2l+1 (14)
где S 2 матрица оператора двоично-инверсной перестановки пор дка
Р 2J - матрица оператора полной тасовки пор дка 21.
Дл примера рассмотрим факторизацию матрицы преобразовани Хаара при N
2 ж н® н® т(3 ).
где
В соответствии с (2) преобразование Ха- ара над одной вводной выборкой Xi производитс в п этапов, т.е.
Y, ((H®-...(H(n-1) (H(n) .уМ. xfi ...).
Сущность алгоритма заключаетс в следующем .
Алгоритм состоит из К 2П взаимодействующих между собой ветвей. Ветви алгоритма условно разбиваютс на о групп. В
l-ю группу (1 0,1п-2) вход т ветвей,
а в I n-1-ю группу входит одна ветвь. На очередном i-м цикле алгоритма (i 1,2,...), состо щем из двух шагов (шагу алгоритма соответствует такт работы сумматоров-вы- читателей в предлагаемом процессоре), параллельно в каждой группе ветвей I
0,1t-1 (t мин {п-1,1+1}) выполн етс 1-й
этап преобразовани , т.е. умножение матрицы Н( Т( ) на очередной вектор, вл ющийс при I 1,2t-1 результатом
работы предыдущей группы ветвей на предыдущем цикле, а при I 0 - новой входной выборкой XI.
Итак, на каждом цикле, т.е. через шаг, начинает обрабатыватьс нова входна выборка. Начина с п-го шага в 2 -йветви алгоритма (в n-й группе) через один шаг выполн етс последний (п-1)й этап преобразовани Хаара, над очередным вектором результатов, полученных в(2п 1-1)-й ветви. Тким образом, преобразование одной входной выборки осуществл етс за п шагов, и
при этом, начина с n-го шага через каждый шаг формируетс результат преобразовани очередной входной выборки.
В соответствии с приведенным алгоритмом дл последовательности входных выбо- оок оазмерами N 2П процессор содержит 2 сумматоров-вычитателей, на каждом из которых реализуютс вычислени , выполн емые одной ветвью алгоритма. По
аналогии с ветв ми алгоритма сумматоры- вычитатели разбиваютс на конвейерно соединенные группы.
Рассмотрим работу процессора на примере последовательности входных выборок
размерами N 24 16. В этом случае, процессор содержит четыре группы сумматоров-вычитателей: в нулевую группу вход т четыре сумматора-вычитател , в первую группу - два сумматора-вычитател , во вторую и в третью - по одному сумматору-вы- читателю. Процессрр содержит семь коммутаторов в первой группе, четыре - во второй группе, тринадцать блоков задержки в первой группе, задерживающих информацию на один такт работы сумматоров-вычитателей , восемь блоков задержки во второй группе, задерживающих информацию также на один такт (так как n-l-З 1 при п 4, I 0) и блок синхронизации, содержащий
генератор тактовых импульсов и делитель частоты на два.
С каждым тактом на синхронизирующие входы блоков задержки первой и вто
рой групп поступают сигналы от генератора 7 тактовых импульсов блока 6 синхронизации , запомина информацию на один такт работы сумматоров-вычитателей. На первом такте при поступлении на синхронизи- рующие входы 10 коммутаторов 2о-2з сигнала отделител 8 частоты блока 6 синхронизации они устанавливаютс в первое состо ние и подключают к входам сумматоров-вычитателей IQ-Й группы первые восемь информационных входа процессора: Хс и У1 . Х2 и , Х4 и Xs , Хб и Х7 .
Вычисл ютс суммы (Хо + Xi), (X2 + Хз), (Х4 + Xs) (Хе + Ху) и разности (), (), (), (). Суммы поступают на блоки 4о, 42,44,4е задержки и запоминаютс в них, а разности- на блоки 4i, 4з, 4s, 4у. На втором такте по сигналу от блока синхронизации коммутаторы устанавливаютс во вто- рое состо ние, коммутаторы 1о-1з в первое .
Через коммутаторы на входы сумматоров-вычитателей поступают следующие четыре пары входных сигналов: Ха , XionXn-v3i, Xi2 и , Xi4 и . Вычисл ютс суммы (Ха + Хд). (Хю + Xn), (Xi2 + Xi3), (Xi4 + Xis) и разности (Xa-Xg), (Xю-Хи). (Xi2-Xi3). (Xi4-Xis). Разности поступают на блоки задержки первой группы 4i. 4з, 4s, 4, откуда предыдущие результаты через коммутаторы передаютс на блоки задержки второй группы 5о, 52, 5i, 5б, где и запоминаютс на один такт.
Суммы из сумматоров-вычитателей Зсг
33поступают на блоки задержки 4о, 42. 44, 4е, откуда предыдущие результаты передаютс на входы сумматоров-вычитателей следующей группы И-й 34 и 3s- Таким образом базовые операции первого этапа полностью завершены.
Одновременно сумматоры-вычитатели
34и 3s продолжают преобразование первой входной выборки, т.е. вычисл ютс соответ- ственно суммы ((Хо + Xi) + (Х2 + Хз)), ((Х4 + Xs)
+ (Хб + X)) и разности ((Хо + Xi) - (Х2 + Хз)), ((Х4 + Xs) - (Хе + X)) Суммы поступают на блоки задержки 4в и 4ю, а разности - на блоки 4д и 4ц. Двум тактам работы суммато- ров-вычитателей соответствует цикл работы процессора. С каждым циклом, т.е. через такт на вход процессора р поступает нова входна выборка. На третьем такте коммутаторы устанавливаютс вновь в пер- вое состо ние, коммутаторы - во второе состо ние, коммутаторы 14 и 1s - в первое. Первый этап преобразовани над первой половиной новой входной выборки вычисл етс аналогично указанному.при
0
5 0
5
5
0
5
0 5
этом предыдущие результаты из блоков задержки 4i, 4з, 4s, 4у через коммутаторы 1о- 1з передаютс на блоки задержки 5i, 5з, 5s, 5, а с блоков задержки 5о, 52, 54, 5е предыдущие результаты, т.е. (Xo-Xi), Х2-Хз), (Х4- Xs), (Хб-Ху) поступают на восьмой, дев тый, дес тый и одиннадцатый информационные выходы процессора, т.е. на выходах процессора имеетс уже часть коэффициентов: Ye, Yg, Yio, Yn.
Информаци с блоков задержки 4д и 4ц через коммутаторы 14 и 1s. т.е. ((Xo + Xi)-(X2 + Хз)). ((ХА + Xs) - (Хе + Ху)) поступает на четвертый и п тый информационные выходы процессора, т.е. имеютс У4-й, Ys-й коэффициенты . На этом же такте включаетс в работу 12- группа сумматоров-вычитателей , т.е. в сумматоре-вычитателе Зе вычисл етс сумма ((Хо + Xi + Х2 + Хз) + (Х4 + Xs + Хб + Ху)) и разность ((Хо + Xi + Х2 + Хз) - (Х4 + Xs + Хб + Ху)). Разность через коммутатор 1б поступает на второй выход процессора, т.е. на выходе имеетс коэффициент Y2, а сумма поступает на блок задержки 4i2.
На следующем четвертом такте коммутаторы 2о-2з устанавливаютс во второе состо ние , коммутаторы - в первое, коммутаторы 14, 1s, 1б - во второе состо ние . На двенадцатый, тринадцатый, четырнадцатый и п тнадцатый информационные выходы процессора поступают результаты из блоков задержки 5i, 5з. 5s, 5y, на седьмой и шестой выходы - через коммутаторы 14 и 1s из блоков задержки 4д и 4ц, т.е. на указанных выходах имеютс Yi2, Yi3, Yis, YG, Yy коэффициенты преобразовани . На этом же такте сумматор-вычитатель Зб вычисл ет сумму ((Ха + Хд + Хю + Хц) + (Xi2 + Xis + Xi4 - Xis)) и разность ((Xs + Xg + Хю + Хц) - (Xi2 + X13 -Х14+Х15)).
Разность через коммутатор 1б поступает на первый информационный выход процессора , а сумма - непосредственно на второй вход сумматора-вычитател ЗУ, на первый вход которого поступает предыдущий результат из блока 4i2 задержки. Сумматор-вычитатель Зу выполн ет последний этап преобразовани Хаара, вычисл сумму (Хо + Xi + ... Xis) и разность ((Хо + ... Ху) - (Ха + ... Xis)). Сумма поступает на нулевой выход процессора, а разность - на первый.
Таким образом на информационных выходах процессора через четыре такта работы сумматоров-вычитателей, т.е. через два цикла работы процессора, имеютс все коэффициенты Хаара.
Конечные результаты преобразовани
над следующими входными выборками будут готовы на каждом втором такте работы сумматоров-вычитателей, т.е. на каждом цикле процессора.
Предлагаемый процессор реализует преобразование Хаара дл входных выборок длиной 2П (n-целое число, п з), на которое требуетс п тактов работы сумматоров-вычитателей.
В случае N 2 16 на преобразование входной выборки требуютс четыре такта работы сумматоров-вычитателей или два цикла работы процессора вместо дев ти тактов в базовом объекте.
Процессор производит конвейерную обработку с перекрытием во времени последовательности поступающих на каждый цикл (через такт) выборок-векторов, при этом в установившемс режиме, начина с п-го такта через такт (на каждый цикл), он выдает очередной вектор коэффициентов преобразовани Хаара.
Claims (1)
- Формула изобретени Параллельный процессор Хаара, содержащий п групп (N 2П -объем входной выборки ) сумматоров-вычислителей, первую группу коммутаторов и блок синхронизации , о т л и ч а ю щ и и с тем, что. с целью повышени быстродействи , в него введены втора группа коммутаторов и две пы блоков задержки, причем j-й (j -- 0,2- ) информационный вход процессора соединен с 1-м (i - j mod 2 - 0 J mod N/2/2n 2 информационным входом К-го (К (j mod N/2 - j mod 2))коммутатора второй группы . S-й (S 0,1) информационный выход которого соединен с одноименным S-м входом сумматора-вычитател первой группы, выход суммы j-ro сумматора-вычитател первой группы через J-й блок задержки первой группы соединен с q-м (q j mod 2) входом Z-ro (Z 0 0/2) сумматора-вычитател первой группы, выход суммы M-ro (M0,20n-2-l1) сумматора-вычитател 1-й (I1,п-2) группы через М + 2П 1 - 2n l й блок задержки первой группы соединен с t-м (t0 М mod 2) входом R-го (R (M-t)/2) сумматора-вычитател (I + 1)-й группы, кроме того, выход суммы сумматора-вычитател (п-2)-й группы соединен непосредственно с вторым входом сумматора-вычитател (п-1)-й5 группы, выход разности М- го су мматора вы- читател р-й группы (р 0,п-3) через (М + 2 - 2П р)-й блок задержки первой группы соединен с информационным входом L- го (L М + 2n - коммутатора первой группы, выход разности сумматора-вычитател ()-й группы соединен с информационным входом (2П - 1)-го коммутатора первой группы, выходы суммы и разности сумматора-вычитател (п-1)-й группы сое5 динены соответственно с первым и вторым выходами процессора, выходы коммутаторов с ( - 5)-го по ( - 3)-й первой группы соединены соответственно с третьего по восьмой выходами процессора, а вы0 ходы коммутаторов с первого по ( - 6)-й через блоки задержки второй группы соединены с дев того по (2п-т)-й выходами процессора , первый выход блока синхронизации соединен с входами синхро5 низации всех блоков задержки, второй выход блока синхронизации соединен с управл ющими входами коммутаторов первой и второй групп.о-mgr3 r-i -(t-ч).-.)$w,- 1Юr,-,) 3 U3(t-4)(tt2 Јft-«;-H) 1.9 rФиг 1-ЧУ 1 г /yf- доьоьал операциrt / t - xФиг. 2
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU894738804A SU1667103A1 (ru) | 1989-06-14 | 1989-06-14 | Параллельный процессор Хаара |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU894738804A SU1667103A1 (ru) | 1989-06-14 | 1989-06-14 | Параллельный процессор Хаара |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1667103A1 true SU1667103A1 (ru) | 1991-07-30 |
Family
ID=21470434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU894738804A SU1667103A1 (ru) | 1989-06-14 | 1989-06-14 | Параллельный процессор Хаара |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1667103A1 (ru) |
-
1989
- 1989-06-14 SU SU894738804A patent/SU1667103A1/ru active
Non-Patent Citations (1)
Title |
---|
Патент US N 3981443, кл. G 06 F 15/34, 1975. Авторское свидетельство СССР № 1061150,кл. G 06 F 15/332, 1983. Авторское свидетельство СССР № 1343423.кл. G 06 F 15/332. 1987. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4354249A (en) | Processing unit for multiplying two mathematical quantities including at least one complex multiplier | |
JP2637749B2 (ja) | データ処理装置とその処理方法 | |
JPH05189471A (ja) | バタフライ形演算装置 | |
US3721812A (en) | Fast fourier transform computer and method for simultaneously processing two independent sets of data | |
US3925646A (en) | Information and process control enhancement system employing series of square wave components | |
SU1667103A1 (ru) | Параллельный процессор Хаара | |
US4490805A (en) | High speed multiply accumulate processor | |
EP0080266B1 (en) | Discrete fourier transform circuit | |
KR0147758B1 (ko) | Mpeg-2 오디오 복호화기의 합성 필터 | |
JPS60220466A (ja) | 高速フ−リエ変換装置 | |
US20240220203A1 (en) | Streaming-based compute unit and method, and artificial intelligence chip | |
SU1756901A1 (ru) | Поточно-параллельный процессор Хаара | |
SU1718217A1 (ru) | Устройство дл возведени в степень | |
SU1550513A1 (ru) | Устройство дл вычислени функции @ | |
SU1104529A1 (ru) | Цифровой автокоррел тор | |
JPH0535773A (ja) | ベクトル除算方式とその装置 | |
SU805191A1 (ru) | Устройство дл вычислени спектраМОщНОСТи | |
SU564638A1 (ru) | Устройство дл решени систем линейных алгебраических уравлений | |
Alia et al. | A fast near optimum VLSI implementation of FFT using residue number systems | |
SU1548785A1 (ru) | Мультиконвейерное вычислительное устройство | |
JP2775307B2 (ja) | 磁気共鳴診断装置のデータ収集装置 | |
SU767703A1 (ru) | Цифровой многомерный регул тор | |
Muniappan et al. | Walsh spectrum measurement in natural, dyadic, and sequency ordering | |
CA1292578C (en) | Side-fed superlattice for the production of linear predictor and filter coefficients | |
SU1325510A1 (ru) | Устройство дл ортогонального преобразовани по Уолшу |