KR100232096B1 - Vlsi of systolic array for discrete wavelet transform - Google Patents

Vlsi of systolic array for discrete wavelet transform Download PDF

Info

Publication number
KR100232096B1
KR100232096B1 KR1019960039718A KR19960039718A KR100232096B1 KR 100232096 B1 KR100232096 B1 KR 100232096B1 KR 1019960039718 A KR1019960039718 A KR 1019960039718A KR 19960039718 A KR19960039718 A KR 19960039718A KR 100232096 B1 KR100232096 B1 KR 100232096B1
Authority
KR
South Korea
Prior art keywords
stored
input
processing element
systolic array
level
Prior art date
Application number
KR1019960039718A
Other languages
Korean (ko)
Other versions
KR19980020997A (en
Inventor
반성범
박래홍
Original Assignee
박래홍
반성범
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박래홍, 반성범 filed Critical 박래홍
Priority to KR1019960039718A priority Critical patent/KR100232096B1/en
Publication of KR19980020997A publication Critical patent/KR19980020997A/en
Application granted granted Critical
Publication of KR100232096B1 publication Critical patent/KR100232096B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 이산 웨이브렛 변환 계산을 위한 시스톨릭 어레이 구조에 있어서, 저주파 웨이브렛 필터와 고주파 웨이브렛 필터의 계수들을 저장하고 있으며 입력 값과 저장 값을 곱하여 출력하는 프로세싱 엘리먼트에 의하여 한 레벨의 분석 웨이브렛의 계산 및 한 레벨의 합성 웨이브렛의 계산시 고주파 필터 출력과 저주파 출력을 번갈아서 계산하여 다음 레벨에서 사용되지 않는 출력 시퀀스를 계산하지 않도록 하는 것임을 특징으로 하는 이산 웨이브렛 변환 계산을 위한 시스톨릭 어레이 구조를 제시한다.In the systolic array structure for the discrete wavelet transform calculation, the present invention stores coefficients of a low frequency wavelet filter and a high frequency wavelet filter, and analyzes one level of analysis wave by a processing element that multiplies and outputs an input value and a stored value. Systolic array for discrete wavelet transform calculation, characterized in that the high frequency filter output and the low frequency output are alternately calculated during the calculation of the letlet and the calculation of the composite wavelet of one level so as not to calculate an unused output sequence at the next level. Present the structure.

Description

이산 웨이브렛 변환을 위한 VLSI의 구조Structure of VLSI for Discrete Wavelet Transform

제1도는 DWT의 3레벨 분석 과정을 보여주는 도면.1 is a diagram showing a three-level analysis process of DWT.

제2도는 DWT의 3레벨 합성 과정을 보여주는 도면.2 is a diagram showing a three-level synthesis process of DWT.

제3도는 한 레벨 분석 웨이브렛 계산을 위한 타입 I 시스톨릭 어레이 구조를 보여주는 도면.3 shows a Type I systolic array structure for one level analysis wavelet calculation.

제4도는 한 레벨 분석 웨이브렛 계산을 위한 타입 II 시스톨릭 어레이 구조를 보여주는 도면.4 shows a type II systolic array structure for one level analysis wavelet calculation.

제5도는 제3도에 도시된 타입 I 및 제4도에 도시된 타입 II에 사용된 프로세싱 엘리먼트들의 기능을 나타내는 도면.FIG. 5 shows the functionality of the processing elements used in Type I shown in FIG. 3 and Type II shown in FIG.

제6도는 3 레벨 DWT계산을 위한 시스톨릭 어레이 구조를 나타내는 도면.6 shows a systolic array structure for three-level DWT calculation.

제7도는 한 레벨 합성 웨이브렛 계산을 위한 시스톨릭 어레이 구조를 보여주는 도면.7 shows a systolic array structure for one level composite wavelet calculation.

본 발명은 이산 웨이브렛 변환(Discrete Wavelet Transform, 이하에서는 DWT라 함)을 위한 시스톨릭 어레이 구조에 관한 것이다.The present invention relates to a systolic array structure for Discrete Wavelet Transform (DWT).

영상 압축 방법 중 변환 부호화 방식은 압축률이 우수하나 사용되는 기저(basis)들이 블록 사이에서 비연속적이므로 재생 연산에서 블록 효과가 발생한다.Among the image compression methods, the transform coding method has a good compression ratio, but since the used basis is discontinuous between blocks, a block effect occurs in a reproduction operation.

이러한 블록 효과를 줄이기 위하여 최근 DWT가 제시되었다.DWT has recently been proposed to reduce this block effect.

DWT는 시간과 주파수에 대하여 국부성을 가지고 신호를 표현할 수 있어서 비정상 과정(nonstationary)을 갖는 영상 신호를 해석함에 유리하고 이를 이용하여 표현된 영상은 인간 시각 특성과 비슷하여 최근 영상 처리 분야에서 각광을 받기 시작하였다.DWT can express signals with locality with respect to time and frequency, which is advantageous for interpreting non-stationary image signals, and the images represented by these images are similar to human visual characteristics. I started to receive.

그러나, DWT는 유용한 변화임에도 불구하고 계산량이 많아서 실시간 처리가 어려운 문제점이 있다. 이러한 문제를 해결하기 위하여 병렬 컴퓨터를 이용하여 알고리즘을 처리 속도를 향상시키는 방법이 연구되고 있다.However, although DWT is a useful change, it is difficult to process in real time due to a large amount of calculation. In order to solve this problem, a method of improving the processing speed of an algorithm using a parallel computer has been studied.

최근에는 범용 컴퓨터가 가지는 가격상의 문제, 복잡성 그리고 시스템에 의한 부하 등을 고려하여 특정 알고리즘을 위한 전용 컴퓨터 개발이 촉진되어 왔는데, VLSI기술을 이용한 시스톨릭/웨이브프론트 어레이가 그 대표적인 예이다.Recently, the development of a dedicated computer for a specific algorithm has been promoted in consideration of the cost, complexity, and system load of a general purpose computer. A typical example is a systolic / wavefront array using VLSI technology.

시스톨릭 어레이는 VLSI 기술을 이용하여 특정한 알고리즘의 수행 속도를 향상시키기 위하여 최대한의 동시 실행의 이룬 전용 하드웨어 구조로서 스시톨릭 어레이의 특징은 모듈성, 규칙성, 국부적 연결성, 고도의 종속 연결성, 잘 동기된 다중 처리 등에 있다. 이러한 구조는 제어가 간단하고 단위 시간당 처리량이 많아서 DSP 분야에 많이 사용된다.Systolic arrays are dedicated hardware architectures that achieve maximum concurrent execution to improve the performance of specific algorithms using VLSI technology. The characteristics of a systolic array are modularity, regularity, local connectivity, highly dependent connectivity, and well-synchronized. Multiprocessing and so on. This structure is popular for DSP applications because of its simple control and high throughput per unit time.

DWT 계산을 위한 종래의 구조로는 먼저 1990년에 발표된 Knowles의 구조로 이는 중간 결과값을 저장하기 위하여 큰 멀티플렉서가 필요한 단점이 있다.The conventional structure for DWT calculation is Knowles's structure, published in 1990, which requires a large multiplexer to store intermediate results.

Parhi와 Nishitani는 계산 시간이 짧은 ″folded architecure″를 제안했지만 복잡한 라우팅(routing)과 제어를 위한 하드웨어가 필요하다는 단점이 있다.Parhi and Nishitani proposed a `` folded architecure '' with a short computation time, but the disadvantage is that it requires hardware for complex routing and control.

또한 이 구조는 필터 사이즈가 변하면 구조가 간단하게 확정되지 않는다는 단점이 있다. Vishwanath et al.은 RPA(Recursive Pyramid Algorithm)을 이용하여 구현하였지만 라우팅 네트워크가 필요하다는 단점이 있다.In addition, this structure has a disadvantage that the structure is not easily determined when the filter size is changed. Vishwanath et al. Implemented using RPA (Recursive Pyramid Algorithm), but has a disadvantage in that a routing network is required.

본 발명의 목적은 상기한 바와 같은 종래 구조의 단점을 보완한 DWT 계산을 위한 시스톨릭 어레이 구조를 제사하는데 있다.It is an object of the present invention to provide a systolic array structure for DWT calculation that compensates for the shortcomings of the conventional structure as described above.

상기한 바와 같은 목적을 달성하기 위하여, 본 발명은 이산 웨이브렛 변환계산을 위한 시스톨릭 어레이 구조에 있어서, 저주파 웨이브렛 필터와 고주파 웨이브렛 필터의 계수들을 저장하고 있으며 입력 값과 저장 값을 곱하여 출력하는 프로세싱 엘리먼트에 의하여 한 레벨의 분석 웨이브렛의 계산 및 한 레벨의 합성 웨이브렛의 계산시 고주파 필터 출력과 저주파 출력을 번갈아서 계산하여 다음 레벨에서 사용되지 않는 출력 시퀀스를 계산하지 않도록 하는 것임을 특징으로 하는 이산 웨이브렛 변환 계산을 위한 시스톨릭 어레이 구조를 제시한다.In order to achieve the above object, the present invention is a systolic array structure for discrete wavelet transform calculation, and stores the coefficients of the low frequency wavelet filter and the high frequency wavelet filter and outputs by multiplying the input value and the stored value In the calculation of the analysis wavelet of one level and the calculation of the composite wavelet of one level by the processing element to calculate the high frequency filter output and the low frequency output alternately so as not to calculate the output sequence not used in the next level A systolic array structure for the discrete wavelet transform calculation is presented.

또한, 본 발명에서는 상기한 바와 같은 한 레벨 계산을 위한 시스톨릭 어레이 구조의 입력과 출력을 직렬로 연결하여 다중 레벨의 이산 웨이브렛 변환 계산이 가능하도록 하는 시스톨릭 어레이 구조를 제시한다.In addition, the present invention proposes a systolic array structure in which the input and output of the systolic array structure for one level calculation as described above are connected in series to enable multilevel discrete wavelet transform calculation.

이하에서는 첨부된 도면을 참조하면서 본 발명을 상세하게 설명한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

본 명세서에서는 편의상 레벨 수가 3이고 필터 탭 수가 4인 DWT 계산을 위한 시스톨릭 어레이 구조를 예를 들어 설명한다.In the present specification, for convenience, a systolic array structure for DWT calculation having a level number of three and a filter tap number of four is described as an example.

본 발명에 의한 DWT 계산을 위한 시스톨릭 어레이 구조를 설명하기에 앞서 DWT를 설명한다.Before describing the systolic array structure for DWT calculation according to the present invention, DWT will be described.

DWT는 서브밴드 코팅의 한 예로 분석 과정과 합성 과정으로 이루어져 있다.DWT is an example of a subband coating consisting of analytical and synthetic processes.

제1도는 DWT의 3레벨 분석 과정을 보여주는 도면이다.1 is a diagram illustrating a three-level analysis process of DWT.

제1도에서 G는 고주파 웨이브렛 필터이고, H는 저주파 웨이브렛 필터이다. 입력 신호 a가 입력되면, G 필터를 통과한 신호는 2:1 다운샘플링되어 u로 출력된다. 반면에 H필터를 통과하고 다운샘플링된 신호 v는 G필터와 H필터를 다시 통과하게 된다.In FIG. 1, G is a high frequency wavelet filter and H is a low frequency wavelet filter. When the input signal a is input, the signal passing through the G filter is downsampled 2: 1 and output to u. On the other hand, the signal v passed through the H filter and downsampled passes through the G filter and the H filter again.

제2도는 DWT의 3레벨 합성 과정을 보여주는 도면이다.2 is a diagram illustrating a three-level synthesis process of DWT.

제2도는 도시된 3레벨 합성 과정은 제1도의 3레벨 분석 과정의 역이다. 입력 신호 y와 z가 1:2 업샘플링되어 각각 G필터와 H필터를 통과한 후 합하여 x신호가 된다.2 is a reverse of the three-level analysis process of FIG. The input signals y and z are up-sampled 1: 2 and pass through the G and H filters, respectively, and are summed into x signals.

제1도와 제2도는 1차원 DWT의 전체적인 블록도로서 주요한 특징은 다음과 같다.1 and 2 are the overall block diagram of the one-dimensional DWT, the main features are as follows.

첫째, 각 레벨이 동일하게 구성되어 있다. 즉, G와 H 필터링하는 블록과 다운샘플링하는 블록이 하나의 블록을 구성하고 있다. 그러나, 각 블록이 동일하지만 다운샘플링에 의하여 각 레벨의 입력값의 타이밍이 달라서 하드웨어 구현에 문제가 있다. 더욱 구체적으로 설명하면, 첫 번째 레벨에서는 매 클럭마다 입력되지만 두 번째 클럭에서는 첫 번째 레벨에서의 다운샘플링에 의하여 짝수 클럭에서만 입력이 되고, 세 번째 레벨에서는 네 클럭마다 입력된다.First, each level is configured identically. That is, a block for G and H filtering and a block for downsampling constitute one block. However, there is a problem in hardware implementation because the blocks are the same but the timing of the input values at each level is different due to downsampling. In more detail, the first level is input every clock, but the second clock is input only at an even clock by downsampling at the first level, and the third level is input every four clocks.

둘째, 계산량이 많은 부분은 저주파 웨이브렛 필터 H를 통과하는 부분으로 이 블록을 어떻게 구현하는냐가 중요한 문제가 된다.Second, the large amount of computation passes through the low-frequency wavelet filter H, and how to implement this block becomes an important problem.

셋째, 각각의 레벨이 G와 H 필터를 통과한 후 다운샘플링되므로 필터링 계산 결과값이 모두 필요하지 않으므로 하드웨어 구현시 이러한 특징으로 이용하여야 한다.Third, since each level is downsampled after passing through the G and H filters, all the results of the filtering calculations are not required. Therefore, this feature should be used in hardware implementation.

이하에서는 상기에서 설명한 DWT를 시스톨릭 어레이 구조를 이용하여 구현하는 방법을 설명한다.Hereinafter, a method of implementing the above-described DWT using a systolic array structure will be described.

고주파 웨이브렛 필터인 G와 저주파 웨이브렛 필터인 H의 전달함수가 다음의 식(1)과 같이 표시된다고 가정한다.It is assumed that the transfer function of the high frequency wavelet filter G and the low frequency wavelet filter H is expressed by the following equation (1).

한 레벨의 DWT 계산 과정을 표시하면 다음의 식(2)와 같다.If one level of DWT calculation process is displayed, the following equation (2) is shown.

상기 식(2)에서 an은 입력 시퀀스를 나타내고 vn은 저주파 출력 시퀀스를 나타낸다.In Equation (2), a n represents an input sequence and v n represents a low frequency output sequence.

상기 식(2)에서 v2n+1, n≥0, 은 다음 레벨에서 사용되지 않는 것이므로 계산할 필요가 없고, a2nh2m과 a2n+1h2m+1의 계산만이 필요하다. 본 발명에서는 이러한 특징을 이용하여 한 레벨의 분석 DWT 계산을 위한 구조를 제3도 및 제4도에 도시된 바와 같이 제안한다.In Equation (2), v 2n + 1 , n≥0, are not used at the next level, and do not need to be calculated, and only calculation of a 2n h 2m and a 2n + 1 h 2m + 1 is necessary. Using this feature, the present invention proposes a structure for calculating a level of analysis DWT as shown in FIGS. 3 and 4.

제3도는 한 레벨 분석 웨이브렛 계산을 위한 타입 I 시스톨릭 어레이 구조를 보여주는 도면이고, 제4도는 한 레벨 분석 웨이브렛 계산을 위한 타입 II 시스톨릭 어레이 구조를 보여주는 도면이다.3 shows a Type I systolic array structure for one level analysis wavelet calculation, and FIG. 4 shows a Type II systolic array structure for one level analysis wavelet calculation.

제3도 및 제4도에 도시된 구조에서는 H(z)와 G(z)가 프로세싱 엘리먼트(PE, Processing Element)에 저장되어 있고 입력 an이 좌측으로부터 입력되어 출력 v2n과 u2n을 번갈아가며 계산하도록 하였다. 이와 같은 방식으로 필요하지 않은 값인 v2n+1을 계산하지 않고 u2n을 계산하도록 하였다. 제3도에 도시된 A1~A3은 두 입력의 합을 계산하는 프로세싱 엘리먼트 이고, D는 입력을 한 클럭 지연시키는 프로세싱 엘리먼트이다.In the structures shown in FIGS. 3 and 4, H (z) and G (z) are stored in a processing element (PE) and input a n is input from the left to alternate outputs v 2n and u 2n . I was going to calculate. In this way, u 2n is calculated without calculating v 2n + 1, which is not necessary. A1 to A3 shown in FIG. 3 are processing elements for calculating the sum of two inputs, and D is a processing element for delaying the input by one clock.

또한, 제3도에서 x, y, z는 지연되는 클럭 수를 의미하는 것이로서 다음의 식(4)에 의하여 구할 수 있다.In FIG. 3, x, y, and z denote the number of delayed clocks, which can be obtained by the following equation (4).

상기 식(3)에서 C는 클럭 차이를 나타낸다. 예를 들어 첫 번째, 두 번째, 그리고 세 번째 레벨의 x는 1, 2, 그리고 4, y는 0, 2 그리고 6이고, z는 1, 4 그리고 10이 된다. 제3도 및 제4도에서 한 클럭은 한 번의 합과 곱을 수행하는 시간이다.In Equation (3), C represents a clock difference. For example, the first, second, and third levels of x are 1, 2, and 4, y is 0, 2, and 6, and z is 1, 4, and 10. In Figures 3 and 4, one clock is the time to multiply one sum and product.

제4도에 도시된 타입 II 시스톨릭 어레이 구조에서는 D 프로세싱 엘리먼트와 A 프로세싱 엘리먼트는 필요하지 않다.In the type II systolic array structure shown in FIG. 4, the D processing element and the A processing element are not necessary.

제5도는 제3도에 도시된 타입 I 및 제4도에 도시된 타입 II에 사용된 프로세싱 엘리먼트들의 기능을 나타내는 도면이다.FIG. 5 is a diagram illustrating the functionality of the processing elements used in Type I shown in FIG. 3 and Type II shown in FIG.

제5(a)도는 프로세싱 엘리먼트에 저장된 g(h)와 입력 a를 곱하여 출력하는 프로세싱 엘리먼트, 제5(b)도는 입력을 한 클럭 지연시키는 프로세싱 엘리먼트, 제5c도는 두 입력을 더하는 프로세싱 엘리먼트로서, 제5(a)도내지 제5(c)도에 도시된 프로세싱 엘리먼트는 제3도에 도시된 타입 I의 시스톨릭 어레이구조에 사용되는 것이다. 제5(d)도는 입력 a, d 및 e 에 대하여 a 와 d를 전달하고 ah+d+e를 계산하는 프로세싱 엘리먼트로서 제4도에 도시된 타입 II의 시스톨릭 어레이 구조에 사용되는 것이다.5 (a) is a processing element for multiplying g (h) stored in the processing element by an input a, and 5 (b) is a processing element for delaying an input by one clock, and FIG. 5c is a processing element for adding two inputs. The processing elements shown in Figures 5 (a) through 5 (c) are used for the Type I systolic array structure shown in Figure 3. Figure 5 (d) is used in the Type II systolic array structure shown in Figure 4 as a processing element that passes a and d and calculates ah + d + e for inputs a, d and e.

제3도 및 제4도에 도시된 시스톨릭 어레이 구조의 이해를 돕기 위하여 데이터의 흐름을 다음의 표 1과 같이 나타낸다.To facilitate the understanding of the systolic array structures shown in FIGS. 3 and 4, the flow of data is shown in Table 1 below.

[표 1]TABLE 1

상기한 바와 같은 한 레벨 웨이브렛 분석 필터에 의하여 3레벨 웨이브렛 분석 필터를 구성하기 위하여는 3개의 프로세싱 엘리먼트 어레이를 제6도와 같이 연결해야 한다.In order to configure the three-level wavelet analysis filter by the one-level wavelet analysis filter as described above, three processing element arrays must be connected as shown in FIG.

제6도는 3 레벨 DWT 계산을 위한 시스톨릭 어레이 구조를 나타내는 도면이다.6 shows a systolic array structure for 3-level DWT calculation.

제6도에서 입력은 an이고 첫 번째 레벨의 고주파 출력 un은 출력되고 저주파 출력 vn은 두 번째 프로세싱 엘리먼트 어레이로 입력된다. 상기한 방식으로 수행하면 세 번째 프로세싱 엘리먼트에서 저주파와 고주파 출력인 yn과 zn이 출력된다.In FIG. 6 the input is a n and the high frequency output u n of the first level is output and the low frequency output v n is input to the second array of processing elements. In this manner, the low frequency and high frequency outputs y n and z n are output from the third processing element.

제7도는 한 레벨 합성 웨이브렛 계산을 위한 시스톨릭 어레이 구조를 보여주는 도면이다.7 shows a systolic array structure for one-level composite wavelet calculation.

첫 번째 레벨 합성 웨이브렛 필터 계산은 다음의 식(4)와 같이 계산된다.The first level synthesis wavelet filter calculation is calculated as shown in Equation (4) below.

제7도에 도시된 시스톨릭 어레이 구조는 한 레벨 합성 웨이브렛 필터 계산 과정에서도 분석 과정에서와 마찬가지로, gmu2n+1과 hmv2n+1, n≥0, 은 계산할 필요가 없으므로 gmu2n과 hmv2n만을 계산하도록 한다.In the systolic array structure shown in FIG. 7, g m u 2n + 1 and h m v 2n + 1 , n≥0, do not need to be calculated as in the one-level synthesis wavelet filter calculation process, as in the analysis process. Calculate only m u 2n and h m v 2n .

저주파와 고주파 필터 계수는 프로세싱 엘리먼트에 저장되도록 하였고 입력이 좌측으로 되도록 하였다.Low and high frequency filter coefficients were stored in the processing element and the inputs were left.

즉, 제3도에 도시된 한 레벨 분석 웨이브렛 계산을 위한 타입 I 시스톨릭 어레이 구조와 입력값과 프로세싱 엘리먼트에 저장된 필터 계수값만이 다르다.That is, only the Type I systolic array structure for the level analysis wavelet calculation shown in FIG. 3 differs from the input coefficients and the filter coefficient values stored in the processing elements.

3 레벨 웨이브렛 합성과정도 3 레벨 웨이브렛 분석과정에서와 마찬가지로, 세 개의 프로세싱 엘리먼트를 제6도에 도시된 바와 같이 연결해야 한다.As in the three-level wavelet analysis process, the three-level wavelet synthesis process must connect three processing elements as shown in FIG.

본 발명에 의하여 제시된 시스톨릭 어레이 구조와 종래의 시스톨릭 어레이 구조에 의한 DWT 계산의 성능을 표 2에서 비교 분석하였다.The performance of DWT calculation by the systolic array structure presented by the present invention and the conventional systolic array structure was compared and analyzed in Table 2.

[표 2]TABLE 2

상기 표 2에서 N은 시퀀스 크기, L은 레벨수, M은 필터 탭 수를 각각 나타낸다.In Table 2, N represents the sequence size, L represents the number of levels, and M represents the number of filter taps.

상기 표 2에 나타난 성능 분석 결과를 보면, 본 발명에 의한 시스톨릭 어레이 구조가 Nm개의 곱셈 프로세싱 엘리먼트가 필요한 반면에 종래의 구조의 Lee et al.의 구조와 Vishwanath et al.의 구조는 Nm 또는 m개의 곱셈 프로세싱 엘리먼트가 필요하다.In the results of the performance analysis shown in Table 2, while the systolic array structure according to the present invention requires Nm multiplication processing elements, the structure of Lee et al. And the structure of Vishwanath et al. Of the conventional structure are Nm or m. Multiplication processing elements are required.

계산 시간과 필요한 프로세싱 엘리먼트의 개수에서는 Parhi와 Nishitani의 구조가 가장 성능이 좋지만 메모리 블록이 필요하다는 단점이 있다. 즉, 본 발명에 의한 시스톨릭 어레이 구조는 종래의 구조에서 필요로 하는 제어 유닛, 메모리 유닛, 또는 라우팅 네트워크 등의 추가적인 하드웨어가 필요없는 장점이 있다.Parhi and Nishitani have the best performance in terms of computation time and the number of processing elements required, but the disadvantage is that memory blocks are required. That is, the systolic array structure according to the present invention has the advantage that no additional hardware such as a control unit, a memory unit, or a routing network required in the conventional structure is required.

Claims (1)

이산 웨이브렛 변환을 위한 고주파 웨이브렛 필터 G와 저주파 웨이브렛 필터 H의 전달함수가 다음과 같이 주어질 때,Given the transfer function of the high frequency wavelet filter G and the low frequency wavelet filter H for the discrete wavelet transform, 입력 시퀀스 an에 대하여 저주파 출력 시퀀스 vn, 고주파 출력 시퀀스 un을 출력하는 이산 웨이브렛 변환을 위한 시스톨릭 어레이 구조에 있어서, 저주파 웨이브렛 필터 계수(hn)와 고주파 웨이브렛 필터 계수(gn)이 저장되어 있으며 입력 a, b, e에 대하여 a, ahn+d+e, ahn를 출력하는 프로세싱 엘리먼트(PE)의 어레이를 구성하되, 입력 시퀀스 an중 짝수 성분(a2n)은 h0, g0가 저장된 프로세싱엘리먼트의 입력(a)이 되고, 입력 시퀀스 an중 홀수 성분(a2n+1)은 h1, g1가 저장된 프로세싱엘리먼트의 입력(a)이 되고, h2n, g2n이 저장된 프로세싱엘리먼트의 출력중 a은 다음 단계의 h2n, g2n이 저장된 프로세싱 엘리먼트의 입력(a)이 되고, h2n+1, g2n+1이 저장된 프로세싱 엘리먼트의 출력중 a은 다음 단계의 h2n+1, g2n+1이 저장된 프로세싱 엘리먼트의 입력(a)이 되고, h2n, g2n이 저장된 프로세싱엘리먼트의 출력중 ahn+d+e은 앞 단계의 h2n, g2n이 저장된 프로세싱엘리먼트의 입력(d)이 되고, h2n+1, g2n+1이 저장된 프로세싱엘리먼트의 출력중 ahn+d+e은 앞 단계의 h2n+1, g2n+1이 저장된 프로세싱엘리먼트의 입력(d)이 되고, h2n+1, g2n+1이 저장된 프로세싱엘리먼트의 출력중 aㆍhn은 h2n, g2n이 저장된 프로세싱엘리먼트의 입력(e)이 되도록 함에 의하여 h0, g0가 저장된 프로세싱엘리먼트의 출력(c)이 저주파 출력 시퀀스중 짝수 성분(v2n), 과 고주파 출력 시퀀스 중 홀수 성분(u2n)이 번갈아가면서 출력하는 것임을 특징으로 하는 이산 웨이브렛 변환을 위한 시스톨릭 어레이 구조.Input sequence low-frequency output sequence with respect to a n v n, the high-frequency output sequence u n discrete waves in the systolic array structure for the wavelet transform, the low-frequency wavelet filter coefficients (h n) and the high frequency wavelet filter coefficients (g for outputting n ) is stored and constitutes an array of processing elements PE for outputting a, ah n + d + e, ah n for inputs a, b, and e, with even components (a 2n ) of the input sequence a n H 0 , g 0 is the input (a) of the processing element stored, the odd component (a 2n + 1 ) of the input sequence a n is h 1 , input (a) of the processing element stored g 1 , h 2n, g 2n of the output of the stored processing element a is of the following steps: h 2n, g 2n is the input (a) of the stored processing elements, h 2n + 1, g 2n + 1 of which the output of the processing element is stored a Is the input of the processing element where h 2n + 1 and g 2n + 1 are stored (a) is, h 2n, g 2n is stored during the output of the processing element ah n + d + e is the input (d) of processing elements of h 2n, g 2n previous step are stored, h 2n + 1, In the output of the processing element with g 2n + 1 stored, ah n + d + e becomes the input (d) of the processing element with h 2n + 1 and g 2n + 1 stored in the previous step, and h 2n + 1 , g 2n + one of the outputs (c) a low-frequency output sequence of the processing elements is h 0, g 0 is stored by as the of the a-h n outputs of the processing element is stored is such that the input (e) of processing elements is h 2n, g 2n stored Systolic array structure for discrete wavelet transform, characterized in that the even component (v 2n ), and the odd component (u 2n ) of the high frequency output sequence alternately output.
KR1019960039718A 1996-09-13 1996-09-13 Vlsi of systolic array for discrete wavelet transform KR100232096B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960039718A KR100232096B1 (en) 1996-09-13 1996-09-13 Vlsi of systolic array for discrete wavelet transform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960039718A KR100232096B1 (en) 1996-09-13 1996-09-13 Vlsi of systolic array for discrete wavelet transform

Publications (2)

Publication Number Publication Date
KR19980020997A KR19980020997A (en) 1998-06-25
KR100232096B1 true KR100232096B1 (en) 1999-12-01

Family

ID=19473642

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960039718A KR100232096B1 (en) 1996-09-13 1996-09-13 Vlsi of systolic array for discrete wavelet transform

Country Status (1)

Country Link
KR (1) KR100232096B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100300338B1 (en) * 1999-02-19 2001-09-26 박래홍 VLSI Architecture for the 2-D Discrete Wavelet Transform
KR100321108B1 (en) * 1999-06-12 2002-03-18 박래홍 VLSI Architecture for the 1-D Discrete Wavelet Transform
KR100920229B1 (en) * 2007-06-28 2009-10-05 포항공과대학교 산학협력단 Fast systolic array system of a belief propagation and method for processing a message using the same

Also Published As

Publication number Publication date
KR19980020997A (en) 1998-06-25

Similar Documents

Publication Publication Date Title
Grzeszczak et al. VLSI implementation of discrete wavelet transform
Chakrabarti et al. Architectures for wavelet transforms: A survey
US5875122A (en) Integrated systolic architecture for decomposition and reconstruction of signals using wavelet transforms
US6215908B1 (en) Symmetric filtering based VLSI architecture for image compression
US6047303A (en) Systolic architecture for computing an inverse discrete wavelet transforms
US5995210A (en) Integrated architecture for computing a forward and inverse discrete wavelet transforms
EP0485444A1 (en) Modular digital signal processing system
Mahmoud et al. Comparison between haar and daubechies wavelet transformions on FPGA technology
US6976046B2 (en) Architectures for discrete wavelet transforms
KR100232096B1 (en) Vlsi of systolic array for discrete wavelet transform
Trenas et al. A configurable architecture for the wavelet packet transform
Colom-Palero et al. Flexible architecture for the implementation of the two-dimensional discrete wavelet transform (2D-DWT) oriented to FPGA devices
Narasimhan et al. Improved Wigner–Ville distribution performance by signal decomposition and modified group delay
Limqueco et al. A scalable architecture for 2-D discrete wavelet transform
JP2004525463A (en) Pyramid filter
Oruklu et al. Dynamically reconfigurable architecture design for ultrasonic imaging
Pan et al. New systolic arrays for computation of the 1-D discrete wavelet transform
KR100300338B1 (en) VLSI Architecture for the 2-D Discrete Wavelet Transform
Kumar et al. A two stage pipeline architecture for hardware implementation of multi-level decomposition of 1-D framelet transform
Pan et al. VLSI architectures of the 1-D and 2-D discrete wavelet transforms for JPEG 2000
Desneux et al. A dedicated DSP architecture for discrete wavelet transform
Grzeszczak et al. VLSI architecture for discrete wavelet transform
Zhang et al. An efficient VLSI architecture for discrete wavelet transform based on the Daubechies architecture
Nandeesha et al. Discrete Wavelet Transform Based VLSI Architecture for Image Compression–A Survey
Uzun et al. An efficient architecture for 1-D discrete biorthogonal wavelet transform

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090616

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee