CN100517382C - 一种并行提升9/7小波基的vlsi结构 - Google Patents
一种并行提升9/7小波基的vlsi结构 Download PDFInfo
- Publication number
- CN100517382C CN100517382C CN 200710052272 CN200710052272A CN100517382C CN 100517382 C CN100517382 C CN 100517382C CN 200710052272 CN200710052272 CN 200710052272 CN 200710052272 A CN200710052272 A CN 200710052272A CN 100517382 C CN100517382 C CN 100517382C
- Authority
- CN
- China
- Prior art keywords
- processing unit
- output
- wavelet
- delay
- parallel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Abstract
一种并行提升9/7小波基的VLSI结构,属于图像压缩处理中的小波变换领域,目的在于有效减少所需的硬件资源,提高最大工作频率,以适于高速、硬件资源要求比较严格的应用场合。本发明包括四个实现不同提升步骤的处理单元,各处理单元由乘法器,加法器,反相器和延时寄存器组成,其中提升系数a=-4,b=12,c=-16/5,k1=5/96,k2=-/16。为了缩短结构的关键路径,本发明可以在不同的处理单元之间加入流水线寄存器来减小关键路径延时。本发明与传统的9/7小波基VLSI结构具有类似的压缩性能,但是具有最小的硬件资源和最短的关键路径延时,可有效地应用于各种高速、硬件资源要求比较严格的各种系统中。
Description
技术领域
本发明属于图像压缩处理中的小波变换领域,具体涉及一种并行提升9/7小波基的VLSI结构。
背景技术
随着卫星遥感技术的发展和对传输式观测卫星遥感图像质量要求的不断提高,航天遥感图像的分辨率和采样率也越来越高,由此引起高分辨率遥感图像数据存储量和传输数据量的急剧增长。为了尽量保持高分辨率遥感图像所具有的信息,必须解决输入数据码速率和传输信道带宽之间的矛盾,因此星载环境高分辨率遥感图像数据的高速、实时、大压缩比压缩编码是解决数传带宽和信息保持之间矛盾的关键技术。作为最新的静止图像压缩国际标准,JPEG2000在遥感图像等海量数据压缩方面提供了很好的技术支持和具有优秀的压缩性能。而在JPEG2000算法中,一个比较核心的关键技术就是小波变换技术。传统双正交97(CDF97)小波基具有线性相位,具有良好的压缩性能,因此被JPEG2000图像压缩标准所采用,也被大多数基于小波的图像压缩算法所采用。提升型小波变换能够有效减少算术运算单元的数目和寄存器的数量,但是基于提升算法的小波变换比基于卷积运算的小波变换结构实现关键路径较长。Chao-Tsung HUANG的论文——Flipping structure:an efficient VLSIarchitecture for lifting-based discrete wavelet transform,IEEE Trans.onSignal Processing.2004,52(4):1080-1089,和Cheng-Yi Xiong的论文——ANote on“Flipping Structure:An Efficient VLSI Architecture forLifting-Based Discrete Wavelet Transform,IEEE Trans.on SignalProcessing.2006,54(5):1910-1916.提出了各种一维CDF97小波变换的超大规模集成电路(VLSI)结构,从而减少了关键路径延时。但是,这些变换结构都是基于CDF97小波变换。由于其小波变换提升系数均是无理数,在计算过程中需要使用大量的浮点乘法运算,因此,通过各种结构变换之后,由于存在舍入误差,其压缩性能不一定最佳。
发明内容
本发明提出一种并行提升9/7小波基的VLSI结构,目的在于有效减少所需的硬件资源,提高最大工作频率,以适于高速、硬件资源要求比较严格的应用场合。
本发明的一种并行提升9/7小波基的VLSI结构,包括四个实现不同提升步骤的处理单元,各处理单元由乘法器,加法器,反相器和延时寄存器组成,其特征在于:
(1)所述第一处理单元的输入、输出为:
H(0)(n)=x(2n+1),L(0)(n)=x(2n);
H(1)(n)=L(0)(n)+L(0)(n+1)-H(0)(n),L(1)(n)=aL(0)(n);
(2)所述第二处理单元的输入、输出为:
H(2)(n)=bH(1)(n),L(2)(n)=H(1)(n)+H(1)(n-1)-L(1)(n);
(3)所述第三处理单元的输入、输出为:
H(3)(n)=L(2)(n)+L(2)(n+1)-H(2)(n),L(3)(n)=cL(2)(n);
(4)所述第四处理单元的输入、输出为:
H(4)(n)=H(3)(n),L(4)(n)=H(3)(n)+H(3)(n-1)-L(3)(n);
(5)所述第四处理单元的两个输出值分别送到两个输出乘法器进行缩放操作:
H(n)=H(4)(n)K1,L(n)=L(4)(n)K2;
上述式中,a=-4,b=12,c=-16/5,
所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第四处理单元和两个输出乘法器之间具有两个流水线寄存器。
所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第二处理单元和第三处理单元之间具有两个流水线寄存器。
所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第一处理单元和第二处理单元之间具有两个流水线寄存器;所述第三处理单元和第四处理单元之间具有两个流水线寄存器。
本发明的VLSI结构,所需的乘法器和加法器数量分别为5和4。相对于CDF97而言,有效地减少了一个乘法器资源。在不同的提升步中,所有的乘法运算是并行执行的;在每个提升步中,所有的加法运算与乘法运算是并行执行的。
本发明采用二级流水线技术时,其关键路径延时为Tm+Ta(Tm代表乘法器的延时,Ta代表加法器的延时);采用四级流水线技术时,关键路径延时可进一步减少到Tm。因此,通过较少的硬件资源可取得最短的关键路径延时。
图1是传统双正交97与本发明在相同压缩比下(采用EBCOT算法),用不同的图像进行比较得到的图像压缩客观质量(峰值信噪比)的对比值,测试图像大小为512×512的块,见图2:女士图和图3:气球图。表明本发明提出的并行提升9/7小波基VLSI结构,与传统的9/7小波基VLSI结构具有类似的压缩性能。但是其VLSI结构具有最小的硬件资源和最短的关键路径延时,可有效地应用于各种高速、硬件资源要求比较严格的各种系统中。
附图说明
图1为传统双正交97与本发明在相同压缩比的对比结果示意图;
图2为女士图像;
图3为气球图像;
图4为本发明的VLSI结构示意图;
图5为本发明中第一处理单元结构示意图;
图6为本发明中第二处理单元结构示意图;
图7为本发明中第三处理单元结构示意图;
图8为本发明中第四处理单元结构示意图;
图9为本发明采用一级流水线示意图;
图10为本发明采用二级流水线示意图;
图11为本发明采用四级流水线示意图;
图12为传统双正交97的VLSI结构采用四级流水线示意图。
具体实施方式
下面结合附图对本发明详细说明。
在本发明中,设定分解端与重构端的低通滤波器的长度分别为9和7,消失矩的阶数分别为2和4,即小波滤波器在分解端与重构端的低通滤波器函数分别为
H(w)和G(w)的k阶导数满足:
H(k)(w)|w=π=0,k=0,G(k)(w)|w=π=0,k=0,2
即H(π)=0,G(π)=0,G(2)(π)=0 (1)
小波滤波器分解端低通滤波器函数的z变换表示为:h(z)=he(z2)+z-1ho(z2),其中,he,ho分别为偶、奇系数多项式,即
同理,小波滤波器重构端低通滤波器函数的z变换表示为:g(z)=ge(z2)+z-1go(z2),
多相位矩阵P(z)定义为:
假设输入信号的Z变换表示为:
x(z)=xe(z2)+z-1xo(z2),
而输出的低、高频分量的Z变换表示分别为r1(z),d1(z),则Mallat算法的分解过程可以等价地表示为
本发明提出P(z)的一种并行提升分解格式:
按照并行提升分解格式,比较(2)式和(3)式,由(1)式和归一化条件,可求得如下的并行提升小波基(PA97)对应的提升系数:
a=-4,b=12,c=-16/5,
采用数学方程形式表示,其VLSI结构实现过程可表示如下:
L(0)(n)=x(2n),H(0)(n)=x(2n+1);
H(1)(n)=L(0)(n)+L(0)(n+1)-H(0)(n),
L(1)(n)=aL(0)(n);
L(2)(n)=H(1)(n)+H(1)(n-1)-L(1)(n),
H(2)(n)=bH(1)(n);
H(3)(n)=L(2)(n)+L(2)(n+1)-H(2)(n),
L(3)(n)=cL(2)(n);
L(4)(n)=H(3)(n)+H(3)(n-1)-L(3)(n),
H(4)(n)=H(3)(n);
H(n)=H(4)(n)K1,L(n)=L(4)(n)K2
将上述的数学方程形式,映射得到相应的VLSI结构如图4所示,a,b,c,k1,k2为本发明对应的提升系数。每个采样时钟交替输入一个数据,分别为偶序列信号x(2n)和奇序列信号x(2n+1),L(n)和H(n)分别代表输入的低频和高频分量的输出。在变换过程中,数据顺序输入到第一处理单元PE1、第二处理单元PE2、第三处理单元PE3和第四处理单元PE4进行处理,交替实现一次提升和二次提升运算,最后经过后级的归一化乘法运算,输出原始信号的高频分量H(n)和低频分量L(n),该系统结构能够实现每个内部时钟周期输出一个数据(一个低频和一个高频分量交替输出)。
第一处理单元PE1结构如图5所示,第二处理单元PE2结构如图6所示,第三处理单元PE3结构如图7所示,第四处理单元PE4结构如图8所示,其中PE4不需要使用乘法单元,而PE1、PE2、PE3均由一个三输入加法器、反相器和乘法器构成。此时所用到的资源数目为:乘法器5个,三输入加法器4个,反相器4个,寄存器数目为4。
为了缩短结构的关键路径,本发明可以在不同的处理单元之间加入流水线寄存器来减小关键路径延时。如图9所示,当在第四处理单元PE4和输出乘法器之间加入一级流水线寄存器时,此时关键路径延时近似为2Tm+2Ta(由于反相器关键路径延时很小,其中Tm代表乘法器延时,Ta代表三输入加法器延时),所需的流水线寄存器数目为2。如图10所示,当在第二处理单元PE2和第三处理单元PE3之间加入一级流水线寄存器时,此时各个乘法运算单元之间是并行执行的,所需的流水线寄存器数目为4,关键路径延时近似为Tm+Ta;当在每个处理单元之间加入4级流水线寄存器时,此时加法运算与乘法运算是并行执行的,所需的流水线寄存器数目为8,关键路径延时减小到Tm,该结构如图11所示。
将本发明提出的VLSI结构与其它比较有效的VLSI结构进行性能比较,其中包括Chao-Tsung HUANG的翻折结构[1]和Cheng-Yi Xiong的改进型翻折结构[2]。对比结果如表1所示,表明本发明能有效地提高系统性能。
表1:性能比较
实现结构 | 乘法器 | 加法器 | 关键路径延时 | 寄存器数目 |
CDF+1级流水 | 6 | 8 | 4Tm+8Ta | 6 |
CDF+4级流水 | 6 | 8 | Tm+2Ta | 12 |
[1]+5级流水 | 6 | 4 | Tm | 14 |
[2]+4级流水 | 6 | 4 | Tm | 14 |
本发明+1级流水 | 5 | 4 | 2Tm+2Ta | 6 |
本发明+2级流水 | 5 | 4 | Tm+Ta | 8 |
本发明+4级流水 | 5 | 4 | Tm | 12 |
乘法器延时Tm;加法器延时Ta。除CDF+4级流水线结构外,其他结构中加法器均指三输入加法器。
为了便于比较,在图12中给出了传统双正交97的VLSI结构采用四级流水线示意图,a′,b′,c′,d′,k1′,k2′为传统双正交97小波的提升系数。
Claims (4)
1.一种并行提升9/7小波基的VLSI结构,包括四个实现不同提升步骤的处理单元,各处理单元由乘法器,加法器,反相器和延时寄存器组成,其特征在于:
(1)第一处理单元的输入为:H(0)(n)=x(2n+1),L(0)(n)=x(2n);
输出为:H(1)(n)=L(0)(n)+L(0)(n+1)-H(0)(n),L(1)(n)=a L(0)(n);
(2)第二处理单元的输入为:H(1)(n),L(1)(n);
输出为:H(2)(n)=b H(1)(n),L(2)(n)=H(1)(n)+H(1)(n-1)-L(1)(n);
(3)第三处理单元的输入为:H(2)(n),L(2)(n);
输出为:H(3)(n)=L(2)(n)+L(2)(n+1)-H(2)(n),L(3)(n)=c L(2)(n);
(4)第四处理单元的输入为:H(3)(n),L(3)(n);
输出为:H(4)(n)=H(3)(n),L(4)(n)=H(3)(n)+H(3)(n-1)-L(3)(n);
(5)第四处理单元的两个输出值分别送到两个输出乘法器进行缩放操作:
H(n)=H(4)(n)K1,L(n)=L(4)(n)K2;
上述式中,a=-4,b=12,c=-16/5,
2.如权利要求1所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第四处理单元和两个输出乘法器之间具有两个流水线寄存器。
3.如权利要求2所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第二处理单元和第三处理单元之间具有两个流水线寄存器。
4.如权利要求3所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第一处理单元和第二处理单元之间具有两个流水线寄存器;所述第三处理单元和第四处理单元之间具有两个流水线寄存器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710052272 CN100517382C (zh) | 2007-05-23 | 2007-05-23 | 一种并行提升9/7小波基的vlsi结构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710052272 CN100517382C (zh) | 2007-05-23 | 2007-05-23 | 一种并行提升9/7小波基的vlsi结构 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101059866A CN101059866A (zh) | 2007-10-24 |
CN100517382C true CN100517382C (zh) | 2009-07-22 |
Family
ID=38865962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200710052272 Expired - Fee Related CN100517382C (zh) | 2007-05-23 | 2007-05-23 | 一种并行提升9/7小波基的vlsi结构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100517382C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289828A (zh) * | 2011-06-10 | 2011-12-21 | 中国科学院空间科学与应用研究中心 | 一种基于fpga的星载图像压缩的小波变换系统及方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404772B (zh) * | 2008-11-19 | 2010-09-22 | 中国科学院光电技术研究所 | 基于小波变换的vlsi图像压缩编码器 |
CN102300092B (zh) * | 2011-08-25 | 2013-04-24 | 北京航空航天大学 | 一种基于提升格式的9/7小波逆变换的图像解压缩方法 |
CN104301740B (zh) * | 2014-10-27 | 2017-09-29 | 北京航天自动控制研究所 | 一种红外图像9/7小波变换硬件加速电路 |
CN107730436A (zh) * | 2017-11-01 | 2018-02-23 | 天津市科迪信息技术有限责任公司 | 一种基于gpu加速提升的小波变换优化方法 |
-
2007
- 2007-05-23 CN CN 200710052272 patent/CN100517382C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289828A (zh) * | 2011-06-10 | 2011-12-21 | 中国科学院空间科学与应用研究中心 | 一种基于fpga的星载图像压缩的小波变换系统及方法 |
CN102289828B (zh) * | 2011-06-10 | 2013-04-24 | 中国科学院空间科学与应用研究中心 | 一种基于fpga的星载图像压缩的小波变换系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101059866A (zh) | 2007-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI327700B (en) | Method and circuit for performing a cordic based loeffler discrete cosine transformation (dct) particularly for signal processing | |
CN100517382C (zh) | 一种并行提升9/7小波基的vlsi结构 | |
CN101154215B (zh) | 基23频域取样快速傅立叶变换的硬件结构 | |
CN1326397C (zh) | 一种dct快速变换结构 | |
Xiong et al. | A note on" Flipping structure: an efficient VLSI architecture for lifting-based discrete wavelet Transform" | |
CN102300092B (zh) | 一种基于提升格式的9/7小波逆变换的图像解压缩方法 | |
CN102970545A (zh) | 一种基于二维离散小波变换算法的静态图像压缩方法 | |
CN103237219A (zh) | 二维离散余弦变换/逆离散余弦变换电路及方法 | |
CN104657334A (zh) | 一种快速傅里叶变化的基2-4-8混合基蝶算器及其应用 | |
Godi et al. | Design optimisation of multiplier‐free parallel pipelined FFT on field programmable gate array | |
Nagabushanam et al. | Fast implementation of lifting based 1D/2D/3D DWT-IDWT architecture for image compression | |
Tran et al. | ASIC design of MUL-RED Radix-2 Pipeline FFT circuit for 802.11 ah system | |
CN103365826B (zh) | 一种小面积的基-3fft蝶形单元 | |
Wang et al. | An area-and energy-efficient hybrid architecture for floating-point FFT computations | |
TWI423046B (zh) | 以離散傅立葉轉換為核心之修正型離散餘弦正轉換、反轉換之系統 | |
Kaur et al. | Design of 32-point mixed radix FFT processor using CSD multiplier | |
CN106505973A (zh) | 一种n抽头的fir滤波器 | |
Zhang et al. | Multiplier-less VLSI architecture for real-time computation of multi-dimensional convolution | |
Anbumani et al. | 2D Lifting Based Discrete Wavelet Transform Architecture based on Sub Expression Reduction Technique | |
Bhosale et al. | 2D DWT lifting image compression scheme for error tolerant applications | |
Hatim et al. | Design optimization of the quantization and a pipelined 2D-DCT for real-time applications | |
Kiran Maye et al. | Level Skip VLSI Architecture for 2D-Discrete Wavelet Transform | |
Yiu et al. | Arithmetic shift method suitable for VLSI implementation to CDF 9/7 discrete wavelet transform based on lifting scheme | |
CN102999474B (zh) | 一种基于cordic算法的数据加窗方法 | |
CN101546560A (zh) | 音频编解码装置及编解码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090722 Termination date: 20100523 |