CN100517382C - 一种并行提升9/7小波基的vlsi结构 - Google Patents

一种并行提升9/7小波基的vlsi结构 Download PDF

Info

Publication number
CN100517382C
CN100517382C CN 200710052272 CN200710052272A CN100517382C CN 100517382 C CN100517382 C CN 100517382C CN 200710052272 CN200710052272 CN 200710052272 CN 200710052272 A CN200710052272 A CN 200710052272A CN 100517382 C CN100517382 C CN 100517382C
Authority
CN
China
Prior art keywords
processing unit
output
wavelet
delay
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200710052272
Other languages
English (en)
Other versions
CN101059866A (zh
Inventor
田昕
田金文
谭毅华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN 200710052272 priority Critical patent/CN100517382C/zh
Publication of CN101059866A publication Critical patent/CN101059866A/zh
Application granted granted Critical
Publication of CN100517382C publication Critical patent/CN100517382C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

一种并行提升9/7小波基的VLSI结构,属于图像压缩处理中的小波变换领域,目的在于有效减少所需的硬件资源,提高最大工作频率,以适于高速、硬件资源要求比较严格的应用场合。本发明包括四个实现不同提升步骤的处理单元,各处理单元由乘法器,加法器,反相器和延时寄存器组成,其中提升系数a=-4,b=12,c=-16/5,k1=5/96,k2=-/16。为了缩短结构的关键路径,本发明可以在不同的处理单元之间加入流水线寄存器来减小关键路径延时。本发明与传统的9/7小波基VLSI结构具有类似的压缩性能,但是具有最小的硬件资源和最短的关键路径延时,可有效地应用于各种高速、硬件资源要求比较严格的各种系统中。

Description

一种并行提升9/7小波基的VLSI结构
技术领域
本发明属于图像压缩处理中的小波变换领域,具体涉及一种并行提升9/7小波基的VLSI结构。
背景技术
随着卫星遥感技术的发展和对传输式观测卫星遥感图像质量要求的不断提高,航天遥感图像的分辨率和采样率也越来越高,由此引起高分辨率遥感图像数据存储量和传输数据量的急剧增长。为了尽量保持高分辨率遥感图像所具有的信息,必须解决输入数据码速率和传输信道带宽之间的矛盾,因此星载环境高分辨率遥感图像数据的高速、实时、大压缩比压缩编码是解决数传带宽和信息保持之间矛盾的关键技术。作为最新的静止图像压缩国际标准,JPEG2000在遥感图像等海量数据压缩方面提供了很好的技术支持和具有优秀的压缩性能。而在JPEG2000算法中,一个比较核心的关键技术就是小波变换技术。传统双正交97(CDF97)小波基具有线性相位,具有良好的压缩性能,因此被JPEG2000图像压缩标准所采用,也被大多数基于小波的图像压缩算法所采用。提升型小波变换能够有效减少算术运算单元的数目和寄存器的数量,但是基于提升算法的小波变换比基于卷积运算的小波变换结构实现关键路径较长。Chao-Tsung HUANG的论文——Flipping structure:an efficient VLSIarchitecture for lifting-based discrete wavelet transform,IEEE Trans.onSignal Processing.2004,52(4):1080-1089,和Cheng-Yi Xiong的论文——ANote on“Flipping Structure:An Efficient VLSI Architecture forLifting-Based Discrete Wavelet Transform,IEEE Trans.on SignalProcessing.2006,54(5):1910-1916.提出了各种一维CDF97小波变换的超大规模集成电路(VLSI)结构,从而减少了关键路径延时。但是,这些变换结构都是基于CDF97小波变换。由于其小波变换提升系数均是无理数,在计算过程中需要使用大量的浮点乘法运算,因此,通过各种结构变换之后,由于存在舍入误差,其压缩性能不一定最佳。
发明内容
本发明提出一种并行提升9/7小波基的VLSI结构,目的在于有效减少所需的硬件资源,提高最大工作频率,以适于高速、硬件资源要求比较严格的应用场合。
本发明的一种并行提升9/7小波基的VLSI结构,包括四个实现不同提升步骤的处理单元,各处理单元由乘法器,加法器,反相器和延时寄存器组成,其特征在于:
(1)所述第一处理单元的输入、输出为:
H(0)(n)=x(2n+1),L(0)(n)=x(2n);
H(1)(n)=L(0)(n)+L(0)(n+1)-H(0)(n),L(1)(n)=aL(0)(n);
(2)所述第二处理单元的输入、输出为:
H(2)(n)=bH(1)(n),L(2)(n)=H(1)(n)+H(1)(n-1)-L(1)(n);
(3)所述第三处理单元的输入、输出为:
H(3)(n)=L(2)(n)+L(2)(n+1)-H(2)(n),L(3)(n)=cL(2)(n);
(4)所述第四处理单元的输入、输出为:
H(4)(n)=H(3)(n),L(4)(n)=H(3)(n)+H(3)(n-1)-L(3)(n);
(5)所述第四处理单元的两个输出值分别送到两个输出乘法器进行缩放操作:
H(n)=H(4)(n)K1,L(n)=L(4)(n)K2
上述式中,a=-4,b=12,c=-16/5, k 1 = 5 2 / 96 , k 2 = - 2 / 16 .
所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第四处理单元和两个输出乘法器之间具有两个流水线寄存器。
所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第二处理单元和第三处理单元之间具有两个流水线寄存器。
所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第一处理单元和第二处理单元之间具有两个流水线寄存器;所述第三处理单元和第四处理单元之间具有两个流水线寄存器。
本发明的VLSI结构,所需的乘法器和加法器数量分别为5和4。相对于CDF97而言,有效地减少了一个乘法器资源。在不同的提升步中,所有的乘法运算是并行执行的;在每个提升步中,所有的加法运算与乘法运算是并行执行的。
本发明采用二级流水线技术时,其关键路径延时为Tm+Ta(Tm代表乘法器的延时,Ta代表加法器的延时);采用四级流水线技术时,关键路径延时可进一步减少到Tm。因此,通过较少的硬件资源可取得最短的关键路径延时。
图1是传统双正交97与本发明在相同压缩比下(采用EBCOT算法),用不同的图像进行比较得到的图像压缩客观质量(峰值信噪比)的对比值,测试图像大小为512×512的块,见图2:女士图和图3:气球图。表明本发明提出的并行提升9/7小波基VLSI结构,与传统的9/7小波基VLSI结构具有类似的压缩性能。但是其VLSI结构具有最小的硬件资源和最短的关键路径延时,可有效地应用于各种高速、硬件资源要求比较严格的各种系统中。
附图说明
图1为传统双正交97与本发明在相同压缩比的对比结果示意图;
图2为女士图像;
图3为气球图像;
图4为本发明的VLSI结构示意图;
图5为本发明中第一处理单元结构示意图;
图6为本发明中第二处理单元结构示意图;
图7为本发明中第三处理单元结构示意图;
图8为本发明中第四处理单元结构示意图;
图9为本发明采用一级流水线示意图;
图10为本发明采用二级流水线示意图;
图11为本发明采用四级流水线示意图;
图12为传统双正交97的VLSI结构采用四级流水线示意图。
图4~图12中的标记:
Figure C20071005227200071
表示延时寄存器,
Figure C20071005227200072
表示流水线寄存器,
Figure C20071005227200073
表示加法器,
Figure C20071005227200074
表示乘法器,
Figure C20071005227200075
表示反相器。
具体实施方式
下面结合附图对本发明详细说明。
在本发明中,设定分解端与重构端的低通滤波器的长度分别为9和7,消失矩的阶数分别为2和4,即小波滤波器在分解端与重构端的低通滤波器函数分别为 H ( w ) = 2 [ ( 1 + e - iw ) / 2 ] 2 P ( w ) , G ( w ) = 2 [ ( 1 + e - iw ) / 2 ] 4 P ~ ( w ) ,
H(w)和G(w)的k阶导数满足:
H(k)(w)|w=π=0,k=0,G(k)(w)|w=π=0,k=0,2
即H(π)=0,G(π)=0,G(2)(π)=0                  (1)
小波滤波器分解端低通滤波器函数的z变换表示为:h(z)=he(z2)+z-1ho(z2),其中,he,ho分别为偶、奇系数多项式,即
h e ( z ) = Σ k h 2 k z - k , h o ( z ) = Σ k h 2 k + 1 z - k
同理,小波滤波器重构端低通滤波器函数的z变换表示为:g(z)=ge(z2)+z-1go(z2),
g e ( z ) = Σ k g 2 k z - k , g o ( z ) = Σ k g 2 k + 1 z - k
多相位矩阵P(z)定义为:
P ( z ) = h e ( z ) g e ( z ) h o ( z ) g o ( z ) - - - ( 2 )
假设输入信号的Z变换表示为:
x(z)=xe(z2)+z-1xo(z2),
而输出的低、高频分量的Z变换表示分别为r1(z),d1(z),则Mallat算法的分解过程可以等价地表示为
r 1 ( z ) d 1 ( z ) = P T ( z ) x e ( z ) z - 1 x o ( z )
本发明提出P(z)的一种并行提升分解格式:
P ( z ) = a 1 + z - 1 0 - 1 - 1 0 1 + z b c 1 + z - 1 0 - 1 - 1 0 1 + z 1 K 1 0 0 K 2 - - - ( 3 )
按照并行提升分解格式,比较(2)式和(3)式,由(1)式和归一化条件,可求得如下的并行提升小波基(PA97)对应的提升系数:
a=-4,b=12,c=-16/5, k 1 = 5 2 / 96 , k 2 = - 2 / 16 .
采用数学方程形式表示,其VLSI结构实现过程可表示如下:
L(0)(n)=x(2n),H(0)(n)=x(2n+1);
H(1)(n)=L(0)(n)+L(0)(n+1)-H(0)(n),
L(1)(n)=aL(0)(n);
L(2)(n)=H(1)(n)+H(1)(n-1)-L(1)(n),
H(2)(n)=bH(1)(n);
H(3)(n)=L(2)(n)+L(2)(n+1)-H(2)(n),
L(3)(n)=cL(2)(n);
L(4)(n)=H(3)(n)+H(3)(n-1)-L(3)(n),
H(4)(n)=H(3)(n);
H(n)=H(4)(n)K1,L(n)=L(4)(n)K2
将上述的数学方程形式,映射得到相应的VLSI结构如图4所示,a,b,c,k1,k2为本发明对应的提升系数。每个采样时钟交替输入一个数据,分别为偶序列信号x(2n)和奇序列信号x(2n+1),L(n)和H(n)分别代表输入的低频和高频分量的输出。在变换过程中,数据顺序输入到第一处理单元PE1、第二处理单元PE2、第三处理单元PE3和第四处理单元PE4进行处理,交替实现一次提升和二次提升运算,最后经过后级的归一化乘法运算,输出原始信号的高频分量H(n)和低频分量L(n),该系统结构能够实现每个内部时钟周期输出一个数据(一个低频和一个高频分量交替输出)。
第一处理单元PE1结构如图5所示,第二处理单元PE2结构如图6所示,第三处理单元PE3结构如图7所示,第四处理单元PE4结构如图8所示,其中PE4不需要使用乘法单元,而PE1、PE2、PE3均由一个三输入加法器、反相器和乘法器构成。此时所用到的资源数目为:乘法器5个,三输入加法器4个,反相器4个,寄存器数目为4。
为了缩短结构的关键路径,本发明可以在不同的处理单元之间加入流水线寄存器来减小关键路径延时。如图9所示,当在第四处理单元PE4和输出乘法器之间加入一级流水线寄存器时,此时关键路径延时近似为2Tm+2Ta(由于反相器关键路径延时很小,其中Tm代表乘法器延时,Ta代表三输入加法器延时),所需的流水线寄存器数目为2。如图10所示,当在第二处理单元PE2和第三处理单元PE3之间加入一级流水线寄存器时,此时各个乘法运算单元之间是并行执行的,所需的流水线寄存器数目为4,关键路径延时近似为Tm+Ta;当在每个处理单元之间加入4级流水线寄存器时,此时加法运算与乘法运算是并行执行的,所需的流水线寄存器数目为8,关键路径延时减小到Tm,该结构如图11所示。
将本发明提出的VLSI结构与其它比较有效的VLSI结构进行性能比较,其中包括Chao-Tsung HUANG的翻折结构[1]和Cheng-Yi Xiong的改进型翻折结构[2]。对比结果如表1所示,表明本发明能有效地提高系统性能。
表1:性能比较
  实现结构   乘法器   加法器   关键路径延时   寄存器数目
  CDF+1级流水   6   8   4Tm+8Ta   6
  CDF+4级流水   6   8   Tm+2Ta   12
  [1]+5级流水   6   4   Tm   14
  [2]+4级流水   6   4   Tm   14
  本发明+1级流水   5   4   2Tm+2Ta   6
  本发明+2级流水   5   4   Tm+Ta   8
  本发明+4级流水   5   4   Tm   12
乘法器延时Tm;加法器延时Ta。除CDF+4级流水线结构外,其他结构中加法器均指三输入加法器。
为了便于比较,在图12中给出了传统双正交97的VLSI结构采用四级流水线示意图,a′,b′,c′,d′,k1′,k2′为传统双正交97小波的提升系数。

Claims (4)

1.一种并行提升9/7小波基的VLSI结构,包括四个实现不同提升步骤的处理单元,各处理单元由乘法器,加法器,反相器和延时寄存器组成,其特征在于:
(1)第一处理单元的输入为:H(0)(n)=x(2n+1),L(0)(n)=x(2n);
输出为:H(1)(n)=L(0)(n)+L(0)(n+1)-H(0)(n),L(1)(n)=a L(0)(n);
(2)第二处理单元的输入为:H(1)(n),L(1)(n);
输出为:H(2)(n)=b H(1)(n),L(2)(n)=H(1)(n)+H(1)(n-1)-L(1)(n);
(3)第三处理单元的输入为:H(2)(n),L(2)(n);
输出为:H(3)(n)=L(2)(n)+L(2)(n+1)-H(2)(n),L(3)(n)=c L(2)(n);
(4)第四处理单元的输入为:H(3)(n),L(3)(n);
输出为:H(4)(n)=H(3)(n),L(4)(n)=H(3)(n)+H(3)(n-1)-L(3)(n);
(5)第四处理单元的两个输出值分别送到两个输出乘法器进行缩放操作:
H(n)=H(4)(n)K1,L(n)=L(4)(n)K2
上述式中,a=-4,b=12,c=-16/5, k 1 = 5 2 / 96 , k 2 = - 2 / 16 .
2.如权利要求1所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第四处理单元和两个输出乘法器之间具有两个流水线寄存器。
3.如权利要求2所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第二处理单元和第三处理单元之间具有两个流水线寄存器。
4.如权利要求3所述的一种并行提升9/7小波基的VLSI结构,其特征在于:所述第一处理单元和第二处理单元之间具有两个流水线寄存器;所述第三处理单元和第四处理单元之间具有两个流水线寄存器。
CN 200710052272 2007-05-23 2007-05-23 一种并行提升9/7小波基的vlsi结构 Expired - Fee Related CN100517382C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710052272 CN100517382C (zh) 2007-05-23 2007-05-23 一种并行提升9/7小波基的vlsi结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710052272 CN100517382C (zh) 2007-05-23 2007-05-23 一种并行提升9/7小波基的vlsi结构

Publications (2)

Publication Number Publication Date
CN101059866A CN101059866A (zh) 2007-10-24
CN100517382C true CN100517382C (zh) 2009-07-22

Family

ID=38865962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710052272 Expired - Fee Related CN100517382C (zh) 2007-05-23 2007-05-23 一种并行提升9/7小波基的vlsi结构

Country Status (1)

Country Link
CN (1) CN100517382C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289828A (zh) * 2011-06-10 2011-12-21 中国科学院空间科学与应用研究中心 一种基于fpga的星载图像压缩的小波变换系统及方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404772B (zh) * 2008-11-19 2010-09-22 中国科学院光电技术研究所 基于小波变换的vlsi图像压缩编码器
CN102300092B (zh) * 2011-08-25 2013-04-24 北京航空航天大学 一种基于提升格式的9/7小波逆变换的图像解压缩方法
CN104301740B (zh) * 2014-10-27 2017-09-29 北京航天自动控制研究所 一种红外图像9/7小波变换硬件加速电路
CN107730436A (zh) * 2017-11-01 2018-02-23 天津市科迪信息技术有限责任公司 一种基于gpu加速提升的小波变换优化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289828A (zh) * 2011-06-10 2011-12-21 中国科学院空间科学与应用研究中心 一种基于fpga的星载图像压缩的小波变换系统及方法
CN102289828B (zh) * 2011-06-10 2013-04-24 中国科学院空间科学与应用研究中心 一种基于fpga的星载图像压缩的小波变换系统及方法

Also Published As

Publication number Publication date
CN101059866A (zh) 2007-10-24

Similar Documents

Publication Publication Date Title
TWI327700B (en) Method and circuit for performing a cordic based loeffler discrete cosine transformation (dct) particularly for signal processing
CN100517382C (zh) 一种并行提升9/7小波基的vlsi结构
CN101154215B (zh) 基23频域取样快速傅立叶变换的硬件结构
CN1326397C (zh) 一种dct快速变换结构
Xiong et al. A note on" Flipping structure: an efficient VLSI architecture for lifting-based discrete wavelet Transform"
CN102300092B (zh) 一种基于提升格式的9/7小波逆变换的图像解压缩方法
CN102970545A (zh) 一种基于二维离散小波变换算法的静态图像压缩方法
CN103237219A (zh) 二维离散余弦变换/逆离散余弦变换电路及方法
CN104657334A (zh) 一种快速傅里叶变化的基2-4-8混合基蝶算器及其应用
Godi et al. Design optimisation of multiplier‐free parallel pipelined FFT on field programmable gate array
Nagabushanam et al. Fast implementation of lifting based 1D/2D/3D DWT-IDWT architecture for image compression
Tran et al. ASIC design of MUL-RED Radix-2 Pipeline FFT circuit for 802.11 ah system
CN103365826B (zh) 一种小面积的基-3fft蝶形单元
Wang et al. An area-and energy-efficient hybrid architecture for floating-point FFT computations
TWI423046B (zh) 以離散傅立葉轉換為核心之修正型離散餘弦正轉換、反轉換之系統
Kaur et al. Design of 32-point mixed radix FFT processor using CSD multiplier
CN106505973A (zh) 一种n抽头的fir滤波器
Zhang et al. Multiplier-less VLSI architecture for real-time computation of multi-dimensional convolution
Anbumani et al. 2D Lifting Based Discrete Wavelet Transform Architecture based on Sub Expression Reduction Technique
Bhosale et al. 2D DWT lifting image compression scheme for error tolerant applications
Hatim et al. Design optimization of the quantization and a pipelined 2D-DCT for real-time applications
Kiran Maye et al. Level Skip VLSI Architecture for 2D-Discrete Wavelet Transform
Yiu et al. Arithmetic shift method suitable for VLSI implementation to CDF 9/7 discrete wavelet transform based on lifting scheme
CN102999474B (zh) 一种基于cordic算法的数据加窗方法
CN101546560A (zh) 音频编解码装置及编解码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090722

Termination date: 20100523