CN1138254C - 一种基于小波变换的音频信号压缩编/解码方法 - Google Patents

一种基于小波变换的音频信号压缩编/解码方法 Download PDF

Info

Publication number
CN1138254C
CN1138254C CNB011096861A CN01109686A CN1138254C CN 1138254 C CN1138254 C CN 1138254C CN B011096861 A CNB011096861 A CN B011096861A CN 01109686 A CN01109686 A CN 01109686A CN 1138254 C CN1138254 C CN 1138254C
Authority
CN
China
Prior art keywords
subband
samples
wavelet
filter
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB011096861A
Other languages
English (en)
Other versions
CN1375817A (zh
Inventor
陈笑天
潘兴德
顾春来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING FUGUO DIGITAL TECHN Co Ltd
Original Assignee
BEIJING FUGUO DIGITAL TECHN Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING FUGUO DIGITAL TECHN Co Ltd filed Critical BEIJING FUGUO DIGITAL TECHN Co Ltd
Priority to CNB011096861A priority Critical patent/CN1138254C/zh
Publication of CN1375817A publication Critical patent/CN1375817A/zh
Application granted granted Critical
Publication of CN1138254C publication Critical patent/CN1138254C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

本发明涉及一种基于小波变换的音频信号压缩编/解码方法。根据小波和小波包变换的时频局域化和多分辨率分析性质,本发明采用小波技术取代传统的滤波器组,结合人耳的听觉特性,实现高增益、高质量的音频编码,并解决了小波技术应用中的滤波及提高预算速度等几项核心问题,使得对宽带音频信号的音乐进行处理时,在同样采用心理声学模型的情况下,无失真压缩率(相对意义上)比通常MPEG有明显的提高,而且克服了小波应用中的瓶颈问题。

Description

一种基于小波变换的音频信号压缩编/解码方法
技术领域    本发明涉及数据压缩方法,尤其是基于小波变换的音频信号压缩编/解码方法。
背景技术    目前广泛使用的宽带音频压缩,主要采用MPEG-1或2、杜比AC-3等标准,用于CD、MD、MPC、VCD、DVD、HDTV和电影配音等。MPEG音频压缩标准为许多音频数据定义了多种算法,都采用了子带划分并利用人类听觉心理声学模型压缩的方法。MPEG音频的基本算法为:子带分解将输入的音频信号分解成多个频带,然后进行比例因子处理和量化,每一个子带的量化步长选择由频域分析函数完成对采样值进行编码(层次1和2为定长,层次3为Huffman可变长编码),并用附加信息进行格式化以便于传播。解码器解包并对系数和附加信息进行解码和逆量化,将样本映射回重构值;在每个子带上都用合适的比例因子将其放大,并应用子带分解去覆盖一个时域信号。数字音频信号源,不管是单声道还是立体声,采样频率对于MPEG-1为32、44.1或48kHz,或对于MPEG-2为16、22.05、24、44.1、48kHz。源数据都要进行子带分解,比例因子处理并量化后进行编码。解码器首先逆编码,逆量化,逆缩放和子带组合重构源信号。在子带分解方面,对于层1和层2,MPEG采用32个等带宽正交镜像滤波器组(QMF)进行子带滤波;对于层3,MPEG采用QMF后紧跟MDCT的方法使频率分辨率提高到一个更好的层次。通过该滤波器可以有效地分离出最多576个子频带。子带分解都严格采样,每个子带的采样率乘以子带数应为总的采样率。在现有音视频信号的压缩算法中,都采用了子带分解来进行压缩编码。例如在MPEG中,利用32个等带宽的多相滤波器组(multiple phase filter bands)对信号进行处理,得到32个等宽子带上的信号样本,进而通过心理声学模型对各个自子样本进行压缩。等带宽多相滤波器组的优势是各子带滤波器的阶数相同,计算中不存在延迟问题,且滤波器具有较好的抗混叠性质。但是,利用等带宽的滤波器组的不可避免的缺陷在于:不能充分的利用人耳的听觉特性实现冗余信息的最大限度的去除,即实现更高压缩比下的无失真编码。在传统的子带编码中,对人的心理声学模型并没有良好的利用,原因在于,能够接近人耳的听觉特性的非等带宽滤波器组设计涉及一些技术方面的困难。例如,MPEG用32各等带宽的子带滤波器组来划分人耳听觉的频率带宽。在这种子带的划分中,在低频部分一个子带包含多个临界频带,而在高频部分,一个临界频带又被分成多个子带,子带的利用效率很低,不可能很好的逼近入耳的听觉特性(在低频部分尤其如此)。利用这种滤波器组进行音频压缩编码,技术实现上比较简单,但人耳的听觉特性的利用率是有限的,很难实现高压缩比的无失真编码。
发明内容    本发明的主要目的是提供一种基于小波的音频信号编/解码方法,以使得对宽带音频信号的音乐进行处理时,在同样采用心理声学模型的情况下,无失真压缩率(相对意义上)比通常MPEG有明显的提高。
本发明主要是针对MPEG宽带音频压缩算法的改进,用小波技术取代传统的滤波器组,结合人耳的听觉特性,实现高增益、高质量的音频编码,并解决了小波技术应用于音频压缩编解码中的滤波及提高运算速度等几项核心问题。为达到此目的,对音频信号按如下方法进行编/解码操作。编码过程:
(1)从麦克风或其它输入线路采入音频信号;
(2)经低通滤波器滤除高频信号;
(3)经模拟数字转换器转换后成为数字信号PCM流;
(4)数字信号进入数字信号处理器,移入128点新样本于缓冲池,同时从缓冲池中移出128点最旧的样本(此缓冲池长度为1250个点);
(5)将该缓冲池中的序列分别与16个小波分析滤波器(分析滤波器的实现方法在下面单独说明)卷积,并进行临界再采样,获16个分解序列对应16个频带,由于子带的非均匀性,各子带的再采样率是不一样的,具体如下:子带1~4抽样各为1个样本,子带5~6各为2个样本,子带7~13各为8个样本,子带14~15各为16个样本,子带16为32个样本;
(6)以3*128点为一个群,这样各子带中的样本数为原来的三倍,即子带1~4中各有3个样本,子带5~6各有6个样本,子带7~13各有24个样本,子带14~15各有48个样本,子带16有96个样本;分别找出各子带的尺度因子(方法同MP2),将各子带归一化;
(7)同时该3*128点的频谱信息,代入心理声学模型(1或2),求得各子带的量化位数;
(8)据(7)获得的量化位数量化各子带中的样本,量化方法如下:
设:每子带的量化位数为a,该子带的样本数为Num,则各样本的量化后结果为b:
b=a>>(16-Num)
(9)无失真编码(采用霍夫曼编码);
(10)打包,编码输出;
(11)单片机读入压缩码流,写入存储介质。解码过程:
(12)单片机从存储介质或PC上读入压缩码流;
(13)将压缩码流传入DSP;
(14)输入编码序列,以与编码过程相反的顺序解包,即霍夫曼解,还原为16个子带上的样本,推入16个缓冲池;
(15)将各子带上的样本反量化,同时除于尺度因子;
(16)相应于编码过程(5)中的再采样,将各子带上的样本间插零值,具体个数为:子带1~4中2个样本间插入127个零,子带5~6中2个样本间插入63个零,子带7~13中2个样本间插入15个零,子带14~15中2个样本间插入7个零,子带16中2个样本间插入3个零;
(17)将16个缓冲池中的序列与合成滤波器组分别卷积各得128个数据,将16个128点对应相加的一128点序列,该序列即为输出值;
(18)输出该序列,形成PCM流;
(19)PCM流经数字模拟转换器转换后形成模拟信号;
(20)模拟信号通过低通滤波器滤去高频信号;
(21)滤去高频信号的模拟信号经耳机或扬声器播出。
本发明上述编码过程步骤(5)中的分析虑波器的实现方法利用卷积对线性系统满足结合律的特点,把各个小波滤波器先进行卷积运算;另一方面考虑上下采样的影响来控制各个小波滤波器在小波包分解与合成树中所处的位置,由此可得到相应的子带划分多相滤波器组,其对应的公式如下所示:
Figure C0110968600061
Figure C0110968600062
其中:S1,D1:输入信号;
      f1,f2:小波分解滤波器
      rf1,rf2:小波重构滤波器
     
Figure C0110968600063
n:下采样n倍
      n:上采样n倍
解码时小波重构滤波器的实现方法是上面所说分析滤波器实现方法的逆过程。
在对由音频小波包编码器得到的音频压缩码流进行解码时,对解码速度和内存资源有较高的要求,这是小波算法虽然具有许多优越于DCT算法的数学性质但难于实用的瓶颈所在,本发明提供了小波包解码器中小波重构的一个快速算法,根据在小波的重构过程中需要多次插0值的特性,为降低小波重构的计算量,利用子带0插值的规则性,在计算时避开了这些0插值点的计算;为降低存储空间上的开销,只需用一个缓冲存储器去存储必要的数据。
本发明所说的基于小波变换的音频信号编/解码方法应用于宽带音频信号的音乐进行处理时,在采用同样心理声学模型的情况下,其无失真压缩率(相对意义上)比通常MPEG要有明显提高,而且本发明中对小波虑波器划分方法以及解码过程中的快速算法上有比以往的小波技术有所突破,克服了小波应用中的瓶颈问题,充分利用了小波和小波包变换的时频局域化和多分辨率分析性质。
附图说明    下面将结合附图对本发明的一个实施例进行详细说明。
图1是本发明主要电路结构的方框图。
图2是解码器结构。
图3是编码器结构。
图4是临界频带的典型划分表。
图5是MPEG子带滤波器组频带划分与临界频带带宽的比较。
图6是小波包子带分解的一个实例。
图7是小波包分解树和合成树。
图8是一个小波包子带及其样本点实例。
图9是小波包解码中子带合成的过程。
图10是小波树结构及计算量和RAM空间占用情况对比。
具体实施方式  本实施例应用DSP作为主要的运算器件,完成音频数据的编码和解码算法,用一片单片机作为主要逻辑件。
在详细论述本发明技术方案前,涉及基于小波音频压缩技术的心理声学模型由以下背景资料提供。
数字音频压缩编码技术能够以比较低的速率获得高质量的编码效果,其基本原理在于:1)设法消除音频信号的冗余度;2)充分利用人耳听觉特性。正常人可以听到频率范围在20Hz~20kHz,强度范围为-5dB~130dB的声音,并具有判别响度、音调和音色的本领。人耳的听觉特性涉及了有关心理声学和生理声学等方面的问题。人耳听觉特性在宽带音频编码中的应用主要体现在以下几个方面:听觉的强度和频率范围特性;掩蔽效应及人耳的高频定位特性。前者是在编码中将听阈曲线以下的声音信号滤掉,以减少记录传输的信息量,节约编码的比特数。利用掩蔽效应原理,低于掩蔽门限的弱信号可不做编码,以提高比特利用率;并将量化噪声控制在掩蔽门限以下,从而节省了量化的比特数,消除声音的听觉无关度。根据人耳的高频定位特性,在多通道立体声编码中可以对高频成分特殊处理,大量减少高频信息冗余,提高压缩效率。在变换编码中,时域帧长(即时域窗长度)的选择受两个互相矛盾的因素制约:帧长越大,则编码增益越高;而过大的帧长将会使时域分辨率降低,而产生严重的“预回声”。因此,选择一个合适的帧长,使编码增益和“预回声”的抑制都达到一个最佳的平衡点,是很重要的。实验证明,当帧长缩短到2ms~5ms时,由于前向掩蔽效应,“预回声”会被其后面的冲击响应所掩蔽。例如,在48kHz采样时,窗长为256时,其时域分辨率为2.7ms,由于前掩蔽效应,人耳察觉不到“预回声”。在心理声学中,一个纯音可以被以它为中心,且具有一定带宽的连续噪声所掩蔽,若在这一频带内噪声功率等于该纯音的功率,此时该纯音处于刚好能被听到的临界状态,即称这一频带为临界带宽(单位为Bark)。临界频带的一个典型划分如图4所示。临界频带是编码中子带划分的心理声学依据。人耳对音频信号的分析以临界频带为基础,类似一个非等带宽滤波器组,在不同的子带中差异很大,子带编码就是利用了这一性质而设计出来。因此,临界频带是编码中子带划分的心理声学依据。在子带编码中,子带的划分应尽量与人耳临界频带的宽度接近,以便更好的适应人耳的听觉特性。在传统的子带编码中,这一要求并没有能够得到很好的满足。原因在于,能够接近人耳的听觉特性的非等带宽滤波器组设计涉及一些技术发面的困难。例如,MPEG用32个等带宽的子带滤波器组来划分人耳听觉的频率带宽,如图5所示。在这种子带的划分中,在低频部分一个子带包含多个临界频带,而在高频部分,一个临界频带有被分成多个子带,子带的利用效率很低,不可能很好的逼近人耳的听觉特性(在低频部分尤其如此)。但其优点在于,等带宽多相滤波器组的优势是各子带滤波器的阶数相同,计算中不存在延迟问题,且滤波器具有较好的抗混叠性质。利用这种滤波器组进行音频压缩编码,技术实现上比较简单,但人耳的听觉特性的利用率是有限的,很难实现高压缩比的无失真编码。
基于小波的音频压缩技术,就是为了从根本上解决传统音频压缩编码中的上述瓶颈问题而提出的,小波分析近年来发展很快的一门数学分支,具有信号时频局部化分析和多尺度分析的能力,在有限个子带分解中,基于小波的子带分解可以更好的接近人耳的临界频带,即更好的利用人耳的心理听觉特性,因而极大的推动了数字信号处理技术的发展。
根据以上原理,在本发明中,利用听觉的前向掩蔽效应,在保证较高的编码增益下,有效的抑制因时域分辨率不足而造成的“预回声”现象;利用掩蔽效应,确定量化级别,控制量化噪声使之低于或尽可能接近人耳的掩蔽门限,实现无失真音频编码以及在低码率下提高音频编码的质量。本发明中的一个小波包子带分解实例如图6所示。
本发明所说的技术方案总体上可以分为音频信号编码和解码两个部分的操作,其流程分别如下:编码过程:
(1)从麦克风或输入线路中采入音频信号;
(2)经低通滤波器滤除高频信号;
(3)经AD转换后成为数字信号PCM流;
(4)数字信号进入DSP,利用本专利所述的算法进行压缩编码,形成压缩码流;
(5)单片机读入压缩码流,写入存储介质。解码过程:
(6)单片机从存储介质或PC上读出压缩码流;
(7)将压缩码流传入DSP;
(8)DSP利用本专利所述的算法进行解压缩,形成PCM流;
(9)PCM流经DA转换后形成模拟信号;
(10)模拟信号通过低通滤波器滤去高频信号;
(11)滤去高频信号的模拟信号经耳机或扬声器播出;
编码过程中,麦克风或其它输入线路采入音频信号,然后经低通滤波器滤除高频信号,其后是经模拟数字转换器转换后成为数字信号PCM流,这几步通过现有技术即可实现。
接着,数字信号进入数字信号处理器(DSP)。在数字信号处理器中(本实施例中采用的型号是TMS320C54XX),对信号处理的方法是本发明技术方案要解决的主要技术问题,主要包括音频信号的小波分解虑波器的获得及编码器的获得。这里所说的分析和重构滤波器及编码器和解码器的功能均是在DSP中实现的。因为在解码过程中在数字信号处理器中的操作过程是编码过程的相反步骤,所以这里将小波分解和重构滤波器、编码器和解码器的实现方法一并阐述,其处理过程分别如下:
DSP中基本的编码过程如下,见附图2:
(1)移入128点新样本于缓冲池,同时从缓冲池中移出128点最旧的样本,此缓冲池长度为1250个点;
(2)将该缓冲池中的序列分别与16个小波分析滤波器卷积,并进行临界再采样,获16个分解序列对应16个频带,由于子带的非均匀性,各子带的再采样率是不一样的,具体如下:子带1~4抽样各为1个样本,子带5~6各为2个样本,子带7~13各为8个样本,子带14~15各为16个样本,子带16为32个样本;
(3)以3*128点为一个群,这样各子带中的样本数为原来的三倍,即子带1~4中各有3个样本,子带5~6各有6个样本,子带7~13各有24个样本,子带14~15各有48个样本,子带16有96个样本;分别找出各子带的尺度因子,方法同MP2,将各子带归一化;
(4)同时该3*128点的频谱信息,代入心理声学模型(1或2),求得各子带的量化位数;
(5)根据(4)获得的量化位数量化各子带中的样本,量化方法如下:
设:每子带的量化位数为a,该子带的样本数为Num,则各样本的量化后结果为b:
b=a>>(16-Num)
(6)无失真编码,采用霍夫曼编码;
(7)打包,编码输出。
解码过程与编码过程相反,其基本的过程如下,见附图3:
(1)输入编码序列,以与编码过程相反的顺序解包,即霍夫曼解,还原为16个子带上的样本,推入16个缓冲池;
(2)将各子带上的样本反量化,同时除于尺度因子;
(3)相应于编码过程(2)中的再采样,将各子带上的样本间插零值,具体个数为:子带1~4中2个样本间插入127个零,子带5~6中2个样本间插入63个零,子带7~13中2个样本间插入15个零,子带14~15中2个样本间插入7个零,子带16中2个样本间插入3个零;
(4)将16个缓冲池中的序列与合成滤波器组分别卷积各得128个数据,将16个128点对应相加的一128点序列,该序列即为输出值;
(5)输出该序列。
目前,利用小波对信号进行处理时,为进一步提高频率分辨率,需要将信号继续分解,通常的做法是进行类Mallat算法,如图7所示。传统的做法是逐层分解和逐层合成,其具体方法如下所述:
在分解过程中将信号与分解滤波器进行卷积,然后进行下采样,重复这一过程直至到达二叉树相应的子带结点;而在重构过程中则需要把每一叶子结点上的小波系数与重构滤波器进行卷积,然后进行上采样(一般为添零),直至回到二叉树的根结点。很显然,在实现卷积的数值计算过程中不可避免地会多次引入截断误差,而每次卷积之后的上、下采样则会使该误差扩散,多次重复这一过程则会导致误差累积。当层次较深时,误差甚至会扩散到整个子带上,从而整个子带上的数据都成为虚假数据。
本发明中小波分解和重构滤波器的获得是通过预先卷积滤波器,利用卷积对线性系统满足结合律的特点,把各个小波滤波器先进行卷积运算;另一方面考虑上下采样的影响来控制各个小波滤波器在小波包分解与合成树中所处的位置,由此可得到相应的子带划分多相滤波器组。其对应的公式如下所示:
Figure C0110968600101
其中:S1,D1:输入信号;
      f1,f2:小波分解滤波器
      rf1,rf2:小波重构滤波器
      n:下采样n倍
      n:上采样n倍
设所采用小波包二叉树如图7的三层小波包二叉树,以子带2为例进行说明,设源信号序列为resSig,子带2上得到的分解系数序列为sub2Sig,分解低通小波滤波器为LD,分解高通小波滤波器为HD,*为卷积运算,则该子带分解滤波器及该子带分解序列的生成方法为:
其中bigFilter2为该子带最终生成的分解滤波器,上采样为间插零,Sub2Sig为已下采样的该子带的分解序列。
若低通小波重构滤波器为LR,高通小波重构滤波器为HR,*为卷积运算,则该子带分解滤波器和该子带合成序列的生成方法为:
其中RecFilter2为该子带最终生成的合成滤波器,Rec2Sig为该子带的合成序列,所有各子带上的合成序列对应相加即为合成样本。
其它分解子带滤波器和重构滤波器可以由类似的方法得到。
解码过程中,对由音频小波包编码器得到的音频压缩码流进行解码时,对解码速度和内存资源有较高的要求,本发明根据子带的特点,为减少计算量和存储空间,本发明提出了快速算法,该算法可以极大地降低计算量和存储空间,它为音频数据小波包压缩方案的实现提供了保证。
以如图8所示的小波包分解为例,其分解样本每帧长度为128点,其中第1~4子带各为1个样本点,第5~6子带各为2个样本点,第7~13子带各为8个样本点,第14~15子带各为16个样本点,第16子带为32个样本点。
合成子带时,按常规方法,各子带插值分别与合成小波滤波器卷积后相加,如图9所示:
然而这种方法有很明显的没有效率的地方,首先各子带均有相当多的零参与卷积,而且需要系统分配大量RAM去存储16个序列,明显缺乏执行效率。
因此根据小波分解序列的特点,利用子带0插值的规则性,在计算时避开了这些0插值点的计算;只需用一个缓冲存储器去存储必要的数据,因此极大地减少了存储空间。
本专利的快速算法和通常卷积算法均采用DB-10小波作为小波基,小波树结构均如图10所示,其重构128点的计算量和RAM空间占用情况对比如下:(滤波器长度分别为1144,1144,1144,1144,568,568,136,136,136,136,136,136,136,64,64,28)
常规方法计算量(乘法)=16*(4*(1144*128)+2*(568*128)+7*(136*128)+2*(64*128)+28*128)=872960*16;
常规方法RAM空间=4*(1144+128)+2*(568+128)+7*(136+128)+2*(64+128)+28+128=8868
本发明算法计算量(乘法)=16*(4*(1144/128*128)+2*(568/64*128)+7*(136/16*128)+2*(64/8*128)+28/4*128)=17408*16
本发明算法RAM空间=*(1144+128)/128+2*(568+128)/64+7*(136+128)/16+2*(64+128)/8+(28+128)/4=264结合某一具体小波滤波器前后还具有许多零元,则其计算量还可以大幅低。实现本发明快速算法的核心C-伪代码:
  for(ii=0;ii<子带数;ii++)

  {

      samplept=sample+帧长-1;//指向数据帧的末尾

      for(inti=0;i<样本序列长度;i++)

      {

          ConvResult=0;

          for(intj=0;j<该子带中的样本数;j++)

          {

          //计算该次计算所对应的滤波器和输入样本序列的起始运算位置

          //gap为该子带样本间的0插值数。

          kBegin=((i-j*gap+0x7F)&0xFFFFFF80);
for(int k=kBegin;k<=子带滤波器长度;k+=帧长)

                  ConvResult+=样本序列[k]*子带滤波器[k];

          }

          (*samplept--)+=ConvResult;

      }

  }//End ii loop
在编码过程中,编码打包输出后,由单片机读入压缩码流,写入存储介质,完成音频信号的压缩编码过程。总的来说,解码过程是编码过程的逆顺序,单片机从存储介质或PC上读入压缩码流,将压缩码流传入DSP,在DSP中的处理已在上面分析编码方法中做出说明,DSP输出该序列形成PCM流,PCM流经数字模拟转换器转换后形成模拟信号,模拟信号通过低通滤波器滤去高频信号,滤去高频信号的模拟信号经耳机或扬声器播出。
本实施例只是结合一些特定的硬件对本发明所述的方法进行阐述,本发明技术方案的实施并不局限于此,由本领域普通技术人员所能做出的各种变化或改进都不会脱离本发明的范围。

Claims (3)

1、一种基于小波变换的音频信号压缩编/解码方法,该方法通过由低通滤波器、模数和数模转换器、数字信号处理器、单片机组成的装置执行对音频数据的压缩编/解码,其特征在于进行以下步骤的操作:
编码过程:
(1)从麦克风或其它输入线路采入音频信号;
(2)经低通滤波器滤除高频信号;
(3)经模拟数字转换器转换后成为数字信号PCM流;
(4)数字信号进入数字信号处理器,移入128点新样本于缓冲池,同时从缓冲池中移出128点最旧的样本;
(5)将该缓冲池中的序列分别与16个小波分析滤波器卷积,并进行临界再采样,获16个分解序列对应16个频带,由于子带的非均匀性,各子带的再采样率是不一样的,具体如下:子带1~4抽样各为1个样本,子带5~6各为2个样本,子带7~13各为8个样本,子带14~15各为16个样本,子带16为32个样本;
(6)以3*128点为一个群,这样各子带中的样本数为原来的三倍,即子带1~4中各有3个样本,子带5~6各有6个样本,子带7~13各有24个样本,子带14~15各有48个样本,子带16有96个样本;分别找出各子带的尺度因子,将各子带归一化;
(7)同时该3*128点的频谱信息,代入心理声学模型,求得各子带的量化位数;
(8)根据(7)获得的量化位数量化各子带中的样本,量化方法如下:
设:每子带的量化位数为a,该子带的样本数为Num,则各样本的量化后结果为b:
b=a>>(16-Num)
(9)无失真编码;
(10)打包,编码输出;
(11)单片机读入压缩码流,写入存储介质;
解码过程:
(12)单片机从存储介质或PC上读入压缩码流;
(13)将压缩码流传入数字信号处理器;
(14)输入编码序列,以与编码过程相反的顺序解包,还原为16个子带上的样本,推入16个缓冲池;
(15)将各子带上的样本反量化,同时除于尺度因子;
(16)相应于编码过程(5)中的再采样,将各子带上的样本间插零值,具体个数为:子带1~4中2个样本间插入127个零,子带5~6中2个样本间插入63个零,子带7~13中2个样本间插入15个零,子带14~15中2个样本间插入7个零,子带16中2个样本间插入3个零;
(17)将16个缓冲池中的序列与合成滤波器组分别卷积各得128个数据,将16个128点对应相加的一128点序列,该序列即为输出值;
(18)输出该序列,形成PCM流;
(19)PCM流经数字模拟转换器转换后形成模拟信号;
(20)模拟信号通过低通滤波器滤去高频信号;
(21)滤去高频信号的模拟信号经耳机或扬声器播出。
2、根据权利要求1所述的音频信号压缩编/解码方法,其特征在于,编码过程步骤(5)中所说的小波分析滤波器的实现方法是利用卷积对线性系统满足结合律的特点,把各个小波滤波器先进行卷积运算;另一方面根据上下采样的影响来控制各个小波滤波器在小波包分解与合成树中所处的位置,由此可得到相应的子带划分多相滤波器组,其对应的公式如下所示:
其中:S1,D1:输入信号;
      f1,f2:小波分解滤波器
      rf1,rf2:小波重构滤波器
      n:下采样n倍
     
Figure C0110968600034
n:上采样n倍
解码时小波重构滤波器的实现方法是上面所说分析滤波器实现方法的逆过程。
3、根据权利要求1或2所述的音频信号压缩编/解码方法,其特征在于,解码过程中小波包解码器中小波重构采取一种快速算法,根据在小波的重构过程中需要多次插0值的特性,利用子带0插值的规则性,在计算时避开这些0插值点的计算;只用一个缓冲存储器存储必要的数据。
CNB011096861A 2001-03-19 2001-03-19 一种基于小波变换的音频信号压缩编/解码方法 Expired - Fee Related CN1138254C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011096861A CN1138254C (zh) 2001-03-19 2001-03-19 一种基于小波变换的音频信号压缩编/解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011096861A CN1138254C (zh) 2001-03-19 2001-03-19 一种基于小波变换的音频信号压缩编/解码方法

Publications (2)

Publication Number Publication Date
CN1375817A CN1375817A (zh) 2002-10-23
CN1138254C true CN1138254C (zh) 2004-02-11

Family

ID=4658081

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011096861A Expired - Fee Related CN1138254C (zh) 2001-03-19 2001-03-19 一种基于小波变换的音频信号压缩编/解码方法

Country Status (1)

Country Link
CN (1) CN1138254C (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454765C (zh) * 2006-03-14 2009-01-21 安凯(广州)软件技术有限公司 一种提高音频解码器解码精度的方法
CN101771399B (zh) * 2010-03-22 2012-10-17 上海辛克试验机有限公司 一种基于单片机的mdac窄带跟踪滤波器及其实现方法
US9571931B1 (en) * 2013-04-09 2017-02-14 Cirrus Logic, Inc. Systems and methods for reducing non-linearities of a microphone signal
EP3162086B1 (en) * 2014-06-27 2021-04-07 Dolby International AB Apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
EP3489953B8 (en) * 2014-06-27 2022-06-15 Dolby International AB Determining a lowest integer number of bits required for representing non-differential gain values for the compression of an hoa data frame representation
CN107230998A (zh) * 2017-06-09 2017-10-03 东华大学 降低功率波动频率及区间最大变化率风电场功率平滑方法
CN112133317B (zh) * 2020-09-21 2021-08-10 易兆微电子(杭州)股份有限公司 一种基于sbc的低传输比特率高质量语音编解码方法
CN113129911A (zh) * 2021-03-19 2021-07-16 江门市华恩电子研究院有限公司 一种音频信号编码压缩和传输的方法及电子设备
CN116778936A (zh) * 2023-08-17 2023-09-19 建朗电子(深圳)有限公司 一种基于混沌映射与人耳模型的音频压缩与恢复方法

Also Published As

Publication number Publication date
CN1375817A (zh) 2002-10-23

Similar Documents

Publication Publication Date Title
EP1715476B1 (en) Low-bitrate encoding/decoding method and system
US6115689A (en) Scalable audio coder and decoder
JP4373006B2 (ja) スケーラブル音声コーダとデコーダ
US6253165B1 (en) System and method for modeling probability distribution functions of transform coefficients of encoded signal
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
CN1662958A (zh) 使用频谱孔填充的音频编码系统
CN1262990C (zh) 利用谐波提取的音频编码方法和设备
JPH1084284A (ja) 信号再生方法および装置
Sinha et al. The perceptual audio coder (PAC)
CN1138254C (zh) 一种基于小波变换的音频信号压缩编/解码方法
CN101105940A (zh) 音频编解码的量化方法、反变换方法及音频编解码装置
CN1318904A (zh) 一种实用的基于小波变换的声音编解码器
CN1154084C (zh) 一种基于伪小波滤波的音频编/解码方法
CN1424713A (zh) 高频耦合的伪小波5声道音频编/解码方法
CN1460992A (zh) 用于感知音频编/解码的低延时、自适应的多分辨率滤波器组
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
WO1999044291A1 (fr) Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees
CN1290078C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
CN1123865C (zh) 小波音频编码信号处理中块效应消除方法
US20030158740A1 (en) Inverse-modified discrete cosine transform and overlap-add method and hardware structure for MPEG layer3 audio signal decoding
CN1130832C (zh) 小波分解滤波器组和重构滤波器组的构造方法
Singh et al. An Enhanced Low Bit Rate Audio Codec Using Discrete Wavelet Transform
Ruiz et al. New algorithm for searching minimum bit rate wavelet representations with application to multiresolution-based perceptual audio coding
Reyes et al. A new cost function to select the wavelet decomposition for audio compression
Tsutsui 43.7 ATRAC (Adaptive Transform Acoustic Coding) and ATRAC 2

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
PP01 Preservation of patent right

Effective date of registration: 20051209

Pledge (preservation): Preservation

PD01 Discharge of preservation of patent

Pledge (preservation): Preservation

Release effective date: 20060609

PP01 Preservation of patent right

Effective date of registration: 20061102

Pledge (preservation): Preservation

PD01 Discharge of preservation of patent

Date of cancellation: 20071102

Pledge (preservation): Preservation registration

PP01 Preservation of patent right

Effective date of registration: 20071102

Pledge (preservation): Preservation

PD01 Discharge of preservation of patent

Date of cancellation: 20081102

Pledge (preservation): Preservation registration

PP01 Preservation of patent right

Effective date of registration: 20081102

Pledge (preservation): Preservation

PD01 Discharge of preservation of patent

Date of cancellation: 20091102

Pledge (preservation): Preservation registration

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040211

Termination date: 20080319