CN101179716B - 一种压缩域的传输数据流音频自动增益控制方法 - Google Patents

一种压缩域的传输数据流音频自动增益控制方法 Download PDF

Info

Publication number
CN101179716B
CN101179716B CN2007100318673A CN200710031867A CN101179716B CN 101179716 B CN101179716 B CN 101179716B CN 2007100318673 A CN2007100318673 A CN 2007100318673A CN 200710031867 A CN200710031867 A CN 200710031867A CN 101179716 B CN101179716 B CN 101179716B
Authority
CN
China
Prior art keywords
gain
data
audio
power
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007100318673A
Other languages
English (en)
Other versions
CN101179716A (zh
Inventor
郭礼华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN2007100318673A priority Critical patent/CN101179716B/zh
Publication of CN101179716A publication Critical patent/CN101179716A/zh
Application granted granted Critical
Publication of CN101179716B publication Critical patent/CN101179716B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种压缩域的传输数据流音频自动增益控制方法。该方法采用可编程逻辑器件(FPGA)和数字处理芯片(DSP)协同完成压缩音频数据的增益调节,包括:FPGA提取TS流中的音频压缩数据,存入存储器之一;DSP首先取出存储器之一的数据,从中提取编码参数、比例因子和量化音频数据;然后把量化音频数据进行反量化和反缩放处理;接着计算信号的频谱能量,依据目标频谱能量采用预测方法计算增益量;最后依据增益量修改压缩音频数据中的标志位,并把修改后数据存入存储器之二;FPGA再把存储器之二的音频压缩数据嵌到TS流中。该方法不需要把TS流的压缩音频数据解压到原始模拟音频信号,增益控制完全在音频压缩域内实现。

Description

一种压缩域的传输数据流音频自动增益控制方法
技术领域
本发明涉及音频增益控制方法,特别是涉及一种TS(传输数据)流压缩音频的自动增益控制方法。 
背景技术
现有的音频增益方法都是在原始的未压缩的音频信号上进行增益控制,但是随着数字广播系统的逐步推广,未来的广播系统将逐渐被数字广播系统所取代,而数字广播系统中的音频信号都是经过MPEG压缩的,所以现有的音频增益方法不能直接对压缩后的音频进行增益控制,而需要首先把压缩音频数据解压到原始的未压缩数据,然后利用传统的音频增益方法进行增益控制调节,接着把增益控制后的音频数据进行MPEG压缩,最终完成数字广播系统中的压缩域音频的自动增益控制。从处理流程上来看,传统的方法在处理压缩域的TS流音频自动增益控制过程非常繁琐,并且还会由于数据的解压和压缩这些过程给音频数据带来损耗,降低音频的原有音质。 
发明内容
本发明就是针对以上的问题,提出一种TS流压缩音频的自动增益控制方法,该方法直接应用到数字广播系统的发射端,调节各个节目之间的音频增益,提高广播质量。 
本发明的目的通过如下技术方案实现: 
一种压缩域的传输数据流音频自动增益控制方法:采用FPGA(可编程逻辑器件)和DSP(数字处理芯片)协同完成TS流中的音频数据的增益调节,控制方法包括如下步骤: 
(1)FPGA芯片之一提取TS流数据中的音频压缩数据,并存入存储器之一; 
(2)DSP处理器从存储器之一中取出音频压缩数据,并在音频压缩数据中提取编码参数; 
(3)DSP处理器根据提取的编码参数信息,提取相应的比例因子和量化音频数据; 
(4)DSP处理器根据音频解压原理,把量化音频数据进行反量化,然后根据比例因子再进行反缩放处理,得到相应的子带频谱信号; 
(5)DSP处理器利用子带的频谱信号,计算当前信号的频谱能量,并与目标频谱能量进行比较,采用预测方法实现增益量的计算; 
(6)DSP处理器把计算出来的增益量,通过log函数转换成修改量,直接修改压缩数据流中的缩放因子索引值系数,最后把修改后的压缩数据存入存储器之二中; 
(7)FPGA芯片之二取出DSP处理器存储到存储器之二的数据,把数据进行TS组包,并嵌回原始的TS流中。 
为进一步实现本发明目的,所述增益量的调节是修改音频压缩数据流中的scalefactor缩放因子系数,当增益大于1的时候,减小scalefactor缩放因子,当增益小于1的时候,增加scalefactor缩放因子,所增加或减小scalefactor缩放因子的值为修改量。 
所述的修改量是所计算出来的增益量的log函数值。 
所述的增益量计算主要选用频谱功率,频谱功率主要是:压缩音频信号进行反量化和反缩放,得到子带频谱信号,利用每个子带的频谱信号,计算各子带的频谱功率,并把各子带频谱功率进行叠加,计算信号在频谱域的总功率。 
所述增益量的获取是采用功率预测方法,给出目标信号功率pref,解压音频数据计算当前信号功率px,利用gain=gain*(1+mu*px*(pref-py))预测公式计算增益因子gain,其中mu增益调节因子,pref理想增益值,px当前信号功率,py是目标功率,gain是增益值。 
相对于现有技术本发明具有如下优点和有益效果: 
(1)此技术发明直接在压缩域内对音频的增益进行调节,不需要解压和压缩过程,解决了传统音频增益方法在解决压缩音频信号的增益控制的难题,并且保持了音频的原有音质。 
(2)此技术发明的解决方案完全在音频的压缩域内进行,避免了解压和压缩过程,从最终的系统结构框架上来看,整体实现流程简单,系统复杂度低。 
(3)此技术发明所用器件主要是可编程逻辑器件,DSP处理芯片和一些常用的数字芯片,这些芯片的价格非常低廉,所以系统的总体成本很低廉。 
附图说明
图1位TS流压缩音频的自动增益控制器的硬件结构图 
图2为TS流压缩音频的自动增益控制器的系统框图。 
具体实施方式
下面结合附图和实施例对本设备作进一步的说明,但本发明所要求保护的范围并不局限 于实施例所涉及的范围。 
如图1所述,一种压缩域的TS流音频自动增益控制系统主要采用FPGA芯片和处理器共同完成TS流压缩音频的自动增益控制。在整个系统中,输入的TS流数据必须先经过一个串/并转换器之一将输入的串行TS流数据转换成并行数据,并行数据是8位宽,串/并转换器用CYPRESS公司的CY7B933芯片。经过串/并转换后的8位宽数据送入FPGA芯片之一,FPGA芯片之一完成从TS流数据提取相应的音频数据。提取出来的音频数据直接存储到存储器之一中。存储器之一采用NEC公司的D42280GU型号的FIFO芯片。当存储器之一中数据存储够8K数据后,处理器将一次性的从存储器之一中提取8K音频数据。处理器将这8K音频数据进行相应的自动增益处理。处理器处理完后的数据存入存储器之二,存储器之二也采用NEC公司的D42280GU型号的FIFO芯片。FPGA芯片之二把存储器之二中的数据进行TS打包处理。打包处理后的数据再送入并/串转换器之二。并/串转换器采用CYPRESS公司的CY7B923芯片完成。并/串转换器之二将打包好的数据转换成串行的TS流输出。在实际的系统中,FPGA芯片之一和FPGA芯片之二采用1片ALtera公司的EP1C8来完成,它们分别是两个不同的模块。处理器采用TI公司的TMS320C6000芯片。 
附图2是TS流压缩音频的自动增益控制方法的主要系统框图。TS流压缩音频的自动增益控制方法主要包括以下处理步骤: 
(1)TS流音频包提取。TS流主要有两种格式,188和204包结构大小,这两种包结构的主要区别在于204包结构比188包结构多了16位的RS的检验位,其他结构都相同,即4个字节的包头和184字节的数据。在4个字节的包头中,其中有一个13bit大小的PID标志,主要标识184字节数据的节目源。FPGA芯片之一利用已知的音频的PID,提取其中的184字节的音频数据,提取后的存入存储器之一,等待处理器的提取。 
(2)提取编码参数。处理器提取存储器之一中的音频数据后,处理器在压缩音频数据中寻找字节为“FFF”的帧同步。找到帧同步后,接下来的数据位分别是1bit的版本号、2bits的层标志、1bit的错误保护标志,4bits的比特率标志、2bits的采样频率标志、1bit的填充位、1bit的扩展位、2bits的模式位、2bits的模式扩展位、1bit的版本标志、1bit的原创标志和2bits重点标志。这些标志位和帧同步,总共32bits,即4个字节,具体包头结构在1997年清华大学出版社出版的,由钟玉琢,乔秉新,祁卫所著的“运动图像及其伴音通用编码国际标准一MPEG2”已有详细的描述。这些标志位就是后继的编码所需要的编码参数。 
(3)提取编码数据。根据提取的编码参数,可以确定当前压缩音频数据的层号,比特 率和采样率等信息参数,这些参数将用来辅助提取真正的压缩音频数据。在压缩音频数据中主要包括两种信息,一种是比例因子信息,另外一种是量化音频数据。根据比特分配表,处理器可以从压缩音频数据中得到每一个子层的比例因子和量化音频数据。这两部分数据是整个系统中的关键数据,量化音频数据可以用来统计音频信号的能量大小,而比例因子主要用来调节音频信号的最终增益。 
(3)反量化和反缩放。提取的量化音频数据,处理器根据音频解压算法,进行相应的反量化处理和反缩放处理。逆量化值可以用下面的线性公式得到: 
s ′ ′ ′ = 2 nb 2 nb - 1 * ( s ′ ′ + 2 - nb + 1 )
其中s
Figure 2007100318673_0
是分数值,s″是逆量化值,nb是分配给子带中的样点的位数。 
经过逆量化后的逆量化值必须进行反缩放。缩放计算过程如下: 
s′=factor*s″ 
其中factor是缩放比例,在缩放表中利用比例因子索引得到。 
(4)频谱计算和功率调节。经过反量化和反缩放处理后的数据就是各个子带的频谱信号。由于要进行音频增益控制,所以处理器必须根据音频信号的大小进行调节。最常用的方法,就是把压缩音频解码到原始的音频信号,再进行调节;但是这样算法复杂度高,为此处理器直接根据音频的频谱信息,计算相应的频谱功率,然后进行调节。首先处理器把各个子带的频谱分别计算出相应的功率,然后再对32个子带进行功率平均,从而完成整个帧的频谱功率计算。接下来的进行功率调节,也即计算调节增益量。再进行功率调整中,主要的调节算法如下: 
第一步:初始化。设定相应的初始化参数并把当前的频谱功率设定当前信号的功率px和目标信号的功率pref,并初始化参数α,mu,gain。 
第二步:根据计算出来的功率利用下面公式更新当前信号功率、目标功率和增益值。 
px=α*px+(1-α)*px 
gain=gain*(1+mu*px*(pref-py)) 
py=gain*px 
其中α是功率更新因子,mu增益调节因子,pref理想增益值,px当前信号功率, 
py是目标功率,gain增益值。 
第三步:重复第二步。 
(5)调整比例因子。通过信号的频谱功率可以计算出相应的增益值,这个增益值就是用来进行比例因子调节的依据。当增益大于1时候,处理器相应调大比例因子,当增益小于1时候,处理器调小比例因子。在处理器实际调节比例因子过程中,处理器并不是直接调节比例因子,而是调整比例因子的索引值。假设当前的索引值为x的话,调整后的索引值为x-log(gain)。把调整完后的数据重新放回到原始的压缩音频数据中,然后处理器将处理后的数据存储到存储器之二。 
(6)TS流组包。由于在整个处理过程中,最终只是修改了比例因子的索引值,并没有改变其字节大小,而且其它信息完全仍然得以保留,所以经过调整后的音频数据,其数据大小和原始的压缩音频数据大小是一样的。为此FGPA芯片之二从存储器之二中提取处理器处理后的数据,并在这些数据前加上4个字节的TS流包头(如果是204包结构,相应增加16个字节的RS检验位),最后FGPA芯片把加上TS流包头后的数据直接嵌回到原始的TS流数据中,从而完成整个TS流压缩音频的自动增益控制过程。 

Claims (5)

1.一种压缩域的传输数据流音频自动增益控制方法,其特征在于,采用可编程逻辑器件和数字处理芯片协同完成TS流中的音频数据的增益调节,该控制方法包括如下步骤:
(1)可编程逻辑器件之一提取TS流数据中的音频压缩数据,并存入存储器之一;
(2)数字处理芯片从存储器之一中取出音频压缩数据,并在音频压缩数据中提取编码参数;
(3)数字处理芯片根据提取的编码参数信息,提取相应的比例因子和量化音频数据;
(4)数字处理芯片根据音频解压原理,把量化音频数据进行反量化,然后根据比例因子再进行反缩放处理,得到相应的子带频谱信号;
(5)数字处理芯片利用子带的频谱信号,计算当前信号的频谱功率,并与目标频谱功率进行比较,采用预测方法实现增益量的计算;
(6)数字处理芯片把计算出来的增益量,通过log函数转换成修改量,直接修改压缩数据流中的缩放因子索引值系数,最后把修改后的压缩数据存入存储器之二中;
(7)可编程逻辑器件之二取出数字处理芯片存储到存储器之二的数据,把数据进行TS组包,并嵌回原始的TS流中。
2.根据权利要求1所述的压缩域的传输数据流音频自动增益控制方法,其特征在于,增益量的调节是修改音频压缩数据流中的scalefactor缩放因子索引值系数,当增益大于1的时候,减小scalefactor缩放因子索引值系数,当增益小于1的时候,增加scalefactor缩放因子索引值系数,所增加或减小scalefactor缩放因子索引值系数的值为修改量。
3.根据权利要求2所述的压缩域的传输数据流音频自动增益控制方法,其特征在于,所述的修改量是所计算出来的增益量的log函数值。
4.根据权利要求1所述的压缩域的传输数据流音频自动增益控制方法,其特征在于,所述的增益量计算选用频谱功率,频谱功率主要是:压缩音频信号进行反量化和反缩放,得到子带频谱信号,利用每个子带的频谱信号,计算各子带的频谱功率,并把各子带频谱功率进行叠加,计算信号在频谱域的总功率。
5.根据权利要求1所述的压缩域的传输数据流音频自动增益控制方法,其特征在于,增益量的获取是采用功率预测方法,给出目标信号功率pref,解压音频数据计算当前信号功率px,利用gain=gain*(1+mu*px*(pref-py))预测公式更新增益因子gain,其中mu是增益调节因子,pref是目标信号功率,px是当前信号功率,py=gain*px,gain是增益值。
CN2007100318673A 2007-11-30 2007-11-30 一种压缩域的传输数据流音频自动增益控制方法 Expired - Fee Related CN101179716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100318673A CN101179716B (zh) 2007-11-30 2007-11-30 一种压缩域的传输数据流音频自动增益控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100318673A CN101179716B (zh) 2007-11-30 2007-11-30 一种压缩域的传输数据流音频自动增益控制方法

Publications (2)

Publication Number Publication Date
CN101179716A CN101179716A (zh) 2008-05-14
CN101179716B true CN101179716B (zh) 2011-12-07

Family

ID=39405776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100318673A Expired - Fee Related CN101179716B (zh) 2007-11-30 2007-11-30 一种压缩域的传输数据流音频自动增益控制方法

Country Status (1)

Country Link
CN (1) CN101179716B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101951518B (zh) * 2010-10-12 2012-05-16 高斯贝尔数码科技股份有限公司 一种低码率情形下的数字电视图像修正系统及修正方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1192817A (zh) * 1995-06-16 1998-09-09 诺基亚流动电话有限公司 语音编码器
CN1236164A (zh) * 1998-05-14 1999-11-24 索尼公司 再现和记录装置、译码装置、记录装置、及其相应方法
CN1388965A (zh) * 2000-09-08 2003-01-01 皇家菲利浦电子有限公司 音频信号压缩
CN1750406A (zh) * 2002-08-21 2006-03-22 中山正音数字技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
CN1801325A (zh) * 2004-12-31 2006-07-12 北京中星微电子有限公司 一种数字音频自动增益控制的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1192817A (zh) * 1995-06-16 1998-09-09 诺基亚流动电话有限公司 语音编码器
CN1236164A (zh) * 1998-05-14 1999-11-24 索尼公司 再现和记录装置、译码装置、记录装置、及其相应方法
CN1388965A (zh) * 2000-09-08 2003-01-01 皇家菲利浦电子有限公司 音频信号压缩
CN1750406A (zh) * 2002-08-21 2006-03-22 中山正音数字技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
CN1801325A (zh) * 2004-12-31 2006-07-12 北京中星微电子有限公司 一种数字音频自动增益控制的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开平9-284719A 1997.10.31

Also Published As

Publication number Publication date
CN101179716A (zh) 2008-05-14

Similar Documents

Publication Publication Date Title
US11894003B2 (en) Reconstruction of audio scenes from a downmix
CN100589657C (zh) 编码音频的节约式响度测量方法及装置
JP3391686B2 (ja) 符号化されたオーディオ信号を復号する方法及び装置
CN104683804B (zh) 基于视频内容特征的参数自适应多维码率控制方法
CN101064106B (zh) 用于低复杂度高级音频编码的自适应速率控制算法
CN102592638A (zh) 用于进行压缩数字位流的混合的方法及装置
CN104681028B (zh) 一种编码方法及装置
CN102394063A (zh) 运动图像专家组环绕解码器和恢复多通道音频信号的方法
NO337836B1 (no) Kvantisering av datasignaler
KR100771401B1 (ko) 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법
US8311843B2 (en) Frequency band scale factor determination in audio encoding based upon frequency band signal energy
CN101179716B (zh) 一种压缩域的传输数据流音频自动增益控制方法
CN101138021B (zh) 使用虚拟源位置信息的多声道音频压缩和解压缩方法
CN103152568B (zh) 一种实时截断码流的jpeg2000编码方法及其实施系统
US7426462B2 (en) Fast codebook selection method in audio encoding
CN101350199A (zh) 音频编码器及音频编码方法
TWI231656B (en) Fast bit allocation algorithm for audio coding
CN101960515B (zh) 用于不同滤波器组域之间进行变换的方法和设备
CN111479286A (zh) 一种边缘计算系统减少通信流量的数据处理方法
EP0868031B1 (en) Signal coding method and apparatus
CN110164418B (zh) 基于卷积网格长短时记忆递归神经网络的自动语音识别加速方法
CN101552009B (zh) 一种mp3编码中的量化方法及装置
CN114203191B (zh) Dra同步音频编码的传输方法
CN101409075B (zh) 一种g.729标准中线谱对系数转换及量化的改进方法
JP4516345B2 (ja) 音声符号化情報処理装置および音声符号化情報処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111207

Termination date: 20141130

EXPY Termination of patent right or utility model