CN101207665B - 一种衰减因子的获取方法 - Google Patents

一种衰减因子的获取方法 Download PDF

Info

Publication number
CN101207665B
CN101207665B CN2007101696180A CN200710169618A CN101207665B CN 101207665 B CN101207665 B CN 101207665B CN 2007101696180 A CN2007101696180 A CN 2007101696180A CN 200710169618 A CN200710169618 A CN 200710169618A CN 101207665 B CN101207665 B CN 101207665B
Authority
CN
China
Prior art keywords
signal
pitch period
period signal
decay factor
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101696180A
Other languages
English (en)
Other versions
CN101207665A (zh
Inventor
詹五洲
王东琦
涂永峰
王静
张清
苗磊
许剑峰
胡晨
杨毅
杜正中
齐峰岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007101696180A priority Critical patent/CN101207665B/zh
Priority to PCT/CN2008/070807 priority patent/WO2009059497A1/zh
Priority to BRPI0808765-2A priority patent/BRPI0808765B1/pt
Priority to CN201110092815.3A priority patent/CN102169692B/zh
Priority to CN2012101846225A priority patent/CN102682777B/zh
Priority to CN2008800010241A priority patent/CN101578657B/zh
Publication of CN101207665A publication Critical patent/CN101207665A/zh
Priority to US12/264,593 priority patent/US8320265B2/en
Priority to KR1020080108895A priority patent/KR101168648B1/ko
Priority to ES08168328T priority patent/ES2340975T3/es
Priority to JP2008284260A priority patent/JP4824734B2/ja
Priority to AT09178182T priority patent/ATE484052T1/de
Priority to EP08168328A priority patent/EP2056292B1/en
Priority to DK08168328.6T priority patent/DK2056292T3/da
Priority to DE602008000668T priority patent/DE602008000668D1/de
Priority to DE602008002938T priority patent/DE602008002938D1/de
Priority to EP09178182A priority patent/EP2161719B1/en
Priority to AT08168328T priority patent/ATE458241T1/de
Priority to DE202008017752U priority patent/DE202008017752U1/de
Priority to PL08168328T priority patent/PL2056292T3/pl
Priority to US12/556,048 priority patent/US7957961B2/en
Priority to JP2010060127A priority patent/JP5255585B2/ja
Priority to HK10107180.3A priority patent/HK1142713A1/xx
Application granted granted Critical
Publication of CN101207665B publication Critical patent/CN101207665B/zh
Priority to HK11109983.7A priority patent/HK1155844A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/097Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephone Function (AREA)
  • Fluid-Damping Devices (AREA)
  • Telephonic Communication Services (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Networks Using Active Elements (AREA)
  • Compounds Of Unknown Constitution (AREA)
  • Communication Control (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)

Abstract

本发明公开了一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,包括以下步骤:获取信号最后两个基音周期信号的变化趋势;根据所述信号最后两个基音周期信号的变化趋势获取衰减因子;根据所述信号最后两个基音周期信号的变化趋势,对合成信号进行动态衰减。通过使用本发明,使用历史信号最近的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。

Description

一种衰减因子的获取方法
技术领域
本发明涉及信号处理领域,尤其涉及一种衰减因子的获取方法。
背景技术
在实时语音通信系统中,对语音数据的传输要求实时可靠,例如VoIP(Voice over IP,基于IP的语音)系统。但由于网络系统自身的不可靠特性,数据包在从发送端到接收端传输过程中有可能会被丢弃或者不能及时的达到目的地,而这两种情况都被接收端认为是网络丢包。而发生网络丢包是不可避免的,同时也是影响语音通话质量最主要因素之一,因此在实时通信系统中需要健壮的丢包隐藏方法来恢复丢失的数据包,使得在发生网络丢包的情况下仍获得良好的通话质量。
G.722是ITU-T制定的应用于语音通信的语音编码算法。G.722编码器的原理示意图如图1所示:在发送端,G.722编码器把宽带语音分成高低两个子带,并使用ADPCM(Adaptive Differential Pulse Code Modulation,自适应差分脉冲编码调制)分别对两个子带进行编码并通过网络一起发送给接收端。在接收端,使用ADPCM解码器对两个子带分别解码,然后使用QMF(QuadratureMirror Filter,正交镜像滤波)合成滤波器合成最终的信号。
在现有技术中给出了适用于G..722的PLC(Packet Loss Concealment,丢包隐藏)算法,对于两个不同的子带采用了不同的PLC算法,低带部分的PLC算法,即图1中的虚线框中①的部分,而对于高带的PLC算法,对应图1中的虚线框②。对于低带信号,xl(n)对应当前收到的数据帧解码后对应的信号、而yl(n)对应当有丢包时利用zl(n),n=-289,...,-1合成的信号,zl(n)对应进行完CROSS-FADING(交叉衰减)后最终输出的低带信号;对于高带信号,zh(n)为最终输出的高带信号。得到低带信号zl(n)和高带信号zh(n)后,对低带信号zl(n)和高带信号zh(n)作QMF,合成最终要输出的宽带信号y(n)。
下面仅对低带信号做详细介绍:
在没有丢包的情况下,zl(n)=xl(n),即CROSS-FADING时不改变重构信号。
在有丢包情况下,对于第一个丢失的数据帧,使用短时预测器和长时预测器对历史信号zl(n),n<0进行分析,并提取出语音类别信息;接着使用上述预测器和类别信息,使用线性预测基音周期重复的方法生成信号yl(n);然后重构丢失帧的信号zl(n)=yl(n),n=0,…,L-1。另外,ADPCM的状态也要随之同步更新,直到遇到一个好帧。注意到不仅要生成丢失的帧所对应信号,也要生成用于CROSS-FADING的10ms信号yl(n),n=L,…,L+79,那么一旦收到一个好帧,就对xl(n),n=L,…,L+79,和yl(n),n=L,…,L+79做CROSS-FADING处理。注意到此类CROSS-FADING仅在发生丢帧后,接收端收到第一个好帧数据时才进行。
图2为现有技术中给出的低带部分基于基音周期重复部分的LPC模块的更详细的框架。
当数据帧是好帧时,zl(n)被存储到一个缓冲区里面以备后用。
当遇到第一个坏帧时,则需要分两步来合成最终的信号yl(n)。首先对历史信号zl(n),n=-297,…,-1进行分析,然后结合分析的结果合成信号yl(n),n=0,…,L-1,其中L是数据帧的帧长。
该基于基音周期重复部分的LPC模块具体包括以下部分:
(1)LP(Linear Prediction,线性预测)分析
短时分析和合成滤波器A(z)和1/A(z)均是基于8阶LP的滤波器。LP分析滤波定义为:
A(z)=1+a1z-1+a2 z-2+…+a8z-8
LP分析之后,使得历史信号zl(n)通过滤波器A(z)后得到残差信号e(n),n=-289,…,-1:
e ( n ) = zl ( n ) + Σ i = 1 8 a i zl ( n - i ) .
(2)历史数据分析
现有技术中G.722使用基音周期重复方法对丢失的数据进行补偿。因此,首先需要估计出基因周期T0,首先对zl(n)进行预处理,去除在LTP(Long TermPrediction,长时预测)分析中不需要的低频成分,然后通过LTP分析可以得到历史信号的基因周期T0,并结合信号分类模块得到语音的类别。
在G.722附录A中把语音分成了如下几类,如下表所示:
  分类名称   解释
  TRANSIENT   能量变化大的语音,例如爆破音
  UNVOICED   对于非语音信号
  VUV_TRANSITION   语音和非语音信号的转换
  WEAKLY_VOICED   语音信号的开始或者结束
  VOICED   语音信号,例如稳定的元音
(3)基音周期重复
基因周期重复模块用于估计丢失帧的LP残差信号e(n),n=0,…,L-1。在进行基因周期重复之前,如果语音的类别不是VOICED,则采用下面的公式来限制采样点的幅度:
e ( n ) = min ( max i = - 2 , . . . , + 2 ( | e ( n - T 0 + i ) | ) , | e ( n ) | ) × sign ( e ( n ) ) , n=-T0,…,-1
其中,
sign ( x ) = 1 if x &GreaterEqual; 0 - 1 if x < 0
如果语音的类别是VOICED,则丢失信号所对应的残差e(n),n=0,…,L-1采用重复历史数据对应的最后一个基音周期的残差数据获得,即:
e(n)=e(n-T0)
而对于其它类型的语音,为了避免生成的数据周期性太强(对于非语音的数据,如果周期性太强,听起来就会有音乐噪声等不舒服噪声),则使用下面的公式生成丢失信号所对应的残差信号e(n),n=0,…,L-1:
e(n)=e(n-T0+(-1)n)。
除了生成丢失帧对应的信号外,为了保证丢失帧和丢失帧之后的第一个好帧之间的平滑拼接,还要继续生成额外80个样点的数据e(n),n=L,…,L+79,以生成用于CROSS-FADING的信号。
(4)LP合成
在生成丢失帧和CROSS-FADING对应的残差信号e(n)后,接着用下面的公式得到重构的丢失帧信号ylpre(n),n=0,…,L-1:
yl pre ( n ) = e ( n ) - &Sigma; i = 1 8 a i yl ( n - i )
其中,残差信号e(n),n=0,…,L-1,是在章节步骤3基音周期重复中得到的残差。
除此之外,还要继续使用上述公式生成用于CROSS-FADING的80个样点ylpre(n),n=L,…,L+79。
(5)Adaptive muting
为了实现平滑的能量过渡,在与高带信号进行QMF之前,还需要对低带信号进行CROSS-FADING处理,规则如下表所示:
Figure GSB00000235409900042
在上表中,zl(n)为对应最终输出的当前帧对应的信号;xl(n)当前帧对应的好帧的信号;yl(n)对应当前帧同一时刻合成的信号,其中L为帧长,80为进行CROSS-FADING样点的个数。
G.722附录4还考虑到针对不同的语音类型,在进行CROSS-FADING之前对ylpre(n)中的信号的能量进行控制。即
yl(n)=g_mute_lb×ylpre(n)n=0,…,L+79
其中,g_mute_lb为每个样点所对应的系数。它的取值根据语音类型的不同以及丢包情况而变化,如下图3所示。其中开始80个样点对应当前丢失帧的g_mute_lb。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术中使用如图3所示的静态的自适应衰减因子来控制合成信号的能量。虽然它所规定的衰减因子也是逐渐变化的,但它的衰减速度,即衰减因子的大小,对同一类型的语音,都是一样的。但人的发音的特点是很丰富多变的,如果衰减因子不匹配,重建后的信号就会有令人不舒适的噪声,特别是在稳定语音的末尾,使用静态的自适应衰减因子就不能适应人的语音丰富多变的特点。
例如图4所示的情况,其中T0为历史信号的基音周期,上面的信号对应原始信号,即没有丢包情况下的波形示意图。下面的短划线信号为根据现有G.722合成的信号。从图中可以发现:合成的信号没有保持和原始信号一致的衰减速度,如果同一基音周期重复次数太多,则合成的信号就会出现明显得音乐噪声,与理想的情况差距很大。
发明内容
本发明的实施例提供一种衰减因子的获取方法,用于自适应的动态调整合成信号处理中所使用的衰减因子,实现历史数据和最新收到的数据的平稳过渡。
为达到上述目的,本发明的实施例提供一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,包括以下步骤:
获取信号最后两个基音周期信号的变化趋势;
根据所述信号最后两个基音周期信号的变化趋势获取衰减因子1-C*(n+1),用于对合成信号进行动态衰减yl(n)=ylpre(n)*(1-C*(n+1)),n=0,..,N-1;
其中,ylpre(n)为重构的丢失帧信号,C为衰减系数,N为合成信号的长度,C=(1-R)/T0,T0为基音周期的长度,R为所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,或所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值;
当R为所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值时,
Figure GSB00000235409900061
其中,E1为最后一个基音周期信号的能量,E2为前一个基音周期信号的能量;
当R为所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值时,R=P1/P2;其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值。
与现有技术相比,本发明的实施例具有以下优点:
使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
附图说明
图1是现有技术中G.722编码器的原理示意图;
图2是现有技术中低带部分基于基音周期重复部分的LPC模块示意图;
图3是现有技术中静音因子的取值与语音类型以及丢包情况的关系示意图;
图4是现有技术中原始信号和根据现有G.722合成的信号的示意图;
图5是本发明的实施例一中一种衰减因子的获取方法的流程图;
图6是本发明的实施例一中动态衰减方法后输出信号的示意图;
图7A和图7B是本发明的实施例二中衰减因子获取装置的结构示意图;
图8是本发明的实施例二中衰减因子获取装置的应用场景示意图。
具体实施方式
以下结合附图和实施例,对本发明的实施方式做进一步说明。
本发明的实施例一中提供了一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,如图5所示,包括以下步骤:
步骤s101、获取信号的变化趋势。
具体的,该变化趋势可以通过以下参数表示:(1)信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;(2)信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。
步骤s102、根据该变化趋势获取衰减因子。
以下结合具体的应用场景,描述本发明实施例一的具体处理方法。
本发明的实施例一中,提供了一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,主要针对图3中对衰减因子计算的改进。
具体的,假设接收到的历史信号中最后两个基音周期的信号如图6中的原始信号所示,则根据上述历史信号最后两个基音周期的变化趋势来动态调整自适应动态衰减因子。具体的调整方法包括以下步骤:
步骤s201、获取信号的变化趋势。
可以通过信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值表示信号的变化趋势,即计算历史信号最后两个基音周期信号的能量E1和E2,以及二能量的比值。
E 1 = &Sigma; i = 1 T 0 xl 2 ( - i )
E 2 = &Sigma; i = 1 T 0 x l 2 ( - i - T 0 )
R = E 1 E 2
其中,E1为最后一个基音周期信号的能量,E2为前一个基音周期信号的能量,T0为历史信号对应的基音周期。
或者:
也可以通过历史信号最后两个基音周期的峰值峰谷差的比值来表示信号的变化趋势:
P1=max(xl(i))-min(xl(j))    (i,j)=-T0,...,-1
P2=max(xl(i))-min(xl(j))   (i,j)=-2T0,...,-(T0+1)
其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值,然后计算其比值为:
R = P 1 P 2
步骤s202、根据该获取到的信号的变化趋势,对合成的信号进行动态衰减。
计算公式如下:
yl(n)=ylpre(n)*(1-C*(n+1))    n=0,..,N-1
其中ylpre(n)为重构的丢失帧信号,N为合成信号的长度,C为自适应衰减系数,其值为:
C = 1 - R T 0
对于衰减因子1-C*(n+1)<0的情况下,需令1-C*(n+1)=0,以避免出现采样点对应衰减因子为负的情况。
特殊的,为了避免在R>1的情况下,出现采样点对应幅值溢出的情况下,可以考虑仅在R<1的情况下,使用本实施例步骤s202的公式对合成的信号进行动态衰减。
特殊的,为了避免能量比较小的信号衰减速度过快,则可以考虑仅在E1超过某个限定值的情况下,使用本实施例步骤s202的公式对合成的信号进行动态衰减。
特殊的,为了避免合成信号由于衰减速度过快,特别是在有连续丢帧的情况下,则给衰减系数C设定一个上限,当超过某个限定值时,则使得衰减系数为上限所设定的值。
特殊的,在网络环境差,在有连续丢帧的情况下,为防止衰减速度过快,可以设定一定的条件,例如可以考虑当丢失帧的个数超过指定个数,例如2帧,或者丢失帧对应的信号超过指定长度,例如20ms,或者当前衰减因子(1-C*(n+1))到达指定的阀值后的一个或者多个条件后,则需要对衰减系数C进行调整,以防止衰减过快,导致输出信号为静音的情况。
例如在8K采样,帧长为40个采样点的情况下,可以设定丢失帧个数为4,且衰减因子1-C*(n+1)小于0.9以后,则将衰减系数C调整为较小的值。其中所述较小的值的规则为:
假定预计依当前的衰减系数C和衰减因子的值V,那么衰减因子V将在V/C个采样点后衰减为0,而比较理想的情况是在M(M≠V/C)个采样点后衰减为0,那么调整衰减系数C为:
C=V/M
如图6所示,最上信号为原始信号,中间的信号为合成的信号,从图中可以看到,该信号虽然有一定程度的衰减,但仍然保持了很强的浊音特征,如果持续时间过长,就会表现为音乐性的噪声,特别是在浊音的尾部。最下面信号为使用了本发明实施例中动态衰减之后的信号,可以看出和原始信号已经非常接近。
通过使用上述实施例提供的方法,使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
本发明的实施例二中提供一种衰减因子获取装置,用于丢包隐藏中的合成信号的处理,包括:
变化趋势获取单元10,用于获取信号的变化趋势。
衰减因子获取单元20,用于根据变化趋势获取单元10获取的变化趋势获取衰减因子。
该衰减因子获取单元20进一步包括:衰减系数获取子单元21,用于根据变化趋势获取单元10获取的变化趋势生成衰减系数;衰减因子获取子单元22,用于根据衰减系数获取单元21生成的衰减系数获取衰减因子。还包括:衰减系数调整子单元23,用于在满足特定条件时,将衰减系数获取子单元21获取的衰减系数的值调整为特定值,该特定条件包括衰减系数的值是否超过上限、是否存在连续丢帧的情况、衰减速度是否过快中的一种或多种。
具体的,该变化趋势获取单元10获取的变化趋势可以通过以下参数体现:(1)信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;(2)信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。
该变化趋势使用上述(1)中能量的比值表示时,该衰减因子获取装置的结构如图7A所示,变化趋势获取单元10进一步包括:
能量获取子单元11,用于获取信号最后一个基音周期信号的能量与前一个基音周期信号的能量;能量比值获取子单元12,用于获取能量获取子单元11获取的信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,以该比值表示所述信号的变化趋势。
该变化趋势使用上述(2)中的幅度差值的比值表示时,该衰减因子获取装置的结构如图7B所示,所述变化趋势获取单元进一步包括:
幅度差值获取子单元13,用于获取信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,以及前一个基音周期信号的最大幅度值和最小幅度值的差值;幅度差值比值获取子单元14,用于获取信号最后一个基音周期信号的差值与前一个基音周期信号的差值的比值,以该比值表示所述信号的变化趋势。
本发明的实施例二中一种衰减因子获取装置的应用场景示意图如图8所示,用于使用历史信号的变化趋势来动态调整自适应衰减因子。
通过使用上述实施例提供的装置,使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台设备执行本发明各个实施例所述的方法。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (4)

1.一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,其特征在于,包括以下步骤:
获取信号最后两个基音周期信号的变化趋势;
根据所述信号最后两个基音周期信号的变化趋势获取衰减因子1-C*(n+1),用于对合成信号进行动态衰减yl(n)=ylpre(n)*(1-C*(n+1)),n=0,..,N-1;
其中,ylpre(n)为重构的丢失帧信号,C为衰减系数,N为合成信号的长度,C=(1-R)/T0,T0为基音周期的长度,R为所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,或所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值;
当R为所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值时,
Figure FSB00000235409800011
其中,E1为最后一个基音周期信号的能量,E2为前一个基音周期信号的能量;
当R为所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值时,R=P1/P2;其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值。
2.如权利要求1所述衰减因子的获取方法,其特征在于,所述衰减因子为1-C*(n+1),当1-C*(n+1)<0时,令所述衰减因子1-C*(n+1)=0。
3.如权利要求1所述衰减因子的获取方法,其特征在于,预先为衰减系数C设定一个上限值,当根据C=(1-R)/T0获取的C值超过所述上限值时,使得衰减系数C为所述上限值。
4.如权利要求1所述衰减因子的获取方法,其特征在于,连续丢失多个帧时,则将衰减系数C调整为:
预设信号在M个样点后衰减为零;
令调整后的衰减系数C=V/M,其中V为当前的衰减因子。
CN2007101696180A 2007-11-05 2007-11-05 一种衰减因子的获取方法 Active CN101207665B (zh)

Priority Applications (23)

Application Number Priority Date Filing Date Title
CN2007101696180A CN101207665B (zh) 2007-11-05 2007-11-05 一种衰减因子的获取方法
PCT/CN2008/070807 WO2009059497A1 (fr) 2007-11-05 2008-04-25 Procédé et dispositif d'obtention d'un facteur d'atténuation
BRPI0808765-2A BRPI0808765B1 (pt) 2007-11-05 2008-04-25 Método e aparelho para processamento de um sinal de voz sintetizado em ocultação de perda de pacotes e decodificador de voz
CN201110092815.3A CN102169692B (zh) 2007-11-05 2008-04-25 信号处理方法和装置
CN2012101846225A CN102682777B (zh) 2007-11-05 2008-04-25 一种衰减因子的获取方法和获取装置
CN2008800010241A CN101578657B (zh) 2007-11-05 2008-04-25 一种衰减因子的获取方法和获取装置
US12/264,593 US8320265B2 (en) 2007-11-05 2008-11-04 Method and apparatus for obtaining an attenuation factor
KR1020080108895A KR101168648B1 (ko) 2007-11-05 2008-11-04 감쇠 인자를 취득하기 위한 방법 및 장치
DK08168328.6T DK2056292T3 (da) 2007-11-05 2008-11-05 Fremgangsmåde og apparat til tilvejebringelse af en dæmpningsfaktor
DE202008017752U DE202008017752U1 (de) 2007-11-05 2008-11-05 Vorrichtung zum Erlangen eines Dämpfungsfaktors
AT09178182T ATE484052T1 (de) 2007-11-05 2008-11-05 Sprachsignalverarbeitung bei der verschleierung von paketverlusten
EP08168328A EP2056292B1 (en) 2007-11-05 2008-11-05 Method and apparatus for obtaining an attenuation factor
ES08168328T ES2340975T3 (es) 2007-11-05 2008-11-05 Metodo y aparato para obtener un factor de atenuacion.
DE602008000668T DE602008000668D1 (de) 2007-11-05 2008-11-05 Verfahren und Vorrichtung zur Erlangung eines Dämpfungsfaktors
DE602008002938T DE602008002938D1 (de) 2007-11-05 2008-11-05 Sprachsignalverarbeitung bei der Verschleierung von Paketverlusten
EP09178182A EP2161719B1 (en) 2007-11-05 2008-11-05 Processing of a speech signal in packet loss concealment
AT08168328T ATE458241T1 (de) 2007-11-05 2008-11-05 Verfahren und vorrichtung zur erlangung eines dämpfungsfaktors
JP2008284260A JP4824734B2 (ja) 2007-11-05 2008-11-05 減衰率を取得する方法および装置
PL08168328T PL2056292T3 (pl) 2007-11-05 2008-11-05 Sposób oraz urządzenie do uzyskiwania współczynnika tłumienia
US12/556,048 US7957961B2 (en) 2007-11-05 2009-09-09 Method and apparatus for obtaining an attenuation factor
JP2010060127A JP5255585B2 (ja) 2007-11-05 2010-03-17 減衰率を取得する方法および装置
HK10107180.3A HK1142713A1 (en) 2007-11-05 2010-07-27 Processing of a speech signal in packet loss concealment
HK11109983.7A HK1155844A1 (zh) 2007-11-05 2011-09-22 信號處理方法和裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101696180A CN101207665B (zh) 2007-11-05 2007-11-05 一种衰减因子的获取方法

Publications (2)

Publication Number Publication Date
CN101207665A CN101207665A (zh) 2008-06-25
CN101207665B true CN101207665B (zh) 2010-12-08

Family

ID=39567522

Family Applications (4)

Application Number Title Priority Date Filing Date
CN2007101696180A Active CN101207665B (zh) 2007-11-05 2007-11-05 一种衰减因子的获取方法
CN2012101846225A Active CN102682777B (zh) 2007-11-05 2008-04-25 一种衰减因子的获取方法和获取装置
CN201110092815.3A Active CN102169692B (zh) 2007-11-05 2008-04-25 信号处理方法和装置
CN2008800010241A Active CN101578657B (zh) 2007-11-05 2008-04-25 一种衰减因子的获取方法和获取装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN2012101846225A Active CN102682777B (zh) 2007-11-05 2008-04-25 一种衰减因子的获取方法和获取装置
CN201110092815.3A Active CN102169692B (zh) 2007-11-05 2008-04-25 信号处理方法和装置
CN2008800010241A Active CN101578657B (zh) 2007-11-05 2008-04-25 一种衰减因子的获取方法和获取装置

Country Status (13)

Country Link
US (2) US8320265B2 (zh)
EP (2) EP2056292B1 (zh)
JP (2) JP4824734B2 (zh)
KR (1) KR101168648B1 (zh)
CN (4) CN101207665B (zh)
AT (2) ATE484052T1 (zh)
BR (1) BRPI0808765B1 (zh)
DE (3) DE202008017752U1 (zh)
DK (1) DK2056292T3 (zh)
ES (1) ES2340975T3 (zh)
HK (2) HK1142713A1 (zh)
PL (1) PL2056292T3 (zh)
WO (1) WO2009059497A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299614A (zh) * 2013-07-16 2015-01-21 华为技术有限公司 解码方法和解码装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101325631B (zh) * 2007-06-14 2010-10-20 华为技术有限公司 一种估计基音周期的方法和装置
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
KR100998396B1 (ko) * 2008-03-20 2010-12-03 광주과학기술원 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
CN101483042B (zh) 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
JP5150386B2 (ja) * 2008-06-26 2013-02-20 日本電信電話株式会社 電磁ノイズ診断装置、電磁ノイズ診断システム及び電磁ノイズ診断方法
JP5694745B2 (ja) * 2010-11-26 2015-04-01 株式会社Nttドコモ 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
EP2487350A1 (de) * 2011-02-11 2012-08-15 Siemens Aktiengesellschaft Verfahren zur Regelung einer Gasturbine
MX338070B (es) 2011-10-21 2016-04-01 Samsung Electronics Co Ltd Metodo y aparato de ocultamiento de error de trama y metodo y aparato de decodificación de audio.
US9330672B2 (en) 2011-10-24 2016-05-03 Zte Corporation Frame loss compensation method and apparatus for voice frame signal
EP2922053B1 (en) 2012-11-15 2019-08-28 NTT Docomo, Inc. Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
KR102238376B1 (ko) 2013-02-05 2021-04-08 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
CN104301064B (zh) * 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN103714820B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 参数域的丢包隐藏方法及装置
US10035557B2 (en) * 2014-06-10 2018-07-31 Fu-Long Chang Self-balancing vehicle frame
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
US9978400B2 (en) * 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
US10362269B2 (en) * 2017-01-11 2019-07-23 Ringcentral, Inc. Systems and methods for determining one or more active speakers during an audio or video conference session
CN113496706B (zh) * 2020-03-19 2023-05-23 抖音视界有限公司 音频处理方法、装置、电子设备及存储介质

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2654643B2 (ja) 1987-03-11 1997-09-17 東洋通信機株式会社 音声分析方法
JPH06130999A (ja) 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd コード励振線形予測復号化装置
DE69422935T2 (de) 1994-06-30 2000-08-17 Ibm Verfahren und vorrichtung zum vergleichen von datensequenzen variabler länge
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
JP3095340B2 (ja) 1995-10-04 2000-10-03 松下電器産業株式会社 音声復号化装置
TW326070B (en) 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US6011795A (en) 1997-03-20 2000-01-04 Washington University Method and apparatus for fast hierarchical address lookup using controlled expansion of prefixes
JP3567750B2 (ja) 1998-08-10 2004-09-22 株式会社日立製作所 圧縮音声再生方法及び圧縮音声再生装置
US7423983B1 (en) 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
JP2001228896A (ja) 2000-02-14 2001-08-24 Iwatsu Electric Co Ltd 欠落音声パケットの代替置換方式
US20070192863A1 (en) 2005-07-01 2007-08-16 Harsh Kapoor Systems and methods for processing data flows
EP1199709A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US20030177011A1 (en) 2001-03-06 2003-09-18 Yasuyo Yasuda Audio data interpolation apparatus and method, audio data-related information creation apparatus and method, audio data interpolation information transmission apparatus and method, program and recording medium thereof
US6785687B2 (en) 2001-06-04 2004-08-31 Hewlett-Packard Development Company, L.P. System for and method of efficient, expandable storage and retrieval of small datasets
US6816856B2 (en) 2001-06-04 2004-11-09 Hewlett-Packard Development Company, L.P. System for and method of data compression in a valueless digital tree representing a bitset
US7143032B2 (en) 2001-08-17 2006-11-28 Broadcom Corporation Method and system for an overlap-add technique for predictive decoding based on extrapolation of speech and ringinig waveform
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
EP1292036B1 (en) 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US20040064308A1 (en) 2002-09-30 2004-04-01 Intel Corporation Method and apparatus for speech packet loss recovery
KR20030024721A (ko) 2003-01-28 2003-03-26 배명진 보이스-펜에서 녹음소리를 정답게 들려주는소프트사운드기능
JP4303687B2 (ja) 2003-01-30 2009-07-29 富士通株式会社 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム
US7415463B2 (en) 2003-05-13 2008-08-19 Cisco Technology, Inc. Programming tree data structures and handling collisions while performing lookup operations
US7415472B2 (en) 2003-05-13 2008-08-19 Cisco Technology, Inc. Comparison tree data structures of particular use in performing lookup operations
JP2005024756A (ja) 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
US7302385B2 (en) 2003-07-07 2007-11-27 Electronics And Telecommunications Research Institute Speech restoration system and method for concealing packet losses
US20050049853A1 (en) 2003-09-01 2005-03-03 Mi-Suk Lee Frame loss concealment method and device for VoIP system
JP4365653B2 (ja) 2003-09-17 2009-11-18 パナソニック株式会社 音声信号送信装置、音声信号伝送システム及び音声信号送信方法
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
JP4733939B2 (ja) 2004-01-08 2011-07-27 パナソニック株式会社 信号復号化装置及び信号復号化方法
ATE523876T1 (de) 2004-03-05 2011-09-15 Panasonic Corp Fehlerverbergungseinrichtung und fehlerverbergungsverfahren
US7034675B2 (en) * 2004-04-16 2006-04-25 Robert Bosch Gmbh Intrusion detection system including over-under passive infrared optics and a microwave transceiver
JP4345588B2 (ja) * 2004-06-24 2009-10-14 住友金属鉱山株式会社 希土類−遷移金属−窒素系磁石粉末とその製造方法、および得られるボンド磁石
US8725501B2 (en) 2004-07-20 2014-05-13 Panasonic Corporation Audio decoding device and compensation frame generation method
KR20060011417A (ko) 2004-07-30 2006-02-03 삼성전자주식회사 음성 출력과 영상 출력을 제어하는 장치와 제어 방법
US9047860B2 (en) 2005-01-31 2015-06-02 Skype Method for concatenating frames in communication system
JP4846712B2 (ja) 2005-03-14 2011-12-28 パナソニック株式会社 スケーラブル復号化装置およびスケーラブル復号化方法
US20070174047A1 (en) 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
KR100745683B1 (ko) * 2005-11-28 2007-08-02 한국전자통신연구원 음성의 특징을 이용한 패킷 손실 은닉 방법
CN1983909B (zh) * 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
CN101000768B (zh) * 2006-06-21 2010-12-08 北京工业大学 嵌入式语音编解码的方法及编解码器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299614A (zh) * 2013-07-16 2015-01-21 华为技术有限公司 解码方法和解码装置
CN104299614B (zh) * 2013-07-16 2017-12-29 华为技术有限公司 解码方法和解码装置

Also Published As

Publication number Publication date
CN102169692A (zh) 2011-08-31
EP2056292A2 (en) 2009-05-06
JP2010176142A (ja) 2010-08-12
BRPI0808765A2 (pt) 2014-09-16
EP2161719A2 (en) 2010-03-10
JP4824734B2 (ja) 2011-11-30
EP2056292B1 (en) 2010-02-17
KR20090046714A (ko) 2009-05-11
CN102682777B (zh) 2013-11-06
EP2056292A3 (en) 2009-05-27
JP5255585B2 (ja) 2013-08-07
US20090116486A1 (en) 2009-05-07
CN101578657B (zh) 2012-11-07
HK1155844A1 (zh) 2012-05-25
DK2056292T3 (da) 2010-06-07
CN102682777A (zh) 2012-09-19
US7957961B2 (en) 2011-06-07
HK1142713A1 (en) 2010-12-10
EP2161719B1 (en) 2010-10-06
WO2009059497A1 (fr) 2009-05-14
JP2009175693A (ja) 2009-08-06
ATE458241T1 (de) 2010-03-15
US20090316598A1 (en) 2009-12-24
CN102169692B (zh) 2014-04-30
EP2161719A3 (en) 2010-03-24
ATE484052T1 (de) 2010-10-15
CN101207665A (zh) 2008-06-25
US8320265B2 (en) 2012-11-27
KR101168648B1 (ko) 2012-07-25
ES2340975T3 (es) 2010-06-11
CN101578657A (zh) 2009-11-11
BRPI0808765B1 (pt) 2020-09-15
DE602008000668D1 (de) 2010-04-01
DE202008017752U1 (de) 2010-09-16
DE602008002938D1 (de) 2010-11-18
PL2056292T3 (pl) 2010-07-30

Similar Documents

Publication Publication Date Title
CN101207665B (zh) 一种衰减因子的获取方法
CN100550712C (zh) 一种信号处理方法和处理装置
AU2006252962B2 (en) Audio CODEC post-filter
US9135923B1 (en) Pitch synchronous speech coding based on timbre vectors
US8532998B2 (en) Selective bandwidth extension for encoding/decoding audio/speech signal
JP4861196B2 (ja) Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス
KR100647336B1 (ko) 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
EP3301674A1 (en) Adaptive bandwidth extension and apparatus for the same
CN104126201B (zh) 用于语音编码的混合码本激励的系统和方法
Seneff System to independently modify excitation and/or spectrum of speech waveform without explicit pitch extraction
CN1074846C (zh) 产生用于话音编码器的频谱噪音加权滤波器的方法
Lin et al. Speech enhancement for low bit rate speech codec
CN106935243A (zh) 一种基于melp的低比特数字语音矢量量化方法和系统
Hwang et al. Alias-and-Separate: wideband speech coding using sub-Nyquist sampling and speech separation
KR20030009517A (ko) 위상-스미어링 및 위상-디스미어링 필터를 구비하는adpcm 스피치 코딩 시스템
CN117409810A (zh) 歌声分离模型
CN115631744A (zh) 一种两阶段的多说话人基频轨迹提取方法
Dimolitsas Speech Coding
Myungjin et al. Implementation of voice synthesis algorithm using redundant bit reduction technique for the text editing type recorded announcements
Joshi Speech compression using LPC and EZW technique
Joseph et al. Non-linear encoding of the excitation source using neural networks for transition mode coding in CELP
de Alencar et al. On the performance of ITU-T G. 723.1 and AMR-NB codecs for large vocabulary distributed speech recognition in Brazilian Portuguese
Ould-cheikh WIDE BAND SPEECH CODER AT 13 K bit/s
Hong An improved SIFT method for pitch estimation of speech
Carmona et al. Dealing with acoustic noise and packet loss in VoIP recognition systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080625