CN101207665B - 一种衰减因子的获取方法 - Google Patents
一种衰减因子的获取方法 Download PDFInfo
- Publication number
- CN101207665B CN101207665B CN2007101696180A CN200710169618A CN101207665B CN 101207665 B CN101207665 B CN 101207665B CN 2007101696180 A CN2007101696180 A CN 2007101696180A CN 200710169618 A CN200710169618 A CN 200710169618A CN 101207665 B CN101207665 B CN 101207665B
- Authority
- CN
- China
- Prior art keywords
- signal
- pitch period
- period signal
- decay factor
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/097—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephone Function (AREA)
- Fluid-Damping Devices (AREA)
- Telephonic Communication Services (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Networks Using Active Elements (AREA)
- Compounds Of Unknown Constitution (AREA)
- Communication Control (AREA)
- Radar Systems Or Details Thereof (AREA)
- Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
Abstract
本发明公开了一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,包括以下步骤:获取信号最后两个基音周期信号的变化趋势;根据所述信号最后两个基音周期信号的变化趋势获取衰减因子;根据所述信号最后两个基音周期信号的变化趋势,对合成信号进行动态衰减。通过使用本发明,使用历史信号最近的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
Description
技术领域
本发明涉及信号处理领域,尤其涉及一种衰减因子的获取方法。
背景技术
在实时语音通信系统中,对语音数据的传输要求实时可靠,例如VoIP(Voice over IP,基于IP的语音)系统。但由于网络系统自身的不可靠特性,数据包在从发送端到接收端传输过程中有可能会被丢弃或者不能及时的达到目的地,而这两种情况都被接收端认为是网络丢包。而发生网络丢包是不可避免的,同时也是影响语音通话质量最主要因素之一,因此在实时通信系统中需要健壮的丢包隐藏方法来恢复丢失的数据包,使得在发生网络丢包的情况下仍获得良好的通话质量。
G.722是ITU-T制定的应用于语音通信的语音编码算法。G.722编码器的原理示意图如图1所示:在发送端,G.722编码器把宽带语音分成高低两个子带,并使用ADPCM(Adaptive Differential Pulse Code Modulation,自适应差分脉冲编码调制)分别对两个子带进行编码并通过网络一起发送给接收端。在接收端,使用ADPCM解码器对两个子带分别解码,然后使用QMF(QuadratureMirror Filter,正交镜像滤波)合成滤波器合成最终的信号。
在现有技术中给出了适用于G..722的PLC(Packet Loss Concealment,丢包隐藏)算法,对于两个不同的子带采用了不同的PLC算法,低带部分的PLC算法,即图1中的虚线框中①的部分,而对于高带的PLC算法,对应图1中的虚线框②。对于低带信号,xl(n)对应当前收到的数据帧解码后对应的信号、而yl(n)对应当有丢包时利用zl(n),n=-289,...,-1合成的信号,zl(n)对应进行完CROSS-FADING(交叉衰减)后最终输出的低带信号;对于高带信号,zh(n)为最终输出的高带信号。得到低带信号zl(n)和高带信号zh(n)后,对低带信号zl(n)和高带信号zh(n)作QMF,合成最终要输出的宽带信号y(n)。
下面仅对低带信号做详细介绍:
在没有丢包的情况下,zl(n)=xl(n),即CROSS-FADING时不改变重构信号。
在有丢包情况下,对于第一个丢失的数据帧,使用短时预测器和长时预测器对历史信号zl(n),n<0进行分析,并提取出语音类别信息;接着使用上述预测器和类别信息,使用线性预测基音周期重复的方法生成信号yl(n);然后重构丢失帧的信号zl(n)=yl(n),n=0,…,L-1。另外,ADPCM的状态也要随之同步更新,直到遇到一个好帧。注意到不仅要生成丢失的帧所对应信号,也要生成用于CROSS-FADING的10ms信号yl(n),n=L,…,L+79,那么一旦收到一个好帧,就对xl(n),n=L,…,L+79,和yl(n),n=L,…,L+79做CROSS-FADING处理。注意到此类CROSS-FADING仅在发生丢帧后,接收端收到第一个好帧数据时才进行。
图2为现有技术中给出的低带部分基于基音周期重复部分的LPC模块的更详细的框架。
当数据帧是好帧时,zl(n)被存储到一个缓冲区里面以备后用。
当遇到第一个坏帧时,则需要分两步来合成最终的信号yl(n)。首先对历史信号zl(n),n=-297,…,-1进行分析,然后结合分析的结果合成信号yl(n),n=0,…,L-1,其中L是数据帧的帧长。
该基于基音周期重复部分的LPC模块具体包括以下部分:
(1)LP(Linear Prediction,线性预测)分析
短时分析和合成滤波器A(z)和1/A(z)均是基于8阶LP的滤波器。LP分析滤波定义为:
A(z)=1+a1z-1+a2 z-2+…+a8z-8
LP分析之后,使得历史信号zl(n)通过滤波器A(z)后得到残差信号e(n),n=-289,…,-1:
(2)历史数据分析
现有技术中G.722使用基音周期重复方法对丢失的数据进行补偿。因此,首先需要估计出基因周期T0,首先对zl(n)进行预处理,去除在LTP(Long TermPrediction,长时预测)分析中不需要的低频成分,然后通过LTP分析可以得到历史信号的基因周期T0,并结合信号分类模块得到语音的类别。
在G.722附录A中把语音分成了如下几类,如下表所示:
分类名称 | 解释 |
TRANSIENT | 能量变化大的语音,例如爆破音 |
UNVOICED | 对于非语音信号 |
VUV_TRANSITION | 语音和非语音信号的转换 |
WEAKLY_VOICED | 语音信号的开始或者结束 |
VOICED | 语音信号,例如稳定的元音 |
(3)基音周期重复
基因周期重复模块用于估计丢失帧的LP残差信号e(n),n=0,…,L-1。在进行基因周期重复之前,如果语音的类别不是VOICED,则采用下面的公式来限制采样点的幅度:
其中,
如果语音的类别是VOICED,则丢失信号所对应的残差e(n),n=0,…,L-1采用重复历史数据对应的最后一个基音周期的残差数据获得,即:
e(n)=e(n-T0)
而对于其它类型的语音,为了避免生成的数据周期性太强(对于非语音的数据,如果周期性太强,听起来就会有音乐噪声等不舒服噪声),则使用下面的公式生成丢失信号所对应的残差信号e(n),n=0,…,L-1:
e(n)=e(n-T0+(-1)n)。
除了生成丢失帧对应的信号外,为了保证丢失帧和丢失帧之后的第一个好帧之间的平滑拼接,还要继续生成额外80个样点的数据e(n),n=L,…,L+79,以生成用于CROSS-FADING的信号。
(4)LP合成
在生成丢失帧和CROSS-FADING对应的残差信号e(n)后,接着用下面的公式得到重构的丢失帧信号ylpre(n),n=0,…,L-1:
其中,残差信号e(n),n=0,…,L-1,是在章节步骤3基音周期重复中得到的残差。
除此之外,还要继续使用上述公式生成用于CROSS-FADING的80个样点ylpre(n),n=L,…,L+79。
(5)Adaptive muting
为了实现平滑的能量过渡,在与高带信号进行QMF之前,还需要对低带信号进行CROSS-FADING处理,规则如下表所示:
在上表中,zl(n)为对应最终输出的当前帧对应的信号;xl(n)当前帧对应的好帧的信号;yl(n)对应当前帧同一时刻合成的信号,其中L为帧长,80为进行CROSS-FADING样点的个数。
G.722附录4还考虑到针对不同的语音类型,在进行CROSS-FADING之前对ylpre(n)中的信号的能量进行控制。即
yl(n)=g_mute_lb×ylpre(n)n=0,…,L+79
其中,g_mute_lb为每个样点所对应的系数。它的取值根据语音类型的不同以及丢包情况而变化,如下图3所示。其中开始80个样点对应当前丢失帧的g_mute_lb。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术中使用如图3所示的静态的自适应衰减因子来控制合成信号的能量。虽然它所规定的衰减因子也是逐渐变化的,但它的衰减速度,即衰减因子的大小,对同一类型的语音,都是一样的。但人的发音的特点是很丰富多变的,如果衰减因子不匹配,重建后的信号就会有令人不舒适的噪声,特别是在稳定语音的末尾,使用静态的自适应衰减因子就不能适应人的语音丰富多变的特点。
例如图4所示的情况,其中T0为历史信号的基音周期,上面的信号对应原始信号,即没有丢包情况下的波形示意图。下面的短划线信号为根据现有G.722合成的信号。从图中可以发现:合成的信号没有保持和原始信号一致的衰减速度,如果同一基音周期重复次数太多,则合成的信号就会出现明显得音乐噪声,与理想的情况差距很大。
发明内容
本发明的实施例提供一种衰减因子的获取方法,用于自适应的动态调整合成信号处理中所使用的衰减因子,实现历史数据和最新收到的数据的平稳过渡。
为达到上述目的,本发明的实施例提供一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,包括以下步骤:
获取信号最后两个基音周期信号的变化趋势;
根据所述信号最后两个基音周期信号的变化趋势获取衰减因子1-C*(n+1),用于对合成信号进行动态衰减yl(n)=ylpre(n)*(1-C*(n+1)),n=0,..,N-1;
其中,ylpre(n)为重构的丢失帧信号,C为衰减系数,N为合成信号的长度,C=(1-R)/T0,T0为基音周期的长度,R为所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,或所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值;
当R为所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值时,R=P1/P2;其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值。
与现有技术相比,本发明的实施例具有以下优点:
使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
附图说明
图1是现有技术中G.722编码器的原理示意图;
图2是现有技术中低带部分基于基音周期重复部分的LPC模块示意图;
图3是现有技术中静音因子的取值与语音类型以及丢包情况的关系示意图;
图4是现有技术中原始信号和根据现有G.722合成的信号的示意图;
图5是本发明的实施例一中一种衰减因子的获取方法的流程图;
图6是本发明的实施例一中动态衰减方法后输出信号的示意图;
图7A和图7B是本发明的实施例二中衰减因子获取装置的结构示意图;
图8是本发明的实施例二中衰减因子获取装置的应用场景示意图。
具体实施方式
以下结合附图和实施例,对本发明的实施方式做进一步说明。
本发明的实施例一中提供了一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,如图5所示,包括以下步骤:
步骤s101、获取信号的变化趋势。
具体的,该变化趋势可以通过以下参数表示:(1)信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;(2)信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。
步骤s102、根据该变化趋势获取衰减因子。
以下结合具体的应用场景,描述本发明实施例一的具体处理方法。
本发明的实施例一中,提供了一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,主要针对图3中对衰减因子计算的改进。
具体的,假设接收到的历史信号中最后两个基音周期的信号如图6中的原始信号所示,则根据上述历史信号最后两个基音周期的变化趋势来动态调整自适应动态衰减因子。具体的调整方法包括以下步骤:
步骤s201、获取信号的变化趋势。
可以通过信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值表示信号的变化趋势,即计算历史信号最后两个基音周期信号的能量E1和E2,以及二能量的比值。
其中,E1为最后一个基音周期信号的能量,E2为前一个基音周期信号的能量,T0为历史信号对应的基音周期。
或者:
也可以通过历史信号最后两个基音周期的峰值峰谷差的比值来表示信号的变化趋势:
P1=max(xl(i))-min(xl(j)) (i,j)=-T0,...,-1
P2=max(xl(i))-min(xl(j)) (i,j)=-2T0,...,-(T0+1)
其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值,然后计算其比值为:
步骤s202、根据该获取到的信号的变化趋势,对合成的信号进行动态衰减。
计算公式如下:
yl(n)=ylpre(n)*(1-C*(n+1)) n=0,..,N-1
其中ylpre(n)为重构的丢失帧信号,N为合成信号的长度,C为自适应衰减系数,其值为:
对于衰减因子1-C*(n+1)<0的情况下,需令1-C*(n+1)=0,以避免出现采样点对应衰减因子为负的情况。
特殊的,为了避免在R>1的情况下,出现采样点对应幅值溢出的情况下,可以考虑仅在R<1的情况下,使用本实施例步骤s202的公式对合成的信号进行动态衰减。
特殊的,为了避免能量比较小的信号衰减速度过快,则可以考虑仅在E1超过某个限定值的情况下,使用本实施例步骤s202的公式对合成的信号进行动态衰减。
特殊的,为了避免合成信号由于衰减速度过快,特别是在有连续丢帧的情况下,则给衰减系数C设定一个上限,当超过某个限定值时,则使得衰减系数为上限所设定的值。
特殊的,在网络环境差,在有连续丢帧的情况下,为防止衰减速度过快,可以设定一定的条件,例如可以考虑当丢失帧的个数超过指定个数,例如2帧,或者丢失帧对应的信号超过指定长度,例如20ms,或者当前衰减因子(1-C*(n+1))到达指定的阀值后的一个或者多个条件后,则需要对衰减系数C进行调整,以防止衰减过快,导致输出信号为静音的情况。
例如在8K采样,帧长为40个采样点的情况下,可以设定丢失帧个数为4,且衰减因子1-C*(n+1)小于0.9以后,则将衰减系数C调整为较小的值。其中所述较小的值的规则为:
假定预计依当前的衰减系数C和衰减因子的值V,那么衰减因子V将在V/C个采样点后衰减为0,而比较理想的情况是在M(M≠V/C)个采样点后衰减为0,那么调整衰减系数C为:
C=V/M
如图6所示,最上信号为原始信号,中间的信号为合成的信号,从图中可以看到,该信号虽然有一定程度的衰减,但仍然保持了很强的浊音特征,如果持续时间过长,就会表现为音乐性的噪声,特别是在浊音的尾部。最下面信号为使用了本发明实施例中动态衰减之后的信号,可以看出和原始信号已经非常接近。
通过使用上述实施例提供的方法,使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
本发明的实施例二中提供一种衰减因子获取装置,用于丢包隐藏中的合成信号的处理,包括:
变化趋势获取单元10,用于获取信号的变化趋势。
衰减因子获取单元20,用于根据变化趋势获取单元10获取的变化趋势获取衰减因子。
该衰减因子获取单元20进一步包括:衰减系数获取子单元21,用于根据变化趋势获取单元10获取的变化趋势生成衰减系数;衰减因子获取子单元22,用于根据衰减系数获取单元21生成的衰减系数获取衰减因子。还包括:衰减系数调整子单元23,用于在满足特定条件时,将衰减系数获取子单元21获取的衰减系数的值调整为特定值,该特定条件包括衰减系数的值是否超过上限、是否存在连续丢帧的情况、衰减速度是否过快中的一种或多种。
具体的,该变化趋势获取单元10获取的变化趋势可以通过以下参数体现:(1)信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;(2)信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。
该变化趋势使用上述(1)中能量的比值表示时,该衰减因子获取装置的结构如图7A所示,变化趋势获取单元10进一步包括:
能量获取子单元11,用于获取信号最后一个基音周期信号的能量与前一个基音周期信号的能量;能量比值获取子单元12,用于获取能量获取子单元11获取的信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,以该比值表示所述信号的变化趋势。
该变化趋势使用上述(2)中的幅度差值的比值表示时,该衰减因子获取装置的结构如图7B所示,所述变化趋势获取单元进一步包括:
幅度差值获取子单元13,用于获取信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,以及前一个基音周期信号的最大幅度值和最小幅度值的差值;幅度差值比值获取子单元14,用于获取信号最后一个基音周期信号的差值与前一个基音周期信号的差值的比值,以该比值表示所述信号的变化趋势。
本发明的实施例二中一种衰减因子获取装置的应用场景示意图如图8所示,用于使用历史信号的变化趋势来动态调整自适应衰减因子。
通过使用上述实施例提供的装置,使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台设备执行本发明各个实施例所述的方法。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (4)
1.一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,其特征在于,包括以下步骤:
获取信号最后两个基音周期信号的变化趋势;
根据所述信号最后两个基音周期信号的变化趋势获取衰减因子1-C*(n+1),用于对合成信号进行动态衰减yl(n)=ylpre(n)*(1-C*(n+1)),n=0,..,N-1;
其中,ylpre(n)为重构的丢失帧信号,C为衰减系数,N为合成信号的长度,C=(1-R)/T0,T0为基音周期的长度,R为所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,或所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值;
当R为所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值时,R=P1/P2;其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值。
2.如权利要求1所述衰减因子的获取方法,其特征在于,所述衰减因子为1-C*(n+1),当1-C*(n+1)<0时,令所述衰减因子1-C*(n+1)=0。
3.如权利要求1所述衰减因子的获取方法,其特征在于,预先为衰减系数C设定一个上限值,当根据C=(1-R)/T0获取的C值超过所述上限值时,使得衰减系数C为所述上限值。
4.如权利要求1所述衰减因子的获取方法,其特征在于,连续丢失多个帧时,则将衰减系数C调整为:
预设信号在M个样点后衰减为零;
令调整后的衰减系数C=V/M,其中V为当前的衰减因子。
Priority Applications (23)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101696180A CN101207665B (zh) | 2007-11-05 | 2007-11-05 | 一种衰减因子的获取方法 |
PCT/CN2008/070807 WO2009059497A1 (fr) | 2007-11-05 | 2008-04-25 | Procédé et dispositif d'obtention d'un facteur d'atténuation |
BRPI0808765-2A BRPI0808765B1 (pt) | 2007-11-05 | 2008-04-25 | Método e aparelho para processamento de um sinal de voz sintetizado em ocultação de perda de pacotes e decodificador de voz |
CN201110092815.3A CN102169692B (zh) | 2007-11-05 | 2008-04-25 | 信号处理方法和装置 |
CN2012101846225A CN102682777B (zh) | 2007-11-05 | 2008-04-25 | 一种衰减因子的获取方法和获取装置 |
CN2008800010241A CN101578657B (zh) | 2007-11-05 | 2008-04-25 | 一种衰减因子的获取方法和获取装置 |
US12/264,593 US8320265B2 (en) | 2007-11-05 | 2008-11-04 | Method and apparatus for obtaining an attenuation factor |
KR1020080108895A KR101168648B1 (ko) | 2007-11-05 | 2008-11-04 | 감쇠 인자를 취득하기 위한 방법 및 장치 |
DK08168328.6T DK2056292T3 (da) | 2007-11-05 | 2008-11-05 | Fremgangsmåde og apparat til tilvejebringelse af en dæmpningsfaktor |
DE202008017752U DE202008017752U1 (de) | 2007-11-05 | 2008-11-05 | Vorrichtung zum Erlangen eines Dämpfungsfaktors |
AT09178182T ATE484052T1 (de) | 2007-11-05 | 2008-11-05 | Sprachsignalverarbeitung bei der verschleierung von paketverlusten |
EP08168328A EP2056292B1 (en) | 2007-11-05 | 2008-11-05 | Method and apparatus for obtaining an attenuation factor |
ES08168328T ES2340975T3 (es) | 2007-11-05 | 2008-11-05 | Metodo y aparato para obtener un factor de atenuacion. |
DE602008000668T DE602008000668D1 (de) | 2007-11-05 | 2008-11-05 | Verfahren und Vorrichtung zur Erlangung eines Dämpfungsfaktors |
DE602008002938T DE602008002938D1 (de) | 2007-11-05 | 2008-11-05 | Sprachsignalverarbeitung bei der Verschleierung von Paketverlusten |
EP09178182A EP2161719B1 (en) | 2007-11-05 | 2008-11-05 | Processing of a speech signal in packet loss concealment |
AT08168328T ATE458241T1 (de) | 2007-11-05 | 2008-11-05 | Verfahren und vorrichtung zur erlangung eines dämpfungsfaktors |
JP2008284260A JP4824734B2 (ja) | 2007-11-05 | 2008-11-05 | 減衰率を取得する方法および装置 |
PL08168328T PL2056292T3 (pl) | 2007-11-05 | 2008-11-05 | Sposób oraz urządzenie do uzyskiwania współczynnika tłumienia |
US12/556,048 US7957961B2 (en) | 2007-11-05 | 2009-09-09 | Method and apparatus for obtaining an attenuation factor |
JP2010060127A JP5255585B2 (ja) | 2007-11-05 | 2010-03-17 | 減衰率を取得する方法および装置 |
HK10107180.3A HK1142713A1 (en) | 2007-11-05 | 2010-07-27 | Processing of a speech signal in packet loss concealment |
HK11109983.7A HK1155844A1 (zh) | 2007-11-05 | 2011-09-22 | 信號處理方法和裝置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101696180A CN101207665B (zh) | 2007-11-05 | 2007-11-05 | 一种衰减因子的获取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101207665A CN101207665A (zh) | 2008-06-25 |
CN101207665B true CN101207665B (zh) | 2010-12-08 |
Family
ID=39567522
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101696180A Active CN101207665B (zh) | 2007-11-05 | 2007-11-05 | 一种衰减因子的获取方法 |
CN2012101846225A Active CN102682777B (zh) | 2007-11-05 | 2008-04-25 | 一种衰减因子的获取方法和获取装置 |
CN201110092815.3A Active CN102169692B (zh) | 2007-11-05 | 2008-04-25 | 信号处理方法和装置 |
CN2008800010241A Active CN101578657B (zh) | 2007-11-05 | 2008-04-25 | 一种衰减因子的获取方法和获取装置 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012101846225A Active CN102682777B (zh) | 2007-11-05 | 2008-04-25 | 一种衰减因子的获取方法和获取装置 |
CN201110092815.3A Active CN102169692B (zh) | 2007-11-05 | 2008-04-25 | 信号处理方法和装置 |
CN2008800010241A Active CN101578657B (zh) | 2007-11-05 | 2008-04-25 | 一种衰减因子的获取方法和获取装置 |
Country Status (13)
Country | Link |
---|---|
US (2) | US8320265B2 (zh) |
EP (2) | EP2056292B1 (zh) |
JP (2) | JP4824734B2 (zh) |
KR (1) | KR101168648B1 (zh) |
CN (4) | CN101207665B (zh) |
AT (2) | ATE484052T1 (zh) |
BR (1) | BRPI0808765B1 (zh) |
DE (3) | DE202008017752U1 (zh) |
DK (1) | DK2056292T3 (zh) |
ES (1) | ES2340975T3 (zh) |
HK (2) | HK1142713A1 (zh) |
PL (1) | PL2056292T3 (zh) |
WO (1) | WO2009059497A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104299614A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 解码方法和解码装置 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101325631B (zh) * | 2007-06-14 | 2010-10-20 | 华为技术有限公司 | 一种估计基音周期的方法和装置 |
CN100550712C (zh) * | 2007-11-05 | 2009-10-14 | 华为技术有限公司 | 一种信号处理方法和处理装置 |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
CN101483042B (zh) | 2008-03-20 | 2011-03-30 | 华为技术有限公司 | 一种噪声生成方法以及噪声生成装置 |
JP5150386B2 (ja) * | 2008-06-26 | 2013-02-20 | 日本電信電話株式会社 | 電磁ノイズ診断装置、電磁ノイズ診断システム及び電磁ノイズ診断方法 |
JP5694745B2 (ja) * | 2010-11-26 | 2015-04-01 | 株式会社Nttドコモ | 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム |
EP2487350A1 (de) * | 2011-02-11 | 2012-08-15 | Siemens Aktiengesellschaft | Verfahren zur Regelung einer Gasturbine |
MX338070B (es) | 2011-10-21 | 2016-04-01 | Samsung Electronics Co Ltd | Metodo y aparato de ocultamiento de error de trama y metodo y aparato de decodificación de audio. |
US9330672B2 (en) | 2011-10-24 | 2016-05-03 | Zte Corporation | Frame loss compensation method and apparatus for voice frame signal |
EP2922053B1 (en) | 2012-11-15 | 2019-08-28 | NTT Docomo, Inc. | Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program |
KR102238376B1 (ko) | 2013-02-05 | 2021-04-08 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치 |
CN104301064B (zh) * | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
CN103714820B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 参数域的丢包隐藏方法及装置 |
US10035557B2 (en) * | 2014-06-10 | 2018-07-31 | Fu-Long Chang | Self-balancing vehicle frame |
CN105225666B (zh) | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
US9978400B2 (en) * | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10362269B2 (en) * | 2017-01-11 | 2019-07-23 | Ringcentral, Inc. | Systems and methods for determining one or more active speakers during an audio or video conference session |
CN113496706B (zh) * | 2020-03-19 | 2023-05-23 | 抖音视界有限公司 | 音频处理方法、装置、电子设备及存储介质 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2654643B2 (ja) | 1987-03-11 | 1997-09-17 | 東洋通信機株式会社 | 音声分析方法 |
JPH06130999A (ja) | 1992-10-22 | 1994-05-13 | Oki Electric Ind Co Ltd | コード励振線形予測復号化装置 |
DE69422935T2 (de) | 1994-06-30 | 2000-08-17 | Ibm | Verfahren und vorrichtung zum vergleichen von datensequenzen variabler länge |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JP3095340B2 (ja) | 1995-10-04 | 2000-10-03 | 松下電器産業株式会社 | 音声復号化装置 |
TW326070B (en) | 1996-12-19 | 1998-02-01 | Holtek Microelectronics Inc | The estimation method of the impulse gain for coding vocoder |
US6011795A (en) | 1997-03-20 | 2000-01-04 | Washington University | Method and apparatus for fast hierarchical address lookup using controlled expansion of prefixes |
JP3567750B2 (ja) | 1998-08-10 | 2004-09-22 | 株式会社日立製作所 | 圧縮音声再生方法及び圧縮音声再生装置 |
US7423983B1 (en) | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
JP2001228896A (ja) | 2000-02-14 | 2001-08-24 | Iwatsu Electric Co Ltd | 欠落音声パケットの代替置換方式 |
US20070192863A1 (en) | 2005-07-01 | 2007-08-16 | Harsh Kapoor | Systems and methods for processing data flows |
EP1199709A1 (en) | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
US20030177011A1 (en) | 2001-03-06 | 2003-09-18 | Yasuyo Yasuda | Audio data interpolation apparatus and method, audio data-related information creation apparatus and method, audio data interpolation information transmission apparatus and method, program and recording medium thereof |
US6785687B2 (en) | 2001-06-04 | 2004-08-31 | Hewlett-Packard Development Company, L.P. | System for and method of efficient, expandable storage and retrieval of small datasets |
US6816856B2 (en) | 2001-06-04 | 2004-11-09 | Hewlett-Packard Development Company, L.P. | System for and method of data compression in a valueless digital tree representing a bitset |
US7143032B2 (en) | 2001-08-17 | 2006-11-28 | Broadcom Corporation | Method and system for an overlap-add technique for predictive decoding based on extrapolation of speech and ringinig waveform |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
EP1292036B1 (en) | 2001-08-23 | 2012-08-01 | Nippon Telegraph And Telephone Corporation | Digital signal decoding methods and apparatuses |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US20040064308A1 (en) | 2002-09-30 | 2004-04-01 | Intel Corporation | Method and apparatus for speech packet loss recovery |
KR20030024721A (ko) | 2003-01-28 | 2003-03-26 | 배명진 | 보이스-펜에서 녹음소리를 정답게 들려주는소프트사운드기능 |
JP4303687B2 (ja) | 2003-01-30 | 2009-07-29 | 富士通株式会社 | 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム |
US7415463B2 (en) | 2003-05-13 | 2008-08-19 | Cisco Technology, Inc. | Programming tree data structures and handling collisions while performing lookup operations |
US7415472B2 (en) | 2003-05-13 | 2008-08-19 | Cisco Technology, Inc. | Comparison tree data structures of particular use in performing lookup operations |
JP2005024756A (ja) | 2003-06-30 | 2005-01-27 | Toshiba Corp | 復号処理回路および移動端末装置 |
US7302385B2 (en) | 2003-07-07 | 2007-11-27 | Electronics And Telecommunications Research Institute | Speech restoration system and method for concealing packet losses |
US20050049853A1 (en) | 2003-09-01 | 2005-03-03 | Mi-Suk Lee | Frame loss concealment method and device for VoIP system |
JP4365653B2 (ja) | 2003-09-17 | 2009-11-18 | パナソニック株式会社 | 音声信号送信装置、音声信号伝送システム及び音声信号送信方法 |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
JP4733939B2 (ja) | 2004-01-08 | 2011-07-27 | パナソニック株式会社 | 信号復号化装置及び信号復号化方法 |
ATE523876T1 (de) | 2004-03-05 | 2011-09-15 | Panasonic Corp | Fehlerverbergungseinrichtung und fehlerverbergungsverfahren |
US7034675B2 (en) * | 2004-04-16 | 2006-04-25 | Robert Bosch Gmbh | Intrusion detection system including over-under passive infrared optics and a microwave transceiver |
JP4345588B2 (ja) * | 2004-06-24 | 2009-10-14 | 住友金属鉱山株式会社 | 希土類−遷移金属−窒素系磁石粉末とその製造方法、および得られるボンド磁石 |
US8725501B2 (en) | 2004-07-20 | 2014-05-13 | Panasonic Corporation | Audio decoding device and compensation frame generation method |
KR20060011417A (ko) | 2004-07-30 | 2006-02-03 | 삼성전자주식회사 | 음성 출력과 영상 출력을 제어하는 장치와 제어 방법 |
US9047860B2 (en) | 2005-01-31 | 2015-06-02 | Skype | Method for concatenating frames in communication system |
JP4846712B2 (ja) | 2005-03-14 | 2011-12-28 | パナソニック株式会社 | スケーラブル復号化装置およびスケーラブル復号化方法 |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
KR100745683B1 (ko) * | 2005-11-28 | 2007-08-02 | 한국전자통신연구원 | 음성의 특징을 이용한 패킷 손실 은닉 방법 |
CN1983909B (zh) * | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
CN101000768B (zh) * | 2006-06-21 | 2010-12-08 | 北京工业大学 | 嵌入式语音编解码的方法及编解码器 |
-
2007
- 2007-11-05 CN CN2007101696180A patent/CN101207665B/zh active Active
-
2008
- 2008-04-25 CN CN2012101846225A patent/CN102682777B/zh active Active
- 2008-04-25 CN CN201110092815.3A patent/CN102169692B/zh active Active
- 2008-04-25 WO PCT/CN2008/070807 patent/WO2009059497A1/zh active Application Filing
- 2008-04-25 BR BRPI0808765-2A patent/BRPI0808765B1/pt active IP Right Grant
- 2008-04-25 CN CN2008800010241A patent/CN101578657B/zh active Active
- 2008-11-04 KR KR1020080108895A patent/KR101168648B1/ko active IP Right Grant
- 2008-11-04 US US12/264,593 patent/US8320265B2/en active Active
- 2008-11-05 JP JP2008284260A patent/JP4824734B2/ja active Active
- 2008-11-05 AT AT09178182T patent/ATE484052T1/de not_active IP Right Cessation
- 2008-11-05 DE DE202008017752U patent/DE202008017752U1/de not_active Expired - Lifetime
- 2008-11-05 DE DE602008000668T patent/DE602008000668D1/de active Active
- 2008-11-05 DE DE602008002938T patent/DE602008002938D1/de active Active
- 2008-11-05 DK DK08168328.6T patent/DK2056292T3/da active
- 2008-11-05 EP EP08168328A patent/EP2056292B1/en active Active
- 2008-11-05 PL PL08168328T patent/PL2056292T3/pl unknown
- 2008-11-05 AT AT08168328T patent/ATE458241T1/de not_active IP Right Cessation
- 2008-11-05 ES ES08168328T patent/ES2340975T3/es active Active
- 2008-11-05 EP EP09178182A patent/EP2161719B1/en active Active
-
2009
- 2009-09-09 US US12/556,048 patent/US7957961B2/en active Active
-
2010
- 2010-03-17 JP JP2010060127A patent/JP5255585B2/ja active Active
- 2010-07-27 HK HK10107180.3A patent/HK1142713A1/xx unknown
-
2011
- 2011-09-22 HK HK11109983.7A patent/HK1155844A1/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104299614A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 解码方法和解码装置 |
CN104299614B (zh) * | 2013-07-16 | 2017-12-29 | 华为技术有限公司 | 解码方法和解码装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101207665B (zh) | 一种衰减因子的获取方法 | |
CN100550712C (zh) | 一种信号处理方法和处理装置 | |
AU2006252962B2 (en) | Audio CODEC post-filter | |
US9135923B1 (en) | Pitch synchronous speech coding based on timbre vectors | |
US8532998B2 (en) | Selective bandwidth extension for encoding/decoding audio/speech signal | |
JP4861196B2 (ja) | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス | |
KR100647336B1 (ko) | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 | |
EP3301674A1 (en) | Adaptive bandwidth extension and apparatus for the same | |
CN104126201B (zh) | 用于语音编码的混合码本激励的系统和方法 | |
Seneff | System to independently modify excitation and/or spectrum of speech waveform without explicit pitch extraction | |
CN1074846C (zh) | 产生用于话音编码器的频谱噪音加权滤波器的方法 | |
Lin et al. | Speech enhancement for low bit rate speech codec | |
CN106935243A (zh) | 一种基于melp的低比特数字语音矢量量化方法和系统 | |
Hwang et al. | Alias-and-Separate: wideband speech coding using sub-Nyquist sampling and speech separation | |
KR20030009517A (ko) | 위상-스미어링 및 위상-디스미어링 필터를 구비하는adpcm 스피치 코딩 시스템 | |
CN117409810A (zh) | 歌声分离模型 | |
CN115631744A (zh) | 一种两阶段的多说话人基频轨迹提取方法 | |
Dimolitsas | Speech Coding | |
Myungjin et al. | Implementation of voice synthesis algorithm using redundant bit reduction technique for the text editing type recorded announcements | |
Joshi | Speech compression using LPC and EZW technique | |
Joseph et al. | Non-linear encoding of the excitation source using neural networks for transition mode coding in CELP | |
de Alencar et al. | On the performance of ITU-T G. 723.1 and AMR-NB codecs for large vocabulary distributed speech recognition in Brazilian Portuguese | |
Ould-cheikh | WIDE BAND SPEECH CODER AT 13 K bit/s | |
Hong | An improved SIFT method for pitch estimation of speech | |
Carmona et al. | Dealing with acoustic noise and packet loss in VoIP recognition systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080625 |