CN101976567A - 一种语音信号差错掩盖方法 - Google Patents

一种语音信号差错掩盖方法 Download PDF

Info

Publication number
CN101976567A
CN101976567A CN2010105217740A CN201010521774A CN101976567A CN 101976567 A CN101976567 A CN 101976567A CN 2010105217740 A CN2010105217740 A CN 2010105217740A CN 201010521774 A CN201010521774 A CN 201010521774A CN 101976567 A CN101976567 A CN 101976567A
Authority
CN
China
Prior art keywords
polynomial
voice signal
voice
packet loss
fitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105217740A
Other languages
English (en)
Other versions
CN101976567B (zh
Inventor
陈贺新
赵岩
肖菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201010521774A priority Critical patent/CN101976567B/zh
Publication of CN101976567A publication Critical patent/CN101976567A/zh
Application granted granted Critical
Publication of CN101976567B publication Critical patent/CN101976567B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种语音信号的差错掩盖方法,涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。包括以下步骤为:根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N(N≥2),语音信号的采样率为fs;选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);采用多项式拟合x(t);采用多项式拟合y(s);利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;根据上述步骤获得的预测值,对丢包部分语音值进行替代。

Description

一种语音信号差错掩盖方法
技术领域:
本发明涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。
背景技术:
基于IP的语音通信业务量几年来一直呈上升趋势,同时,传统公共电话网正在逐步向以IP技术为核心的下一代网络演进。然而,基于IP的压缩语音数据包在网络中传输时,会不可避免地由于网络拥塞或传输信道误码等引起丢包,特别是在无线网络中传输时丢包问题更加严重。为了减小丢包对接收端语音质量的影响,已有许多差错控制技术用来对抗丢包的影响,其中,差错掩盖技术便是在接收端中广泛采用的一种改善语音主观听觉效果的方法。
从已有的研究成果来看,语音信号差错掩盖技术主要包括:基于插入的方法、基于再生的方法和基于内插的方法三大类。基于插入的方法是通过插入填充包来实现差错掩盖,而填充包通常是非常简单的静默或噪音替代以及前面收到的包的简单重复。这类方法容易实现,但是掩盖性能较差。基于再生的方法利用语音编码算法的相关知识估计出丢包部分语音的解码参数,进而通过解码或合成恢复丢失的语音信号。这类方法依赖于语音编码算法,不同的语音编码器要采用对应的掩盖方法,通常这类掩盖方法的复杂度也比较高。基于内插的方法是利用某种形式的模式匹配和内插来得到和丢包语音信号相似的可替换包,这类算法比基于插入的方法复杂,但可以获得较好的恢复效果,同时方法的通用性比基于再生的方法好。
经过对现有技术的文献检索发现,David J.Goodman等人在1986年《IEEE声学、语音与信号处理期刊》(IEEE Transactions on acoustics,speech and signal processing)第34卷1440页到1448页发表的“Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications”(分组语音通信中恢复丢失语音段的波形替代技术)一文中提出的基于模式匹配的波形替代方法和基于音高检测的波形替代方法,是两种较好的基于内插的语音信号差错掩盖方法。基于模式匹配的波形替代方法将丢失语音包(含L个采样的语音段)前面的语音信号中紧邻丢包语音段的部分语音(含M个采样的语音子段,M<L,通常M取L的二分之一)看作“模板”(template),然后在丢包语音段更前面或后面的语音信号中搜索和该模板最匹配的语音子段,找到后将含有该语音子段的L个采样的语音段作为丢失语音包的替代,从而实现丢包语音信号的差错掩盖。基于音高检测的波形替代方法同基于模式匹配的波形替代方法类似,只是采用音高检测代替模版匹配在丢包语音段前面或后面的语音信号中搜索能够替代丢包语音段的波形信号。
上述基于波形替代的方法是利用丢包语音段的前面或后面语音信号中具有和丢包语音段相似的波形这一特征,因此当语音信号波形不具有重复性时这种方法就得不到理想的掩盖结果。
发明内容:
本发明的目的是针对现有技术的不足,提供一种用于语音信号差错掩盖的方法,使接收端能够恢复出高质量的掩盖语音信号。
本发明是通过以下技术方案实现的:
一种语音信号的差错掩盖方法,其特征在于,包括以下步骤:
第一步:根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N,且N≥2,语音信号的采样率为fs
第二步:选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);
第三步:采用多项式拟合x(t);
第四步:采用多项式拟合y(s);
第五步:利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);
第六步:利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;
第七步:根据上述步骤获得的预测值,对丢包部分语音值进行替代。
所述第二步采用的多项式拟合x(t),设该多项式为X(t),具体如下:
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
其中,a0,a1,...,an为多项式的系数,n为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs
所述第三步采用的多项式拟合y(s),设该多项式为Y(s),具体如下:
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
其中,b0,b1,...,bp为多项式的系数,p为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs
所述利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r),具体如下:
c.若n≥p,则将y(s)的拟合多项式Y(s)扩展为n阶,那么
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp+bp+1sp+1+...+bnsn
其中,bp+1,...,bn均为0
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cn-1rn-1+cnrn
其中,c0=a0-b0,c1=a1-b1,...,cn=an-bn,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs
d.若n<p,则将x(t)的拟合多项式X(t)扩展为p阶,那么
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn+an+1tn+1+...+aptp
其中,an+1,...,ap均为0
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cp-1rp-1+cprp
其中,c0=a0-b0,c1=a1-b1,...,cp=ap-bp,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs
本发明的有益效果:本发明与现有技术,如基于模式匹配的波形替代方法和前帧替代方法相比,信号的信噪比(SNR)平均要提高1dB以上,且具有更好的主观听觉效果。
附图说明:
图1为本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结果。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。
设解码端对音频流解码后定位到丢失帧的位置,设丢失帧的帧序号为N(N≥2),已经将丢失帧前面的第N-1帧和丢失帧后面的第N+1帧正确解码,丢失帧的采样点数为160,语音的采样率fs为8000Hz。本发明实施例的具体实施步骤为:
(1)选取丢包语音前面第N-1帧已正确解码的语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面第N+1帧已正确解码的语音信号采样点L个,并设该语音信号为y(s);
(2)采用多项式拟合x(t),设此多项式为X(t),
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
其中,a0,a1,...,an为多项式的系数,n为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs
(3)由最小二乘法确定多项式x(t)的拟合系数,假设各数据点的权值为1,令,
Figure BSA00000320617100041
则有:
Figure BSA00000320617100042
即:
Σ i = 0 L ( a 0 t i j + a 1 t i j + 1 + . . . + a n t i n + j ) = Σ i = 0 L t i j x ( t i )
解此方程组就可以得到多项式系数向量A=a0,a1,...,an
(4)采用多项式拟合y(s),设此多项式为Y(s),如公式
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
其中,b0,b1,...,bp为多项式的系数,p为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs
(5)由最小二乘法确定多项式y(s)的拟合系数,假设各数据点的权值为1,令,
Figure BSA00000320617100044
则有:
Figure BSA00000320617100045
即:
Σ i = 0 L ( b 0 s i j + b 1 s i j + 1 + . . . + b p s i p + j ) = Σ i = 0 L s i j y ( s i )
解此方程组就可以得到多项式系数向量B=b0,b1,...,bp
(6)利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);所述利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式,具体如下:
①若n≥p,则将y(s)的拟合多项式Y(s)扩展为n阶,如公式
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp+bp+1sp+1+...+bnsn
其中,bp+1,...,bn均为0.
生成丢包部分语音信号的多项式表达式z(r),如公式
z(r)=c0+c1r+c2r2+...+cn-1rn-1+cnrn
其中,丢包部分语音信号的多项式系数与第N-1帧和第N+1帧语音信号的多项式系数的关系是:
c0=a0-b0,c1=a1-b1,...,cn=an-bn
且,r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs
②若n<p,则将x(t)的拟合多项式X(t)扩展为p阶,如公式
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn+an+1tn+1+...+aptp
其中,an+1,...,ap均为0.
生成丢包部分语音信号的多项式表达式z(r),如公式
z(r)=c0+c1r+c2r2+...+cp-1rp-1+cprp
其中,丢包部分语音信号的多项式系数与第N-1帧和第N+1帧语音信号的多项式系数的关系是:
c0=a0-b0,c1=a1-b1,...,cp=ap-bp
且,r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs
(5)利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值。
(6)根据上述步骤获得的预测值,对丢包部分语音值进行替代。
作为对比实例,本发明实施例还实现了对语音信号ring.wav(fs=8000Hz,n=160,,L=80)在不同丢包率下基于模式匹配的波形替代方法和前帧替代方法。实验发现,本发明相比基于模式匹配的波形替代方法和前帧替代方法具有更好的掩盖效果,信号的信噪比(SNR)在不同丢包率下都有较大提高。图1给出了本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结果。

Claims (4)

1.一种语音信号的差错掩盖方法,其特征在于,包括以下步骤:
第一步:根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N,且N≥2,语音信号的采样率为fs
第二步:选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);
第三步:采用多项式拟合x(t);
第四步:采用多项式拟合y(s);
第五步:利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);
第六步:利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;
第七步:根据上述步骤获得的预测值,对丢包部分语音值进行替代。
2.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于:所述第二步采用的多项式拟合x(t),设该多项式为X(t),具体如下:
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
其中,a0,a1,...,an为多项式的系数,n为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs
3.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于,所述第三步采用的多项式拟合y(s),设该多项式为Y(s),具体如下:
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
其中,b0,b1,...,bp为多项式的系数,p为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs
4.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征是,所述利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r),具体如下:
a.若n≥p,则将y(s)的拟合多项式Y(s)扩展为n阶,那么
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp+bp+1sp+1+...+bnsn
其中,bp+1,...,bn均为0
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cn-1rn-1+cnrn
其中,c0=a0-b0,c1=a1-b1,...,cn=an-bn,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs
b.若n<p,则将x(t)的拟合多项式X(t)扩展为p阶,那么
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn+an+1tn+1+...+aptp
其中,an+1,...,ap均为0
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cp-1rp-1+cprp
其中,c0=a0-b0,c1=a1-b1,...,cp=ap-bp,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs
CN201010521774A 2010-10-28 2010-10-28 一种语音信号差错掩盖方法 Expired - Fee Related CN101976567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010521774A CN101976567B (zh) 2010-10-28 2010-10-28 一种语音信号差错掩盖方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010521774A CN101976567B (zh) 2010-10-28 2010-10-28 一种语音信号差错掩盖方法

Publications (2)

Publication Number Publication Date
CN101976567A true CN101976567A (zh) 2011-02-16
CN101976567B CN101976567B (zh) 2011-12-14

Family

ID=43576448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010521774A Expired - Fee Related CN101976567B (zh) 2010-10-28 2010-10-28 一种语音信号差错掩盖方法

Country Status (1)

Country Link
CN (1) CN101976567B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107112025A (zh) * 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
CN112634868A (zh) * 2020-12-21 2021-04-09 北京声智科技有限公司 一种语音信号处理方法、装置、介质和设备
CN113838477A (zh) * 2021-09-13 2021-12-24 阿波罗智联(北京)科技有限公司 音频数据包的丢包恢复方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1441950A (zh) * 2000-07-14 2003-09-10 康奈克森特系统公司 处理丢失帧的语音通信系统及方法
US20060171373A1 (en) * 2005-02-02 2006-08-03 Dunling Li Packet loss concealment for voice over packet networks
US20070282601A1 (en) * 2006-06-02 2007-12-06 Texas Instruments Inc. Packet loss concealment for a conjugate structure algebraic code excited linear prediction decoder
CN101221765A (zh) * 2008-01-29 2008-07-16 北京理工大学 一种基于语音前向包络预测的差错隐藏方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1441950A (zh) * 2000-07-14 2003-09-10 康奈克森特系统公司 处理丢失帧的语音通信系统及方法
US20060171373A1 (en) * 2005-02-02 2006-08-03 Dunling Li Packet loss concealment for voice over packet networks
US20070282601A1 (en) * 2006-06-02 2007-12-06 Texas Instruments Inc. Packet loss concealment for a conjugate structure algebraic code excited linear prediction decoder
CN101221765A (zh) * 2008-01-29 2008-07-16 北京理工大学 一种基于语音前向包络预测的差错隐藏方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 20071130 Mohamed Chibani, et al. Fast Recovery for a CELP-Like Speech Codec After a Frame Erasure 2485-2495 1-4 第15卷, 第8期 2 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107112025A (zh) * 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
CN112634868A (zh) * 2020-12-21 2021-04-09 北京声智科技有限公司 一种语音信号处理方法、装置、介质和设备
CN112634868B (zh) * 2020-12-21 2024-04-05 北京声智科技有限公司 一种语音信号处理方法、装置、介质和设备
CN113838477A (zh) * 2021-09-13 2021-12-24 阿波罗智联(北京)科技有限公司 音频数据包的丢包恢复方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101976567B (zh) 2011-12-14

Similar Documents

Publication Publication Date Title
KR100956522B1 (ko) 음성 통신에서의 프레임 소거 은닉
US8428959B2 (en) Audio packet loss concealment by transform interpolation
ES2836220T3 (es) Sistema y procedimiento de recuperación de errores de transmisión de paquetes basada en redundancia
CN102598119B (zh) 基音估计
US20040001599A1 (en) System and method of noise reduction in receiving wireless transmission of packetized audio signals
CN1081298A (zh) 无线电通信系统接收器中帧检测质量估计的一种方法和装置
Bernard et al. Low-bitrate distributed speech recognition for packet-based and wireless communication
JP2003501925A (ja) パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
EP1449305A1 (en) Method for replacing corrupted audio data
CN101976567B (zh) 一种语音信号差错掩盖方法
CN103456307B (zh) 音频解码器中帧差错隐藏的谱代替方法及系统
US8676573B2 (en) Error concealment
CN101166071A (zh) 差错帧隐藏装置与方法
CN101221765B (zh) 一种基于语音前向包络预测的差错隐藏方法
KR100792209B1 (ko) 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
CN112992160B (zh) 一种音频错误隐藏方法及装置
JP2006279809A (ja) 音声再生装置および音声再生方法
Aoki A VoIP packet loss concealment technique taking account of pitch variation in pitch waveform replication
Lu et al. A low complexity packet loss recovery method for audio transmission
JP2004023191A (ja) 信号符号化方法及び信号復号化方法及び信号符号化装置及び信号復号化装置及び信号符号化プログラム及び信号復号化プログラム
US10763885B2 (en) Method of error concealment, and associated device
US20080130678A1 (en) Method And Devices For Providing Protection In Packet Switched Communication Networks
KR19990070424A (ko) 차등 펄스 부호 변조를 위한 부조합 평균 중점 예측기
WO2011051629A3 (fr) Procede de reception et recepteur pour transmission numerique serie codee sur un canal non stationnaire

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111214

Termination date: 20121028