CN101976567B - 一种语音信号差错掩盖方法 - Google Patents
一种语音信号差错掩盖方法 Download PDFInfo
- Publication number
- CN101976567B CN101976567B CN201010521774A CN201010521774A CN101976567B CN 101976567 B CN101976567 B CN 101976567B CN 201010521774 A CN201010521774 A CN 201010521774A CN 201010521774 A CN201010521774 A CN 201010521774A CN 101976567 B CN101976567 B CN 101976567B
- Authority
- CN
- China
- Prior art keywords
- polynomial
- voice signal
- voice
- packet loss
- fitting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种语音信号的差错掩盖方法,涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。包括以下步骤为:根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N(N≥2),语音信号的采样率为fs;选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);采用多项式拟合x(t);采用多项式拟合y(s);利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;根据上述步骤获得的预测值,对丢包部分语音值进行替代。
Description
技术领域:
本发明涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。
背景技术:
基于IP的语音通信业务量几年来一直呈上升趋势,同时,传统公共电话网正在逐步向以IP技术为核心的下一代网络演进。然而,基于IP的压缩语音数据包在网络中传输时,会不可避免地由于网络拥塞或传输信道误码等引起丢包,特别是在无线网络中传输时丢包问题更加严重。为了减小丢包对接收端语音质量的影响,已有许多差错控制技术用来对抗丢包的影响,其中,差错掩盖技术便是在接收端中广泛采用的一种改善语音主观听觉效果的方法。
从已有的研究成果来看,语音信号差错掩盖技术主要包括:基于插入的方法、基于再生的方法和基于内插的方法三大类。基于插入的方法是通过插入填充包来实现差错掩盖,而填充包通常是非常简单的静默或噪音替代以及前面收到的包的简单重复。这类方法容易实现,但是掩盖性能较差。基于再生的方法利用语音编码算法的相关知识估计出丢包部分语音的解码参数,进而通过解码或合成恢复丢失的语音信号。这类方法依赖于语音编码算法,不同的语音编码器要采用对应的掩盖方法,通常这类掩盖方法的复杂度也比较高。基于内插的方法是利用某种形式的模式匹配和内插来得到和丢包语音信号相似的可替换包,这类算法比基于插入的方法复杂,但可以获得较好的恢复效果,同时方法的通用性比基于再生的方法好。
经过对现有技术的文献检索发现,David J.Goodman等人在1986年《IEEE声学、语音与信号处理期刊》(IEEE Transactions on acoustics,speech and signal processing)第34卷1440页到1448页发表的“Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications”(分组语音通信中恢复丢失语音段的波形替代技术)一文中提出的基于模式匹配的波形替代方法和基于音高检测的波形替代方法,是两种较好的基于内插的语音信号差错掩盖方法。基于模式匹配的波形替代方法将丢失语音包(含L个采样的语音段)前面的语音信号中紧邻丢包语音段的部分语音(含M个采样的语音子段,M<L,通常M取L的二分之一)看作“模板”(template),然后在丢包语音段更前面或后面的语音信号中搜索和该模板最匹配的语音子段,找到后将含有该语音子段的L个采样的语音段作为丢失语音包的替代,从而实现丢包语音信号的差错掩盖。基于音高检测的波形替代方法同基于模式匹配的波形替代方法类似,只是采用音高检测代替模版匹配在丢包语音段前面或后面的语音信号中搜索能够替代丢包语音段的波形信号。
上述基于波形替代的方法是利用丢包语音段的前面或后面语音信号中具有和丢包语音段相似的波形这一特征,因此当语音信号波形不具有重复性时这种方法就得不到理想的掩盖结果。
发明内容:
本发明的目的是针对现有技术的不足,提供一种用于语音信号差错掩盖的方法,使接收端能够恢复出高质量的掩盖语音信号。
本发明是通过以下技术方案实现的:
一种语音信号的差错掩盖方法,其特征在于,包括以下步骤:
第一步:根据接收端丢失的语音包的长度确定丢包部分的语音信号采样点数,并设该丢包部分的语音采样点数为L;设丢失帧的帧序号为N,且N≥2,语音信号的采样率为fs;
第二步:选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);
第三步:采用多项式拟合x(t);
第四步:采用多项式拟合y(s);
第五步:利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);
第六步:利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;
第七步:根据上述步骤获得的预测值,对丢包部分语音值进行替代。
所述第二步采用的多项式拟合x(t),设该多项式为X(t),具体如下:
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
其中,a0,a1,...,an为多项式的系数,n为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs。
所述第三步采用的多项式拟合y(s),设该多项式为Y(s),具体如下:
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
其中,b0,b1,...,bp为多项式的系数,p为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs。
所述利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r),具体如下:
c.若n≥p,则将y(s)的拟合多项式Y(s)扩展为n阶,那么
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp+bp+1sp+1+...+bnsn
其中,bp+1,...,bn均为0
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cn-1rn-1+cnrn
其中,c0=a0-b0,c1=a1-b1,...,cn=an-bn,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs;
d.若n<p,则将x(t)的拟合多项式X(t)扩展为p阶,那么
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn+an+1tn+1+...+aptp
其中,an+1,...,ap均为0
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cp-1rp-1+cprp
其中,c0=a0-b0,c1=a1-b1,...,cp=ap-bp,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs。
本发明的有益效果:本发明与现有技术,如基于模式匹配的波形替代方法和前帧替代方法相比,信号的信噪比(SNR)平均要提高1dB以上,且具有更好的主观听觉效果。
附图说明:
图1为本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结果。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。
设解码端对音频流解码后定位到丢失帧的位置,设丢失帧的帧序号为N(N≥2),已经将丢失帧前面的第N-1帧和丢失帧后面的第N+1帧正确解码,丢失帧的采样点数为160,语音的采样率fs为8000Hz。本发明实施例的具体实施步骤为:
(1)选取丢包语音前面第N-1帧已正确解码的语音信号采样点L个,并设该语音信 号为x(t);同时,选取丢包语音后面第N+1帧已正确解码的语音信号采样点L个,并设该语音信号为y(s);
(2)采用多项式拟合x(t),设此多项式为X(t),
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
其中,a0,a1,...,an为多项式的系数,n为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs。
(3)由最小二乘法确定多项式x(t)的拟合系数,假设各数据点的权值为1,令,
则有:
即:
解此方程组就可以得到多项式系数向量A=a0,a1,...,an。
(4)采用多项式拟合y(s),设此多项式为Y(s),如公式
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
其中,b0,b1,...,bp为多项式的系数,p为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs。
(5)由最小二乘法确定多项式y(s)的拟合系数,假设各数据点的权值为1,令,
则有:
即:
解此方程组就可以得到多项式系数向量B=b0,b1,...,bp。
(6)利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);所述利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式,具体如下:
①若n≥p,则将y(s)的拟合多项式Y(s)扩展为n阶,如公式
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp+bp+1sp+1+...+bnsn
其中,bp+1,...,bn均为0.
生成丢包部分语音信号的多项式表达式z(r),如公式
z(r)=c0+c1r+c2r2+...+cn-1rn-1+cnrn
其中,丢包部分语音信号的多项式系数与第N-1帧和第N+1帧语音信号的多项式系数的关系是:
c0=a0-b0,c1=a1-b1,...,cn=an-bn
且,r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs。
②若n<p,则将x(t)的拟合多项式X(t)扩展为p阶,如公式
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn+an+1tn+1+...+aptp
其中,an+1,...,ap均为0.
生成丢包部分语音信号的多项式表达式z(r),如公式
z(r)=c0+c1r+c2r2+...+cp-1rp-1+cprp
其中,丢包部分语音信号的多项式系数与第N-1帧和第N+1帧语音信号的多项式系数的关系是:
c0=a0-b0,c1=a1-b1,...,cp=ap-bp
且,r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs。
(5)利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值。
(6)根据上述步骤获得的预测值,对丢包部分语音值进行替代。
作为对比实例,本发明实施例还实现了对语音信号ring.wav(fs=8000Hz,n=160,, L=80)在不同丢包率下基于模式匹配的波形替代方法和前帧替代方法。实验发现,本发明相比基于模式匹配的波形替代方法和前帧替代方法具有更好的掩盖效果,信号的信噪比(SNR)在不同丢包率下都有较大提高。图1给出了本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结果。
Claims (4)
1.一种语音信号的差错掩盖方法,其特征在于,包括以下步骤:
第一步:根据接收端丢失的语音包的长度确定丢包部分的语音信号采样点数,并设该丢包部分的语音信号采样点数为L;设丢失帧的帧序号为N,且N≥2,语音信号的采样率为fs;
第二步:选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);
第三步:采用多项式拟合x(t);
第四步:采用多项式拟合y(s);
第五步:利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);
第六步:利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;
第七步:根据上述步骤获得的预测值,对丢包部分语音值进行替代。
2.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于:所述第二步采用的多项式拟合x(t),设该多项式为X(t),具体如下:
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
其中,a0,a1,..,an为多项式的系数,n 为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs。
3.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于,所述第三步采用的多项式拟合y(s),设该多项式为Y(s),具体如下:
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
其中,b0,b1,...,bp为多项式的系数,p 为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs。
4.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征是,所述利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r),具体如下:
其中:X(t)=a0+a1t+a2t2+...+an-1tn-1+antn
a0,a1,...,an 为多项式的系数,n为多项式的阶数,t=(N-2)·L/fs,((N-2)·L+1)/fs,...,((N-1)·L-1)/fs,
其中:Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp
b0,b1,...,bp为多项式的系数,p为多项式的阶数,s=N·L/fs,(N·L+1)/fs,...,((N+1)·L-1)/fs,那么
a.若n≥p,则将y(s)的拟合多项式Y(s)扩展为n阶,那么
Y(s)=b0+b1s+b2s2+...+bp-1sp-1+bpsp+bp+1sp+1+...+bnsn
其中,bp+1,...,bn均为0,
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cn-1rn-1+cnrn
其中,c0=a0-b0,c1=a1-b1,...,cn=an-bn,且有,r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs;
b.若n<p,则将x(t)的拟合多项式X(t)扩展为p阶,那么
X(t)=a0+a1t+a2t2+...+an-1tn-1+antn+an+1tn+1+...+aptp
其中,an+1,...,ap均为0,
生成丢包部分语音信号的多项式表达式z(r),则
z(r)=c0+c1r+c2r2+...+cp-1rp-1+cprp
其中,c0=a0-b0,c1=a1-b1,...,cp=ap-bp,且有,
r=(N-1)·L/fs,((N-1)·L+1)/fs,...,(N·L-1)/fs。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010521774A CN101976567B (zh) | 2010-10-28 | 2010-10-28 | 一种语音信号差错掩盖方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010521774A CN101976567B (zh) | 2010-10-28 | 2010-10-28 | 一种语音信号差错掩盖方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101976567A CN101976567A (zh) | 2011-02-16 |
CN101976567B true CN101976567B (zh) | 2011-12-14 |
Family
ID=43576448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010521774A Expired - Fee Related CN101976567B (zh) | 2010-10-28 | 2010-10-28 | 一种语音信号差错掩盖方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101976567B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9978388B2 (en) * | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
CN112634868B (zh) * | 2020-12-21 | 2024-04-05 | 北京声智科技有限公司 | 一种语音信号处理方法、装置、介质和设备 |
CN113838477B (zh) * | 2021-09-13 | 2024-08-02 | 上海兆言网络科技有限公司 | 音频数据包的丢包恢复方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1441950A (zh) * | 2000-07-14 | 2003-09-10 | 康奈克森特系统公司 | 处理丢失帧的语音通信系统及方法 |
CN101221765A (zh) * | 2008-01-29 | 2008-07-16 | 北京理工大学 | 一种基于语音前向包络预测的差错隐藏方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7359409B2 (en) * | 2005-02-02 | 2008-04-15 | Texas Instruments Incorporated | Packet loss concealment for voice over packet networks |
US20070282601A1 (en) * | 2006-06-02 | 2007-12-06 | Texas Instruments Inc. | Packet loss concealment for a conjugate structure algebraic code excited linear prediction decoder |
-
2010
- 2010-10-28 CN CN201010521774A patent/CN101976567B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1441950A (zh) * | 2000-07-14 | 2003-09-10 | 康奈克森特系统公司 | 处理丢失帧的语音通信系统及方法 |
CN101221765A (zh) * | 2008-01-29 | 2008-07-16 | 北京理工大学 | 一种基于语音前向包络预测的差错隐藏方法 |
Non-Patent Citations (1)
Title |
---|
Mohamed Chibani, et al..Fast Recovery for a CELP-Like Speech Codec After a Frame Erasure.《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》.2007,第15卷(第8期),2485-2495. * |
Also Published As
Publication number | Publication date |
---|---|
CN101976567A (zh) | 2011-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101147190B (zh) | 语音通信中的帧擦除隐蔽 | |
US8428959B2 (en) | Audio packet loss concealment by transform interpolation | |
ES2836220T3 (es) | Sistema y procedimiento de recuperación de errores de transmisión de paquetes basada en redundancia | |
CN102598119B (zh) | 基音估计 | |
CN105306110B (zh) | 一种实现音乐同步播放的方法及系统 | |
US20040001599A1 (en) | System and method of noise reduction in receiving wireless transmission of packetized audio signals | |
CN1081298A (zh) | 无线电通信系统接收器中帧检测质量估计的一种方法和装置 | |
EP1449305A1 (en) | Method for replacing corrupted audio data | |
CN101976567B (zh) | 一种语音信号差错掩盖方法 | |
CN103456307B (zh) | 音频解码器中帧差错隐藏的谱代替方法及系统 | |
US8676573B2 (en) | Error concealment | |
CN101166071A (zh) | 差错帧隐藏装置与方法 | |
CN101221765B (zh) | 一种基于语音前向包络预测的差错隐藏方法 | |
CN106683681B (zh) | 处理丢失帧的方法和装置 | |
EP1649452B1 (en) | Error concealment in multi-channel audio systems | |
KR20070059860A (ko) | 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치 | |
CN1929355B (zh) | 语音包丢失恢复系统以及方法 | |
JP3472279B2 (ja) | 音声符号化パラメータ符号化方法及び装置 | |
CN112992160B (zh) | 一种音频错误隐藏方法及装置 | |
US20040064308A1 (en) | Method and apparatus for speech packet loss recovery | |
JP2006279809A (ja) | 音声再生装置および音声再生方法 | |
Aoki | A VoIP packet loss concealment technique taking account of pitch variation in pitch waveform replication | |
JP2004023191A (ja) | 信号符号化方法及び信号復号化方法及び信号符号化装置及び信号復号化装置及び信号符号化プログラム及び信号復号化プログラム | |
Lu et al. | A low complexity packet loss recovery method for audio transmission | |
US10763885B2 (en) | Method of error concealment, and associated device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111214 Termination date: 20121028 |