CN103474083A - 基于正交正弦脉冲序列定位标签的语音时间规整方法 - Google Patents
基于正交正弦脉冲序列定位标签的语音时间规整方法 Download PDFInfo
- Publication number
- CN103474083A CN103474083A CN2013104303390A CN201310430339A CN103474083A CN 103474083 A CN103474083 A CN 103474083A CN 2013104303390 A CN2013104303390 A CN 2013104303390A CN 201310430339 A CN201310430339 A CN 201310430339A CN 103474083 A CN103474083 A CN 103474083A
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- transmission system
- communication
- positioning label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明公开了一种基于正交正弦脉冲序列定位标签的语音时间规整方法,其特征是利用正弦脉冲序列之间的正交性,设计由一组正交正弦脉冲序列构成的定位标签并插入原始语音信号之前,与原始语音信号一起组成测试信号,再将测试信号通过通信或语音传输系统后的输出信号与定位标签进行互相关运算,根据互相关函数最大值位置估计系统时延,实现通信或语音传输系统输入与输出信号的时间规整。与传统基于语音包络互相关的时间规整方法相比,本发明方法简单,时间规整精度高,在低信噪比条件下仍能获得较高的时间规整精度,能更好地满足可懂度客观测量实际应用需求。
Description
技术领域
本发明涉及基于输入-输出的语音可懂度测量方法或语音质量客观评价方法,主要应用于使通信或语音传输系统的输出语音信号与输入语音信号在时域对齐,即时间规整。
背景技术
基于输入-输出的语音可懂度测量方法或语音质量客观评价方法以原始语音作参考,评估通信或语音传输系统输出语音信号的失真程度,并以输出语音信号的失真度作为语音可懂度或语音质量预测依据。使用此类方法的前提是输出语音信号与输入语音信号在时域精确对齐,即时间规整。时间规整的本质是估计并消除输出语音信号与输入语音信号之间的时间延迟,估计精度直接影响后续语音质量或可懂度测量的精度。
通常情况下,语音信号处理以帧为基本分析单元,且帧长取值范围为25ms~64ms,时间规整的误差应远小于帧长,一般要求小于3ms。
目前,基于输入-输出的可懂度测量研究大多围绕参数提取与失真距离测量算法。已有算法通常基于语音信号自身包络进行时间规整,但语音包络自相关函数的主瓣宽度宽、主副比低,导致此类方法在低信噪比条件下的时间规整精度较低。
发明内容
本发明的目的在于提供一种基于正交正弦脉冲序列定位标签的语音时间规整方法。利用正弦脉冲序列之间的正交性,设计由一组正交正弦脉冲序列构成的定位标签,插入在测试语音之前,与原始语音信号一起组成测试信号,再将测试信号通过通信或语音传输系统后的输出信号与定位标签进行互相关运算,根据互相关函数最大值位置估计系统时延,实现通信或语音传输系统输入与输出信号的时间规整。
本发明为解决技术问题采用如下技术方案:
本发明基于正交正弦脉冲序列定位标签的语音时间规整方法的特点是:利用正弦脉冲序列之间的正交性,设计由一组正交正弦脉冲序列构成的定位标签并插入原始语音信号之前,与原始语音信号一起组成测试信号,再将测试信号通过通信或语音传输系统后的输出信号与定位标签进行互相关运算,根据互相关函数最大值位置估计系统时延,实现通信或语音传输系统输入与输出信号的时间规整。
本发明基于正交正弦脉冲序列定位标签的语音时间规整方法的特点在于按如下过程进行:
针对通信或语音传输系统设计语音测试信号,所述语音测试信号x(t)是在原始语音信号s(t)起始位置之前插入一段时长为L的正交正弦脉冲序列定位标签l(t),用式(1)表示为:
x(t)=l(t)+s(t-L) (1)
所述正交正弦脉冲序列定位标签l(t)按式(2)获得:
式(2)中,f0为正交正弦脉冲序列定位标签的基频,取值为10Hz-1.5kHz,为每个正弦脉冲序列的初始相位,取值范围不限,T0=1/f0;u(t)为阶跃函数,K是满足3kf0≤fmax的最大整数k,fmax是能通过待测通信或语音传输系统的语音信号的最高频率。
以语音测试信号x(t)为所述通信或语音传输系统的输入信号,将所述通信或语音传输系统的输出语音信号y(t)与定位标签l(t)进行互相关运算,然后将互相关函数取得最大值的位置偏移量作为通信或语音传输系统时延τ0的估计值进而以为起点,从通信或语音传输系统输出失真语音信号y(t)中截取与原始语音信号s(t)等长度的信号作为测试语音的输出响应,达到时间规整的目的。
与已有技术相比,本发明有益效果体现在:
1、本发明方法时间规整精度与测试样本无关,便于在实际应用中灵活控制;
2、本发明正交正弦脉冲序列定位标签的主要能量集中在音频范围,系统通过性好;
3、本发明定位标签的均方根带宽远大于语音包络的均方根带宽,时间规整精度显著提高;
4、本发明定位标签与语音、噪声弱相关或不相关,自相关函数近似于单位脉冲函数,具有很好的抗噪能力。
附图说明
图1为本发明方法原理框图;
图2为本发明方法中定位标签自相关函数波形实例;
图3为本发明方法中原始语音信号实例;
图4为本发明方法中插入定位标签后的测试信号实例;
图5为本发明方法中通信或语音传输系统输出语音信号实例;
图6为本发明方法中定位标签与系统输出语音的互相关函数波形实例;
图7为利用本发明方法进行时间规整后的语音信号实例。
具体实施方式
具体实施中的基于正交正弦脉冲序列定位标签的语音时间规整方法按如下过程进行:
针对通信或语音传输系统,设计语音测试信号x(t),语音测试信号x(t)是在原始语音信号s(t)起始位置之前插入一段时长为L的正交正弦脉冲序列定位标签l(t),用式(1)表征为:
x(t)=l(t)+s(t-L) (1)
正交正弦脉冲序列定位标签l(t)按式(2)获得:
式(2)中,f0为正交正弦脉冲序列定位标签的基频,取值为10Hz-1.5kHz,为每个正弦脉冲序列的初始相位,取值范围不限;T0=1/f0,u(t)为阶跃函数,K是满足3kf0≤fmax的最大整数k,fmax是能通过待测通信或语音传输系统的语音信号的最高频率。
以语音测试信号x(t)为所述通信或语音传输系统的输入信号,将所述通信或语音传输系统的输出语音信号y(t)与定位标签l(t)进行互相关运算,然后将互相关函数取得最大值的位置偏移量作为通信或语音传输系统时延τ0的估计值进而以为起点,从通信或语音传输系统输出失真语音信号y(t)中截取与原始语音信号s(t)等长度的信号作为测试语音的输出响应,达到时间规整的目的。
以给出的实施例为例,基于正交正弦脉冲序列定位标签的语音时间规整方法的过程是:
(1)定位标签设计:图1所示的正交正弦脉冲序列的定位标签设计公式如式(2)所示,假设某系统能通过的最高频率fmax为3.6kHz,则当f0取40Hz时,K等于30,定位标签时间长度为750ms,其自相关特性如图2所示;
(2)在图3所示原始语音信号实例前插入定位标签生成语音测试信号如图4所示;
(3)将语音测试信号输入通信或语音传输系统,并采集存储通信或语音传输系统的输出信号,图5所示通信或语音传输系统输出语音信号实例存在500ms的系统时延;
(4)时延估计:将待测通信或语音传输系统输出信号与定位标签进行互相关运算,将互相关函数取得最大值位置代表的时延作为系统时延估计值,图6为本实施例中定位标签与输出语音的自相关函数波形实例,获得时延估计值为500.125ms,因此,本实施例的时延估记误差为0.125ms;
(5)平移、截断:根据时延估计值和输入信号长度从输出信号中截取有用信号。在图5所示通信或语音传输系统输出语音信号实例中,以1000.125ms为起点,截取与原始语音信号等长的信号,图7为经过上述步骤获得的结果。
定位标签l(t)是利用三角函数集{sin(Ωt),sin(2Ωt),...,sin(nΩt),...}中任意两个函数在区间(t0,t0+T)(T=2π/Ω)正交的性质,即
定位标签的特征是:
1、定位标签由一组确定的正弦脉冲序列组成,正弦脉冲序列之间两两正交,每个正弦脉冲的时间长度均为T0;
2、定位标签的功率谱分布在fmax/3内近似为常数;
3、定位标签与语音、噪声弱相关或不相关,自相关函数近似于单位脉冲函数,具有很好的抗噪能力。
Claims (2)
1.一种基于正交正弦脉冲序列定位标签的语音时间规整方法,其特征是:利用正弦脉冲序列之间的正交性,设计由一组正交正弦脉冲序列构成的定位标签并插入原始语音信号之前,与原始语音信号一起组成测试信号,再将测试信号通过通信或语音传输系统后的输出信号与定位标签进行互相关运算,根据互相关函数最大值位置估计系统时延,实现通信或语音传输系统输入与输出信号的时间规整。
2.根据权利要求1所述的基于正交正弦脉冲序列定位标签的语音时间规整方法,其特征是按如下过程进行:
针对通信或语音传输系统设计语音测试信号,所述语音测试信号x(t)是在原始语音信号s(t)起始位置之前插入一段时长为L的正交正弦脉冲序列定位标签l(t),用式(1)表示为:
x(t)=l(t)+s(t-L) (1)
所述正交正弦脉冲序列定位标签l(t)按式(2)获得:
式(2)中,f0为正交正弦脉冲序列定位标签的基频,取值为10Hz-1.5kHz,为每个正弦脉冲序列的初始相位,取值范围不限,T0=1/f0,u(t)为阶跃函数,K是满足3kf0≤fmax的最大整数k,fmax是能通过待测通信或语音传输系统的语音信号的最高频率;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310430339.0A CN103474083B (zh) | 2013-09-18 | 2013-09-18 | 基于正交正弦脉冲序列定位标签的语音时间规整方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310430339.0A CN103474083B (zh) | 2013-09-18 | 2013-09-18 | 基于正交正弦脉冲序列定位标签的语音时间规整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103474083A true CN103474083A (zh) | 2013-12-25 |
CN103474083B CN103474083B (zh) | 2015-11-18 |
Family
ID=49798902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310430339.0A Expired - Fee Related CN103474083B (zh) | 2013-09-18 | 2013-09-18 | 基于正交正弦脉冲序列定位标签的语音时间规整方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103474083B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109903752A (zh) * | 2018-05-28 | 2019-06-18 | 华为技术有限公司 | 对齐语音的方法和装置 |
CN111489759A (zh) * | 2020-03-23 | 2020-08-04 | 天津大学 | 基于光纤语音时域信号波形对齐的噪声评估方法 |
CN113436610A (zh) * | 2020-03-23 | 2021-09-24 | 阿里巴巴集团控股有限公司 | 测试方法、装置及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100333049B1 (ko) * | 2000-01-25 | 2002-04-22 | 박종섭 | 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법 |
CN101048813A (zh) * | 2004-08-30 | 2007-10-03 | 高通股份有限公司 | 用于语音ip传输的自适应去抖动缓冲器 |
US7680655B2 (en) * | 2005-05-20 | 2010-03-16 | Alcatel-Lucent Usa Inc. | Method and apparatus for measuring the quality of speech transmissions that use speech compression |
CN102379112A (zh) * | 2009-04-07 | 2012-03-14 | 高通股份有限公司 | 在通信系统中确定延迟 |
-
2013
- 2013-09-18 CN CN201310430339.0A patent/CN103474083B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100333049B1 (ko) * | 2000-01-25 | 2002-04-22 | 박종섭 | 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법 |
CN101048813A (zh) * | 2004-08-30 | 2007-10-03 | 高通股份有限公司 | 用于语音ip传输的自适应去抖动缓冲器 |
US7680655B2 (en) * | 2005-05-20 | 2010-03-16 | Alcatel-Lucent Usa Inc. | Method and apparatus for measuring the quality of speech transmissions that use speech compression |
CN102379112A (zh) * | 2009-04-07 | 2012-03-14 | 高通股份有限公司 | 在通信系统中确定延迟 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109903752A (zh) * | 2018-05-28 | 2019-06-18 | 华为技术有限公司 | 对齐语音的方法和装置 |
WO2019228306A1 (zh) * | 2018-05-28 | 2019-12-05 | 华为技术有限公司 | 对齐语音的方法和装置 |
CN109903752B (zh) * | 2018-05-28 | 2021-04-20 | 华为技术有限公司 | 对齐语音的方法和装置 |
US11631397B2 (en) | 2018-05-28 | 2023-04-18 | Huawei Technologies Co., Ltd. | Voice alignment method and apparatus |
CN111489759A (zh) * | 2020-03-23 | 2020-08-04 | 天津大学 | 基于光纤语音时域信号波形对齐的噪声评估方法 |
CN113436610A (zh) * | 2020-03-23 | 2021-09-24 | 阿里巴巴集团控股有限公司 | 测试方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103474083B (zh) | 2015-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
San Liang | Unraveling the cause-effect relation between time series | |
CN106199185B (zh) | 一种基于连续对数扫频的线性脉冲响应测量方法及系统 | |
CN101701983A (zh) | 基于music谱估计和hbf神经网络的电力系统间谐波检测方法 | |
CN106331951B (zh) | 一种基于连续对数扫频的谐波失真测量方法及系统 | |
CN102393488B (zh) | 一种谐波分析方法 | |
CN103308766A (zh) | 一种基于凯撒自卷积窗双谱线插值fft谐波分析方法及其装置 | |
CN101900761B (zh) | 一种高准确度非整周期采样谐波分析测量方法 | |
CN101901209B (zh) | 基于改进emd和arma模型的结构响应分析方法 | |
CN103941090B (zh) | 基于谱线能量插值的谐波测量方法 | |
CN107566061A (zh) | 微波秒级时延校准系统 | |
CN103474083B (zh) | 基于正交正弦脉冲序列定位标签的语音时间规整方法 | |
CN102508026A (zh) | 一种电能质量谐波分析仪的谐波分析方法 | |
CN104218973A (zh) | 基于Myriad滤波的跳频信号参数估计方法 | |
CN105675126A (zh) | 一种用于检测多频多源复杂稳定声场声压的新方法 | |
CN103795411A (zh) | 基于五项最大旁瓣衰减窗三谱线插值测试sfdr的方法 | |
CN103575979B (zh) | 一种数字化测量交流电频率的方法 | |
CN102495280A (zh) | 一种抗噪音宽带频率测量方法及锁相频率计 | |
CN104215833A (zh) | 电力系统频率测量方法及装置 | |
CN101718816A (zh) | 基于四项系数Nuttall窗插值FFT的基波与谐波检测方法 | |
CN101335567A (zh) | 超宽带非相干系统的平均误码率在IEEE802.15.3a的S-V修正模型衰落信道下的评估方法 | |
CN106772193A (zh) | 一种电流互感器频率特性测量装置及其方法 | |
CN103823120A (zh) | 一种任意波形失真度的确定方法 | |
CN104849551B (zh) | 一种谐相角分析方法 | |
CN102546116A (zh) | 基于压缩感知的跳频信号盲检测方法 | |
CN108169715B (zh) | 一种同相和正交通道相位不平衡度确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151118 Termination date: 20190918 |
|
CF01 | Termination of patent right due to non-payment of annual fee |