CN101261836B - 基于过渡帧判决及处理的激励信号自然度提高方法 - Google Patents
基于过渡帧判决及处理的激励信号自然度提高方法 Download PDFInfo
- Publication number
- CN101261836B CN101261836B CN2008101051378A CN200810105137A CN101261836B CN 101261836 B CN101261836 B CN 101261836B CN 2008101051378 A CN2008101051378 A CN 2008101051378A CN 200810105137 A CN200810105137 A CN 200810105137A CN 101261836 B CN101261836 B CN 101261836B
- Authority
- CN
- China
- Prior art keywords
- parameter
- frame
- present frame
- par
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000007704 transition Effects 0.000 title claims abstract description 33
- 230000005284 excitation Effects 0.000 title claims description 14
- 238000012545 processing Methods 0.000 title claims description 6
- 230000002708 enhancing effect Effects 0.000 title 1
- 238000005070 sampling Methods 0.000 claims abstract description 26
- 238000013139 quantization Methods 0.000 claims description 15
- 238000005086 pumping Methods 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 7
- 101000622137 Homo sapiens P-selectin Proteins 0.000 abstract description 6
- 102100023472 P-selectin Human genes 0.000 abstract description 6
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 abstract description 6
- 238000011002 quantification Methods 0.000 abstract description 5
- 239000013598 vector Substances 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 238000010189 synthetic method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
基于过渡帧判决及处理的激励信号自然度提高方法属于低速率语音压缩编码技术领域。若当前帧前后各60个样点的平均能量比值小于1/32,则被判定为过渡帧,并用子带清浊音矢量的冗余模式进行表示,解码端对参数进行解量化,根据解码得到的子带清浊音矢量判决当前帧是否为过渡帧,若判定为非过渡帧,再判决当前帧是否为浊音帧且前一帧是否为清音帧,若是,则在合成激励信号时,解码端当前帧参数不与前一帧参数进行插值。这种方法可以提高合成语音的自然度。该方法适用于SELP 2.4kbps声码器。
Description
技术领域
本发明属于语音编码技术领域,特别针对于SELP 2.4kbps声码器技术。
背景技术
语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。近些年来国际电信联盟(ITU)、一些区域组织和一些国家相继制定了一系列语音压缩编码标准,在编码速率为2.4kb/s到16kb/s上得到了令人满意的语音质量。目前国内外的研究主要集中在2.4kb/s以下速率高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放等。低速率语音编码中激励信号的合成非常重要,SELP声码器采用混合激励信号,用基音周期参数、能量参数、余量谱幅度参数以及子带清浊音判决参数描述激励信号的特征,合成语音清晰自然。目前SELP 2.4kbps声码器技术中激励信号合成的主要步骤如下:
步骤(1)对输入语音信号样点按时间顺序分帧;
步骤(2)对当前帧提取基音周期参数;
步骤(3)对当前帧提取能量参数;
步骤(4)对当前帧提取余量谱幅度参数;
步骤(5)对当前帧提取5个子带清浊音判决参数;
步骤(6)将步骤(2)、步骤(3)、步骤(4)以及步骤(5)求取的特征参数进行量化,将量化索引传递给解码端;
步骤(7)解码端根据步骤(6)发送的量化索引进行解量化,得到合成激励信号所需的参数;
步骤(8)对步骤(7)中求取的特征参数进行插值。若前一帧和当前帧为浊音帧,并且基音周期的变化率小于22.5%,则对解码端参数采用逐点的线性插值;否则采用分段插值;
步骤(9)根据步骤(8)中插值后的参数合成激励信号。
上述已有技术对子带清浊音判决参数采用5bit量化,每个子带的清浊音特性用1bit表示,当某个子带为浊音时将其清浊音判决参数置为1,否则置为0。由于当第一个子带为清音时,后四个子带也必为清音,因此子带清浊音判决参数中有部分模式是不存在的,即子带清浊音判决参数的量化存在一定的冗余。
如图1所示,在子带清浊音判决参数的量化上,原有技术采用简单的每个子带清浊音判决参数1bit量化共5bit量化的方式,这会使编码后的码流存在一定的冗余度,没有充分的利用比特信息。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种基于过渡帧判决及处理的激励信号自然度提高方法,能够比较充分的利用子带清浊音判决参数量化的冗余度,提高清浊音过渡时合成语音的自然度。
本发明提出的基于过渡帧判决及处理的激励信号自然度提高方法,包括以下步骤:
在编码端,依次按以下步骤执行:
步骤(1)对输入语音信号样点按时间顺序分帧;
步骤(2)对当前帧提取基音周期参数;
步骤(3)对当前帧提取能量参数;
步骤(4)对当前帧提取余量谱幅度参数;
步骤(5)对当前帧提取5个子带清浊音判决参数;
步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧;
步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0,即,假设步骤(5)中求取的模式为11100,则修改为01100;
步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端;
在解码端,依次按以下步骤执行:
步骤(1′)解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数:若清浊音判决参数中第一个子带的清浊音判决参数为0,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧;
步骤(2′)将步骤(1′)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决参数;
步骤(3′)对步骤(1′)中所得到的参数进行插值。若前一帧和当前帧为浊音帧,并且基音周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值;若前一帧为清音帧且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值;否则采用分段插值;
步骤(4′)根据步骤(3′)中插值后的参数合成激励信号。
本发明的特点是对分帧后的语音信号采用过渡帧判决的方法,并且根据当前帧是否为过渡帧来修正子带清浊音判决参数。原有的技术对各个子带的清浊音判决参数采用简单的1bit量化,它没有考虑到子带清浊音判决参数中一些不存在的模式,因此增加了量化的冗余度。本发明利用了子带清浊音判决参数的冗余度,根据当前帧前后各60个样点的平均能量比值判定当前帧是否为过渡帧,根据当前帧是否为过渡帧来决定是否修正子带清浊音判决参数。解码端根据接收到的子带清浊音判决参数判定当前帧是否为过渡帧,并对第一个子带的清浊音判决参数进行修正,根据当前帧是否为过渡帧而采用不同的插值方案。
本方法可以降低参数量化的冗余度,提高清浊音过渡时合成语音的自然度。该方法主要针对于SELP 2.4kbps声码器。
附图说明
图1为已有技术的激励信号合成方法流程框图。
图2为本发明提出的激励信号合成方法流程框图。
具体实施方式
本发明提出的基于过渡帧判决及处理的激励信号自然度提高方法结合附图及实施例进一步说明如下:
本发明的方法流程如图2所示,包括以下步骤:
在编码端,依次按以下步骤执行:
步骤(1)对输入语音信号样点按时间顺序分帧;
步骤(2)对当前帧提取基音周期参数;
步骤(3)对当前帧提取能量参数;
步骤(4)对当前帧提取余量谱幅度参数;
步骤(5)对当前帧提取5个子带清浊音判决参数;
步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧;
步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0,即,假设步骤(5)中求取的模式为11100,则修改为01100;
步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端;
在解码端,依次按以下步骤执行:
步骤(1′)解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数:若清浊音判决参数中第一个子带的清浊音判决参数为0,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧;
步骤(2′)将步骤(1′)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决参数;
步骤(3′)对步骤(1′)中所得到的参数进行插值。若前一帧和当前帧为浊音帧,并且基音周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值;若前一帧为清音帧且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值;否则采用分段插值;
步骤(4′)根据步骤(3′)中插值后的参数合成激励信号。
本发明上述方法各步骤的具体实施例分别详细说明如下:
上述方法步骤(1)对输入语音信号样点按时间顺序分帧的实施例是按8khz频率采样、已经过高通滤波去除工频干扰的语音样点。同原有的SELP 2.4kbps声码器一样,每25ms,也就是200个语音样点构成一帧。
上述方法步骤(2)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法求取当前帧的基音周期参数Pitch。
上述方法步骤(3)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法求取当前帧的能量参数RMS。
上述方法步骤(4)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法求当前帧的余量谱幅度参数,记为矢量R,其维数为n。
R=[r1,r2,L,rn],n=10
上述方法步骤(5)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法对当前帧提取5个子带的清浊音参数,子带为清音用“0”表示,子带为浊音用“1”表示,得到5个子带清浊音判决参数,记为[Vbp1,Vbp2,Vbp3,Vbp4,Vbp5]。
上述方法步骤(6)的实施例为:计算当前帧前后各60个样点的平均能量,公式表示如下:用一个过渡帧标志位traflag来表征当前帧是否为过渡帧。若E2/E1>32,判定当前帧为过渡帧,并将traflag置为1;反之将其置为0。
上述方法步骤(7)的实施例为:若过渡帧判决标志位traflag=1,并且Vbp2+Vbp3+Vbp4+Vbp5≠0,则令Vbp1=0。
上述方法步骤(8)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法对当前帧的特征参数进行量化,发送量化索引。
上述方法步骤(1′)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法根据量化索引对当前帧的特征参数进行解量化。若Vbp1=0,并且Vbp2+Vbp3+Vbp4+Vbp5≠0,则令Vbp1=1,traflag=1;反之,令traflag=0。
上述方法步骤(2′)的实施例为:令Vbp=Vbp1,其中Vbp为全带清浊音判决参数。
上述方法步骤(3′)的实施例为:若Vbpold=Vbpnew=1,且|Pitchold-Pitchnew |<0.225×Pitchnew,则对解码端的Pitch、RMS、R以及[Vbp1,Vbp2,Vbp3,Vbp4,Vbp5]参数采用逐点的线性插值;若Vbpold=0,Vbpnew=1,且traflag=0,则不进行插值;否则采用分段插值。
逐点的线性插值采用如下计算公式
par(k)=parold+(parnew-parold)·k/(N-1)
分段插值采用如下计算公式
不进行插值时,有:par(k)=parnew
其中,parold为前一帧的参数,parnew为当前帧的参数,par(k)为插值后的参数,N为语音样点的个数,这里取200。
上述方法步骤(4′)的实施例为:按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法,利用子带清浊音判决、基音周期参数、余量谱幅度参数和能量参数进行激励信号合成。
Claims (1)
1.基于过渡帧判决及处理的激励信号自然度提高方法,其特征在于,所述方法在编、解码端依次按以下步骤实现:
在编码端,依次按如下步骤执行:
步骤(1)对输入的8khz频率采样的语音信号样点按时间顺序分帧,每帧200个样点;
步骤(2)对当前帧提取基音周期参数;
步骤(3)对当前帧提取能量参数;
步骤(4)对当前帧提取余量谱幅度参数;
步骤(5)对当前帧提取5个子带清浊音判决参数,子带清音用“0”表示,子带浊音用“1”表示;
步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧;
步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0;
步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端;
在解码端,依次按如下步骤执行:
步骤(1′)解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数,若清浊音判决参数中第一个子带的清浊音判决参数为0,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧;
步骤(2′)将步骤(1′)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决参数;
步骤(3′)对步骤(1′)中所得到的参数进行插值,若前一帧和当前帧为浊音帧,并且基音周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值,如公式(1)所示;若前一帧为清音帧且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值,即立刻使用本帧解码得到的参数值;否则采用分段插值,如公式(2)所示;
par(k)=parold+(parnew-parold)·k/(N-1) (1)
其中,N为每帧的合成语音样点,取值200,parold为前一帧的参数,parnew为当前帧的参数,par(k)为插值后的参数,k表示合成语音样点;
步骤(4′)根据步骤(3′)中插值后的参数合成激励信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101051378A CN101261836B (zh) | 2008-04-25 | 2008-04-25 | 基于过渡帧判决及处理的激励信号自然度提高方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101051378A CN101261836B (zh) | 2008-04-25 | 2008-04-25 | 基于过渡帧判决及处理的激励信号自然度提高方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101261836A CN101261836A (zh) | 2008-09-10 |
CN101261836B true CN101261836B (zh) | 2011-03-30 |
Family
ID=39962248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101051378A Expired - Fee Related CN101261836B (zh) | 2008-04-25 | 2008-04-25 | 基于过渡帧判决及处理的激励信号自然度提高方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101261836B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461088A (zh) * | 2018-03-21 | 2018-08-28 | 山东省计算中心(国家超级计算济南中心) | 基于支持向量机在语音解码端重构子带清浊音度参数的方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
CN103680509B (zh) * | 2013-12-16 | 2016-04-06 | 重庆邮电大学 | 一种语音信号非连续传输及背景噪声生成方法 |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN107369455B (zh) | 2014-03-21 | 2020-12-15 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US6128591A (en) * | 1997-07-11 | 2000-10-03 | U.S. Philips Corporation | Speech encoding system with increased frequency of determination of analysis coefficients in vicinity of transitions between voiced and unvoiced speech segments |
CN1975861A (zh) * | 2006-12-15 | 2007-06-06 | 清华大学 | 声码器基音周期参数抗信道误码方法 |
CN101004916A (zh) * | 2007-01-19 | 2007-07-25 | 清华大学 | 声码器线谱对参数抗信道误码方法 |
CN101009098A (zh) * | 2007-01-26 | 2007-08-01 | 清华大学 | 声码器增益参数分模式抗信道误码方法 |
CN101009096A (zh) * | 2006-12-15 | 2007-08-01 | 清华大学 | 子带清浊音模糊判决的方法 |
CN101030377A (zh) * | 2007-04-13 | 2007-09-05 | 清华大学 | 提高声码器基音周期参数量化精度的方法 |
-
2008
- 2008-04-25 CN CN2008101051378A patent/CN101261836B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US6128591A (en) * | 1997-07-11 | 2000-10-03 | U.S. Philips Corporation | Speech encoding system with increased frequency of determination of analysis coefficients in vicinity of transitions between voiced and unvoiced speech segments |
CN1975861A (zh) * | 2006-12-15 | 2007-06-06 | 清华大学 | 声码器基音周期参数抗信道误码方法 |
CN101009096A (zh) * | 2006-12-15 | 2007-08-01 | 清华大学 | 子带清浊音模糊判决的方法 |
CN101004916A (zh) * | 2007-01-19 | 2007-07-25 | 清华大学 | 声码器线谱对参数抗信道误码方法 |
CN101009098A (zh) * | 2007-01-26 | 2007-08-01 | 清华大学 | 声码器增益参数分模式抗信道误码方法 |
CN101030377A (zh) * | 2007-04-13 | 2007-09-05 | 清华大学 | 提高声码器基音周期参数量化精度的方法 |
Non-Patent Citations (2)
Title |
---|
李军林 等.0.8kb/s高质量声码器算法.《清华大学学报(自然科学版)》.2003,第43卷(第1期),第12-15页. |
李军林等.0.8kb/s高质量声码器算法.《清华大学学报(自然科学版)》.2003,第43卷(第1期),第12-15页. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461088A (zh) * | 2018-03-21 | 2018-08-28 | 山东省计算中心(国家超级计算济南中心) | 基于支持向量机在语音解码端重构子带清浊音度参数的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101261836A (zh) | 2008-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101261836B (zh) | 基于过渡帧判决及处理的激励信号自然度提高方法 | |
Geiser et al. | Bandwidth extension for hierarchical speech and audio coding in ITU-T Rec. G. 729.1 | |
TWI415114B (zh) | 用於計算頻譜包絡數目之裝置與方法 | |
EP2791937B1 (en) | Generation of a high band extension of a bandwidth extended audio signal | |
CN101577605B (zh) | 基于滤波器相似度的语音lpc隐藏和提取算法 | |
CN103325375B (zh) | 一种极低码率语音编解码设备及编解码方法 | |
CN103050121A (zh) | 线性预测语音编码方法及语音合成方法 | |
KR20080093074A (ko) | 오디오신호들의 분류 | |
JPH09190196A (ja) | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置、並びに携帯無線端末装置 | |
EP1756807B1 (en) | Audio encoding | |
JP2002541499A (ja) | Celp符号変換 | |
CN106256000A (zh) | 高频带激励信号生成 | |
CN105830153A (zh) | 高频带信号建模 | |
WO2009039645A1 (en) | Method and device for efficient quantization of transform information in an embedded speech and audio codec | |
TW463143B (en) | Low-bit rate speech encoding method | |
KR20160128871A (ko) | 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치 | |
CN101009096B (zh) | 子带清浊音模糊判决的方法 | |
CN104517614A (zh) | 基于各子带特征参数值的清浊音判决装置及其判决方法 | |
CN101304261B (zh) | 一种频带扩展的方法及装置 | |
EP2772911B1 (en) | Method and device for quantizing voice signals in a band-selective manner | |
EP1872364B1 (en) | Source coding and/or decoding | |
JP2007512572A (ja) | オーディオ符号化 | |
CN101295507A (zh) | 带级间预测的超帧声道参数多级矢量量化方法 | |
JPH07225599A (ja) | 音声の符号化方法 | |
Milkovic et al. | Speech coding methods in mobile radiocommunication systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110330 Termination date: 20150425 |
|
EXPY | Termination of patent right or utility model |