CN101303855B - 一种舒适噪声参数产生方法和装置 - Google Patents

一种舒适噪声参数产生方法和装置 Download PDF

Info

Publication number
CN101303855B
CN101303855B CN 200710104395 CN200710104395A CN101303855B CN 101303855 B CN101303855 B CN 101303855B CN 200710104395 CN200710104395 CN 200710104395 CN 200710104395 A CN200710104395 A CN 200710104395A CN 101303855 B CN101303855 B CN 101303855B
Authority
CN
China
Prior art keywords
frame
parameter
energy
frequency spectrum
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 200710104395
Other languages
English (en)
Other versions
CN101303855A (zh
Inventor
李伟
孙晓刚
刘丽
曹军彬
张清
许丽净
许剑峰
杜正中
胡晨
苗磊
杨毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN 200710104395 priority Critical patent/CN101303855B/zh
Priority to PCT/CN2008/070925 priority patent/WO2008138263A1/zh
Publication of CN101303855A publication Critical patent/CN101303855A/zh
Application granted granted Critical
Publication of CN101303855B publication Critical patent/CN101303855B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明实施例公开了一种舒适噪声参数产生方法,包括:计算当前一组连续帧中各帧的能量特征值以及频谱特征值;从所述计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;从所述计算出的各帧频谱特征值中选择出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。本发明实施例同时公开了一种舒适噪声参数产生装置,应用该方法和装置能够实现简单方便地生成舒适噪声参数。

Description

一种舒适噪声参数产生方法和装置
技术领域
本发明涉及音频处理技术,特别涉及一种舒适噪声参数产生方法和装置。
背景技术
在当前的移动通信系统中,通常采用不连续传输模式(DTX)对语音信息进行传输。所谓DTX,是指在语音暂停的情况下,发送方移动终端(以下简称发送端)只发送相对于正常情况下极少的数据量,而接收方移动终端(以下简称接收端)根据接收到的数据中所包含的参数产生舒适噪声。这种方式有利于节省移动终端和基站的电能以及带宽,并降低传输数据的比特率和减少冲突,从而保证移动通信的通信质量。
在DTX传输模式中,当语音暂停时,伴随语音信息一起传输的背景噪声也会随之消失,造成背景噪声的不连续性。如果这种切换快速发生,尤其是当发生在车用环境中或是背景噪声水平比较高的时候,会给接收端用户造成主观感觉上语音质量的严重下降。为避免这种情况的发生,在语音暂停的情况下,发送端会计算背景噪声的参数,比如信号帧的能量参数以及线性预测编码(LPC)参数,并且将计算出的参数以非常低的码率传输至接收端。接收端利用接收到的参数尽可能地重构出接近于发送端背景噪声的舒适噪声。具体来说,接收端产生高斯随机噪声信号,通过生成的高斯随机噪声信号激励LPC滤波器,并根据接收自发送端的能量参数,合成舒适噪声信号,以消除切换造成的影响,从而使用户有更舒适的主观感受。
现有技术中比较常用的舒适噪声生成方法为自适应多速率宽带(AMR-WB)编码方法。该方法中发送端通过计算当前帧以及之前的7帧(以 下简称前8帧)的平均值,得到代表当前背景噪声的静音描述(SID)帧中的能量参数
Figure S071A4395X20070606D000021
和频谱参数fmean,接收端根据接收到的和fmean生成舒适噪声。具体实现过程包括:
发送端参数计算:
(1)计算能量参数
Figure S071A4395X20070606D000023
发送端首先计算每一帧的能量enlog(i),计算方式如公式(1)所示:
en log ( i ) = 1 2 log 2 ( 1 N Σ n = 0 N - 1 s 2 ( n ) ) - - - ( 1 )
其中,s(n)为经过高通滤波之后的语音帧信号;N为每一帧的采样点数,在AMR-WB中N的取值为256。
计算出前8帧的能量后,发送端进一步求取这8帧的能量平均值,即能量参数计算方式如公式(2)所示:
en log mean ( i ) = 1 8 Σ n = 0 7 en log ( i - n ) - - - ( 2 )
(2)计算频谱参数fmean
fmean的计算采用未量化的线性预测参数:
在AMR-WB中,LPC参数表示为倒谱频率(ISF)参数,每一帧的ISF参数的表示形式为一个矢量f7=[f1f2...f16]。
在求取前8帧的ISF参数的均值之前,首先需要进行剔除频谱差异较大帧的运算,具体计算过程为:根据每一帧的ISF参数计算前8帧相互之间的频谱差ΔRij,计算方式如公式(3)所示:
Δ R ij = Σ k = 1 16 ( f i ( k ) - f j ( k ) ) 2 , i = 0 , . . . , 7 , j = 0 , . . . , 7 , i ≠ j - - - ( 3 )
其中,fi(k)表示第i帧的ISF参数矢量的第k个值。
之后,计算第i帧与其它7帧的总频谱差ΔSi,计算方式如公式(4)所示:
Δ S i = Σ j = 0 , j ≠ i 7 Δ R ij , i = 0 , . . . , 7 , j = 0 , . . . , 7 - - - ( 4 )
通过公式(4)的计算得到8个总频谱差后,从中选出总频谱差取值最小的 一个,记为ΔSmed,以及取值最大和次大的两个,分别记为ΔSfir和ΔSsec。分别比较ΔSfir与ΔSmed以及ΔSsec与ΔSmed的商是否大于预先设置的参数THmed,即判断ΔSfir和ΔSsec是否满足公式(5)所示条件:
Δ S j Δ S med > TH med - - - ( 5 )
其中,ΔSj的取值为ΔSfir或ΔSsec;THmed=2.25。
如果ΔSfir或ΔSsec满足公式(5)所示条件,则用ΔSmed所对应的帧中的ISF参数替换ΔSfir或ΔSsec所对应的帧中的ISF参数;否则,保持ΔSfir或ΔSsec所对应的帧中的ISF参数不变。
最后,计算替换后的8个帧对应的ISF参数的平均值fmean(n),计算方式如公式(6)所示:
f mean ( n ) = 1 8 Σ i = 0 7 f ′ ( n - i ) , i = 0 , . . . , 7 - - - ( 6 )
fmean(n)即为最终计算得到的当前背景噪声的频谱参数,其中f′(n-i)(i=0,...,7)为替换后的前8帧的ISF参数。
发送端计算出代表当前背景噪声水平的能量参数
Figure S071A4395X20070606D000033
和频谱参数fmean后,通过SID帧将其发送至接收端。
接收端参数计算:
现有技术中,将语音暂停之后的7个连续帧,称为拖尾(Hangover)帧。在发送端,这7个连续帧仍将按照普通的语音帧处理方式进行编码传输,所以,接收端可以直接获取这7个连续帧的参数。这样,对于接收端来说,其第一个SID帧的参数即可根据接收到的Hangover中的连续7帧的参数直接求平均获得。具体计算过程为:
首先,计算第一个SID帧的能量参数
Figure S071A4395X20070606D000034
计算方式如公式(7)所示:
e ^ n log mean ( i ) = 1 8 Σ n = 0 7 e ^ n log ( i - n ) - - - ( 7 )
其中,
Figure S071A4395X20070606D000036
为对Hangover帧进行解码后得到的各帧能量值。
然后,计算第一个SID帧的频谱参数
Figure S071A4395X20070606D000041
计算方式如公式(8)所示:
f ^ mean ( n ) = 1 8 Σ i = 0 7 f ^ ( n - i ) , - - - ( 8 )
其中,
Figure S071A4395X20070606D000043
为量化以后的各帧的ISF参数,通过对Hanover帧进行解码得到。
由于Hanover帧只有7帧,所以在实际计算时,如公式(7)和(8)所示,需要补充一个第8帧,该第8帧参数的取值可以为第7帧的简单重复。
除去以上所提到的语音暂停后的第一个SID帧的参数是由接收端计算得出之外,之后接收端得到的SID帧的
Figure S071A4395X20070606D000044
和fmean参数均是由发送端计算并通过SID帧传输过来的。
图1为现有接收端舒适噪声生成过程示意图。如图1所示,接收端得到SID帧的和fmean参数以后,根据得到激励增益(gain),根据fmean得到ISF,然后对其进行内插,再转换为LPC参数;进而,接收端生成高斯随机噪声序列,并通过激励增益去调整高斯随机噪声序列和激励合成滤波器,最终产生舒适噪声。
应用上述方法,通过在接收端生成舒适噪声,解决了现有技术中当语音暂停的情况下,接收端用户主观感觉上语音质量下降的问题。但是,这种方法需要在发送端进行剔除频谱差异较大帧以及求ISF平均值的运算,接收端也需要进行ISF求平均的运算,这些运算都具有较大的运算量,因此造成算法复杂度过高。
发明内容
有鉴于此,本发明实施例的主要目的在于提供一种舒适噪声参数产生方法,能够简单方便地生成舒适噪声参数。
本发明实施例的另一个目的在于提供一种舒适噪声参数产生装置,应用该装置能够简单方便地生成舒适噪声参数。
一种舒适噪声参数产生方法,该方法包括以下步骤:
发送端计算当前一组连续帧中各帧的能量特征值以及频谱特征值;其中,所述各帧的能量特征值为各帧的能量值enlog(i);所述各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差ΔSi
发送端从所述计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;
发送端从所述计算出的各帧频谱特征值中选择出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
一种舒适噪声参数产生装置,所述装置包括:计算模块、能量参数生成模块以及频谱参数生成模块;
所述计算模块,用于计算当前一组连续帧中各帧的能量特征值以及频谱特征值,并将计算出的各帧的能量特征值以及频谱特征值分别输出至所述能量参数生成模块以及频谱参数生成模块;其中,所述各帧的能量特征值为各帧的能量值enlog(i);所述各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差ΔSi
所述能量参数生成模块,用于接收来自所述计算模块的各帧的能量特征值,并从所述各帧的能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;
所述频谱参数生成模块,用于接收来自所述计算模块的各帧的频谱特征值,并从所述各帧的频谱特征值中选择出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
可见,采用本发明实施例的技术方案,在计算出一组连续帧的能量特征值以及频谱特征值以后,根据计算结果,从中选择出最能代表当前背景噪声水平的能量特征值以及频谱特征值对应的帧的能量以及倒谱频率参数作为生成当前舒适噪声的参数。与现有技术中的舒适噪声参数生成方法相比,本发明实施例所述方法无需进行剔除频谱差异较大帧以及求倒谱频率参数均值的运算,从而降低了算法复杂度,只需较少运算,即可简单方便地生成所需舒适噪声参数。
附图说明
图1为现有接收端舒适噪声生成过程示意图。
图2为本发明方法实施例的总体流程图。
图3为本发明方法较佳实施例的流程图。
图4为本发明装置实施例的组成结构示意图。
图5为将图4所示装置作为发送端应用到实际移动通信系统后的系统结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明作进一步地详细说明。
本发明实施方式中,计算当前一组连续帧中各帧的能量特征值以及频谱特征值;从计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;从计算出的各帧频谱特征值中选择出一个频谱特征值,将选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
图2为本发明方法实施例的总体流程图。本发明方法实施例应用于移动通信系统中的语音通信发生暂停的情况下。如图2所示,该方法包括以下步骤:
步骤201:计算当前一组连续帧中各帧的能量特征值以及频谱特征值。
本步骤中,各帧的能量特征值是指各帧的能量值enlog(i),计算方式如公式(9)所示:
en log ( i ) = 1 2 log 2 ( 1 N Σ n = 0 N - 1 s 2 ( n ) ) - - - ( 9 )
其中,s(n)为经过高通滤波后的语音帧信号,N为每一帧的采样点数目。
各帧的频谱特征值是指各帧与除自身以外的其它帧的总频谱差ΔSi,计算方式为:
首先,计算各帧相互之间的频谱差ΔRij,计算方式如公式(10)所示:
Δ R ij = Σ k = 1 16 ( f i ( k ) - f j ( k ) ) 2 , i ≠ j - - - ( 10 )
然后,计算总频谱差ΔSi,计算方式如公式(11)所示:
Δ S i = Σ j = 0 , j ≠ i N Δ R ij - - - ( 11 )
其中,公式(10)和(11)中,i,j的取值范围为从零到N;N的取值为当前一组连续帧中所包括的帧的个数减一;fi(k)为第i帧的ISF参数矢量的第k个值。
步骤202:从计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;从计算出的各帧频谱特征值中选择出一个频谱特征值,将选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
本步骤中,对计算出的各帧的enlog(i)按照大小顺序进行排序,并选择排序后处于中间位置的enlog(i)作为当前舒适噪声的能量参数。
从计算得到的各帧的总频谱差ΔSi中选出取值最小的ΔSi,并选择取值最小的ΔSi对应的帧的ISF参数作为当前舒适噪声的频谱参数。
上述步骤201和202均是由发送端完成的。在得到所需的能量参数以及频谱参数以后,发送端向接收端发送携带有能量参数以及频谱参数的SID帧。接收端接收该SID帧,并根据其中的能量参数和频谱参数生成舒适噪声。
需要说明的是,在实际应用中,语音暂停之后的7个连续帧被称为Hangover,对于这7个连续帧,发送端仍然会按照语音帧的方式进行编码和传输,这种情况下,接收端可以直接获得这7帧的参数。由于Hangover作为语音信号的语尾,一般情况下越是往后的帧会越接近纯背景噪声,所以,本发明实施例中,接收端接收并选取七个连续帧中最后一帧的能量特征值和倒谱频率参数作为当前舒适噪声的能量参数和频谱参数,并根据所述能量参数和频谱参数生成舒适噪声。
图3为本发明方法较佳实施例的流程图。本实施例中,将每8个连续帧(当前帧以及之前7帧,以下简称前8帧)看成一组连续语音帧,即针对每8帧计算一次舒适噪声参数。如图3所示,包括以下步骤:
步骤301:发送端按照普通的语音帧处理方式对语音暂停之后的7个连续帧进行编码并传输至接收端。
步骤302:接收端选取最后一帧的能量和ISF参数作为生成舒适噪声的能量参数和频谱参数。
由于Hangover作为语音信号的语尾,一般情况下越往后的帧越接近纯背景噪声,所以,本步骤中,接收端直接选取接收到的7个连续帧中的最后一帧的能量和ISF参数作为生成舒适噪声的能量参数和频谱参数。
步骤303:接收端生成舒适噪声。
本步骤中,接收端根据步骤302中获取到的能量参数和频谱参数生成舒适噪声,生成方式与现有技术相同。
步骤304:发送端生成能量参数。
本步骤中,发送端计算前8帧中每一帧的能量值enlog(i),计算方式如公式(9)所示。然后,对计算出的每一帧的enlog(i)(i=0,......7)按照升序顺序进行排序,假设排序后的各帧能量值为
Figure S071A4395X20070606D000081
(j=0,...,7),则选取处于中间位置的
Figure S071A4395X20070606D000082
作为生成舒适噪声的能量参数
Figure S071A4395X20070606D000083
本实施例中,假设选取排序后位于第四个位置上的
Figure S071A4395X20070606D000084
作为
Figure S071A4395X20070606D000085
则有:  en log back = en log ′ ( 3 ) .
步骤305:发送端生成频谱参数。
本步骤中,发送端首先计算前8帧相互之间的频谱差ΔRij,计算方式如公式(12)所示:
Δ R ij = Σ k = 1 16 ( f i ( k ) - f j ( k ) ) 2 , i = 0 , . . . , 7 , j = 0 , . . . , 7 , i ≠ j - - - ( 12 )
其中fi(k)是第i帧的ISF参数矢量的第k个值。
然后,计算第i帧与其它7帧的总频谱差ΔSi,计算公式如公式(13)所示:
Δ S i = Σ j = 0 , j ≠ i 7 Δ R ij , i = 0 , . . . , 7 , j = 0 , . . . , 7 - - - ( 13 )
计算出各帧的ΔSi后,发送端从中选出取值最小的一个ΔSi,记为ΔSmin,并用ΔSmin对应的帧的ISF参数f(i)作为当前生成舒适噪声的频谱参数fback,即fback=f(i)。
步骤306:发送端向接收端发送SID帧。
SID帧中携带有生成的反映背景噪声水平的能量参数
Figure S071A4395X20070606D000091
以及频谱参数fback
步骤307:接收端生成舒适噪声。
本步骤中,接收端生成舒适噪声的方式与现有技术相同,此处不再赘述。
后续过程,发送端和接收端之间不断重复步骤304~307。
基于上述方法,图4为本发明装置实施例的组成结构示意图。如图4所示,该装置包括:计算模块401、能量参数生成模块402以及频谱参数生成模块403:
计算模块401,用于计算当前一组连续帧中各帧的能量特征值以及频谱特征值,并将计算出的各帧的能量特征值以及频谱特征值分别输出至能量参数生成模块402以及频谱参数生成模块403;计算模块401还可进一步划分为能量参数计算模块以及频谱参数计算模块;
能量参数生成模块402,用于接收来自计算模块401的各帧的能量特征值,并从各帧的能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;
频谱参数生成模块403,用于接收来自计算模块401的各帧的频谱特征值,并从各帧的频谱特征值中选择出一个频谱特征值,将选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
其中,各帧的能量特征值为各帧的能量值enlog(i);能量参数生成模块402具体包括:排序模块4021以及选择模块4022:
排序模块4021,用于接收来自计算模块401的各帧的enlog(i),将各帧的enlog(i)按照大小顺序进行排序后发送至选择模块4022;
选择模块4022,用于从接收自排序模块4021的排序后的enlog(i)中选择出处于中间位置的enlog(i),作为当前舒适噪声的能量参数输出。
各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差ΔSi;频谱参数生成模块403具体用于,接收来自计算模块401的各帧的ΔSi,选取各帧的ΔSi中取值最小的ΔSi对应的帧的ISF参数作为当前舒适噪声的频谱参数输出。
将图4所示装置作为发送端应用到实际移动通信系统中,可得到如图5所示的系统结构示意图。如图5所示,为便于描述,本实施例中将发送端中的计算模块进一步划分为频谱参数计算模块以及能量参数计算模块。
发送端将生成的能量参数以及频谱参数fback量化以后通过SID帧发送至接收端;接收端接收到SID帧以后,从中得到相应的参数并将其分别存放到能量参数接收模块以及频谱参数接收模块,然后根据该能量参数以及频谱参数生成舒适噪声。其中,舒适噪声的生成为现有技术,此处不再赘述。
可见,采用本发明实施例的技术方案,在计算出一组连续帧的能量特征值以及频谱特征值以后,根据计算结果,从中选择出最能代表当前背景噪声水平的能量特征值以及频谱特征值对应的帧的能量以及ISF参数作为生成当前舒适噪声的参数。相比于现有技术中的舒适噪声参数生成方法,本发明实施例方法无需进行剔除频谱差异较大帧以及求ISF参数平均值的运算,从而降低了算法复杂度,只需较少运算,即可简单方便地生成所需舒适噪声参数。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种舒适噪声参数产生方法,其特征在于,该方法包括以下步骤:
发送端计算当前一组连续帧中各帧的能量特征值以及频谱特征值;其中,所述各帧的能量特征值为各帧的能量值enlog(i);所述各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差ΔSi
发送端从所述计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;
发送端从所述计算出的各帧频谱特征值中选择出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
2.根据权利要求1所述的方法,其特征在于,所述enlog(i)的计算方法为: en log ( i ) = 1 2 log 2 ( 1 N Σ n = 0 N - 1 s 2 ( n ) ) ;
其中,s(n)为经过高通滤波的语音帧信号,N为每一帧的采样点数目。
3.根据权利要求2所述的方法,其特征在于,所述从计算出的各帧能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数的方法为:
对所述计算出的各帧的能量值按照大小顺序进行排序;
选取所述排序后处于中间位置的能量值作为所述当前舒适噪声的能量参数。
4.根据权利要求1所述的方法,其特征在于,所述ΔSi的计算方法为:
首先,计算各帧相互之间的频谱差ΔRij Δ R ij = Σ k = 1 16 ( f i ( k ) - f j ( k ) ) 2 , i ≠ j ;
然后,计算所述总频谱差ΔSi Δ S i = Σ j = 0 , j ≠ i N Δ R ij ;
其中,i,j的取值范围为从零到N;所述N的取值为当前一组连续帧中所包括的帧的个数减一;fi(k)为第i帧的倒谱频率参数矢量的第k个值。
5.根据权利要求4所述的方法,其特征在于,所述从计算出的各帧频谱特征值中选取出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数的方法为:
从所述计算得到的各帧的总频谱差ΔSi中选出取值最小的ΔSi
选择所述取值最小的ΔSi对应的帧的倒谱频率参数作为当前舒适噪声的频谱参数。
6.根据权利要求1所述的方法,其特征在于,该方法进一步包括:
发送端将所述能量参数以及频谱参数输出至接收端;
所述接收端接收所述能量参数以及频谱参数;根据所述能量参数和频谱参数生成舒适噪声。
7.根据权利要求1所述的方法,其特征在于,该方法之前进一步包括:
发送端将语音暂停之后的七个连续帧按照语音帧进行编码并输出;
接收端接收并选取所述七个连续帧中最后一帧的能量特征值和倒谱频率参数作为当前舒适噪声的能量参数和频谱参数;
接收端根据所述能量参数和频谱参数生成舒适噪声。
8.根据权利要求1~7中任一项所述的方法,其特征在于,所述当前一组连续帧中共包括八帧。
9.一种舒适噪声参数产生装置,其特征在于,所述装置包括:计算模块、能量参数生成模块以及频谱参数生成模块;
所述计算模块,用于计算当前一组连续帧中各帧的能量特征值以及频谱特征值,并将计算出的各帧的能量特征值以及频谱特征值分别输出至所述能量参数生成模块以及频谱参数生成模块;其中,所述各帧的能量特征值为各帧的能量值enlog(i);所述各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差ΔSi
所述能量参数生成模块,用于接收来自所述计算模块的各帧的能量特征值,并从所述各帧的能量特征值中选择出一个能量特征值,作为当前舒适噪声的能量参数输出;
所述频谱参数生成模块,用于接收来自所述计算模块的各帧的频谱特征值,并从所述各帧的频谱特征值中选择出一个频谱特征值,将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
10.根据权利要求9所述的装置,其特征在于,所述能量参数生成模块具体包括:排序模块以及选择模块;
所述排序模块,用于接收来自所述计算模块的各帧的enlog(i),将所述各帧的enlog(i)按照大小顺序进行排序后发送至所述选择模块;
所述选择模块,用于从接收自所述排序模块的排序后的enlog(i)中选择出处于中间位置的enlog(i),作为所述当前舒适噪声的能量参数输出。
11.根据权利要求9或10所述的装置,其特征在于,
所述频谱参数生成模块具体用于,接收来自所述计算模块的各帧的ΔSi,选取所述各帧的ΔSi中取值最小的ΔSi对应的帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。
CN 200710104395 2007-05-11 2007-05-11 一种舒适噪声参数产生方法和装置 Active CN101303855B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 200710104395 CN101303855B (zh) 2007-05-11 2007-05-11 一种舒适噪声参数产生方法和装置
PCT/CN2008/070925 WO2008138263A1 (fr) 2007-05-11 2008-05-09 Procédé et dispositif de génération de paramètres de bruit de confort

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710104395 CN101303855B (zh) 2007-05-11 2007-05-11 一种舒适噪声参数产生方法和装置

Publications (2)

Publication Number Publication Date
CN101303855A CN101303855A (zh) 2008-11-12
CN101303855B true CN101303855B (zh) 2011-06-22

Family

ID=40001703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710104395 Active CN101303855B (zh) 2007-05-11 2007-05-11 一种舒适噪声参数产生方法和装置

Country Status (2)

Country Link
CN (1) CN101303855B (zh)
WO (1) WO2008138263A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103137133A (zh) * 2011-11-29 2013-06-05 中兴通讯股份有限公司 非激活音信号参数估计方法及舒适噪声产生方法及系统

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201241A (zh) * 2011-04-11 2011-09-28 深圳市华新微声学技术有限公司 语音信号处理方法及装置
CN103093756B (zh) * 2011-11-01 2015-08-12 联芯科技有限公司 舒适噪声生成方法及舒适噪声生成器
KR101877906B1 (ko) * 2013-01-29 2018-07-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 노이즈 채움 개념
CN106169297B (zh) 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
CN104978970B (zh) 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统
CN109841222B (zh) * 2017-11-29 2022-07-01 腾讯科技(深圳)有限公司 音频通信方法、通信设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1155801A (zh) * 1995-10-13 1997-07-30 法国电信公司 在语音数字传输系统中产生悦耳噪声的方法与装置
CN1367918A (zh) * 1999-06-07 2002-09-04 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
CN1513168A (zh) * 2000-11-27 2004-07-14 ��˹��ŵ�� 话音通信中产生舒适噪声的方法和系统
CN1801327A (zh) * 2004-12-29 2006-07-12 西门子公司 舒适噪声产生参数的匹配方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1155801A (zh) * 1995-10-13 1997-07-30 法国电信公司 在语音数字传输系统中产生悦耳噪声的方法与装置
CN1367918A (zh) * 1999-06-07 2002-09-04 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
CN1513168A (zh) * 2000-11-27 2004-07-14 ��˹��ŵ�� 话音通信中产生舒适噪声的方法和系统
CN1801327A (zh) * 2004-12-29 2006-07-12 西门子公司 舒适噪声产生参数的匹配方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103137133A (zh) * 2011-11-29 2013-06-05 中兴通讯股份有限公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
CN103137133B (zh) * 2011-11-29 2017-06-06 南京中兴软件有限责任公司 非激活音信号参数估计方法及舒适噪声产生方法及系统

Also Published As

Publication number Publication date
WO2008138263A1 (fr) 2008-11-20
CN101303855A (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
CN101303855B (zh) 一种舒适噪声参数产生方法和装置
CN1969319B (zh) 在通信系统中对帧进行编码的方法和编码器
CN102341852B (zh) 滤波语音信号的方法和滤波器
CN1926610B (zh) 合成单声道音频信号的方法、音频解码器和编码系统
US9251800B2 (en) Generation of a high band extension of a bandwidth extended audio signal
CN1922660B (zh) 通信装置和通信方法
CN103325375B (zh) 一种极低码率语音编解码设备及编解码方法
US10134406B2 (en) Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system
CN1815558B (zh) 语音中非话音部分的低数据位速率编码
CN101320563B (zh) 一种背景噪声编码/解码装置、方法和通信设备
CN103187065B (zh) 音频数据的处理方法、装置和系统
CN101751926A (zh) 信号编码、解码方法及装置、编解码系统
JPH11126098A (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
CN101548315A (zh) 用于立体声编码的方法、装置和计算机程序产品
CN101377925B (zh) 提高g.711的感知质量的自适应调整方法
CN1312463C (zh) 一种产生lsf矢量的方法和装置
CN103680509A (zh) 一种语音信号非连续传输及背景噪声生成方法
CN112614495A (zh) 一种软件无线电多制式语音编解码器
CN116052700B (zh) 声音编解码方法以及相关装置、系统
CN102760441B (zh) 一种背景噪声编码/解码装置、方法和通信设备
CN101266798B (zh) 一种在语音解码器中进行增益平滑的方法及装置
CN1873777B (zh) 具有语音解码功能的移动通信终端及其动作方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
Taniguchi et al. Multimode coding: A novel approach to narrow‐and medium‐band coding
RU2394284C1 (ru) Способ сжатия и восстановления речевых сигналов для систем кодирования с переменной скоростью передачи

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant