WO2008138263A1 - Procédé et dispositif de génération de paramètres de bruit de confort - Google Patents

Procédé et dispositif de génération de paramètres de bruit de confort Download PDF

Info

Publication number
WO2008138263A1
WO2008138263A1 PCT/CN2008/070925 CN2008070925W WO2008138263A1 WO 2008138263 A1 WO2008138263 A1 WO 2008138263A1 CN 2008070925 W CN2008070925 W CN 2008070925W WO 2008138263 A1 WO2008138263 A1 WO 2008138263A1
Authority
WO
WIPO (PCT)
Prior art keywords
frame
parameter
energy
comfort noise
spectral
Prior art date
Application number
PCT/CN2008/070925
Other languages
English (en)
French (fr)
Inventor
Wei Li
Xiaogang Sun
Li Liu
Junbin Cao
Qing Zhang
Lijing Xu
Jianfeng Xu
Zhengzhong Du
Chen Hu
Lei Miao
Yi Yang
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of WO2008138263A1 publication Critical patent/WO2008138263A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Definitions

  • the present invention relates to audio processing techniques, and more particularly to a method and apparatus for generating comfort noise parameters. Background technique
  • DTX Discontinuous Transmission Mode
  • the sender mobile terminal hereinafter referred to as the sender
  • the receiver mobile terminal hereinafter referred to as the receiver
  • the parameters contained in the data produce comfort noise. This method is beneficial to save power and bandwidth of mobile terminals and base stations, and to reduce the bit rate of transmission data and reduce collisions, thereby ensuring communication quality of mobile communication.
  • the sender calculates the parameters of the background noise, such as the energy parameters of the signal frame and the LPC (Linear Prediction Coding) parameter, and the calculated parameters are Very low bit rate is transmitted to the receiving end.
  • the receiving end reconstructs the comfort noise close to the background noise of the transmitting end as much as possible using the received parameters.
  • the receiving end generates a Gaussian random noise signal, excites the LPC filter by the generated Gaussian random noise signal, and synthesizes the comfort noise signal according to the energy parameter received from the transmitting end, so as to eliminate the influence caused by the switching, thereby making the user more cozy
  • a commonly used comfort noise generating method in the prior art is an adaptive multi-rate wideband encoding method.
  • the transmitting end obtains the energy parameter e « in the SID (Silent Descriptor) frame representing the current background noise by calculating the average value of the current frame and the previous 7 frames (hereinafter referred to as the first 8 frames).
  • the spectral parameter f msan the receiving end generates comfort noise based on the received e g a " and f mean .
  • the main object of embodiments of the present invention is to provide a comfort noise parameter generating method, so that comfort noise parameters can be generated simply and conveniently.
  • Another object of embodiments of the present invention is to provide a comfort noise parameter generating device that can be used to easily and comfortably generate comfort noise parameters.
  • a method for generating a comfort noise parameter comprising the steps of:
  • a comfort noise parameter generating device comprising: an acquiring module, configured to acquire energy feature values and spectral feature values of each frame in a group of consecutive frames including a current frame, And outputting the obtained energy feature value and the spectral feature value of each frame to the energy parameter generating module and the spectrum parameter generating module respectively;
  • An energy parameter generating module configured to receive energy characteristic values of each frame from the acquiring module, and select an energy feature value from the energy feature values of each frame as an energy parameter of current comfort noise;
  • a spectrum parameter generating module configured to receive a spectral feature value of each frame from the acquiring module, and select one spectral feature value from the spectral feature values of each frame, and select the selected spectral feature value corresponding to the frame
  • the cepstrum frequency parameter is used as the spectral parameter of the current comfort noise.
  • a method for generating a comfort noise parameter includes the following steps:
  • a comfort noise parameter generating device the device comprising:
  • An energy parameter obtaining module configured to receive an SID frame output by the transmitting end, obtain an energy parameter of each frame in a consecutive frame corresponding to the SID frame, and select an energy parameter of a last frame of the continuous frame as current comfort Energy parameter of noise;
  • a spectrum parameter receiving module configured to receive a SID frame output by the transmitting end, obtain a frequency parameter of each frame in a consecutive frame corresponding to the SID frame, and select a spectrum parameter of a last frame of the continuous frame as a current Spectral parameters of comfort noise;
  • a comfort noise generating module is configured to generate comfort noise according to the energy parameter and the spectrum parameter of the current comfort noise.
  • a comfort noise parameter generating system includes: a transmitting end and a receiving end; and the transmitting end is configured to generate energy parameters and spectrum parameters of current comfort noise, and Sending the generated energy parameter and the spectrum parameter generating SID frame to the receiving end;
  • the receiving end is configured to receive, by the receiving end, a SID frame, obtain an energy parameter and a spectrum parameter of the current comfort noise, and generate comfort noise according to the energy parameter and the spectrum parameter.
  • the energy feature value and the spectral feature value that best represent the current background noise level are selected from the technical solution of the embodiment of the present invention.
  • the energy of the corresponding frame and the cepstral frequency parameter are used as parameters for generating the current comfort noise.
  • the method in the embodiment of the present invention does not need to perform the operation of eliminating the spectrum difference large frame and the cepstrum frequency parameter mean value, thereby realizing the simple and convenient generation of the required comfort noise parameter. .
  • FIG. 1 is a schematic diagram of a process of generating comfort noise at a receiving end
  • FIG. 3 is a flow chart of a preferred embodiment of the method of the present invention.
  • FIG. 4 is a schematic structural diagram of a transmitting end of an apparatus embodiment of the present invention.
  • FIG. 5 is a schematic structural diagram of a receiving end of an apparatus embodiment of the present invention.
  • FIG. 6 is a schematic structural diagram of a comfort noise generating system in an embodiment of the system of the present invention. detailed description
  • an energy feature value and a spectral feature value of each frame in a group of consecutive frames including a current frame are obtained; and an energy feature value is selected from the acquired energy feature values of each frame as energy of current comfort noise.
  • spectrum of each frame obtained from the above A frequency feature value is selected in the eigenvalue, and the selected spectral feature value corresponds to the cepstrum frequency parameter of the frame as the spectrum parameter of the current comfort noise.
  • FIG. 2 is a general flow chart of an embodiment of a method of the present invention.
  • the method embodiment of the present invention is applied in the case where the voice communication in the mobile communication system is suspended. As shown in Figure 2, the method includes the following steps:
  • Step S201 Calculate an energy feature value and a spectrum feature value of each frame in the current group of consecutive frames.
  • is the number of samples per frame.
  • the spectrum feature value of each frame refers to the total spectrum difference AS of each frame and other frames except itself, and is calculated as:
  • Step S202 Select an energy feature value from the calculated energy feature values of each frame as the energy parameter output of the current comfort noise; select a spectral feature value from the calculated spectral feature values of each frame, and select the selected one.
  • the spectral characteristic value corresponds to the cepstrum frequency parameter of the frame as the spectral parameter of the current comfort noise.
  • the calculated frames are sorted in order of magnitude, and the energy parameters of the current comfort noise in the middle position after sorting are selected.
  • the above steps S201 and S202 are all completed by the transmitting end.
  • the transmitting end After obtaining the required energy parameters and the spectral parameters, the transmitting end sends a SID frame carrying the energy parameter and the spectrum parameter to the receiving end.
  • the receiving end receives the SID frame and generates comfort noise according to the energy parameter and the spectral parameter therein.
  • the receiver The terminal can directly obtain the parameters of these 7 frames.
  • the receiving end receives and selects the energy feature value of the last frame of the seven consecutive frames, and the more the background frame is, the closer the background is to the pure background noise.
  • the cepstrum frequency parameter is used as an energy parameter and a spectral parameter of the current comfort noise, and generates comfort noise according to the energy parameter and the spectral parameter.
  • every 8 consecutive frames (the current frame and the previous 7 frames, hereinafter referred to as the first 8 frames) are regarded as a set of continuous speech frames, that is, a comfort noise parameter is calculated for every 8 frames.
  • a comfort noise parameter is calculated for every 8 frames.
  • Step S301 After the voice is paused according to the normal voice frame processing manner, the sender The 7 consecutive frames are encoded and transmitted to the receiving end.
  • Step S302 The receiving end selects the energy and ISF parameters of the last frame as energy parameters and spectrum parameters for generating comfortable noise.
  • the receiving end directly selects the energy parameter and the ISF parameter of the last frame of the received 7 consecutive frames. As an energy parameter and a spectral parameter for generating comfort noise.
  • Step S303 The receiving end generates comfort noise.
  • the receiving end generates comfort noise according to the energy parameter and the spectrum parameter acquired in step S302, and the generating manner is the same as the prior art.
  • Step S304 The transmitting end generates an energy parameter.
  • Step S305 The transmitting end generates a spectrum parameter.
  • the transmitting end first calculates the spectral difference between the first 8 frames.
  • the calculation method is shown in the formula (12):
  • the sender After calculating the M,. of each frame, the sender selects the AS, which is the smallest value, and records it as m n , and uses the ISF parameter /( ) of the frame corresponding to M mn as the spectrum parameter of the currently generated comfort noise.
  • ie f back f(i).
  • Step S306 The sender sends a SID frame to the receiver.
  • the SID frame carries the generated energy parameter ⁇ ck reflecting the background noise level and the spectral parameter f hack .
  • Step S307 The receiving end generates comfort noise.
  • steps S304 ⁇ S307 are repeated between the transmitting end and the receiving end.
  • FIG. 4 it is a schematic structural diagram of a transmitting end of an apparatus embodiment of the present invention.
  • the apparatus includes: an obtaining module 401, an energy parameter generating module 402, and a spectrum parameter generating module 403, wherein:
  • the obtaining module 401 is configured to obtain an energy feature value and a spectral feature value of each frame in a group of consecutive frames including the current frame, and output the acquired energy feature value and the spectral feature value of each frame to the energy parameter generating module 402, respectively.
  • the spectrum parameter generating module 403; the obtaining module 401 is further divided into an energy parameter acquiring module and a spectrum parameter acquiring module;
  • the energy parameter generating module 402 is configured to receive energy feature values of each frame from the acquiring module 401, and select one energy feature value from the energy feature values of each frame as the energy parameter of the current comfort noise;
  • the spectrum parameter generating module 403 is configured to receive spectral feature values of each frame from the obtaining module 401, and select one spectral feature value from the spectral feature values of each frame, and select the selected spectral feature value corresponding to the cepstrum frequency parameter of the frame. As a spectral parameter of current comfort noise.
  • the energy feature value of each frame is an energy value e g of each frame (0; the energy parameter generating module 402 specifically includes: a sorting module 4021 and a selecting module 4022:
  • the sorting module 4021 is configured to receive £ ( ) of each frame from the obtaining module 401, sort the frames in order of size, and send them to the selecting module 4022;
  • the selecting module 4022 is configured to select e (0) in the intermediate position from the sorted e g ( ) received from the sorting module 4021 as the energy parameter of the current comfort noise.
  • the spectrum characteristic value of each frame is the total spectrum difference AS of each frame and other frames except itself.
  • the spectrum parameter generating module 403 is configured to receive the frames from the frames of the obtaining module 401, and select the frames of each frame. The minimum value of ⁇ ,.
  • the ISF parameter of the corresponding frame is used as the spectral parameter of the current comfort noise.
  • FIG. 5 it is a schematic structural diagram of a receiving end of an apparatus embodiment of the present invention.
  • the apparatus includes: a spectral parameter receiving module 501, an energy parameter acquiring module 502, and a comfort noise generating module 503, wherein:
  • the spectrum parameter receiving module 501 is configured to receive a SID frame output by the sending end, obtain a spectrum parameter of each frame in a consecutive frame corresponding to the SID frame, and select a spectrum parameter of a last frame of the continuous frame as a current Spectral parameters for comfort noise.
  • the energy parameter obtaining module 502 is configured to receive a SID frame outputted by the sending end, obtain an energy parameter of each frame in a consecutive frame corresponding to the SID frame, and select an energy parameter of a last frame of the continuous frame as a current Energy parameters for comfort noise.
  • the comfort noise generating module 503 is configured to generate comfort noise according to the energy parameter and the spectrum parameter of the current comfort noise.
  • the system includes: a transmitting end 601 and a receiving end 602. among them:
  • a transmitting end 601 configured to generate energy parameters and spectral parameters of current comfort noise, and The generated energy parameter and the spectrum parameter generating SID frame are sent to the receiving end 602.
  • the receiving end 602 is configured to receive, by the receiving end 601, a SID frame, obtain an energy parameter and a spectrum parameter of the current comfort noise, and generate comfort noise according to the energy parameter and the spectrum parameter.
  • the energy feature value that best represents the current background noise level and the spectral feature value are selected.
  • the energy of the frame and the ISF parameters are used as parameters to generate the current comfort noise.
  • the method of the embodiment of the present invention does not need to perform the operation of eliminating the spectrum difference large frame and calculating the ISF parameter average value, thereby realizing the simple and convenient generation of the required comfort noise parameter.
  • modules in the apparatus of the embodiments may be distributed in the apparatus of the embodiments as described in the embodiments, or the corresponding changes may be in one or more apparatus different from the embodiment.
  • the modules of the above embodiments may be combined into one module, or may be further split into a plurality of sub-modules.
  • the present invention can be implemented by hardware, or can be implemented by means of software plus necessary general hardware platform, and the technical solution of the present invention. It can be embodied in the form of a software product that can be stored in a non-volatile storage medium (which can be a CD-ROM, a USB flash drive, a mobile hard disk, etc.), including a number of instructions for making a computer device (may It is a personal computer, a server, or a network device, etc.) that performs the methods described in various embodiments of the present invention.
  • a non-volatile storage medium which can be a CD-ROM, a USB flash drive, a mobile hard disk, etc.
  • a computer device may It is a personal computer, a server, or a network device, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

一种舒适噪声参数产生方法和装置 技术领域
本发明涉及音频处理技术,特别涉及一种舒适噪声参数产生方法 和装置。 背景技术
在当前的移动通信系统中, 通常釆用 DTX ( Discontinuous Transmission, 不连续传输模式)对语音信息进行传输。 所谓 DTX, 是指在语音暂停的情况下, 发送方移动终端(以下简称发送端)只发 送相对于正常情况下极少的数据量, 而接收方移动终端(以下简称接 收端)根据接收到的数据中所包含的参数产生舒适噪声。 这种方式有 利于节省移动终端和基站的电能以及带宽,并降低传输数据的比特率 和减少冲突, 从而保证移动通信的通信质量。
在 DTX传输模式中, 当语音暂停时, 伴随语音信息一起传输的 背景噪声也会随之消失, 造成背景噪声的不连续性。 如果这种切换快 速发生, 尤其是当发生在车用环境中或是背景噪声水平比较高的时 候, 会给接收端用户造成主观感觉上语音质量的严重下降。 为避免这 种情况的发生,在语音暂停的情况下,发送端会计算背景噪声的参数, 比如信号帧的能量参数以及 LPC ( Linear Prediction Coding, 线性预 测编码)参数, 并且将计算出的参数以非常低的码率传输至接收端。 接收端利用接收到的参数尽可能地重构出接近于发送端背景噪声的 舒适噪声。 具体来说, 接收端产生高斯随机噪声信号, 通过生成的高 斯随机噪声信号激励 LPC滤波器, 并根据接收自发送端的能量参数, 合成舒适噪声信号, 以消除切换造成的影响, 从而使用户有更舒适的 现有技术中比较常用的舒适噪声生成方法为自适应多速率宽带 编码方法。 该方法中发送端通过计算当前帧以及之前的 7帧(以下简 称前 8 帧) 的平均值, 得到代表当前背景噪声的 SID ( Silence Descriptor, 静音描述)帧中的能量参数 e« 。"和频谱参数 fmsan ,接收端 根据接收到的 e g a"和 f mean生成舒适噪声。
现有技术通过在接收端生成舒适噪声,解决了当语音暂停的情况 下, 接收端用户主观感觉上语音质量下降的问题。 但是, 这种方法技 术难度大, 实现较为复杂。 发明内容
有鉴于此,本发明实施例的主要目的在于提供一种舒适噪声参数 产生方法, 以便于能够简单方便地生成舒适噪声参数。
本发明实施例的另一个目的在于提供一种舒适噪声参数产生装 置, 应用该装置能够简单方便地生成舒适噪声参数。
一种舒适噪声参数产生方法, 该方法包括以下步骤:
获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特 征值;
从所述获取的各帧能量特征值中选择一个能量特征值,作为当前 舒适噪声的能量参数;
从所述获取的各帧频谱特征值中选择一个频谱特征值,将所述选 择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱 参数。
一种舒适噪声参数产生装置, 所述装置, 包括: 获取模块, 用于 获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特征值 , 并将获取到的各帧的能量特征值以及频谱特征值分别输出至所述能 量参数生成模块以及频谱参数生成模块;
能量参数生成模块,用于接收来自所述获取模块的各帧的能量特 征值, 并从所述各帧的能量特征值中选择一个能量特征值, 作为当前 舒适噪声的能量参数;
频谱参数生成模块,用于接收来自所述获取模块的各帧的频谱特 征值, 并从所述各帧的频谱特征值中选择一个频谱特征值, 将所述选 择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱 参数。
一种舒适噪声参数产生方法, 包括以下步骤:
接收发送端将语音暂停之后的一组连续帧按照语音帧编码输出 的静音描述 SID帧;
根据所述 SID帧获取当前舒适噪声的能量参数和频谱参数; 根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。 一种舒适噪声参数产生装置, 所述装置, 包括:
能量参数获取模块, 用于接收发送端输出的 SID 帧, 获取所述 SID帧对应的一组连续帧中各帧的能量参数, 并选取所述一组连续帧 最后一帧的能量参数作为当前舒适噪声的能量参数;
频谱参数接收模块, 用于接收发送端输出的 SID 帧, 获取所述 SID帧对应的一组连续帧中各帧的频语参数, 并选取所述一组连续帧 最后一帧的频谱参数作为当前舒适噪声的频谱参数;
舒适噪声生成模块,用于根据所述当前舒适噪声的能量参数和频 谱参数生成舒适噪声。
一种舒适噪声参数产生系统, 包括: 发送端和接收端; 所述发送端, 用于生成当前舒适噪声的能量参数和频谱参数, 并 将生成的能量参数和频谱参数生成 SID帧发送给接收端;
所述接收端,用于接收接收端发送 SID帧,获取当前舒适噪声的 能量参数和频谱参数, 根据所述能量参数以及频谱参数生成舒适噪 声。
可见, 釆用本发明实施例的技术方案, 在获取包括当前帧的一组 连续帧的能量特征值以及频谱特征值以后,从中选择出最能代表当前 背景噪声水平的能量特征值以及频谱特征值对应的帧的能量以及倒 谱频率参数作为生成当前舒适噪声的参数。与现有技术中的舒适噪声 参数生成方法相比,本发明实施例所述方法无需进行剔除频谱差异较 大帧以及求倒谱频率参数均值的运算,从而实现简单方便地生成所需 舒适噪声参数。 附图说明
图 1为现有接收端舒适噪声生成过程示意图;
图 2为本发明方法实施例的总体流程图;
图 3为本发明方法较佳实施例的流程图;
图 4为本发明装置实施例发送端的组成结构示意图;
图 5为本发明装置实施例接收端的组成结构示意图;
图 6为本发明系统实施例中舒适噪声生成系统的结构示意图。 具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白, 以下参照附 图并举实施例, 对本发明作进一步地详细说明。
本发明实施方式中,获取包括当前帧的一组连续帧中各帧的能量 特征值以及频谱特征值;从所述获取的各帧能量特征值中选择一个能 量特征值, 作为当前舒适噪声的能量参数; 从所述获取的各帧频谱特 征值中选择一个频语特征值,将选择出的频谱特征值对应帧的倒谱频 率参数作为当前舒适噪声的频谱参数。
图 2为本发明方法实施例的总体流程图。本发明方法实施例应用 于移动通信系统中的语音通信发生暂停的情况下。 如图 2所示, 该方 法包括以下步骤:
步骤 S201: 计算当前一组连续帧中各帧的能量特征值以及频谱 特征值。
本步骤中, 各帧的能量特征值是指各帧的能量值 e g(0, 计算方 式如公式(9)所示: enloB(i) = (9)
Figure imgf000007_0001
其中, 为经过高通滤波后的语音帧信号, ^为每一帧的釆样 点数目。
各帧的频谱特征值是指各帧与除自身以外的其它帧的总频谱差 AS, , 计算方式为:
首先, 计算各帧相互之间的频谱差 ., 计算方式如公式(10) 所示:
Figure imgf000007_0002
然后, 计算总频谱差 计算方式如公式(11 )所示:
M,.= ∑ Δ^}. (ID 其中, 公式 (10)和(11 ) 中, 的取值范围为从零到 N; N 的取值为当前一组连续帧中所包括的帧的个数减一; 为第 i帧的 ISF ( Immittance Spectral Frequency, 导抗谱频率 )参数矢量的第 k个 值。 步骤 S202: 从计算出的各帧能量特征值中选择出一个能量特征 值, 作为当前舒适噪声的能量参数输出; 从计算出的各帧频谱特征值 中选择出一个频谱特征值,将选择出的频谱特征值对应帧的倒谱频率 参数作为当前舒适噪声的频谱参数输出。 本步骤中, 对计算出的各帧的 按照大小顺序进行排序, 并 选择排序后处于中间位置的 作为当前舒适噪声的能量参数。
从计算得到的各帧的总频谱差 Μ,.中选出取值最小的 Μ,. , 并选择 取值最 d、的 Μ,.对应的帧的 I SF参数作为当前舒适噪声的频谱参数。
上述步骤 S201和 S202均是由发送端完成的。在得到所需的能量 参数以及频谱参数以后,发送端向接收端发送携带有能量参数以及频 谱参数的 SID帧。 接收端接收该 SID帧, 并根据其中的能量参数和 频谱参数生成舒适噪声。
需要说明的是, 在实际应用中, 语音暂停之后的 7个连续帧被称 为 Hangover, 对于这 7个连续帧, 发送端仍然会按照语音帧的方式 进行编码和传输, 这种情况下, 接收端可以直接获得这 7帧的参数。 由于 Hangover作为语音信号的语尾, 一般情况下越是往后的帧会越 接近纯背景噪声, 所以, 本发明实施例中, 接收端接收并选取七个连 续帧中最后一帧的能量特征值和倒谱频率参数作为当前舒适噪声的 能量参数和频谱参数, 并根据所述能量参数和频谱参数生成舒适噪 声。
图 3为本发明方法较佳实施例的流程图。 本实施例中, 将每 8个 连续帧(当前帧以及之前 7帧, 以下简称前 8帧)看成一组连续语音 帧, 即针对每 8帧计算一次舒适噪声参数。 如图 3所示, 包括以下步 骤:
步骤 S301 : 发送端按照普通的语音帧处理方式对语音暂停之后 的 7个连续帧进行编码并传输至接收端。
步骤 S302: 接收端选取最后一帧的能量和 ISF参数作为生成舒 适噪声的能量参数和频谱参数。
由于 Hangover作为语音信号的语尾, 一般情况下越往后的帧越 接近纯背景噪声, 所以, 本步骤中, 接收端直接选取接收到的 7个连 续帧中的最后一帧的能量参数和 ISF 参数作为生成舒适噪声的能量 参数和频谱参数。
步骤 S303: 接收端生成舒适噪声。
本步骤中, 接收端根据步骤 S302中获取到的能量参数和频谱参 数生成舒适噪声, 生成方式与现有技术相同。
步骤 S304: 发送端生成能量参数。
本步骤中, 发送端计算前 8帧中每一帧的能量值 e"i。g() , 计算方 式如公式(9) 所示。 然后, 对计算出的每一帧的^ · = 0,...,7按照 升序顺序进行排序, 4艮设排序后的各帧能量值为 e«;。 gC/) ( = 0,...,7 ), 则选取处于中间位置的^ ( 作为生成舒适噪声的能量参数^^ 。
本实施例中, 假设选取排序后位于第四个位置上的 e«;。 g(j')作为 e * , 则有: o g(3)。
步骤 S305: 发送端生成频谱参数。
本步骤中, 发送端首先计算前 8帧相互之间的频谱差 ., 计算 方式 ¾口公式 ( 12 )所示:
AR1]
Figure imgf000009_0001
= 0,...,7J = 0,...,7,i≠j (12) 其中 是第 i帧的 ISF参数矢量的第 A个值。
然后,计算第 7'帧与其它 7帧的总频谱差 Μ,.,计算公式如公式( 13 ) 所示: M,. = Z / = 0, ..., 7, = 0, ..., 7 ( 13 )
J=0,j≠i
计算出各帧的 M,.后, 发送端从中选出取值最小的一个 AS,. , 记为 mn , 并用 Mmn对应的帧的 ISF参数 /( )作为当前生成舒适噪声的频 谱参数 fback , 即 fback = f(i)。
步骤 S306: 发送端向接收端发送 SID帧。
SID 帧中携带有生成的反映背景噪声水平的能量参数 <ck以及 频谱参数 fhack
步骤 S307: 接收端生成舒适噪声。
本步骤中,接收端生成舒适噪声的方式与现有技术相同, 此处不 再赘述。
后续过程, 发送端和接收端之间不断重复步骤 S304 ~ S307。 基于上述方法, 如图 4所示, 为本发明装置实施例发送端的组成 结构示意图。 该装置包括: 获取模块 401、 能量参数生成模块 402以 及频谱参数生成模块 403 , 其中:
获取模块 401 , 用于获取包括当前帧的一组连续帧中各帧的能量 特征值以及频谱特征值,并将获取到的各帧的能量特征值以及频谱特 征值分别输出至能量参数生成模块 402以及频谱参数生成模块 403 ; 获取模块 401 还可进一步划分为能量参数获取模块以及频谱参数获 取模块;
能量参数生成模块 402 , 用于接收来自获取模块 401的各帧的能 量特征值, 并从各帧的能量特征值中选择一个能量特征值, 作为当前 舒适噪声的能量参数;
频谱参数生成模块 403 , 用于接收来自获取模块 401的各帧的频 谱特征值, 并从各帧的频谱特征值中选择一个频谱特征值, 将选择出 的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数。 其中, 各帧的能量特征值为各帧的能量值 e g(0 ; 能量参数生成 模块 402具体包括: 排序模块 4021以及选择模块 4022:
排序模块 4021 , 用于接收来自获取模块 401的各帧的£ ( ) , 将 各帧的 按照大小顺序进行排序后发送至选择模块 4022;
选择模块 4022,用于从接收自排序模块 4021的排序后的 e g ( )中 选择处于中间位置的 e (0 , 作为当前舒适噪声的能量参数。
各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差 AS,;频谱参数生成模块 403用于接收来自获取模块 401的各帧的 Μ,., 选取各帧的 Μ,.中取值最小的 Μ,.对应的帧的 ISF参数作为当前舒适噪 声的频谱参数。
基于上述方法, 如图 5所示, 为本发明装置实施例接收端的组成 结构示意图。 该装置包括: 频谱参数接收模块 501、 能量参数获取模 块 502和舒适噪声生成模块 503 , 其中:
频谱参数接收模块 501 , 用于接收发送端输出的 SID帧, 获取所 述 SID帧对应的一组连续帧中各帧的频谱参数,并选取所述一组连续 帧最后一帧的频谱参数作为当前舒适噪声的频谱参数。
能量参数获取模块 502, 用于接收发送端输出的 SID帧, 获取所 述 SID帧对应的一组连续帧中各帧的能量参数,并选取所述一组连续 帧最后一帧的能量参数作为当前舒适噪声的能量参数。
舒适噪声生成模块 503 , 用于根据所述当前舒适噪声的能量参数 和频谱参数生成舒适噪声。
将上述发送端和接收端应用到实际移动通信系统中,可得到如图 6所示的系统结构示意图。 该系统包括: 发送端 601和接收端 602。 其中:
发送端 601 , 用于生成当前舒适噪声的能量参数和频谱参数, 并 将生成的能量参数和频谱参数生成 SID帧发送给接收端 602。
接收端 602, 用于接收接收端 601发送 SID帧, 获取当前舒适噪 声的能量参数和频谱参数,根据所述能量参数以及频谱参数生成舒适 噪声。
可见, 釆用本发明实施例的技术方案, 在获取包括当前帧的一组 连续帧的能量特征值以及频谱特征值以后,从中选择最能代表当前背 景噪声水平的能量特征值以及频谱特征值对应的帧的能量以及 ISF 参数作为生成当前舒适噪声的参数。相比于现有技术中的舒适噪声参 数生成方法,本发明实施例方法无需进行剔除频谱差异较大帧以及求 ISF参数平均值的运算, 从而实现了简单方便地生成所需舒适噪声参 数。
本领域技术人员可以理解实施例中的装置中的模块可以按照实 施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本 实施例的一个或多个装置中。 上述实施例的模块可以合并为一个模 块, 也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解 到本发明可以通过硬件实现,也可以可借助软件加必要的通用硬件平 台的方式来实现基于这样的理解,本发明的技术方案可以以软件产品 的形式体现出来, 该软件产品可以存储在一个非易失性存储介质(可 以是 CD-ROM, U盘, 移动硬盘等) 中, 包括若干指令用以使得一 台计算机设备(可以是个人计算机, 服务器, 或者网络设备等)执行 本发明各个实施例所述的方法。
综上所述, 以上仅为本发明的较佳实施例而已, 并非用于限定本 发明的保护范围。 凡在本发明的精神和原则之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。

Claims

权利要求
1、 一种舒适噪声参数产生方法, 其特征在于, 该方法包括以下 步骤:
获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特 征值;
从所述获取的各帧能量特征值中选择一个能量特征值,作为当前 舒适噪声的能量参数;
从所述获取的各帧频谱特征值中选择一个频谱特征值,将所述选 择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱 参数。
2、 根据权利要求 1所述的方法, 其特征在于, 所述从获取的各 帧能量特征值中选择一个能量特征值,作为当前舒适噪声的能量参数 包括如下步骤:
对所述获取的各帧的能量特征值大小进行排序;
选取所述排序后处于中间位置的能量特征值作为所述当前舒适 噪声的能量参数。
3、 根据权利要求 2所述的方法, 其特征在于, 所述包括当前帧 的一组连续帧包括八帧,所述选取排序后处于中间位置的能量特征值 为排序后处于第四位置的能量特征值。
4、 根据权利要求 1所述的方法, 其特征在于, 所述从获取的各 帧频谱特征值中选取一个频谱特征值,将所述选择出的频谱特征值对 应帧的倒谱频率参数作为当前舒适噪声的频谱参数包括如下步骤: 从所述获取的各帧的总频谱差中选出取值最小的总频谱差; 选择所述取值最小的总频谱差对应的帧的倒谱频率参数作为当 前舒适噪声的频谱参数。
5、 一种舒适噪声参数产生装置, 其特征在于, 所述装置包括: 获取模块,用于获取包括当前帧的一组连续帧中各帧的能量特征 值以及频谱特征值,并将获取到的各帧的能量特征值以及频谱特征值 分别输出至所述能量参数生成模块以及频谱参数生成模块;
能量参数生成模块,用于接收来自所述获取模块的各帧的能量特 征值, 并从所述各帧的能量特征值中选择出一个能量特征值, 作为当 前舒适噪声的能量参数;
频谱参数生成模块,用于接收来自所述获取模块的各帧的频谱特 征值, 并从所述各帧的频谱特征值中选择一个频谱特征值, 将所述选 择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱 参数。
6、 根据权利要求 5所述的装置, 其特征在于, 所述各帧的能量 特征值为各帧的能量值£ ( ); 所述能量参数生成模块具体包括: 排序模块, 用于接收来自所述获取模块的各帧的£ ( ) , 将所述 各帧的 e"i。g ( )按照大小顺序进行排序后发送至选择模块;
选择模块, 用于从接收自所述排序模块的排序后的 e"i。g ( )中选择 出处于中间位置的 , 作为所述当前舒适噪声的能量参数。
7、 根据权利要求 5或 6所述的装置, 其特征在于, 所述各帧的 频谱特征值为各帧与除自身以外的其它帧的总频谱差 ^;
所述频谱参数生成模块具体用于,接收来自所述获取模块的各帧 的 ^ , 选取所述各帧的^''中取值最小的Δ ^对应的帧的倒谱频率参 数作为当前舒适噪声的频谱参数。
8、 一种舒适噪声产生方法, 其特征在于, 包括以下步骤: 接收发送端将语音暂停之后的一组连续帧按照语音帧编码输出 的静音描述 SID帧;
根据所述 SID帧获取当前舒适噪声的能量参数和频谱参数; 根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。
9、 根据权利要求 8所述舒适噪声产生方法, 其特征在于, 所述 根据 SID帧获取当前舒适噪声的能量参数和频谱参数, 具体包括: 根据所述 SID 帧获取所述一组连续帧中各帧的能量参数和频谱 参数;
选取所述一组连续帧中最后一帧的能量参数和频谱参数作为当 前舒适噪声的能量参数和频谱参数。
10、 一种舒适噪声参数产生装置,其特征在于, 所述装置, 包括: 能量参数获取模块, 用于接收发送端输出的 SID 帧, 获取所述
SID帧对应的一组连续帧中各帧的能量参数, 并选取所述一组连续帧 最后一帧的能量参数作为当前舒适噪声的能量参数;
频谱参数接收模块, 用于接收发送端输出的 SID 帧, 获取所述 SID帧对应的一组连续帧中各帧的频语参数, 并选取所述一组连续帧 最后一帧的频谱参数作为当前舒适噪声的频谱参数; 舒适噪声生成模块,用于根据所述当前舒适噪声的能量参数和频 谱参数生成舒适噪声。
11、 一种舒适噪声参数产生系统, 其特征在于, 包括: 发送端和 接收端;
所述发送端, 用于生成当前舒适噪声的能量参数和频谱参数, 并 将生成的能量参数和频谱参数生成 SID帧发送给接收端;
所述接收端,用于接收接收端发送 SID帧,获取当前舒适噪声的 能量参数和频谱参数, 根据所述能量参数以及频谱参数生成舒适噪 声。
PCT/CN2008/070925 2007-05-11 2008-05-09 Procédé et dispositif de génération de paramètres de bruit de confort WO2008138263A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710104395.X 2007-05-11
CN 200710104395 CN101303855B (zh) 2007-05-11 2007-05-11 一种舒适噪声参数产生方法和装置

Publications (1)

Publication Number Publication Date
WO2008138263A1 true WO2008138263A1 (fr) 2008-11-20

Family

ID=40001703

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2008/070925 WO2008138263A1 (fr) 2007-05-11 2008-05-09 Procédé et dispositif de génération de paramètres de bruit de confort

Country Status (2)

Country Link
CN (1) CN101303855B (zh)
WO (1) WO2008138263A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197667A (zh) * 2013-01-29 2019-09-03 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201241A (zh) * 2011-04-11 2011-09-28 深圳市华新微声学技术有限公司 语音信号处理方法及装置
CN103093756B (zh) * 2011-11-01 2015-08-12 联芯科技有限公司 舒适噪声生成方法及舒适噪声生成器
CN103137133B (zh) * 2011-11-29 2017-06-06 南京中兴软件有限责任公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
CN106169297B (zh) 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
CN104978970B (zh) 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统
CN109841222B (zh) * 2017-11-29 2022-07-01 腾讯科技(深圳)有限公司 音频通信方法、通信设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1155801A (zh) * 1995-10-13 1997-07-30 法国电信公司 在语音数字传输系统中产生悦耳噪声的方法与装置
CN1367918A (zh) * 1999-06-07 2002-09-04 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
CN1513168A (zh) * 2000-11-27 2004-07-14 ��˹��ŵ�� 话音通信中产生舒适噪声的方法和系统
CN1801327A (zh) * 2004-12-29 2006-07-12 西门子公司 舒适噪声产生参数的匹配方法
US20070050189A1 (en) * 2005-08-31 2007-03-01 Cruz-Zeno Edgardo M Method and apparatus for comfort noise generation in speech communication systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1155801A (zh) * 1995-10-13 1997-07-30 法国电信公司 在语音数字传输系统中产生悦耳噪声的方法与装置
CN1367918A (zh) * 1999-06-07 2002-09-04 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
CN1513168A (zh) * 2000-11-27 2004-07-14 ��˹��ŵ�� 话音通信中产生舒适噪声的方法和系统
CN1801327A (zh) * 2004-12-29 2006-07-12 西门子公司 舒适噪声产生参数的匹配方法
US20070050189A1 (en) * 2005-08-31 2007-03-01 Cruz-Zeno Edgardo M Method and apparatus for comfort noise generation in speech communication systems

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197667A (zh) * 2013-01-29 2019-09-03 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置
CN110197667B (zh) * 2013-01-29 2023-06-30 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置

Also Published As

Publication number Publication date
CN101303855B (zh) 2011-06-22
CN101303855A (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
US10734003B2 (en) Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system
US11727946B2 (en) Method, apparatus, and system for processing audio data
US9460729B2 (en) Layered approach to spatial audio coding
US11978460B2 (en) Truncateable predictive coding
JP5281169B2 (ja) 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム
US20090192790A1 (en) Systems, methods, and apparatus for context suppression using receivers
WO2008138263A1 (fr) Procédé et dispositif de génération de paramètres de bruit de confort
EP3815082B1 (en) Adaptive comfort noise parameter determination
JP7297367B2 (ja) 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム
WO2007140724A1 (fr) procédé et appareil pour transmettre et recevoir un bruit de fond et système de compression de silence
JP4464707B2 (ja) 通信装置
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
JP2003249957A (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08734277

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08734277

Country of ref document: EP

Kind code of ref document: A1