CN112133317A - 一种基于sbc的低传输比特率高质量语音编解码方法 - Google Patents

一种基于sbc的低传输比特率高质量语音编解码方法 Download PDF

Info

Publication number
CN112133317A
CN112133317A CN202010991900.2A CN202010991900A CN112133317A CN 112133317 A CN112133317 A CN 112133317A CN 202010991900 A CN202010991900 A CN 202010991900A CN 112133317 A CN112133317 A CN 112133317A
Authority
CN
China
Prior art keywords
sub
bit
sbc
data
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010991900.2A
Other languages
English (en)
Other versions
CN112133317B (zh
Inventor
左罡
胡晨光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yizhao Micro Electronics Hangzhou Co Ltd
Original Assignee
Yizhao Micro Electronics Hangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yizhao Micro Electronics Hangzhou Co Ltd filed Critical Yizhao Micro Electronics Hangzhou Co Ltd
Priority to CN202010991900.2A priority Critical patent/CN112133317B/zh
Publication of CN112133317A publication Critical patent/CN112133317A/zh
Application granted granted Critical
Publication of CN112133317B publication Critical patent/CN112133317B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种基于SBC的低传输比特率高质量语音编解码方法,属于语音或音频编码或解码技术领域,包括以下步骤:S100,发射端实现8KHz采样率语音数据的SBC编码,生成比特流数据发送;S200,接收端实现SBC解码,得到8KHz的脉冲编码调制语音数据;S300,降噪模块对SBC解码得到的脉冲编码调制语音数据进行频域降噪。本发明基于SBC编解码,提出一种8K采样率的8:1语音压缩/解压方案,并对解压后的语音进行降噪,实现了低传输比特率传递高质量音频数据的低计算复杂度的音频编解码。

Description

一种基于SBC的低传输比特率高质量语音编解码方法
技术领域
本发明属于语音或音频编码或解码技术领域,具体涉及为一种基于SBC的低传输比特率高质量语音编解码方法。
背景技术
在现有的智能移动终端中,很多已具有了蓝牙立体声功能。这一功能要 求有较大的带宽,以支持音频PCM(Pulse Code Modulation,脉冲编码调制)裸数据在串行UART(Universal Asynchronous Receiver/Transmitter,通用异步接收/发送装置)上的传输。为了在有限带宽情况下,有效地传输更多的音频数据,因此,需要对音频PCM裸数据进行压缩编码。鉴于智能移动终端的运算能力,采用SBC(SubBand Coding,子带编码)算法对音频数据进行压缩编码相对适合。
蓝牙SBC算法是一种以中等比特率传递高质量音频数据的低计算复杂度的音频编码算法。传统的SBC支持的采样率包括44.1kHz、48kHz、32kHz、16kHz;对于16kHz默认的压缩比为4:1,采样率的音频所需的频宽为64kps。
传统的SBC,具有以下不足:
1)SBC是一种有损编码,压缩比越大,对音质的影响更大,高压缩率会引入噪声。
2)SBC不支持8KHz的采样率,不能将语音的传输的比特率降到更低,对带宽要求高。
发明内容
本发明的目的在于克服上述提到的缺陷和不足,而提供一种基于SBC的低传输比特率高质量语音编解码方法。
本发明实现其目的采用的技术方案如下。
一种基于SBC的低传输比特率高质量语音编解码方法,包括以下步骤:
S100,发射端实现8KHz采样率语音数据的SBC编码,生成比特流数据发送;
S200,接收端实现SBC解码,得到8KHz的脉冲编码调制语音数据;
S300,降噪模块对SBC解码得到的脉冲编码调制语音数据进行频域降噪。
进一步,所述步骤100中,SBC编码,输入是脉冲编码调制数据,即采样后的时间序列,输出是二进制流,其具体步骤如下:
S101,脉冲编码调制数据输入至多相滤波器组,多相滤波器组把时间序列变换到频域,子频段的个数是4个或8个,取每一个子频段幅值的最大值作为这个子频段的尺度因子;
S102,比特分配和子带量化:每一个子频段有若干幅值需要编码,每个幅值需要用若干比特数来表示;同一个子频段中每个幅值的比特数相同,不同子频段幅值分配的比特数不同;为每个子频段分配幅值比特数的过程叫做比特分配;根据每个子频段的尺度因子及每个幅值需要的比特数,对每一个子频段进行编码的过程,得到每个子频段的量化结果,即子带量化;
S103,比特流打包:是将每个子频段编码后的结果组合起来,加上校验码、帧头信息,生成比特流数据发送。
进一步,所述步骤200中,SBC解码过程是编码过程的逆过程,其输入是二进制流,输出是脉冲编码调制数据,其具体步骤如下:首先对比特流进行解包,得到一帧一帧的数据;每一帧中都包含子频段数、每个子频段的尺度因子、每个子频段幅值需要的比特数;根据这些信息及每个子频段编码之后的数据,重建子频段的编码前的数据;然后经过逆向的多相滤波器组,得到原始的脉冲编码调制数据;将所有子频段的脉冲编码调制数据合并,得到解码后的脉冲编码调制语音数据。
更进一步,步骤S102中,将比特分配设置为SNR,在8K采样率实现8:1的压缩率。
更进一步,所述步骤S300,包括以下步骤:
步骤S301,重叠加窗,时频转换:
降噪模块每次处理的时域点数为64点;每次保留前一帧的64个点的数据,组成128个点的语音帧,通过加窗防止重叠带来的突变,并保证重叠区部分窗口的平方和必须为1;根据需求设计的16bit位宽的128点窗函数的如下:
SqrtHanning=[0,399,798,1196,1594,1990,2386,2780,3172,
3562,3951,4337,4720,5101,5478,5853,6224,
6591,6954,7313,7668,8019,8364,8705,9040,
9370,9695,10013,10326,10633,10933,11227,11514,
11795,12068,12335,12594,12845,13089,13325,13553,
13773,13985,14189,14384,14571,14749,14918,15079,
15231,15373,15506,15631,15746,15851,15947,16034,
16111,16179,16237,16286,16325,16354,16373,16384,
16373,16354,16325,16286,16237,16179,16111,
16034,15947,15851,15746,15631,15506,15373,15231,
15079,14918,14749,14571,14384,14189,13985,13773,
13553,13325,13089,12845,12594,12335,12068,11795,
11514,11227,10933,10633,10326,10013,9695,9370,
9040,8705,8364,8019,7668,7313,6954,6591,
6224,5853,5478,5101,4720,4337,3951,3562,
3172,2780,2386,1990,1594,1196,798,399];
时域加窗操作表示为:
Figure 694642DEST_PATH_IMAGE001
其中,y(n)是128点的一帧脉冲编码调制数据,加窗后进行128点FFT运算;
长度为N的数据序列y(n)的离散傅里叶变换Y(k)可表示为:
Figure DEST_PATH_IMAGE002
其中,
Figure 637934DEST_PATH_IMAGE003
,为旋转因子;
本步骤用按频率抽取的基4 FFT实现时域到频域的转换;
步骤S302,最小值跟踪估计噪声:
采用连续谱最小值跟踪法估计频域噪声分量;首先对各频点带噪语音功率谱进行平滑处理:
Figure 536620DEST_PATH_IMAGE004
其中,P(k,n)为平滑后的第n帧、k频点的语音信号功率谱;Y(k,n) 为第n帧、k频点的幅值;α为平滑因子;平滑处理后对各频点带噪语音功率最小值进行非线性跟踪:
If
Figure 247087DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
Else
Figure 240319DEST_PATH_IMAGE007
End
Figure 352632DEST_PATH_IMAGE008
本步骤中的非线性跟踪会连续对噪声功率进行估计,这里的
Figure 891060DEST_PATH_IMAGE009
就是估计的噪声功率谱密度;其中α取值为0.9, β取值为0.15,γ为0.8;
步骤S303,维纳滤波降噪:
维纳滤波的频域响应表示为:
Figure 88824DEST_PATH_IMAGE010
滤波后的频域信号表示为:
Figure 433217DEST_PATH_IMAGE011
步骤S304,去加窗,频时转换:
经过维纳滤波后,对频域信号进行去窗操作,使用加窗同样的窗函数,保证重叠区部分窗口的平方和为1;
去窗函数表示为:
Figure 150769DEST_PATH_IMAGE012
由 X(k)通过离散傅里叶逆变换(IDFT)到 x(n)表示为:
Figure 125678DEST_PATH_IMAGE013
通过上述步骤,实现了语音信号16Kbit/s的传输比特率。
本发明基于SBC编解码,提出一种8K采样率的8:1语音压缩/解压方案,并对解压后的语音进行降噪,实现了低传输比特率传递高质量音频数据的低计算复杂度的音频编解码。
附图说明
图1 是低传输比特率高质量语音编解码方案实现流程图
图2是SBC编码框图;
图3是SBC解码框图;
图4是频域降噪流程图。
具体实施方式
下面结合附图,对本发明作进一步详细说明。
SBC(subband codec)叫做子带编码。它的基本原理是把信号的频率分为若干子带,然后对每个子带进行编码,并根据每个子带的重要性及特点分配不同的位数(采样深度)来表示音频数据。
如图2所示,SBC编码的输入是PCM(脉冲编码调制)数据,即采样后的时间序列,输出是二进制流。
多相滤波器组把时间序列变换到频域,子频段的个数可以是4个或8个,对应不同的多相滤波器组。每一个子频段的幅值的范围是不同的,取每一个子频段幅值的最大值作为这个子频段的尺度因子(scale factor)。每一个子频段有若干幅值需要编码,每个幅值需要用若干比特数来表示。同一个子频段中每个幅值的比特数相同,不同子频段幅值分配的比特数不同。为每个子频段分配幅值比特数的过程叫做比特分配(allocation method)。根据每个子频段的尺度因子及每个幅值需要的比特数,对每一个子频段进行编码的过程,得到每个子频段的量化结果,即子带量化(Quantized Subband)。比特流打包(bitstreampacking)是将每个子频段编码后的结果组合起来,加上校验码、帧头信息等的过程。
图3所示的SBC解码过程是编码过程的逆过程,其输入是二进制流,输出是PCM数据。首先对二进制流进行解包,得到一帧一帧的数据。每一帧中都包含子频段数(4或8)、每个子频段的尺度因子、每个子频段幅值需要的比特数,根据这些信息及每个子频段编码之后的数据,重建子频段的编码前的数据。然后经过逆向的多相滤波器组,得到原始的PCM数据。将所有子频段的PCM数据合并,得到解码后的PCM数据。
通过SBC编码原理可知,SBC编码中唯一和采样率相关的过程是比特分配。SBC编码参数中的比特分配分为SNR和Loudness。两个配置决定比特分配是根据各频带的信噪比或是响度。如果设置为SNR时,比特分配和采样率是无关的。所以当我们将比特分配(allocation method)设置为SNR时,SBC是可以支持8K采样率的。为了在8K采样率实现8:1的压缩率,所需的SBC参数配置如下表所示。
表1. SBC参数配置
参数名 配置
channel mode Mono
bitpool 12
allocation method SNR
BLOCKS 16
BANDS 8
8K采样率实现8:1的压缩率会引入噪声,降低了语音质量。降噪模块的原理是在频域采用维纳滤波器抑制估计出来的噪声。
如图4所示,降噪模块的步骤如下:
1)加窗和离散傅里叶模块的设计
降噪模块每次处理的时域点数为64点。每次保留前一帧的64个点的数据,组成128个点的语音帧,通过加窗防止重叠带来的突变,并保证重叠区部分窗口的平方和必须为1。根据需求设计的16bit位宽的128点窗函数的如下:
SqrtHanning=[0,399,798,1196,1594,1990,2386,2780,3172,
3562,3951,4337,4720,5101,5478,5853,6224,
6591,6954,7313,7668,8019,8364,8705,9040,
9370,9695,10013,10326,10633,10933,11227,11514,
11795,12068,12335,12594,12845,13089,13325,13553,
13773,13985,14189,14384,14571,14749,14918,15079,
15231,15373,15506,15631,15746,15851,15947,16034,
16111,16179,16237,16286,16325,16354,16373,16384,
16373,16354,16325,16286,16237,16179,16111,
16034,15947,15851,15746,15631,15506,15373,15231,
15079,14918,14749,14571,14384,14189,13985,13773,
13553,13325,13089,12845,12594,12335,12068,11795,
11514,11227,10933,10633,10326,10013,9695,9370,
9040,8705,8364,8019,7668,7313,6954,6591,
6224,5853,5478,5101,4720,4337,3951,3562,
3172,2780,2386,1990,1594,1196,798,399];
时域加窗操作可表示为:
Figure 545158DEST_PATH_IMAGE001
其中,y(n)是128个点的语音帧,加窗后进行128点FFT运算。
长度为N的数据序列y(n)的离散傅里叶变换Y(k)可表示为:
Figure 693243DEST_PATH_IMAGE014
其中,
Figure 514568DEST_PATH_IMAGE003
称为旋转因子。
本方法用按频率抽取的基4 FFT实现时域到频域的转换。
2)噪声估计模块
本方法采用连续谱最小值跟踪法估计频域噪声分量。首先对各频点带噪语音功率谱进行平滑处理:
Figure 909646DEST_PATH_IMAGE015
其中,P(k,n)为平滑后的第n帧、k频点的语音信号功率谱;Y(k,n) 第n帧、k频点的幅值。α为平滑因子。平滑处理后对各频点带噪语音功率最小值进行非线性跟踪:
If
Figure 613160DEST_PATH_IMAGE016
Figure 237039DEST_PATH_IMAGE017
Else
Figure 178451DEST_PATH_IMAGE018
End
Figure 557479DEST_PATH_IMAGE019
方法中的非线性跟踪会连续对噪声功率进行估计,这里的
Figure 685972DEST_PATH_IMAGE020
就是估计的噪声功率谱密度。其中α取值为0.9, β取值为0.15,γ为0.8。
3) 频域维纳滤波模块
维纳滤波的频域响应
Figure 126925DEST_PATH_IMAGE021
可表示为:
Figure 454001DEST_PATH_IMAGE022
滤波后的频域信号可表示为:
Figure 941614DEST_PATH_IMAGE023
4)去窗和IFFT模块
经过维纳滤波后,对频域信号进行去窗操作,使用加窗同样的窗函数,保证重叠区部分窗口的平方和为1。
去窗函数可表示为:
Figure 822982DEST_PATH_IMAGE024
X(k)通过离散傅里叶逆变换(IDFT)到 x(n)可表示为:
Figure 116560DEST_PATH_IMAGE025
通过上述方案,实现了语音信号16Kbit/s的传输比特率。
在易兆微电子的蓝牙语音遥控器项目中,需要遥控器端通过蓝牙模块模块,传输16KHz采样率的PCM语音数据到接收端进行语音识别。可知16KHz的PCM(16bit)占用的带宽为256Kb/s。采用本专利提出的语音编解码方案,实现16Kb/s的传输比特率,整体的压缩率达到16:1。方案整体的流程如下:
1)实现16KHz采样率到8KHz采样率的下采;
2)遥控器端实现8KHz采样率下低运算复杂度的8:1语音压缩;
3)接收端对接受数据解压缩得到8KHz的语音;
4)对8KHz的语音进行降噪,提高语音质量;
5)实现8KHz到16KHz的采样率变换;
编解码后的音频和原始音频在听感上基本没有差别,也没有降低语音识别率。
本发明按照实施例进行了说明,在不脱离本原理的前提下,本装置还可以作出若干变形和改进。应当指出,凡采用等同替换或等效变换等方式所获得的技术方案,均落在本发明的保护范围内。

Claims (5)

1.一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,包括以下步骤:
S100,发射端实现8KHz采样率语音数据的SBC编码,生成比特流数据发送;
S200,接收端实现SBC解码,得到8KHz的脉冲编码调制语音数据;
S300,降噪模块对SBC解码得到的脉冲编码调制语音数据进行频域降噪。
2.根据权利要求1所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤100中,SBC编码,输入是脉冲编码调制数据,即采样后的时间序列,输出是二进制流,其具体步骤如下:
S101,脉冲编码调制数据输入至多相滤波器组,多相滤波器组把时间序列变换到频域,子频段的个数是4个或8个,取每一个子频段幅值的最大值作为这个子频段的尺度因子;
S102,比特分配和子带量化:每一个子频段有若干幅值需要编码,每个幅值需要用若干比特数来表示;同一个子频段中每个幅值的比特数相同,不同子频段幅值分配的比特数不同;为每个子频段分配幅值比特数的过程叫做比特分配;根据每个子频段的尺度因子及每个幅值需要的比特数,对每一个子频段进行编码的过程,得到每个子频段的量化结果,即子带量化;
S103,比特流打包:是将每个子频段编码后的结果组合起来,加上校验码、帧头信息,生成比特流数据发送。
3.根据权利要求1所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤200中,SBC解码过程是编码过程的逆过程,其输入是二进制流,输出是脉冲编码调制数据,其具体步骤如下:首先对比特流进行解包,得到一帧一帧的数据;每一帧中都包含子频段数、每个子频段的尺度因子、每个子频段幅值需要的比特数;根据这些信息及每个子频段编码之后的数据,重建子频段的编码前的数据;然后经过逆向的多相滤波器组,得到原始的脉冲编码调制数据;将所有子频段的脉冲编码调制数据合并,得到解码后的脉冲编码调制语音数据。
4.根据权利要求2所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,步骤S102中,将比特分配设置为SNR,在8K采样率实现8:1的压缩率。
5.根据权利要求4所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤S300,包括以下步骤:
步骤S301,重叠加窗,时频转换:
降噪模块每次处理的时域点数为64点;每次保留前一帧的64个点的数据,组成128个点的语音帧,通过加窗防止重叠带来的突变,并保证重叠区部分窗口的平方和必须为1;根据需求设计的16bit位宽的128点窗函数的如下:
SqrtHanning=[0,399,798,1196,1594,1990,2386,2780,3172,
3562,3951,4337,4720,5101,5478,5853,6224,
6591,6954,7313,7668,8019,8364,8705,9040,
9370,9695,10013,10326,10633,10933,11227,11514,
11795,12068,12335,12594,12845,13089,13325,13553,
13773,13985,14189,14384,14571,14749,14918,15079,
15231,15373,15506,15631,15746,15851,15947,16034,
16111,16179,16237,16286,16325,16354,16373,16384,
16373,16354,16325,16286,16237,16179,16111,
16034,15947,15851,15746,15631,15506,15373,15231,
15079,14918,14749,14571,14384,14189,13985,13773,
13553,13325,13089,12845,12594,12335,12068,11795,
11514,11227,10933,10633,10326,10013,9695,9370,
9040,8705,8364,8019,7668,7313,6954,6591,
6224,5853,5478,5101,4720,4337,3951,3562,
3172,2780,2386,1990,1594,1196,798,399];
时域加窗操作表示为:
Figure 20321DEST_PATH_IMAGE001
其中,y(n)是128点的一帧脉冲编码调制数据,加窗后进行128点FFT运算;
长度为N的数据序列y(n)的离散傅里叶变换Y(k)可表示为:
Figure 671882DEST_PATH_IMAGE002
其中,
Figure 671193DEST_PATH_IMAGE003
,为旋转因子;
本步骤用按频率抽取的基4 FFT实现时域到频域的转换;
步骤S302,最小值跟踪估计噪声:
采用连续谱最小值跟踪法估计频域噪声分量;首先对各频点带噪语音功率谱进行平滑处理:
Figure 800823DEST_PATH_IMAGE004
其中,P(k,n)为平滑后的第n帧、k频点的语音信号功率谱;Y(k,n) 为第n帧、k频点的幅值;α为平滑因子;平滑处理后对各频点带噪语音功率最小值进行非线性跟踪:
If
Figure 349616DEST_PATH_IMAGE005
Figure 906500DEST_PATH_IMAGE006
Else
Figure 642375DEST_PATH_IMAGE007
End
Figure 575696DEST_PATH_IMAGE008
本步骤中的非线性跟踪会连续对噪声功率进行估计,这里的
Figure 228263DEST_PATH_IMAGE009
就是估计的噪声功率谱密度;其中α取值为0.9, β取值为0.15,γ为0.8;
步骤S303,维纳滤波降噪:
维纳滤波的频域响应表示为:
Figure 956047DEST_PATH_IMAGE010
滤波后的频域信号表示为:
Figure 444797DEST_PATH_IMAGE011
步骤S304,去加窗,频时转换:
经过维纳滤波后,对频域信号进行去窗操作,使用加窗同样的窗函数,保证重叠区部分窗口的平方和为1;
去窗函数表示为:
Figure 916230DEST_PATH_IMAGE012
由 X(k)通过离散傅里叶逆变换(IDFT)到 x(n)表示为:
Figure 174036DEST_PATH_IMAGE013
通过上述步骤,实现了语音信号16Kbit/s的传输比特率。
CN202010991900.2A 2020-09-21 2020-09-21 一种基于sbc的低传输比特率高质量语音编解码方法 Active CN112133317B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010991900.2A CN112133317B (zh) 2020-09-21 2020-09-21 一种基于sbc的低传输比特率高质量语音编解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010991900.2A CN112133317B (zh) 2020-09-21 2020-09-21 一种基于sbc的低传输比特率高质量语音编解码方法

Publications (2)

Publication Number Publication Date
CN112133317A true CN112133317A (zh) 2020-12-25
CN112133317B CN112133317B (zh) 2021-08-10

Family

ID=73841872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010991900.2A Active CN112133317B (zh) 2020-09-21 2020-09-21 一种基于sbc的低传输比特率高质量语音编解码方法

Country Status (1)

Country Link
CN (1) CN112133317B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022252957A1 (zh) * 2021-05-29 2022-12-08 华为技术有限公司 音频数据编解码方法和相关装置及计算机可读存储介质
CN117095685A (zh) * 2023-10-19 2023-11-21 深圳市新移科技有限公司 一种联发科平台终端设备及其控制方法
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0333121A2 (en) * 1988-03-14 1989-09-20 Fujitsu Limited Voice coding apparatus
CN1375817A (zh) * 2001-03-19 2002-10-23 北京阜国数字技术有限公司 一种基于小波变换的音频信号压缩编/解码方法
CN102754150A (zh) * 2010-02-11 2012-10-24 高通股份有限公司 在子带译码解码器中隐藏遗失包
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN108389583A (zh) * 2018-07-04 2018-08-10 恒玄科技(上海)有限公司 一种无线蓝牙耳机通信音频的编码/解码方法及系统
CN109961799A (zh) * 2019-01-31 2019-07-02 杭州惠耳听力技术设备有限公司 一种基于迭代维纳滤波的助听器多通道语音增强算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0333121A2 (en) * 1988-03-14 1989-09-20 Fujitsu Limited Voice coding apparatus
CN1375817A (zh) * 2001-03-19 2002-10-23 北京阜国数字技术有限公司 一种基于小波变换的音频信号压缩编/解码方法
CN102754150A (zh) * 2010-02-11 2012-10-24 高通股份有限公司 在子带译码解码器中隐藏遗失包
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN108389583A (zh) * 2018-07-04 2018-08-10 恒玄科技(上海)有限公司 一种无线蓝牙耳机通信音频的编码/解码方法及系统
CN109961799A (zh) * 2019-01-31 2019-07-02 杭州惠耳听力技术设备有限公司 一种基于迭代维纳滤波的助听器多通道语音增强算法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022252957A1 (zh) * 2021-05-29 2022-12-08 华为技术有限公司 音频数据编解码方法和相关装置及计算机可读存储介质
CN117095685A (zh) * 2023-10-19 2023-11-21 深圳市新移科技有限公司 一种联发科平台终端设备及其控制方法
CN117095685B (zh) * 2023-10-19 2023-12-19 深圳市新移科技有限公司 一种联发科平台终端设备及其控制方法
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统
CN117854514B (zh) * 2024-03-06 2024-05-31 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Also Published As

Publication number Publication date
CN112133317B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN112133317B (zh) 一种基于sbc的低传输比特率高质量语音编解码方法
CN103415884B (zh) 用于执行霍夫曼编码的装置和方法
CN106133831B (zh) 音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法
EP1914724B1 (en) Dual-transform coding of audio signals
CN103069484B (zh) 时/频二维后处理
JP2908270B2 (ja) 適応的符号化システム
EP3232437B1 (en) Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
KR101621641B1 (ko) 신호 코딩 및 디코딩 방법 및 장치
WO2005096274A1 (fr) Dispositif et procede de codage/decodage audio ameliores
CN101494054B (zh) 一种音频码率控制方法及系统
CN101325059B (zh) 语音编解码收发方法及装置
CN109215668B (zh) 一种声道间相位差参数的编码方法及装置
JP6957444B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
CN101325058B (zh) 语音编码发送和接收解码的方法及装置
WO2005096508A1 (fr) Equipement de codage et de decodage audio ameliore, procede associe
CN101833953B (zh) 降低多描述编解码冗余度的方法和装置
CN116129918A (zh) 一种提高音频编码质量的方法
JPH0537396A (ja) デイジタルデータの高能率符号化方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant