CN105679312B - 一种噪声环境下声纹识别的语音特征处理方法 - Google Patents
一种噪声环境下声纹识别的语音特征处理方法 Download PDFInfo
- Publication number
- CN105679312B CN105679312B CN201610125032.3A CN201610125032A CN105679312B CN 105679312 B CN105679312 B CN 105679312B CN 201610125032 A CN201610125032 A CN 201610125032A CN 105679312 B CN105679312 B CN 105679312B
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency
- time series
- voice
- cepstrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
Abstract
本发明请求保护一种噪声环境下声纹识别的语音信号特征处理方法,包括步骤:(1)根据语音信号的特点对其进行信号的前期处理,包括语音信号的预加重,端点检测和加窗函数的选择;(2)估算发声个体的基音周期,并以此为依据对语音信号进行谱平滑处理,得到新的谱包络,计算通过梅尔滤波器的能量,最终通过离散余弦变换(DCT)计算得到梅尔平滑系数(SFCC)。(3)结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法对SFCC进行后处理,得到回归平衡参数(MVDA);目的是通过平滑谱包络去除个体发声的不稳定因素和通过后处理算法去除环境噪声的影响,最终降低声纹识别的误识率。
Description
技术领域
本发明涉及语音信号处理领域,提出一种基于基音特性和噪声特性的语音特征提取方法。
背景技术
随着语音科学与信息通信技术的发展,作为更加便捷的身份验证技术,声纹识别技术取得了显著的进步。语言作为人类最基础的自然属性之一,是人类之间信息传递最直接便捷的方式。作为个体的人的发声器官不仅与先天因素有关,而且受后天发育环境等因素的影响较大,因此语音有十分显著的个体色彩。这种个体上的特点同时衍生了一个科学研究热点——声纹识别。当一个个体在说话人时,所产生的语音与个体的发声习惯、发声器官等因素有关,这些因素是相对稳定的,一般情况下差异较小,因此个体之间的声纹图谱都存在差异。因此人的声音可以作为人的身份标识,是一个相对稳定的生命信号。声纹识别就是将人的发声特性作为标识,对人的身份进行验证的一项科学技术。
语音信号中的基音周期是语音的一大特性,它描述了语音激励源的一个特征。但由于人的基音周期的范围很宽,且同一个体在不同的情感环境中发音的基音周期也不相同,加之基音周期还会受到发音音调的影响,因此将基音作为声纹特征是比较困难的事情,而且基音也会通过影响语音特征参数,影响声纹识别的结果。因此本发明的谱包络平滑法正是基于这一特性,去除了基音的影响。
鲁棒性是声纹识别技术的关键,一个训练好的声纹识别系统通常需要在各种日常的环境下工作。声学模型只使用语音样本库中的数据进行训练,而语音的采集通常在低噪声的环境下,往往很难与多种噪声环境相匹配,环境噪声造成的特征扭曲降低了声纹识别的鲁棒性。环境噪声根据其特性可以分为加性噪声和减性噪声两种,如何有效的去除这两种噪声的干扰是关键所在。语音特征的后处理算法在前期特征的基础上进行处理,不仅减小了算法的复杂性,而且有利于提高语音的声纹特性。
发明内容
针对以上现有技术的不足,提出了一种方法。本发明的技术方案如下:一种噪声环境下声纹识别的语音特征处理方法,该方法包括以下几个步骤:
步骤1:获取噪声环境下的语音信号,根据语音的特点对信号进行前期处理,包括预加重处理,加窗处理和端点检测;
步骤2:估算发声个体的基音周期,并以此为依据对语音信号进行谱平滑处理,得到新的谱包络,计算通过梅尔滤波器的能量,最终通过DCT倒谱计算得到中间信号SFCC;
步骤3:结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法依次对步骤2得到的SFCC进行后处理,得到最终语音特征MVDA。
进一步的,步骤1对信号进行前期处理,具体为:步骤A1:根据口腔的辐射响应接近于一阶高通函数的特性,采用的预加重滤波器为x′(n)=x(n)-a*x(n-1),公式中a是常数,x(n)为原信号,x′(n)为预加重信号,n为时域内语音的采样点。
步骤A2:采用汉明窗对语音信号进行加窗处理;
步骤A3:采用短时平均能量和短时平均过零率的双门限法对语音信号进行端点检测。
进一步的,所述步骤2,具体步骤如下:
步骤B1:首先利用倒谱法基音检测估算每一帧语音的基音周期;
步骤B2:对每一帧信号进行快速傅里叶变换,计算谱线能量;
步骤B3:对得到的能量谱求其谱包络,利用谱包络平滑函数对谱包络进行平滑处理;
步骤B4:计算通过Mel滤波器组的能量,计算DCT倒谱得到SFCC。
进一步的,所述步骤B3利用谱包络平滑函数对谱包络进行平滑处理具体为:对于
一帧语音信号,首先通过在步骤B1中求得的基音频率w0;根据基音频率w0的频域数据X[w],
在信号区间[w0/2,3w0/2]内找到波峰A1及其对应的频率w11;同样在信号区间[w0/2+w11,3w0/
2+w11]内找到波峰A2及其对应的频率w12;循环此步骤依次发现{[Ak,w1k]},k=1,2,...,一直
找到频域信号的末端;同样根据其频域数据X[w],在信号区间[w0/2,3w0/2]内找到波峰B1及
其对应的频率w21;同样在信号区间[w0/2+w21,3w0/2+w21]内找到波峰B2及其对应的频率w22;
循环此步骤依次发现{[Bk,w2k]},k=1,2,...,一直找到频域信号的末端;根据Ak和Bk求得二
者的中间值Ck及其对应的频率wk;根据两个相邻的中间值插值重新估算谱线能量,公式为得到新的能量谱包络。
进一步的,所述步骤3,结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法依次对步骤2得到的SFCC进行后处理,具体步骤如下:
步骤C1:利用均值消减法对语音信号特征进行处理,用C(τ)表示第τ帧语音信号的特征,则均值消减表示为表示经步骤C1后得到的语音信号,其中μ是根据样本数据估计的均值项;
步骤C2:利用方差归一化法对步骤C1均值消减后的语音信号特征进行处理;方差归一化法表示为其中是均值消减和方差归一化之后的特征,σ2[d]是SFCC第d维的估计方差;
步骤C3:利用时间序列滤波法对步骤C2方差归一后的语音信号特征进行处理;其中是均值消减、方差归一化和时间序列滤波之后的特征,K代表时间序列的宽度,m为其最大宽度;
步骤C4:利用加权自回归移动平均滤波法对语音信号特征进行处理,
其中是MVDA滤波之后的特征,m代表加权自回归移动平均滤波法深度和权重,m=1时表示没加权自回归移动平均滤波处理, 这里T为给定语句中的帧数。
进一步的,所述步骤B1:首先利用倒谱法基音检测估算每一帧语音的基音周期具体为;
已知基音频率范围为40~600Hz之间,当采样频率为fs时,在到频率域上40Hz对应的基因周期样值点Pmax=fs/40,而600Hz对应的基音周期样值点为Pmin=fs/600,所以在计算出倒谱后,就在到频率为Pmin和Pmax之间寻找倒谱函数的最大值,倒谱函数最大值对应的样点数就是该i帧语音信号的基音周期T0(i)。
进一步的,所述步骤B2对每一帧信号进行快速傅里叶变换,计算谱线能量具体为;
当假设语音信号序列为x(n),对应的傅里叶变换为X(w)=FT[x(n)],则序列为倒谱,FT和FT-1分别表示傅里叶变换和傅里叶逆变换,根据语音的特性,x(n)是由声门脉冲激励u(n)经声道响应υ(n)滤波而得到,可以表示为x(n)=u(n)*υ(n),设这三个量的倒谱分别为及则可得到看出和是相对分离的,因而可行倒谱分离恢复u(n),从中求出基音周期。
本发明的优点及有益效果如下:
本发明是针对声纹识别中,语音信号特征的个体因素和环境因素,提出了一种有效去除基音和噪声干扰的特征处理方法,保证声纹识别的灵敏性和准确性。具体优点是:(1)对语音信号进行预处理,针对噪声环境特性选取合适的预加重方法、加窗分帧方法和端点检测方法,降低了噪声对语音预处理造成的误差,保证了声纹识别的系统性能;(2)在特征提取时,通过对语音信号进行谱平滑处理,得到更能代表声纹特性的谱包络,弱化了基音周期的不稳定性;(3)在后处理算法中,利用MVDA滤波法去除卷积噪声和加性噪声影响,同时保证了语音系统的灵敏性。
本发明所有语音特征处理步骤,都采取了针对声纹特性的方法,综合考虑了声纹识别的外部噪声环境和发声个体自身的不稳定因素,在保证声纹识别系统的同时,降低了算法的复杂性,保证了声纹识别的灵敏性。
附图说明
图1是本发明提供优选实施例能量谱包络图;
图2:谱包络平滑法流程图;
图3:MVDA处理法流程图。
具体实施方式
以下结合附图,对本发明作进一步说明:
如图1所示,假设语音信号为x(n)。
步骤1:采用的预加重滤波器x′(n)=x(n)-ax(n-1),其中a取常数0.95,对语音信号进行预处理;采用汉明窗对语音信号进行加窗处理;首先根据短时能量包络线选取一个较大的阈值T1(根据语音信号能量统计,设为9.58)进行粗判,高于该阈值确定为语音信号,语音信号的起止点位于该阈值与短时能量包络交点所对应时间点之外。在平均能量上确定一个较低的阈值T2(根据语音信号能量统计,设为5.56),并从T1的交点分别往信号的两侧搜索,找到与T2的交点就是短时能量判定的语音信号起止点。以短时过零率为准向语音信号两侧寻找,找到低于设定过零率阈值T3(根据语音短时过零率统计,设为7.56)的点即为语音信号的起止点。根据两级判决的结果各取起点和终点的中间值作为最后的起止点。步骤2:首先利用倒谱法基音检测估算每一帧语音的基音周期。当采样频率为fs=8000Hz时,在到频率域上40Hz对应的基因周期样值点Pmax=fs/40,而600Hz对应的基音周期样值点为Pmin=fs/600。所以在计算出倒谱后,就在到频率为Pmin和Pmax之间寻找倒谱函数的最大值,倒谱函数最大值对应的样点数就是该i帧语音信号的基音周期T0(i)。接着计算谱线能量E(w)=[X(w)]2。利用谱包络平滑函数对谱包络进行平滑处理,如图2。对于一帧语音信号,首先求得基音频率w0;根据其频域数据E[w],在信号区间[w0/2,3w0/2]内找到波峰A1及其对应的频率w11;同样在信号区间[w0/2+w11,3w0/2+w11]内找到波峰A2及其对应的频率w12;循环此步骤依次发现{[Ak,w1k]},k=1,2,...,一直找到信号的末端,频率为4000Hz时;同样根据其频域数据E[w],在信号区间[w0/2,3w0/2]内找到波峰B1及其对应的频率w21;同样在信号区间[w0/2+w21,3w0/2+w21]内找到波峰B2及其对应的频率w22;循环此步骤依次发现{[Bk,w2k]},k=1,2,...,一直找到信号的末端,频率为4000Hz时;根据Ak和Bk求得二者的中间值Ck及其对应的频率wk;根据两个相邻的中间值插重新估算谱线能量,公式为得到新的能量谱包络,得第i帧的能量谱为Ci。根据Mel滤波器的频率响应Hm(k),其中M为Mel滤波器个数,N为语音信号的帧长。最后对S(i,m)做DCT变换求得特征参数SFCC,如图2。
步骤3:SFCC参数的MVDA滤波,步骤如图3。利用均值消减法对语音信号特征进行处理,用C(τ)表示第τ帧语音信号的特征,则均值消减表示为其中μ是根据样本数据估计的均值项。利用方差归一化法对语音信号特征进行处理。方差归一化法表示为其中是均值消减和方差归一化之后的特征,σ2[d]是SFCC第d维的估计方差。利用时间序列滤波法对语音信号特征进行处理。时间序列滤波法表示为其中是均值消减、方差归一化和时间序列滤波之后的特征,K代表时间序列的宽度,m为其最大宽度。利用加权自回归移动平均滤波法对语音信号特征进行处理。根据语音信号的低频强高频弱的特性,构建并加权自回归移动平均滤波法表示为:
其中是MVDA滤波之后的特征,m代表加权自回归移动平均滤波法深度和权重,特殊情况m=1表示没加权自回归移动平均滤波处理。 这里T为给定语句中的帧数。得到最终的特征参数
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (7)
1.一种噪声环境下声纹识别的语音特征处理方法,其特征在于,该方法包括以下几个步骤:
步骤1:获取噪声环境下的语音信号,根据语音的特点对信号进行前期处理,包括预加重处理,加窗处理和端点检测;
步骤2:估算发声个体的基音周期,并以此为依据对语音信号进行谱平滑处理,得到新的谱包络,计算通过梅尔滤波器的能量,最终通过DCT倒谱计算得到特征参数SFCC;
步骤3:结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法依次对步骤2得到的特征参数SFCC进行后处理,其中利用时间序列滤波法为:对方差归一化后的语音信号特征进行处理,其中,τ表示帧数,是均值消减、方差归一化和时间序列滤波之后的特征,k代表时间序列的宽度,w为时间序列最大宽度,是均值消减和方差归一化之后的特征,得到最终语音特征MVDA。
2.根据权利要求1所示的噪声环境下声纹识别的语音特征处理方法,其特征在于,步骤1对信号进行前期处理,具体为:步骤A1:根据口腔的辐射响应接近于一阶高通函数的特性,采用的预加重滤波器为x′(n)=x(n)-a*x(n-1),公式中a是常数,x(n)为原信号,x′(n)为预加重信号,n为时域内语音的采样点;
步骤A2:采用汉明窗对语音信号进行加窗处理;
步骤A3:采用短时平均能量和短时平均过零率的双门限法对语音信号进行端点检测。
3.根据权利要求1或2所示的噪声环境下声纹识别的语音特征处理方法,其特征在于,所述步骤2,具体步骤如下:
步骤B1:首先利用倒谱法基音检测估算每一帧语音的基音周期T0(i);
步骤B2:对每一帧信号进行快速傅里叶变换,计算谱线能量;
步骤B3:对得到的能量谱求其谱包络,利用谱包络平滑函数对谱包络进行平滑处理;
步骤B4:计算通过梅尔滤波器组的能量,计算DCT倒谱得到SFCC。
4.根据权利要求3所示的噪声环境下声纹识别的语音特征处理方法,其特征在于,所示步骤B3利用谱包络平滑函数对谱包络进行平滑处理具体为:对于一帧语音信号,首先通过在步骤B1中求得的基音频率w0;根据基音频率w0的频域数据X[w],在信号区间[w0/2,3w0/2]内找到波峰A1及其对应的频率w11;同样在信号区间[w0/2+w11,3w0/2+w11]内找到波峰A2及其对应的频率w12;循环此步骤依次发现{[Ak,w1k]},k=1,2,...,一直找到频域信号的末端;同样根据其频域数据X[w],在信号区间[w0/2,3w0/2]内找到波峰B1及其对应的频率w21;同样在信号区间[w0/2+w21,3w0/2+w21]内找到波峰B2及其对应的频率w22;循环此步骤依次发现{[Bk,w2k]},k=1,2,...,一直找到频域信号的末端;根据Ak和Bk求得二者的中间值Ck及其对应的频率wk;根据两个相邻的中间值插值重新估算谱线能量,公式为w表示时间序列最大宽度,得到新的能量谱包络。
5.根据权利要求1所示的噪声环境下声纹识别的语音特征处理方法,其特征在于,所述步骤3,结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法依次对步骤2得到的SFCC进行后处理,具体步骤如下:
步骤C1:利用均值消减法对语音信号特征进行处理,用C(τ)表示第τ帧语音信号的特征,则均值消减表示为 表示经步骤C1后得到的语音信号,其中μ是根据样本数据估计的均值项;
步骤C2:利用方差归一化法对步骤C1均值消减后的语音信号特征进行处理;方差归一化法表示为其中是第d维均值消减之后的特征,σ2[d]是SFCC第d维的估计方差;
步骤C3:利用时间序列滤波法对步骤C2方差归一后的语音信号特征进行处理;其中是均值消减、方差归一化和时间序列滤波之后的特征,k代表时间序列的宽度,w为时间序列的最大宽度;
步骤C4:利用加权自回归移动平均滤波法对语音信号特征进行处理,
其中是MVDA滤波之后的特征,m代表加权自回归移动平均滤波法深度和权重,m=1时表示没加权自回归移动平均滤波处理, C(τ)[d]表示第d维特征,μ[d]表示均值,这里T为给定语句中的帧数。
6.根据权利要求3所示的噪声环境下声纹识别的语音特征处理方法,其特征在于,所述步骤B1:首先利用倒谱法基音检测估算每一帧语音的基音周期具体为;
已知基音频率范围为40~600Hz之间,当采样频率为fs时,在到频率域上40Hz对应的基音 周期样值点Pmax=fs/40,而600Hz对应的基音周期样值点为Pmin=fs/600,所以在计算出倒谱后,就在到频率为Pmin和Pmax之间寻找倒谱函数的最大值,倒谱函数最大值对应的样点数就是i帧语音信号的基音周期T0(i)。
7.根据权利要求3所示的噪声环境下声纹识别的语音特征处理方法,其特征在于,所述步骤B2对每一帧信号进行快速傅里叶变换,计算谱线能量具体为;当假设语音信号序列为x(n),n为时域内语音的采样点,对应的傅里叶变换为X(w)=FT[x(n)],则序列为倒谱,w为时间序列的最大宽度,FT和FT-1分别表示傅里叶变换和傅里叶逆变换,根据语音的特性,x(n)是由声门脉冲激励u(n)经声道响应υ(n)滤波而得到,表示为x(n)=u(n)*υ(n),*表示滤波,设这三个量的倒谱分别为及则可得到看出和是相对分离的,因而可行倒谱分离从恢复u(n),从中求出基音周期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610125032.3A CN105679312B (zh) | 2016-03-04 | 2016-03-04 | 一种噪声环境下声纹识别的语音特征处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610125032.3A CN105679312B (zh) | 2016-03-04 | 2016-03-04 | 一种噪声环境下声纹识别的语音特征处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105679312A CN105679312A (zh) | 2016-06-15 |
CN105679312B true CN105679312B (zh) | 2019-09-10 |
Family
ID=56306838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610125032.3A Active CN105679312B (zh) | 2016-03-04 | 2016-03-04 | 一种噪声环境下声纹识别的语音特征处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105679312B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106205638B (zh) * | 2016-06-16 | 2019-11-08 | 清华大学 | 一种面向音频事件检测的双层基音特征提取方法 |
CN107785020B (zh) * | 2016-08-24 | 2022-01-25 | 中兴通讯股份有限公司 | 语音识别处理方法及装置 |
CN109256127B (zh) * | 2018-11-15 | 2021-02-19 | 江南大学 | 一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法 |
CN109672787A (zh) * | 2019-02-18 | 2019-04-23 | 重庆蓝岸通讯技术有限公司 | 一种设备智能提醒方法 |
CN111105809B (zh) * | 2019-12-31 | 2022-03-22 | 云知声智能科技股份有限公司 | 一种降噪方法及装置 |
CN111429921B (zh) * | 2020-03-02 | 2023-01-03 | 厦门快商通科技股份有限公司 | 声纹识别方法、系统、移动终端及存储介质 |
CN111489763B (zh) * | 2020-04-13 | 2023-06-20 | 武汉大学 | 一种基于gmm模型的复杂环境下说话人识别自适应方法 |
CN112786059A (zh) * | 2021-03-11 | 2021-05-11 | 合肥市清大创新研究院有限公司 | 一种基于人工智能的声纹特征提取方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69207039D1 (de) * | 1991-03-25 | 1996-02-08 | Nippon Telegraph & Telephone | Verfahren zur Simulierung einer akustischen Übertragungsfunktion und Simulator hierfür |
CN102982803A (zh) * | 2012-12-11 | 2013-03-20 | 华南师范大学 | 基于hrsf及改进dtw算法的孤立词语音识别方法 |
CN103026407A (zh) * | 2010-05-25 | 2013-04-03 | 诺基亚公司 | 带宽扩展器 |
CN103370740A (zh) * | 2010-12-16 | 2013-10-23 | 法国电信公司 | 分级编码器中的改善阶段的改善编码 |
CN105224681A (zh) * | 2015-10-23 | 2016-01-06 | 武汉大学 | 基于家庭工作地上下文环境的用户需求获取方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7584235B2 (en) * | 2004-03-18 | 2009-09-01 | Tektronix, Inc. | Variable passband autoregressive moving average filter |
-
2016
- 2016-03-04 CN CN201610125032.3A patent/CN105679312B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69207039D1 (de) * | 1991-03-25 | 1996-02-08 | Nippon Telegraph & Telephone | Verfahren zur Simulierung einer akustischen Übertragungsfunktion und Simulator hierfür |
CN103026407A (zh) * | 2010-05-25 | 2013-04-03 | 诺基亚公司 | 带宽扩展器 |
CN103370740A (zh) * | 2010-12-16 | 2013-10-23 | 法国电信公司 | 分级编码器中的改善阶段的改善编码 |
CN102982803A (zh) * | 2012-12-11 | 2013-03-20 | 华南师范大学 | 基于hrsf及改进dtw算法的孤立词语音识别方法 |
CN105224681A (zh) * | 2015-10-23 | 2016-01-06 | 武汉大学 | 基于家庭工作地上下文环境的用户需求获取方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于ARIMA与WASDN加权组合的时间序列预测;张雨浓等;《计算机应用研究》;20150930;第2630-2633页 |
Also Published As
Publication number | Publication date |
---|---|
CN105679312A (zh) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105679312B (zh) | 一种噪声环境下声纹识别的语音特征处理方法 | |
CN106847292B (zh) | 声纹识别方法及装置 | |
CN106486131B (zh) | 一种语音去噪的方法及装置 | |
CN106935248B (zh) | 一种语音相似度检测方法及装置 | |
CN108922541B (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN108986824B (zh) | 一种回放语音检测方法 | |
Patel et al. | Speech recognition and verification using MFCC & VQ | |
US20170154640A1 (en) | Method and electronic device for voice recognition based on dynamic voice model selection | |
CN102968990B (zh) | 说话人识别方法和系统 | |
CN102436809B (zh) | 英语口语机考系统中网络语音识别方法 | |
WO2014153800A1 (zh) | 语音识别系统 | |
CN109036437A (zh) | 口音识别方法、装置、计算机装置及计算机可读存储介质 | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
CN103077728B (zh) | 一种病人虚弱语音端点检测方法 | |
Ismail et al. | Mfcc-vq approach for qalqalahtajweed rule checking | |
CN108682432B (zh) | 语音情感识别装置 | |
Jaafar et al. | Automatic syllables segmentation for frog identification system | |
CN111489763B (zh) | 一种基于gmm模型的复杂环境下说话人识别自适应方法 | |
Venturini et al. | On speech features fusion, α-integration Gaussian modeling and multi-style training for noise robust speaker classification | |
Hassan et al. | Pattern classification in recognizing Qalqalah Kubra pronuncation using multilayer perceptrons | |
Kaminski et al. | Automatic speaker recognition using a unique personal feature vector and Gaussian Mixture Models | |
CN116312561A (zh) | 一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置 | |
CN111091816B (zh) | 一种基于语音评测的数据处理系统及方法 | |
KR20090116055A (ko) | 은닉 마코프 모델을 이용한 잡음 마스크 추정 방법 및 이를수행하는 장치 | |
Shu-Guang et al. | Isolated word recognition in reverberant environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |