CN102426837A - 农业现场数据采集的移动设备语音识别的鲁棒性方法 - Google Patents

农业现场数据采集的移动设备语音识别的鲁棒性方法 Download PDF

Info

Publication number
CN102426837A
CN102426837A CN2011104539949A CN201110453994A CN102426837A CN 102426837 A CN102426837 A CN 102426837A CN 2011104539949 A CN2011104539949 A CN 2011104539949A CN 201110453994 A CN201110453994 A CN 201110453994A CN 102426837 A CN102426837 A CN 102426837A
Authority
CN
China
Prior art keywords
deviation
noise
sigma
voice
centerdot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104539949A
Other languages
English (en)
Other versions
CN102426837B (zh
Inventor
诸叶平
赵俊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Information Institute of CAAS
Original Assignee
Agricultural Information Institute of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Information Institute of CAAS filed Critical Agricultural Information Institute of CAAS
Priority to CN2011104539949A priority Critical patent/CN102426837B/zh
Publication of CN102426837A publication Critical patent/CN102426837A/zh
Application granted granted Critical
Publication of CN102426837B publication Critical patent/CN102426837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提出一种农业现场数据采集的移动设备语音识别的鲁棒性方法,该方法是基于移动设备语音识别特征补偿和模型补偿相结合的抗噪方法,针对农业现场数据采集典型应用场景的非平稳噪声环境,寻找稳健的耐噪声语音特征参数以及从含噪语音中提取的特征进行处理,去除由噪声引起的含噪语音特征和纯净语音特征之间的偏差,以有效提高系统识别准确率。本发明的方法复杂性低,更容易实施,同时由于基于农业特定情景的偏差模式要求的训练数据少,实时性好,更适合于在移动设备有限的计算和存储资源条件下应用。

Description

农业现场数据采集的移动设备语音识别的鲁棒性方法
技术领域
本发明涉及属于智能信息处理、农业信息技术领域,尤其是指一种农业现场数据采集的移动设备语音识别的鲁棒性方法。
背景技术
我国地域跨度大,地理环境复杂,农业生产水平和科技水平发展不平衡,移动设备的应用多样性和灵活性可以帮助解决在农业信息化进程中所遇到的来源于基层的前端技术困难,即原始信息的采集和控制问题。语音识别技术是解决移动设备交互问题的重要途径,随着农业现代化进程的不断深入,语音识别技术在农业信息领域的重要性越来越突出,在农业科学研究、农业生产和农产品信息采集领域都有着广泛应用。但基于移动设备的语音识别距离实用化还有一定距离,一方面,移动条件下各种不良声学环境的环境噪声限制了语音识别技术的应用,另一方面,非特定人连续语音识别对移动设备的语音识别技术提出了更高的鲁棒性要求。现有的语音识别鲁棒性方法主要面临以下问题:
1、语音信号是一种非平稳信号,常用的噪声补偿方法都是建立在线性平稳信号的假设上,考虑时变因素和非线性影响的情形非常复杂。
2、连续语音信号的声学特征随其前后相连的语音的不同而有很大差异,限制了语音识别在低信噪比移动设备上的实际应用。
3、大词汇量连续语音识别系统适应性差,对环境的依赖性较强,噪声环境下语音识别准确率的提高难度大。
在通用领域大词汇量连续语音识别的背景下解决上述问题非常困难,在特定领域中小词汇量的应用方面,移动设备的语音识别应用需要适应小数据的新环境,而桌面语音识别常用的具有复杂参数的最大似然线性回归方法复杂度又超出了移动设备的计算能力。
发明内容
本发明要解决的技术问题是:提出一种农业现场数据采集的移动设备语音识别鲁棒性方法,提高了识别鲁棒性,降低了识别难度,改善了农业现场数据采集语音识别的环境适应性。
本发明的技术解决方案是:一种农业现场数据采集的移动设备语音识别的鲁棒性方法,该方法是基于移动设备语音识别特征补偿和模型补偿相结合的抗噪方法,针对农业现场数据采集典型应用场景的非平稳噪声环境,寻找稳健的耐噪声语音特征参数以及从含噪语音中提取的特征进行处理,去除由噪声引起的含噪语音特征和纯净语音特征之间的偏差,以有效提高系统识别准确率。
本发明的特点和优点是:本发明为提高农业现场数据采集语音识别的鲁棒性,针对农业现场数据采集典型应用场景的非平稳噪声环境,寻找稳健的耐噪声语音特征参数以及从含噪语音中提取的特征进行处理,提出一种基于移动设备语音识别特征补偿和模型补偿相结合的抗噪方法,去除由噪声引起的含噪语音特征和纯净语音特征之间的偏差,以达到有效提高系统识别准确率的目的,在农业现场数据采集领域中小词汇量低信噪比条件下,本发明提高了移动设备语音识别在室内、室外和野外典型环境下的抗噪特性,具有一定的可靠性和实用性。
本方法复杂性低,更容易实施,同时由于基于农业特定情景的偏差模式要求的训练数据少,实时性好,更适合于在移动设备有限的计算和存储资源条件下应用。
附图说明
图1为本发明的农业现场数据采集的移动设备语音识别的鲁棒性方法的原理图。
图2为本发明的农业现场数据采集的移动设备语音识别的鲁棒性方法的模块框图。
具体实施方式
下面配合附图及具体实施例对本发明的具体实施方式作进一步的详细说明。
本发明提出一种农业现场数据采集的移动设备语音识别的鲁棒性方法,所述方法包括模型补偿、场景偏差计算、初始权重调整、环境补偿和自适应控制;语音信号经过模型补偿进行MFCC特征提取,与权值系数完成卷积运算,与背景噪声完成迭加后得到含噪特征矢量,然后经过场景偏差计算,根据计算结果进行场景初始权重系数调整,使场景初始权重根据输入信号的变动自动学习,而不断调整权值系数并始终保持均方差最小。
语音在从产生、采集为数字信号、调制传输解调整个过程都不可避免的受到外界的干扰,包括周围环境噪声的影响,语音信号采集设备的影响,传输调制信道的影响等。语音特征分布的环境变量的变化比语音信号变量的变化要慢,在一个短时间窗的噪声语音和模型分布之间进行随机匹配,从噪声语音数据找出并去除瞬间的非语音变化,可以使得语音识别精度可得到显著改善。
如图1所示,其为本发明的设计原理图。本发明是基于稳定性的考虑提出的一种基于模式的动态补偿方案,用来改善移动环境下语音识别的鲁棒性。
该方法定义了一个带偏差的固定模式来纠正数据训练时的环境变量,假设数据训练是根据一组事先定义好的应用场景下得到的,在识别时,瞬时偏差由多种可能的模式线性加权得到。
为了快速估计加权值,采用基于语音相关先验模式的贝叶斯学习法,对于先验数据统计在训练其间提前计算,一个是固定模式的偏差,一个是模式的初始权重。
固定模式通过把某些特定的场景分类合并的方式获得,选择三种情形下的移动环境作为代表:室内环境(办公室/温室大棚)、公共场所(市场,有背景噪音)和野外环境(风声、水声及虫鸣)。实际过程中通过噪声现场录音方法收集每个先验场景下的数据,利用最大似然线性回归方法估计一个全局偏置矢量作为相对于纯净语音的环境偏差。采用的环境补偿方法是从相似的应用场景中获取知识通过某些预先偏差补偿受噪降低的语音。
模式补偿方法提出瞬间偏差的估计是多种先验偏差模板线性时变的结合,偏差模式由几个代表典型应用场景的环境特性在训练过程计算得到。
为了便于准确理解本发明的技术方案,下面结合具体实施例对本发明的方法的关键技术部分进行详细说明,至于其它与现有语音识别技术相同的部分,由于本领域的技术人员结合本文的描述可以准确理解,故此处则不再一一赘述。
移动环境中语音识别鲁棒性改善的主要障碍包括由加性噪音、通道编码和解码中的非线性特征及脉冲干扰源产生的听觉降低。考虑到农业语音识别的有限训练样本和移动设备资源有限性,本方法采取从相似的应用场景中获取知识通过某些预先偏差来补偿受噪影响的语音信号。在移动环境中,加性噪音和卷积噪音会同时破坏语音信号,在倒谱范围里引出了一个时间变量偏差,瞬间的偏差是各种不同程度噪音、信道、甚至语音本身作用的混合。变化的偏差函数定义为:
bt=f(Xt,Nt,Ht)                                                        (1)
其中Xt,Ht和Nt分别代表语音、过滤和噪音。
1、语音码本的信号评估方法
考虑一个纯净语音环境,通过把可能的噪声语音数据最大化能够计算出一个变化的环境偏差。语音数据的统计用一个编码本Ω来模拟。
ΩM={ωm}1≤m≤M  ωm={αm,n;μm,n;∑m,n}1≤n≤N                  (2)
M代表编码数,每个编码都是一个N阶混合正态分布,αm,n;μm,n;∑m,n分别代表混合权重、均值和协方差矩阵,O代表当前帧的语音特征:
O = { O t - T 2 , · · · , O t , · · · , O t + T 2 } - - - ( 3 )
O和Ω之间随机匹配导出最大化的可能性:
max b t P ( O | Ω , b t ) - - - ( 4 )
用迭代的最大期望值方法求解:
U t = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · Σ m , n - 1
V t = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · Σ m , n - 1 ( o j - μ m , n ) - - - ( 5 )
b t i = U t - 1 V t
γm,n,j是时间j按前面迭代次偏差假设下的高斯分布ωm,n的占有率。
2、基于固定模式的动态补偿方法
给出Xt,Ht和Nt的联合分布,偏差可以在整个随机空间按积分计算:
Figure BDA0000127222090000046
按有限代表点来近似计算:
b t ≈ Σ r = 1 R f ( X r , N r , H r ) P r , t - - - ( 7 )
用预先计算好的固定模式描述移动环境特定点(Xr,Nr,Hr)的偏差:
B=[b1,b2,…,bR]其中br=f(Xr,Nr,Hr)               (8)
一个时变矢量被用来表示这些模型的瞬间权重因子:
λt=[λt,1,λt,2,…,λt,R]T其中λt,r=Pr,t    (9)
给出λt的先验分布,瞬间偏差能够通过优化噪声数据和模型间的匹配来估算:
max λ t P ( O | Ω M , B , λ t ) P ( λ t ) - - - ( 10 )
先验分布假设为一个正态分布:
λ t ∝ N ( λ ‾ , Γ ) - - - ( 11 )
用迭代方法求解:
U t ′ = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · B T Σ m , n - 1 B + τ Γ - 1
V t ′ = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · Σ m , n - 1 ( o j - μ m , n ) + τ Γ - 1 λ ‾ - - - ( 12 )
λ′t=U′t -1V′t
τ为先验信息分布的调节参数。当τ被设定为零时,式(12)为最大似然估计。τ根据实际应用中的数据大小来调节。
3、多模板的谱加补偿方法
在农业具体应用环境中,背景噪声通常是加性噪声,对于基于HMM的语音识别系统,多模板的谱加训练噪声补偿方法如下:假定噪声模板为N={N1,N2,…,NM}其中M代表环境噪声种类,Ni={Ni1),Ni2),,NiB)},对于词表中的某个词在安静环境中得到K遍训练语音,求MFCC参数可得B个频谱,对一个T帧的语音可以得到T个频谱矢量序列,将每一帧频谱矢量分别加相应方差矢量中的某一个矢量,便得到一个新的T帧的频谱矢量序列,连同原来的频谱矢量序列,总共可以得到M+1个T帧的频谱矢量序列。对每一个频谱矢量求离散余弦反变换,得到MFCC参数,将一遍语音便扩展成M+1遍的MFCC参数序列,共得到K(M+1)遍参数序列,用这些参数序列训练该语音的隐马尔可夫模型进行模型补偿,在只考虑背景加性噪声的条件下,可以有效使模板适应多种噪声情况,不增加识别时的运算量,实时性好,适合在便携设备中使用。
如图2所示,本方法的设计主要分为模型补偿模块、场景偏差计算模块、初始权重调整模块、环境补偿模块和自适应控制模块。语音信号经过模型补偿模块进行MFCC特征提取,与权值系数完成卷积运算,与背景噪声完成迭加后得到含噪特征矢量,然后经过场景偏差计算模块,根据计算结果进行场景初始权重系数调整,使场景初始权重根据输入信号的变动自动学习,而不断调整权值系数并始终保持均方差最小。其中,对于环境补偿,由于聚合来自不同特定场景的训练数据会掩盖特定环境在声音模型中的信息,故本方法中的环境补偿是通过人工收集每个先验场景下的数据,利用最大似然方法估计一个全局偏移矢量作为相对于纯净语音的环境偏差,以达到预先补偿受噪降低的语音信号;由于模型和扰动的先验知识比较少,在系统的运行过程中依据对象的输入输出数据去不断提取有关模型的信息,改进模型参数,使模型逐步改进完善,逐步接近实际,最后将系统自身调整到一个满意的工作状态。
本发明的目的就是不断改变初始权重跟踪最新的场景变化。先验演进法的工作模式是按照不断增加的方式演变,当先验变量矩阵保持不变时相当于根据不同的语音片段调节中先验平均值矢量,通过不断更新先验的统计数据和当前数据来估计瞬时偏差(本发明中按时间变量结合先验模板进行计算)。
与常用的自适应模型比较,本方法复杂性低,更容易实施,同时由于基于农业特定情景的偏差模式要求的训练数据少,实时性好,更适合于在移动设备有限的计算和存储资源条件下应用。
虽然本发明已以具体实施例揭示,但其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的构思和范围的前提下所作出的等同组件的置换,或依本发明专利保护范围所作的等同变化与修饰,皆应仍属本专利涵盖的范畴。

Claims (10)

1.一种农业现场数据采集的移动设备语音识别的鲁棒性方法,其特征在于,该方法是基于移动设备语音识别特征补偿和模型补偿相结合的抗噪方法,针对农业现场数据采集典型应用场景的非平稳噪声环境,寻找稳健的耐噪声语音特征参数以及从含噪语音中提取的特征进行处理,去除由噪声引起的含噪语音特征和纯净语音特征之间的偏差,以有效提高系统识别准确率。
2.如权利要求1所述的方法,其特征在于,所述方法包括模型补偿、场景偏差计算、初始权重调整、环境补偿和自适应控制;语音信号经过模型补偿进行MFCC特征提取,与权值系数完成卷积运算,与背景噪声完成迭加后得到含噪特征矢量,然后经过场景偏差计算,根据计算结果进行场景初始权重系数调整,使场景初始权重根据输入信号的变动自动学习,而不断调整权值系数并始终保持均方差最小。
3.如权利要求1所述的方法,其特征在于,所述方法是通过一个带偏差的固定模式来纠正数据训练时的环境变量,其中数据训练是根据一组事先定义好的应用场景下得到的,在识别时,瞬时偏差由多种可能的模式线性加权得到。
4.如权利要求1所述的方法,其特征在于,所述方法采用基于语音相关先验模式的贝叶斯学习法来快速估计加权值;对于先验数据统计,在训练其间提前计算固定模式的偏差和模式的初始权重。
5.如权利要求4所述的方法,其特征在于,所述固定模式是通过把某些特定的场景分类合并的方式获得,选择三种情形下的移动环境作为代表:以办公室及/或温室大棚为代表的室内环境、以市场为代表的背景噪音的公共场所和以具有风声、水声及/或虫鸣的野外环境。
6.如权利要求1所述的方法,其特征在于,通过噪声现场录音方法收集每个先验场景下的数据,利用最大似然线性回归方法估计一个全局偏置矢量作为相对于纯净语音的环境偏差;从相似的应用场景中获取知识通过某些预先偏差补偿受噪降低的语音。
7.如权利要求1所述的方法,其特征在于,模式补偿方法中瞬间偏差的估计是多种先验偏差模板线性时变的结合,偏差模式由几个代表典型应用场景的环境特性在训练过程计算得到。
8.如权利要求4所述的方法,其特征在于,所述固定模式的偏差是采用语音码本的信号评估方法获得,其中,变化的偏差函数定义为:
bt=f(Xt,Nt,Ht)                                                        (1)
其中Xt,Ht和Nt分别代表语音、过滤和噪音;
考虑一个纯净语音环境,通过把可能的噪声语音数据最大化能够计算出一个变化的环境偏差;语音数据的统计用一个编码本来模拟:
ΩM={ωm}1≤m≤M  ωm={αm,n;μm,n;∑m,n}1≤n≤N                  (2)
M代表编码数,每个编码都是一个N阶混合正态分布,αm,n;μm,n;∑m,n分别代表混合权重、均值和协方差矩阵,O代表当前帧的语音特征:
O = { O t - T 2 , · · · , O t , · · · , O t + T 2 } - - - ( 3 )
O和Ω之间随机匹配导出最大化的可能性:
Figure FDA0000127222080000022
用迭代的最大期望值方法求解:
U t = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · Σ m , n - 1
V t = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · Σ m , n - 1 ( o j - μ m , n ) - - - ( 5 )
b t i = U t - 1 V t
γm,n,j是时间j按前面迭代次偏差假设下的高斯分布ωm,n的占有率。
9.如权利要求8所述的方法,其特征在于,基于固定模式的动态补偿方法如下:
给出Xt,Ht和Nt的联合分布,偏差可以在整个随机空间按积分计算:
Figure FDA0000127222080000027
按有限代表点来近似计算:
b t ≈ Σ r = 1 R f ( X r , N r , H r ) P r , t - - - ( 7 )
用预先计算好的固定模式描述移动环境特定点(Xr,Nr,Hr)的偏差:
B=[b1,b2,…,bR]其中br=f(Xr,Nr,Hr)                        (8)
利用一个时变矢量被用来表示这些模型的瞬间权重因子:
λt=[λt,1,λt,2,…,λt,R]T其中λt,r=Pr,t             (9)
给出λt的先验分布,瞬间偏差能够通过优化噪声数据和模型间的匹配来估算:
max λ t P ( O | Ω M , B , λ t ) P ( λ t ) - - - ( 10 )
将先验分布假设为一个正态分布:
λ t ∝ N ( λ ‾ , Γ ) - - - ( 11 )
用迭代方法求解:
U t ′ = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · B T Σ m , n - 1 B + τ Γ - 1
V t ′ = Σ m = 1 M Σ n = 1 N Σ j = t - T / 2 j = t + T / 2 γ m , n , j · Σ m , n - 1 ( o j - μ m , n ) + τ Γ - 1 λ ‾ - - - ( 12 )
λ′t=U′t -1V′t
τ为先验信息分布的调节参数;当τ被设定为零时,式(12)为最大似然估计;τ根据实际应用中的数据大小来调节。
10.如权利要求9所述的方法,其特征在于,对于基于HMM的语音识别系统,多模板的谱加训练噪声补偿方法如下:假定噪声模板为N={N1,N2,…,NM}其中M代表环境噪声种类,Ni={Ni1),Ni2),,NiB)},对于词表中的某个词在安静环境中得到K遍训练语音,求MFCC参数可得B个频谱,对一个T帧的语音可以得到T个频谱矢量序列,将每一帧频谱矢量分别加相应方差矢量中的某一个矢量,便得到一个新的T帧的频谱矢量序列,连同原来的频谱矢量序列,总共可以得到M+1个T帧的频谱矢量序列;对每一个频谱矢量求离散余弦反变换,得到MFCC参数,将一遍语音便扩展成M+1遍的MFCC参数序列,共得到K(M+1)遍参数序列,用这些参数序列训练该语音的隐马尔可夫模型进行模型补偿。
CN2011104539949A 2011-12-30 2011-12-30 农业现场数据采集的移动设备语音识别的鲁棒性方法 Active CN102426837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104539949A CN102426837B (zh) 2011-12-30 2011-12-30 农业现场数据采集的移动设备语音识别的鲁棒性方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104539949A CN102426837B (zh) 2011-12-30 2011-12-30 农业现场数据采集的移动设备语音识别的鲁棒性方法

Publications (2)

Publication Number Publication Date
CN102426837A true CN102426837A (zh) 2012-04-25
CN102426837B CN102426837B (zh) 2013-10-16

Family

ID=45960811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104539949A Active CN102426837B (zh) 2011-12-30 2011-12-30 农业现场数据采集的移动设备语音识别的鲁棒性方法

Country Status (1)

Country Link
CN (1) CN102426837B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310789A (zh) * 2013-05-08 2013-09-18 北京大学深圳研究生院 一种基于改进的并行模型组合的声音事件识别方法
CN104463393A (zh) * 2013-09-17 2015-03-25 中国农业科学院农业信息研究所 一种基于语音的农产品价格的采集方法
CN105580071A (zh) * 2013-05-06 2016-05-11 谷歌技术控股有限责任公司 用于训练声音识别模型数据库的方法和装置
CN105702255A (zh) * 2016-03-28 2016-06-22 华智水稻生物技术有限公司 农业数据采集方法、装置及移动终端
CN107862000A (zh) * 2017-10-22 2018-03-30 北京市农林科学院 一种农业技术咨询人机对话方法
CN108010527A (zh) * 2017-12-19 2018-05-08 深圳市欧瑞博科技有限公司 语音识别方法、装置、计算机设备和存储介质
CN111341323A (zh) * 2020-02-10 2020-06-26 厦门快商通科技股份有限公司 声纹识别训练数据扩增方法、系统、移动终端及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049388A (ja) * 2000-07-31 2002-02-15 Matsushita Electric Ind Co Ltd 変換マトリックスを使用する自動音声認識の際の付加および重畳ノイズ適応方法
CN1397929A (zh) * 2002-07-12 2003-02-19 清华大学 抗噪声语音识别用语音增强-特征加权-对数谱相加方法
CN1571012A (zh) * 2003-07-11 2005-01-26 中国科学院声学研究所 语音识别的概率加权平均缺失特征数据重建方法
CN1595497A (zh) * 2003-09-12 2005-03-16 古井贞熙 语音模型的噪声适应系统及方法,语音识别的噪声适应程序
KR100694879B1 (ko) * 2006-11-23 2007-03-14 부산대학교 산학협력단 아이겐 환경 및 바이어스 벡터 동시 가중치 추정을 통한잡음 보상 방법
CN101051461A (zh) * 2006-04-06 2007-10-10 株式会社东芝 特征向量补偿装置和特征向量补偿方法
US7729909B2 (en) * 2005-03-04 2010-06-01 Panasonic Corporation Block-diagonal covariance joint subspace tying and model compensation for noise robust automatic speech recognition
CN101853665A (zh) * 2009-06-18 2010-10-06 博石金(北京)信息技术有限公司 语音中噪声的消除方法
US20100262423A1 (en) * 2009-04-13 2010-10-14 Microsoft Corporation Feature compensation approach to robust speech recognition

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049388A (ja) * 2000-07-31 2002-02-15 Matsushita Electric Ind Co Ltd 変換マトリックスを使用する自動音声認識の際の付加および重畳ノイズ適応方法
CN1397929A (zh) * 2002-07-12 2003-02-19 清华大学 抗噪声语音识别用语音增强-特征加权-对数谱相加方法
CN1571012A (zh) * 2003-07-11 2005-01-26 中国科学院声学研究所 语音识别的概率加权平均缺失特征数据重建方法
CN1595497A (zh) * 2003-09-12 2005-03-16 古井贞熙 语音模型的噪声适应系统及方法,语音识别的噪声适应程序
US7729909B2 (en) * 2005-03-04 2010-06-01 Panasonic Corporation Block-diagonal covariance joint subspace tying and model compensation for noise robust automatic speech recognition
CN101051461A (zh) * 2006-04-06 2007-10-10 株式会社东芝 特征向量补偿装置和特征向量补偿方法
KR100694879B1 (ko) * 2006-11-23 2007-03-14 부산대학교 산학협력단 아이겐 환경 및 바이어스 벡터 동시 가중치 추정을 통한잡음 보상 방법
US20100262423A1 (en) * 2009-04-13 2010-10-14 Microsoft Corporation Feature compensation approach to robust speech recognition
CN101853665A (zh) * 2009-06-18 2010-10-06 博石金(北京)信息技术有限公司 语音中噪声的消除方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105580071A (zh) * 2013-05-06 2016-05-11 谷歌技术控股有限责任公司 用于训练声音识别模型数据库的方法和装置
CN105580071B (zh) * 2013-05-06 2020-08-21 谷歌技术控股有限责任公司 用于训练声音识别模型数据库的方法和装置
CN103310789A (zh) * 2013-05-08 2013-09-18 北京大学深圳研究生院 一种基于改进的并行模型组合的声音事件识别方法
CN103310789B (zh) * 2013-05-08 2016-04-06 北京大学深圳研究生院 一种基于改进的并行模型组合的声音事件识别方法
CN104463393A (zh) * 2013-09-17 2015-03-25 中国农业科学院农业信息研究所 一种基于语音的农产品价格的采集方法
CN105702255A (zh) * 2016-03-28 2016-06-22 华智水稻生物技术有限公司 农业数据采集方法、装置及移动终端
CN107862000A (zh) * 2017-10-22 2018-03-30 北京市农林科学院 一种农业技术咨询人机对话方法
CN108010527A (zh) * 2017-12-19 2018-05-08 深圳市欧瑞博科技有限公司 语音识别方法、装置、计算机设备和存储介质
CN108010527B (zh) * 2017-12-19 2020-06-12 深圳市欧瑞博科技有限公司 语音识别方法、计算机设备和存储介质
CN111508489A (zh) * 2017-12-19 2020-08-07 深圳市欧瑞博科技股份有限公司 语音识别方法、装置、计算机设备和存储介质
CN111341323A (zh) * 2020-02-10 2020-06-26 厦门快商通科技股份有限公司 声纹识别训练数据扩增方法、系统、移动终端及存储介质

Also Published As

Publication number Publication date
CN102426837B (zh) 2013-10-16

Similar Documents

Publication Publication Date Title
CN102426837B (zh) 农业现场数据采集的移动设备语音识别的鲁棒性方法
CN103236260B (zh) 语音识别系统
CN103000174B (zh) 语音识别系统中基于快速噪声估计的特征补偿方法
CN108447495B (zh) 一种基于综合特征集的深度学习语音增强方法
CN113488058B (zh) 一种基于短语音的声纹识别方法
CN111783558A (zh) 一种卫星导航干扰信号类型智能识别方法及系统
CN110148420A (zh) 一种适用于噪声环境下的语音识别方法
CN109192200B (zh) 一种语音识别方法
CN102945670B (zh) 一种用于语音识别系统的多环境特征补偿方法
CN104008751A (zh) 一种基于bp神经网络的说话人识别方法
CN104916289A (zh) 行车噪声环境下快速声学事件的检测方法
CN102682765A (zh) 高速公路音频车辆检测装置及其方法
CN104978507A (zh) 一种基于声纹识别的智能测井评价专家系统身份认证方法
CN104485103A (zh) 一种基于矢量泰勒级数的多环境模型孤立词识别方法
US6449594B1 (en) Method of model adaptation for noisy speech recognition by transformation between cepstral and linear spectral domains
CN112017682A (zh) 一种单通道语音同时降噪和去混响系统
CN108257606A (zh) 一种基于自适应并行模型组合的鲁棒语音身份识别方法
CN107274887A (zh) 基于融合特征mgfcc的说话人二次特征提取方法
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
CN108806725A (zh) 语音区分方法、装置、计算机设备及存储介质
CN106356058A (zh) 一种基于多频带特征补偿的鲁棒语音识别方法
CN104665875A (zh) 超声多普勒包络和心率检测方法
CN104157294A (zh) 一种农产品市场要素信息采集的鲁棒性语音识别方法
CN111341331B (zh) 基于局部注意力机制的语音增强方法、装置及介质
CN116992263A (zh) 一种基于多任务学习的水下航行器自噪声特征提取、识别与分离的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant