CN113299284B - 一种基于自适应滤波的语音识别装置、方法、设备及介质 - Google Patents

一种基于自适应滤波的语音识别装置、方法、设备及介质 Download PDF

Info

Publication number
CN113299284B
CN113299284B CN202110411753.1A CN202110411753A CN113299284B CN 113299284 B CN113299284 B CN 113299284B CN 202110411753 A CN202110411753 A CN 202110411753A CN 113299284 B CN113299284 B CN 113299284B
Authority
CN
China
Prior art keywords
signal
adaptive filtering
noise ratio
equalizer
outputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110411753.1A
Other languages
English (en)
Other versions
CN113299284A (zh
Inventor
王世元
张强强
贺付亮
郭靖
龙正吉
王琳
钱国兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University
Original Assignee
Southwest University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University filed Critical Southwest University
Priority to CN202110411753.1A priority Critical patent/CN113299284B/zh
Publication of CN113299284A publication Critical patent/CN113299284A/zh
Application granted granted Critical
Publication of CN113299284B publication Critical patent/CN113299284B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • G10K11/17854Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于自适应滤波的语音识别装置、方法、设备及介质,包括:采集模块,用于采集说话人的语音信息;预处理模块,用于对语音信息进行模数转换并产生语音信号;第一信号增强模块,用于对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;第二信号增强模块,用于对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;比较输出模块,输出比较结果。本发明考虑了白噪声和色噪声两种噪声的影响,针对性地采用基于白噪声的自适应滤波算法和基于色噪声的自适应滤波算法,提高了语音识别的准确度。

Description

一种基于自适应滤波的语音识别装置、方法、设备及介质
技术领域
本发明涉及语音识别技术领域,尤其是一种基于自适应滤波的语音识别装置、方法、设备及介质。
背景技术
LMS(Least Mean Square)算法的原理为:通过当前时刻滤波器的输出误差,输出信号和滤波器权系数来估算下一时刻可滤波器权系数,最终达到期望输出信号和实际输出信号之间的均方误差最小。RLS(Recursive Least Square)可以进行实时在线估计参数,是一个线性递推估计器,使当前参数的协方差最小化。Dentino等1979年首先提出了变换域自适应滤波的概念,其基本思想是把时域信号转变为变换域信号,在变换域中采用自适应算法。
对于强相关的信号,LMS算法的收敛性能降低,这是由于LMS算法的收敛性能依赖于输入信号自相关矩阵的特征值发散程度,输入信号自相关矩阵的特征值发散程度越小,LMS算法的收敛性能越好;RLS算法对输入信号的自相关矩阵的逆进行递推估计更新,收敛速度快。LMS算法和RLS算法对于统计独立的高斯白噪声具有较好的滤波作用,而变换域自适应滤波对于色噪声滤波方面,滤波效果更好。由于环境的复杂多变性,噪声并不是一成不变的,需要基于环境的改变选择更合适的滤波方法。
发明内容
针对现有技术中的缺陷,本发明提供了一种基于自适应滤波的语音识别装置、方法、设备及介质,提高了语音识别的准确度。
第一方面
一种基于自适应滤波的语音识别装置,包括:
优选地,采集模块,用于采集说话人的语音信息;
预处理模块,用于对语音信息进行模数转换并产生语音信号;
第一信号增强模块,用于对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;
第二信号增强模块,用于对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;
比较输出模块,用于比较第一信噪比和第二信噪比并输出比较结果;
所述比较第一信噪比和第二信噪比并输出比较结果具体包括:
比较第一信噪比的值是否大于第二信噪比的值,若是,输出第一信噪比及第一增强信号;若否,输出第二信噪比及第二增强信号。
优选地,所述基于白噪声的自适应滤波算法包括以下步骤:
S1、构建目标函数
Figure BDA0003024465330000021
其中,w为均衡器的权向量,u为均衡器的输入向量,d为期望响应;
S2、构造均衡器的权向量系数的递推公式:
w(i)=w(i-1)+ηΦ(i)[d(i)-Φ(i)Tw(i-1)]
其中,w(i)为权向量系数,η为步长,
Figure BDA0003024465330000022
Figure BDA0003024465330000023
为均衡器输入向量u映射到高维特征空间的向量;
S3、根据RKHS理论,在权向量张成的空间做投影,权向量在特征空间展开可得:
Figure BDA0003024465330000024
其中,aj(i)为所述投影的系数;
S4、根据Mercer核定义进行向量点积,得到均衡器的输出公式:
Figure BDA0003024465330000025
y(i;k)为滤波器的输出值;
S5、对均衡器进行初始化,按照步骤S2、S3和步骤S4不断进行迭代和更新,直至处理完毕。
优选地,基于色噪声的自适应滤波算法包括变换域自适应滤波算法。
优选地,所述预处理模块包括模数转换芯片,模数转换芯片采用AD9125双通道16位带宽芯片。
优选地,还包括主控模块和通讯模块,主控模块用于接收比较输出模块发送的比较结果,并将比较结果通过通讯模块上传至上位机。
优选地,所述采集模块包括多个等间距排列的麦克风组成的阵列。
第二方面
一种基于自适应滤波的语音识别方法,包括以下步骤:
采集说话人的语音信息;
对语音信息进行模数转换并产生语音信号;
对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;
对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;
比较第一信噪比的值是否大于第二信噪比的值,若是,输出第一信噪比及第一增强信号;若否,输出第二信噪比及第二增强信号。
优选地,所述基于白噪声的自适应滤波算法包括以下步骤:
S1、构建目标函数
Figure BDA0003024465330000031
其中,w为均衡器的权向量,u为均衡器的输入向量,d为期望响应;
S2、构造均衡器的权向量系数的递推公式:
w(i)=w(i-1)+ηΦ(i)[d(i)-Φ(i)Tw(i-1)]
其中,w(i)为权向量系数,η为步长,
Figure BDA0003024465330000032
Figure BDA0003024465330000033
为均衡器输入向量u映射到高维特征空间的向量;
S3、根据RKHS理论,在权向量张成的空间做投影,权向量在特征空间展开可得:
Figure BDA0003024465330000041
其中,aj(i)为所述投影的系数;
S4、根据Mercer核定义进行向量点积,得到均衡器的输出公式:
Figure BDA0003024465330000042
y(i;k)为滤波器的输出值;
S5、对均衡器进行初始化,按照步骤S2、S3和步骤S4不断进行迭代和更新,直至处理完毕。
第三方面
一种基于自适应滤波的语音识别设备,包括存储器和处理器;所述存储器用于存储可执行程序代码;
所述处理器用于读取所述存储器中存储的可执行程序代码,以执行第二方面所述的一种基于自适应滤波的语音识别方法。
第四方面
一种介质,所述存储介质存储有权利要求7中所述的可执行程序代码。
本发明提供的了一种基于自适应滤波的语音识别装置、方法、设备及介质,考虑了白噪声和色噪声两种噪声的影响,针对性地采用基于白噪声的自适应滤波算法和基于色噪声的自适应滤波算法,输出较高信噪比对应的增强信号,提高了语音识别的准确度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明实施例的一种基于自适应滤波的语音识别装置的结构示意图;
图2为本发明实施例的一种基于自适应滤波的语音识别方法的流程示意图;
图3为本发明实施例的一种基于自适应滤波的语音识别设备的硬件架构图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
如图1所示,本发明实施例提供了一种基于自适应滤波的语音识别装置,采集模块,用于采集说话人的语音信息;预处理模块,用于对语音信息进行模数转换并产生语音信号;第一信号增强模块,用于对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;第二信号增强模块,用于对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;比较输出模块,用于比较第一信噪比和第二信噪比并输出比较结果。其中,比较第一信噪比和第二信噪比并输出比较结果具体包括:比较第一信噪比的值是否大于第二信噪比的值,若是,输出第一信噪比及第一信噪比对应的第一增强信号;若否,输出第二信噪比及第二信噪比对应的第二增强信号。
本发明实施例中基于白噪声的自适应滤波算法包括以下步骤:
S1、构建目标函数
Figure BDA0003024465330000061
其中,w为均衡器的权向量,u为均衡器的输入向量,d为期望响应;
S2、构造均衡器的权向量系数的递推公式:
w(i)=w(i-1)+ηΦ(i)[d(i)-Φ(i)Tw(i-1)]
其中,w(i)为权向量系数,η为步长,
Figure BDA0003024465330000062
Figure BDA0003024465330000063
为均衡器输入向量u映射到高维特征空间的向量;
S3、根据RKHS理论,在权向量张成的空间做投影,权向量在特征空间展开可得:
Figure BDA0003024465330000064
其中,aj(i)为投影的系数;
S4、根据Mercer核定义进行向量点积,得到均衡器的输出公式:
Figure BDA0003024465330000065
y(i;k)为滤波器的输出值;
S5、对均衡器进行初始化,按照步骤S2、S3和步骤S4不断进行迭代和更新,直至处理完毕。
根据实际需要,本发明实施例基于白噪声的自适应滤波算法还可采用LMS滤波算法或RLS滤波算法。LMS滤波算法实现的步骤如下:
1)初始化,设定滤波器W(k)的初始值:
Figure BDA0003024465330000066
2)估计滤波器输出值:
y(n)=WT(n)X(n)
3)计算估计误差:
e(n)=d(n)-y(n)
4)权值更新:
固步长LMS:W(n+1)=W(n)+2μe(n)X(n)
归一化LMS:
Figure BDA0003024465330000071
RLS算法的流程为:
1)初始化估计器:
x0=E[x]
P0=E[(x-x0)(x-x0)T]
2)建立观测模型,定义雅克比和测量协方差矩阵:
yk=Hkx+vk
3)更新对xk的估计和协方差Pk
Figure BDA0003024465330000072
xk=xk-1+Kk(yk-Hkxk-1)
Pk=(1-KkHk)Pk-1
变换域自适应滤波算法的原理为:变换矩阵N*N的T矩阵,常用的正交变换有离散余弦变换(DCT)、离散傅立叶变换(DTFT)、离散Hartly变换及沃尔什-哈达玛(Walsh—Hadamard)变换等。变换后的信号为:
X'=T*X
变换域的递推公式为:
W(n+1)=W(n)+2μe(n)P-1(n)X(n)
P(n)=diag[P(n,0),P(n,1),…,P(n,N-1)]
P(n,l)=βP(n-1,l)+(1-β)XT(n,l)·X(n,l),l=0,1…N-1
若令Λ2=P(n),则权系数向量的迭代方程为:
W(n+1)=W(n)+2μe(n)Λ-2X(n)
本发明实施例中,基于色噪声的自适应滤波算法包括变换域自适应滤波算法。
预处理模块包括模数转换芯片,模数转换芯片采用AD9125双通道16位带宽芯片。AD9125是一款双通道、16位、高动态范围TxDAC数模转换器(DAC),提供1000MSPS采样速率,可以产生最高达奈奎斯特频率的多载波。它具有针对直接变频传输应用进行优化的特性,包括复合数字调制以及增益与失调补偿。DAC输出经过优化,可以与模拟正交调制器无缝接口,例如ADI公司的ADL537x F-MOD系列调制器。4线式串行端口接口允许对许多内部参数进行编程和回读。满量程输出电流可以在8.7mA至31.7mA范围内进行编程。
本实施例实现的一种基于自适应滤波的语音识别装置还包括主控模块、通讯模块和定位模块,主控模块用于接收比较输出模块发送的比较结果,并将比较结果通过通讯模块上传至上位机;定位模块用于定位位置信息并发送至主控模块,主控模块将位置信息通过通讯模块上传至上位机。
本实施例中,采集模块包括多个麦克风,麦克风等间距排列成线阵或者方阵。
本发明实施例还提供了一种基于自适应滤波的语音识别方法,如图2所示,包括以下步骤:
S1、采集说话人的语音信息;
S2、对语音信息进行模数转换并产生语音信号;
S3、对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;
S4、比较第一信噪比的值是否大于第二信噪比的值,若是,输出第一信噪比及第一信噪比对应的第一增强信号;若否,输出第二信噪比及第二信噪比对应的第二增强信号。
基于白噪声的自适应滤波算法包括以下步骤:
S1、构建目标函数
Figure BDA0003024465330000081
其中,w为均衡器的权向量,u为均衡器的输入向量,d为期望响应;
S2、构造均衡器的权向量系数的递推公式:
w(i)=w(i-1)+ηΦ(i)[d(i)-Φ(i)Tw(i-1)]
其中,w(i)为权向量系数,η为步长,
Figure BDA0003024465330000091
Figure BDA0003024465330000092
为均衡器输入向量u映射到高维特征空间的向量;
S3、根据RKHS理论,在权向量张成的空间做投影,权向量在特征空间展开可得:
Figure BDA0003024465330000093
其中,aj(i)为投影的系数;
S4、根据Mercer核定义进行向量点积,得到均衡器的输出公式:
Figure BDA0003024465330000094
y(i;k)为滤波器的输出值;
S5、对均衡器进行初始化,按照步骤S2、S3和步骤S4不断进行迭代和更新,直至处理完毕。
本发明实施例中,基于色噪声的自适应滤波算法包括变换域自适应滤波算法。
图3为硬件架构的结构图,如图3所示,一种自适应滤波的语音识别设备包括输入设备、输入接口、中央处理器、存储器、输出接口和输出设备。其中,输入接口、中央处理器、存储器及输出接口通过总线相互连接,输入设备和输出设备分别通过输入接口和输出接口与总线连接,进而与设备的其他组件连接。具体地,输入设备接收来自外部的输入信息,并通过输入接口将输入信息传送到中央处理器。中央处理器基于存储器存储的计算机可执行程序代码对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器中,然后通过输出接口将输出信息传送到输出设备,输出设备将输出信息输出到设备的外部供用户使用。
本发明实施例还提供了一种计算机存储介质,该计算机存储介质上存储有可执行程序代码,该可执行程序代码被处理器执行时实现上述一种基于自适应滤波的语音识别方法。本实施例中,存储介质可以是计算机能够读取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。其中,可用介质可以是磁性介质(如软盘、硬盘、磁带)、光介质(如DVD)、或者半导体介质(如固态硬盘SSD)等。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供的一种基于自适应滤波的语音识别装置、方法、设备及介质,说话人语音信息经采集和预处理后,分别采用基于白噪声的自适应滤波算法和基于色噪声的自适应滤波算法进行滤波、去噪,比较并选择较大信噪比对应的增强信号作为最终的输出信号。本实施例考虑了白噪声和色噪声两种噪声的影响,针对性地采用基于白噪声的自适应滤波算法和基于色噪声的自适应滤波算法,输出较高信噪比对应的增强信号,提高了语音识别的准确度。本实施例中,还可通过通讯模块将比较结果及位置信息发送至上位机,方便远程监控。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种基于自适应滤波的语音识别装置,其特征在于:包括:
采集模块,用于采集说话人的语音信息;
预处理模块,用于对语音信息进行模数转换并产生语音信号;
第一信号增强模块,用于对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;
第二信号增强模块,用于对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;
比较输出模块,用于比较第一信噪比和第二信噪比并输出比较结果;
所述比较第一信噪比和第二信噪比并输出比较结果具体包括:
比较第一信噪比的值是否大于第二信噪比的值,若是,输出第一信噪比及第一增强信号;若否,输出第二信噪比及第二增强信号。
2.根据权利要求1所述的一种基于自适应滤波的语音识别装置,其特征在于:所述基于白噪声的自适应滤波算法包括以下步骤:
S1、构建目标函数
Figure FDA0003573245250000011
其中,w为均衡器的权向量,u为均衡器的输入向量,d为期望响应,E表示期望;
S2、构造均衡器的权向量系数的递推公式:
w(i)=w(i-1)+ηΦ(i)[d(i)-Φ(i)Tw(i-1)]
其中,w(i)为权向量系数,η为步长,
Figure FDA0003573245250000012
Figure FDA0003573245250000013
为均衡器输入向量u映射到高维特征空间的向量;
S3、根据RKHS理论,在权向量张成的空间做投影,权向量在特征空间展开可得:
Figure FDA0003573245250000014
其中,aj(i)为所述投影的系数;
S4、根据Mercer核定义进行向量点积,得到均衡器的输出公式:
Figure FDA0003573245250000021
y(i;k)为滤波器的输出值;
S5、对均衡器进行初始化,按照步骤S2、S3和步骤S4不断进行迭代和更新,直至处理完毕。
3.根据权利要求1所述的一种基于自适应滤波的语音识别装置,其特征在于:基于色噪声的自适应滤波算法包括变换域自适应滤波算法。
4.根据权利要求1所述的一种基于自适应滤波的语音识别装置,其特征在于:所述预处理模块包括模数转换芯片,模数转换芯片采用AD9125双通道16位带宽芯片。
5.根据权利要求1所述的一种基于自适应滤波的语音识别装置,其特征在于:还包括主控模块和通讯模块,主控模块用于接收比较输出模块发送的比较结果,并将比较结果通过通讯模块上传至上位机。
6.根据权利要求1所述的一种基于自适应滤波的语音识别装置,其特征在于:所述采集模块包括多个等间距排列的麦克风组成的阵列。
7.一种基于自适应滤波的语音识别方法,其特征在于:包括以下步骤:
采集说话人的语音信息;
对语音信息进行模数转换并产生语音信号;
对语音信号按照基于白噪声的自适应滤波算法进行滤波、降噪并输出第一增强信号及第一增强信号对应的第一信噪比;
对语音信号按照基于色噪声的自适应滤波算法进行滤波、降噪并输出第二增强信号及第二增强信号对应的第二信噪比;
比较第一信噪比的值是否大于第二信噪比的值,若是,输出第一信噪比及第一增强信号;若否,输出第二信噪比及第二增强信号。
8.根据权利要求7所述的一种基于自适应滤波的语音识别方法,其特征在于:所述基于白噪声的自适应滤波算法包括以下步骤:
S1、构建目标函数
Figure FDA0003573245250000031
其中,w为均衡器的权向量,u为均衡器的输入向量,d为期望响应,E表示期望;
S2、构造均衡器的权向量系数的递推公式:
w(i)=w(i-1)+ηΦ(i)[d(i)-Φ(i)Tw(i-1)]
其中,w(i)为权向量系数,η为步长,
Figure FDA0003573245250000032
Figure FDA0003573245250000033
为均衡器输入向量u映射到高维特征空间的向量;
S3、根据RKHS理论,在权向量张成的空间做投影,权向量在特征空间展开可得:
Figure FDA0003573245250000034
其中,aj(i)为所述投影的系数;
S4、根据Mercer核定义进行向量点积,得到均衡器的输出公式:
Figure FDA0003573245250000035
y(i;k)为滤波器的输出值;
S5、对均衡器进行初始化,按照步骤S2、S3和步骤S4不断进行迭代和更新,直至处理完毕。
9.一种基于自适应滤波的语音识别设备,其特征在于:包括存储器和处理器;所述存储器用于存储可执行程序代码;
所述处理器用于读取所述存储器中存储的可执行程序代码,以执行权利要求7-8中任一项所述的一种基于自适应滤波的语音识别方法。
10.一种介质,其特征在于:所述介质存储有权利要求9中所述的可执行程序代码。
CN202110411753.1A 2021-04-16 2021-04-16 一种基于自适应滤波的语音识别装置、方法、设备及介质 Active CN113299284B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110411753.1A CN113299284B (zh) 2021-04-16 2021-04-16 一种基于自适应滤波的语音识别装置、方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110411753.1A CN113299284B (zh) 2021-04-16 2021-04-16 一种基于自适应滤波的语音识别装置、方法、设备及介质

Publications (2)

Publication Number Publication Date
CN113299284A CN113299284A (zh) 2021-08-24
CN113299284B true CN113299284B (zh) 2022-05-27

Family

ID=77318778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110411753.1A Active CN113299284B (zh) 2021-04-16 2021-04-16 一种基于自适应滤波的语音识别装置、方法、设备及介质

Country Status (1)

Country Link
CN (1) CN113299284B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708714A (zh) * 2022-04-02 2022-07-05 重庆交通职业学院 一种基于大数据的可视化环保设备服务管理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
WO2015165042A1 (zh) * 2014-04-29 2015-11-05 华为技术有限公司 信号接收方法及接收机
CN107316648A (zh) * 2017-07-24 2017-11-03 厦门理工学院 一种基于有色噪声的语音增强方法
CN110491405A (zh) * 2019-08-21 2019-11-22 南京信息工程大学 基于协同非线性自适应滤波的麦克风阵列语音增强方法
CN111814515A (zh) * 2019-04-11 2020-10-23 哈尔滨工业大学 基于改进变步长lms自适应的有源噪声对消方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9984701B2 (en) * 2016-06-10 2018-05-29 Apple Inc. Noise detection and removal systems, and related methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
WO2015165042A1 (zh) * 2014-04-29 2015-11-05 华为技术有限公司 信号接收方法及接收机
CN107316648A (zh) * 2017-07-24 2017-11-03 厦门理工学院 一种基于有色噪声的语音增强方法
CN111814515A (zh) * 2019-04-11 2020-10-23 哈尔滨工业大学 基于改进变步长lms自适应的有源噪声对消方法
CN110491405A (zh) * 2019-08-21 2019-11-22 南京信息工程大学 基于协同非线性自适应滤波的麦克风阵列语音增强方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ECG Signal Denoising by Using Least-Mean-Square;Uzzal Biswas;《3rd INTERNATIONAL CONFERENCE ON INFORMATICS, ELECTRONICS & VISION 2014》;20141231;全文 *
Logarithmic Hyperbolic Cosine Adaptive Filter and Its Performance Analysis;Shiyuan Wang;< IEEE Transactions on Systems, Man, and Cybernetics: Systems>;20190524;第2512-2524页 *
基于听觉感知加权的时域语音增强算法研究;吴晓华;《中国优秀硕士学位论文全文数据库》;20200215(第2期);I136-413 *
基于固定维度特征空间的鲁棒自适应滤波器研究;熊奎;《中国优秀硕士学位论文全文数据库》;20210115(第1期);I135-586 *

Also Published As

Publication number Publication date
CN113299284A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN109643554B (zh) 自适应语音增强方法和电子设备
CN108172231B (zh) 一种基于卡尔曼滤波的去混响方法及系统
Shin et al. Iterative SVD method for noise reduction of low-dimensional chaotic time series
JP6533340B2 (ja) ビーム形成用途のための適応的位相歪曲のない振幅応答等化
CN110402540B (zh) 主动降噪方法、装置、芯片、主动控制系统和存储介质
JP2007526511A (ja) 周波数領域で多重経路多チャネル混合信号のブラインド分離のための方法及びその装置
JP2015521748A (ja) 入力信号を変換する方法
WO2007053831A2 (en) Optimum nonlinear correntropy filter
JP2018531555A6 (ja) ビーム形成用途のための適応的位相歪曲のない振幅応答等化
CN113299284B (zh) 一种基于自适应滤波的语音识别装置、方法、设备及介质
CN110162739A (zh) 基于变遗忘因子的rffklms算法权值更新优化方法
Venkatesan et al. An efficient noise removal technique using modified error normalized LMS algorithm
KR100347699B1 (ko) 전력스펙트럼밀도추정방법및장치
CN111884625A (zh) 一种变步长稀疏增广复数自适应滤波器
CN113504505B (zh) 一种适用于低信噪比环境下的一维doa估计方法
WO2004090782A1 (en) Accurate linear parameter estimation with noisy inputs
CN109217844B (zh) 基于预训练随机傅里叶特征核lms的超参数优化方法
CN111193497A (zh) 一种基于emfnl滤波器的次级通道建模方法
CN115498980A (zh) 一种基于M估计的递归最小p阶自适应滤波定位方法
JP2541044B2 (ja) 適応フィルタ装置
CN115632633A (zh) 一种基于稳健m估计的最小误差熵自适应滤波方法
Avalos et al. Multichannel Filtered-X Error Coded Affine Projection-Like Algorithm with Evolving Order
Sicuranza et al. A variable-step adaptation algorithm for memory-oriented Volterra filters
CN110648681A (zh) 语音增强的方法、装置、电子设备及计算机可读存储介质
CN117040489B (zh) 一种稀疏约束的样条自适应滤波器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant