CN113539284B - 语音降噪方法、装置、计算机设备及存储介质 - Google Patents

语音降噪方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113539284B
CN113539284B CN202110618936.0A CN202110618936A CN113539284B CN 113539284 B CN113539284 B CN 113539284B CN 202110618936 A CN202110618936 A CN 202110618936A CN 113539284 B CN113539284 B CN 113539284B
Authority
CN
China
Prior art keywords
voice signal
noise
voice
signal
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110618936.0A
Other languages
English (en)
Other versions
CN113539284A (zh
Inventor
何从华
曾峰
王新春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Discovery Technology Shenzhen Co ltd
Original Assignee
Discovery Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Discovery Technology Shenzhen Co ltd filed Critical Discovery Technology Shenzhen Co ltd
Priority to CN202110618936.0A priority Critical patent/CN113539284B/zh
Publication of CN113539284A publication Critical patent/CN113539284A/zh
Application granted granted Critical
Publication of CN113539284B publication Critical patent/CN113539284B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本申请实施例属于语音降噪技术领域,涉及一种语音降噪方法,该语音降噪方法用于解决语音降噪的技术问题,该语音降噪方法包括下述步骤:获取第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号,第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,第一麦克风和第二麦克风处于同一场景下的不同位置;利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号;对第三语音信号进行放大处理,得到降噪语音信号。

Description

语音降噪方法、装置、计算机设备及存储介质
技术领域
本申请涉及语音降噪技术领域,尤其涉及一种语音降噪方法、装置、计算机设备及存储介质。
背景技术
现在语音交互场景随处可见,例如可以应用在智能家居产品或者智能终端上,用户可以通过语音向设备下发语音指令,相比传统的按键操作,提高了用户体验。但随着语音识别和人工智能技术的日益发展,现在人们对语音识别的发展要求不仅仅是限于听到语音的控制指令,而是希望越来越灵敏,甚至在有环境噪声的环境下,也希望可以非常清晰地辨认用户的说话,甚至包括用户用方言等不太标准的语音说话。
现在的技术由于无法准确地挑选出环境噪声和实际的用户语音,使得设备很难听懂用户的语音指令,从而操作出错,影响用户体验。
可见,在获取到包含有环境噪音和用户语音的语音信号时,如何进行降噪处理,得到降噪的语音信号,仍是目前尚待解决的技术问题。
发明内容
本申请实施例的目的在于提出一种语音降噪方法、装置、计算机设备及存储介质,以解决语音降噪的技术问题。
为了解决上述技术问题,本申请实施例提供一种语音降噪方法,采用了如下所述的技术方案:
获取该第一麦克风采集的第一语音信号和该第二麦克风采集的第二语音信号,该第一语音信号和该第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,该第一麦克风和该第二麦克风处于同一场景下的不同位置;
利用该第一语音信号和该第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取该另一语音信号被抵消后剩余的第三语音信号;
对该第三语音信号进行放大处理,得到降噪语音信号。
为了解决上述技术问题,本申请实施例还提供一种语音降噪装置,采用了如下所述的技术方案:
该语音信号采集模块,用于获取该第一麦克风采集的第一语音信号和该第二麦克风采集的第二语音信号,该第一语音信号和该第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,该第一麦克风和该第二麦克风处于同一场景下的不同位置;
该滤波抵消模块,用于利用该第一语音信号和该第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取该另一语音信号被抵消后剩余的第三语音信号;
该语音信号放大模块,用于对该第三语音信号进行放大处理,得到降噪语音信号。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的语音降噪方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的语音降噪方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请实施例中,在获取到第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号后,可以利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号,其中该第一麦克风和第二麦克风处于同一场景下的不同位置。之后,对第三语音信号进行放大处理,得到降噪语音信号。
其中,本申请实施例所假定的语音信号中的噪音为加性噪声,即第一语音信号和所述第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成。由于大多情况下,环境噪声的噪音源距离设备一般比较远,且往往多个噪音源,而用户语音的声源比较近且只有一个,因此环境噪声较用户语音在空间中的分布更为均匀。基于此,可以认为第一语音信号中的环境噪声分量和第二语音信号中的环境噪声分量功率比较接近,而第一语音信号中的用户语音分量和第二语音信号中的用户语音分量功率差别较大。那么,通过抵消之后,可以认为麦克风所采集的语音信号中的环境噪声分量被完全或绝大多数抵消掉,而用户语音的分量则保留较多,即第三语音信号中,用户语音分量所占的比例相比原始的语音信号得到了提高。因此,再对其放大,从而可以得到较为准确的降噪语音信号。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1根据本申请的语音降噪方法的一个实施例的流程图;
图2是根据本申请的语音降噪装置的一个实施例的结构示意图;
图3是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
继续参考图1,示出了根据本申请的一种语音降噪方法的一个实施例的流程图。的语音降噪方法,包括以下步骤:
步骤S110,获取第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号,第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,第一麦克风和第二麦克风处于同一场景下的不同位置。
在本申请实施例中,语音降噪方法运行于其上的语音降噪设备,该语音降噪设备可以为具有语音交互功能的终端设备,例如,智能家居产品、智能汽车、手机、计算机等。在该语音降噪设备与第一麦克风和第二麦克风相连,分别用于采集不同位置的包含用户语音的带噪语音,并分别将各自的带噪语音转换为对应的电信号,即第一语音信号和第二语音信号。
进一步地,还需要说明的是,实际环境中的环境噪声因而其特性变化无穷,可以是加性的也可以是非加性的。而本发明应对的噪声是以工厂噪声、人的噪音以及汽车噪声等实际场景为主要对象,一般这些场景下的假设噪声是加性的、局部平稳的、噪声与语音统计独立或不相关。并且,考虑到加性噪声更普遍且易于分析问题,对于部分非加性噪声如乘积性噪声或卷积性噪声也可以通过同态变换而成为加性噪声,因此本申请实施例中仅讨论加性噪声,即第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,其带噪语音模型表达式如下述公式所示:
y(n)=s(n)+d(n)
其中,s(n)表示纯净的用户语音,d(n)表示噪声,y(n)表示麦克风采集的带噪语音。
步骤S120,利用该第一语音信号和该第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号。
在本申请实施例中,在得到第一语音信号和第二语音信号后,先检测第一语音信号和第二语音信号的功率大小。之后,根据干涉原理,可以利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,再获取另一语音信号被抵消后剩余的第三语音信号。其中,具体在进行滤波抵消时,假定第一语音信号的功率较低,则可以通过转换电路调节第一语音信号的电信号,以使第一语音信号中的声波振幅反向。之后,将调节后的第一语音信号的电信号与第二语音信号的电信号叠加,叠加之后的电信号,则即为第三语音信号。
步骤S130,对第三语音信号进行放大处理,得到降噪语音信号。
在本申请实施例中,在得到第三语音信号后,通过放大器对第三语音信号进行放大处理,增大第三语音信号的声波振幅和语音信号的功率,从而得到降噪语音信号。
在本申请实施例一些可能的实现方式中,在步骤S120,利用该第一语音信号和该第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号之后,该语音降噪方法还可以包括:确定第三语音信号的平均功率是否大于预设值;步骤S130,对第三语音信号进行放大处理,得到降噪语音信号,具体可以包括:若大于,则对第三语音信号进行放大处理,得到降噪语音信号
具体的,在一些情况下,第一语音信号和第二语音信号之间信号强度差别很小,例如,用户在第一麦克风和第二麦克风中间时,可能两个麦克风采集的用户语音信号的强度接近,则此时采集的第一语音信号和第二语音信号的强度差就会较小。那这种情况下,依旧采用滤波抵消的方法,可能效果不好。因此,在得到第三语音信号后,可以先检测第三语音信号的平均功率,在第三语音信号的平均功率大于预设值时,则执行步骤S130。
在本申请实施例一些可能的实现方式中,在上述:确定第三语音信号的平均功率是否大于预设值的步骤之后,该语音降噪方法还可以包括:若小于,则提取该第一语音信号或该第二语音信号中用户语音开始前的噪音;提取该噪音的统计特性,作为整段语音信号的噪音统计特性;根据该噪音统计特性从该第一语音信号或该第二语音信号中滤除噪声信号分量,得到该降噪语音信号。
本申请实施例中,假定第一语音信号和第二语音信号中的环境噪声是局部平稳的,局部平稳是指一段带噪语音中的噪声具有和语音开始前那段噪声相同的统计特性,且在整个语音段中保持不变,也就是说可以根据语音开始前那段噪声来估计语音中所叠加的噪声统计特性。基于上述假设,可以在语音降噪设备中设置一个具有二输入端的自适应滤波器,运行在参考传感器输入端的自适应滤波器用于根据第一语音信号或者第二语音信号估计噪声信号分量,然后从第一语音信号或者第二语音信号中减去该噪声估值,从而得到降噪语音信号。具体的,可以提取第一语音信号或者第二语音信号中,用户语音信号前的一部分声音信号作为噪音信号。之后,提取该段噪音的统计特性作为整段语音信号中的噪音统计特性,统计特性可以包括噪音的频率、振幅、功率等相关参数信息。最后,将该段噪音的统计特性信息输入自适应滤波器,对第一语音信号或者第二语音信号进行滤波处理,滤除噪声信号分量,从而得到降噪语音信号。
在本申请实施例一些可能的实现方式中,步骤S130,对第三语音信号进行放大处理,得到降噪语音信号,可以包括:过滤掉第三语音信号中频率不在预设范围内的语音分量,并对过滤剩余的语音分量进行放大处理,得到降噪语音信号,其中,预设范围为预设的人类语音的频率范围。
具体的,噪声信号的频率与用户语音信号的频率往往不在同一范围内。因此,为在得到第三语音信号后,还可以先对第三语音信号进行时频转换,过滤掉第三语音信号中,频率不在预设范围内的语音分量。之后,再进行放大处理,从而得到降噪语音信号。其中,预设的频率范围为预设的人类语音的频率范围。
在本申请实施例一些可能的实现方式中,步骤S130,对第三语音信号进行放大处理,得到降噪语音信号,可以包括:对第三语音信号进行放大处理,并过滤掉放大后第三语音信号中频率不在预设范围内的语音分量,确定剩余的语音分量为降噪语音信号,其中,预设范围为预设的人类语音的频率范围。
具体的,噪声信号的频率与用户语音信号的频率往往不在同一范围内。因此在得到第三语音信号后,还可以先对第三语音信号进行放大处理。之后,对第三语音信号进行时频转换,过滤掉第三语音信号中,频率不在预设范围内的语音分量,从而得到降噪语音信号。其中,预设的频率范围为预设的人类语音的频率范围。
在本申请实施例一些可能的实现方式中,在步骤S110,获取第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号,第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成的步骤之前,该语音降噪方法还可以包括:在检测到与用户之间的距离小于预设值时,同时启动第一麦克风和第二麦克风。
具体的,可以在该语音降噪设备中设置位置传感器,其在检测到与用户的距离小于预设值时,启动第一麦克风和第二麦克风,避免麦克风一直启用所带来的功耗问题。
在本申请实施例一些可能的实现方式中,在上述得到降噪语音信号之后,该语音降噪方法还可以包括:将该降噪语音信号转换为语音指令或文字。
本申请实施例中,由于语音降噪设备可以是智能家居产品、智能汽车、手机、计算机等设备,因此在得到降噪语音信号后,还可以通过语音识别模块,将该降噪语音信号转换为语音指令或文字,以使设备可以根据该语音指令执行后续操作,实现用户与设备之间的语音交互功能。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请实施例中,在获取到第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号后,可以利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号,其中该第一麦克风和第二麦克风处于同一场景下的不同位置。之后,对第三语音信号进行放大处理,得到降噪语音信号。
其中,本申请实施例所假定的语音信号中的噪音为加性噪声,即第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成。由于大多情况下,环境噪声的噪音源距离设备一般比较远,且往往多个噪音源,而用户语音的声源比较近且只有一个,因此环境噪声较用户语音在空间中的分布更为均匀。基于此,可以认为第一语音信号中的环境噪声分量和第二语音信号中的环境噪声分量功率比较接近,而第一语音信号中的用户语音分量和第二语音信号中的用户语音分量功率差别较大。那么,通过抵消之后,可以认为麦克风所采集的语音信号中的环境噪声分量被完全或绝大多数抵消掉,而用户语音的分量则保留较多,即第三语音信号中,用户语音分量所占的比例相比原始的语音信号得到了提高。因此,再对其放大,从而可以得到较为准确的降噪语音信号。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图2,作为对上述图1所示方法的实现,本申请提供了一种语音降噪装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图2所示,本实施例所述的语音降噪装置200包括:
语音信号采集模块210,用于获取该第一麦克风采集的第一语音信号和该第二麦克风采集的第二语音信号,该第一语音信号和该第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,该第一麦克风和该第二麦克风处于同一场景下的不同位置;
滤波抵消模块220,用于利用该第一语音信号和该第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取该另一语音信号被抵消后剩余的第三语音信号;
语音信号放大模块230,用于对该第三语音信号进行放大处理,得到降噪语音信号。
在本申请实施例一些可能的实现方式中,语音降噪装置200还包括:
判断模块,用于确定该第三语音信号的平均功率是否大于预设值;
语音信号放大模块230,具体用于若大于,则对该第三语音信号进行放大处理,得到降噪语音信号。
在本申请实施例一些可能的实现方式中,语音降噪装置200还包括:
噪声提取模块,用于若小于,则提取该第一语音信号或该第二语音信号中用户语音开始前的噪音;提取该噪音的统计特性,作为整段语音信号的噪音统计特性;
噪声滤除模块,用于根据该噪音统计特性从该第一语音信号或该第二语音信号中滤除噪声信号分量,得到该降噪语音信号。
在本申请实施例一些可能的实现方式中,语音信号放大模块230,具体用于过滤掉该第三语音信号中频率不在预设范围内的语音分量,并对过滤剩余的语音分量进行放大处理,得到该降噪语音信号,其中,该预设范围为预设的人类语音的频率范围。
在本申请实施例一些可能的实现方式中,语音信号放大模块230,具体用于对该第三语音信号进行放大处理,并过滤掉放大后该第三语音信号中频率不在预设范围内的语音分量,确定剩余的语音分量为该降噪语音信号,其中,该预设范围为预设的人类语音的频率范围。
在本申请实施例一些可能的实现方式中,语音降噪装置200还包括:
启动模块,用于在检测到与用户之间的距离小于预设值时,同时启动该第一麦克风和该第二麦克风。
在本申请实施例一些可能的实现方式中,语音降噪装置200还包括:
转换模块,用于将该降噪语音信号转换为语音指令或文字。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请实施例中,在获取到第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号后,可以利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号,其中该第一麦克风和第二麦克风处于同一场景下的不同位置。之后,对第三语音信号进行放大处理,得到降噪语音信号。
其中,本申请实施例所假定的语音信号中的噪音为加性噪声,即第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成。由于大多情况下,环境噪声的噪音源距离设备一般比较远,且往往多个噪音源,而用户语音的声源比较近且只有一个,因此环境噪声较用户语音在空间中的分布更为均匀。基于此,可以认为第一语音信号中的环境噪声分量和第二语音信号中的环境噪声分量功率比较接近,而第一语音信号中的用户语音分量和第二语音信号中的用户语音分量功率差别较大。那么,通过抵消之后,可以认为麦克风所采集的语音信号中的环境噪声分量被完全或绝大多数抵消掉,而用户语音的分量则保留较多,即第三语音信号中,用户语音分量所占的比例相比原始的语音信号得到了提高。因此,再对其放大,从而可以得到较为准确的降噪语音信号。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图3,图3为本实施例计算机设备基本结构框图。
所述计算机设备300包括通过系统总线相互通信连接存储器310、处理器320、网络接口330。需要指出的是,图中仅示出了具有组件310-330的计算机设备300,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器310至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器310可以是所述计算机设备300的内部存储单元,例如该计算机设备300的硬盘或内存。在另一些实施例中,所述存储器310也可以是所述计算机设备300的外部存储设备,例如该计算机设备300上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器310还可以既包括所述计算机设备300的内部存储单元也包括其外部存储设备。本实施例中,所述存储器310通常用于存储安装于所述计算机设备300的操作系统和各类应用软件,例如语音降噪方法的计算机可读指令等。此外,所述存储器310还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器320在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器320通常用于控制所述计算机设备300的总体操作。本实施例中,所述处理器320用于运行所述存储器310中存储的计算机可读指令或者处理数据,例如运行所述语音降噪方法的计算机可读指令。
所述网络接口330可包括无线网络接口或有线网络接口,该网络接口330通常用于在所述计算机设备300与其他电子设备之间建立通信连接。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请实施例中,计算机设备300在执行上述的语音降噪方法时,在获取到第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号后,可以利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号,其中该第一麦克风和第二麦克风处于同一场景下的不同位置。之后,对第三语音信号进行放大处理,得到降噪语音信号。
其中,本申请实施例所假定的语音信号中的噪音为加性噪声,即第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成。由于大多情况下,环境噪声的噪音源距离设备一般比较远,且往往多个噪音源,而用户语音的声源比较近且只有一个,因此环境噪声较用户语音在空间中的分布更为均匀。基于此,可以认为第一语音信号中的环境噪声分量和第二语音信号中的环境噪声分量功率比较接近,而第一语音信号中的用户语音分量和第二语音信号中的用户语音分量功率差别较大。那么,通过抵消之后,可以认为麦克风所采集的语音信号中的环境噪声分量被完全或绝大多数抵消掉,而用户语音的分量则保留较多,即第三语音信号中,用户语音分量所占的比例相比原始的语音信号得到了提高。因此,再对其放大,从而可以得到较为准确的降噪语音信号。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的语音降噪方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请实施例中,计算机可读指令被处理器执行时,在获取到第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号后,可以利用第一语音信号和第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号,其中该第一麦克风和第二麦克风处于同一场景下的不同位置。之后,对第三语音信号进行放大处理,得到降噪语音信号。
其中,本申请实施例所假定的语音信号中的噪音为加性噪声,即第一语音信号和第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成。由于大多情况下,环境噪声的噪音源距离设备一般比较远,且往往多个噪音源,而用户语音的声源比较近且只有一个,因此环境噪声较用户语音在空间中的分布更为均匀。基于此,可以认为第一语音信号中的环境噪声分量和第二语音信号中的环境噪声分量功率比较接近,而第一语音信号中的用户语音分量和第二语音信号中的用户语音分量功率差别较大。那么,通过抵消之后,可以认为麦克风所采集的语音信号中的环境噪声分量被完全或绝大多数抵消掉,而用户语音的分量则保留较多,即第三语音信号中,用户语音分量所占的比例相比原始的语音信号得到了提高。因此,再对其放大,从而可以得到较为准确的降噪语音信号。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (8)

1.一种语音降噪方法,其特征在于,所述语音降噪方法包括下述步骤:
获取第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号,所述第一语音信号和所述第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,所述第一麦克风和所述第二麦克风处于同一场景下的不同位置;
比较所述第一语音信号和所述第二语音信号的信号功率大小,利用所述第一语音信号和所述第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取所述另一语音信号被抵消后剩余的第三语音信号,其中,所述另一语音信号为所述第一语音信号和所述第二语音信号中信号功率较大的语音信号;
对所述第三语音信号进行放大处理,得到降噪语音信号;
所述利用所述第一语音信号和所述第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取另一语音信号被抵消后剩余的第三语音信号的步骤之后,所述语音降噪方法还包括:
确定所述第三语音信号的平均功率是否大于预设值;
所述对所述第三语音信号进行放大处理,得到降噪语音信号的步骤,包括:
若大于,则对所述第三语音信号进行放大处理,得到降噪语音信号;
所述确定所述第三语音信号的平均功率是否大于预设值的步骤之后,所述语音降噪方法还包括:
若小于,则提取所述第一语音信号或所述第二语音信号中用户语音开始前的噪音;
提取所述噪音的统计特性,作为整段语音信号的噪音统计特性;
根据所述噪音统计特性从所述第一语音信号或所述第二语音信号中滤除噪声信号分量,得到所述降噪语音信号。
2.根据权利要求1所述的语音降噪方法,其特征在于,所述对所述第三语音信号进行放大处理,得到降噪语音信号的步骤,具体包括:
过滤掉所述第三语音信号中频率不在预设范围内的语音分量,并对过滤剩余的语音分量进行放大处理,得到所述降噪语音信号,其中,所述预设范围为预设的人类语音的频率范围。
3.根据权利要求1所述的语音降噪方法,其特征在于,所述对所述第三语音信号进行放大处理,得到降噪语音信号的步骤,具体包括:
对所述第三语音信号进行放大处理,并过滤掉放大后所述第三语音信号中频率不在预设范围内的语音分量,确定剩余的语音分量为所述降噪语音信号,其中,所述预设范围为预设的人类语音的频率范围。
4.根据权利要求1所述的语音降噪方法,其特征在于,所述获取所述第一麦克风采集的第一语音信号和所述第二麦克风采集的第二语音信号的步骤之前,所述语音降噪方法还包括:
在检测到与用户之间的距离小于预设值时,同时启动所述第一麦克风和所述第二麦克风。
5.根据权利要求1所述的语音降噪方法,其特征在于,在所述得到所述降噪语音信号的步骤之后,所述语音降噪方法还包括:
将所述降噪语音信号转换为语音指令或文字。
6.一种语音降噪装置,其特征在于,所述语音降噪装置包括:
语音信号采集模块,用于获取第一麦克风采集的第一语音信号和第二麦克风采集的第二语音信号,所述第一语音信号和所述第二语音信号均由线性叠加的用户语音信号和环境噪声信号组成,所述第一麦克风和所述第二麦克风处于同一场景下的不同位置;
滤波抵消模块,用于比较所述第一语音信号和所述第二语音信号的信号功率大小,利用所述第一语音信号和所述第二语音信号中信号功率较小的语音信号对另一语音信号进行滤波抵消,获取所述另一语音信号被抵消后剩余的第三语音信号,其中,所述另一语音信号为所述第一语音信号和所述第二语音信号中信号功率较大的语音信号;
语音信号放大模块,用于对所述第三语音信号进行放大处理,得到降噪语音信号;
所述语音降噪装置还包括:
判断模块,用于确定所述第三语音信号的平均功率是否大于预设值;
所述对所述第三语音信号进行放大处理,得到降噪语音信号的步骤,包括:
语音信号放大模块,用于若大于,则对所述第三语音信号进行放大处理,得到降噪语音信号;
所述语音降噪装置还包括:
噪声提取模块,用于若小于,则提取所述第一语音信号或所述第二语音信号中用户语音开始前的噪音;提取所述噪音的统计特性,作为整段语音信号的噪音统计特性;
噪声滤除模块,用于根据所述噪音统计特性从所述第一语音信号或所述第二语音信号中滤除噪声信号分量,得到所述降噪语音信号。
7.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的语音降噪方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的语音降噪方法的步骤。
CN202110618936.0A 2021-06-03 2021-06-03 语音降噪方法、装置、计算机设备及存储介质 Active CN113539284B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110618936.0A CN113539284B (zh) 2021-06-03 2021-06-03 语音降噪方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110618936.0A CN113539284B (zh) 2021-06-03 2021-06-03 语音降噪方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113539284A CN113539284A (zh) 2021-10-22
CN113539284B true CN113539284B (zh) 2023-12-29

Family

ID=78095520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110618936.0A Active CN113539284B (zh) 2021-06-03 2021-06-03 语音降噪方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113539284B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849231B1 (en) * 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
CN107742523A (zh) * 2017-11-16 2018-02-27 广东欧珀移动通信有限公司 语音信号处理方法、装置以及移动终端
CN109448718A (zh) * 2018-12-11 2019-03-08 广州小鹏汽车科技有限公司 一种基于多麦克风阵列的语音识别方法及系统
CN109686378A (zh) * 2017-10-13 2019-04-26 华为技术有限公司 语音处理方法和终端
WO2019227590A1 (zh) * 2018-05-29 2019-12-05 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012786A1 (en) * 2007-07-06 2009-01-08 Texas Instruments Incorporated Adaptive Noise Cancellation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849231B1 (en) * 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
CN109686378A (zh) * 2017-10-13 2019-04-26 华为技术有限公司 语音处理方法和终端
CN107742523A (zh) * 2017-11-16 2018-02-27 广东欧珀移动通信有限公司 语音信号处理方法、装置以及移动终端
WO2019227590A1 (zh) * 2018-05-29 2019-12-05 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN109448718A (zh) * 2018-12-11 2019-03-08 广州小鹏汽车科技有限公司 一种基于多麦克风阵列的语音识别方法及系统

Also Published As

Publication number Publication date
CN113539284A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
US20210327448A1 (en) Speech noise reduction method and apparatus, computing device, and computer-readable storage medium
CN107644642B (zh) 语义识别方法、装置、存储介质及电子设备
KR102159217B1 (ko) 전자장치, 신분 검증 방법, 시스템 및 컴퓨터 판독 가능한 저장매체
US11295760B2 (en) Method, apparatus, system and storage medium for implementing a far-field speech function
CN109920419B (zh) 语音控制方法和装置、电子设备及计算机可读介质
CN108335694B (zh) 远场环境噪声处理方法、装置、设备和存储介质
CN107507621B (zh) 一种噪声抑制方法及移动终端
CN104575509A (zh) 语音增强处理方法及装置
CN110970051A (zh) 语音数据采集方法、终端及可读存储介质
CN110808030A (zh) 语音唤醒方法、系统、存储介质及电子设备
CN111445918B (zh) 降低智能语音设备误唤醒的方法、装置和计算机设备
CN111722696B (zh) 用于低功耗设备的语音数据处理方法和装置
CN110782884B (zh) 远场拾音噪声处理方法、装置、设备及存储介质
CN112311635A (zh) 语音打断唤醒方法、装置及计算机可读存储介质
CN111326146A (zh) 语音唤醒模板的获取方法、装置、电子设备及计算机可读存储介质
CN113539284B (zh) 语音降噪方法、装置、计算机设备及存储介质
KR102220964B1 (ko) 오디오 인식을 위한 방법 및 디바이스
CN112634922A (zh) 语音信号处理方法、设备及计算机可读存储介质
CN112289311A (zh) 语音唤醒方法、装置、电子设备及存储介质
CN116312545A (zh) 多噪声环境下的语音识别系统和方法
CN112233676A (zh) 智能设备唤醒方法、装置、电子设备及存储介质
CN111210817A (zh) 数据处理方法及装置
CN112740321A (zh) 唤醒设备的方法、装置、存储介质及电子设备
CN113436613A (zh) 语音识别方法、装置、电子设备及存储介质
CN114333817A (zh) 遥控器及遥控器语音识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant