CN111785290B - 麦克风阵列语音信号处理方法、装置、设备及存储介质 - Google Patents

麦克风阵列语音信号处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111785290B
CN111785290B CN202010423562.2A CN202010423562A CN111785290B CN 111785290 B CN111785290 B CN 111785290B CN 202010423562 A CN202010423562 A CN 202010423562A CN 111785290 B CN111785290 B CN 111785290B
Authority
CN
China
Prior art keywords
initial
voice signals
path
delay value
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010423562.2A
Other languages
English (en)
Other versions
CN111785290A (zh
Inventor
季海交
胡小辉
陈桥红
黄维
张涛磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tendzone Intelligent Technology Co ltd
Original Assignee
Shenzhen Tendzone Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tendzone Intelligent Technology Co ltd filed Critical Shenzhen Tendzone Intelligent Technology Co ltd
Priority to CN202010423562.2A priority Critical patent/CN111785290B/zh
Publication of CN111785290A publication Critical patent/CN111785290A/zh
Application granted granted Critical
Publication of CN111785290B publication Critical patent/CN111785290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种麦克风阵列语音信号处理方法、装置、设备及计算机可读存储介质,该方法包括步骤:通过麦克风阵列获取N路的初始语音信号,其中,N为正整数;根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对初始语音信号进行处理,得到N路的中间语音信号;将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号,改变了对语音信号处理的方法,提供的语音信号处理方法中对初始语音信号的延时矫正涉及到的计算简单,且计算量低,加快了音频处理器对初始语音信号处理的速度,子带技术有效抑制了声反馈。

Description

麦克风阵列语音信号处理方法、装置、设备及存储介质
技术领域
本发明涉及信号处理技术领域,尤其涉及一种麦克风阵列语音信号处理方法、装置、设备及存储介质。
背景技术
麦克风阵列由一定数目的声学传感器组成,用来对声场的声音特性进行采样并处理的系统。目前对声音特性进行处理的算法主要包括AGC(Automatic Gain Control,自动增益制算法)、AEC(Automatic Echo Control,自动回声抑制算法)、AFC(AutomaticFeedback Control,自动反馈控制算法)、ANS(Automatic Noise Suppression,自动噪声抑制算法)和AM(Automatic Mixer,自动混音处理算法)等,这些算法的应用非常广泛和成熟,但是由于这些算法的运算量非常大,运算比较复杂,对声音特性的处理造成了很大的延时。
发明内容
本发明的主要目的在于提出一种麦克风阵列语音信号处理方法、装置、设备及计算机可读存储介质,旨在解决现有技术对声音信号处理慢的技术问题。
为实现上述目的,本发明提供了一种麦克风阵列语音信号处理方法,所述麦克风阵列语音信号处理方法包括:
通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数;
根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号;
将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号。
可选地,所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤包括:
根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值,其中,所述M为正整数,且小于所述N;
判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围;
若否,则向所述中间延时值和第N路所述初始语音信号的初始延时值持续增加预设时间单元,直至所述中间延时值和第N路所述初始语音信号的初始延时值处于所述预设零门限范围,并将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
可选地,所述判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围的步骤之后,还包括:
若是,则将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
可选地,所述根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路所述初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值的步骤包括:
计算第M-1路和第M+1路所述初始语音信号的初始延时值的差的绝对值;
求取所述差的绝对值的二分之一与第M路所述初始语音信号的所述初始延时值的和,将所述和确定为第M路所述初始语音信号的中间延时值,得到N-2路所述初始语音信号的所述中间延时值。
可选地,所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤之前,还包括:
对每路所述初始语音信号进行高通滤波处理,去除所述初始语音信号中频率小于预设频率的采样点,以去除所述初始语音信号中的低频信号。
可选地,所述将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号的步骤包括:
将N路的中间语音信号进行累加,利用子带技术对累加后的中间语音信号进行分解,得到多段子带频段;
调整所述子带频段的频响曲线,并将调整后的所述子带频段重构,得到合成语音信号。
可选地,所述麦克风阵列语音信号处理方法还包括以下步骤:
通过所述麦克风阵列获取环境噪声信号,并利用子带技术对所述环境噪声信号进行分解和重构,得到合成噪声信号;
生成与所述合成噪声信号的相位相反的反向合成噪声信号;
通过加法器将所述合成语音信号和所述反向合成噪声信号累加,得到目标语音信号。
此外,为实现上述目的,本发明还提供一麦克风阵列语音信号处理装置,所述麦克风阵列语音信号处理装置包括:
获取模块,用于通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数;
矫正模块,用于根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号;
累加模块,用于将N路的中间语音信号进行累加;
处理模块,用于利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号。
此外,为实现上述目的,本发明还提供一种麦克风阵列语音信号处理设备,所述麦克风阵列语音信号处理设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的麦克风阵列语音信号处理程序,所述麦克风阵列语音信号处理程序被所述处理器执行时实现如上所述的麦克风阵列语音信号处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有麦克风阵列语音信号处理程序,所述麦克风阵列语音信号处理程序被处理器执行时实现如上文所述的麦克风阵列语音信号处理方法的步骤。
本发明通过麦克风阵列获取N路的初始语音信号,根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对初始语音信号进行处理,得到N路的中间语音信号,再将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号,改变了对语音信号处理的方法,不用进行如AGC、AEC等算法的复杂运算,且本实施例提供的语音信号处理方法中对初始语音信号的延时矫正涉及到的计算简单,且计算量低,加快了音频处理器对初始语音信号处理的速度,子带技术起到有效抑制声反馈的作用。
附图说明
图1为实现本发明各个实施例一种终端的硬件结构示意图;
图2为本发明麦克风阵列语音信号处理方法第一实施例的第一流程示意图;
图3为本发明麦克风阵列语音信号处理方法第一实施例步骤的的细化步骤流程示意图;
图4为本发明麦克风阵列语音信号处理方法第一实施例的新增步骤流程示意图;
图5为本发明麦克风阵列语音信号处理方法第四实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种麦克风阵列语音信号处理设备,参照图1,图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图1即可为麦克风阵列语音信号处理设备的硬件运行环境的结构示意图。本发明实施例麦克风阵列语音信号处理设备可以是PC,便携计算机,服务器等设备。
如图1所示,该麦克风阵列语音信号处理设备可以包括:处理器1001,例如CPU,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,麦克风阵列语音信号处理设备还可以包括RF(Radio Frequency,射频)电路,传感器、WiFi模块等等。
本领域技术人员可以理解,图1中示出的麦克风阵列语音信号处理设备结构并不构成麦克风阵列语音信号处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及麦克风阵列语音信号处理程序。其中,操作系统是管理和控制麦克风阵列语音信号处理设备硬件和软件资源的程序,支持麦克风阵列语音信号处理程序以及其它软件或程序的运行。
图1所示的麦克风阵列语音信号处理设备,可用于数据的交互,用户接口1003主要用于侦测或者输出各种信息,如侦测初始语音信号和输出目标语音信号等;网络接口1004主要用于与后台服务器交互,进行通信;处理器1001可以用于调用存储器1005中存储的麦克风阵列语音信号处理程序,并执行以下操作:
通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数;
根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号;
将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号。
进一步地,所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤包括:
根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值,其中,所述M为正整数,且小于所述N;
判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围;
若否,则向所述中间延时值和第N路所述初始语音信号的初始延时值持续增加预设时间单元,直至所述中间延时值和第N路所述初始语音信号的初始延时值处于所述预设零门限范围,并将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
进一步地,所述判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围的步骤之后,处理器1001可以用于调用存储器1005中存储的麦克风阵列语音信号处理程序,并执行以下操作:
若是,则将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
进一步地,所述根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路所述初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值的步骤包括:
计算第M-1路和第M+1路所述初始语音信号的初始延时值的差的绝对值;
求取所述差的绝对值的二分之一与第M路所述初始语音信号的所述初始延时值的和,将所述和确定为第M路所述初始语音信号的中间延时值,得到N-2路所述初始语音信号的所述中间延时值。
进一步地,所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤之前,处理器1001可以用于调用存储器1005中存储的麦克风阵列语音信号处理程序,并执行以下操作:
对每路所述初始语音信号进行高通滤波处理,去除所述初始语音信号中频率小于预设频率的采样点,以去除所述初始语音信号中的低频信号。
进一步地,所述将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号的步骤包括:
将N路的中间语音信号进行累加,利用子带技术对累加后的中间语音信号进行分解,得到多段子带频段;
调整所述子带频段的频响曲线,并将调整后的所述子带频段重构,得到合成语音信号。
进一步地,处理器1001可以用于调用存储器1005中存储的麦克风阵列语音信号处理程序,并执行以下操作:
通过所述麦克风阵列获取环境噪声信号,并利用子带技术对所述环境噪声信号进行分解和重构,得到合成噪声信号;
生成与所述合成噪声信号的相位相反的反向合成噪声信号;
通过加法器将所述合成语音信号和所述反向合成噪声信号累加,得到目标语音信号。
本发明麦克风阵列语音信号处理设备具体实施方式与下述麦克风阵列语音信号处理方法各实施例基本相同,在此不再赘述。
基于上述结构,提出本发明麦克风阵列语音信号处理方法的各个实施例。
本发明提供一种麦克风阵列语音信号处理方法。
参照图2,图2为本发明麦克风阵列语音信号处理方法第一实施例的第一流程示意图。
在本实施例中,提供了麦克风阵列语音信号处理方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中,麦克风阵列语音信号处理方法包括:
步骤S10,通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数。
麦克风阵列由多个麦克风组构成,每个麦克风组至少含有两个麦克风,其中一个麦克风组用于获取环境噪声信号,剩余的几个麦克风组排成一列,获取环境噪声信号的麦克风组位于该一列麦克风组背面且居中的位置。
通过一列麦克风组获取多路的初始语音信号。若一列麦克风组含有N个麦克风组,则该一列麦克风组可获取N路初始语音信号,每个麦克风组获取一路初始语音信号,其中,N为正整数。例如,一列麦克风组含有7个麦克风组,可获取7路初始语音信号。
步骤S20,根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号。
由于每个麦克风距离声源的远近不同,每个麦克风获取到的初始语音信号的时间有所不同,也就是说每路初始语音信号的初始延时值不相同。为了增强麦克风阵列输出声音的效果,N路初始语音信号必须具有同时性,所以必须对N路初始语音信号的初始延时值进行矫正,对N路初始语音信号的初始延时值进行矫正处理后,将初始延时值矫正处理后的初始语音信号确定为N路的中间语音信号。
进一步地,参照图3,步骤S20还包括:
步骤S21,根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值,其中,所述M为正整数,且小于所述N。
若初始语音信号有N路,每路初始语音信号均有初始延时值,初始延时值越大表示麦克风组获取初始语音信号越迟。可以理解的是,最迟获取初始语音信号的麦克风组和最早获取初始语音信号的麦克风组始终是麦克风阵列中一列麦克风组的两侧第一个麦克风组中的其中一个。在下列陈述中,将最迟获取到的初始语音信号称为第一路初始语音信号,最早获取到的初始语音信号称为第N路初始语音信号。
第M路、第M-1路和第M+1路初始语音信号均是N路初始语音信号中的一路,可以理解的是,M是不等于1且小于N的正整数。
根据与第M路初始语音信号的相邻两路初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,将矫正后的初始延时值视作中间延时值。由于第一路初始语音信号与第N路初始语音信号均只有一路的相邻的初始语音信号,所以只能得到N-2路初始语音信号的中间延时值,第一路初始语音信号和第N路初始语音信号没有经过矫正。
例如,当N=7时,M的取值可以为2、3、4、5、6,第1路初始语音信号的初始延时值最大,第7路初始语音信号的初始延时值最小,可以根据第1路和第3路初始语音信号的初始延时值矫正第2路初始语音信号的初始延时值,得到第2路初始语音信号的中间延时值,同样的,可以得到第3路、第4路、第5路和第6路初始语音信号的中间延时值。
进一步地,步骤S21还包括:
步骤a,计算第M-1路和第M+1路所述初始语音信号的初始延时值的差的绝对值;
步骤b,求取所述差的绝对值的二分之一与第M路所述初始语音信号的所述初始延时值的和,将所述和确定为第M路所述初始语音信号的中间延时值,得到N-2路所述初始语音信号的所述中间延时值。
将第M-1路初始语音信号的初始延时值减去第M+1路初始语音信号的初始延时值,取所得结果的绝对值,也就是计算第M-1路和第M+1路初始语音信号的初始延时值的差的绝对值。
取上述求到的差的绝对值的二分之一与第M路初始语音信号的初始延时值的和,,并将该和确定为第M路初始语音信号的中间延时值,可以得到N-2路初始语音信号的中间延时值,例如,当N=7时,可以确定第2、3、4、5、6路初始语音信号的中间延时值。
步骤S22,判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围。
预设零门限范围是一个数值范围,一般将预设零门限范围设置为包含最大初始延时值的数值范围,最大初始延时值即为第1路初始语音信号的初始延时值,,例如,最大初始延时值为0.05毫秒(ms),预设零门限范围可以是0.049ms~0.051ms。判断N-2路初始语音信号的中间延时值和第N路初始语音信号的初始延时值是否在预设零门限范围内
步骤S23,若否,则向所述中间延时值和第N路所述初始语音信号的初始延时值持续增加预设时间单元,直至所述中间延时值和第N路所述初始语音信号的初始延时值处于所述预设零门限范围,并将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
若判断出N-2路初始语音信号的中间延时值或者第N路初始语音信号的初始延时值不在预设零门限范围内,则说明对初始延时值的矫正并不成功,还需要做进一步的矫正。需要说明的是,当N-2路初始语音信号中至少一路初始语音信号的中间延时值不在预设零门限范围内,都可以认为是N-2路初始语音信号的中间延时值不在预设零门限范围内,也就是说只有当每路初始语音信号的中间延时值均在预设零门限范围内,才能认为N-2路初始语音信号的中间延时值在预设零门限范围内,否则均认为N-2路初始语音信号的中间延时值不在预设零门限范围内。
当判断出N-2路初始语音信号的中间延时值或者第N路初始语音信号的初始延时值不在预设零门限范围内时,需要对所有中间延时值和第N路初始语音信号的初始延时值进行进一步地矫正。向中间延时值和第N路初始语音信号的初始延时值持续增加预设时间单元,直至所有的中间延时值和第N路初始语音信号的初始延时值处于预设零门限范围,将此时中间延时值对应的初始语音信号、第一路初始语音信号和第N路初始语音信号确定为中间语音信号。预设时间单元是麦克风组对初始语音信号进行采样时设定的采样率的倒数。
进一步地,参照图4,步骤S22之后,还包括:
步骤S24,若是,则将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
当判断出N-2路初始语音信号的中间延时值或者第N路初始语音信号的初始延时值在预设零门限范围内时,将此时的中间延时值对应的初始语音信号、第一路初始语音信号和第N路初始语音信号确定为中间语音信号。
步骤S30,将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号。
对N路的中间语音信号进行累加,合并成一路语音信号,利用子带技术对该一路语音信号进行处理,得到合成语音信号,该合成语音信号有更好的频响特性,可有效抑制声反馈,防止输出合成语音信号后有啸叫的情况出现。
本实施例通过麦克风阵列获取N路的初始语音信号,根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对初始语音信号进行处理,得到N路的中间语音信号,再将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号,改变了对语音信号处理的方法,不用进行如AGC、AEC等算法的复杂运算,且本实施例提供的语音信号处理方法中对初始语音信号的延时矫正涉及到的计算简单,且计算量低,加快了音频处理器对初始语音信号处理的速度,子带技术可有效抑制声反馈。
进一步地,提出本发明麦克风阵列语音信号处理方法的第二实施例。麦克风阵列语音信号处理方法的第二实施例与麦克风阵列语音信号处理方法的第一实施例的区别在于,所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤之前,还包括:
步骤c,对每路所述初始语音信号进行高通滤波处理,去除所述初始语音信号中频率小于预设频率的采样点,以去除所述初始语音信号中的低频信号。
高通滤波处理可去除初始语音信号中低频语音信号,使得输出的语音信号有更大的响度,预设频率可以由研究人员或用户设定,一般的可以设置为100HZ(赫兹)、80HZ等。
对每路初始语音信号进行高通滤波处理,去除初始语音信号中频率低与预设频率的采样点,以去除初始语音信号中的低频信号,使得输出的语音信号的响度更大。
本实施例通过对每路初始语音信号进行高通滤波处理,去除初始语音信号中频率小于预设频率的采样点,以去除初始语音信号中的低频信号,提高输出的语音信号的响度,进一步地可提高用户的体验感。
进一步地,提出本发明麦克风阵列语音信号处理方法的第三实施例。麦克风阵列语音信号处理方法的第三实施例与麦克风阵列语音信号处理方法的第一或第二实施例的区别在于,所述将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号的步骤包括:
步骤d,将N路的中间语音信号进行累加,利用子带技术对累加后的中间语音信号进行分解,得到多段子带频段。
对N路的中间语音信号进行累加,可以理解,累加之后得到一路的语音信号,再利用子带技术对累加后的中间语音信号进行分解,得到18段子带频段。
步骤e,调整所述子带频段的频响曲线,并将调整后的所述子带频段重构,得到合成语音信号。
将18段子带频段中的最后一段子带,也就是频率最高的子带频段通过高通滤波器,将第一段至第十七段子带频段通过带通滤波器,以调整所有子带频段的频响曲线的增益,使得子带频段的频响曲线更加的平坦,有更优的频响特性,将调整后的子带频段重构,形成合成语音信号,合成语音信号是成形的波束,该波束中的每一路语音信号方向相同。
本实施例通过利用子带技术对累加后的中间语音信号进行分解和重构,得到一路合成语音信号,可有效抑制声反馈,进一步的提升用户的体验感。
进一步地,提出本发明麦克风阵列语音信号处理方法的第四实施例,参照图5。麦克风阵列语音信号处理方法的第四实施例与麦克风阵列语音信号处理方法的第一、第二实施例或第三实施例的区别在于,所述麦克风阵列语音信号处理方法还包括以下步骤:
步骤S40,通过所述麦克风阵列获取环境噪声信号,并利用子带技术对所述环境噪声信号进行分解和重构,得到合成噪声信号。
麦克分阵列中一列麦克风组的背面且居中的位置放置的麦克风组用于获取环境噪声信号,同样的利用子带技术对环境噪声信号进行分解和重构,得到一路平坦的合成噪声信号。
步骤S50,生成与所述合成噪声信号的相位相反的反向合成噪声信号。
根据合成噪声信号的相位和幅值生成与合成噪声信号相位相反,幅值相同的反向合成噪声信号。
步骤S60,通过加法器将所述合成语音信号和所述反向合成噪声信号累加,得到目标语音信号。
在加法器中,将合成语音信号和反向合成噪声信号累加,以去除合成语音信号中的环境噪声信号,提高输出的声音的质量。
本实施例通过麦克风阵列获取环境噪声信号,并利用子带技术对环境噪声信号进行分解和重构,得到合成噪声信号,再生成与合成噪声信号相对应的反向合成噪声信号,通过加法器将合成语音信号与反向合成噪声信号累加,去除合成语音信号中的环境噪声信号,提高输出语音的质量,进一步地提升用户的体验感。
此外,为实现上述目的,本发明还提供一种麦克风阵列语音信号处理装置,所述麦克风阵列语音信号处理装置包括:
获取模块,用于通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数;
矫正模块,用于根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号;
累加模块,用于将N路的中间语音信号进行累加;
处理模块,用于利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号。
进一步地,所述矫正模块还包括:
矫正单元,用于根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值,其中,所述M为正整数,且小于所述N;
判断单元,用于判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围;
增加单元,用于若否,则向所述中间延时值和第N路所述初始语音信号的初始延时值持续增加预设时间单元,直至所述中间延时值和第N路所述初始语音信号的初始延时值处于所述预设零门限范围;
确定单元,用于将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
所述确定单元还用于若是,则将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
进一步地,所述矫正单元还包括:
计算子单元,用于计算第M-1路和第M+1路所述初始语音信号的初始延时值的差的绝对值;
求取子单元,用于求取所述差的绝对值的二分之一与第M路所述初始语音信号的所述初始延时值的和;
确定子单元,用于将所述和确定为第M路所述初始语音信号的中间延时值,得到N-2路所述初始语音信号的所述中间延时值。
进一步地,所述述麦克风阵列语音信号处理装置包括:
滤波模块,用于对每路所述初始语音信号进行高通滤波处理,去除所述初始语音信号中频率小于预设频率的采样点,以去除所述初始语音信号中的低频信号。
进一步的,处理模块还包括:
累加单元,用于将N路的中间语音信号进行累加;
分解单元,用于利用子带技术对累加后的中间语音信号进行分解,得到多段子带频段;
调整单元,用于调整所述子带频段的频响曲线;
重构单元,用于将调整后的所述子带频段重构,得到合成语音信号。
进一步地,所述获取模块还用于通过所述麦克风阵列获取环境噪声信号;
所述分解重构模块还用于利用子带技术对所述环境噪声信号进行分解和重构,得到合成噪声信号;
所述述麦克风阵列语音信号处理装置包括:
生成模块,用于生成与所述合成噪声信号的相位相反的反向合成噪声信号;
所述累加单元还用于通过加法器将所述合成语音信号和所述反向合成噪声信号累加,得到目标语音信号。
本发明计算机可读存储介质具体实施方式与上述麦克风阵列语音信号处理方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种麦克风阵列语音信号处理方法,其特征在于,所述麦克风阵列语音信号处理方法包括以下步骤:
通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数;
根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号;
将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号;
所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤包括:
根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值,其中,所述M为正整数,且小于所述N;
判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围;
若否,则向所述中间延时值和第N路所述初始语音信号的初始延时值持续增加预设时间单元,直至所述中间延时值和第N路所述初始语音信号的初始延时值处于所述预设零门限范围,并将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
2.如权利要求1所述的麦克风阵列语音信号处理方法,其特征在于,所述判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围的步骤之后,还包括:
若是,则将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
3.如权利要求1所述的麦克风阵列语音信号处理方法,其特征在于,所述根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路所述初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值的步骤包括:
计算第M-1路和第M+1路所述初始语音信号的初始延时值的差的绝对值;
求取所述差的绝对值的二分之一与第M路所述初始语音信号的所述初始延时值的和,将所述和确定为第M路所述初始语音信号的中间延时值,得到N-2路所述初始语音信号的所述中间延时值。
4.如权利要求1所述的麦克风阵列语音信号处理方法,其特征在于,所述根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号的步骤之前,还包括:
对每路所述初始语音信号进行高通滤波处理,去除所述初始语音信号中频率小于预设频率的采样点,以去除所述初始语音信号中的低频信号。
5.如权利要求1所述的麦克风阵列语音信号处理方法,其特征在于,所述将N路的中间语音信号进行累加,并利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号的步骤包括:
将N路的中间语音信号进行累加,利用子带技术对累加后的中间语音信号进行分解,得到多段子带频段;
调整所述子带频段的频响曲线,并将调整后的所述子带频段重构,得到合成语音信号。
6.如权利要求1所述的麦克风阵列语音信号处理方法,其特征在于,所述麦克风阵列语音信号处理方法还包括以下步骤:
通过所述麦克风阵列获取环境噪声信号,并利用子带技术对所述环境噪声信号进行分解和重构,得到合成噪声信号;
生成与所述合成噪声信号的相位相反的反向合成噪声信号;
通过加法器将所述合成语音信号和所述反向合成噪声信号累加,得到目标语音信号。
7.一种麦克风阵列语音信号处理装置,其特征在于,所述麦克风阵列语音信号处理装置包括:
获取模块,用于通过所述麦克风阵列获取N路的初始语音信号,其中,所述N为正整数;
矫正模块,用于根据预设规则,对每路初始语音信号的初始延时值进行矫正,以对所述初始语音信号进行处理,得到N路的中间语音信号;
累加模块,用于将N路的中间语音信号进行累加;
处理模块,用于利用子带技术对累加后的中间语音信号进行处理,得到合成语音信号;
所述麦克风阵列语音信号处理装置用于实现:
根据第M-1路和第M+1路所述初始语音信号的初始延时值矫正第M路初始语音信号的初始延时值,得到N-2路所述初始语音信号的中间延时值,其中,所述M为正整数,且小于所述N;
判断N-2路所述初始语音信号的中间延时值和第N路所述初始语音信号的初始延时值是否处于预设零门限范围;
若否,则向所述中间延时值和第N路所述初始语音信号的初始延时值持续增加预设时间单元,直至所述中间延时值和第N路所述初始语音信号的初始延时值处于所述预设零门限范围,并将所述中间延时值对应的所述初始语音信号、第一路和第N路所述初始语音信号确定为所述中间语音信号。
8.一种麦克风阵列语音信号处理设备,其特征在于,所述麦克风阵列语音信号处理设备包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的麦克风阵列语音信号处理程序,所述麦克风阵列语音信号处理程序被所述处理器执行时实现如权利要求1至6中任一项所述的麦克风阵列语音信号处理方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有麦克风阵列语音信号处理程序,所述麦克风阵列语音信号处理程序被处理器执行时实现如权利要求1至6中任一项所述的麦克风阵列语音信号处理方法的步骤。
CN202010423562.2A 2020-05-18 2020-05-18 麦克风阵列语音信号处理方法、装置、设备及存储介质 Active CN111785290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010423562.2A CN111785290B (zh) 2020-05-18 2020-05-18 麦克风阵列语音信号处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010423562.2A CN111785290B (zh) 2020-05-18 2020-05-18 麦克风阵列语音信号处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111785290A CN111785290A (zh) 2020-10-16
CN111785290B true CN111785290B (zh) 2023-12-26

Family

ID=72754168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010423562.2A Active CN111785290B (zh) 2020-05-18 2020-05-18 麦克风阵列语音信号处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111785290B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112601158B (zh) * 2021-03-04 2021-07-06 深圳市东微智能科技股份有限公司 扩声系统的混音处理方法、扩声系统及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN107749305A (zh) * 2017-09-29 2018-03-02 百度在线网络技术(北京)有限公司 语音处理方法及其装置
CN108694957A (zh) * 2018-04-08 2018-10-23 湖北工业大学 基于圆形麦克风阵列波束形成的回声抵消设计方法
CN109448718A (zh) * 2018-12-11 2019-03-08 广州小鹏汽车科技有限公司 一种基于多麦克风阵列的语音识别方法及系统
WO2019169616A1 (zh) * 2018-03-09 2019-09-12 深圳市汇顶科技股份有限公司 语音信号处理方法及装置
CN110767247A (zh) * 2019-10-29 2020-02-07 支付宝(杭州)信息技术有限公司 语音信号处理方法、声音采集装置和电子设备
CN110931032A (zh) * 2019-11-19 2020-03-27 西安合谱声学科技有限公司 一种动态回声消除方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN107749305A (zh) * 2017-09-29 2018-03-02 百度在线网络技术(北京)有限公司 语音处理方法及其装置
WO2019169616A1 (zh) * 2018-03-09 2019-09-12 深圳市汇顶科技股份有限公司 语音信号处理方法及装置
CN108694957A (zh) * 2018-04-08 2018-10-23 湖北工业大学 基于圆形麦克风阵列波束形成的回声抵消设计方法
CN109448718A (zh) * 2018-12-11 2019-03-08 广州小鹏汽车科技有限公司 一种基于多麦克风阵列的语音识别方法及系统
CN110767247A (zh) * 2019-10-29 2020-02-07 支付宝(杭州)信息技术有限公司 语音信号处理方法、声音采集装置和电子设备
CN110931032A (zh) * 2019-11-19 2020-03-27 西安合谱声学科技有限公司 一种动态回声消除方法及装置

Also Published As

Publication number Publication date
CN111785290A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN1122970C (zh) 由时域频谱减法减少信号噪声的降噪处理器、方法和电话
EP2283484B1 (en) System and method for dynamic sound delivery
JP5070993B2 (ja) 音処理装置、位相差補正方法及びコンピュータプログラム
CN111149370B (zh) 会议系统中的啸叫检测
EP2811485A1 (en) Sound correcting apparatus, sound correcting program, and sound correcting method
EP2265039B1 (en) Hearing aid
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
EP2463856B1 (en) Method to reduce artifacts in algorithms with fast-varying gain
US10622004B1 (en) Acoustic echo cancellation using loudspeaker position
EP2034710A2 (en) Multipoint communication apparatus with sound level adjustment unit
JP6303340B2 (ja) 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
CN111785290B (zh) 麦克风阵列语音信号处理方法、装置、设备及存储介质
JP4448464B2 (ja) 雑音低減方法、装置、プログラム及び記録媒体
US11380312B1 (en) Residual echo suppression for keyword detection
JP2013168856A (ja) ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
JP5232121B2 (ja) 信号処理装置
KR100873000B1 (ko) 마이크 어레이를 이용한 방향성 음원 필터링 시스템 및 그방법
CN106797517B (zh) 用于净化音频信号的多耳mmse分析技术
WO2012128678A1 (en) Method and arrangement for damping of dominant frequencies in an audio signal
JP4922427B2 (ja) 信号補正装置
JP2012163682A (ja) 音声処理装置及び方法
JP2007067549A (ja) 収音装置とその方法とそのプログラムとその記録媒体
CN114420153A (zh) 音质调整方法、装置、设备及存储介质
CN110022514B (zh) 音频信号的降噪方法、装置、系统及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant