CN104766093A - 一种基于麦克风阵列的声目标分类方法 - Google Patents

一种基于麦克风阵列的声目标分类方法 Download PDF

Info

Publication number
CN104766093A
CN104766093A CN201510151851.0A CN201510151851A CN104766093A CN 104766093 A CN104766093 A CN 104766093A CN 201510151851 A CN201510151851 A CN 201510151851A CN 104766093 A CN104766093 A CN 104766093A
Authority
CN
China
Prior art keywords
signal
algorithm
microphone
microphone array
orientation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510151851.0A
Other languages
English (en)
Other versions
CN104766093B (zh
Inventor
郭峰
黄景昌
祖兴水
程勇博
刘华巍
李宝清
袁晓兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Microsystem and Information Technology of CAS
University of Chinese Academy of Sciences
Original Assignee
Shanghai Institute of Microsystem and Information Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Microsystem and Information Technology of CAS filed Critical Shanghai Institute of Microsystem and Information Technology of CAS
Priority to CN201510151851.0A priority Critical patent/CN104766093B/zh
Publication of CN104766093A publication Critical patent/CN104766093A/zh
Application granted granted Critical
Publication of CN104766093B publication Critical patent/CN104766093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

本发明涉及一种基于麦克风阵列的声目标分类方法,其特征在于包括以下步骤:(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类。本发明充分利用麦克风阵列的优势,不但提高了目标信号的信噪比而且提升分类算法的准确率和抗噪能力。具有环境适应能力强、性能可靠等优点,特别适用于需要对声目标进行连续监控的场合。

Description

一种基于麦克风阵列的声目标分类方法
技术领域
本发明涉及一种基于麦克风阵列的声目标分类方法,特别是涉及一种采用麦克风阵列将声目标的声音信号特征和声目标的空间特征相结合的分类方法。属于声目标识别分类技术领域。
背景技术
利用声音信号来对目标进行分类一直是模式识别领域一个十分重要的课题。相比较单麦克风,麦克风阵列富含更多的信息。利用这些信息可以实现声目标的定位,声信号的增强以及干扰的抑制。在目前的利用麦克风阵列来对声目标进行分类的方法大部分集中于这样的架构:先用波束形成对声音信号进行增强,然后将增强后的信号送入分类器。在这种架构下,用于波束形成的方法的主要有最小方差无畸变响应(Minimum variance distortionlessresponse,MVDR)和延时-求和(Delay and Sum)等。
MVDR虽然能够较好的抑制来自其它方向上的干扰,但是一方面由于有矩阵求逆操作,计算量相对较大,另一方面经过MVDR处理后的信号,其分类效果有时候会反而不如延时-求和算法。延时-求和主要是利用目标声信号在各个通道存在不同延时的特点,通过算法估计出各个通道的延时,然后将各个通道按各自的延时在时间上进行移位,最后将移位后的各个通道信号叠加相加,从而对目标声信号进行增强。但由于移位的长度等于延时除以采样周期,这种算法受采样率制约,需要较高的采样率。与延时-求和方法是通过时间上的移位来弥补各个通道之间声信号的时间差从而受限于采样率这一特点相比,本发明针对这种信号增强后接分类器的分类算法架构,在波束形成的信号增强端采用常规波速形成(CBF)的方法,通过调整各通道的相位来弥补通道间的时间差。
此外,当利用麦克风阵列对声目标进行分类的时候。现有的分类器利用目标的空间特征鲜有报道。然而目标角度变化量Δθ本身则是一个十分重要的空间特征,富含大量的信息,例如当分类目标为运动车辆的时候,如果相邻两段声音信号时间间隔较短(比如125ms),车辆离麦克风阵列较远时,Δθ趋于0,当车辆离麦克风阵列较近时,Δθ变大,但其值仍然在一个较小的区间中,且满足一定的函数关系。而噪声信号的角度变化量Δθ的特点是,即使相邻两段声音信号的时间间隔较短,定向角度θ随时间的变化常常出现波动甚至震荡现象,即Δθ取值很大且不满足运动车辆的Δθ所满足的函数关系。这是噪声信号与运动车辆的信号一个差异十分显著的特征。所以将目标角度变化量Δθ作为一个空间特征用于分类器可以提高声目标和噪声间的分类准确率。本发明拟首先通过常规波束形成对各通道声音信号进行加权求和,以通过调整各个通道的信号相位来弥补其到达时间差,然后再提取经常规波束形成后的信号的特征,将其再加上定向角度变化量的空间特征一起作为新的特征,可望有效提高分类器的分类准确率及抗噪能力。从而构筑成本发明的构思。
发明内容
本发明的目的在于提供一种基于麦克风阵列的声目标分类方法,也就是说本发明所要解决的技术问题是提供一种基于麦克风阵列的,环境适应能力强、性能可靠,具有较强抗噪能力的声目标分类方法。
本发明所提供的一种采用麦克风阵列的结合目标空间特征的声目标分类方法,具体包括以下步骤:
(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;
(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类。
所述的麦克风阵列的麦克风数量为2个或2个以上,排列方式为均匀排列或随机排列。
所述步骤(1)中的定向算法为现有的声阵列定向算法之一。可选用的算法有很多,现有的能定向的算法均可选用,包括多重信号分类算法(MUSIC)、旋转不变子空间法(ESPRIT)以及最大似然算法等。
所述步骤(1)中的波束形成方法为常规波束形成(参见王永良“空间谱估计理论与算法”P59,清华大学出版社),这实际上也是一个基本的算法,具体算法如下:
y ( t ) = c · Σ i = 1 M w i x i ( t ) = c · A H · X w i = e j ω 0 τ i
其中,c为一个调节信号幅度的常数,M为麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,AH表示流型矩阵A的共轭转置,X为麦克风阵列采集信号的矩阵形式表达,j表示虚数单位,ω0为进行常规波束形成所选取的参考频点,τi表示声音信号在第i个阵元处的时移,常规波束形成的方向为定向算法所得出的目标方向。
所述步骤(2)中的定向角度变化量等于当前信号的定向角度减去其前一段信号的定向角度。
所述步骤(2)中的提取常规波束形成后信号特征的特征提取方法为现有的特征提取算法之一。现有的特征提取算法有很多种,本发明对使用何种特征提取算法没有什么特殊要求,实施例中的MFCC算法只是其中的一种。
所述步骤(2)中的分类算法为现有的分类算法之一。
综上所述,本发明涉及一种基于麦克风阵列的声目标分类方法,实际上包括以下四个步骤:①麦克风阵列利用采集到的声音信号对声音目标进行定向;②然后利用麦克风的定向结果对麦克风接收信号进行常规波束形成;③再对常规波束形成后的信号进行特征提取,将提取到的特征和定向角度变化量一起作为新的特征;④最后对新得到的特征运行现有的目标分类算法得出分类结果。
需说明的是:
a)第1步定向和第2步常规波束形成具有非常紧密的关系,将这两步放在一起,作为第一大步(如发明内容所述)就是为了表达出这种紧密关系;
b)第3步特征提取和第4步分类识别也具有非常紧密的关系,将其放在一起,作为第二大步(如发明内容)也是为了表达出这种紧密关系,很多文献其实都把他们看作一步。
c)发明内容将算法步骤分为了2个大步,其中第一大步所考虑的问题是阵列信号处理领域的问题,第二大步所考虑的问题是模式识别领域的问题。因此,彼此间的层次性比4个小步更加清晰。
本发明充分利用了麦克风阵列的优势,不但能提高目标信号的信噪比,而且还能提高分类算法的准确性和鲁棒性。
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:
本发明利用麦克风阵列来对声目标进行分类。麦克风阵列可以同时利用多通道数据来抑制噪声,增强信号。本发明在波束形成后接分类器的分类算法架构下,将波束形成使用常规波束形成(CBF)的方法对各个通道直接乘以一个加权值用调整相位的方式来弥补时间差,而避免了采用延时-求和算法需要较高采样率的缺点。此外,考虑到声目标的角度变化量Δθ含有丰富的空间信息,本发明在现有的特征提取方法所提取的特征的基础上增加了一个角度变化量Δθ的空间特征,用以提升分类算法的准确率和抗噪能力。本发明具有环境适应能力强、性能可靠等优点,特别适用于需要对声目标进行连续监控的情况。
附图说明
图1是算法操作流程图;
图2是实施例的操作流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明所述的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种基于麦克风阵列的声目标识别方法,如图1所示,包括以下步骤:(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类。
下面以一个声目标分类算法的具体实施例来进一步说明本发明。
步骤一:以一个直径为12cm的6阵元均匀圆阵排列的麦克风阵列采集声音信号。
步骤二:麦克风阵列对声目标采用Music算法进行定向,t时刻定向出的角度为θt
步骤三:根据定向出的角度θt对各个通道声音信号进行常规波束形成。即按下式进行加权:
y ( t ) = c · Σ i = 1 M w i x i ( t ) w i = e j ω 0 τ i
c为一个调节信号幅度的常数取1/M,M=6表示麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,ω0为进行常规波束形成所选取的参考频点取340Hz,τi表示声音信号在第i个阵元处的时移,根据本实例的圆阵结构可得在俯仰角为0°的时候有其中r表示圆阵半径,为6cm,v表示声音在空气中的速度,常取340m/s。
步骤四:将常规波束形成后的信号y(t)提取其梅尔倒谱系数(MFCC),其中梅尔滤波器组包含24个滤波器,可以得到24维的梅尔倒谱系数,由于第一维表示直流分量,在取均值的条件下,第一维数值很小将其去掉,最后得到23维的梅尔倒谱系数。
步骤五:将上一步得到的23维的梅尔倒谱系数和定向角度变化量Δθ(Δθ=θtt-1)一起构成一个24维的包含信号特征以及目标空间特征的特征向量,将最后得到的特征向量送入GMM(高斯混合模型)进行分类。操作流程图见图2。
对于其他阵元的均匀或非均匀排列,乃至随机排列均与本实施例中的均匀圆阵排列过程完全一样,在应用圆阵结构的地方只是常规波束形成的操作,至于非均匀阵列的常规波束形成也与本实施例类似,只是阵列信号处理的知识不同而已。
不难发现,本发明利用麦克风阵列采集到的声响信号进行常规波束形成,用相位差来弥补各个通道的时间差以增强信号,然后在传统特征提取算法所提取到的特征的基础上,增加了一维描述空间变化的特征即定向角度的变化量,以提高分类器性能。本发明具有环境适应能力强、性能可靠等优点,特别适合于需要对声音目标进行连续监控的情况。

Claims (10)

1.一种基于麦克风阵列的声目标分类方法,其特征在于,包括以下步骤:
(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;
(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类。
2.根据权利要求1所述的分类方法,其特征在于所述麦克风阵列的麦克风数量为2个或2个以上,排列方式为均匀排列或随机排列。
3.根据权利要求1所述的分类方法,其特征在于步骤(1)中所述的定向算法为现有的声阵列定向算法之一。
4.根据权利要求3所述的分类方法,其特征在于所述的定向算法包括多重信号分类算法MUSIC、旋转不变子空间法ESPRIT或最大似然算法。
5.根据权利要求1所述的分类方法,其特征在于步骤(1)中所述的常规波束形成算法如下:
y ( t ) = c · Σ i = 1 M w i x i ( t ) = c · A H · X w i = e j ω 0 τ i
其中,c为一个调节信号幅度的常数,M为麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,AH表示流型矩阵A的共轭转置,X为麦克风阵列采集信号的矩阵形式表达,ω0为进行常规波束形成所选取的参考频点,τi表示声音信号在第i个阵元处的时移;常规波束形成的方向为定向算法所得出的目标方向。
6.根据权利要求5所述的分类方法,其特征在于将波束形成使用常规波束形成的方法对各个通道直接乘以一个加权值用以调整相位的方式来弥补时间差。
7.根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的定向角度变化量等于当前信号的定向角度减去其前一段信号的定向角度,提交分类算法的准确率和抗噪能力。
8.根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的提取常规波束形成后信号特征的特征提取方法为现有的特征提取算法之一。
9.根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的分类算法为现有的分类算法之一。
10.根据权利要求1-9任一项所述的分类方法,其特征在于直径为12cm的6阵元均匀圆阵排列的麦克风阵列采集声音信号,利用麦克风阵列采集到的声响信号进行常规波束形成,用相位差来弥补各个通道的时间差以增强信号,然后在传统特征提取算法所提取到的特征的基础上,增加了一维描述空间变化的特征即定向角度的变化量,以提高分类器性能;具体步骤是:
(1)麦克风阵列对声目标采用Music算法进行定向,t时刻定向出的角度为θt
(2)根据定向出的角度θt对各个通道声音信号进行常规波束形成;即先按下式进行加权:
y ( t ) = c · Σ i = 1 M w i x i ( t ) w i = e j ω 0 τ i
c为一个调节信号幅度的常数取1/M,M=6表示麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,ω0为进行常规波束形成所选取的参考频点取340Hz,τi表示声音信号在第i个阵元处的时移,在俯仰角为0°的时候有其中r表示圆阵半径,为6cm,v表示声音在空气中的速度,常取340m/s;
(3)将常规波束形成后的信号y(t)提取其梅尔倒谱系数MFCC,其中梅尔滤波器组包含24个滤波器,可以得到24维的梅尔倒谱系数,由于第一维表示直流分量,在取均值的条件下,第一维数值很小将其去掉,最后得到23维的梅尔倒谱系数;
(4)将步骤(3)得到的23维的梅尔倒谱系数和定向角度变化量Δθ一起构成一个24维的包含信号特征以及目标空间特征的特征向量,将最后得到的特征向量送入高斯混合模型GMM进行分类,式中Δθ=θtt-1
CN201510151851.0A 2015-04-01 2015-04-01 一种基于麦克风阵列的声目标分类方法 Active CN104766093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510151851.0A CN104766093B (zh) 2015-04-01 2015-04-01 一种基于麦克风阵列的声目标分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510151851.0A CN104766093B (zh) 2015-04-01 2015-04-01 一种基于麦克风阵列的声目标分类方法

Publications (2)

Publication Number Publication Date
CN104766093A true CN104766093A (zh) 2015-07-08
CN104766093B CN104766093B (zh) 2018-02-16

Family

ID=53647907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510151851.0A Active CN104766093B (zh) 2015-04-01 2015-04-01 一种基于麦克风阵列的声目标分类方法

Country Status (1)

Country Link
CN (1) CN104766093B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846803A (zh) * 2017-02-08 2017-06-13 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
CN106932087A (zh) * 2017-03-21 2017-07-07 陕西理工大学 圆形声矢量传感器阵列近场源多参数估计方法
CN107785029A (zh) * 2017-10-23 2018-03-09 科大讯飞股份有限公司 目标语音检测方法及装置
CN109188347A (zh) * 2018-10-11 2019-01-11 北京遥感设备研究所 基于music谱的信号极化方式三分类方法
WO2019061439A1 (zh) * 2017-09-29 2019-04-04 山东大学 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
CN109741609A (zh) * 2019-02-25 2019-05-10 南京理工大学 一种基于麦克风阵列的机动车鸣笛声监测方法
CN111044973A (zh) * 2019-12-31 2020-04-21 山东大学 一种用于麦克风方阵的mvdr目标声源定向拾音方法
WO2021027049A1 (zh) * 2019-08-15 2021-02-18 北京小米移动软件有限公司 一种声音采集方法、装置及介质
CN113138367A (zh) * 2020-01-20 2021-07-20 中国科学院上海微系统与信息技术研究所 一种目标定位方法、装置、电子设备及存储介质
CN113793613A (zh) * 2021-07-28 2021-12-14 辽宁工业大学 一种多特征融合的说话人识别方法
CN113823321A (zh) * 2021-08-31 2021-12-21 中国科学院上海微系统与信息技术研究所 一种基于特征预训练的深度学习分类的声音数据分类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050195988A1 (en) * 2004-03-02 2005-09-08 Microsoft Corporation System and method for beamforming using a microphone array
CN102074236A (zh) * 2010-11-29 2011-05-25 清华大学 一种分布式麦克风的说话人聚类方法
CN102088911A (zh) * 2008-06-17 2011-06-08 皇家飞利浦电子股份有限公司 利用声音分类器和麦克风的声学患者监测
CN102231277A (zh) * 2011-06-29 2011-11-02 电子科技大学 基于声纹识别的移动终端隐私保护方法
CN102799262A (zh) * 2011-04-08 2012-11-28 索尼电脑娱乐公司 用于确定输入语音的相关性的装置和方法
CN103994820A (zh) * 2014-04-21 2014-08-20 中国科学院上海微系统与信息技术研究所 一种基于微孔径麦克风阵列的运动目标识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050195988A1 (en) * 2004-03-02 2005-09-08 Microsoft Corporation System and method for beamforming using a microphone array
CN102088911A (zh) * 2008-06-17 2011-06-08 皇家飞利浦电子股份有限公司 利用声音分类器和麦克风的声学患者监测
CN102074236A (zh) * 2010-11-29 2011-05-25 清华大学 一种分布式麦克风的说话人聚类方法
CN102799262A (zh) * 2011-04-08 2012-11-28 索尼电脑娱乐公司 用于确定输入语音的相关性的装置和方法
CN102231277A (zh) * 2011-06-29 2011-11-02 电子科技大学 基于声纹识别的移动终端隐私保护方法
CN103994820A (zh) * 2014-04-21 2014-08-20 中国科学院上海微系统与信息技术研究所 一种基于微孔径麦克风阵列的运动目标识别方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846803B (zh) * 2017-02-08 2023-06-23 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
CN106846803A (zh) * 2017-02-08 2017-06-13 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
CN106932087B (zh) * 2017-03-21 2019-07-05 陕西理工大学 圆形声矢量传感器阵列近场源多参数估计方法
CN106932087A (zh) * 2017-03-21 2017-07-07 陕西理工大学 圆形声矢量传感器阵列近场源多参数估计方法
WO2019061439A1 (zh) * 2017-09-29 2019-04-04 山东大学 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
CN107785029B (zh) * 2017-10-23 2021-01-29 科大讯飞股份有限公司 目标语音检测方法及装置
US11308974B2 (en) 2017-10-23 2022-04-19 Iflytek Co., Ltd. Target voice detection method and apparatus
CN107785029A (zh) * 2017-10-23 2018-03-09 科大讯飞股份有限公司 目标语音检测方法及装置
CN109188347A (zh) * 2018-10-11 2019-01-11 北京遥感设备研究所 基于music谱的信号极化方式三分类方法
CN109741609A (zh) * 2019-02-25 2019-05-10 南京理工大学 一种基于麦克风阵列的机动车鸣笛声监测方法
CN109741609B (zh) * 2019-02-25 2021-05-04 南京理工大学 一种基于麦克风阵列的机动车鸣笛声监测方法
WO2021027049A1 (zh) * 2019-08-15 2021-02-18 北京小米移动软件有限公司 一种声音采集方法、装置及介质
US10945071B1 (en) 2019-08-15 2021-03-09 Beijing Xiaomi Mobile Software Co., Ltd. Sound collecting method, device and medium
CN111044973A (zh) * 2019-12-31 2020-04-21 山东大学 一种用于麦克风方阵的mvdr目标声源定向拾音方法
CN113138367A (zh) * 2020-01-20 2021-07-20 中国科学院上海微系统与信息技术研究所 一种目标定位方法、装置、电子设备及存储介质
CN113793613A (zh) * 2021-07-28 2021-12-14 辽宁工业大学 一种多特征融合的说话人识别方法
CN113823321A (zh) * 2021-08-31 2021-12-21 中国科学院上海微系统与信息技术研究所 一种基于特征预训练的深度学习分类的声音数据分类方法
CN113823321B (zh) * 2021-08-31 2023-08-08 中国科学院上海微系统与信息技术研究所 一种基于特征预训练的深度学习分类的声音数据分类方法

Also Published As

Publication number Publication date
CN104766093B (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
CN104766093A (zh) 一种基于麦克风阵列的声目标分类方法
Xiao et al. Deep beamforming networks for multi-channel speech recognition
Hoshen et al. Speech acoustic modeling from raw multichannel waveforms
EP1455552A2 (en) Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same
CN106023996B (zh) 基于十字形声阵列宽带波束形成的声识别方法
CN104076331A (zh) 一种七元麦克风阵列的声源定位方法
CN106504763A (zh) 基于盲源分离与谱减法的麦克风阵列多目标语音增强方法
CN108899044A (zh) 语音信号处理方法及装置
CN103854660B (zh) 一种基于独立成分分析的四麦克语音增强方法
CN109448389B (zh) 一种汽车鸣笛智能检测方法
CN109977724B (zh) 一种水下目标分类方法
Wang et al. Deep learning assisted time-frequency processing for speech enhancement on drones
CN111239680A (zh) 一种基于差分阵列的波达方向估计方法
Karbasi et al. Environmental sound classification using spectral dynamic features
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及系统
Ibrahim et al. Noise2Weight: On detecting payload weight from drones acoustic emissions
CN103994820A (zh) 一种基于微孔径麦克风阵列的运动目标识别方法
Al-Hattab et al. Rethinking environmental sound classification using convolutional neural networks: optimized parameter tuning of single feature extraction
CN113203987A (zh) 一种基于k均值聚类的多声源方位估计方法
Yang et al. Srp-dnn: Learning direct-path phase difference for multiple moving sound source localization
Lin Jointly tracking and separating speech sources using multiple features and the generalized labeled multi-bernoulli framework
Zheng et al. Spectral mask estimation using deep neural networks for inter-sensor data ratio model based robust DOA estimation
CN110136741B (zh) 一种基于多尺度上下文的单通道语音增强方法
Guo et al. A classification method for moving targets in the wild based on microphone array and linear sparse auto-encoder
Masnadi-Shirazi et al. Separation and tracking of multiple speakers in a reverberant environment using a multiple model particle filter glimpsing method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Liu Huawei

Inventor after: Guo Feng

Inventor after: Huang Jingchang

Inventor after: Zu Xingshui

Inventor after: Cheng Yongbo

Inventor after: Li Baoqing

Inventor after: Yuan Xiaobing

Inventor before: Guo Feng

Inventor before: Huang Jingchang

Inventor before: Zu Xingshui

Inventor before: Cheng Yongbo

Inventor before: Liu Huawei

Inventor before: Li Baoqing

Inventor before: Yuan Xiaobing

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20180801

Address after: 200050 No. 865, Changning Road, Shanghai, Changning District

Co-patentee after: University of Chinese Academy of Sciences

Patentee after: Shanghai Institute of Microsystem and Information Technology, Chinese Academy of Sciences

Address before: 200050 No. 865, Changning Road, Shanghai, Changning District

Patentee before: Shanghai Institute of Microsystem and Information Technology, Chinese Academy of Sciences

TR01 Transfer of patent right