CN111505569A - 声源定位方法以及相关设备、装置 - Google Patents
声源定位方法以及相关设备、装置 Download PDFInfo
- Publication number
- CN111505569A CN111505569A CN202010432870.1A CN202010432870A CN111505569A CN 111505569 A CN111505569 A CN 111505569A CN 202010432870 A CN202010432870 A CN 202010432870A CN 111505569 A CN111505569 A CN 111505569A
- Authority
- CN
- China
- Prior art keywords
- power spectrum
- sound source
- frequency
- azimuth
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本申请公开了一种声源定位方法以及相关设备、装置,其中,声源定位方法包括:获取信号接收器接收到的目标声源的时域信号;将时域信号进行时频转换,得到对应的频域信号;对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据;利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,其中,功率谱表示声源方位与功率之间的关系;利用至少一个功率谱,确定目标声源的方位。上述方案,能够快速且准确地进行声源定位。
Description
技术领域
本申请涉及信息技术领域,特别是涉及一种声源定位方法以及相关设备、装置。
背景技术
目前,在诸如会议、教学、通信、机械设备振动等众多应用场景均需要对声源进行定位。以会议应用为例,在传统会议中,通常使用单个麦克风采集说话人的声音信息,会后通过人工的方式对会议录音内容进行整理、校对。然而,传统会议模式已经不能满足现代会议要求。现代会议要求根据与会者座位排列的先验信息,可以在不同时刻定位不同说话人的位置来区分不同说话人,从而为会后人工整理会议记录或为控制中心区分不同说话人提供有用信息。有鉴于此,如何快速且准确地进行声源定位成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种声源定位方法以及相关设备、装置,能够快速且准确地进行声源定位。
为了解决上述问题,本申请第一方面提供了一种声源定位方法,包括:获取信号接收器接收到的目标声源的时域信号;将时域信号进行时频转换,得到对应的频域信号;对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据;利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,其中,功率谱表示声源方位与功率之间的关系;利用至少一个功率谱,确定目标声源的方位。
为了解决上述问题,本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的声源定位方法。
为了解决上述问题,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的声源定位方法。
上述方案,通过获取信号接收器接收到的目标声源的时域信号,从而对时域信号进行时频转换,得到对应的频域信号,并对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据,故能够将宽带信号分成至少一个窄带信号,从而利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,且功率谱表示声源方位与功率之间的关系,故能够基于窄带信号进行声源分析,有利于提高声源定位的速度,进而利用至少一个功率谱确定的目标声源的方位,能够有利于提高声源定位的准确性,故此,能够快速且准确地进行声源定位。
附图说明
图1是本申请声源定位方法一实施例的流程示意图;
图2是均匀直线阵一实施例的框架示意图;
图3是图1中步骤S14一实施例的流程示意图;
图4是图3中步骤S141一实施例的流程示意图;
图5是图1中步骤S15一实施例的流程示意图;
图6是最终源功率谱和最终对称功率谱一实施例的示意图;
图7是本申请声源定位装置一实施例的框架示意图;
图8是本申请电子设备一实施例的框架示意图;
图9是存储装置一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请声源定位方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:获取信号接收器接收到的目标声源的时域信号。
在一个实施场景中,信号接收器为信号接收阵列,信号接收阵列包括多个阵元,用于接收声音信号。在一个具体的实施场景中,阵元可以为麦克风。在另一个具体的实施场景中,信号接收阵列具体可以是均匀直线阵,均匀直线阵中可以包含多个阵元,相邻阵元之间的距离相等且其所包含的多个阵元在一条直线上,从而能够在阵元数量有限的情况下,尽可能提高阵列的尺寸,扩大阵列的近场范围,此外,在实际应用中,均匀直线阵能够提高安装的便捷性,以及工程隐蔽性。请结合参阅图2,图2是均匀直线阵一实施例的框架示意图,如图2所示,图中黑色实心圆表示阵元1、阵元2、阵元3、……、阵元M-1、阵元M共计M个阵元,相邻阵元之间的距离为d,远场中存在一目标声源,其方位为θ。在实际应用中,远场中还可能存在多个目标声源,多个目标声源的方位可以表示为{θ1,θ2,…,θk},在此不做限定。
步骤S12:将时域信号进行时频转换,得到对应的频域信号。
在一个实施场景中,为了能够在稳定的频率特性上进行时频转换,还可以对时域信号进行加窗分帧,从而得到多个分帧时域信号,具体地,可以采用预设窗函数对时域信号进行加窗分帧,窗函数可以是矩形窗函数、汉明窗函数、海宁窗函数,在此不做限定;此外,分帧时域信号的长度可以为10毫秒,在此不做限定;此外,相邻分帧时域信号之间还可以由重叠信号,在此不做限定。
在另一个实施场景中,时域信号包括由信号接收器的多个阵元分别接收到的第一时域信号,为了能够在稳定的频率特性上进行时频转换,还可以利用预设窗函数,对第一时域信号进行加窗分帧,得到多个第二时域信号,并将多个第二时域信号进行时频转换,得到与每一第二时域信号对应的频域信号。在一个具体的实施场景中,预设窗函数可以采用如上所述的窗函数,在此不再赘述。在另一个具体的实施场景中,还可以采用一预设采样频率(如,8kHz、16kHz、32kHz、48kHz等)对第一时域信号进行采样,得到数字信号,再利用预设窗函数对数字信号进行加窗分帧,得到多个第二时域信号,从而可以采用多点快速傅里叶变换将第二时域信号转换到频域,得到对应的频域信号。为了便于描述,多个阵元分别接收到的第一时域信号可以表示为xi(t),其中,i∈[1,M],对第一时域信号xi(t)进行加窗分帧,得到的第二时域信号可以表示为其中,j∈[1,K],K表示分帧的总数,对第二时域信号进行时频转换所得到的频域信号可以表示为
步骤S13:对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据。
在一个实施场景中,时域信号包括由信号接收器的多个阵元分别接收到的第一时域信号xi(t),且利用预设窗函数,对第一时域信号xi(t)进行加窗分帧,得到多个第二时域信号则可以将多个第二时域信号分别进行时频转换,得到与每一第二时域信号对应的频域信号,故对与每一第二时域信号对应的频域信号进行频域分析,可以得到至少一个子频带的中心频率,为了便于描述,至少一个子频带的中心频率可以表示为即共计Ns个子频带的中心频率。故此,统计同一中心频率在不同频域信号中的响应值,作为中心频率的响应数据。具体地,可以统计中心频率ω1在不同频域信号的响应值[x1(ω1),x2(ω1),…,xM(ω1)],作为中心频率ω1的响应数据,其维数与信号接收器所包含的阵元数量相等。为了便于描述,可以将中心频率ω1对应的响应数据记为X(ω1),其他中心频率可以以此类推,在此不再一一举例。上式中,M为信号接收器所包含的阵元数量,即响应数据的维数与信号接收器中所包含的阵元数量相等。
步骤S14:利用至少一个中心频率的响应数据,构建对应中心频率的功率谱。
功率谱表示声源方位与功率之间的关系。在一个实施场景中,可以采用预设功率谱构建方式得到中心频率的功率谱,预设功率谱构建方式可以包括:MVDR(MinimumVariance Distortionless Response,最小方差无失真响应算法)、MUSIC(MultipleSignal Classification,多重信号分类)、CBF(Conventional Beam Former,常规波束成形)等等,在此不做限定。
步骤S15:利用至少一个功率谱,确定目标声源的方位。
在一个实施场景中,可以分别在至少一个功率谱的全空间谱范围内进行谱峰搜索,从而将搜索到的谱峰对应的声源方位作为目标声源的方位。
在另一个实施场景中,为了提高声源定位的效率,还可以利用预设权重,将至少一个功率谱进行加权处理,得到最终功率谱,并在最终功率谱的全空间谱范围内进行谱峰搜索,从而将将搜索到的谱峰对应的声源方位作为目标声源的方位。
在又一个实施场景中,为了提高后续声源定位的效率,还可以将至少一个功率谱进行镜像对称转换,得到关于预设方位(例如,0度)对称的对称功率谱,从而只需在至少一个功率谱对应的对称功率谱的半空间谱内进行谱峰搜索即可,例如,以预设方位是0度为例,则只需在大于或等于0度范围内进行谱峰搜索,或在小于或等于0度范围内进行谱峰搜索即可,在半空间谱内搜索到的谱峰对应的方位再次进行镜像对称,可以新增镜像对称方位,再对新增的镜像对称方位和搜索到的谱峰对应的方位进行判定,即可确定目标声源的实际方位,在此暂不赘述。
在又一个实施场景中,为了进一步提高声源定位的效率,还可以先将至少一个功率谱进行镜像对称转换,得到关于预设方位(例如,0度)对称的对称功率谱,再将至少一个功率谱对应的对称功率谱进行加权处理,得到最终对称功率谱,从而只需在最终对称功率谱的半空间谱内进行谱峰搜索即可,具体在此暂不赘述。
在又一个实施场景中,为了进一步提高声源定位的效率,在得到的功率谱较多的情况下,还可以将至少一个中心频率对应的功率谱按照各自平均能量由大到小的顺序进行排序,并从选取平均能量前预设数量(如,2、3等)个功率谱,并利用选取的功率谱,确定目标声源的方位。
在又一个实施场景中,为了进一步提高声源定位的效率,还在至少一个中心频率对应的功率谱中,选取中心频率为预设频率的功率谱,并利用选取的功率谱,确定目标声源的方位。在一个具体的实施场景中,预设频率可以根据实际情况进行设置,例如,可以预先采集声源(例如,人)发声时的功率谱图,并对谱图进行能量分析,统计对应的能量较大的至少一个频率,作为预设频率。以目标声源是人为例,可以基于上述统计,将300Hz、600Hz、1000Hz作为预设频率,在此不做限定。
上述方案,通过获取信号接收器接收到的目标声源的时域信号,从而对时域信号进行时频转换,得到对应的频域信号,并对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据,故能够将宽带信号分成至少一个窄带信号,从而利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,且功率谱表示声源方位与功率之间的关系,故能够基于窄带信号进行声源分析,有利于提高声源定位的速度,进而利用至少一个功率谱确定的目标声源的方位,能够有利于提高声源定位的准确性,故此,能够快速且准确地进行声源定位。
请参阅图3,图3是图1中步骤S14一实施例的流程示意图。具体地,信号接收器为均匀直线阵,通过如下步骤可以得到中心频率对应的功率谱:
步骤S141:利用至少一个中心频率的响应数据,分别构建对应中心频率的源功率谱和镜像功率谱。
源功率谱为与目标声源对应的功率谱,镜像功率谱表示与目标声源关于预设方位对称的虚拟镜像源对应的功率谱。
在一个实施场景中,请结合参阅图4,图4是图3中步骤S141一实施例的流程示意图。具体地,图4是构建对应中心频率的源功率谱和镜像功率谱一实施例的流程示意图,包括如下步骤:
步骤S41:对至少一个中心频率的响应数据进行求解,得到对应中心频率的协方差矩阵。
具体地,可以采用下式对至少一个中心频率的响应数据进行求解,得到对应中心频率的协方差矩阵:
R(ωk)=E{X(ωk)XH(ωk)}
上式中,ωk表示第k个中心频率,X(ωk)表示第k个中心频率的响应数据,XH(ωk)表示第k个中心频率的响应数据的共轭转置,R(ωk)表示第k个中心频率的协方差矩阵。
步骤S42:基于多个阵元之间的距离,获取均匀直线阵的阵列流形表示,且阵列流形表示与声源方位相关。
请结合参阅图2,以阵元1为参考阵元,阵元2相对于阵元1多传播的波程为dsinθ,阵元3相对于阵元1多传播的波程为2dsinθ,以此类推,阵元M相对于阵元1多传播的波程为(M-1)dsinθ,故在高斯白噪声背景下,信号接收器接收到的时域信号可以表示为:
x(t)=[1,e-j2πdsinθ/λ,…,e-j2π(M-1)dsinθ/λ]Ts(t)+n(t)
上式中,x(t)表示信号接收器接收到的时域信号,s(t)表示声源信号,n(t)表示噪声信号,阵列流表示[1,e-j2πdsinθ/λ,…,e-j2π(M-1)dsinθ/λ]T为一与声源方位相关的矢量,为了便于描述,可以简写为a(θ)。以此类推,在一个实施场景中,当远场存在声源方位分别为θ={θ1,θ2,…,θk}共k个声源时,上述阵列流表示可以表示为:
当远场存在的声源为其他方位时,可以以此类推,在此不再一一举例。
上述步骤S41和步骤S42可以按照先后顺序执行,如先执行步骤S41,后执行步骤S42,或者,先执行步骤S42,后执行步骤S41。此外,上述步骤S41和步骤S42也可以同时执行,在此不做限定。
步骤S43:利用由阵列流形表示构建的约束条件,对由对应中心频率的协方差矩阵构建的功率谱函数进行求解,得到对应中心频率的源功率谱。
在一个实施场景中,以MVDR为例,MVDR的基本思想是选取合适的权向量w,为了减少对于非期望方向上激励的响应构建一个约束最优化问题。这一最优化问题中的判决准则为:在期望方向上形成一个单位幅度的约束下,使均方输出能量最小,即对其他方向的信号和噪声尽量抑制,利用阵列流表示可以构建约束条件,具体可以表示为:
上式中,R表示对应中心频率的协方差,wHRw表示由对应中心频率的协方差构建的功率谱函数,其上标H表示共轭转置,wHa(θ)=1表示约束条件。
具体求解时,可以根据上述约束条件和功率谱函数构建一目标函数,具体可以表示为:
求上式的梯度,并令其等于零,可以得到:
解得其权向量为:
w=λR-1a(θ)
将上式代入约束条件中,可以得到:
将上式代入权向量的表示式中,可以得到权向量:
将上式代入功率谱函数中,可以得到源功率谱的函数表示:
上式中,协方差矩阵R为对应中心频率的协方差矩阵,P(θ)为对应中心频率的源功率谱的函数表示。例如,当协方差矩阵R为对应中心频率ω1的协方差矩阵时,上述源功率谱的函数表示P(θ)为对应中心频率ω1的源功率谱的函数表示。利用上述源功率谱的函数表示,即可描绘得到源功率谱。
步骤S44:利用阵列流表示与预设方位相关的对称特征,对约束条件进行对称变换。
阵列流表示a(θ)=[1,e-j2πdsinθ/λ,…,e-j2π(M-1)dsinθ/λ]T,故阵列流表示a(θ)的共轭可以表示为:
a*(θ)=[1,ej2πdsinθ/λ,…,ej2π(M-1)dsinθ/λ]T
此外,当预设方位为0度时,阵列流表示a(θ)关于0度对称的表示为:
a(-θ)=[1,ej2πdsinθ/λ,…,ej2π(M-1)dsinθ/λ]T
故可以确定a*(θ)=a(-θ),即矢量的共轭矢量与矢量关于预设方位对称的对称矢量相同。由于镜像功率谱的约束条件可以表示为:
wHa(-θ)=1
故利用上述阵列流表示与预设方位相关的对称特征,将约束条件中的矢量变换为共轭矢量,可以得到变换后的约束条件:
wHa*(θ)=1
步骤S45:利用对称变换后的约束条件,对功率谱函数进行求解,得到对应中心频率的镜像功率谱。
具体地,可以通过下式利用对称变换后的约束条件,对功率谱函数进行求解,得到对应中心频率的镜像功率谱:
具体推导过程可以参考上述步骤,在此不再赘述。通过推导,可以确定镜像功率谱的函数表示:
上式中,协方差矩阵R为对应中心频率的协方差矩阵,P'(θ)为对应中心频率的镜像功率谱的函数表示。例如,当协方差矩阵R为对应中心频率ω1的协方差矩阵时,上述镜像功率谱的函数表示P'(θ)为对应中心频率ω1的镜像功率谱的函数表示。利用上述镜像功率谱的函数表示,即可描绘得到镜像功率谱。
步骤S142:利用源功率谱和镜像功率谱,构建得到对应中心频率的对称功率谱。
对称功率谱关于预设方位对称,在一个具体的实施场景中,预设方位可以为0度,此外,预设方位也可以根据实际情况设置为其他角度,在此不做限定。
在一个实施场景中,根据求解得到的源功率谱的函数表示和求解得到的镜像功率谱的函数表示,可以构建得到对称功率谱的函数表示:
从而利用对称功率谱的函数表示,可以构建得到对称功率谱。上式中,协方差矩阵R为对应中心频率的协方差矩阵,P'(θ)为对应中心频率的对称功率谱的函数表示。例如,当协方差矩阵R为对应中心频率ω1的协方差矩阵时,上述对称功率谱的函数表示P'(θ)为对应中心频率ω1的对称功率谱的函数表示。利用上述对称功率谱的函数表示,即可描绘得到对称功率谱。
在另一个实施场景中,可以认为源功率谱的函数表示为搜索出P(θ)的极大值,故其分母aH(θ)R-1a(θ)的极小值可以认为声源的方位。同理,镜像功率谱的函数表示的分母aH(θ)(R-1)*a(θ)极小值可以认为声源关于预设方位镜像的方位,故为了搜索包含声源及其镜像的方位,可以认为搜索aH(θ)(R-1)*a(θ)+aH(θ)R-1a(θ)极小值,故此,可以构建得到对称功率谱的函数表示:
上式中,Re(R-1)表示协方差矩阵逆的实部,故相比于R-1(R-1)*为实数矩阵,从而能够在搜索过程中进一步降低运算量。
在一个实施场景中,可以在关于预设方位对称的对称功率谱的半空间谱中进行谱峰搜索,从而确定目标声源的方位,具体地,可以在不大于预设范围的半空间谱中进行谱峰搜索,或者还可以在不小于预设方位的半空间谱中进行谱峰搜索,从而确定目标声源的方位,在此不做限定。
区别于前述实施例,通过利用至少一个中心频率的响应数据,分别构建对应中心频率的源功率谱和镜像功率谱,且源功率谱为与目标声源对应的功率谱,镜像功率谱表示与目标声源关于预设方位对称的虚拟镜像源对应的功率谱,从而利用源功率谱和镜像功率谱,构建得到对应中心频率的对称功率谱,且对称功率谱关于预设方位对称,进而能够有利于后续在对称功率谱的半空间谱内进行搜索,故有利于提高声源定位的速度,并降低声源定位的复杂度。
请参阅图5,图5是图1中步骤S15一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S151:利用预设权值,将至少一个中心频率对应的对称功率谱进行加权处理,得到最终对称功率谱。
在一个实施场景中,可以根据实际应用情况对每一中心频率对应的对称功率谱设置一预设权值,从而可以利用预设权值对至少一个中心频率对应的对称功率谱进行加权处理,进而得到最终对称功率谱。具体地,可以将至少一个中心频率对应的对称功率谱在同一声源方位处的谱值分别利用预设权值进行加权处理,从而得到最终对称功率谱。
步骤S152:在最终对称功率谱的半空间谱中进行谱峰搜索,确定目标声源的方位。
具体地,为了便于利用在最终对称功率谱的半空间谱中搜索得到的谱峰,确定谱峰对应的方位正是声源的方位,还是其镜像,可以利用预设权值,将至少一个中心频率对应的源功率谱进行加权处理,从而得到最终源功率谱。请结合参阅图6,图6是最终源功率谱和最终对称功率谱一实施例的示意图,为了便于描述,图中只描绘其谱峰,如图6中的最终源功率谱,在θ1和θ2方位分别存在一谱峰,最终对称功率谱在在θ1和θ2方位分别存在一谱峰,且在θ1和θ2方位关于0度对称的方位-θ1和-θ2方位也分别存在一谱峰,故能够获取最终对称功率谱的半空间谱中搜索得到的谱峰对应的第一方位(如在图6中不大于0度的半空间谱中搜索得到的θ1和-θ2方位),以及搜索得到的声源方位关于预设方位对称的第二方位(如在图6中的θ2和-θ1方位),并获取第一方位在最终源功率谱中的第一谱值(如θ1方位在最终源功率谱中的第一谱值和-θ2方位在最终源功率谱中的第一谱值),以及第二方位在最终源功率谱中的第二谱值(如θ2方位在最终源功率谱中的第二谱值和-θ1方位在最终源功率谱的第二谱值),从而利用第一谱值和第二谱值之间的大小关系,确定第一方位或第二方位中的至少一者为目标声源的方位。
在一个具体的实施场景中,若第一谱值与第二谱值之间的比值大于预设阈值(例如,10),则确定第一方位为目标声源的方位。请结合参阅图6,可以确定第一方位θ1在最终源功率谱中的第一谱值,以及第二方位-θ1在最终源功率谱中的第二谱值,且根据图6可以确定第二谱值相对于第一谱值可以忽略不计,则可以确定第一方位θ1为目标声源的方位。
在另一个具体的实施场景中,若第二谱值与第一谱值之间的比值大于预设阈值(例如,10),则确定第二方位目标声源的方位。请继续结合参阅图6,可以确定第二方位θ2在最终源功率谱中的第二谱值,以及第一方位-θ2在最终源功率谱中的第一谱值,且根据图6可以确定第一谱值相对于第二谱值可以忽略不计,则可以确定第二方位θ2为目标声源的方位。
在又一个具体的实施场景中,若第一谱值和第二谱值之间的差值在预设数值范围(例如,0.9)内,则可以确定第一方位和第二方位均为目标声源的方位。
区别于前述实施例,通过利用预设权值,将至少一个中心频率对应的对称功率谱进行加权处理,得到最终对称功率谱,并在最终对称功率谱的半空间谱中进行谱峰搜索,确定目标声源的方位,能够进一步降低谱峰搜索的运算量,从而能够进一步提高声源定位的速度。
请参阅图7,图7是本申请声源定位装置70一实施例的框架示意图。声源定位装置70包括信号获取模块71、信号转换模块72、信号分析模块73、图谱构建模块74和方位确定模块75,信号获取模块71用于获取信号接收器接收到的目标声源的时域信号;信号转换模块72用于将时域信号进行时频转换,得到对应的频域信号;信号分析模块73用于对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据;图谱构建模块74用于利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,其中,功率谱表示声源方位与功率之间的关系;方位确定模块75用于利用至少一个功率谱,确定目标声源的方位。
上述方案,通过获取信号接收器接收到的目标声源的时域信号,从而对时域信号进行时频转换,得到对应的频域信号,并对频域信号进行频域分析,得到频域信号中至少一个子频带的中心频率的响应数据,故能够将宽带信号分成至少一个窄带信号,从而利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,且功率谱表示声源方位与功率之间的关系,故能够基于窄带信号进行声源分析,有利于提高声源定位的速度,进而利用至少一个功率谱确定的目标声源的方位,能够有利于提高声源定位的准确性,故此,能够快速且准确地进行声源定位。
在一些实施例中,信号接收器为均匀直线阵,图谱构建模块74包括第一构建子模块,用于利用至少一个中心频率的响应数据,分别构建对应中心频率的源功率谱和镜像功率谱,其中,源功率谱为与目标声源对应的功率谱,镜像功率谱表示与目标声源关于预设方位对称的虚拟镜像源对应的功率谱,图谱构建模块74包括第二构建子模块,用于利用源功率谱和镜像功率谱,构建得到对应中心频率的对称功率谱,其中,对称功率谱关于预设方位对称,方位确定模块75具体用于在对称功率谱的半空间谱中进行谱峰搜索,确定目标声源的方位,其中,半空间谱的声源方位不大于或不小于预设方位。
区别于前述实施例,通过利用至少一个中心频率的响应数据,分别构建对应中心频率的源功率谱和镜像功率谱,且源功率谱为与目标声源对应的功率谱,镜像功率谱表示与目标声源关于预设方位对称的虚拟镜像源对应的功率谱,从而利用源功率谱和镜像功率谱,构建得到对应中心频率的对称功率谱,且对称功率谱关于预设方位对称,进而能够有利于后续在对称功率谱的半空间谱内进行搜索,故有利于提高声源定位的速度,并降低声源定位的复杂度。
在一些实施例中,图谱构建模块74还包括第三构建子模块,用于利用预设权值,将至少一个中心频率对应的对称功率谱进行加权处理,得到最终对称功率谱,方位确定模块75具体用于在最终对称功率谱的半空间谱中进行谱峰搜索,确定目标声源的方位。
区别于前述实施例,通过利用预设权值,将至少一个中心频率对应的对称功率谱进行加权处理,得到最终对称功率谱,并在最终对称功率谱的半空间谱中进行谱峰搜索,确定目标声源的方位,能够进一步降低谱峰搜索的运算量,从而能够进一步提高声源定位的速度。
在一些实施例中,第三构建子模块具体用于将至少一个中心频率对应的对称功率谱在同一声源方位处的谱值分别利用预设权值进行加权处理,得到最终对称功率谱。
区别于前述实施例,通过将至少一个中心频率对应的对称功率谱在同一声源方位处的谱值分别利用预设权值进行加权处理,从而得到最终对称功率谱,能够准确地得到最终对称功率谱。
在一些实施例中,图谱构建模块74还包括第四构建子模块,用于利用预设权值,将至少一个中心频率对应的源功率谱进行加权处理,得到最终源功率谱,方位确定模块75包括方位获取子模块,用于获取在最终对称功率谱的半空间谱中搜索得到的谱峰对应的第一方位,以及搜索得到的声源方位关于预设方位对称的第二方位,方位确定模块75包括谱值获取子模块,用于获取第一方位在最终源功率谱中的第一谱值,以及与第一方位关于预设方位对称的第二方位在最终源功率谱中的第二谱值,方位确定模块75包括方位判定子模块,用于利用第一谱值和第二谱值之间的大小关系,确定第一方位或第二方位中的至少一者为目标声源的方位。
区别于前述实施例,通过利用预设权值,将至少一个中心频率对应的源功率谱进行加权处理,得到最终源功率谱,并获取在最终对称功率谱的半空间谱中搜索得到的谱峰对应的第一方位,以及搜索得到的声源方位关于预设方位对称的第二方位,从而获取第一方位在最终源功率谱中的第一谱值,以及与第一方位关于预设方位对称的第二方位在最终源功率谱中的第二谱值,进而利用第一谱值和第二谱值之间的大小关系,确定第一方位或第二方位中的至少一者为目标声源的方位,能够提高声源定位的准确性。
在一些实施例中,方位判定子模块包括第一确定单元,用于在第一谱值与第二谱值之间的比值大于预设阈值时,确定第一方位为目标声源的方位;方位判定子模块包括第二确定单元,用于第二谱值与第一谱值之间的比值大于预设阈值时,确定第二方位目标声源的方位;方位判定子模块包括第三确定单元,用于第一谱值和第二谱值之间的差值在预设数值范围内时,确定第一方位和第二方位为目标声源的方位。
区别于前述实施例,若第一谱值与第二谱值之间的比值大于预设阈值,则确定第一方位为目标声源的方位,且若第二谱值与第一谱值之间的比值大于预设阈值,则确定第二方位目标声源的方位,且若第一谱值和第二谱值之间的差值在预设数值范围内,则确定第一方位和第二方位为目标声源的方位,故能够根据第一谱值和第二谱值之间的大小关系,准确地判定第一方位和第二方位中的至少一者为目标声源的方位。
在一些实施例中,均匀直线阵包括多个阵元,第一构建子模块包括协方差矩阵获取单元,用于对至少一个中心频率的响应数据进行求解,得到对应中心频率的协方差矩阵,第一构建子模块包括阵列流形表示获取单元,用于基于多个阵元之间的距离,获取均匀直线阵的阵列流形表示,且阵列流形表示与声源方位相关,第一构建子模块包括第一函数求解单元,用于利用由阵列流形表示构建的约束条件,对由对应中心频率的协方差矩阵构建的功率谱函数进行求解,得到对应中心频率的源功率谱,第一构建子模块包括条件变换单元,用于利用阵列流表示与预设方位相关的对称特征,对约束条件进行对称变换,第一构建子模块包括第二函数求解单元,用于利用对称变换后的约束条件,对功率谱函数进行求解,得到对应中心频率的镜像功率谱。
区别于前述实施例,通过对至少一个中心频率的响应数据进行求解,得到对应中心频率的协方差矩阵,并基于多个阵元之间的距离,获取均匀直线阵的阵列流形表示,且阵列流形表示与声源方位相关,从而利用由阵列流形表示构建的约束条件,对由对应中心频率的协方差矩阵构建的功率谱函数进行求解,得到对应中心频率的源功率谱,并利用阵列流表示与预设方位相关的对称特征,对约束条件进行对称变换,从而利用对称变换后的约束条件,对功率谱函数进行求解,得到对应中心频率的镜像功率谱,能够准确地获取源功率谱和镜像功率谱。
在一些实施例中,阵列流表示为一与声源方位相关的矢量,与预设方位相关的对称特征包括:矢量的共轭矢量与矢量关于预设方位对称的对称矢量相同,对称变换包括:将约束条件中的矢量变换为共轭矢量。
在一些实施例中,第二构建子模块包括函数表示获取单元,用于利用求解得到的源功率谱的函数表示和求解得到的镜像功率谱的函数表示,得到对称功率谱的函数表示,第二构建子模块包括图谱构建单元,用于利用对称功率谱的函数表示,构建得到对称功率谱。
区别于前述实施例,通过利用求解得到的源功率谱的函数表示和求解得到的镜像功率谱的函数表示,得到对称功率谱的函数表示,从而利用对称功率谱的函数表示,构建得到对称功率谱,能够提高得到对称功率谱的速度,进而能够提高声源定位的速度。
在一些实施例中,时域信号包括由信号接收器所包含的多个阵元接收到的第一时域信号,声源定位装置70还包括加窗分帧模块,用于利用预设窗函数,对第一时域信号进行加窗分帧,得到多个第二时域信号,信号转换模块72具体用于将多个第二时域信号分别进行时频转换,得到与每一第二时域信号对应的频域信号,信号分析模块73包括频域分析子模块,用于对与每一第二时域信号对应的频域信号进行频域分析,得到至少一个子频带的中心频率;信号分析模块73包括数值统计子模块,用于统计同一中心频率在不同频域信号中的响应值,作为中心频率的响应数据。
区别于前述实施例,时域信号包括由多个阵元分别接收到的第一时域信号,利用预设窗函数,对第一时域信号进行加窗分帧,得到多个第二时域信号,并将多个第二时域信号分别进行时频转换,得到与每一第二时域信号对应的频域信号,从而对与每一第二时域信号对应的频域信号进行频域分析,得到至少一个子频带的中心频率,并统计同一中心频率在不同频域信号中的响应值,作为中心频率的响应数据,进而能够基于宽带信号统计得到窄带信号在不同中心频率上的响应数据,故能够有利于提高声源定位的速度。
在一些实施例中,响应数据的维数与信号接收器中所包含的阵元数量相等。
请参阅图8,图8是本申请电子设备80一实施例的框架示意图。异电子设备80包括相互耦接的存储器81和处理器82,存储器81存储有程序指令,处理器82用于执行程序指令以实现上述任一声源定位方法实施例中的步骤。
具体而言,处理器82用于控制其自身以及存储器81以实现上述任一声源定位方法实施例中的步骤。处理器82还可以称为CPU(Central Processing Unit,中央处理单元)。处理器82可能是一种集成电路芯片,具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器82可以由多个集成电路芯片共同实现。
上述方案,能够将宽带信号分成至少一个窄带信号,从而利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,且功率谱表示声源方位与功率之间的关系,故能够基于窄带信号进行声源分析,有利于提高声源定位的速度,进而利用至少一个功率谱确定的目标声源的方位,能够有利于提高声源定位的准确性,故此,能够快速且准确地进行声源定位。
请参阅图9,图9为本申请存储装置90一实施例的框架示意图。存储装置90存储有能够被处理器运行的程序指令901,程序指令901用于实现上述任一声源定位方法实施例中的步骤。
上述方案,能够将宽带信号分成至少一个窄带信号,从而利用至少一个中心频率的响应数据,构建对应中心频率的功率谱,且功率谱表示声源方位与功率之间的关系,故能够基于窄带信号进行声源分析,有利于提高声源定位的速度,进而利用至少一个功率谱确定的目标声源的方位,能够有利于提高声源定位的准确性,故此,能够快速且准确地进行声源定位。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (13)
1.一种声源定位方法,其特征在于,包括:
获取信号接收器接收到的目标声源的时域信号;
将所述时域信号进行时频转换,得到对应的频域信号;
对所述频域信号进行频域分析,得到所述频域信号中至少一个子频带的中心频率的响应数据;
利用至少一个所述中心频率的响应数据,构建对应所述中心频率的功率谱,其中,所述功率谱表示声源方位与功率之间的关系;
利用至少一个所述功率谱,确定所述目标声源的方位。
2.根据权利要求1所述的声源定位方法,其特征在于,所述信号接收器为均匀直线阵,所述利用至少一个所述中心频率的响应数据,构建对应所述中心频率的功率谱包括:
利用至少一个所述中心频率的响应数据,分别构建对应所述中心频率的源功率谱和镜像功率谱,其中,所述源功率谱为与所述目标声源对应的功率谱,所述镜像功率谱表示与所述目标声源关于预设方位对称的虚拟镜像源对应的功率谱;
利用所述源功率谱和所述镜像功率谱,构建得到对应所述中心频率的对称功率谱,其中,所述对称功率谱关于所述预设方位对称;
所述利用至少一个所述功率谱,确定所述目标声源的方位包括:
在所述对称功率谱的半空间谱中进行谱峰搜索,确定所述目标声源的方位,其中,所述半空间谱的声源方位不大于或不小于所述预设方位。
3.根据权利要求2所述的声源定位方法,其特征在于,所述在所述对称功率谱的半空间谱中进行谱峰搜索,确定所述目标声源的方位之前,所述方法还包括:
利用预设权值,将至少一个所述中心频率对应的对称功率谱进行加权处理,得到最终对称功率谱;
所述在所述对称功率谱的半空间谱中进行谱峰搜索,确定所述目标声源的方位包括:
在所述最终对称功率谱的半空间谱中进行谱峰搜索,确定所述目标声源的方位。
4.根据权利要求3所述的声源定位方法,其特征在于,所述利用预设权值,将至少一个所述中心频率对应的对称功率谱进行加权处理,得到最终对称功率谱包括:
将至少一个所述中心频率对应的对称功率谱在同一所述声源方位处的谱值分别利用所述预设权值进行加权处理,得到所述最终对称功率谱。
5.根据权利要求3所述的声源定位方法,其特征在于,所述在所述最终对称功率谱的半空间谱中进行谱峰搜索,确定所述目标声源的方位之前,所述方法还包括:
利用所述预设权值,将至少一个所述中心频率对应的源功率谱进行加权处理,得到最终源功率谱;
所述在所述最终对称功率谱的半空间谱中进行谱峰搜索,确定所述目标声源的方位包括:
获取在所述最终对称功率谱的半空间谱中搜索得到的谱峰对应的第一方位,以及搜索得到的声源方位关于所述预设方位对称的第二方位;
获取所述第一方位在所述最终源功率谱中的第一谱值,以及与所述第一方位关于所述预设方位对称的第二方位在所述最终源功率谱中的第二谱值;
利用所述第一谱值和所述第二谱值之间的大小关系,确定所述第一方位或所述第二方位中的至少一者为所述目标声源的方位。
6.根据权利要求5所述的声源定位方法,其特征在于,所述利用所述第一谱值和所述第二谱值之间的大小关系,确定所述第一方位或所述第二方位中的至少一者为所述目标声源的方位包括:
若所述第一谱值与所述第二谱值之间的比值大于预设阈值,则确定所述第一方位为所述目标声源的方位;
若所述第二谱值与所述第一谱值之间的比值大于所述预设阈值,则确定所述第二方位所述目标声源的方位;
若所述第一谱值和所述第二谱值之间的差值在预设数值范围内,则确定所述第一方位和所述第二方位为所述目标声源的方位。
7.根据权利要求2所述的声源定位方法,其特征在于,所述均匀直线阵包括多个阵元,所述利用至少一个所述中心频率的响应数据,分别构建对应所述中心频率的源功率谱和镜像功率谱包括:
对至少一个所述中心频率的响应数据进行求解,得到对应所述中心频率的协方差矩阵;
基于所述多个阵元之间的距离,获取所述均匀直线阵的阵列流形表示,且所述阵列流形表示与所述声源方位相关;
利用由所述阵列流形表示构建的约束条件,对由对应所述中心频率的协方差矩阵构建的功率谱函数进行求解,得到对应所述中心频率的所述源功率谱;以及,
利用所述阵列流表示与所述预设方位相关的对称特征,对所述约束条件进行对称变换;
利用对称变换后的所述约束条件,对所述功率谱函数进行求解,得到对应所述中心频率的所述镜像功率谱。
8.根据权利要求7所述的声源定位方法,其特征在于,所述阵列流表示为一与所述声源方位相关的矢量,与所述预设方位相关的对称特征包括:所述矢量的共轭矢量与所述矢量关于所述预设方位对称的对称矢量相同,所述对称变换包括:将所述约束条件中的所述矢量变换为所述共轭矢量。
9.根据权利要求7所述的声源定位方法,其特征在于,所述利用所述源功率谱和所述镜像功率谱,构建得到对应所述中心频率的对称功率谱包括:
利用求解得到的所述源功率谱的函数表示和求解得到的所述镜像功率谱的函数表示,得到所述对称功率谱的函数表示;
利用所述对称功率谱的函数表示,构建得到所述对称功率谱。
10.根据权利要求1所述的声源定位方法,其特征在于,所述时域信号包括由所述信号接收器所包含的多个阵元分别接收到的第一时域信号;
所述将所述时域信号进行时频转换,得到对应的频域信号之前,所述方法还包括:
利用预设窗函数,对所述第一时域信号进行加窗分帧,得到多个第二时域信号;
所述将所述时域信号进行时频转换,得到对应的频域信号包括:
将所述多个第二时域信号分别进行时频转换,得到与每一所述第二时域信号对应的频域信号;
所述对所述频域信号进行频域分析,得到所述频域信号的至少一个子频带及其中心频率的响应数据包括:
对与每一所述第二时域信号对应的频域信号进行频域分析,得到所述至少一个子频带的中心频率;
统计同一所述中心频率在不同所述频域信号中的响应值,作为所述中心频率的响应数据。
11.根据权利要求1所述的声源定位方法,其特征在于,所述响应数据的维数与所述信号接收器中所包含的阵元数量相等。
12.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至11任一项所述的声源定位方法。
13.一种存储装置,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至11任一项所述的声源定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010432870.1A CN111505569B (zh) | 2020-05-20 | 2020-05-20 | 声源定位方法以及相关设备、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010432870.1A CN111505569B (zh) | 2020-05-20 | 2020-05-20 | 声源定位方法以及相关设备、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111505569A true CN111505569A (zh) | 2020-08-07 |
CN111505569B CN111505569B (zh) | 2022-04-19 |
Family
ID=71872108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010432870.1A Active CN111505569B (zh) | 2020-05-20 | 2020-05-20 | 声源定位方法以及相关设备、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111505569B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113687305A (zh) * | 2021-07-26 | 2021-11-23 | 浙江大华技术股份有限公司 | 声源方位的定位方法、装置、设备及计算机可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080247566A1 (en) * | 2007-04-03 | 2008-10-09 | Industrial Technology Research Institute | Sound source localization system and sound source localization method |
CN101893698A (zh) * | 2010-06-22 | 2010-11-24 | 嘉兴学院 | 噪声源测试分析方法及其装置 |
CN102353960A (zh) * | 2011-06-16 | 2012-02-15 | 哈尔滨工程大学 | 前视避碰声纳浅海稳健高分辨方位估计方法 |
CN102879764A (zh) * | 2012-10-16 | 2013-01-16 | 浙江大学 | 一种水下声源方位估计方法 |
CN104316929A (zh) * | 2014-09-12 | 2015-01-28 | 何平 | 一种功率谱识别方法及装置 |
CN108445452A (zh) * | 2018-02-01 | 2018-08-24 | 北京云知声信息技术有限公司 | 改进的频域srp声源方位估计方法 |
CN110133596A (zh) * | 2019-05-13 | 2019-08-16 | 南京林业大学 | 一种基于频点信噪比和偏置软判决的阵列声源定位方法 |
CN110133594A (zh) * | 2018-02-09 | 2019-08-16 | 北京搜狗科技发展有限公司 | 一种声源定位方法、装置和用于声源定位的装置 |
CN110320492A (zh) * | 2019-07-16 | 2019-10-11 | 哈尔滨工程大学 | 一种基于导向矢量对称特性的低复杂度doa估计方法 |
-
2020
- 2020-05-20 CN CN202010432870.1A patent/CN111505569B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080247566A1 (en) * | 2007-04-03 | 2008-10-09 | Industrial Technology Research Institute | Sound source localization system and sound source localization method |
CN101893698A (zh) * | 2010-06-22 | 2010-11-24 | 嘉兴学院 | 噪声源测试分析方法及其装置 |
CN102353960A (zh) * | 2011-06-16 | 2012-02-15 | 哈尔滨工程大学 | 前视避碰声纳浅海稳健高分辨方位估计方法 |
CN102879764A (zh) * | 2012-10-16 | 2013-01-16 | 浙江大学 | 一种水下声源方位估计方法 |
CN104316929A (zh) * | 2014-09-12 | 2015-01-28 | 何平 | 一种功率谱识别方法及装置 |
CN108445452A (zh) * | 2018-02-01 | 2018-08-24 | 北京云知声信息技术有限公司 | 改进的频域srp声源方位估计方法 |
CN110133594A (zh) * | 2018-02-09 | 2019-08-16 | 北京搜狗科技发展有限公司 | 一种声源定位方法、装置和用于声源定位的装置 |
CN110133596A (zh) * | 2019-05-13 | 2019-08-16 | 南京林业大学 | 一种基于频点信噪比和偏置软判决的阵列声源定位方法 |
CN110320492A (zh) * | 2019-07-16 | 2019-10-11 | 哈尔滨工程大学 | 一种基于导向矢量对称特性的低复杂度doa估计方法 |
Non-Patent Citations (2)
Title |
---|
PAUL D.TEAL ET.AL: "《LOW FREQUENCY PHASE CALIBRATION FOR A CIRCULAR MICROPHONE ARRAY》", 《2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING-ICASSP"07》 * |
肖栋 等: "《基于波束形成的多类型多声源定位研究》", 《应用声学》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113687305A (zh) * | 2021-07-26 | 2021-11-23 | 浙江大华技术股份有限公司 | 声源方位的定位方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111505569B (zh) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109830245B (zh) | 一种基于波束成形的多说话者语音分离方法及系统 | |
CN103426435B (zh) | 具有移动约束的通过独立分量分析的源分离 | |
WO2021196905A1 (zh) | 语音信号去混响处理方法、装置、计算机设备和存储介质 | |
Schädler et al. | Separable spectro-temporal Gabor filter bank features: Reducing the complexity of robust features for automatic speech recognition | |
US10818302B2 (en) | Audio source separation | |
CN103854660B (zh) | 一种基于独立成分分析的四麦克语音增强方法 | |
Ganapathy et al. | Temporal envelope compensation for robust phoneme recognition using modulation spectrum | |
CN110544490A (zh) | 一种基于高斯混合模型和空间功率谱特征的声源定位方法 | |
Aroudi et al. | Dbnet: Doa-driven beamforming network for end-to-end reverberant sound source separation | |
Sainath et al. | Reducing the Computational Complexity of Multimicrophone Acoustic Models with Integrated Feature Extraction. | |
CN111505569B (zh) | 声源定位方法以及相关设备、装置 | |
Kameoka et al. | Statistical model of speech signals based on composite autoregressive system with application to blind source separation | |
CN113687305A (zh) | 声源方位的定位方法、装置、设备及计算机可读存储介质 | |
Krause et al. | Data diversity for improving DNN-based localization of concurrent sound events | |
Karimian-Azari et al. | Fast joint DOA and pitch estimation using a broadband MVDR beamformer | |
Arberet et al. | A tractable framework for estimating and combining spectral source models for audio source separation | |
Dehghan Firoozabadi et al. | A novel nested circular microphone array and subband processing-based system for counting and DOA estimation of multiple simultaneous speakers | |
JP7405758B2 (ja) | 音響オブジェクト抽出装置及び音響オブジェクト抽出方法 | |
Aroudi et al. | DBNET: DOA-driven beamforming network for end-to-end farfield sound source separation | |
Al-Ali et al. | Enhanced forensic speaker verification performance using the ICA-EBM algorithm under noisy and reverberant environments | |
Chen et al. | Multi-channel end-to-end neural network for speech enhancement, source localization, and voice activity detection | |
CN109074811B (zh) | 音频源分离 | |
Li et al. | TaylorBeamixer: Learning Taylor-Inspired All-Neural Multi-Channel Speech Enhancement from Beam-Space Dictionary Perspective | |
Li et al. | Separation of Multiple Speech Sources in Reverberant Environments Based on Sparse Component Enhancement | |
Di Persia et al. | Correlated postfiltering and mutual information in pseudoanechoic model based blind source separation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |