CN109212480B - 一种基于分布式辅助粒子滤波的声源跟踪方法 - Google Patents

一种基于分布式辅助粒子滤波的声源跟踪方法 Download PDF

Info

Publication number
CN109212480B
CN109212480B CN201811031156.0A CN201811031156A CN109212480B CN 109212480 B CN109212480 B CN 109212480B CN 201811031156 A CN201811031156 A CN 201811031156A CN 109212480 B CN109212480 B CN 109212480B
Authority
CN
China
Prior art keywords
sound source
calculating
local
node
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811031156.0A
Other languages
English (en)
Other versions
CN109212480A (zh
Inventor
张巧灵
唐柔冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811031156.0A priority Critical patent/CN109212480B/zh
Publication of CN109212480A publication Critical patent/CN109212480A/zh
Application granted granted Critical
Publication of CN109212480B publication Critical patent/CN109212480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders

Abstract

本发明公开一种基于分布式辅助粒子滤波的声源跟踪方法,包括:首先,在每一个节点l计算广义互相关函数
Figure DDA0001789763600000011
构造该节点的局部观测
Figure DDA0001789763600000012
计算k‑1时刻的每一个粒子
Figure DDA0001789763600000013
的辅助变量
Figure DDA0001789763600000014
利用平均一致性算法计算
Figure DDA0001789763600000015
对应的权重
Figure DDA0001789763600000016
并进行归一化;根据归一化的权重
Figure DDA0001789763600000017
对k‑1时刻的粒子重采样得到
Figure DDA0001789763600000018
通过声源动态模型以及k‑1时刻的粒子
Figure DDA0001789763600000019
预测k时刻的粒子
Figure DDA00017897636000000110
其次,对预测得到每一个粒子
Figure DDA00017897636000000111
利用局部观测
Figure DDA00017897636000000112
计算器局部权重,然后利用平均一致性算法计算其全局权重
Figure DDA00017897636000000113
并进行归一化;最后,根据粒子和权重计算出当前k时刻的声源位置。本发明能够在室内噪声和混响环境下对移动声源进行有效跟踪,仅要求节点间的局部通信,具有良好的可扩展性和对通信链路故障的鲁棒性。

Description

一种基于分布式辅助粒子滤波的声源跟踪方法
技术领域
本发明涉及室内声源跟踪的技术领域,具体涉及一种基于分布式辅助粒子滤波的声源跟踪方法。
背景技术
基于麦克风阵列的声源定位和跟踪是音频信号处理领域一个基本而重要的研究课题。它是众多音频处理问题的基础,如语音增强、去噪、语音识别、语音分离等,在许多应用场合发挥着极其重要的作用,如智能语音识别、音视频会议系统、智能音箱、车载免提电话系统、移动机器人、助听设备和监控系统等。智能语音识别系统,尤其是远场语音识别,对音频输入信号的质量非常敏感。通常,可在语音识别系统前端采用声源定位和跟踪技术预先得到说话人的位置或方向信息,然后使麦克风阵列波束指向该说话人,放大该方向音频信号的同时衰减其它方向捕捉的信号,提高拾取音频信号的质量,进而提高后端的语音识别性能。
基于麦克风网络的声源定位和跟踪,主要利用空间中多个不同位置的麦克风对同一声源信号的感知差异来估计该声源的空间位置信息。麦克风网络是一种新型的麦克风阵列,传统的麦克风阵列通常具有固定且规则的阵列结构;此外,受智能设备尺寸限制,阵列可容纳的麦克风数目不多,空间覆盖范围有限,导致其在许多应用场合(如远场语音交互)的抗噪声和抗混响性能不够理想。相比之下麦克风网络的节点部署灵活,空间覆盖范围更大,具有更好的抗噪声和抗混响能力;每个节点都有独立的数据处理能力,且对通信链路故障具有一定的鲁棒性。基于以上特点,麦克风网络已经出现迅速成为国内外学者的研究热点。
目前,关于麦克风网络的声源定位和跟踪方法大体分为以下几类:一是传统的声源定位方法,即先将麦克风接收的音频信号转化为某个定位函数,然后通过定位函数的最大波峰进行声源定位。这类方法在噪声或混响不严重的情况下取得了良好效果;然而,当噪声或混响较大时,定位函数往往呈现多个伪峰(Spurious Peaks),这些伪峰甚至会将真正声源对应的波峰“淹没”,导致错误的位置估计;此外,当声源移动时,用于定位算法的观测数据十分有限,导致定位性能下降;二基于神经网络的声源定位方法,即通过数据训练利用神经网络构建特征观测和声源位置(或方向)的映射关系,进而实现声源定位。早期Nakano等采用人工神经网络(ANN)对声源的方向和位置进行估计,近年来,Takeda和Komatani等采用深度学习网络(DNN)进行声源定位。这类方法依赖于定位函数提取的特征观测作为神经网路的输入,当噪声或混响较大,或者声源移动时,由定位函数提取的特征观测往往并不可靠,导致神经网络的定位性能下降;三是集中式声源跟踪方法,对于移动声源,跟踪方法主要根据声源的运动特性采用递推算法估计其位置信息,在噪声和混响环境下往往比定位方法性能更好。这类方法需要将所有的节点的观测信息传送到融合中心,但融合中心的功耗在麦克风巨大网络下会急剧增加,并且对融合中心的依赖性太强,一旦融合中心发生故障,网络将瘫痪;四是分布式声源跟踪方法,相比集中式的跟踪方法,这类方法往往不需要融合中心,只需要阵列中邻域节点之间的局部通信,其对节点或链路失败具有很好的鲁棒性,且具有良好的可扩展性,因而非常适合于灵活智能的阵列或网络。田野等基于扩展卡尔曼滤波算法,结合室内声源跟踪问题的特点,提出了一种基于分布式扩展卡尔曼滤波的声源跟踪方法。Zhong等人结合扩展卡尔曼滤波以及粒子滤波算法,提出了一种基于分布式扩展卡尔曼粒子滤波的声源跟踪算法。本人曾根据室内声源跟踪问题的特点,结合边缘粒子滤波(MPF)以及辅助粒子滤波(APF)算法,提出了一种基于分布式边缘辅助粒子滤波的声源跟踪算法。
总体而言,基于麦克风网络的分布式声源跟踪方法是室内声源跟踪问题的研究热点,该研究对于解决当前许多音频应用,如智能语音交互(尤其是远场语音交互)的技术落地具有十分重要的意义。然而,目前基于麦克风网络的分布式声源跟踪方法的研究尚不成熟,现有成果或多或少存在一定不足。
发明内容
针对上述现有技术的不足,本发明提出一种基于分布式辅助粒子滤波的声源跟踪方法,该方法适用于一般的非线性、非高斯跟踪问题,仅仅需要相邻节点之间的局部通信,且具有良好的鲁棒性和可扩展性。
在本发明中,本发明提供了一种基于分布式辅助粒子滤波的声源跟踪方法,该方法主要包括以下步骤:
S1,在每一个节点l计算广义互相关函数
Figure GDA0002515631940000031
利用
Figure GDA0002515631940000032
的多个局部极值点构造局部观测
Figure GDA0002515631940000033
l=1,2,…,L,L为麦克风节点的数目,k=1,2,…,K,,K为对声源进行位置估计的帧数;
S2,计算k-1时刻的每一个粒子
Figure GDA0002515631940000034
的辅助变量
Figure GDA0002515631940000035
及其权重
Figure GDA0002515631940000036
j=1,2,…,N;
S3,根据权重
Figure GDA0002515631940000037
对k-1的粒子
Figure GDA0002515631940000038
重采样得到
Figure GDA0002515631940000039
S4,根据声源动态模型以及k-1时刻的粒子
Figure GDA00025156319400000310
预测k时刻的粒子
Figure GDA00025156319400000311
S5,计算每一个粒子
Figure GDA00025156319400000312
的权重
Figure GDA00025156319400000313
S6,根据粒子
Figure GDA00025156319400000314
及其权重
Figure GDA00025156319400000315
计算声源位置
Figure GDA00025156319400000316
优选地,步骤S2具体包括以下步骤:
S21,通过公式
Figure GDA0002515631940000041
计算辅助变量
Figure GDA0002515631940000042
S22,通过多假设模型
Figure GDA0002515631940000043
计算局部似然概率
Figure GDA0002515631940000044
其中,
Figure GDA0002515631940000045
S23,利用平均一致性迭代公式由局部似然概率
Figure GDA0002515631940000046
计算全局似然概率
Figure GDA0002515631940000047
S24,通过公式
Figure GDA0002515631940000048
计算辅助变量
Figure GDA0002515631940000049
的权重
Figure GDA00025156319400000410
S25,归一化权重
Figure GDA00025156319400000411
优选地,步骤S5具体包括以下步骤:
S51,通过多假设模型
Figure GDA00025156319400000412
计算局部似然概率
Figure GDA00025156319400000413
S52,利用平均一致性迭代公式由局部似然概率
Figure GDA00025156319400000414
计算全局似然概率
Figure GDA00025156319400000415
S53,通过公式
Figure GDA00025156319400000416
计算权重
Figure GDA00025156319400000417
S54,归一化权重
Figure GDA00025156319400000418
其中i=1,2,…,N。
优选地,步骤S1中每一个节点l依据广义互相关函数
Figure GDA00025156319400000419
的前Nn个最大值对应的时延作为该节点的局部观测
Figure GDA00025156319400000420
Figure GDA00025156319400000421
相对于现有技术,本发明具有以下优点:
本发明结合辅助粒子滤波算法和室内声源跟踪问题的特点,提出一种基于分布式辅助粒子滤波的声源跟踪框架,该方法适用于一般的非线性、非高斯跟踪问题,仅仅需要相邻节点之间的局部通信,且具有良好的鲁棒性和可扩展性。
附图说明
图1为本发明的具体实施步骤。
图2为本发明实施例的分布式麦克风网络的通信图。
图3为本发明实施例的麦克风分布和扬声器的运动轨迹图。
具体实施方式
下面结合具体实施例和附图对本发明作详细说明。虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
如图1所示,本发明的利用分布式辅助粒子滤波算法进行声源跟踪的方法包括以下步骤:首先,在每一个节点l计算广义互相关函数
Figure GDA0002515631940000051
并且构造该节点的局部观测
Figure GDA0002515631940000052
计算出k-1时刻的每一个粒子
Figure GDA0002515631940000053
的辅助变量
Figure GDA0002515631940000054
利用平均一致性算法计算
Figure GDA0002515631940000055
对应的权重
Figure GDA0002515631940000056
并进行归一化;根据归一化的权重
Figure GDA0002515631940000057
对k-1时刻的粒子重采样得到
Figure GDA0002515631940000058
通过声源的动态模型以及k-1时刻的粒子
Figure GDA0002515631940000059
预测得出k时刻的粒子
Figure GDA00025156319400000510
其次,对预测得到每一个粒子
Figure GDA00025156319400000511
先利用局部观测
Figure GDA00025156319400000512
计算器局部权重,然后利用平均一致性算法计算其全局权重
Figure GDA00025156319400000513
并进行归一化;最后,根据粒子和权重计算出当前k时刻的声源位置。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。
本实施例是基于如图2所示的分布式麦克风网络的通信图进行说明。具体的模拟设置为:仿真环境是大小为5m×5m×3m的典型会议室,其中共有L=12个随机分布的麦克风节点,每个节点包括一对麦克风,两个麦克风之间的距离为Dm=0.6m。各个麦克风的位置可以预先通过校准算法估计得到。目标声源的运动轨迹是一个从(0.9,2.65)m到(4.1,2.65)m的半圆弧,如图3所示。为简便起见,麦克风的位置以及声源的移动轨迹都在高度为z=1.5m的平面上。声音传播速度为c=343m/s。xk表示为在k时刻声源的状态向量。在本实施例中,原始无混响的语音信号是一段长度为4s、采样频率为fs=16kHz的单通道16bit的纯净女性英语发音。在模拟期间,语音信号沿着如图2所示的移动轨迹被分成K=120帧,帧长度为ΔT=32ms。目标声源和麦克风之间的房间脉冲响应采用Image模型生成。将原始无混响的语音信号先与其对应的房间脉冲信号进行卷积,然后加上不同强度的高斯白噪声,最终可得到受噪声和混响污染的麦克风接收音频信号。
S1:在每一个节点l构造局部观测
Figure GDA0002515631940000061
首先,在节点l处计算两个麦克风信号之间的相位加权广义互相关(GCC-PATH)函数
Figure GDA0002515631940000062
Figure GDA0002515631940000063
其中,
Figure GDA0002515631940000064
Figure GDA0002515631940000065
分别表示为在节点l处的时域麦克风信号
Figure GDA0002515631940000066
Figure GDA0002515631940000067
的所对应的频域部分,符号*表示为复共轭操作。
进一步地,利用GCC函数
Figure GDA0002515631940000068
的多个局部极值点构造局部观测
Figure GDA0002515631940000069
局部观测
Figure GDA00025156319400000610
由GCC函数
Figure GDA00025156319400000611
的前Nn个最大峰值对应的时延组成,即
Figure GDA00025156319400000612
其中,
Figure GDA00025156319400000613
中的每一个元素
Figure GDA00025156319400000614
称为节点l的TDOA候选值,且
Figure GDA00025156319400000615
为节点l处可能的最大TDOA值,即
Figure GDA00025156319400000616
Figure GDA00025156319400000617
为节点l处包含的麦克风对与声源的距离,||·||为欧几里得范数。在本实施例中,Nn=4。
S2,计算出k-1时刻的每一个粒子
Figure GDA00025156319400000618
的辅助变量
Figure GDA00025156319400000619
及其权重
Figure GDA00025156319400000620
其中,j=1,2,…,N。具体地说,先计算出辅助变量
Figure GDA0002515631940000071
进一步地通过多假设模型计算出局部似然概率
Figure GDA0002515631940000072
再对局部似然概率
Figure GDA0002515631940000073
进行一致性迭代得到全局似然概率
Figure GDA0002515631940000074
最后通过公式
Figure GDA0002515631940000075
计算出权重
Figure GDA0002515631940000076
并进行归一化,即
Figure GDA0002515631940000077
在本实施例中,每个节点具有N=500个粒子。辅助变量权重
Figure GDA0002515631940000078
的计算公式为
Figure GDA0002515631940000079
其中E{·}为数学期望。接着,通过多假设模型计算出局部似然概率
Figure GDA00025156319400000710
多假设模型如下:
Figure GDA00025156319400000711
其中,
Figure GDA00025156319400000712
为节点l处的最大可能到达时间差(TDOA),可由S1得出。qn为第n个TDOA候选值与声源相关联的先验概率,且
Figure GDA00025156319400000713
为节点l处的TDOA的候选值,
Figure GDA00025156319400000714
表示服从正态分布
Figure GDA00025156319400000715
的随机向量在取值为
Figure GDA00025156319400000716
处的概率密度,且
Figure GDA00025156319400000717
表示状态
Figure GDA00025156319400000718
对应的位置向量。在本实施例中,Nn=4,q0=0.25,qn=0.1825,观测标准偏差是σ=5×105
进一步地,对局部似然概率
Figure GDA00025156319400000719
进行平均一致性迭代得到似然概率
Figure GDA00025156319400000720
平均一致性算法通常是以分布式方式计算平均值的方法。假设每个节点l∈v处的某个变量的初始值为il(0),并且其平均
Figure GDA00025156319400000721
可以通过以下递归共识迭代逐渐实现,
Figure GDA00025156319400000722
其中,t为迭代指数,ξll′是边(l,l′)的加权系数。随着迭代次数的增加,每个节点l∈v处的变量il(t)可以逐渐收敛于全局平均,即
Figure GDA0002515631940000081
特别地,ξll′采用的是Metropolis-Hastings加权,即
Figure GDA0002515631940000082
此一致性迭代算法仅仅需要临近节点的信息,而不需要全局信息,大大加大了算法的优化性。
迭代结束后,通过公式
Figure GDA0002515631940000083
计算出权重
Figure GDA0002515631940000084
并进行归一化,归一化的计算方法为:
Figure GDA0002515631940000085
S3,根据权重
Figure GDA0002515631940000086
对k-1的粒子
Figure GDA0002515631940000087
进行重采样得到
Figure GDA0002515631940000088
并设置其权重为
1/N;重采样公式如下:
Figure GDA0002515631940000089
其中,i=1,2,…,N。δ(·)为多维狄拉克函数,ji表示与第i个粒子
Figure GDA00025156319400000810
相对应的k-1时刻的粒子
Figure GDA00025156319400000811
的索引,在后面计算中,通常省略索引。
S4,通过声源的运动模型以及k-1时刻的粒子
Figure GDA00025156319400000812
预测得到k时刻的粒子
Figure GDA00025156319400000813
具体地,运动模型用郎之万模型进行迭代,即
Figure GDA00025156319400000814
其中,ΔT=Nf/fs是两次连续位置之间的时间间隔,Nf和fs是采样帧长和采样频率。uk是具有零均值和四阶协方差矩阵的高斯过程噪声序列,它反映了声源运动的不确定性。a=e-βΔT,
Figure GDA00025156319400000924
其中a是位置常数,b是速度常数,其中β是速率常数,
Figure GDA0002515631940000091
是稳定速度常数。在本实施例中,Nf=512,β=10s-1
Figure GDA0002515631940000092
ΔT=32ms,fs=16kHz。
S5,计算出每一个粒子
Figure GDA0002515631940000093
的权重
Figure GDA0002515631940000094
具体地说,通过多假设模型计算出局部似然概率
Figure GDA0002515631940000095
再对局部似然概率
Figure GDA0002515631940000096
进行一致性迭代得到全局似然概率
Figure GDA0002515631940000097
最后得出权重
Figure GDA0002515631940000098
并归一化,其中,局部似然概率
Figure GDA0002515631940000099
仍采用多假设模型计算,即
Figure GDA00025156319400000910
其中,
Figure GDA00025156319400000911
n=1,2,…,Nn。qn为第n个TDOA候选者与真正声源相关联的先验概率,且
Figure GDA00025156319400000912
为节点l处的TDOA的候选值,
Figure GDA00025156319400000913
表示服从正态分布
Figure GDA00025156319400000914
的随机向量在取值为
Figure GDA00025156319400000915
处的概率密度,且
Figure GDA00025156319400000916
Figure GDA00025156319400000917
表示状态
Figure GDA00025156319400000918
对应的位置向量。在本实例中,q0=0.25,qn=0.1825,σ=5×105
然后,对局部似然概率
Figure GDA00025156319400000919
进行平均一致性迭代得到全局似然概率
Figure GDA00025156319400000920
Figure GDA00025156319400000921
其中,exp()和log()分别表示自然指数和自然对数运算。在本实例中,共执行Nt=10次一致性迭代。
迭代结束后,计算k时刻第i个粒子
Figure GDA00025156319400000922
的权重
Figure GDA00025156319400000923
计算公式如下:
Figure GDA0002515631940000101
其中,ji表示粒子
Figure GDA0002515631940000102
前一时刻粒子
Figure GDA0002515631940000103
的索引。
Figure GDA0002515631940000104
可由S2得出。
最后,归一化权重
Figure GDA0002515631940000105
S6,根据粒子及其权重计算出声源位置
Figure GDA0002515631940000106
其中,
Figure GDA0002515631940000107
为状态
Figure GDA0002515631940000108
对应的位置向量。

Claims (7)

1.一种基于分布式辅助粒子滤波的声源跟踪方法,包括以下步骤:
S1,在每一个节点l处计算广义互相关函数
Figure FDA0002515631930000011
利用
Figure FDA0002515631930000012
的多个局部极值点构造局部观测
Figure FDA0002515631930000013
其中l=1,2,…,L,L为麦克风节点的数目,k=1,2,…,K,,K为对声源进行位置估计的帧数;
S2,计算k-1时刻的每一个粒子
Figure FDA0002515631930000014
的辅助变量
Figure FDA0002515631930000015
及其权重
Figure FDA0002515631930000016
其中j=1,2,…,N;
S3,根据权重
Figure FDA0002515631930000017
对k-1的粒子
Figure FDA0002515631930000018
重采样得到
Figure FDA0002515631930000019
其中,ji表示与第i个粒子
Figure FDA00025156319300000110
相对应的k-1时刻的粒子
Figure FDA00025156319300000111
的索引;
S4,根据声源动态模型以及k-1时刻的粒子
Figure FDA00025156319300000112
预测k时刻的粒子
Figure FDA00025156319300000113
S5,计算每一个粒子
Figure FDA00025156319300000114
的权重
Figure FDA00025156319300000115
S6,根据粒子
Figure FDA00025156319300000116
及其权重
Figure FDA00025156319300000117
计算声源位置
Figure FDA00025156319300000118
其中,
Figure FDA00025156319300000119
为状态
Figure FDA00025156319300000120
对应的位置向量。
2.根据权利要求1所述的方法,其特征在于:步骤S2具体包括以下步骤:
S21,通过公式
Figure FDA00025156319300000121
计算辅助变量
Figure FDA00025156319300000122
S22,通过多假设模型计算局部似然概率
Figure FDA00025156319300000123
S23,利用平均一致性迭代公式由局部似然概率
Figure FDA00025156319300000124
计算全局似然概率
Figure FDA00025156319300000125
S24,通过公式
Figure FDA00025156319300000126
计算辅助变量
Figure FDA00025156319300000127
的权重
Figure FDA00025156319300000128
S25,归一化权重
Figure FDA00025156319300000129
3.根据权利要求2所述的方法,其特征在于:步骤S23具体包括以下步骤:
S231,计算局部似然概率
Figure FDA00025156319300000130
的对数
Figure FDA00025156319300000131
S232,根据初始值
Figure FDA00025156319300000132
通过平均一致性迭代公式
Figure FDA00025156319300000133
Figure FDA00025156319300000134
得到全局平均
Figure FDA00025156319300000135
S233,由公式
Figure FDA00025156319300000136
计算得到全局似然概率
Figure FDA00025156319300000137
4.根据权利要求1所述的方法,其特征在于:步骤S5具体包括以下步骤:
S51,通过多假设模型计算局部似然概率
Figure FDA0002515631930000021
S52,利用平均一致性迭代公式由局部似然概率
Figure FDA0002515631930000022
计算全局似然概率
Figure FDA0002515631930000023
S53,通过公式
Figure FDA0002515631930000024
计算权重
Figure FDA0002515631930000025
S54,归一化权重
Figure FDA0002515631930000026
其中i=1,2,…,N。
5.根据权利要求1所述的方法,其特征在于:步骤S1中每一个节点l依据广义互相关函数
Figure FDA0002515631930000027
的前Nn个最大值对应的时延作为该节点的局部观测
Figure FDA0002515631930000028
Figure FDA0002515631930000029
Figure FDA00025156319300000210
6.根据权利要求4所述的方法,其特征在于,步骤S52具体包括以下步骤:
S521,计算局部似然概率
Figure FDA00025156319300000211
的对数
Figure FDA00025156319300000212
S522,根据初始值
Figure FDA00025156319300000213
通过平均一致性迭代公式
Figure FDA00025156319300000214
Figure FDA00025156319300000215
得到全局平均
Figure FDA00025156319300000216
S523,由公式
Figure FDA00025156319300000217
计算得到全局似然概率
Figure FDA00025156319300000218
7.根据权利要求2或4所述的方法,其特征在于,所述多假设模型为:
Figure FDA00025156319300000219
式中,
Figure FDA00025156319300000220
Figure FDA00025156319300000221
为节点l处的最大可能到达时间差TDOA,qn为第n个TDOA候选值与声源相关联的先验概率,且
Figure FDA00025156319300000222
Figure FDA00025156319300000223
为节点l处的TDOA的候选值,
Figure FDA00025156319300000224
表示服从正态分布
Figure FDA00025156319300000225
的随机向量在取值为
Figure FDA00025156319300000226
处的概率密度,且
Figure FDA00025156319300000227
Figure FDA00025156319300000228
表示状态xk对应的位置向量,
Figure FDA00025156319300000229
Figure FDA00025156319300000230
分别表示节点l内的两个麦克风的位置向量。
CN201811031156.0A 2018-09-05 2018-09-05 一种基于分布式辅助粒子滤波的声源跟踪方法 Active CN109212480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811031156.0A CN109212480B (zh) 2018-09-05 2018-09-05 一种基于分布式辅助粒子滤波的声源跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811031156.0A CN109212480B (zh) 2018-09-05 2018-09-05 一种基于分布式辅助粒子滤波的声源跟踪方法

Publications (2)

Publication Number Publication Date
CN109212480A CN109212480A (zh) 2019-01-15
CN109212480B true CN109212480B (zh) 2020-07-28

Family

ID=64986310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811031156.0A Active CN109212480B (zh) 2018-09-05 2018-09-05 一种基于分布式辅助粒子滤波的声源跟踪方法

Country Status (1)

Country Link
CN (1) CN109212480B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394546A (zh) * 2007-09-17 2009-03-25 华为技术有限公司 视频目标轮廓跟踪方法及装置
CN101980044A (zh) * 2010-01-22 2011-02-23 西安电子科技大学 未知测量噪声分布下的多目标跟踪方法
CN102257401A (zh) * 2008-12-16 2011-11-23 皇家飞利浦电子股份有限公司 使用粒子滤波估计声源地点
CN105590021A (zh) * 2015-11-06 2016-05-18 上海交通大学 基于麦克风阵列的动态数量声源跟踪方法
CN106875426A (zh) * 2017-02-21 2017-06-20 中国科学院自动化研究所 基于相关粒子滤波的视觉跟踪方法及装置
CN107038714A (zh) * 2017-04-17 2017-08-11 西安理工大学 多型视觉传感协同目标跟踪方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060245601A1 (en) * 2005-04-27 2006-11-02 Francois Michaud Robust localization and tracking of simultaneously moving sound sources using beamforming and particle filtering
WO2007129731A1 (ja) * 2006-05-10 2007-11-15 Honda Motor Co., Ltd. 音源追跡システム、方法、およびロボット

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394546A (zh) * 2007-09-17 2009-03-25 华为技术有限公司 视频目标轮廓跟踪方法及装置
CN102257401A (zh) * 2008-12-16 2011-11-23 皇家飞利浦电子股份有限公司 使用粒子滤波估计声源地点
CN101980044A (zh) * 2010-01-22 2011-02-23 西安电子科技大学 未知测量噪声分布下的多目标跟踪方法
CN105590021A (zh) * 2015-11-06 2016-05-18 上海交通大学 基于麦克风阵列的动态数量声源跟踪方法
CN106875426A (zh) * 2017-02-21 2017-06-20 中国科学院自动化研究所 基于相关粒子滤波的视觉跟踪方法及装置
CN107038714A (zh) * 2017-04-17 2017-08-11 西安理工大学 多型视觉传感协同目标跟踪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"麦克风网络中基于分布式粒子滤波的说话人跟踪方法研究";张巧灵;《中国博士学位论文全文数据库 信息科技辑》;20170815(第08期);第9-30页 *

Also Published As

Publication number Publication date
CN109212480A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN111239687B (zh) 一种基于深度神经网络的声源定位方法及系统
CN106251877B (zh) 语音声源方向估计方法及装置
JP6240995B2 (ja) 移動体、音響源マップ作成システムおよび音響源マップ作成方法
Mumolo et al. Algorithms for acoustic localization based on microphone array in service robotics
JP2017044916A (ja) 音源同定装置および音源同定方法
CN110610718B (zh) 一种提取期望声源语音信号的方法及装置
Zhong et al. A time–frequency masking based random finite set particle filtering method for multiple acoustic source detection and tracking
Vincent et al. Audio source localization by optimal control of a mobile robot
Brutti et al. Tracking of multidimensional TDOA for multiple sources with distributed microphone pairs
Marti et al. Real time speaker localization and detection system for camera steering in multiparticipant videoconferencing environments
Zhang et al. AcousticFusion: Fusing sound source localization to visual SLAM in dynamic environments
WO2022142853A1 (zh) 一种声源定位方法以及装置
US11460927B2 (en) Auto-framing through speech and video localizations
CN109212480B (zh) 一种基于分布式辅助粒子滤波的声源跟踪方法
Novoa et al. Weighted delay-and-sum beamforming guided by visual tracking for human-robot interaction
Choi et al. Convolutional neural network-based direction-of-arrival estimation using stereo microphones for drone
Diaz-Guerra et al. Direction of arrival estimation with microphone arrays using SRP-PHAT and neural networks
CN112180318B (zh) 声源波达方向估计模型训练和声源波达方向估计方法
CN113223552A (zh) 语音增强方法、装置、设备、存储介质及程序
Deleforge et al. Audio-motor integration for robot audition
Yang et al. A Review of Sound Source Localization Research in Three-Dimensional Space
CN109239665A (zh) 一种基于信号子空间相似度谱和粒子滤波器的多声源连续定位方法和装置
Tong et al. Robust sound localization of sound sources using deep convolution network
Wang et al. Real-time automated video and audio capture with multiple cameras and microphones
Banerjee et al. A novel sound source localization method using a global-best guided cuckoo search algorithm for drone-based search and rescue operations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant