CN101762806A - 声源定位方法和装置 - Google Patents

声源定位方法和装置 Download PDF

Info

Publication number
CN101762806A
CN101762806A CN201010105118A CN201010105118A CN101762806A CN 101762806 A CN101762806 A CN 101762806A CN 201010105118 A CN201010105118 A CN 201010105118A CN 201010105118 A CN201010105118 A CN 201010105118A CN 101762806 A CN101762806 A CN 101762806A
Authority
CN
China
Prior art keywords
mrow
msub
msubsup
spatial power
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201010105118A
Other languages
English (en)
Other versions
CN101762806B (zh
Inventor
詹五洲
王东琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Huawei Device Shenzhen Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN 201010105118 priority Critical patent/CN101762806B/zh
Publication of CN101762806A publication Critical patent/CN101762806A/zh
Priority to PCT/CN2011/070685 priority patent/WO2011091754A1/zh
Application granted granted Critical
Publication of CN101762806B publication Critical patent/CN101762806B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种声源定位方法和装置,方法包括:采集声源时域信号;将所述时域信号转换为频域信号;根据所述频域信号确定频率的空间功率谱;根据所述空间功率谱确定频率的空间功率概率。装置包括:采集单元,用于采集声源时域信号;转换单元,用于将所述时域信号转换为频域信号;功率确定单元,用于根据所述频域信号确定频率的空间功率谱;概率确定单元,用于根据所述空间功率谱确定频率的空间功率概率分布;定位单元,用于根据空间概率分布确定概率最大的空间位置。本发明运用空间功率概率分布确定声源,可以提高声源阵列在噪声、混响等环境下的定位准确性。

Description

声源定位方法和装置
技术领域
本发明涉及多媒体通信领域的音频处理技术,特别涉及一种声源定位方法。
背景技术
声源定位技术指的是估计除声源所在的位置。声源定位技术有着广泛的应用,例如在视频会议系统中,可采样声源定位技术估计出说话人所在的位置,然后控制摄像机镜头指向说话人所在的位置,实行声控切换功能。声源定位技术也可以应用到监控、语音增强等领域。
下面对现有的SRP(steered response power)以及SRP-PHAT(phasetrans form)声源定位技术进行介绍。
如图3所示,lps对应声源,l1和l2对应两个麦克风,如麦克风。从声源lps到两个麦克风l1和l2的时延分别用TOF(lps,l1)和TOF(lps,l1)表示。两个麦克风之间收到的信号分别为x1(t)和x2(t),则x1(t+TOF(lps,l1))∝x2(t+TOF(lps,l2)),其中:
TOF ( l ps , l m ) = | | l ps - l m | | c · f s , fs是采样频率,c是声速。
同时,对应的两个麦克风信号之间的时延τ有如下的定义,当τ=TOF(lps,l1)-TOF(lps,l2)时,x1(t)和x2(t)的时域互相关函数g(x1,x2)具有最大值,g(x1,x2)=∫Rx1(t)·x2(t+τ)dε。 
对于任一麦克风对q,它们的位置对应(laq,lbq),声源lps到达麦克风对q的理论到达时延差(TDOA,Time-difference of arrival)为
t q th ( l ps ) = def TOF ( l ps , l aq ) - TOF ( l ps , l bq ) .
SRP方法通过估计空间上的功率谱分布,找出功率最大的空间位置,该位置即为声源的位置。SRP最基本的公式如下:
l t PS = MAX l ( Σ n = 0 N - 1 P SRP ( k , l , x 1 ( t ) , . . . , x Nm ( t ) ) ) - - - ( 1 )
= MAX l ( Σ n = 0 N - 1 ( x ds ( t - n , l ) ) 2 )
其中,在l位置的声源被各个麦克风拾取后,在时间上对齐并累加的和信号为 x ds ( t , l ) = def x 1 ( t ) + Σ m = 2 N m x ( t + TOF ( l , l m ) ) - TOF ( l , l 1 ) .
由于受到不同声源之间的信号幅度、以及不同频率成分大小的影响,采用上面方法的效果并不好。因此现有公开文献中对该基本方法进行了改进,改进的方法是将各个声源采集的时域信号变换到频域,然后将各个频谱的幅度进行归一化,这样可以消除各个频谱幅度大小不一致的影响,该改进的算法在现有文献中称之为SRP-PHAT法,下面对该方法进行描述。
对采集到的t时刻开始的2NF个时域信号X(t)进行FFT变换,得到
X ( t ) = def [ X ( t ) ( 1 ) , · · · , X ( t ) ( k ) , · · · , X ( t ) ( 2 N F ) ] T
则公式(1)可以变换为:
l t PS = MAX l ( Σ k = 0 N - 1 P SRP ( k , l , X 1 t , . . . , X Nm t ) )
= MAX l ( Σ k = 0 N - 1 | X 1 t ( k ) + Σ m = 2 N m X m t ( k ) × exp ( j × u m ) | 2 ) - - - ( 2 )
u m = π × k N × ( TOF ( l , l m ) - TOF ( l , l 1 ) )
对公式(2)各个频率成分的幅度进行归一化,则得到SRP-PHAT法的计算公式:
l t PS = MAX l ( Σ k = 0 N - 1 P SRP ( k , l , X 1 t , . . . , X Nm t ) )
= MAX l ( Σ k = 0 N - 1 | X 1 t ( k ) | X 1 t ( k ) | + Σ m = 2 N m X m t ( k ) | X m t ( k ) | * exp ( j * u m ) | 2 ) - - - ( 3 )
上述SRP和SRP-PHAT法实际上都是在声源阵列周围的空间中放置多个预定点,然后计算各个预定点的功率值或修正的功率值,其最大值处所在位置即为声源所在位置。
但是在实际应用环境中,声源定位的准确性受到环境噪声、干扰声、混响等因素的影响较大,SRP和SRP-PHAT法均无法有效克服。
发明内容
本发明的目的是提供一种更加稳健的声源定位方法和装置,用以克服现有技术中的声源定位的准确性易受到环境噪声等因素干扰的影响。
本发明一个实施例提供一种声源定位方法,包括:采集声源时域信号;将所述时域信号转换为频域信号;根据所述频域信号确定频率的空间功率谱;根据所述空间功率谱确定频率的空间功率概率;根据空间概率分布确定概率最大的空间位置,作为声源位置。
本发明的另一个实施例提供一种生源定位装置,包括:采集单元,用于采集声源时域信号;转换单元,用于将所述时域信号转换为频域信号;功率确定单元,用于根据所述频域信号确定频率的空间功率谱;概率确定单元,用于根据所述空间功率谱确定频率的空间功率概率分布;定位单元,用于根据空间概率分布确定概率最大的空间位置。
本发明的实施例运用空间功率概率分布确定声源,可以提高声源阵列在噪声、混响等环境下的定位准确性。
附图说明
图1是本发明的声源定位方法的流程图;
图2是本发明的声源定位装置的结构示意图;
图3是现有声源定位方法的说明图。
具体实施方式
为使本发明的目的、技术方案和优点更加清晰易懂,下面结合附图,对本发明做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
实施例一
本实施例提供一种生源定位方法。如图1所示,该方法包括:
步骤101:采集声源时域信号;
在该步骤中,可以通过多个麦克风采集声源的时域信号x1,x2,…,xNm
步骤102:将所述时域信号转换为频域信号;
在该步骤中,将多个麦克风采集的时域信号为x1,x2,…,XNm转换为频域信号为X1,X2,…,XNm。时域信号到频域信号的变换方法通常傅里叶变换(FFT),也可以采用其他常用变换,例如余弦变换(DCT)。
步骤103:根据所述频域信号确定频率的空间功率谱;
在该步骤中,根据下式确定频率的空间功率谱,
P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) = Σ k = 0 N - 1 | X 1 t ( k ) | X 1 t ( k ) | + Σ m = 2 N m X m t ( k ) | X m t ( k ) | * exp ( j * u m ) | 2 .
步骤104:根据所述空间功率谱确定频率的空间功率概率分布;
在该步骤中,先确定单个频率的空间功率概率分布,然后再确定多个频率的空间功率概率分布。对于某个频率来说,其功率在空间上呈一定的分布,不同的频率分布差别较大,很显然不同分布的频率对定位的贡献是不一样。可以根据下面的公式确定单个频率的空间功率概率分布,
ρ P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) = P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) Σ l 0 P SRP - PHAT ( k , l 0 , X 1 t , . . . , X Nm t )
其中,
Figure GSA00000010951500052
表示第k个频率l位置上出现声源的概率。
将各单个频率的空间功率概率分布求和得到多个概率的空间功率分布。或者,将各单个频率的空间功率概率分布加权求和得到多个频率的空间功率分布,各单个频率的空间功率概率分布的权重随频率受噪音干扰影响的程度增大而减小。具体可以根据下面的公式计算多个频率的空间功率概率分布,
ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) = Σ k = 2 N F + 1 w k ρ P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t )
其中,wk是各单个频率的空间功率概率分布的权重,随单个频率的信号幅值增大而增大。
步骤105:根据空间概率分布确定概率最大的空间位置。
在该步骤中,可以根据下面的公式按当前帧确定概率最大的空间位置,
l PS t = MAX l ( ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) ) .
或者,根据下面的公式按多帧确定概率最大的空间位置,
l PS t = MAX l ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) + α 1 ρ P SRP - PHAT ( ALL , l , X 1 t - Δt , . . . , X Nm t - Δt ) + α T ρ P SRP - PHAT ( ALL , l , X 1 t - Δt * T , . . . , X Nm t - Δt * T ) , . . . ,
其中,
Figure GSA00000010951500056
是当前帧的频率的空间功率概率分布,是前一帧的频率的空间功率概率分布,
Figure GSA00000010951500058
是前T帧的频率的空间功率概率分布,α1为前一帧的衰减系数,αT是前T帧的衰减系数。
本发明实施例依据某个频率在某个空间位置呈现尖锐的概率分布,则在该位置出现音源的概率较大,反之则出现的概率较小的现象,对现有的声源定位方法进行改进,从而减小了环境噪声、干扰声、混响等因素对定位准确性的影响,提高了定位的准确性。
实施例二
本实施例提供一种声源定位装置。如图2所示,该装置200包括:
采集单元201,用于采集声源时域信号;
转换单元202,用于将所述时域信号转换为频域信号;
功率确定单元203,用于根据所述频域信号的确定频率的空间功率谱;
概率确定单元204,用于根据所述空间功率谱确定频率的空间功率概率分布;
定位单元205,用于根据空间概率分布确定概率最大的空间位置。
采集单元201,如多个麦克风,采集声源的时域信号x1,x2,…,xNm。转换单元202,如逻辑电路,将多个麦克风采集的时域信号为x1,x2,…,xNm转换为频域信号为X1,X2,…,XNm。时域信号到频域信号的变换方法通常傅里叶变换(FFT),也可以采用其他常用变换(请举例)。功率确定单元203根据下面公式将频域信号X1,X2,…,XNm确定频率的空间功率谱 P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) = Σ k = 0 N - 1 | X 1 t ( k ) | X 1 t ( k ) | + Σ m = 2 N m X m t ( k ) | X m t ( k ) | * exp ( j * u m ) | 2 . 概率确定单元204包括单频率概率确定模块214和多频率概率确定模块224,在根据所述空间功率谱确定频率的空间功率概率分布市,先由单频率概率确定模块214确定单个频率的空间功率概率分布,再由多频率概率确定模块224确定多个频率的空间功率概率分布。单频率概率确定模块214根据下面的公式确定单个频率的空间功率概率分布,
ρ P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) = P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) Σ l 0 P SRP - PHAT ( k , l 0 , X 1 t , . . . , X Nm t )
其中,
Figure GSA00000010951500072
表示第k个频率l位置上出现声源的概率。
多频率概率确定模块224可以将各单个频率的空间功率概率分布求和得到多个概率的空间功率分布。或者,多频率概率确定模块224可以将各单个频率的空间功率概率分布加权求和得到多个频率的空间功率分布,各单个频率的空间功率概率分布的权重随频率受噪音干扰影响的程度增大而减小。多频率概率确定模块224具体可以根据下面的公式计算多个频率的空间功率概率分布,
ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) = Σ k = 2 N F + 1 w k ρ P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t )
其中,wk是各单个频率的空间功率概率分布的权重,随单个频率的信号幅值增大而增大。
最后,定位单元205根据下面的公式按当前帧确定概率最大的空间位置,
l t PS = MAX l ( ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) ) .
或者,定位单元205根据下面的公式按多帧确定概率最大的空间位置,
l t PS = MAX l ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) + α 1 ρ P SRP - PHAT ( ALL , l , X 1 t - Δt , . . . , X Nm t - Δt ) , . . . , + α T ρ P SRP - PHAT ( ALL , l , X 1 t - Δt * T , . . . , X Nm t - Δt * T )
其中,是当前帧的频率的空间功率概率分布,
Figure GSA00000010951500077
是前一帧的频率的空间功率概率分布,是前T帧的频率的空间功率概率分布,α1为前一帧的衰减系数,αT是前T帧的衰减系数。
本发明实施例依据某个频率在某个空间位置呈现尖锐的概率分布,则在该位置出现音源的概率较大,反之则出现的概率较小的现象,对现有的声源定位方法进行改进,从而减小了环境噪声、干扰声、混响等因素对定位准确性的影响,提高了定位的准确性。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种声源定位方法,其特征在于,该方法包括:
采集声源时域信号;
将所述时域信号转换为频域信号;
根据所述频域信号确定频率的空间功率谱;
根据所述空间功率谱确定频率的空间功率概率分布;
根据空间概率分布确定概率最大的空间位置,以概率最大的空间位置作为声源位置。
2.根据权利要求1所述的方法,其特征在于,根据所述空间功率谱确定频率的空间功率概率分布的步骤包括:
确定单个频率的空间功率概率分布;
确定多个频率的空间功率概率分布。
3.根据权利要求2所述的方法,其特征在于:根据下面的公式确定单个频率的空间功率概率分布,
ρ P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) = P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) Σ l 0 P SRP - PHAT ( k , l 0 , X 1 t , . . . , X Nm t )
其中,
Figure FSA00000010951400012
(k,l,X1 t,...,XNm t)表示第k个频率l位置上出现声源的概率, P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) = Σ k = 0 N - 1 | X 1 t ( k ) | X 1 t ( k ) | + Σ m = 2 N M X m t ( k ) | X m t ( k ) | * exp ( j * u m ) | 2 , 表示k个频率l位置上的空间功率谱。
4.根据权利要求2所述的方法,其特征在于:将各单个频率的空间功率概率分布求和得到多个概率的空间功率分布。
5.根据权利要求2所述的方法,其特征在于:将各单个频率的空间功率概率分布加权求和得到多个频率的空间功率分布,各单个频率的空间功率概率分布的权重随频率受噪音干扰影响的程度增大而减小。
6.根据权利要求2所述的方法,其特征在于:根据下面的公式计算多个频率的空间功率概率分布,
ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) = Σ k = 2 N F + 1 w k ρ P SRP - PHAT ( k , l , X 1 t , . . . , X Nm t ) l
其中,wk是各单个频率的空间功率概率分布的权重。
7.根据权利要求5或6所述的方法,其特征在于:所述单个频率的空间功率概率分布的权重随单个频率的信号幅值增大而增大。
8.根据权利要求1所述的方法,其特征在于:根据下面的公式按当前帧确定概率最大的空间位置,
l PS t = MAX l ( ρ P SRP - PHAT ( ALL , l , X 1 t , · · · , X Nm t ) ) .
9.根据权利要求1所述的方法,其特征在于:根据下面的公式按多帧确定概率最大的空间位置,
l PS t = MAX l ρ P SRP - PHAT ( ALL , l , X 1 t , . . . , X Nm t ) + α 1 ρ P SRP - PHAT ( ALL , l , X 1 t - Δt , . . . , X Nm t - Δt ) , . . . , + α T ρ P SRP - PHAT ( ALL , l , X 1 t - Δt * T , . . . , X Nm t - Δt * T )
其中,
Figure FSA00000010951400024
(ALL,l,X1 t,...,XNm t)是当前帧的频率的空间功率概率分布,(ALL,l,X1 t-Δt,...,XNm t-Δt)是前一帧的频率的空间功率概率分布,
Figure FSA00000010951400026
(ALL,l,X1 t-Δt*T,...,XNm t-Δt*T)是前T帧的频率的空间功率概率分布,α1为前一帧的衰减系数,αT是前T帧的衰减系数。
10.一种声源定位装置,其特征在于,该装置包括:
采集单元,用于采集声源时域信号;
转换单元,用于将所述时域信号转换为频域信号;
功率确定单元,用于根据所述频域信号确定频率的空间功率谱;
概率确定单元,用于根据所述空间功率谱确定频率的空间功率概率分布;
定位单元,用于根据空间概率分布确定概率最大的空间位置,以概率最大的空间位置作为声源位置。
11.根据权利要求10所述的装置,其特征在于,所述概率确定单元包括:
单频率概率确定模块,用于确定单个频率的空间功率概率分布;
多频率概率确定模块,用于确定多个频率的空间功率概率分布。
CN 201010105118 2010-01-27 2010-01-27 声源定位方法和装置 Active CN101762806B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 201010105118 CN101762806B (zh) 2010-01-27 2010-01-27 声源定位方法和装置
PCT/CN2011/070685 WO2011091754A1 (zh) 2010-01-27 2011-01-27 声源定位方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010105118 CN101762806B (zh) 2010-01-27 2010-01-27 声源定位方法和装置

Publications (2)

Publication Number Publication Date
CN101762806A true CN101762806A (zh) 2010-06-30
CN101762806B CN101762806B (zh) 2013-03-13

Family

ID=42494092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010105118 Active CN101762806B (zh) 2010-01-27 2010-01-27 声源定位方法和装置

Country Status (2)

Country Link
CN (1) CN101762806B (zh)
WO (1) WO2011091754A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103200A (zh) * 2010-11-29 2011-06-22 清华大学 一种分布式非同步声传感器的声源空间定位方法
WO2011091754A1 (zh) * 2010-01-27 2011-08-04 华为终端有限公司 声源定位方法和装置
CN102854494A (zh) * 2012-08-08 2013-01-02 Tcl集团股份有限公司 一种声源定位方法及装置
CN103076593A (zh) * 2012-12-28 2013-05-01 中国科学院声学研究所 一种声源定位方法及装置
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法
CN106093864A (zh) * 2016-06-03 2016-11-09 清华大学 一种麦克风阵列声源空间实时定位方法
CN106448703A (zh) * 2014-03-05 2017-02-22 佛山科学技术学院 一种激光反射声源定位方法
CN108510987A (zh) * 2018-03-26 2018-09-07 北京小米移动软件有限公司 语音处理方法及装置
CN109188362A (zh) * 2018-09-03 2019-01-11 中国科学院声学研究所 一种麦克风阵列声源定位信号处理方法
CN110082724A (zh) * 2019-05-31 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质
CN110677782A (zh) * 2018-07-03 2020-01-10 国际商业机器公司 信号自适应噪声过滤器
CN110797045A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 声音处理方法、系统、电子设备和计算机可读介质
CN110888112A (zh) * 2018-09-11 2020-03-17 中国科学院声学研究所 一种基于阵列信号的多目标定位识别方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110544490B (zh) * 2019-07-30 2022-04-05 南京工程学院 一种基于高斯混合模型和空间功率谱特征的声源定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080170472A1 (en) * 2007-01-17 2008-07-17 Toyota Engineering & Manufacturing North America, Inc. Method and system for locating a wave source within a defined area
CN101595739A (zh) * 2007-01-26 2009-12-02 微软公司 多传感器声源定位

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4051325B2 (ja) * 2003-08-19 2008-02-20 日本電信電話株式会社 話者位置検出方法、装置、プログラム、および記録媒体
EP1600791B1 (en) * 2004-05-26 2009-04-01 Honda Research Institute Europe GmbH Sound source localization based on binaural signals
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
CN101295015A (zh) * 2007-04-23 2008-10-29 财团法人工业技术研究院 声源定位系统及声源定位方法
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080170472A1 (en) * 2007-01-17 2008-07-17 Toyota Engineering & Manufacturing North America, Inc. Method and system for locating a wave source within a defined area
CN101595739A (zh) * 2007-01-26 2009-12-02 微软公司 多传感器声源定位

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
蔡卫平 等: "一种基于离散时延的鲁棒声源三维定位方法", 《东南大学学报(自然科学版)》 *
谭颖 等: "改进的SRP-PHAT声源定位方法", 《电子与信息学报》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011091754A1 (zh) * 2010-01-27 2011-08-04 华为终端有限公司 声源定位方法和装置
CN102103200B (zh) * 2010-11-29 2012-12-05 清华大学 一种分布式非同步声传感器的声源空间定位方法
CN102103200A (zh) * 2010-11-29 2011-06-22 清华大学 一种分布式非同步声传感器的声源空间定位方法
CN102854494B (zh) * 2012-08-08 2015-09-09 Tcl集团股份有限公司 一种声源定位方法及装置
CN102854494A (zh) * 2012-08-08 2013-01-02 Tcl集团股份有限公司 一种声源定位方法及装置
CN103076593A (zh) * 2012-12-28 2013-05-01 中国科学院声学研究所 一种声源定位方法及装置
CN106448703A (zh) * 2014-03-05 2017-02-22 佛山科学技术学院 一种激光反射声源定位方法
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法
CN106093864A (zh) * 2016-06-03 2016-11-09 清华大学 一种麦克风阵列声源空间实时定位方法
CN108510987A (zh) * 2018-03-26 2018-09-07 北京小米移动软件有限公司 语音处理方法及装置
US10930304B2 (en) 2018-03-26 2021-02-23 Beijing Xiaomi Mobile Software Co., Ltd. Processing voice
CN110677782A (zh) * 2018-07-03 2020-01-10 国际商业机器公司 信号自适应噪声过滤器
CN110797045A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 声音处理方法、系统、电子设备和计算机可读介质
CN109188362A (zh) * 2018-09-03 2019-01-11 中国科学院声学研究所 一种麦克风阵列声源定位信号处理方法
CN110888112A (zh) * 2018-09-11 2020-03-17 中国科学院声学研究所 一种基于阵列信号的多目标定位识别方法
CN110082724A (zh) * 2019-05-31 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质

Also Published As

Publication number Publication date
WO2011091754A1 (zh) 2011-08-04
CN101762806B (zh) 2013-03-13

Similar Documents

Publication Publication Date Title
CN101762806B (zh) 声源定位方法和装置
CN104157295B (zh) 用于检测及抑制瞬态噪声的方法
WO2015196729A1 (zh) 一种麦克风阵列语音增强方法及装置
CN109215677B (zh) 一种适用于语音和音频的风噪检测和抑制方法和装置
Mohan et al. Localization of multiple acoustic sources with small arrays using a coherence test
Kjems et al. Maximum likelihood based noise covariance matrix estimation for multi-microphone speech enhancement
EP3278572B1 (en) Adaptive mixing of sub-band signals
CN104103277A (zh) 一种基于时频掩膜的单声学矢量传感器目标语音增强方法
CN103278801A (zh) 一种变电站噪声成像侦测装置及侦测计算方法
JP6604331B2 (ja) 音声処理装置および方法、並びにプログラム
CN102411138A (zh) 一种机器人声源定位方法
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN106646350B (zh) 一种单只矢量水听器各通道幅度增益不一致时的修正方法
CN104835503A (zh) 一种改进gsc自适应语音增强方法
CN109188362A (zh) 一种麦克风阵列声源定位信号处理方法
CN103760520A (zh) 一种基于avs和稀疏表示的单语者声源doa估计方法
CN106031196A (zh) 信号处理装置、方法以及程序
CN102333052A (zh) 一种适用于浅海低频条件的水声信号盲解卷方法
Zhang et al. An improved delay algorithm based on generalized cross correlation
CN110890099B (zh) 声音信号处理方法、装置以及存储介质
CN111157949A (zh) 一种语音识别及声源定位方法
JP2010103617A (ja) 発話向き推定装置、方法及びプログラム
CN204795569U (zh) 一种便携式双传声器声源识别与定位装置
CN111863017B (zh) 一种基于双麦克风阵列的车内定向拾音方法及相关装置
Li et al. Noise PSD Insensitive RTF Estimation in a Reverberant and Noisy Environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee after: Huawei terminal (Shenzhen) Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: HUAWEI DEVICE Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181221

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: HUAWEI DEVICE Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: Huawei terminal (Shenzhen) Co.,Ltd.