WO2011091754A1 - 声源定位方法和装置 - Google Patents

声源定位方法和装置 Download PDF

Info

Publication number
WO2011091754A1
WO2011091754A1 PCT/CN2011/070685 CN2011070685W WO2011091754A1 WO 2011091754 A1 WO2011091754 A1 WO 2011091754A1 CN 2011070685 W CN2011070685 W CN 2011070685W WO 2011091754 A1 WO2011091754 A1 WO 2011091754A1
Authority
WO
WIPO (PCT)
Prior art keywords
spatial power
probability distribution
frequency
spatial
determining
Prior art date
Application number
PCT/CN2011/070685
Other languages
English (en)
French (fr)
Inventor
詹五洲
王东琦
Original Assignee
华为终端有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为终端有限公司 filed Critical 华为终端有限公司
Publication of WO2011091754A1 publication Critical patent/WO2011091754A1/zh

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Definitions

  • the sampled sound source localization technique estimates the position of the speaker, then controls the camera lens to point to the speaker's position, and implements a voice-activated switching function.
  • Sound source localization technology can also be applied to monitoring, voice enhancement and other fields.
  • SRP steered response power
  • SRP-PHAT phase transform
  • the delay of ⁇ is represented by T ⁇ C ⁇ ⁇ i).
  • the signals received by the two microphones are and W, then A i + TOF ⁇ s , £ l )) ⁇ x 2 (t + TOF(£" ⁇ £ 2 )) j where:
  • the theoretical arrival delay difference (TD0A, Time-difference of arrival) of the arriving microphone pair is def
  • the improved method is to transform the time domain signals collected by each sound source into the frequency domain, and then normalize the amplitude of each spectrum, so as to eliminate the influence of the inconsistency of each spectrum amplitude.
  • the improved algorithm This is referred to as the SRP-PHAT method in the prior art, and the method will be described below.
  • An embodiment of the present invention provides a sound source localization method, including: collecting a sound source time domain signal; converting the time domain signal into a frequency domain signal; determining a spatial power spectrum of the frequency according to the frequency domain signal; The spatial power spectrum determines the spatial power probability of the frequency; the spatial position with the highest probability is determined according to the spatial probability distribution as the sound source position.
  • a source positioning device including: an acquisition unit, configured to collect a sound source time domain signal; a conversion unit, configured to convert the time domain signal into a frequency domain signal; And determining, by the frequency domain signal, a spatial power spectrum of the frequency; a probability determining unit, configured to determine a spatial power probability distribution of the frequency according to the spatial power spectrum; and a positioning unit, configured to determine a spatial location with the highest probability according to the spatial probability distribution.
  • the embodiment of the present invention uses the spatial power probability distribution to determine the sound source, which can improve the positioning accuracy of the sound source array in environments such as noise and reverberation.
  • BRIEF DESCRIPTION OF THE DRAWINGS In order to more clearly illustrate the embodiments of the present invention or the technical solutions in the prior art, the drawings to be used in the embodiments or the description of the prior art will be briefly described below, and obviously, in the following description The drawings are only some of the embodiments of the present invention, and those skilled in the art can obtain other drawings based on these drawings without any creative work.
  • FIG. 1 is a flowchart of a sound source localization method according to an embodiment of the present invention
  • FIG. 2 is a schematic structural diagram of a sound source localization apparatus according to an embodiment of the present invention.
  • FIG. 3 is an explanatory diagram of a sound source localization method in the prior art.
  • the present invention will be further described in detail with reference to the accompanying drawings.
  • the illustrative embodiments of the invention and their description are used to explain the invention, but not as a pair The definition of the invention.
  • This embodiment provides a source localization method. As shown in Figure 1, the method includes:
  • Step 101 collecting a sound source time domain signal
  • step 101 the time domain signals X1 , 3 ⁇ 4, . . . , of the sound source can be collected by a plurality of microphones.
  • Step 102 Convert the time domain signal into a frequency domain signal.
  • the time domain signals collected by the plurality of microphones are X1 , 3 ⁇ 4, ⁇ , converted into frequency domain signals, 3 ⁇ 4, ⁇ , whatsoever.
  • the conversion method of the time domain signal to the frequency domain signal usually Using Fourier Transform (FFT), other commonly used transforms such as Discrete Cosine Transform (DCT) can also be used.
  • FFT Fourier Transform
  • DCT Discrete Cosine Transform
  • Step 103 Determine a spatial power spectrum of the frequency according to the frequency domain signal
  • the spatial power spectrum of the frequency can be determined according to the following formula.
  • Step 104 Determine a spatial power probability distribution of the frequency according to the spatial power spectrum
  • a spatial power probability distribution for a single frequency may be determined prior to determining a spatial power probability distribution for the plurality of frequencies. For a certain frequency, its power is spatially distributed, and the different frequency distributions are different. It is obvious that the frequency of different distributions contributes differently to the positioning.
  • the spatial power probability distribution of each individual frequency can be summed to obtain a spatial power probability distribution of multiple frequencies; or the spatial power probability distribution of each individual frequency can be weighted and summed to obtain spatial power of multiple frequencies. Probability distribution, the weight of the spatial power probability distribution of each individual frequency decreases as the frequency is affected by noise interference. Alternatively, the spatial power probability distribution of multiple frequencies may be calculated according to the following formula. Pp— (U, x[ , ⁇ , ) , - Nm ) Where w is the weight of the spatial power probability distribution for each individual frequency, which increases as the amplitude of the signal at a single frequency increases.
  • Step 105 Determine a spatial location with the highest probability according to the spatial power probability distribution.
  • step 105 the space position with the highest probability can be determined by the frame.
  • the spatial position with the highest probability can be determined by multiple frames.
  • PP S RP i ⁇ , A ⁇ ',..., X Nm is the spatial power probability distribution of the frequency of the pre-f frame of the county, p -At ⁇ t-At
  • V 7 7 Nm is the spatial power probability distribution of the frequencies of the previous frame
  • Is the spatial power probability distribution of the frequency of the previous T frame
  • is the attenuation coefficient of the previous frame
  • ⁇ ⁇ is the attenuation coefficient of the preceding frame.
  • a sharp probability distribution is presented at a certain spatial position, and the probability that the sound source appears at the position is large, and the probability of occurrence of the sound source is small, and the existing sound source localization method is improved. Therefore, the influence of environmental noise, interference sound, reverberation and the like on the positioning accuracy is reduced, and the accuracy of the positioning is improved.
  • the apparatus 200 includes:
  • the collecting unit 201 is configured to collect a sound source time domain signal
  • the converting unit 202 is configured to convert the time domain signal into a frequency domain signal
  • a power determining unit 203 configured to determine a spatial power spectrum according to the frequency of the frequency domain signal
  • the probability determining unit 204 is configured to determine a spatial power probability distribution of the frequency according to the spatial power spectrum; and the positioning unit 205 is configured to determine a spatial location with the highest probability according to the spatial power probability distribution.
  • the collecting unit 201 may include a plurality of microphones for respectively acquiring the time domain signals X1 , 3 ⁇ 4, . . . , of the sound source.
  • Conversion unit 202 may include logic circuitry for a plurality of time domain signals Xl microphones collected, 3 ⁇ 4, ..., ⁇ into a frequency domain signal, 3 ⁇ 4, * ⁇ , ⁇ ⁇ .
  • the transform method of the time domain signal to the frequency domain signal may adopt a fast Fourier transform FFT, or may use other commonly used transforms, such as a discrete cosine transform DCT.
  • the power determining unit 203 can determine the spatial power spectrum of the frequency by using the frequency domain signal, 3 ⁇ 4 , * ⁇ , ⁇ ⁇ according to the following formula, exp (corpse)
  • the probability determination unit 204 can include a single frequency probability determination module 214 and a multiple frequency probability determination module 224.
  • the single frequency probability determination module 214 first determines the spatial power probability distribution of the single frequency, and then the multi-frequency probability determination module 224 determines the spatial power probability distribution of the multiple frequencies. .
  • the single frequency probability determination module 214 can determine the spatial power probability distribution for a single frequency according to the following formula.
  • the multi-frequency probability determination module 224 may sum the spatial power probability distributions of the individual frequencies to obtain a spatial power probability distribution of the plurality of frequencies, or the multi-frequency probability determining module 224 may weight and sum the spatial power probability distributions of the individual frequencies.
  • the spatial power probability distribution of multiple frequencies, the weight of the spatial power probability distribution of each individual frequency decreases as the frequency is affected by noise interference.
  • the locating unit 205 can determine the spatial position with the highest probability according to the current frame according to the following formula.
  • the positioning unit 205 may determine the spatial position with the highest probability according to the following formula according to the following formula. its The inter-power probability distribution, P PSKP ⁇ , ⁇ , ⁇ , is the spatial power probability distribution of the previous frame frequency, r ⁇ is the spatial power probability distribution of the pre- ⁇ frame frequency, ⁇ is the attenuation coefficient of the previous frame, ⁇ ⁇ Is the attenuation coefficient of the front frame.
  • a sharp probability distribution is presented at a certain spatial position, and the probability that the sound source appears at the position is large, and the probability of occurrence of the sound source is small, and the existing sound source localization method is improved. Therefore, the influence of environmental noise, interference sound, reverberation and the like on the positioning accuracy is reduced, and the accuracy of the positioning is improved.

Description

声源定位方法和装置 本申请要求于 2010年 01月 27日提交中国专利局、 申请号为 CN 201010105118.2、 发明名称为 "声源定位方法和装置"的中国专利申请的优先权, 其全部内容通过引用结 合在本申请中。 技术领域 本发明涉及多媒体通信领域的音频处理技术, 特别涉及一种声源定位方法。 背景技术 声源定位技术指的是估计除声源所在的位置。 声源定位技术有着广泛的应用, 例如 在视频会议系统中, 可采样声源定位技术估计出说话人所在的位置, 然后控制摄像机镜 头指向说话人所在的位置, 实行声控切换功能。 声源定位技术也可以应用到监控、 语音 增强等领域。
下面对现有的 SRP (steered response power)声源定位技术以及 SRP-PHAT (phase transform) 声源定位技术进行介绍。 如图 3所示, ^"对应声源, ^和 ^对应两个麦克风。从声源^ "到两个麦克风 ^和
^的时延分别用 T^C^^ ^^^i)表示。 两个麦克风收到的信号分别为 和 W ,则 A i + TOF{ sl))∞x2(t + TOF(£"\£2))j 其中:
.TH · /'^ p 、 - '·'■ 'ν :ί f
" , fs是采样频率, C是声速。
同时, 对应的两个麦克风信号之间 的时延 f 有如下的定义, 当 T = TOF(£psl)-TOF(£ps2) j χ^)和 «的时域互相关函数 g( ,¾;)具有最大值, g(xl ,x2) = xl (t) - x2 (t + τ)άε 对于任一麦克风对 它们的位置对应 (^ ' ),声源 ^到达麦克风对 的理论到 达 时 延 差 ( TD0A , Time-difference of arrival ) 为 def
tq'hps) = TOF(£ps ,laq) - TOF(lps ,lbq) SRP方法通过估计空间上的功率谱分布, 找出功率最大的空间位置, 该位置即为声 源的位置。 SRP :
Figure imgf000004_0001
其中, 在 ^位置的声源被各个麦克风拾取后, 在时间上对齐并累加的和信号为
;s- ¾ ίί) + " if:, -r 由于受到不同声源之间的信号幅度、 以及不同频率成分大小的影响, 采用上面 SRP 方法的效果并不好。 因此现有公开文献中对该基本方法进行了改进, 改进的方法是将各 个声源采集的时域信号变换到频域, 然后将各个频谱的幅度进行归一化, 这样可以消除 各个频谱幅度大小不一致的影响, 该改进的算法在现有文献中称之为 SRP-PHAT法, 下 面对该方法进行描述。
对采集到的 t 时刻开始的 2NF个时域信号 Χω进行 FFT 变换, 得到
Figure imgf000004_0002
则公式 (1) 可以变换为:
Figure imgf000004_0003
um=^ x(TOF(£,£ -TOF(£,£l)) 公式 (2) 中的 N和NF含义相同, 本说明书的后续部分 N和NF也具有相同含义。 对公式 (2) 各个频率成分的幅度进行归一化, 则得到 SRP-PHAT法的计算公式:
MAX「§尸 (k, £, x[ xN'm )
Figure imgf000004_0004
上述 SRP和 SRP-PHAT法实际上都是在声源阵列周围的空间中放置多个预定点, 然 后计算各个预定点的功率值或修正的功率值, 其最大值处所在位置即为声源所在位置。
但是在实际应用环境中, 声源定位的准确性受到环境噪声、 干扰声、 混响等因素的 影响较大, SRP和 SRP-PHAT法均无法有效克服。 发明内容
本发明的目的是提供一种更加稳健的声源定位方法和装置,用以克服现有技术中的 声源定位的准确性易受到环境噪声等因素干扰的影响。
本发明一个实施例提供一种声源定位方法, 包括: 采集声源时域信号; 将所述时域 信号转换为频域信号; 根据所述频域信号确定频率的空间功率谱; 根据所述空间功率谱 确定频率的空间功率概率;根据空间概率分布确定概率最大的空间位置,作为声源位置。
本发明的另一个实施例提供一种生源定位装置, 包括: 采集单元, 用于采集声源时 域信号; 转换单元, 用于将所述时域信号转换为频域信号; 功率确定单元, 用于根据所 述频域信号确定频率的空间功率谱; 概率确定单元, 用于根据所述空间功率谱确定频率 的空间功率概率分布; 定位单元, 用于根据空间概率分布确定概率最大的空间位置。
本发明的实施例运用空间功率概率分布确定声源, 可以提高声源阵列在噪声、 混响 等环境下的定位准确性。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现有 技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还 可以根据这些附图获得其他的附图。
图 1是本发明实施例的声源定位方法的流程图;
图 2是本发明实施例的声源定位装置的结构示意图;
图 3是现有技术中声源定位方法的说明图。 具体实肺式 为使本发明的目的、 技术方案和优点更加清晰易懂, 下面结合附图, 对本发明做进 一步详细说明。 在此, 本发明的示意性实施例及其说明用于解释本发明, 但并不作为对 本发明的限定。
实施例一
本实施例提供一种生源定位方法。 如图 1所示, 该方法包括:
步骤 101 : 采集声源时域信号;
在步骤 101中, 可以通过多个麦克风采集声源的时域信号 Xl, ¾, ···, 。
步骤 102: 将所述时域信号转换为频域信号;
在步骤 102中, 将多个麦克风采集的时域信号为 Xl, ¾, ···, 转换为频域信号为 , ¾, ···, „。 时域信号到频域信号的变换方法, 通常采用傅里叶变换 (Fast Fourier Transform, FFT ) , 也可以采用其他常用变换,例如余弦变换(Discrete Cosine Transform, DCT)。
步骤 103: 根据所述频域信号确定频率的空间功率谱;
在 步 骤 103 中 , 可 以 根 据 下 式 确 定 频 率 的 空 间 功 率 谱 ,
PsRP—PHAT , , ,···, : exp(y * ¾J
Figure imgf000006_0001
步骤 104: 根据所述空间功率谱确定频率的空间功率概率分布;
在步骤 104 中, 可以先确定单个频率的空间功率概率分布, 然后再确定多个频率 的空间功率概率分布。 对于某个频率来说, 其功率在空间上呈一定的分布, 不同的频率 分布差别较大, 很显然不同分布的频率对定位的贡献是不一样。
可以根
Figure imgf000006_0002
置上出现声源的概 可以将各单个频率的空间功率概率分布求和得到多个频率的空间功率概率分布; 或 可以将各单个频率的空间功率概率分布加权求和得到多个频率的空间功率概率分 布, 各单个频率的空间功率概率分布的权重随频率受噪音干扰影响的程度增大而减小。 或者, 具体可以根据下面的公式计算多个频率的空间功率概率分布, Pp— (U, x[,···, ) ,- Nm )
Figure imgf000007_0001
其中, w 是各单个频率的空间功率概率分布的权重, 随单个频率的信号幅值增大 而增大。
步骤 105: 根据空间功率概率分布确定概率最大的空间位置。
在步 105中, 可以根 式, 帧确定概率最大的空间位置,
Figure imgf000007_0002
或者 105中, 可以根据下面的公式, 按多帧确定概率最大的空间位置,
Figure imgf000007_0003
其中, PPSRP i^ , A Χι',…, XNm 是县 ¾当 f前帧的频率的空间功率概率分布, p -At ^ t-At
' R PSKP-PHAT (ALL . X'
V 7 7 Nm 是前 帧的频率的空间功率概率分布,
Figure imgf000007_0004
是前 T帧的频率的空间功率概率分布, αι为前 帧的衰减系数, ατ是前 Τ帧的衰减系数。
本发明实施例依据某个频率在某个空间位置呈现尖锐的概率分布, 则在该位置出 现音源的概率较大, 反之则出现的概率较小的现象, 对现有的声源定位方法进行改进, 从而减小了环境噪声、干扰声、混响等因素对定位准确性的影响,提高了定位的准确性。
实施例二
本实施例提供一种声源定位装置。 如图 2所示, 该装置 200包括:
采集单元 201, 用于采集声源时域信号;
转换单元 202, 用于将所述时域信号转换为频域信号;
功率确定单元 203, 用于根据所述频域信号的确定频率的空间功率谱;
概率确定单元 204, 用于根据所述空间功率谱确定频率的空间功率概率分布; 定位单元 205, 用于根据空间功率概率分布确定概率最大的空间位置。
采集单元 201可以包括多个麦克风, 分别用于采集声源的时域信号 Xl, ¾, ···, 。 转换单元 202可以包括逻辑电路, 用于将多个麦克风采集的时域信号 Xl, ¾, …,^转 换为频域信号 , ¾, *··, ΧΝΠ。 时域信号到频域信号的变换方法可以采用快速傅里叶变换 FFT, 也可以采用其他常用变换, 例如离散余弦变换 DCT。
功率确定单元 203可以根据下面的公式, 利用频域信号 , ¾, *··, ΧΝπ确定频率的 空间功率谱, exp (尸
Figure imgf000008_0001
概率确定单元 204可以包括单频率概率确定模块 214和多频率概率确定模块 224。 在根据所述空间功率谱确定频率的空间功率概率分布时, 先由单频率概率确定模块 214 确定单个频率的空间功率概率分布, 再由多频率概率确定模块 224确定多个频率的空间 功率概率分布。
单频率概率确定模块 214可以根据下面的公式确定单个频率的空间功率概率分布,
(7v t vt PsRP—ΡΗΑτ ψ , H,· · ·, X Nm )
Figure imgf000008_0002
0 , ,···, X Nm , 其中, — 表示第 k个频率 ^立置上出现声源的概率。 多频率概率确定模块 224 可以将各单个频率的空间功率概率分布求和得到多个频 率的空间功率概率分布, 或者, 多频率概率确定模块 224可以将各单个频率的空间功率 概率分布加权求和得到多个频率的空间功率概率分布,各单个频率的空间功率概率分布 的权重随频率受噪音干扰影响的程度增大而减小。多频率概率确定模块 224具体可以根 据下面的公式计算多个频率的空间功率概率分布, ¾一 , ".., )=
Figure imgf000008_0003
其中, 是各单个频率的空间功率概率分布的权重, 随单个频率的信号幅值增大 k
而增大。
最后, 定位单元 205可以根据下面的公式按当前帧确定概率最大的空间位置,
^ = 4 k™ ( "", ))°
或者, 定位单元 205可以根据下面的公式按多帧确定概率最大的空间位置, 其
Figure imgf000009_0001
间功率概率分布, PPSKP ΑΙ ,Κ , χ 、是前一帧的频率的空间功率概率分布, r^ 是前 τ帧的频率的空间功率概率分布, αι为前 一帧的衰减系数, ατ是前 Τ帧的衰减系数。
本发明实施例依据某个频率在某个空间位置呈现尖锐的概率分布, 则在该位置出 现音源的概率较大, 反之则出现的概率较小的现象, 对现有的声源定位方法进行改进, 从而减小了环境噪声、干扰声、混响等因素对定位准确性的影响,提高了定位的准确性。
以上所述的具体描述, 对发明的目的、 技术方案和有益效果进行了进一步详细说 明, 所应理解的是, 以上所述仅为本发明的具体实施例而已, 并不用于限定本发明的保 护范围, 凡在本发明的精神和原则之内, 所做的任何修改、 等同替换、 改进等, 均应包 含在本发明的保护范围之内。

Claims

权利要求
1、 一种声源定位方法, 其特征在于, 该方法包括:
采集声源时域信号;
将所述时域信号转换为频域信号;
根据所述频域信号确定频率的空间功率谱;
根据所述空间功率谱确定频率的空间功率概率分布;
根据空间功率概率分布确定概率最大的空间位置, 以概率最大的空间位置作为声 源位置。
2、 根据权利要求 1所述的方法, 其特征在于, 所述根据所述空间功率谱确定频率 的空间功率概率分布包括:
根据所述空间功率谱, 确定单个频率的空间功率概率分布;
根据所述单个频率的空间功率概率分布, 确定多个频率的空间功率概率分布。
3、 根据权利要求 2所述的方法, 其特征在于: 根据下面的公式确定单个频率的空 间功率概率分
上出现声源的概率,
, 表示 k个频率 ^位
Figure imgf000010_0001
置上的空间功率谱。
4、 根据权利要求 2所述的方法, 其特征在于, 所述根据所述单个频率的空间功率 概率分布, 确定多个频率的空间功率概率分布包括: 将各单个频率的空间功率概率分布 求和得到多个频率的空间功率概率分布。
5、 根据权利要求 2所述的方法, 其特征在于, 所述根据所述单个频率的空间功率 概率分布, 确定多个频率的空间功率概率分布包括: 将各单个频率的空间功率概率分布 加权求和得到多个频率的空间功率概率分布,各单个频率的空间功率概率分布的权重随 频率受噪音干扰影响的程度增大而减小。
6、 根据权利要求 2所述的方法, 其特征在于, 所述根据所述单个频率的空间功率 概率分布, 确定多个频率的空间功率概率分布包括: 根据下面的公式计算多个频率的空 间功率概率分布,
Figure imgf000011_0001
其中, TV,是各单个频率的空间功率概率分布的权重。
k
7、 根据权利要求 5或 6所述的方法, 其特征在于: 所述单个频率的空间功率概率 分布的权重随单个频率的信号幅值增大而增大。
8、 根据权利要求 1所述的方法, 其特征在于, 所述根据空间功率概率分布确定概 率最大的空 公式按当前帧确定概率最大的空间位置,
Figure imgf000011_0002
9、 根据权利要求 1所述的方法, 其特征在于, 所述根据空间功率概率分布确定概 率最大的空 间位置,
Figure imgf000011_0003
其中, ,..., iJ 是当前巾贞的频率的空间功率概率分布, {ΑΙ , £, Χ ".., Χ'-^' )是前一帧的频率的空间功率概率分布,
P, ALL , Xr' ^ *^是前 T帧的频率的空间功率概率分布, 为前 帧的衰减系数, ατ是前 T帧的衰减系数。
10、 一种声源定位装置, 其特征在于, 该装置包括:
采集单元, 用于采集声源时域信号;
转换单元, 用于将所述时域信号转换为频域信号;
功率确定单元, 用于根据所述频域信号确定频率的空间功率谱;
概率确定单元, 用于根据所述空间功率谱确定频率的空间功率概率分布; 定位单元, 用于根据空间功率概率分布确定概率最大的空间位置, 以概率最大的 空间位置作为声源位置。
11、 根据权利要求 10所述的装置, 其特征在于, 所述概率确定单元包括: 单频率概率确定模块, 用于根据所述空间功率谱, 确定单个频率的空间功率概率 分布; 多频率概率确定模块, 用于根据所述单个频率的空间功率概率分布, 确定多个频率 的空间功率概率分布。
PCT/CN2011/070685 2010-01-27 2011-01-27 声源定位方法和装置 WO2011091754A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN 201010105118 CN101762806B (zh) 2010-01-27 2010-01-27 声源定位方法和装置
CN201010105118.2 2010-01-27

Publications (1)

Publication Number Publication Date
WO2011091754A1 true WO2011091754A1 (zh) 2011-08-04

Family

ID=42494092

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/070685 WO2011091754A1 (zh) 2010-01-27 2011-01-27 声源定位方法和装置

Country Status (2)

Country Link
CN (1) CN101762806B (zh)
WO (1) WO2011091754A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110544490A (zh) * 2019-07-30 2019-12-06 南京林业大学 一种基于高斯混合模型和空间功率谱特征的声源定位方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置
CN102103200B (zh) * 2010-11-29 2012-12-05 清华大学 一种分布式非同步声传感器的声源空间定位方法
CN102854494B (zh) * 2012-08-08 2015-09-09 Tcl集团股份有限公司 一种声源定位方法及装置
CN103076593B (zh) * 2012-12-28 2014-09-10 中国科学院声学研究所 一种声源定位方法及装置
CN106448703A (zh) * 2014-03-05 2017-02-22 佛山科学技术学院 一种激光反射声源定位方法
CN104142492B (zh) * 2014-07-29 2017-04-05 佛山科学技术学院 一种srp‑phat多源空间定位方法
CN106093864B (zh) * 2016-06-03 2018-04-17 清华大学 一种麦克风阵列声源空间实时定位方法
CN108510987B (zh) 2018-03-26 2020-10-23 北京小米移动软件有限公司 语音处理方法及装置
US10699727B2 (en) * 2018-07-03 2020-06-30 International Business Machines Corporation Signal adaptive noise filter
CN110797045A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 声音处理方法、系统、电子设备和计算机可读介质
CN109188362B (zh) * 2018-09-03 2020-09-08 中国科学院声学研究所 一种麦克风阵列声源定位信号处理方法
CN110888112B (zh) * 2018-09-11 2021-10-22 中国科学院声学研究所 一种基于阵列信号的多目标定位识别方法
CN110082724B (zh) * 2019-05-31 2021-09-21 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005062096A (ja) * 2003-08-19 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 話者位置検出方法、装置、プログラム、および記録媒体
CN1703118A (zh) * 2004-05-26 2005-11-30 本田研究所欧洲有限公司 基于立体声信号的声源定位
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
US20080170472A1 (en) * 2007-01-17 2008-07-17 Toyota Engineering & Manufacturing North America, Inc. Method and system for locating a wave source within a defined area
CN101295015A (zh) * 2007-04-23 2008-10-29 财团法人工业技术研究院 声源定位系统及声源定位方法
CN101762806A (zh) * 2010-01-27 2010-06-30 华为终端有限公司 声源定位方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233353B2 (en) * 2007-01-26 2012-07-31 Microsoft Corporation Multi-sensor sound source localization

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005062096A (ja) * 2003-08-19 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 話者位置検出方法、装置、プログラム、および記録媒体
CN1703118A (zh) * 2004-05-26 2005-11-30 本田研究所欧洲有限公司 基于立体声信号的声源定位
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
US20080170472A1 (en) * 2007-01-17 2008-07-17 Toyota Engineering & Manufacturing North America, Inc. Method and system for locating a wave source within a defined area
CN101295015A (zh) * 2007-04-23 2008-10-29 财团法人工业技术研究院 声源定位系统及声源定位方法
CN101762806A (zh) * 2010-01-27 2010-06-30 华为终端有限公司 声源定位方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110544490A (zh) * 2019-07-30 2019-12-06 南京林业大学 一种基于高斯混合模型和空间功率谱特征的声源定位方法
CN110544490B (zh) * 2019-07-30 2022-04-05 南京工程学院 一种基于高斯混合模型和空间功率谱特征的声源定位方法

Also Published As

Publication number Publication date
CN101762806B (zh) 2013-03-13
CN101762806A (zh) 2010-06-30

Similar Documents

Publication Publication Date Title
WO2011091754A1 (zh) 声源定位方法和装置
CN102103200B (zh) 一种分布式非同步声传感器的声源空间定位方法
WO2011006369A1 (zh) 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
US9197177B2 (en) Method and implementation apparatus for intelligently controlling volume of electronic device
CN106093864B (zh) 一种麦克风阵列声源空间实时定位方法
CN109087665B (zh) 一种非线性回声抑制方法
CN102387272B (zh) 一种回声抵消系统中残留回声的抑制方法
KR100779409B1 (ko) 향상된 신호 위치 측정 장치
CN111474521B (zh) 多径环境中基于麦克风阵列的声源定位方法
WO2010118588A1 (zh) 一种正交频分复用系统的信道估计方法和装置
CN111445919B (zh) 结合ai模型的语音增强方法、系统、电子设备和介质
US20100322437A1 (en) Signal processing apparatus and signal processing method
WO2019200722A1 (zh) 声源方向估计方法和装置
WO2014089914A1 (zh) 一种基于双麦克的语音混响消减方法和装置
CN110012331A (zh) 一种红外触发的远场双麦远场语音识别方法
CN109688284A (zh) 一种回音延时检测方法
WO2014005473A1 (zh) 一种送受话端采样率偏差纠正方法和系统
CN103268766A (zh) 双麦克风语音增强方法及装置
CN110890099B (zh) 声音信号处理方法、装置以及存储介质
CN112802490A (zh) 一种基于传声器阵列的波束形成方法和装置
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
CN109901114A (zh) 一种适用于声源定位的时延估计方法
JP5235605B2 (ja) 発話向き推定装置、方法及びプログラム
JP5235723B2 (ja) 発話向き推定装置、方法及びプログラム
JP2005077205A (ja) 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11736636

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11736636

Country of ref document: EP

Kind code of ref document: A1