CN1703118B - 基于立体声信号的声源定位方法和装置 - Google Patents

基于立体声信号的声源定位方法和装置 Download PDF

Info

Publication number
CN1703118B
CN1703118B CN2005100746215A CN200510074621A CN1703118B CN 1703118 B CN1703118 B CN 1703118B CN 2005100746215 A CN2005100746215 A CN 2005100746215A CN 200510074621 A CN200510074621 A CN 200510074621A CN 1703118 B CN1703118 B CN 1703118B
Authority
CN
China
Prior art keywords
ear
sound source
probability distribution
matrix
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005100746215A
Other languages
English (en)
Other versions
CN1703118A (zh
Inventor
朱莉安·埃格特
福尔克尔·威勒特
拉斐尔·斯塔尔
于尔根·阿达米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Research Institute Europe GmbH
Original Assignee
Honda Research Institute Europe GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Research Institute Europe GmbH filed Critical Honda Research Institute Europe GmbH
Publication of CN1703118A publication Critical patent/CN1703118A/zh
Application granted granted Critical
Publication of CN1703118B publication Critical patent/CN1703118B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/803Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
    • G01S3/8034Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics wherein the signals are derived simultaneously
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)

Abstract

基于立体声信号的声源定位。所提出的方法旨在利用立体声检测器结构的声源定位。其包括如下步骤:利用滤波器组对两个信号进行预处理,以获得各个信号的(2D)时频谱;利用作用于时频谱的2D曲面片上的共同匹配过程来对ITD和ILD测量进行联合计算,这样就得到了联合表征该声源的两个频率对位移矩阵(一个用于ITD测量,另一个用于ILD测量),在随后步骤中将这些矩阵作为整体(所有的位移和所有的频率)来使用;对用于各个声源位置的平均频率对位移矩阵进行学习,对于ITD和ILD测量分别进行此处理;将所测得的频率对位移矩阵与所学习的矩阵进行比较,以获得声源位置的概率分布(针对各个频道),同样对于ITD和ILD测量进行此处理;将ITD和ILD概率分布矩阵进行组合,以获得用于声源定位的单个联合概率分布;采用信息论过程来提取声源位置的最佳预测。

Description

基于立体声信号的声源定位方法和装置
技术领域
本发明涉及对立体声信号的声源位置进行计算的技术(即,使用例如方位角面中的两个相互偏移的声音接收器)。主要涉及如下两种信号的正确提取、表示和组合:ITD(耳间时差)和ILD/IID(耳间级差/耳间强度差)。 
背景技术
我们分离多个声音的一种主要方法是确定它们在空间中的位置。从固定声源到达两个检测器(如,双耳或两个麦克风)的声音由于传输时间的差异导致这两个测量信号在时间上相互偏差。在第一近似中,可以将其认为是从声源到检测器的直线路径差。将时间偏移称为ITD,并可将其用于提取有关声源的方位角位置的信息。 
此外,诸如机器人头部的录音装置的结构(3D形状、材料)通常使入射声波衍射并衰减。这导致双耳处的信号级的显著差异。这种所谓的ILD与频率紧密相关。例如,在低频处,双耳处几乎没有任何声压差。但是,在高频处,声音波长与头部直径相比变短,由于头部遮挡效应,可能存在显著差异。这些差异随着声源位置而系统变化,并且可用于获取关于其位置的信息。 
ITD和ILD信号以互补方式进行工作。这两者的精度相对于频率范围和声源的方位角位置而独立变化。对于未预处理的信号,在高频处出现了ITD的模糊(ambiguity),这是因为这些信号可能存在几个周期的偏差。结合ILD信号可以将其校平,而该ILD信号解决了仅为高频提供可靠级差的该模糊问题。ITD提示(cue)对声源定位的作用对于正面到达的信号较大,并随声源向侧面移动而变差(因为入射角差对路径差的非线性依从性)。相反的,ILD提示在侧面区域更精确(因为在这种情况下, 一个录音装置得到最大衰减而另一个获得最小衰减),而降低的衰减差使其在正面区域不太精确。 
标准声源定位方法包括经由延迟线路在各频道上单独进行的ITD计算(Jeffreys模型),或者通过系统地将这些频道相互偏移来比较这些频道以进行该ITD计算(stereausis模型)。利用HRTF的头部相关传递函数(外耳/麦克风形状/材料使得声音的谱过滤依从于位置)来明确地模拟ILD和单耳提示。 
在标准方法中,仍然存在与声源的方位角位置相关的三个问题。首先,预先获知哪个延迟响应时移对应于哪个方位方向以使得能够对于特定方向采用正确的代表向量通常是重要的。其次,由于适应性原因,期望避免ITD/ILD的生成的明确模型,替代地,这些模型应当是以容易方式“可学习的”。一个问题是:如何对高度依从于频率的ITD和ILD信息进行组合。通常利用原理不同的过程来计算ITD和ILD,这使得对两个测量的比较是非平凡的。 
发明内容
考虑到上述现有技术的已知解决方案的缺陷,本发明的目的是提供一种根据立体声信号进行声源定位的改进技术。 
提出了一种方法来联合学习并评估ITD(耳差时差)和ILD(耳间级差)表示,这些表示是利用从例如预处理滤波器组中获取的立体声时频谱以互补相关方式测得的。对于每个时间步,根据这些测量和所学习的代表(通过将来自属于同一类(class)(即相同方位角位置)的信号的测量进行组合而创建),来计算基于频率和类别的概率分布。可以将对于不同频率以及ITD和ILD测量提取的这些概率分布视为瞬时声音位置的冗余信息。对于每个时间步,可以利用信息论方法基于提示和频率来组合这些概率分布,以获得位置的强健分类,另外还获得了对于瞬时分类结果质量的置信度测量(例如,从概率分布中直接提取的用作良好置信度测量的最大后沿估计值的概率)。另外,这些概率分布可以沿着时间传播,以产生对后续测量的预测,这改进了分类结果并使得系统可以跟踪 移动声源。 
一种用于立体声检测器结构的方位角声源定位的方法,可以包括如下步骤: 
—利用滤波器组对立体声检测器所生成的两个信号进行预处理,以获得(2D)时频谱。 
—利用作用于时频谱的2D曲面片(patch)上的共同匹配过程来联合计算ITD和ILD测量。这得到用于联合表征该声源的两个频率对位移矩阵(一个用于ITD测量,一个用于ILD测量)。在随后步骤中将这些矩阵作为整体(所有位移和所有频率)来使用。 
—对于各个声源位置对平均的频率对位移矩阵进行学习。对于ITD和ILD测量分别进行此处理。 
—将所测得的频率对位移矩阵与所学习的矩阵进行比较,以针对各个频道获得声源位置的概率分布。同样对于ITD和ILD测量进行此处理。 
—将ITD和ILD概率分布矩阵进行组合,以在特定时间步获得用于声源定位的单个联合概率分布。 
—应用信息论过程,以在该时间步提取对于声源位置的最佳估计。 
可以使用信息论过程来产生可以与后续测量进行组合的预测,以改善基于时间的声源定位,并使得该系统可以追踪并跟随移动声源。 
可以按照依从于频率的方式对ITD和ILD测量结果(即,概率分布)进行组合。 
另选地,可以根据声源位置参数对ITD和ILD测量结果(概率分布)进行组合。 
还可以将所提取的用于声源定位的概率分布用于获取关于多个声源的信息。 
还可以通过对针对高度的立体声特征进行学习,来在垂直方向提取提示中获得用于声源定位的信息。 
根据本发明的另一方面,提出了一种系统,该系统包括立体声检测器和计算单元,该计算单元被设计为通过上述的用于方位角声源定位方法的多个步骤来处理所述检测器的输出。 
最后,本发明提供了一种计算机软件程序产品,在计算装置上运行它时,就实现了上述的用于方位角声源定位方法。 
附图说明
根据结合附图的以下说明,本发明的其它目的和特征将变得更为明显,其中: 
图1示意性示出了用于实现根据本发明的学习步骤的设置,以及 
图2是根据本发明的声源定位处理的流程图。 
具体实施方式
下面将结合图1和图2说明本发明的方位角声源定位的总体概念。 
该方法致力于:根据由立体声检测器30(即具有至少两个独立的声音传感器31、32的检测器)所检测到的两个声音信号分量3、4,来对立体声信号1的始发地S进行定位。由此通过在方位角面中偏移的两个传感器(接收器)31、32来检测(2)输入立体声信号1。 
a)学习频率对位移矩阵 
首先,对两个信号3、4进行预处理(5),以获取分别用于各个信号3、4的两个2D时频谱6。然后,利用相关算法对用于2D时频谱的每个时间步的ITD和ILD测量进行计算(7),以对于依从于方位角位置的ITD和ILD分别提取2D频率对位移矩阵。通过将来自信号3的时频谱的点态(point-wise)窗口化区域与来自信号4的时频谱的对应窗口化区域进行比较,来计算相关性。对于ITD,例如可以通过SSD(方差和)或标准相关系数来计算点态比较。对于ILD,可以通过在频谱的对数预处理之后计算绝对值范数的差来进行该计算。对于所有所需位移都计算该相关性(意味着2D时频谱相互偏移),以检测每一个可能的时移。可以根据经验确定最大位移参数,并且该最大位移参数取决于频率带宽、头部的形状以及两个检测器之间的距离。 
使用所述联合计算的结果,对于分别与ITD和ILD测量相关的2D时间频谱的每个时间步,生成(9)两个不同的频率对位移矩阵10、11。 在每个时间步中,两个频率对位移矩阵10、11联合表征了该声源。 
下一步骤包括:对于不同的声源位置33,对频率对位移矩阵14、15进行学习(12、13)。通过监控方式来进行学习,这表示在学习处理过程中声音位置33是已知的。对于ITD和ILD测量分别进行该学习步骤,并且得到ITD和ILD基准频率对位移矩阵,这些矩阵代表用于所有可能频率的特定位置33。图1示出了实际中是如何进行学习的。以特定方位位置a、特定距离d来布置声源S。然后,从声源S播放覆盖系统应该能定位的频谱的不同的信号,例如从不同个人发出语音信号,并且计算频率对位移矩阵。对相同位置的所有矩阵取平均值,以获得通用的ITD和ILD频率对位移矩阵。对于所有选中的位置33进行此过程。由于2D基准图案随着方位角平滑改变,所以在学习步骤中需要处理只有极少的用于学习的离散位置,例如平均分布在方位角面上的离散位置。 
b)通过使用所学习的频率对位移矩阵来估计未知声源的位置: 
随后,针对各个频道,将所测得的位置未知的声源的ITD和ILD频率对位移矩阵10、11与所学习的频率对位移矩阵14、15进行比较(16、17),以获取声源位置的概率分布18、19。对于ITD和ILD分别进行该比较。由此,ITD比较16包括:将ITD的所测得的频率对位移矩阵10的频率与所学习的频率对位移矩阵14的(2D基准图案)进行比较,并输出ITD概率分布矩阵18。 
将ITD和ILD概率分布矩阵18、19进一步进行组合(20),以获得用于声源定位的单个联合概率分布21。可以根据声源位置参数来进行ITD和ILD概率分布18、19的组合(20)。可以按照依从于频率的方式来对ITD和ILD测量结果进行组合。可以进一步使用所提取的ITD和ILD的概率分布18、19来获得关于多声源的信息。为了实现此目的,将矩阵中的每一个概率分布解释为用于测量的条件概率,该条件概率以频率、提示(ITD、ILD)和位置为条件。基于频率和提示的边缘化导致仅以位置为条件的概率。 
将信息理论过程应用于所述概率分布21,以提取(22)声源位置的最佳估计23。例如,可以使用贝叶斯方法来获取位置估计。为此,必须 利用先验和当前用作似然性的概率分布21来计算后验。然后可以利用诸如MAP(最大后验)或MMSE(最小均方误差)的标准方法,根据后验来计算方位角声源位置的估计。 
系统的扩展包括如下步骤:按时传播最后一个时间步概率分布21,以获得下一时间步的概率分布的预测,然后将其与新测得的概率分布进行组合,以使其随着时间增加。通过此扩展,可以使用该系统来跟踪位置连续变化的多个声源。 
另一实施例扩展了所提出的方法,即,通过学习针对高度的立体声特征来在垂直方向提取提示中获得用于声源位置的信息。 

Claims (7)

1.一种用于声源定位的方法,包括如下步骤:
a)对构成立体声信号(1)并源自已知位置处的已知声源的两个信号分量(3,4)进行处理(2),以获得分别用于所述两个信号中的每一个的2D时频谱(6),
b)利用作用于2D时频谱(6)的2D曲面片上的共同匹配过程来联合计算(7)耳间时差测量和耳间级差测量,以生成(9)两个频率对位移矩阵(10、11),所述两个矩阵中的一个用于耳间时差测量,另一个用于耳间级差测量,所述两个矩阵联合表征了所述声源,
c)分别对于耳间时差测量和耳间级差测量,通过利用已知声源的不同位置重复步骤a)和b),来对平均频率对位移矩阵(14、15)进行学习(12、13),
d)针对各个频道,分别对于耳间时差测量和耳间级差测量,将所测得的未知声源的频率对位移矩阵(10、11)与步骤c)中所学习的矩阵(14、15)进行比较(16、17),以获得声源位置的耳间时差概率分布矩阵(18)和耳间级差概率分布矩阵(19),
e)将耳间时差概率分布矩阵(18)和耳间级差概率分布矩阵(19)进行组合(20),以获得用于声源定位的单个联合概率分布(21),以及
f)根据所获得的联合概率分布(21)来估计所述声源位置。
2.根据权利要求1所述的方法,
其特征在于,
对所述耳间时差概率分布矩阵(18)和所述耳间级差概率分布矩阵(19)进行的所述组合是按照依从于频率的方式进行的。
3.根据权利要求1所述的方法,
其特征在于,
对所述耳间时差概率分布矩阵(18)和所述耳间级差概率分布矩阵(19)进行的所述组合取决于所述声源位置参数。
4.根据上述任一项权利要求所述的方法,
其特征在于,
使用所获得的用于声源定位的联合概率分布(21)来获取关于多声源的信息。
5.根据权利要求1所述的方法,
其特征在于,
还能够通过对针对高度的立体声特征进行学习,来在垂直方向提取提示中获得声源位置的信息。
6.根据权利要求1所述的方法,
其特征在于,
按时传播/外推最后一个时间步的联合概率分布(21),以获得下一概率分布的预测,然后将其与新测得的概率分布进行组合,以使其基于时间改善并跟踪移动声源。
7.一种用于声源定位的设备,包括:
a)对构成立体声信号(1)并源自已知位置处的已知声源的两个信号分量(3,4)进行处理(2),以获得分别用于所述两个信号中的每一个的2D时频谱(6)的装置,
b)利用作用于2D时频谱(6)的2D曲面片上的共同匹配过程来联合计算(7)耳间时差测量和耳间级差测量,以生成(9)两个频率对位移矩阵(10、11)的装置,其中所述两个矩阵中的一个用于耳间时差测量,另一个用于耳间级差测量,所述两个矩阵联合表征了所述声源,
c)分别对于耳间时差测量和耳间级差测量,通过利用已知声源的不同位置重复执行装置a)和b)的操作,来对平均频率对位移矩阵(14、15)进行学习(12、13)的装置,
d)针对各个频道,分别对于耳间时差测量和耳间级差测量,将所测得的未知声源的频率对位移矩阵(10、11)与通过装置c)所学习的矩阵(14、15)进行比较(16、17),以获得声源位置的耳间时差概率分布矩阵(18)和耳间级差概率分布矩阵(19)的装置,
e)将耳间时差概率分布矩阵(18)和耳间级差概率分布矩阵(19)进行组合(20),以获得用于声源定位的单个联合概率分布(21)的装置,以及
f)根据所获得的联合概率分布(21)来估计所述声源位置的装置。
CN2005100746215A 2004-05-26 2005-05-26 基于立体声信号的声源定位方法和装置 Expired - Fee Related CN1703118B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP04012473 2004-05-26
EP04012473.7 2004-05-26
EP04030651A EP1600791B1 (en) 2004-05-26 2004-12-23 Sound source localization based on binaural signals
EP04030651.6 2004-12-23

Publications (2)

Publication Number Publication Date
CN1703118A CN1703118A (zh) 2005-11-30
CN1703118B true CN1703118B (zh) 2013-05-08

Family

ID=34927979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005100746215A Expired - Fee Related CN1703118B (zh) 2004-05-26 2005-05-26 基于立体声信号的声源定位方法和装置

Country Status (4)

Country Link
US (1) US7693287B2 (zh)
EP (1) EP1600791B1 (zh)
JP (1) JP4841863B2 (zh)
CN (1) CN1703118B (zh)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1119218B1 (en) * 2000-01-21 2018-06-20 Oticon A/S Electromagnetic feedback reduction in communication device
EP1600791B1 (en) 2004-05-26 2009-04-01 Honda Research Institute Europe GmbH Sound source localization based on binaural signals
DE602006001051T2 (de) 2006-01-09 2009-07-02 Honda Research Institute Europe Gmbh Bestimmung des entsprechenden Messfensters zur Schallquellenortung in Echoumgebungen
EP1862813A1 (en) * 2006-05-31 2007-12-05 Honda Research Institute Europe GmbH A method for estimating the position of a sound source for online calibration of auditory cue to location transformations
EP1947471B1 (en) * 2007-01-16 2010-10-13 Harman Becker Automotive Systems GmbH System and method for tracking surround headphones using audio signals below the masked threshold of hearing
US8767975B2 (en) 2007-06-21 2014-07-01 Bose Corporation Sound discrimination method and apparatus
US8611554B2 (en) 2008-04-22 2013-12-17 Bose Corporation Hearing assistance apparatus
KR101038574B1 (ko) * 2009-01-16 2011-06-02 전자부품연구원 3차원 오디오 음상 정위 방법과 장치 및 이와 같은 방법을 구현하는 프로그램이 기록되는 기록매체
US8174932B2 (en) * 2009-06-11 2012-05-08 Hewlett-Packard Development Company, L.P. Multimodal object localization
WO2011017748A1 (en) * 2009-08-11 2011-02-17 Hear Ip Pty Ltd A system and method for estimating the direction of arrival of a sound
CN101673549B (zh) * 2009-09-28 2011-12-14 武汉大学 一种移动音源空间音频参数预测编解码方法及系统
JP5397131B2 (ja) * 2009-09-29 2014-01-22 沖電気工業株式会社 音源方向推定装置及びプログラム
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置
CN101957443B (zh) * 2010-06-22 2012-07-11 嘉兴学院 声源定位方法
EP2423702A1 (en) * 2010-08-27 2012-02-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for resolving ambiguity from a direction of arrival estimate
KR101694822B1 (ko) * 2010-09-20 2017-01-10 삼성전자주식회사 음원출력장치 및 이를 제어하는 방법
CN101982793B (zh) * 2010-10-20 2012-07-04 武汉大学 一种基于立体声信号的移动音源定位方法
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
CN102809742B (zh) * 2011-06-01 2015-03-18 杜比实验室特许公司 声源定位设备和方法
US9435873B2 (en) * 2011-07-14 2016-09-06 Microsoft Technology Licensing, Llc Sound source localization using phase spectrum
WO2013029225A1 (en) * 2011-08-29 2013-03-07 Huawei Technologies Co., Ltd. Parametric multichannel encoder and decoder
CN102438189B (zh) * 2011-08-30 2014-07-09 东南大学 基于双通路声信号的声源定位方法
CN102565759B (zh) * 2011-12-29 2013-10-30 东南大学 一种基于子带信噪比估计的双耳声源定位方法
KR102192361B1 (ko) 2013-07-01 2020-12-17 삼성전자주식회사 머리 움직임을 이용한 사용자 인터페이스 방법 및 장치
KR102529121B1 (ko) * 2014-03-28 2023-05-04 삼성전자주식회사 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
CN103901401B (zh) * 2014-04-10 2016-08-17 北京大学深圳研究生院 一种基于双耳匹配滤波器的双耳声音源定位方法
JP2017530579A (ja) * 2014-08-14 2017-10-12 レンセラール ポリテクニック インスティチュート 両耳統合相互相関自己相関メカニズム
CN104837106B (zh) * 2015-05-25 2018-01-26 上海音乐学院 一种用于空间化声音的音频信号处理方法及装置
CN105159066B (zh) * 2015-06-18 2017-11-07 同济大学 一种智能音乐厅调控方法及调控装置
WO2017063688A1 (en) * 2015-10-14 2017-04-20 Huawei Technologies Co., Ltd. Method and device for generating an elevated sound impression
JP6538624B2 (ja) * 2016-08-26 2019-07-03 日本電信電話株式会社 信号処理装置、信号処理方法および信号処理プログラム
CN106501772B (zh) * 2016-10-18 2018-12-14 武汉轻工大学 一种基于双耳线索的空间音源定位方法及系统
US10375498B2 (en) * 2016-11-16 2019-08-06 Dts, Inc. Graphical user interface for calibrating a surround sound system
JP6732944B2 (ja) * 2016-12-16 2020-07-29 日本電信電話株式会社 目的音強調装置、雑音推定用パラメータ学習装置、目的音強調方法、雑音推定用パラメータ学習方法、プログラム
GB2578386B (en) 2017-06-27 2021-12-01 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB2563953A (en) 2017-06-28 2019-01-02 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201713697D0 (en) 2017-06-28 2017-10-11 Cirrus Logic Int Semiconductor Ltd Magnetic detection of replay attack
GB201801526D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for authentication
GB201801532D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
GB201801527D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
GB201801664D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
GB201801874D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Improving robustness of speech processing system against ultrasound and dolphin attacks
GB201803570D0 (en) 2017-10-13 2018-04-18 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201801659D0 (en) 2017-11-14 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of loudspeaker playback
EP3717531A4 (en) 2017-12-01 2021-08-25 The Regents of the University of California BIOLOGICAL SOIL RESISTANT COATINGS AND THEIR MANUFACTURING AND USE PROCESSES
US11264037B2 (en) 2018-01-23 2022-03-01 Cirrus Logic, Inc. Speaker identification
US11929091B2 (en) 2018-04-27 2024-03-12 Dolby Laboratories Licensing Corporation Blind detection of binauralized stereo content
WO2019209930A1 (en) * 2018-04-27 2019-10-31 Dolby Laboratories Licensing Corporation Blind detection of binauralized stereo content
US10692490B2 (en) 2018-07-31 2020-06-23 Cirrus Logic, Inc. Detection of replay attack
US10915614B2 (en) 2018-08-31 2021-02-09 Cirrus Logic, Inc. Biometric authentication
US11037574B2 (en) 2018-09-05 2021-06-15 Cirrus Logic, Inc. Speaker recognition and speaker change detection
US10880669B2 (en) * 2018-09-28 2020-12-29 EmbodyVR, Inc. Binaural sound source localization
JP7252785B2 (ja) * 2019-02-28 2023-04-05 株式会社デンソーテン 音像予測装置および音像予測方法
EP3980088A4 (en) 2019-06-05 2023-06-14 The Regents of the University of California BIOFOILING RESISTANT COATINGS AND METHODS OF MAKING AND USING THEREOF
CN112946578B (zh) * 2021-02-02 2023-04-21 上海头趣科技有限公司 双耳定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011754A (en) * 1996-04-25 2000-01-04 Interval Research Corp. Personal object detector with enhanced stereo imaging capability
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
CN1460185A (zh) * 2001-03-30 2003-12-03 皇家菲利浦电子有限公司 用于音频/图像的说话者检测和定位的方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3838593A (en) 1972-11-06 1974-10-01 Exxon Research Engineering Co Acoustic leak location and detection system
SE456279B (sv) 1986-09-16 1988-09-19 Bost & Co Ab Sett och anordning for att tidsbestemma en akustisk puls
US6990205B1 (en) * 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
DE60141403D1 (de) * 2000-06-09 2010-04-08 Japan Science & Tech Agency Hörvorrichtung für einen Roboter
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
KR101016982B1 (ko) * 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
US7333622B2 (en) * 2002-10-18 2008-02-19 The Regents Of The University Of California Dynamic binaural sound capture and reproduction
JP4521549B2 (ja) * 2003-04-25 2010-08-11 財団法人くまもとテクノ産業財団 上下、左右方向の複数の音源の分離方法、そのためのシステム
EP1586421B1 (en) 2004-04-16 2008-03-05 Honda Research Institute Europe GmbH Self-calibrating orienting system for a manipulating device
EP1600791B1 (en) 2004-05-26 2009-04-01 Honda Research Institute Europe GmbH Sound source localization based on binaural signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011754A (en) * 1996-04-25 2000-01-04 Interval Research Corp. Personal object detector with enhanced stereo imaging capability
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
CN1460185A (zh) * 2001-03-30 2003-12-03 皇家菲利浦电子有限公司 用于音频/图像的说话者检测和定位的方法和装置

Also Published As

Publication number Publication date
JP4841863B2 (ja) 2011-12-21
CN1703118A (zh) 2005-11-30
EP1600791B1 (en) 2009-04-01
EP1600791A1 (en) 2005-11-30
US20050276419A1 (en) 2005-12-15
JP2005338086A (ja) 2005-12-08
US7693287B2 (en) 2010-04-06

Similar Documents

Publication Publication Date Title
CN1703118B (zh) 基于立体声信号的声源定位方法和装置
Raspaud et al. Binaural source localization by joint estimation of ILD and ITD
US8947978B2 (en) System and method for estimating the direction of arrival of a sound
EP1522868A1 (en) System for determining the position of a sound source and method therefor
Hwang et al. Sound direction estimation using an artificial ear for robots
CA2857611A1 (en) Apparatus and method for microphone positioning based on a spatial power density
CN109188362A (zh) 一种麦克风阵列声源定位信号处理方法
Talagala et al. Binaural sound source localization using the frequency diversity of the head-related transfer function
CN103180752A (zh) 用于解析到达方向估计的模糊度的设备和方法
Iida et al. Generation of the amplitude spectra of the individual head-related transfer functions in the upper median plane based on the anthropometry of the listener’s pinnae
Engel et al. Improving binaural rendering with bilateral ambisonics and MagLS
KR20090128221A (ko) 음원 위치 추정 방법 및 그 방법에 따른 시스템
CN101982793B (zh) 一种基于立体声信号的移动音源定位方法
Kossyk et al. Binaural bearing only tracking of stationary sound sources in reverberant environment
Lopez et al. 3-D audio with dynamic tracking for multimedia environtments
Alexandridis et al. Towards wireless acoustic sensor networks for location estimation and counting of multiple speakers in real-life conditions
Hammond et al. Robust full-sphere binaural sound source localization
Nowak et al. 3D virtual audio with headphones: A literature review of the last ten years
Braasch Sound localization in the presence of multiple reflections using a binaurally integrated cross-correlation/auto-correlation mechanism
Hammond et al. Robust median-plane binaural sound source localization
Karthik et al. Subband Selection for Binaural Speech Source Localization.
Karthik et al. Subband Weighting for Binaural Speech Source Localization.
Zohourian et al. Direct-to-reverberant energy ratio estimation based on interaural coherence and a joint ITD/ILD model
EP4346235A1 (en) Apparatus and method employing a perception-based distance metric for spatial audio
CN110166927B (zh) 一种基于定位修正的虚拟声像重建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CI01 Correction of invention patent gazette

Correction item: Priority day

Correct: 20041223

False: 20041213

Number: 19

Volume: 29

CI03 Correction of invention patent

Correction item: Priority day

Correct: 20041223

False: 20041213

Number: 19

Page: The title page

Volume: 29

ERR Gazette correction

Free format text: CORRECT: DATE OF PRIORITY; FROM: 2004.12.13 TO: 2004.12.23

RECT Rectification
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130508

Termination date: 20140526