CN107592601A

CN107592601A - 在小型装置中使用声音传感器阵列估计到达方向

Info

Publication number: CN107592601A
Application number: CN201710548240.9A
Authority: CN
Inventors: T·卢纳; F·古斯塔夫森; D·林格伦; G·汉德拜
Original assignee: Oticon AS
Current assignee: Oticon AS
Priority date: 2016-07-06
Filing date: 2017-07-06
Publication date: 2018-01-16
Also published as: US10321241B2; EP3267697A1; US20190014422A1

Abstract

本申请公开了在小型装置中使用声音传感器阵列估计到达方向，所述小型装置为听力装置，包括用于估计从一个或多个声源发出的声音信号的到达方向的声音系统，所述系统包括：包括M个声音接收变换器的阵列的声音传感器单元，每一声音接收变换器提供电输入信号；采样单元，用于提供周围声场的至少一样本；处理单元，包括：包括参数模型的模型单元，所述参数模型配置成能够将所述阵列处的声场描述为在所述阵列周围及邻近区域中的到达方向的函数；模型优化单元，配置成基于声音样本优化所述模型；价值优化单元，配置成针对到达方向使所述模型的价值函数最小化；估计单元，配置成基于具有优化的参数和优化的价值函数的参数模型估计到达方向。

Description

在小型装置中使用声音传感器阵列估计到达方向

技术领域

本发明总体上涉及借助于声音敏感传感器如传声器的阵列估计声能到达的方法和系统，尤其涉及在小型电子装置如便携装置例如体戴装置如听力装置例如助听器中应用这样的方法和系统。

背景技术

听力受损人员的最大问题迄今仍为在存在竞争声源的情形下理解语音。这由失去足够好地分离声源的能力从而不能“调准/调谐到”当前最感兴趣的信号造成。正常听力人员具有该分离和调准的能力，通常称为鸡尾酒会效应。大脑和听觉系统通过朝向感兴趣声源调整神经增益而进行前述调准。最近的大脑成像数据表明，典型的神经增益在10-12dB级。这意味着大脑在神经学上可将感兴趣的声源加强10-12dB的量。对于听力受损人员，该神经增益要低得多，其接近0dB，这也解释了为什么听力受损人员抱怨声音趋于融为一体，也就是说，它们不再能够被听力受损人员分离和调准。为解决这个问题，希望使用一定尺寸的传声器系统，其可安装在助听器中或者通过一些其它的设置佩戴在听力受损人员的头上。

定向传声器/波束形成器通过抑制从一些方向到达的声音同时保持来自一个方向(通常前面)的良好灵敏度而起作用。与定向传声器相反的是全向传声器，其对于来自所有方向的声音具有一样的灵敏度。一阶相减传声器通常在助听器中实施定向传声器，其中来自两个全向传声器的输出被减去。后传声器处记录的声音被时间延迟然后从前传声器减去。声音在传声器之间传播所花的时间称为外部时延，其计算为传声器之间的距离除以声速。助听器内电学上引入的时延称为内部时延。如果声音从后面到达及内部时延等于外部时延，前面信号及延迟的后面信号将彼此抵消，助听器因而将对从后面到达的声音不敏感。内部时延和外部时延之间的比(称为时延比)确定对从不同方向到达的声音的灵敏度。定向传声器的灵敏度图通常使用极坐标图指明。极坐标图展现传声器对从不同方向到达的声音的灵敏度。

上面的讨论表明当前的波束形成技术(即使具有双耳波束形成器)在混响条件下未实现必要的10-12dB分离，从而不能为听力受损人员重新建立失去的分离能力。此外，波束太宽(30+度)以至于实际上没有选择性。虽然存在其它具有更窄的波束的配置，但来自后面的旁瓣增加。

靠近讲话者放置并使用例如眼睛注视来使用户直观地控制调入哪一讲话者的多个远程传声器原理上可解决该问题。

发明内容

更通用的解决方案将需要头部安装的定向传声器，其分离每一讲话者并使用户能调准到同时或个别活跃的讲话者中的一个或多个(从而实施多个(截然不同的)虚拟传声器)。图8示出了这样的情形。

本发明提出在小型装置如听力装置例如助听器中或者在采用声学声音感测技术的其它便携装置如移动电话或扬声电话中进行波束形成的备选基本原理。对于这些物理尺寸遭受限制的装置，根据本发明，可提供相较目前技术水平的波束形成技术更有选择性的波束形成器。

用于定位和表征声源的现有技术装置为所谓的声像仪/声学照相机，其由一组传声器(也称为传声器阵列)组成，这些传声器被同时采集以形成声源位置的表示。声像仪通常包括传声器阵列及非必须地包括光学照相机。传声器(模拟或数字)被同时采集或者具有已知的相对时延以能够使用信号之间的相差。随着声音以有限的已知速度在介质(空气、水……)中传播，声源由传声器在不同的时刻及以不同的声音强度(取决于声源位置和传声器位置)感知。一种常用的从传声器的测量获得声像的方法是使用波束形成：通过相对地延迟每一传声器信号并将它们相加，来自特定方向的信号被放大，而来自其它方向的信号被消除。之后，计算该所得信号的功率并报告在功率图上对应于方向的像素处。在需要计算功率的每一方向重复该过程。

然而，声像仪的尺寸通常太大以至于不能安装在头上。因而，典型的数据是直径60cm，及声像仪通常具有一百个甚至更多个传声器如MEMS传声器(微型机电系统传声器)，具有窄波束(低于10度)及具有约40dB的旁瓣衰减(分离能力)。大量传声器及(大的)物理尺寸是高角分辨能力的基础。

目前技术水平的助听器延迟及求和波束形成器的问题在于未足够好地分离。下面的表1示出了基于无回音室的记录，对于具有2x2个传声器的设置(左耳中两个传声器，右耳中两个传声器，就像当前的具有模拟的理想的耳-耳无线链路的助听器中一样)，指向不同方向的波束的分离能力(清晰度-定向指数)。该表表明，在约4-9dB范围中的分离能力取决于方向。然而，这是在无回声条件下。在现实的混响条件下，该分离能力仅为约3-4dB。

表1：典型的现有技术双耳定向助听器验配的清晰度-定向指数

该定向指数(DI)是表征声学装置如助听器的方向性的量，因而DI的值越高，助听器的响应越有方向性。

清晰度-定向指数(AI-DI)可视为定向指数的进一步发展。AI-DI是使用在传声清晰度指数(也称为语音可懂度指数)中使用的特定频率(或频带)的权重的得分，其强调对理解语音最重要的那些频率分量，将该频率权重应用于DI，从而获得方向性的测度，这对于语音声音更现实。因而，AI-DI强调单一数字，其预测定向系统在现实声环境中理解语音方面的预期益处。

从传感器阵列估计到达方向(DOA)在文献中是经过很多研究的问题，其中有一系列算法如MUSIC(多信号分类器)、ESPRIT(经旋转不变技术估计信号参数)、确定和随机ML等。这些算法基于窄带和远场信号的假设，及这些算法通常针对规则阵列(均匀地线性到圆形阵列)进行剪裁。基础的原理是估计信号在传感器之间的时延，该时延对应于DOA。此外，大拇指规则是，阵列中的传感器应被分开约所接收信号的波长的一半。典型的应用是在无线电和声纳系统中，其中信号基于载波进行调制，因而满足窄带假设。该经典理论的弱点在于怎样估计声源的数量。最近，在同样估计声源的数量的免调谐方法如SPICE(基于稀疏迭代协方差的估计)算法中取得了明显进展。

上述及其它目标和优点通过根据本发明的方法和系统获得。

根据本发明的原理，提供一种方法、系统或装置，其可提供宽带到达方向(DOA)估计，及该方法、系统或装置可用在近场和远场设置中。

与现有技术相反，本发明涉及机会声信号源的情形，它们通常为宽带。例子包括在户外的机动车辆(其应被衰减)或者会议室中讲话的人(其应被放大)。一种解决方案是将信号聚焦到窄带信号内，例如使用WINGS(Wavefield-Interpolated Narrowband-GeneratedSubspace，波场插值的窄带产生的子空间)算法(例如参见[Doron&Nevet；2008])，从而将该问题重塑为标准问题。WINGS算法使用子空间技术将多个不同的频率投射到一个频率上，从而获得初始信号的窄带逼近。

根据本发明的方法、系统和装置基于空间延迟而不是时间延迟。起源是基于配置成能够将声场描述为声音接收传感器如传声器阵列周围及相邻区域中的到达方向的函数的参数模型。在实施例中，在传感器阵列处进行信号的泰勒(Taylor)展开，其中跨空间的延迟通过泰勒展开而被使得与阵列中的参考点有关。

根据本发明的第一方面，提供了用于估计在一个或多个声源的环境中产生声场的一个或多个声源发出的声音的到达方向的方法，该方法包括：

-提供声音敏感传感器阵列，如传声器，每一传感器提供表示所述环境的声场的数字样本流；

-在实质上同样的时刻从每一所述传感器提供所述声场的至少一样本；

-提供配置成能够将所述声场描述为所述阵列周围及邻近区域中的到达方向的函数的参数模型；

-基于所述声音样本针对所述模型的参数优化所述模型；

-针对所述到达方向使所述模型的价值函数最小化。

在实施例中，所述参数模型配置成在空间延迟域(而不是时域)起作用。

在第一方面的实施例中，上面提及的模型为泰勒展开模型，及每一相应传感器处接收的声音信号按L阶的泰勒级数展开进行分解，其中信号导数通过线性最小平方方法确定，及其中到达方向θ通过下面的表达式进行估计：

其中，║·║²表示最小平方损失(或误差)函数，z为包括声音信号s和另外的噪声∈的混合信号，及Τ(θ)为包括前N个泰勒展开系数的向量。

在第一方面的实施例中，声音敏感传感器阵列为配置来安装在人头上的传声器阵列。

在第一方面的实施例中，所述阵列构造来提供在助听器中，如耳后式助听器、耳内式助听器或听力眼镜中。

根据本发明的第二方面，提供一种用于宽带到达方向(DOA)估计的系统或装置，该装置可在近场及远场设置中使用。

根据本发明这些方面的方法及系统或装置下至超低采样频率均能起作用，这在具有硬件限制的系统如电池供电的传感器节点中是优点。

根据本发明的第二方面，提供一种声音系统如听力系统或者装置如听力装置，用于估计从一个或多个声源发出的声音信号的到达方向，该系统或装置包括：

-包括M个声音接收变换器如传声器的阵列的声音传感器单元，每一声音接收变换器提供电输入信号；

-采样单元，在实质上同样的时刻从每一所述电输入信号提供周围声场的至少一样本；

-处理单元，包括：

--包括参数模型的模型单元，所述参数模型配置成能够将所述阵列处的声场描述为在所述阵列周围及邻近区域中的到达方向的函数；

--模型优化单元，配置成基于声音样本针对所述模型的参数优化所述模型；

--价值优化单元，配置成针对到达方向使所述模型的价值函数最小化；

--估计单元，配置成基于具有优化的参数和优化的价值函数的参数模型估计到达方向。

术语“声音敏感传感器”和“声音接收变换器”和“声音敏感变换器”可互换地使用，在意思上没有任何差别。

在实施例中，声源系统配置成对宽带声信号起作用，例如在0和12kHz之间的范围中，如在20Hz和10kHz之间或者在50Hz和8kHz之间。在实施例中，声音系统配置成同时以不同的DOA(θ)启动波束，因而可用在多讲话者环境中(例如参见图8)。

在实施例中，声音系统如采样单元包括模数(AD)转换器以按预定的采样速率如20kHz对模拟输入进行数字化，从而提供数字样本流。在实施例中，听力装置包括数模(DA)转换器以将数字信号转换为模拟输出信号，例如用于经输出单元如输出变换器呈现给用户。

在第二方面的实施例中，声音敏感传感器阵列包括声音敏感变换器如传声器的阵列，配置成安装在人体上，如头部处或附近，例如连接到头带。

在实施例中，声音敏感传感器阵列包括实施在芯片上的传声器，如MEMS传声器，例如实施在同一芯片上，例如与用于处理来自传声器的电输入信号的电子电路一起实施在同一芯片上。

在实施例中，至少部分声音敏感传感器或变换器如传声器位于头带或类似结构(如一件珠宝例如项链)上或者与其一体，所述类似结构适于安装在用户身体上，例如安装在用户头上或者颈部周围。在实施例中，声音敏感传感器可可逆地安装在用户身体上(例如使得在移除和重新安装时，它们可以实质上一样的相互构造相对于彼此进行安装)。在实施例中，声音敏感变换器固定地安装在用户身体如头上，例如通过完全或部分植入和/或固定到用户的皮肤或组织。在实施例中，声音敏感变换器形成助听器如空气传导助听器、骨导(如骨锚式)或耳蜗植入型助听器的一部分。在实施例中，声音敏感传感器在安装在用户身体上时按预先确定的几何形状进行定位。在实施例中，声音敏感传感器安排成实质上平面的几何形状。在实施例中，声音敏感传感器安排成三维几何形状。在实施例中，声音敏感传感器安排成实质性线性的几何形状。在实施例中，声音敏感传感器安排成弯曲如实质上弯曲或部分圆形的几何形状(例如在圆圈的一部分上，例如跨度大于60度)。在实施例中，声音敏感传感器安排成实质上完全或部分球形的几何形状(例如在球的一部分上，例如跨越半球或者半球的一部分，如多于半球区域的25％如50％以上)。在实施例中，声音敏感变换器阵列(或者至少部分如大部分声音敏感变换器)位于用于由用户佩戴的功能结构上，如一副眼镜上(如一个或多个杆如侧杆上)、项链上、头带上等。在实施例中，声音敏感传感器被设置在用户的头上(如头部或颈部周围)以实质上覆盖用户周围的所有空间角度。在实施例中声音敏感传感器均匀分布，例如作为一个阵列或者按组或阵列分布。在实施例中，声音敏感传感器非均匀地分布以使某些如预定方向或者方向角度的优先级更低。

总的来说，传声器的数量大于感兴趣的音频源(的位置)的数量是有利的，例如2倍大或者5倍大或者更大。在实施例中，声音系统配置成使得声音接收变换器的数量N大于3，例如在从3到10的范围中或者大于10如大于50。

在实施例中，声音系统配置成使得相邻声音接收变换器之间的距离d小于0.02m(20mm)，如小于0.01m，如小于0.008m，如小于0.005m，如小于0.002m(2mm)。在实施例中，声音系统配置成使得相邻声音接收变换器之间的距离小于λ/2，其中λ为在最大感兴趣频率下的声音波长(例如如果fmax＝10kHz，λ＝34mm，则d≤17mm)。在实施例中，声音接收变换器按预定图案进行定位，例如展现某一对称性，例如旋转对称(例如N折叠，N>1)和/或镜像对称和/或平移对称。在实施例中，声音接收变换器设置在声音系统(如听力装置)中使得它们的几何中心以规则图案进行定位，例如按周期方向图。在实施例中，这样的周期方向图可以是2D图案或者3D图案。在实施例中，声音接收变换器按预定但非重复或非对称的图案定位。在实施例中，相邻声音接收变换器之间的距离由重复的晶格形成。在实施例中，各个声音接收变换器的位置已知(例如预定或者在校准过程期间确定)，但不构成重复图案。

在实施例中，声音系统包括波束形成器滤波单元，用于基于表示周围声场的一个或多个波束形成器输入信号提供波束成形信号，并配置成在确定波束成形信号时使用到达方向的估计量。在实施例中，波束形成器滤波单元配置成使用来自M个声音接收变换器的至少部分(如大部分或全部)电输入信号提供波束成形信号。

在实施例中，声音系统(如波束形成器滤波单元)配置成实施角波束图，在衰减-角度绘图中，旁瓣展现多于10dB阈值的衰减，如15dB以上，如20dB以上(例如参见图9)。在实施例中，波束图在所涉及应用感兴趣的频率展现高于阈值的衰减，例如从20Hz到20kHz的人听频范围，例如针对语音感兴趣的频率范围，例如在从1kHz到6kHz的范围中，如在2kHz和4kHz之间的范围中，例如在或约3kHz。

在实施例中，声音系统(如波束形成器滤波单元)配置成实施包括小于30度的主瓣的角波束图。在实施例中，波束图包括展现小于20度的角延伸的主瓣，如小于15度，如小于10度。术语“小于xx度的主瓣”指主瓣周围的两个最靠近的最小值之间的角距离小于xx度，例如参见图9。

在实施例中，声音系统包括辅助装置，配置成实施使用户能控制声音系统的功能的用户接口。

在实施例中，声音系统包括声音敏感传感器的阵列的网络。声音敏感传感器的阵列的网络(每一阵列称为传感器阵列)例如可包括位于用户的左和右耳处(和/或之间)的相应传感器阵列，例如位于用户的左和右耳处(和/或之间)的听力装置中。在实施例中，声音系统配置成使得传感器阵列连接在通信网络中，从而使接收变换器提供的所有电输入信号能在处理单元中一起进行评估，例如结合波束形成器滤波单元。

在实施例中，声音系统包括追踪单元，配置成随时间追踪一个或多个声源。在实施例中，追踪单元基于近场追踪。在实施例中，追踪单元包括卡尔曼滤波器。近场定位和追踪例如在[Gustafsson et al.,2015]中讨论。

在实施例中，声音系统配置成估计多个活动目标声源(如包括语音的声源，如在给定时间段内)的到达方向。

在第二方面的实施例中，声音敏感传感器阵列配置成包括在助听器中，例如调整大小和位置以形成听力装置的一部分。

在第二方面的实施例中，助听器是或包括耳后式助听器或者耳内式助听器或者听力眼镜。

在本发明的第三方面，还提供包括如上所述的、结合附图描述的及权利要求中限定的声音系统的听力装置。

在实施例中，该听力装置包括助听器，如空气传导型助听器例如耳后式助听器或耳内式助听器、骨导型助听器、耳蜗植入型助听器或者一对听力眼镜。

在实施例中，听力装置包括波束形成器滤波单元，用于基于表示周围声场的一个或多个波束形成器输入信号提供波束成形信号，并配置成在确定波束成形信号时使用到达方向的估计量。在实施例中，波束形成器输入信号包括来自声音传感器单元(包括M个声音接收变换器的阵列)的至少一电输入信号，如大部分或全部。

在实施例中，波束形成器滤波单元配置成基于多个活动目标声源的到达方向的估计量确定波束图，其中来自估计的到达方向的声音保持实质上不被改变(保持)，而来自其它方向的声音被衰减(相比较而言)。

在实施例中，听力装置配置成追踪波束图，其随时间跟随活动目标声源。

根据本发明的方法和/或声音系统和/或听力装置相较于经典的DOA方法的优点包括：

-时间采样可以是随意的。同样，超慢的采样即每秒采样可用于使能耗最小化；

-传声器之间的空间分隔优选应比波长的一半近(在代表性音频时，如2kHz或4kHz)。这对于头部安装的阵列是一个优点。理论上该分隔没有下限，这样，即使耳朵安装的阵列也似乎可行。在实践中，SNR确定分隔的下限；

-该方法应用于宽带(真实声源)及窄带信号(目前的大多数算法均聚焦于窄带信号)；

-该阵列可具有任意的形状及不限于均匀阵列。例如，该阵列可安装到眼镜或(VR)护目镜；

-理论上，该方法应用于多个声源，其中声源的数量也可估计。然而，该方法并不随声源的数量缩放，因为参数数量随声源数量线性增加，这样，所需的阵列元素数量也线性增加；

-该方法可按声源位置直接参数化，因此对近场与远场一样地产生效果。如果所注意的声源非常靠近听者，这是有利的。大拇指规则是近场在一个波长内，举例来说，近场为一米。在鸡尾酒会中，可能有许多声源靠近听者；

-该算法非常适合并行实施。

另一方面，本发明进一步提供数据处理系统，包括处理器和程序代码，程序代码使得处理器执行上面描述的、结合附图描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。

另一方面，本发明还提供称为APP的非短暂应用。APP包括可执行指令，其配置成在辅助装置上运行以实施用于上面描述的、结合附图描述的及权利要求中限定的声音系统或听力装置或听力系统的用户接口。在实施例中，该APP配置成在远程控制装置、移动电话如智能电话或另一使能与所述声音系统、所述听力装置或听力系统通信的便携装置上运行。

在本说明书中，“听力装置”指适于改善、增强和/或保护用户的听觉能力的装置如听力仪器或有源耳朵保护装置或其它音频处理装置，其通过从用户环境接收声信号、产生对应的音频信号、可能修改该音频信号、及将可能已修改的音频信号作为可听见的信号提供给用户的至少一只耳朵而实现。“听力装置”还指适于以电子方式接收音频信号、可能修改该音频信号、及将可能已修改的音频信号作为听得见的信号提供给用户的至少一只耳朵的装置如头戴式耳机或耳麦。听得见的信号例如可以下述形式提供：辐射到用户外耳内的声信号、作为机械振动通过用户头部的骨结构和/或通过中耳的部分传到用户内耳的声信号、及直接或间接传到用户耳蜗神经的电信号。

听力装置可构造成以任何已知的方式进行佩戴，如作为佩戴在耳后的单元(具有将辐射的声信号导入耳道内的管或者具有安排成靠近耳道或位于耳道中的扬声器)、作为整个或部分安排在耳廓和/或耳道中的单元、作为连到植入在颅骨内的固定结构的单元、或作为整个或部分植入的单元等。听力装置可包括单一单元或几个彼此电子通信的单元。

更一般地，听力装置包括用于从用户环境接收声信号并提供对应的输入音频信号的输入变换器和/或以电子方式(即有线或无线)接收输入音频信号的接收器、用于处理输入音频信号的(通常可配置的)信号处理电路、及用于根据处理后的音频信号将听得见的信号提供给用户的输出装置。在一些听力装置中，放大器可构成信号处理电路。信号处理电路通常包括一个或多个(集成或单独的)存储元件，用于执行程序和/或用于保存在处理中使用(或可能使用)的参数和/或用于保存适合听力装置功能的信息和/或用于保存例如结合到用户的接口和/或到编程装置的接口使用的信息(如处理后的信息，例如由信号处理电路提供)。在一些听力装置中，输出装置可包括输出变换器，例如用于提供空传声信号的扬声器或用于提供结构或液体传播的声信号的振动器。在一些听力装置中，输出装置可包括一个或多个用于提供电信号的输出电极。

在一些听力装置中，振动器可适于经皮或由皮将结构传播的声信号传给颅骨。在一些听力装置中，振动器可植入在中耳和/或内耳中。在一些听力装置中，振动器可适于将结构传播的声信号提供给中耳骨和/或耳蜗。在一些听力装置中，振动器可适于例如通过卵圆窗将液体传播的声信号提供到耳蜗液体。在一些听力装置中，输出电极可植入在耳蜗中或植入在颅骨内侧上，并可适于将电信号提供给耳蜗的毛细胞、一个或多个听觉神经、听觉脑干、听觉中脑、听觉皮层和/或大脑皮层的其它部分。

“听力系统”指包括一个或两个听力装置的系统。“双耳听力系统”指包括两个听力装置并适于协同地向用户的两只耳朵提供听得见的信号的系统。听力系统或双耳听力系统还可包括一个或多个“辅助装置”，其与听力装置通信并影响和/或受益于听力装置的功能。辅助装置例如可以是遥控器、音频网关设备、移动电话(如智能电话)、广播系统、汽车音频系统或音乐播放器。听力装置、听力系统或双耳听力系统例如可用于补偿听力受损人员的听觉能力损失、增强或保护正常听力人员的听觉能力和/或将电子音频信号传给人。

本发明的实施例如可用在如包括声音输入的便携电子装置应用中，例如助听器、头戴式耳机、耳麦、耳朵保护系统等。

附图说明

本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见，这些附图均为示意性及简化的图，它们只给出了对于理解本发明所必要的细节，而省略其他细节。在整个说明书中，同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明，其中：

图1A示出了可用在本发明实施例中的传声器阵列的示意性平面图。

图1B示出了图1A所示阵列中的四个传声器的、输出电压作为时间的函数的例子。

图2A示出了实际的和两个假设的传播声波按相对于阵列的不同方向通过包括四个传声器的传声器阵列。

图2B示出了来自图2A中的传声器阵列的响应的振幅，对应于图2A中所示的每一相应的通过声波。

图3A示出了在包括目标声源和噪声的听音情形下佩戴左和右助听器的用户。

图3B示出了佩戴左和右助听器及包括传声器阵列的头带的用户。

图4示出了根据本发明的助听器的实施例，包括位于用户耳后的BTE部分和位于用户耳道中的ITE部分，其中该助听器与包括用于助听器的用户接口的辅助装置通信。

图5示出了根据本发明的提供来自声源的声音到声音系统的到达方向的方法的流程图。

图6示出了根据本发明的声音系统的实施例的简化框图。

图7示出了根据本发明的包括波束形成器滤波单元和声音系统的听力装置的实施例的简化框图。

图8示出了根据本发明的听力装置或听力系统用于在多声源环境中分离各个声源。

图9示意性地示出了根据本发明的包括声音敏感传感器阵列的声音系统(在特定频率)的衰减-角度图。

图10示出了多目标声源到达方向估计情形。

具体实施方式

下面结合附图提出的具体描述用作根据本发明的方法和系统的非限制性实施例的描述。

参考图1A，示出了可用在本发明实施例中的传声器阵列的示意性平面图，但应当理解，许多其它形状的阵列也可使用，而不背离本发明的范围。该阵列包括四个传声器1、2、3和4。图1A还示出了用该阵列可获得的可能的方向特性，其中所述方向特性包括主瓣5、两个旁瓣6和8及后瓣7。根据对每一特定传声器信号进行的特定信号处理，可获得许多其它方向特性。

参考图1B，示出了图1A所示阵列中的四个传声器的输出电压作为时间的函数的例子，其在声波按相对于所述阵列的特定方向传播通过所述阵列时产生。相应的输出电压由z₁,z₂,z₃和z₄指定，其与下面给出的详细描述中将使用的记法一样。在图1B所示的例子中，声波首先抵达传声器1，然后抵达传声器4、2和3，这引起图1B中所示的输出电压的相对延迟。

参考图2A，示出了按箭头10所示方向行进的实际的传播声波9及分别按方向12和14行进的两个假设的传播声波11和13。在该例子中，传声器阵列包括四个传声器15、16、17、18，这些传声器之一(在所示例子中为传声器18)可被视为位于坐标系统x、y的原点处的参考传声器R。传播方向在该二维例子中由角度θ唯一地指明，但在本发明范围内，在三维空间中传播也是可能的，这需要两个角度θ,φ来唯一地指明声波的传播方向(参见图3A)。声学波形9的到达方向(DOA)由传声器阵列捕获(星15、16、17、18指图2A中的各个传声器)。图2A示出了进入方向的(源自有限数量的)三个假设10、12、14。只有方向之一(10)在时域给出合理及平滑的重构，因而定义DOA。图2A可说明“空间域”中的情形(如图2A的上部所示)。

参考图2B，示出了图2A中的阵列的四个传声器的响应(完全的传声器阵列在相应传声器信号的适当处理之后的输出电压与时间之间的关系)的振幅，对应于图2A中所示的每一相应的声波(实心点对应于波9和方向10，交叉阴影线的点对应于波11和方向12，及纵向阴影线的点对应于波13和方向14)。

图2B以例示的形式说明了本发明的基本概念。对于声波9通过阵列，阵列输出的振幅作为时间的函数在图2B中通过实心点19示出在四个特定时间点。类似地，声波11通过阵列将导致由点20指明的输出，及声波13的通过将导致由图2B中的点21指明的输出。如图表明的，只有声波之一(声波9、方向10)即声波的有限的许多传播方向之一在时域给出合理及平滑的重构，因而定义根据本发明的原理估计的到达方向(DOA)。图2B可说明“时域”中的情形(如图2B的上部所示)。

图2A中的四个传声器可看作阵列的子集，例如实施为头带(传声器绕头部填充)的传声器阵列的子集。所提出的方法选择图2A中的波前(9)以图2B中通过位于振幅-时间曲线22上的实心点表示的“平滑”方式通过传声器。这包围最可能的到达方向(DOA)，具有角度θ。如果该角度刚刚稍小或稍大，图2B中的图案将没有那样平滑因而不太可能是DOA。因此，通过在θ的方向听(即通过使用阵列的传声器信号的适当组合使波束指向θ的方向，即提供波束形成器滤波单元)，可实施指向θ方向的敏感的“定向传声器阵列”。

在下面，将描述根据本发明的远场到达方向(DOA)估计的具体实施例。

A、信号模型

假定平面传播模型，其中传感器位于(x_n,y_n)处，n＝1,2,…,N。在该部分，假定传感器相较声源更靠近坐标系统的原点。

声源发出声学信号s(t)，其到达传感器n，具有延迟及由下面的表达式给出的附加高斯噪声：

到达传感器n的信号则由下面的表达式给出：

这为DOA文献中的标准假设之一。在表达式(1)中，θ为坐标系统的x轴与定义为参考传感器R的传感器和特定声源之间的向量之间的角度(参见图2A)。延迟则可表达如下：

其中c为声速。

B、假设

主要假设为，延迟差远小于信号变化，这在频率方面可表达为：

由于延迟差受阵列大小D限制(例如人头的典型直径)，表达式(3)可表达为：

作为例子，机动车辆具有低于100Hz(6000rpm)的声发射基频。最短的波长因而约为3米，及所述阵列应远小于该波长，例如0.3米。在平均人头的情形下，D可以约为0.25米。

C、泰勒展开

如果满足(3)中的条件，信号跨所述阵列平滑地变化，及L阶的泰勒级数展开将表示信号在传感器n处的局部性态。则应用下面的表达式：

上面的表达式可写为线性回归：

其中Δ_n(t)指泰勒展开的高阶项，其在下面将因假设(3)而被忽略，及其中

S^T(t)＝(s⁽⁰⁾ s⁽¹⁾ s⁽²⁾…s^(L)) (7b)

表达式(1)中给出的原始模型因而可写为：

考虑该阵列，应用下面的一组等式，这些等式在泰勒展开参数方面线性但对于θ非线性：

其中N指泰勒展开系数的数量。

该组等式可方便地写成矩阵形式：

其中

D、DOA估计

表达式(10)中的部分线性的模型的实质特征在于最小平方(LS)估计量(其与高斯噪声的最大似然(ML)估计量一致)通过搜索最佳到达方向θ而方便地计算，其中所有线性参数可分析地进行估计。也就是说，最佳化仅涉及标量参数，与阵列元素的数量M或者泰勒展开的阶L无关。这也使能并行的实施结构，其中DOA角度被网格化，及LS的测量可完全并行地计算。

LS估计量按定义由下面的表达式给出：

其中V指由下式给出的LS损耗函数：

线性子结构使估计问题适合可分离的最小平方(SLS)框架，其实际上使解决最佳化问题计算上效率更高。

如果θ为固定的参数，s的估计量由下式给出：

对于上面的最佳化问题，该估计量可使用最小平方进行计算：

其中十字符号指摩尔彭罗斯(Moore-Penrose)伪逆。

这导致到达方向θ的下面的估计量：

如果θ为一维或二维，θ的估计量可通过在精细网格上评估它而非常有效率地计算，如上面提及的，其适合并行实施。

在前面，仅公式表示了阵列的单一样本。然而，在t＝t₁,t₂,….,t_m的一批样本可按同样的方式建模，通过将这些样本堆叠到mN向量内并将T(θ)扩展为具有m个同样的块的块对角矩阵，假定θ在该批持续时间内不明显变化。

E、多个信号源

原则上，线性化的信号模型(10)可直接延伸到多个信号源。如果信号源的数量记为K，表达式(10)变成：

为满足识别判据，未知数必须少于观察数量，即：

M≥(L+1)K

对应于K组泰勒展开，具有L个未知数，及每一声源一个额外的角度参数。因而，阵列中传感器元件的数量随信号源的数量线性增加。

F、设计问题

真实信号很少为频带有限的信号，因此最大频率f_max将不能很好地确定。然而，低通滤波器可总是应用于所有传感器。因此，f_max可被考虑为设计参数，就像阵列的大小D一样。泰勒展开的阶L也可自由选择。在本发明的一实际实施中，设计顺序如下：

1)D由阵列的具体构造给出；

2)f_max基于源激发进行选择以获得最好的可能信噪比(SNR)。然而，f_max<<c/D是必须的；

3)泰勒展开式阶L为Df_max的单调递减函数及L必须满足(L+1)小于或等于M的限制条件以获得唯一的解。

推荐以一阶泰勒展开式开始，即L＝1。

图3A示意性地示出了在包括位于特定空间点(例如通过坐标系统中的坐标确定，在此其中心在用户U的耳朵之间的头部中，如箭头x,y,z所示及如图3A的顶部的坐标系统中所示)的声源S的听音情形下，佩戴左和右助听器L-HD,R-HD(例如形成双耳助听器系统)的助听器用户U的几何设置。声源S按球面表示的相对于用户的坐标为(θ_s,r_s,)。声音场景还包括一个或多个噪声源(“噪声”)，其可以分布或空间定位。左和右助听器中的每一个包括适于位于用户U的耳朵(左耳、右耳)后面的部分，通常称为BTE部分(BTE)。BTE部分包括第一(前)和第二(后)传声器(FM_L,FM_L；FM_R,FM_R)，用于将输入声音分别转换为第一和第二电输入信号。给定BTE部分的第一和第二传声器(FM,RM)，当位于用户U的相应耳朵后面时，由表示声音从位于BTE部分周围处的声源S到所涉及助听器(L-HD,R-HD)的第一和第二传声器的传播的传递函数和表征，其中k为频率指数。在图3A的设置中，目标信号源S假定处于相对于用户U的前半平面中，与用户的鼻子的方向(参见图3A中的LOOK-DIR)及与BTE部分的传声器轴(例如参见左和右助听器的参考方向REF-DIR_L,REF-DIR_R)成角度θ。包括传递函数的向量称为所涉及听力装置的传声器的视向量。

给定BTE部分的第一或第二传声器隔开预定距离ΔL_M(通常称为传声器距离d)进行定位。左和右助听器的两个BTE部分因而及相应的传声器当在工作模式安装在用户头上时隔开距离a。在用户U位于距声源S的声学远场中时，从用户到声源的距离r可假定远大于传声器阵列的两个相邻传声器之间的任何距离(ΔL_M和/或a)(ΔL_M,a<<r_s)，如图3A中的向量r_s的断线指明的，r_s不按比例。图3A中的图为通过第一和第二助听器的传声器(垂直于纵向方向，由图3A中的出平面箭头VERT-DIR(z)指明)并对应于平面z＝0的水平面中的平面图。在简化模型中，可以假定声源S_i位于水平面中(如图3A中所示的水平面)。左和右助听器之间的耳间通信链路在图3A中由虚线箭头(记为IAL)指明。耳间通信链路IAL例如配置成使音频信号及控制和/或状态信号能在助听器之间进行交换(或者从一助听器转发给另一助听器或者转发给辅助装置)。在实施例中，所有四个传声器信号均可在一个或两个听力装置(和/或辅助装置，例如参见图4)中获得。在实施例中，四个传声器(FM_L,RM_L,FM_R,RM_R)形成本发明意义的传感器阵列的一部分(如构成传感器阵列)。在实施例中，传声器阵列(例如每一阵列包括三个以上传声器，例如如图1A中所示，四个传声器)位于每一耳朵处(和/或耳朵之间，例如前额上或者分布在头部周围，例如在头带中，例如参见图3B，及经耳间链路IAL(或到辅助装置的相应链路，例如参见图4)或者有线连接一起形成网络)。来自声源S的声音到用户U(在实践中，到用户头部的中点)的到达方向(DOA)在图3A和3B中指明。使用参考坐标系统是本领域技术人员选择的关键。假定传声器阵列的传声器的位置在共同参考坐标系统中已知(或者可确定)。这由到左听力装置L-HD的后传声器RM_L的向量r_RML及该后传声器的坐标指明该坐标及其它传声器的对应坐标例如保存在声音系统的存储器中。

图3B示出了与图3A中一样的情形，但声音系统另外包括位于用户头上(在此为前额)的传声器阵列(在此指明为形成头带的一部分)。头带的M’个传声器HBM₁,…,HBM_M’的位置假定已知，在此在相邻单元之间具有相等的距离ΔL_HBM。头带的传声器连接到听力装置之一的处理器或者连接到单独的处理器如位于辅助装置中的处理器，配置成处理来自左和右听力装置及头带的各个传声器的所有电输入信号。左和右听力装置的传声器(如多于图3A和3B中所示的两个，例如三个或四个)及头带的传声器可被视为通过网络联系在一起的三个个别的传声器阵列。如图3A的情形一样，假定头带的各个传声器的位置(如坐标(x,y)或(r,θ))已知，及例如存储在声音系统的存储器中。在图3B的实施例中，传声器阵列跨头带的有限长度(区域)定位。然而，传声器也可绕头带分布，例如均匀分布，或者分成各个组，或者“非周期性或随机地”分布(具有已知位置)。从而频带头带的用户周围的所有角度均可被注意到。

图4示出了形成为耳内接收器式(RITE)助听器的示例性助听器HD，包括适于位于耳廓后面的BTE部分(BTE)和包含适于位于用户耳道中的输出变换器(如扬声器/接收器SPK)的部分(ITE)。BTE部分和ITE部分(ITE)通过连接元件IC连接(如电连接)。在图4的助听器实施例中，BTE部分包括两个输入变换器(在此为传声器)(FM,RM)，每一输入变换器用于提供表示来自环境的输入声音信号S_BTE的电输入音频信号。在图4的情形下，输入声音信号S_BTE包括来自声源S的贡献，S例如足够远离用户(因而远离听力仪器HD)使得其对声学信号S_BTE的贡献处于声学远场中。图4的助听器还包括两个无线接收器WLR₁,WLR₂，用于提供相应的直接接收的辅助音频和/或信息信号。助听器HD还包括衬底SUB，其上安装根据所涉及应用进行功能划分的多个电子元件(模拟、数字、无源元件等)，但包括彼此连接及经电导体Wx连接到输入和输出单元的可配置的信号处理单元SPU、波束形成器滤波单元BFU和存储器单元MEM。所提及的功能单元(及其它元件)可根据所涉及的应用划分成电路和元件(例如为了尺寸、功耗、模拟-数字处理等)，例如集成在一个或多个集成电路中，或者作为一个或多个集成电路与一个或多个单独的电子元件(如电感器、电容器等)的组合。可配置的信号处理单元SPU提供增强的音频信号，其用于呈现给用户。在图4的助听器实施例中，ITE部分包括扬声器(接收器)SPK形式的输出单元，用于将电信号OUT转换为声学信号(提供或贡献于耳膜处的声学信号S_ED)。在实施例中，ITE部分还包括输入单元，其包括用于提供表示耳道处或耳道中来自环境(包括来自声源S)的输入声音信号S_ITE的电输入音频信号的输入变换器(如传声器)M_ITE。在另一实施例中，助听器可仅包括BTE传声器(FM,RM)。在另一实施例中，助听器可包括三个以上传声器(FM,RM,M_ITE)。在又一实施例中，助听器可包括位于不同于耳朵处的别处的输入单元IT₃与位于BTE部分和/或ITE部分中的一个或多个输入单元的组合。ITE部分还包括引导元件如圆顶DO，用于引导并将ITE部分定位在用户耳道中。

图4中例示的助听器HD为便携装置，及还包括用于对BTE和ITE部分的电子元件供电的电池BAT。

该助听器HD例如可包括定向传声器系统(波束形成器滤波单元BFU)，适于增强佩戴助听器装置的用户的局部环境中的多个声源之中的目标声源。在实施例中，定向系统适于检测(如自适应检测)传声器信号的特定部分(如目标部分和/或噪声部分)源自哪一方向(DOA)。在实施例中，波束形成器滤波单元适于从用户接口(如遥控器或智能电话)接收关于目前的目标方向(DOA)的估计量的输入。存储器MEM例如可包括预定(或自适应确定)的复值、随频率而变的常数W_ij，其定义预定(或自适应确定)的“固定”波束图(如全向、目标消除等)及定义波束成形信号。存储器MEM还可存储听力装置的各个传声器(FM,RM,M_ITE,…)在适当的坐标系统中的坐标值(至少相对于参考点，例如听力装置中的固定位置)。

图4的助听器可构成或者形成根据本发明的助听器和/或双耳助听器系统的一部分。该助听器可包括分析滤波器组，及助听器的正向通路中的音频信号的处理例如可完全或部分在时频域进行。类似地，助听器的分析或控制通路中的信号的处理可完全或部分在时频域进行。

根据本发明的助听器HD可包括用户接口UI，例如如图4的下部中所示，实施在辅助装置AUX如遥控器中，例如实施为智能电话或其它便携(或不动的)电子装置中的APP。在图4的实施例中，用户接口UI的屏幕图示了目标方向APP。辅助装置的显示器示意性地示出了到达方向APP的屏幕，其指示用户指明到目标声源S的方向。到目前的目标声源S的方向可从用户接口指明，例如通过将声源符号拖曳到当前相对于用户的相应方向。当前选择的目标方向是在正向的左边(θ～45°处，参见图3)，如到声源S的粗箭头指明的。辅助装置和助听器适于使表示当前指明的方向的数据(例如用作算法的第一估计量)能经例如无线通信链路(参见图4中的虚线箭头WL2)传给助听器。辅助装置AUX和助听器HD适于使能在其间经例如无线通信链路(参见图4中的虚线箭头WL2)交换表示到目标声源的方向(DOA)的数据。通信链路WL2例如可基于远场通信，如蓝牙或蓝牙低功率(或类似技术)，通过助听器HD和辅助装置AUX中的适当天线和收发器电路实施，由助听器中的收发器单元WLR₂指明。耳间链路可使用相应的无线收发器WLR₁在双耳听力系统的两个助听器之间建立，以交换音频数据、获得多个用于根据本发明的算法的传声器信号从而准确地确定到目标声源的方向(DOA)。

图4示出了根据本发明的听力装置如助听器的运行方法的流程图。

该方法提供用于在一个或多个声源的环境中估计产生声场的一个或多个声源发出的声音的到达方向的方案。该方法包括：

S1，提供声音敏感传感器如传声器的阵列，每一传感器提供表示所述环境的声场的数字样本流；

S2，在实质上同样的时刻从每一所述传感器提供所述声场的至少一样本；

S3，提供配置成能够将所述声场描述为所述阵列周围及邻近区域中的到达方向的函数的参数模型；

S4，基于所述声音样本针对所述模型的参数优化所述模型；

S5，针对所述到达方向使所述模型的价值函数最小化。

图6示出了根据本发明的用于估计从一个或多个声源发出的声音信号的到达方向的声音系统SS的实施例。该声音系统在相应的输入变换器IT1,.,IT_M处从周围声场接收复合信号z₁,…,z_M。声场包括一个或多个(目标如语音)声源S_j,j＝1,…,N_ss(如一个声源S，如图3A、3B中所示)与另外的噪声的时变混合，如图6中由输入声音信号z(t)＝s(t)+∈(t)指明，其中∈(t)表示噪声。声音系统SS包括声音传感器单元SSU，其包括M个声音接收变换器(如传声器)的阵列，每一声音接收变换器提供表示相应输入变换器处接收的声音信号z₁,…,z_M的模拟电输入信号。声音系统SS还包括采样单元SU，用于在实质上同样的时刻从每一电输入信号提供周围声场的至少一样本。采样单元SU包括模数转换器AD₁,…,AD_M，连接到相应输入变换器IT₁,…,IT_M并将相应的数字化电输入信号提供为样本流z’₁,…,z’_M。声音系统SS还包括处理单元PU，其包括a)包括参数模型的模型单元MU，所述参数模型配置成能够将M个声音接收变换器的阵列处的声场描述为在所述阵列周围及邻近区域中的到达方向(DOA)的函数；b)模型优化单元MOU，配置成基于声音样本针对所述模型的参数优化所述模型；c)价值优化单元COU，配置成针对到达方向DOA使所述模型的价值函数最小化；及d)估计单元EU，配置成基于具有优化的参数和优化的价值函数的参数模型估计(最终的)到达方向DOA。

图7示出了根据本发明的包括波束形成器滤波单元BFU的听力装置HD的实施例的简化框图，波束形成器滤波单元BFU用于基于从声音系统SS接收的多个电声音信号z’₁,…,z’_M提供波束成形信号Y_BF。该听力装置HD还包括信号处理单元SPU，用于例如根据用户需要如根据用户的听力受损处理波束成形信号并提供处理后的信号ES，其馈给输出单元(FBS,DA-OT)以向用户提供可感知为声音的时变信号es(t)。图7示出了根据本发明的听力装置HD如助听器的实施例。时变输入声音z(t)假定包括目标信号分量s(t)和噪声信号分量∈(t)的混合、由听力装置拾取、处理并按处理后的形式提供给佩戴听力装置的用户作为听得见的信号(例如参见图3A、3B)。图7的听力装置的声源系统SS包括声音传感器单元SSU，其包括多个输入变换器IT_j,j＝1,…,M，每一输入变换器提供表示声音z_i(t)的(模拟)电输入信号；及包括采样单元SU，包含多个模数转换器AD_j从而提供电输入信号的数字化版本z’₁,…,z’_M。(数字)电输入信号z’₁,…,z’_M馈给声源系统SS的处理单元OU及波束形成器滤波单元BFU的相应分析滤波器组单元FBA_j。处理单元PU根据本发明的方法处理电输入信号z’₁,…,z’_M，并提供(最终的)到达方向DOA，其馈给波束形成器滤波单元BFU的控制单元CONT。分析滤波器组单元FBA_j,j＝1,…,M配置成将电时域信号z’_j转换为多个子频带信号(k＝1,…,K)，从而按时频表示Z_j(k,m)提供电输入信号z’_j,j＝1,…,M，k为子频带指数(k＝1,…,K)及m为时间帧指数。多输入波束形成器滤波单元BFU还包括波束形成器BF和控制单元CONT。波束形成器BF(及非必须地，控制单元CONT)接收多个电输入信号Z’_i,i＝1,…,M并提供波束成形信号Y_BF。控制单元CONT包括存储器MEM，其中可存储复数权重W_ij。该复数权重W_ij定义波束形成器滤波单元BFU的可能的预定(或先前更新)的“固定”波束形成器(经信号W_ij馈给BF)。控制单元CONT包括处理器PRO，例如用于更新视向量d和/或波束形成器滤波权重W_ij，例如受DOA影响或基于DOA。控制单元CONT还包括一个或多个话音活动检测器VAD，用于估计给定输入信号(如输入信号的给定时频单元)是否包括话音(或者话音为主)。相应的控制信号V-NV(话音-无话音)在控制单元CONT中用于确定视向量d，和/或波束形成器滤波权重W_ij还馈给波束形成器BF。在实施例中，控制单元CONT配置成从分析滤波器组FBA_j接收多个电输入信号Z’,i＝1,…,M及从波束形成器BF接收波束成形信号Y_BF。信号Y_BF包括输入声场的目标信号分量的估计量。听力装置HD还可包括(单通道)后滤波单元，接收(空间滤波的)目标信号估计量Y_BF(及对应的空间滤波的噪声信号估计量)以例如基于电输入信号Z’_i,i＝1,…,M的噪声部分的了解提供(进一步)噪声减少的目标信号估计量Y_NR。助听器还包括信号处理单元SPU，用于(进一步)处理波束成形及可能进一步噪声减少的信号(可能包括所提及的后滤波单元)并提供处理后的信号ES。信号处理单元SPU可配置成应用噪声减少的信号Y_NR的随电平和频率而变的整形，例如以补偿用户的听力受损。助听器还包括合成滤波器组FBS，用于将处理后的子频带信号ES转换为声音信号es，其馈给输出单元DA-OT(包括数模转换器DA和输出变换器OT)以将刺激es(t)作为可感知为声音的信号提供给用户。输出变换器OT例如可包括用于将处理后的信号es作为声音呈现给用户的扬声器或者包括骨导听力装置的振动器。助听器的从输入单元到输出单元的正向通路在此部分在时频域工作(处理成多个子频带FB_k，k＝1,…,K)。在另一实施例中，助听器的从输入单元到输出单元的正向通路可在时域工作。助听器还可包括用户接口及一个或多个检测器，从而使用户输入和检测器输入能由波束形成器滤波单元如控制单元CONT接收。可提供波束形成器滤波单元BFU的自适应功能。

用于DOA估计(在声音系统单元SS中)的至少部分(如大部分或全部)声音传感器(在此为传声器)也用作波束形成器滤波单元的输入。应注意，当使用采用本发明方案的多传声器阵列时，助听器传声器的(典型的)最小距离要求可摒弃。包括M个传声器(如M≥4或M≥8)的声音传感器阵列，以任何空间形状相对于彼此固定在空间中，当用于提供空间域滤波时，不受限于具有半波长距离的形状，而具有半波长距离在听力装置目前使用的延迟及求和波束形成技术中是必须的。根据本发明，灵活的空间形状是可能的。

下面参考图8，其示出了同席情形，多个偶尔的讲话者/听者具有准恒定的位置，视向量(从声源到传声器的传递函数)和/或对应于特定DOA的滤波器权重可确定并保存在图7中的控制单元CONT的存储器单元MEM中，使得它们在给定DOA的讲话者(再次)活动时可快速加载到波束形成器BF内。从而非活动波束可被视为表示可一次启动一个或者同时启动两个以上的虚拟传声器。

图8示出了根据本发明的听力装置或听力系统用于在多声源环境中分离各个声源。在图8中，声源为位于用户U(在此时示为听者L)周围的人(其在给定时间为讲话者S或听者L)。用户U可佩戴根据本发明的包括头部安装的传声器阵列的声音系统，其使能分离每一讲话者及使用户能根据当前讲话的人S调入，如具有足够小的角宽度Δθ从而包围用户周围的一个(且只有一个)人的(示意性)椭圆形波束所示。在图8的例子中，讲话的人由S指明，及声音系统聚焦于该人上，如到达方向DOA和包括讲话者S的粗椭圆形波束所示。波束(主瓣)的角宽度为30度级或更小，如小于25度，例如参见图9。

图9示意性地示出了根据本发明的包括声音敏感传感器阵列的声音系统的衰减([dB])-角度([°](在特定频率如2kHz))关系图。该图图示了围绕到达方向DOA的主瓣及多个旁瓣。(第一)旁瓣衰减[dB]被指明为第一旁瓣相较于主瓣的衰减。第一旁瓣相较于主瓣的衰减例如设置成大于10dB，如大于15dB。主瓣的角宽度(在图9中记为Δθ)优选可配置以小于30度，如小于20度。

图10示出了根据本发明的听力装置或听力系统(L-HD,R-HD)配置成在佩戴该听力装置或听力系统的用户U的环境中确定(及可能跟踪)到感兴趣声源(如包括调制的信号如语音的声源，SL1,SL2,SL3)的多个到达方向(在此为三个，DOA1,DOA2,DOA3)的情形。通过如上所述的声音系统确定的到达方向(DOA1,DOA2,DOA3)由听力装置(L-HD,R-HD)的波束形成器滤波单元个别和/或双耳地使用(例如参见图7)以确定波束图BP，其试图保持从感兴趣的(目标)声源(SL1,SL2,SL3)到用户U的(目标)声音(及衰减来自其它方向的声音)。在实施例中，听力装置或听力系统配置成随时间跟踪活动目标声源因而保持波束图BP聚焦于该活动声源(即使用户和声源相对于彼此移动)。在实施例中，跟踪单元配置成使用[Gustafssonet al.,2015]中描述的近场跟踪。在目标跟踪中，下面形式的动态运动模型

x(t+1)＝f(x(t),v(t)) (20)

描述目标随时间的运动。状态x(t)包括在时间t的位置(X(t),Y(t))，及v(t)指处理噪声。通过设延迟τ_n(X(t),Y(t))(参见下面的等式(18))为时变，实现了或多或少的标准非线性估计问题，其中测量等式为

z(t)＝T^T(X,Y)S(t)+∈(t) (19)

其中T为回归矩阵(参见上面的等式(10)、(11))，及其中所述延迟由下式给出：

本发明的概念可用在许多不同的应用中，例如应用于波束/波束形成器的控制，例如以操纵活动波束的方向，例如结合方向选择(指针)装置，例如使用(可能基于耳朵的)眼动电图描记法EarEOG等，例如参见US20140098981A1和[Manabe et al.；2013]。EOG可用于提取用户(当前)首选的听音方向。其它评估偏好的手段如(智能电话上的控制轮)可用于确定首选方向/DOA(θ)。使用可任意启动从而听多个声源的虚拟传声器的概念不必然要求所有其它声源的衰减。首选方向可简单地加强，例如加强10dB。从而不丢失其它声源的听音场景。

应意识到，本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外，特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见，及在此定义的一般原理可应用于其他方面。权利要求因而不限于在此所示的各个方面，而是包含与权利要求语言一致的全部范围，其中除非明确指出，以单数形式提及的元件不意指“一个及只有一个”，而是指“一个或多个”。除非明确指出，术语“一些”指一个或多个。

因而，本发明的范围应依据权利要求进行判断。

参考文献

·[Doron&Nevet；2008]),Miriam A.Doron and Amir Nevet,“Robust wavefieldinterpolation for adaptive wideband beamforming,”Signal Processing,vol.88,no.6,pp.1579–1594,June 2008.

·US20140098981A1(OTICON)10.04.2014

·[Manabe et al.；2013]Hiroyuki Manabe,Masski Fukumoto,Tohru Yagi,“Conductive Rubber Electrodes for Earphone-Based Eye Gesture InputInterface”,ISWC’13,September 9–12,2013,Zurich,Switzerland,pp.33-39.

·[Gustafsson et al.,2015]Fredrik Gustafsson,Gustaf Hendeby,DavidLindgren,George Mathai,and Hans Habberstadt,"Direction of Arrival Estimationin Sensor Arrays Using Local Series Expansion of the Received Signal“,18THINTERNATIONAL CONFERENCE OF INFORMATION FUSION,6 July 2015(2015-07-06),pages761-766.

Claims

1.一种听力装置，包括

用于估计从一个或多个声源发出的声音信号的到达方向的声音系统，所述系统包括：

-包括M个声音接收变换器的阵列的声音传感器单元，每一声音接收变换器提供电输入信号；

-采样单元，用于在实质上同样的时刻从每一所述电输入信号提供周围声场的至少一样本；

-处理单元，包括：

2.根据权利要求1所述的听力装置，其中所述声音敏感传感器的阵列包括配置成由用户佩戴的传声器阵列。

3.根据权利要求1所述的听力装置，其中所述声音敏感传感器的阵列包括集成在芯片上的传声器或者MEMS传声器。

4.根据权利要求1所述的听力装置，其中接收声音变换器的数量M大于3，或者在从3到10的范围中，或者大于10，或者大于50。

5.根据权利要求1所述的听力装置，配置成使得相邻声音接收变换器之间的距离小于0.01m，或者小于或等于0.007m。

6.根据权利要求1所述的听力装置，包括波束形成器滤波单元，用于基于表示周围声场的一个或多个波束形成器输入信号提供波束成形信号，并配置成在确定波束成形信号时使用到达方向的估计量。

7.根据权利要求6所述的听力装置，配置成使得所述波束形成器滤波单元从声音传感器阵列接收至少部分所述电输入信号，并将所述波束成形信号提供为至少部分所述电输入信号的加权组合。

8.根据权利要求1所述的听力装置，包括配置成随时间跟踪一个或多个声源的跟踪单元。

9.根据权利要求1所述的听力装置，。

10.根据权利要求6所述的听力装置，配置成估计多个活动目标声源的到达方向，其中所述波束形成器滤波单元配置成基于多个活动目标声源的到达方向的估计量确定波束图，其中来自估计的到达方向的声音保持实质上不被改变，而来自其它方向的声音被衰减。

11.根据权利要求1所述的听力装置，包括配置成实施使用户能控制所述系统的功能的用户接口的辅助装置。

12.根据权利要求1所述的听力装置，包括声音敏感传感器的阵列的网络。

13.根据权利要求1所述的听力装置，其中所述参数模型为泰勒展开模型，及每一相应传感器处接收的声音信号按L阶的泰勒级数展开进行分解，其中信号导数通过线性最小平方方法确定，及其中到达方向θ通过下面的表达式进行估计：

14.根据权利要求1所述的听力装置，包括助听器。

15.根据权利要求14所述的听力装置，其中所述助听器包括耳后式助听器或者耳内式助听器或者听力眼镜。