CN106878905A

CN106878905A - 确定含噪语音信号的客观感知量的方法

Info

Publication number: CN106878905A
Application number: CN201610846577.3A
Authority: CN
Inventors: J·B·博尔特; K-F·J·格兰; M·G·克里斯滕森
Original assignee: GN Resound AS
Current assignee: GN Hearing AS
Priority date: 2015-09-24
Filing date: 2016-09-23
Publication date: 2017-06-20
Anticipated expiration: 2036-09-23
Also published as: EP3147904A1; EP3147904B1; DK3147904T3; US10397711B2; JP2017063419A; CN106878905B; JP6905319B2; US20170094420A1

Abstract

本发明在第一发面涉及使用定向声音信息确定含噪语音信号的客观感知量的方法。该方法包括以下步骤：将包括目标语音与干扰噪音的混合体的含噪语音信号施加至带有可调扩音器设备的第一听力仪器并且控制可调扩音器设备以产生分别展示第一方向性指数和第二方向性指数的第一预定方向性图案和第二预定方向性图案，其中在一个或多个参考频率下，第二方向性指数小于第一方向性指数。分别使用第一预定方向性图案和第二预方向性图案从可调扩音器设备记录第一含噪语音片段和第二含噪语音片段，并且通过比较第一含噪语音片段和第二含噪语音片段来确定含噪语音信号的客观感知量的至少一个值。

Description

确定含噪语音信号的客观感知量的方法

技术领域

本发明在一方面涉及使用定向声音信息确定含噪语音信号的客观感知量的方法。方法包括将包括了目标语音与干扰噪音的混合体的含噪语音信号施加至带有可调扩音器设备的第一听力仪器并且控制可调扩音器设备以产生分别展示第一方向性指数和第二方向性指数的第一预定方向性图案和第二预定方向性图案，其中在一个或多个参考频率下第二方向性指数小于第一方向性指数。分别使用第一预定方向性图案和第二预方向性图案从可调扩音器设备记录第一含噪语音片段和第二含噪语音片段，并且通过比较第一含噪语音片段和第二含噪语音片段确定含噪语音信号的客观感知量的至少一个值

背景技术

听力受损人员通常遭受听力敏感度的损失，该损失取决于讨论中的声音的频率和等级两者。因此听力受损人员可能与正常听力人员一样能够听到某些频率(例如，低频)，但在其它频率(高频)下不能以与正常听力个体相同的敏感度听到声音。类似地，听力受损人员可以以与正常听力个体相同的敏感度感知例如90dB SPL以上的高声声音，但仍不能以与正常听力个体相同的敏感度听到柔和声音。因此，在后者情况下，听力受损人员在某些频率或频带下遭受动态范围的损失。除上面提到的之外，听力受损人员的频率和等级相关的听力损失常常导致例如在有着多个活跃的说话者和/或噪声声源的含噪声音环境中区分竞争声源或干扰声源的能力降低。健康听力系统依赖于众所周知的鸡尾酒会效应以在此类不利收听条件下区分竞争声源或干扰声源。鸡尾酒会效应尤其依赖于来自竞争声源或干扰声源的听觉空间提示以基于竞争声源的空间定位实行区分。在此类不利收听条件下，在听力受损个体的耳部处接收到的SNR可如此低以至于听力受损个体不能发觉并使用空间听觉提示以区分来自竞争声源的不同声音流。这导致与正常听力受试者相比，对于许多听力受损人员在含噪声音环境中听到和理解语音的能力严重恶化。存在通过将SNR增强技术诸如单通道噪声降低算法或者固定或自适应波束成形算法用于助听器扩音器信号以向助听器用户提供增强的语音可懂度或增强的语音质量来解决问题的若干常用方法。另一方面，存在许多其中助听器用户在没有在助听器中施加任何改进的语音处理算法的情况下能够做得很好的情况。在这些情况下，避免引入多于需要量的处理可能是有益的，这是因为助听器用户可能不受益于这些处理并且改进的算法可能引入恼人的声音假象。

因此，能够检测助听器用户需要例如用于噪声抑制目的改进的语音处理算法以能够理解语音并且像正常听力个体一样与其它人员互动的情况或收听条件将是有利的。

近年来，语音可懂度的客观评估已经重新受到关注[1][2]。该关注已经产生一些可用于例如当语音信号与噪声混合时或者在信号处理之后例如使用压缩或噪声降低评估语音信号的可懂度的方法。在本上下文中，“客观”意味着使用计算机算法而不牵涉任何人类测试人员。如果使用人类测试受试者，则评估被描述为“主观”评估。客观度量的使用可以被分成在线应用和离线应用。在在线应用中，客观评估为在进行语音信号的信号处理或传输的同时正在进行的过程，而在离线应用中，客观评估在施加信号处理例如在一些不同的算法设置已经被用于处理含噪语音信时以及工程师需要选择使用哪种设置之后进行。

客观感知量诸如语音质量和语音可懂度度量可以被分类成两个子组：侵入式度量或非侵入式度量。采用侵入式度量需要访问干净语音信号和含噪语音信号两者。采用非侵入式度量，仅需要访问含噪语音信号。然而，在助听器的正常在线使用期间，不访问干净语音信号而只访问含噪语音信号。含噪语音信号包括目标语音信号与不需要的干扰信号诸如竞争信号、音乐、噪声、混响等的混合体。本发明已经解决了确定由干净语音信号或参考信号的不可用性引起的侵入性客观感知量的问题。根据确定含噪语音信号的客观感知量的本方法学以及相应地被修改的听力仪器和助听器系统，使用可调扩音器设备的方向性性能生成的所谓“伪”干净语音信号，得到对干净语音信号例如目标语音信号的良好估计。对干净语音信号的良好估计允许准确地确定和估计各种类型的客观侵入式感知量诸如客观语音可懂度度量。

发明内容

本发明的第一方面涉及使用定向声音信息确定含噪语音信号的客观感知量。方法包括以下步骤：

a)将包括目标语音与干扰噪音的混合体的含噪语音信号施加至第一听力仪器，其中所述第一听力仪器包括可调扩音器设备，

b)控制可调扩音器设备以产生展示第一方向性指数的第一预定方向性图案，

c)记录由可调扩音器设备使用第一预定方向性图案生成的第一含噪语音片段，

d)控制可调扩音器设备以产生展示第二方向性指数的第二预定方向性图案，其中在一个或多个参考频率下所述第二方向性指数小于第一方向性指数，

e)记录由可调扩音器设备使用第二预定方向性图案生成的第二含噪语音片段，

f)由信号处理器通过比较第一含噪语音片段与第二含噪语音片段来确定含噪语音信号的客观感知量的至少一个值。

本发明解决了上面讨论的现有技术问题，即在听力仪器和听力系统的正常使用期间缺少与计算含噪语音信号的客观感知量有关的对干净语音信号的访问。本发明已经通过利用听力仪器的扩音器设备的空间定向特性产生所谓的“伪”干净语音信号作为对难以获得的“真”干净语音信号的估计，来解决了该问题。可以通过使用第一预定方向性图案记录第一含噪语音片段来估计“伪”干净语音信号，第一预定方向性图案被调节或设置成相对大的方向性指数，即产生主瓣指向目标说话者的窄束宽度。即使在该条件下在“伪”干净语音信号中可能存在有限水平的干扰语音或其它噪声信号，残留噪声水平也可以足够小以允许对所探索的讨论中的客观感知量的值诸如STOI值的准确估计，如以下参考附图进一步详细论证和讨论的。

比较第一含噪语音片段和第二含噪语音片段以确定或计算含噪语音信号的客观感知量的至少一个值例如可以包括相关诸如互相关，例如以计算众所周知的短时客观可懂度度量(STOI)。

与听力仪器和听力仪器系统中语音信号的接收、处理和放大有关的常常具有重要意义为两个客观感知量：语音质量和语音可懂度。语音质量度量接收到的语音信号的舒适和清楚程度。噪声、滴答声和其它听得见的假音将格外降低接收到的语音信号的质量。另一方面语音可懂度度量收听者诸如助听器用户是否已经正确感知或理解语音信号。在该关系中重要的是注意语音质量和语音可懂度不一定相关。较高的质量本身不会引起较高的可懂度，或反之亦然。事实上，在一些语音处理类型中较低的语音质量展示较高的可懂度。

因此，在本方法学的一些实施例中，客观感知量包括下列中的一个或多个：语音可懂度度量、语音质量度量等。在本方法学的一些实施例中，语音可懂度度量可以包括基于侵入式技术的标准化客观可懂度度量，诸如短时客观可懂度度量(STOI)、语音传输指数(STI)、清晰度指数(AI)等。语音质量度量可以包括标准化客观语音质量度量，诸如PESQ、POLQA等。

第一含噪语音片段和第二含噪语音片段优选为入射在可调扩音器设备上的含噪语音信号的大体上时间对齐的片段。第一含噪语音片段和第二含噪语音片段可以大体上同时从由可调扩音器设备产生的第一扩音器信号和第二扩音器信号中生成。替换地，第一含噪语音片段和第二含噪语音片段可以相继地生成而不是同时生成。第一含噪语音片段可以在生成和记录第二含噪语音片段之前被生成和记录，或者反之亦然。第一含噪语音片段和第二含噪语音片段可以从波束成形算法导出，该波束成形算法以不同的参数设置例如时间延迟应用至由可调扩音器设备响应于含噪语音信号而产生的第一全向扩音器信号和第二全向扩音器信号。

如以下讨论的第一方向性指数和第二方向性指数的各自的值指的是在第一听力仪器的自由场条件下测量的值。本技术人员将理解，通过取决于用户头部和躯干几何结构以及助听器外壳的形状/样式例如BTE、ITE、ITC、RIC、CIC等将第一听力仪器放置在助听器用户的耳部中或助听器用户的耳部处或助听器用户的耳部上可以修改第一方向性指数和第二方向性指数的各自的值。当第一听力仪器被安装在助听器用户的左耳或右耳中或助听器用户的左耳或右耳处或助听器用户的左耳或右耳上时可以自然而然地进行本方法学。

本方法学的一个实施例进一步包括以下步骤：

h)基于客观感知量的至少一个值激活或停用运行在助听器信号处理器上的至少一种信号处理算法；以及/或者

基于客观感知量的至少一个值调节至少一种信号处理算法的参数值，

g)根据有效的信号处理算法和/或调节后的参数值处理由扩音器设备生成的扩音器信号以产生听力仪器的第一听力损失补偿输出信号，

i)通过第一输出换能器向用户的左耳或右耳再现第一听力损失补偿输出信号。

以下在附加细节中讨论助听器信号处理器的特性。以下参考附图进一步详细地讨论激活或停用在助听器信号处理器上运行或执行的至少一种信号处理算法的各种方法。

本技术人员将理解，在本方法学的一些实施例中，由扩音器设备响应于进入的含噪语音信号利用第二方向性指数生成的扩音器信号可以基本上无延迟地例如时间延迟小于10ms被传输到助听器处理器的有效的信号处理算法，以产生第一听力损失补偿输出信号。通常通过听力仪器最小化扩音器信号的时间延迟以避免回声效应并且保持到助听器用户的视觉输入和听觉输入适当的一致是有利的。可以与通过助听器信号处理器进行的含噪语音信号的处理并行地进行含噪语音信号的第二含噪语音片段的记录或存储以产生第一听力损失补偿输出信号。

本方法学可以包括根据客观感知量的值逐步调节至少一种信号处理算法的参数值的进一步步骤。本技术人员将理解，客观感知量的值通常随着追踪周围收听环境的变化的噪声水平的时间而变化。

根据客观感知量的变化的值，可以激活或停用各种类型的信号处理算法或使参数值被调节。至少一种信号处理算法可以例如包括下列中的一种：可调波束形成算法、自适应反馈消除算法、单通道噪声降低算法、多通道噪声降低算法、多通道动态范围压缩算法。可以取决于标准化的客观可懂度度量的测量值诸如STOI值由助听器信号处理器将可调扩音器设备的方向性调高或调低，使得当STOI值大时例如在0.8之上选择小的方向性指数值，例如小于1.0dB。相反地，可调扩音器设备的方向性可以被设置为高方向性指数值，例如当STOI值小时例如在0.2以下，选择大于5.0dB或9dB。

在本发明的某些实施例中，在进行确定含噪语音信号的客观感知量的本方法学中牵涉的计算可以分配在经由无线数据通信链路彼此连接的两个或更多个独立设备之间。因此，本方法学可包括进一步的步骤：

-经由无线通信链路将第一含噪语音片段和第二含噪语音片段从听力仪器传输到固定终端、便携式终端或第二听力仪器，

-将第一含噪语音片段和第二含噪语音片段记录在固定终端、便携式终端或第二听力仪器的数据存储区，

-通过固定终端、便携式终端或第二听力仪器的信号处理器确定含噪语音信号的客观感知量的至少一个值，

-经由无线通信链路将客观感知量的至少一个值从固定终端、便携式终端或第二听力仪器传输到第一听力仪器。

固定终端可以包括装备有合适的双向无线数据通信接口的个人计算机，双向无线数据通信接口允许个人计算机无线地接收第一含噪语音片段和第二含噪语音片段并且将客观感知量的至少一个值传输回听力仪器。双向无线数据通信接口可以包括蓝牙数据接口或Wi-Fi数据接口。便携式终端可以包括智能电话、平板电脑或带有相应的无线通信特征和功能的远程身体携带处理器，或者第二听力仪器可包含相应的无线通信特征和功能。

本方法可以进一步包括以下步骤：

-将第一含噪语音片段和第二含噪语音片段记录在第一听力仪器的数据存储器中，

-通过第一听力仪器的信号处理器确定含噪语音信号的客观感知量的至少一个值。以这种方式，第一听力仪器的信号处理器和存储器资源被配置为进行用于确定客观感知量的至少一个值的所有必要的计算。

在1kHz的频率下，第二方向性指数可以小于2dB；并且在1kHz的频率下，第二方向性指数可以大于4dB，优选大于5dB，或大于6dB，或甚至大于9dB。

在整个语音频率范围的相当大部分中，第一方向性指数优选大于第二方向性指数，以保证在获得第一含噪语音片段期间对由可调扩音器设备产生的扩音器信号中的干扰语音和其它噪声源的良好抑制。因此，根据本方法学的一个实施例，在整个预定语音频率范围，诸如在200Hz与5kHz之间或在500Hz与3kHz之间，第一方向性指数大于第二方向性指数。在另一个实施例中，在500Hz与3kHz之间，第二方向性指数小于2dB，而在500Hz与3kHz之间，第一方向性指数大于4dB，优选大于5dB，或大于6dB。

本发明的第二方面涉及听力仪器，该听力仪器包括配置为放置在用户的左耳或右耳处或放置在用户的左耳或右耳中的助听器外壳或壳体。听力仪器进一步包括被配置为响应于来自听力仪器周围的声场的进入声音生成扩音器信号的可调扩音器设备，其中进入声音包括具有目标语音与干扰噪音的混合体的含噪语音信号，助听器信号处理器被配置为执行以下步骤：

-控制可调扩音器设备以产生展示第一方向性指数的第一预定方向性图案，

-将由可调扩音器设备使用第一预定方向性图案生成的第一含噪语音片段记录在数据存储器的第一地址区中，

-控制可调扩音器设备以产生展示第二方向性指数的第二预定方向性图案，其中在一个或多个频率下，第二方向性指数小于第一方向性指数，

e)将由可调扩音器设备使用第二预定方向性图案生成的第二含噪语音片段记录在数据存储器的第二地址范围中，

f)通过比较第一含噪语音片段和第二含噪语音片段确定含噪语音信号的客观感知量的至少一个值。

可以通过硬连线数字硬件或通过在一个软件可编程信号处理器或多个软件可编程信号处理器上执行的一个或多个计算机程序、程序例程和执行线程来执行或实施便携式终端的信号处理器与助听器信号处理器中的每个的信号处理功能。计算机程序、程序例程和执行线程中的每个都可包括多个可执行程序指令。可选地，可通过硬连接数字硬件与在一个软件可编程信号处理器或多个软件可编程信号处理器上运行的计算机程序、例程和执行线程的组合来实行信号处理功能。因此，可通过可在合适的软件可编程微处理器诸如可编程数字信号处理器上执行的计算机程序、程序例程或执行线程来进行以上提及的比较第一含噪语音片段和第二含噪语音片段的方法学中的每个。微处理器和/或专用数字硬件可被集成在ASIC上或者被实施在FPGA器件上。

本发明的第三方面涉及助听器系统，该助听器系统包括第一听力仪器以及固定终端、便携式终端和第二听力仪器中的一个；

第一听力仪器，其包括：

助听器外壳或壳体，其被配置为放置在用户的左耳或右耳处或放置在用户的左耳或右耳中的助听器外壳或壳体，

可调扩音器设备，其被配置为响应于来自听力仪器周围的声场的进入声音生成扩音器信号，其中进入声音包括具有目标语音与干扰噪音的混合体的含噪语音信号，

助听器信号处理器，其被配置为执行以下步骤：

-控制可调扩音器设备以产生展示第一方向性指数的第一预定方向性图案。

-接收由可调扩音器设备使用第一预定方向性图案生成的第一含噪语音片段，

-接收由可调扩音器设备使用第二预定方向性图案生成的第二含噪语音片段，

第一无线发射器，其被配置为经由无线通信链路将第一含噪语音片段和第二含噪语音片段传输到便携式终端或第二听力仪器；

固定终端、便携式终端或第二听力仪器包括：

第二无线收发器，其被配置为通过无线通信链路发送和接收数据，

信号处理器，其被配置为：

-将第一含噪语音片段和第二含噪语音片段记录在便携式终端的数据存储区中或第二听力仪器的数据存储区中，

-通过比较第一含噪语音片段和第二含噪语音片段确定含噪语音信号的客观感知量的至少一个值，

助听器系统提供了通过允许在便携式终端与第一听力仪器之间双向交换数据的无线通信链路实现的计算客观感知量的至少一个值的分配方法，如上文简要讨论的。本技术人员将理解，将与计算客观感知量的至少一个值相关联的计算负担分配在两个或更多个独立设备可以是有利的，尤其是考虑到典型的听力仪器的计算资源和存储器资源的约束。便携式终端可包括通常具有比典型的听力仪器显著更大的计算资源和存储资源的智能电话、移动电话或平板电脑。因此，第一含噪语音片段和第二含噪语音片段可便利地被存储或记录在便携式终端的数据存储区中，并且因此通过便携式终端的合适的信号处理器例如微处理器或DSP来进行含噪语音信号的客观感知量的至少一个值的确定。助听器系统的可选实施例包括第二听力仪器而不是便携式终端，并且可以因此提供双耳助听器系统，在双耳助听器系统中第一听力仪器被布置在用户的左耳或右耳处或者用户的左耳或右耳中且第二听力仪器被放置在用户的另一个耳部处或用户的另一个耳部中。

无线通信链路可基于RF信号传输例如模拟FM技术或各种类型的例如遵守诸如蓝牙LE或其它标准化RF通信协议的蓝牙标准的数字传输技术。可选地，无线通信链路可基于光信号传输或近场电感耦合。参考文献：

[1]J.M.Kates和K.H.Arehart，“The hearing-aid speech qualityindex(HASQI)version 2”，Journal of the Audio Engineering Society,vol.62,no.3,pp.99-117,2014。

[2]T.H.Falk,V.Parsa,J.F.Santos,K.Arehart,O.Hazrati,R.Huber,J.M.Kates和S.Scollie，“Objective Quality and Intelligibility Prediction for Users ofAssistive Listening Devices:Advantages and Limitations of existing tools”,Signal Processing Magazine,IEEE,vol.32,no.2,pp.114-124,2015。

附图说明

将结合附图更详细地描述本发明的实施例，其中：

图1为根据本发明的第一实施例的被放置在包括目标说话者和多个在听力仪器的扩音器设备处产生不需要的干扰语音的干扰噪音的含噪收听环境中的听力仪器的示意性框图，

图2为根据本发明的第二实施例的示例性助听器系统的示意性框图，

图3为对用于测试和评估使用定向声音信息确定含噪语音信号的客观感知量的本方法学的实验室测量设置的简化示意性说明；以及

图4示出了在从上面提及的实验室测量设置的听力仪器中获得的含噪语音信号的若干信噪比条件下实验测量的STOI值。

具体实施方式

图1为根据在不利的声音或收听环境中操作的本发明的第一实施例的如以下更详细讨论的听力仪器102或听力仪器系统102的示意性说明。听力仪器102被配置为使用定向声音信息确定接收到的收听环境中的含噪语音信号的客观感知量，如以下更详细讨论的。听力仪器102可以包括被配置为放置在听力受损个体的左耳或右耳(未示出)处或放置在听力受损个体的左耳或右耳(未示出)中的外壳或壳体。本技术人员将理解，听力仪器102可以包括不同类型的听力仪器，诸如所谓的BTE类型、ITE类型、CIC类型或RIC类型等。因此，听力仪器的扩音器设备可以位于用户耳部的各种位置处，诸如在用户耳廓后面或在用户外耳内部或在用户耳道内部。

听力受损个体(未示出)希望接收由目标或期望的说话者(speaker)112产生的目标语音信号110或可能的其它类型的声音，该目标说话者或期望说话者112处于听力受损人员102的正中面处或附近，离听力受损人员一定距离。如通过由干扰说话者114、116生成的干扰语音信号或语音干扰109a、109b示意性说明的，听力受损个体周围的声音环境可能是不利的，并且在听力仪器102的可调扩音器的一对全向扩音器104、105位置处的含噪语音信号111遭受低信噪比(SNR)。因此对于当前收听环境中的助听器用户，由干扰说话者114、116生成的干扰语音信号109a、109b表示噪声源，并且很可能降低目标语音110的语音可懂度。本技术人员将理解，在实践中代替干扰语音信号或除干扰语音信息之外，噪音信号109a、109b可以包括许多其它类型常见噪声源诸如机械噪声、风噪声、多路重合噪声、来自电视和收音机等等的语音和音乐。除来自各种噪声源的直接噪声声音成分之外，噪声信号也可包括来自听力受损个体所处的房间、礼堂或小室的边界的各种边界反射。这些干扰噪音源的存在的结果为，含噪语音信号111入射在一对全向扩音器104、105上，并且该含噪语音信号111包括期望的/目标语音信号110与干扰语音信号109a、109b的混合体。

听力仪器102包括被配置为响应于从周围声音环境或声场进来的声音诸如上面讨论的含噪语音信号而生成一个或多个扩音器信号的可调扩音器设备104、105方向性指数。听力仪器102进一步包括助听器信号处理器(参考图2上的组件240)，助听器信号处理器被配置为执行控制可调扩音器设备以产生展示第一方向性指数的第一预定方向性图案107a的步骤。方向性图案107a示意性地说明于图表107上并且展示了显著地定向性，其中主瓣指向大约处于0度方向处的目标说话者112。可以在语音频率范围内的相关参考频率或合适的参考频率下，例如在200Hz和5kHz之间的某处的参考频率，例如在1kHz下，记录(record)第一预定方向性图案107a。第一方向性指数可以大于4dB、或大于6dB、或大于10dB以提供对来自除目标说话者所位于的方向例如正面方向之外的其它方向的干扰噪声的良好抑制。助听器信号处理器例如经由合适的程序例程或程序线程被配置或编程为记录或存储由可调扩音器设备响应于含噪语音信号111使用第一预定方向性图案生成的第一含噪语音片段。第一含噪语音片段可以例如被存储在听力仪器102的易失性或非易失性存储器的合适的数据存储区或任何其它合适的存储缓冲区中。第一含噪语音片段的长度将取决于待计算的客观感知量的本质而变化。在本发明的一些实施例中，客观感知量可以是语音可懂度度量诸如标准客观可懂度度量，例如短期客观可懂度度量(STOI)。在后者情况下，第一含噪语音片段的长度可以位于333ms与500ms之间，并且第二含噪语音片段的长度可以位于333ms与500ms之间。

可调扩音器设备104、105方向性指数可以包括第一数模转换器和第二数模转换器(未示出)，第一数模转换器和第二数模转换器被配置为采样和数字化由第一全向扩音器104和第二全向扩音器105提供的第一模拟全向扩音器信号和第二模拟全向扩音器信号，以便产生第一数字扩音器信号和第二数字扩音器信号。第一数字扩音器信号和第二数字扩音器信号中的每个都可以具有在6kHz与48kHz之间的采样频率以及在12位与24位之间的分辨率。助听器信号处理器可以被配置为通过将合适的定向算法应用至第一数字扩音器信号和第二数字扩音器信号来产生具有第一预定方向性图案107a的定向扩音器信号125。可以根据要求，在助听器信号处理器的控制下以高度灵活的方式通过定向算法调节第一预定方向性图案107a。定向算法可以包括在第一数字扩音器信号与第二数字扩音器信号之间具有可变时间延迟的延迟减法功能。此外，可调扩音器设备104、105方向性指数可以通过选择第一数字全向扩音器信号和第二数字全向扩音器信号中的仅一个，以简单的方式产生具有第二预定方向性图案108a的大体全向扩音器信号124，以便进一步处理。

然而，根据可调扩音器设备104、105的替换实施例，方向性指数可以依赖于全向扩音器元件和定向扩音器元件的组合，其中后者包括具有通向公共隔膜的相对侧面的一对间隔开的声音端口的传统的压力梯度扩音器。在后者实施例中，可以在定向扩音器元件的输出处直接产生展示第一预定方向性图案107a的定向扩音器信号125，同时可以直接根据全向扩音器元件的输出来记录大体全向扩音器信号124。因此，助听器信号处理器可以例如通过在定向扩音器元件和全向扩音器元件的输出处产生的扩音器信号之间切换以在第一预定方向性图案107a与第二预定方向性图案108a之间切换可调扩音器设备。

在使用并行处理之后，或者与使用并行处理同时，助听器信号处理器记录或存储由可调扩音器设备使用第一预定方向性图案生成的第一含噪语音片段，助听器信号处理器控制可调扩音器设备以产生先前讨论的第二预定方向性图案108a。至少在先前讨论的一个或多个参考频率或频率范围下，第一方向性指数大于第二方向性指数。在一个或多个参考频率中的每个频率下，第一方向性指数可以例如大于第二方向性指数至少3dB或6dB。第二方向性指数可以例如位于0dB与2dB之间以提供几乎全向声音拾取。助听器信号处理器将由可调扩音器设备使用第二预定方向性图案生成的第二含噪语音片段记录或存储在数据存储器的第二地址范围。本技术人员将理解，第一含噪语音片段和第二含噪语音片段可以包括含噪语音信号111的大体上时间对齐的部分。在一些实施例中，第一全向数字扩音器信号和第二数字扩音器信号在经受先前讨论的波束成形算法以形成具有第一预定方向性图案107a的定向扩音器信号之前，可以暂时地存储在助听器信号处理器的合适的存储缓冲区中。可以通过从适当缓冲位置或地址中选择存储的第一全向数字扩音器信号和第二全向数字扩音器信号中的一个来形成产生第二含噪语音片段的时间对齐的全向扩音器信号。

随后，助听器信号处理器可以从数据存储器的适当位置或地址获取第一含噪语音片段和第二含噪语音片段，并且通过比较第一含噪语音片段和第二含噪语音片段来确定含噪语音信号的客观感知量的一个或多个值。之后，助听器信号处理器可以从数据存储器中清除(flush)第一含噪语音片段和第二含噪语音片段，并且开始通过再次根据含噪语音信号生成和形成新的一对含噪语音片段并计算客观感知量的对应值，来计算客观感知量的第二值或后续值。以这种方式，助听器信号处理器可以被配置为以预定义的时间间隔诸如先前讨论的333ms至500ms的帧尺寸定期地产生反映含噪语音信号的当前特性的客观感知量的更新值。第一含噪语音片段和第二含噪语音片段的开始时间与客观感知量的对应值的交付之间之间的时间延迟可以位于500ms与5m之间并且优选小于4s。

在本实施例中，助听器信号处理器可以被配置为计算先前讨论的短时客观可懂度(STOI)度量，短时客观可懂度(STOI)度量非常适用于计算常常在听力仪器遇到的若干类型的语音信号降级诸如加性噪声、混响、滤波和削波的准确可懂度得分。然而，STOI值的计算需要访问含噪语音信号和干净语音信号两者，这意味着该原本有用的客观可懂度度量已经被认为不适宜用于仅如由助听器扩音器拾取的含噪语音信号是正常可用于分析的在线或实况听力仪器应用。本发明已经通过利用助听器扩音器设备的空间定向性能产生替代难以获得的“真”干净语音信号的所谓的“伪”干净语音信号，来解决了该问题。通过使用可以具有指向目标说话者112的相对大的方向性指数的第一预定方向性图案107a即窄束图案来接收或记录第一语音片段，实现了对第一含噪语音片段中的干扰语音信号109a、109b以及存在于收听环境内的其它噪声源的显著抑制。因此，虽然在“伪”干净语音信号中可能存在有限残留水平的干扰语音和其它噪声信号109a、109b，但是该水平可以足够小以允许适当选择或设定第一方向性指数来准确估计STOI值，如以下参考由本发明人获得的试验结果进一步详细讨论的。

听力仪器102可以相应地被修改以连续地计算表征在听力仪器102的扩音器设备处接收到的期望/目标语音信号110的可懂度的STOI值。接近1.0的STOI值指示期望/目标语音信号110的理想可懂度，而接近0.0的STOI值指示零语音可懂度。本技术人员将明白，助听器信号处理器可以以很多方式利用计算的STOI值以修改对应用至助听器用户的左耳或右耳的听力损失补偿输出信号的处理。助听器信号处理器可以例如取决于当前STOI值激活或停用某些信号处理算法。替换地或另选地，助听器信号处理器可以被修改以调节相同信号处理算法的一个参数值或多个参数值，而不必停用算法。

如一个示例，助听器信号处理器可以例如在当前STOI值位于预定阈值之上时停用单通道噪声降低算法，并且在当前STOI值降到预定阈值以下时激活单通道噪声降低算法。以这种方式，听力用户可以受益于不存在由声音环境中有效的单通道噪声降低算法引入的听力损失补偿输出信号的听得见的声音假象，在该声音环境中期望/目标语音信号110的可懂度足够高以允许助听器用户理解进入的语音并且毫不费力地沟通。在如由预定阈值以下的当前STOI值指示的遭受相当高等级的干扰语音和噪声的相反收听条件下，助听器信号处理器可以激活单通道噪声降低算法，这是因为尽管在听力损失补偿输出信号中引入了某些听得见的声音假象，但是助听器用户能够受益于由期望/目标语音信号110的改善的可懂度得到的噪声降低。

本技术人员将理解，遵循相同的逻辑线，取决于讨论中的客观感知量的当前量，助听器信号处理器可以被修改以激活/停用许多其它类型的信号处理算法或调节许多其它类型的信号处理算法的参数值，例如多通道动态范围压缩算法、波束成形算法或反馈消除算法。以这种方式，应用至听力损失补偿输出信号的改进的信号处理算法的数量可以被修改以追踪不利的助听器用户收听环境或声音环境。可以进行该追踪，使得在有利的收听条件，即由引起相对高的STOI值的低水平的干扰语音和/或噪声表征的那些条件下，仅极小量的信号处理通过助听器处理器被应用至目标语音信号。当然，可以常常通过调节有效的信号处理算法的某些参数值以增加或降低特定算法给予听力损失补偿输出信号的影响而不是停用信号处理算法来实现对应的效果。

根据一个示例性实施例，根据含噪扩音器信号的第一含噪语音片段和第二含噪语音片段确定或计算的STOI值被用于经由可调波束成形算法控制扩音器设备的方向性图案。响应于接近1的高STOI值，助听器信号处理器修改可调波束成形算法以产生基本上全向方向性图案，例如如所说明的方向性图案108a。这可以通过简单地断开两个全向扩音器104、105中的一个或者通过调节可调波束成形算法的特定参数诸如扩音器内时间延迟或相位差来实现。响应于例如朝向零移动的下跌的STOI值，助听器信号处理器修改可调波束成形算法以产生逐步更定向的方向性图案，即增加方向性指数值。方向性指数值可以被调节以符合在极坐标图107上说明的STOI值接近0.1的方向性图案107a。后者方向性图案可以是心形或超心形方向性图案或提供对偏心声源的良好抑制的任何其它合适的方向性图案，在偏心声源中，中心意味着在极坐标图107、108上大约0度方位角或方向处的声源。然而，可实现的方向性的最大量将取决于扩音器设备的物理特性，尤其是其中的单个扩音器的数量以及单个扩音器声音端口之间的间距。

本技术人员将理解，在如上面示意性地说明的本发明的一些实施例中，经由进入的扩音器信号111捕获含噪语音信号的第一含噪语音片段和第二含噪语音片段以及随后计算含噪语音信号的讨论中的客观感知量的一个值或多个值诸如上面讨论的STOI值，这可以唯一地通过听力仪器102的助听器信号处理器来进行。然而，在本发明的其它实施例中，捕获含噪语音信号的第一含噪语音片段和第二含噪语音片段以及如上文所概述的应用至第一含噪语音片段和第二含噪语音片段的各种存储和信号处理功能可以被分配在两个独立的便携式设备之间。两个独立的便携式设备结合地形成进行/实施确定含噪语音信号的客观感知量的本方法学的助听器器械或系统。如图2示意性说明的，此类助听器系统可以包括经由双向无线数据通信链路、RF链路彼此连接的第一听力仪器201和便携式终端250。便携式终端250可以包括移动电话、智能电话、平板电脑或类似的电池供电的便携式通信终端。助听器系统202的其它实施例可包括无线连接到第一听力仪器201的第二听力仪器(未示出)以便形成双耳助听器系统。

助听器系统202的第一听力仪器201可以基本上与先前讨论的听力仪器102相同，不同的是添加了包括无线接收器或收发器234、通信控制器260和RF天线236的无线通信接口。无线通信接口允许第一听力仪器201将无线数据尤其是包括先前讨论的第一含噪语音片段和第二含噪语音片段的数据传输到便携式终端250。第一含噪语音片段和第二含噪语音片段可以经由无线通信链路被调制和传输为模拟信号或为数字编码数据。无线通信链路可以基于RF信号传输，例如FM技术或例如复合蓝牙标准或其它标准化RF通信协议的数字传输技术。替换地，无线通信链路可以基于光信号传输或近场磁力耦合。

如示意性说明的，便携式终端250包括被配置为通过无线通信链路发送和接收数据诸如第一含噪语音片段和第二含噪语音片段的第二无线收发器254。便携式终端250包括信号处理器252和数据存储器256。信号处理器252和数据存储器256可以被集成在单个半导体管芯上。数据存储器256可以包括不同类型的存储器，诸如非易失性EEPROM或易失性RAM存储器。信号处理器252可以包括软件可编程微处理器，由此使得以下讨论的功能通过在信号处理器252上执行的一个或多个程序例程的可执行程序指令来实施。信号处理器252优选被配置为将第一含噪语音片段和第二含噪语音片段写到数据存储器256的预定存储区或存储地址。信号处理器252优选进一步被配置为确定先前讨论的一个STOI值或多个STOI值，或者含噪语音信号的任何其它客观感知量。信号处理器252可以从数据存储器256获取或读出第一含噪语音片段和第二含噪语音片段，并且遵循侵入式STOI估算标准执行第一含噪语音片段与第二含噪语音片段的相关。之后，信号处理器252经由无线通信链路和RF天线253将计算出的一个STOI值或多个STOI值传输回第一听力仪器201。助听器信号处理器240读取接收到的一个STOI值或多个STOI值，并且利用这些值执行先前讨论的各种类型的信号处理算法的激活/停用或者调节各种类型的信号处理算法的参数值。

图3为用于测试上面讨论的确定含噪语音信号的STOI值的方法学的实验室测量设置的简化示意性说明。可以类似于先前讨论的听力仪器102的带有可调扩音器设备的测试听力仪器302被安装在模拟人类头部与躯干的平均听觉性能的适合的头部与躯干模拟器诸如HATS或KEMAR的左耳上或左耳处。目标或期望的说话者312处于(模拟听力受损用户的)KEMAR的正中面处或附近即大体上0度方位，离KEMAR一定距离。除目标说话者312之外，围绕KEMAR和测试听力仪器302的声音环境包括处于约140度方位角处并且生成第一干扰语音信号309b的第一干扰说话者314和处于约270度方位角处并且生成第二干扰语音信号309a的第二干扰说话者316。

该实验利用用于通过依赖于先前讨论的通过利用可调扩音器设备302的空间定向或选择特性获得的“伪”干净语音信号来确定听力仪器302的可调扩音器设备处的含噪语音信号311的STOI值的本方法学的一个实施例。最初扩音器设备被调节以产生如以前讨论的带有相对高的方向性指数的第一预定方向性图案，以在可能的程度上减弱或抑制第一干扰语音信号309a和第二干扰语音信号309b的成分。第一预定方向性图案由实验设置中的波束成形模块或功能325产生。之后，通过扩音器设备302的定向特性从含噪语音信号311中获得“伪”干净语音片段。经由STOI计算单元或设备320的输入322记录“伪”干净语音片段。STOI计算单元或设备320可以包括耦合到个人计算机的电接口设备，该个人计算机运行合适的MATLAB程序用于执行STOI估算。近场扩音器315邻近目标说话者312布置，以同时记录“真”干净目标语音信号310，即参考信号，并且经由信号线321将“真”干净目标语音信号310传输到STOI单元或设备320。最后，扩音器设备被调节以产生如以前讨论的带有相对小的方向性指数例如小于1dB的第二预定方向性图案，使得第一干扰语音信号309a和第二干扰语音信号309b变得基本上减弱。经由STOI计算单元或设备320的输入324从含噪语音信号311记录含噪语音片段。将从目标语音信号310导出的“真”干净语音片段与从含噪语音信号311导出的含噪语音片段和被计算并映射到图4中的图表400的STOI值相关。同样地，将“伪”干净语音片段与含噪语音片段和被计算并映射到图4中的图表400的相应STOI值相关。图表400中的参考曲线或曲线图403示出了对于在-20dB与+20dB之间的宽信噪比范围的含噪语音信号311使用“真”干净语音片段实验测量和计算的含噪语音信号311的STOI值。图表400中的波束形成的信号曲线图405示出了相应的为了相关使用“伪”干净语音片段而不是“真”干净语音片段实验测量和计算的含噪语音信号311的STOI值。如所预期的，当含噪语音信号311的信噪比足够高时，例如在+20dB处或在+20dB之上，对于两个测试案例STOI值都接近1.0。明显地，通过使用“伪”干净语音片段获得的实验确定的STOI值与通过使用“真”干净语音片段获得的实验确定的STOI值之间存在相对良好的一致性，“真”干净语音片段从直接在目标说话者的口部处的参考扩音器中获得。

图4中最底下的图表420中的曲线图423、425示出了相同的测量设置(图3)的测量和计算的STOI值，不同的是使用了一对宽带噪声源而不是用于图表400中曲线图403、405的一对语音干扰者309a、309b作为干扰噪声源或干扰发射台。

Claims

1.一种使用定向声音信息来确定含噪语音信号的客观感知量的方法，包括以下步骤：

a)将包括目标语音与干扰噪音的混合体的含噪语音信号施加至第一听力仪器，其中，所述第一听力仪器包括可调扩音器设备，

b)控制所述可调扩音器设备，以产生展示第一方向性指数的第一预定方向性图案，

c)记录由所述可调扩音器设备使用所述第一预定方向性图案生成的第一含噪语音片段，

d)控制所述可调扩音器设备，以产生展示第二方向性指数的第二预定方向性图案，其中，在一个或多个参考频率下，所述第二方向性指数小于所述第一方向性指数，

e)记录由所述可调扩音器设备使用所述第二预定方向性图案生成的第二含噪语音片段，

f)由信号处理器通过比较所述第一含噪语音片段与所述第二含噪语音片段，来确定所述含噪语音信号的客观感知量的至少一个值。

2.根据权利要求1所述的确定含噪语音信号的客观感知量的方法，其中，所述客观感知量包括下列中的一种或多种：语音可懂度度量和语音质量度量。

3.根据权利要求2所述的确定含噪语音信号的客观感知量的方法，其中，所述语音可懂度度量包括标准化的客观可懂度度量。

4.根据权利要求2所述的确定含噪语音信号的客观感知量的方法，其中，所述语音质量度量包括标准化的客观语音质量度量。

5.根据权利要求1至4中任一项所述的确定含噪语音信号的客观感知量的方法，进一步包括以下步骤：

h)基于所述客观感知量的所述至少一个值，激活或停用运行在助听器信号处理器上的至少一种信号处理算法；和/或

基于所述客观感知量的所述至少一个值，调节所述至少一种信号处理算法的参数值，

g)根据有效的信号处理算法和/或调节后的参数值来处理由所述扩音器设备生成的扩音器信号，以产生所述听力仪器的第一听力损失补偿输出信号，

i)通过第一输出换能器向用户的左耳或右耳再现所述第一听力损失补偿输出信号。

6.根据权利要求5所述的确定含噪语音信号的客观感知量的方法，进一步包括以下步骤：

根据所述客观感知量的值，逐步调节所述至少一种信号处理算法的参数值。

7.根据权利要求5所述的确定含噪语音信号的客观感知量的方法，其中，所述至少一种信号处理算法包括下列中的一种：可调波束成形算法、自适应反馈消除算法、单通道噪声降低算法、多通道噪声降低算法、多通道动态范围压缩算法。

8.根据权利要求1所述的确定含噪语音信号的客观感知量的方法，进一步包括以下步骤：

-经由无线通信链路将所述第一含噪语音片段和所述第二含噪语音片段从所述听力仪器传输到固定终端、便携式终端或第二听力仪器，

-将所述第一含噪语音片段和所述第二含噪语音片段记录在所述固定终端、便携式终端或第二听力仪器的数据存储区，

-通过所述固定终端、便携式终端或第二听力仪器的信号处理器确定所述含噪语音信号的客观感知量的所述至少一个值，

-经由无线通信链路将所述客观感知量的所述至少一个值从所述固定终端、便携式终端或第二听力仪器传输到所述第一听力仪器。

9.根据权利要求1所述的确定含噪语音信号的客观感知量的方法，进一步包括以下步骤：

-将所述第一含噪语音片段和所述第二含噪语音片段记录在所述第一听力仪器的数据存储器中，

-通过所述第一听力仪器的信号处理器确定所述含噪语音信号的客观感知量的所述至少一个值的值。

10.根据权利要求1所述的确定含噪语音信号的客观感知量的方法，其中：

在1kHz的参考频率下，所述第二方向性指数小于2dB；以及

在1kHz的参考频率下，所述第一方向性指数大于4dB，优选大于5dB，或大于6dB。

11.根据权利要求1所述的确定含噪语音信号的客观感知量的方法，其中：

在500Hz与3kHz之间，所述第二方向性指数小于2dB；以及

在500Hz与3kHz之间，所述第一方向性指数大于4dB，优选大于5dB，或大于6dB。

12.根据权利要求1所述的确定含噪语音信号的客观感知量的方法，其中：

在整个预定语音频率范围，诸如在200Hz与5kHz之间或者在500Hz与3kHz之间，所述第二方向性指数小于所述第一方向性指数。

13.一种听力仪器，包括：

-助听器外壳或壳体，被配置为放置在用户的左耳或右耳处或者放置在用户的左耳或右耳中，

-可调扩音器设备，被配置为响应于来自所述听力仪器周围的声场的进入声音而生成扩音器信号，其中，所述进入声音包括具有目标语音与干扰噪音的混合体的含噪语音信号，

-助听器信号处理器，被配置为执行以下步骤：

-控制所述可调扩音器设备以产生展示第一方向性指数的第一预定方向性图案，

-将由所述可调扩音器设备使用所述第一预定方向性图案生成的第一含噪语音片段记录在数据存储器的第一地址区中，

-控制所述可调扩音器设备以产生展示第二方向性指数的第二预定方向性图案，其中，在一个或多个频率下，所述第二方向性指数小于所述第一方向性指数，

e)将由所述可调扩音器设备使用所述第二预定方向性图案生成的第二含噪语音片段记录在所述数据存储器的第二地址范围中，

f)通过比较所述第一含噪语音片段与所述第二含噪语音片段，来确定所述含噪语音信号的客观感知量的至少一个值。

14.根据权利要求13所述的听力仪器，其中，所述可调扩音器设备至少包括：

第一全向扩音器和第二全向扩音器，或者

全向扩音器和定向扩音器。

15.一种助听器系统，包括第一听力仪器、以及固定终端、便携式终端和第二听力仪器中的一个；

所述第一听力仪器包括：

助听器外壳或壳体，被配置为放置在用户的左耳或右耳处或者放置在用户的左耳或右耳中，

可调扩音器设备，被配置为响应于来自所述第一听力仪器周围的声场的进入声音而生成扩音器信号，其中，所述进入声音包括具有目标语音与干扰噪音的混合体的含噪语音信号，

助听器信号处理器，被配置为执行以下步骤：

-接收由所述可调扩音器设备使用所述第一预定方向性图案生成的第一含噪语音片段，

-接收由所述可调扩音器设备使用所述第二预定方向性图案生成的第二含噪语音片段，

第一无线发送器，被配置为经由无线通信链路将所述第一含噪语音片段和所述第二含噪语音片段传输到所述便携式终端或所述第二听力仪器；

所述固定终端、便携式终端或所述第二听力仪器包括：

第二无线收发器，被配置为通过所述无线通信链路发送和接收数据，

信号处理器，被配置为：

-将所述第一含噪语音片段和所述第二含噪语音片段记录在所述便携式终端的数据存储区中或所述第二听力仪器的数据存储区中，

-通过比较所述第一含噪语音片段与所述第二含噪语音片段，来确定所述含噪语音信号的客观感知量的至少一个值，

-经由所述无线通信链路将所述客观感知量的所述至少一个值从所述固定终端、便携式终端或所述第二听力仪器传输到所述第一听力仪器。