CN105430587A - 包括gsc波束形成器的听力装置 - Google Patents
包括gsc波束形成器的听力装置 Download PDFInfo
- Publication number
- CN105430587A CN105430587A CN201510595725.4A CN201510595725A CN105430587A CN 105430587 A CN105430587 A CN 105430587A CN 201510595725 A CN201510595725 A CN 201510595725A CN 105430587 A CN105430587 A CN 105430587A
- Authority
- CN
- China
- Prior art keywords
- signal
- target
- hearing devices
- line
- former
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/405—Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/67—Implantable hearing aids or parts thereof not covered by H04R25/606
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/25—Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Neurosurgery (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了包括GSC波束形成器的听力装置,该听力装置包括传声器阵列、视向量单元、广义旁瓣相消器,所述广义旁瓣相消器包括:全通波束形成器,配置成保持来自所有方向的所有信号分量不衰减并提供全通信号;及目标消除波束形成器,配置成最大程度地衰减来自目标方向的信号分量并提供目标消除的信号向量;换算单元,用于产生应用于目标消除的信号向量的换算向量并提供换算后的目标消除的信号;组合单元,用于从全通信号减去换算后的目标消除的信号,从而提供目标信号的估计量;其中所述换算单元配置成使得换算向量根据全通信号的能量和目标消除的信号的能量之间的差生成。
Description
技术领域
本申请涉及自适应波束形成。本发明具体涉及包括自适应波束形成器的听力装置,尤其涉及广义旁瓣相消器结构(GSC)。
本申请还涉及听力装置的运行方法及包括处理器和程序代码的数据处理系统,程序代码使得处理器执行本发明方法的至少部分步骤。
本发明的实施例如可用在下述应用中:助听器、头戴式耳机、耳麦、有源耳朵保护系统、或其组合、免提电话系统(如汽车音频系统)、移动电话、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
背景技术
在助听器应用中,传声器阵列通常放置成靠近助听器用户的耳朵以确保该阵列拾取大多数现实声音信号进行自然声音感知。因此,从目标声源到各个传声器(m=1,2,…,M)的传递函数dm(k)随助听器用户不同而变化,其中k为频率指数。视向量d(k)定义为d(k)=[d1(k),...,dM(k)]T。
在实际应用中,视向量d(k)未知,其必须进行估计。这通常在具有安装在头部-躯干模拟器上的助听器的录音室中在校准程序进行。此外,波束形成器系数基于视向量d(k)的估计量dest(k)进行构建。
由于使用视向量估计量dest(k)而不是d(k),目标消除波束形成器在视向不具有完美的零值,其具有有限的衰减(如10-30dB级)。该现象使GSC能无意地衰减目标源信号同时使GSC输出信号e(k,n)最小化。
发明内容
在本发明中,分别使用粗体的小写和大写字母强调列向量和矩阵。转置、厄米转置和复共轭分别通过上标T、H和*进行标记。
本申请的目标在于提供改进的听力装置。本申请的另一目标在于提高包括广义旁瓣相消器结构的定向系统的性能。
本申请的目标由所附权利要求限定的及下面描述的发明实现。
听力装置
一方面,本申请的目标由一种听力装置实现,其包括:
-用于在听力装置的环境中从包括目标声源的声场拾取声音的传声器阵列,该传声器阵列包括用于拾取听力装置周围的声场的每一版本并提供M个电输入信号的多个(M个)传声器,视向量d(k)定义为包括元素dm(k)的M维向量,m=1,2,…,M,第m个元素dm(k)定义从目标信号源到第m个传声器的声传递函数或者从第m个(输入)传声器到参考传声器的相对声传递函数,其中k为频率指数;
-视向量单元,用于提供(当前相应)目标声源的视向量d(k)的估计量dest(k);
-广义旁瓣相消器,用于提供来自目标声源的目标信号s(k,n)的估计量e(k,n),其中n为时间指数,目标方向为从听力装置到目标声源的方向,广义旁瓣相消器包括:
--全通波束形成器,配置成保持来自所有方向的所有信号分量不衰减并提供全通信号yc(k,n);及
--目标消除波束形成器,配置成最大程度地衰减来自目标方向的信号分量并提供目标消除的信号向量yb(k,n),其中yb(k,n)=[yb,1(k,n),…,yb,M-1(k,n)]T,及yb,i(k,n)为第i个目标消除的信号;
--换算单元,用于产生应用于目标消除的信号向量yb(k,n)的换算向量h(k,n)并提供换算后的目标消除的信号yn(k,n);
--组合单元,用于从全通信号yc(k,n)减去换算后的目标消除的信号yn(k,n),从而提供目标信号s(k,n)的估计量e(k,n);
其中来自传声器阵列的M个电输入信号和视向量单元连接到广义旁瓣相消器,其中换算单元配置成使得换算向量h(k,n)根据全通信号yc(k,n)的能量和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)生成,其中i为从1到M-1的指数。
从而,针对GSC波束形成器的非理想性提供计算上简单的解决方案。另一优点在于在输出信号中不会引入非自然信号。
在实施例中,来自传声器阵列的M个电输入信号连接到广义旁瓣相消器(例如参见图1A、1B中的GSC单元)。M个电输入信号优选用作广义旁瓣相消器的输入(如图1A-1D中所示)。在实施例中,视向量单元(例如参见图1B中的LVU单元)连接到广义旁瓣相消器。视向量单元提供(当前相应)目标声源的视向量d(k)的估计量dest(k)。视向量的估计量通常用作广义旁瓣相消器的输入。广义旁瓣相消器处理来自传声器阵列的M个电输入信号并提供表示在M个电输入信号中的来自目标声源的目标信号s的估计量e(基于M个电输入信号和视向量的估计量,可能基于另外的控制或传感器信号)。(当前相应)目标声源例如可由用户选择,例如经用户接口或通过看向前述声源的方向。作为备选,其可通过自动程序进行选择,例如基于潜在的目标声源的现有知识(如频率含量信息、调制等)。
在实施例中,目标信号的特性(如空间指纹)由视向量d(k,m)表示,其元素(i=1,2,…,M)定义从目标信号源到M个输入单元(如输入变换器,例如传声器)中的每一个的(随频率和时间而变的)绝对声学传递函数,或者从第i个输入单元到参考输入单元的相对声学传递函数。视向量d(k,m)为M维向量,第i个元素di(k,m)定义从目标信号源到第i个输入单元(如传声器)的声学传递函数。作为备选,第i个元素di(k,m)定义从第i个输入单元到参考输入单元(ref)的相对声学传递函数。对于特定频率(k)和时间单位(m),向量元素di(k,m)通常为复数。在实施例中,视向量预先确定,例如在离线程序中进行测量(或理论上确定)或者在使用之前或期间进行估计。在实施例中,视向量在离线校准程序中进行估计。如果目标源在相较于输入单元的固定位置(或方向)处,例如如果目标源(假定)在相对于用户(如用户前方)的特定位置(或方向)(即相对于输入单元位于其中的装置(由用户佩戴或携带)),这将会很适宜。
总的来说,假定“目标声源”(等同于“目标信号源”)提供“目标信号”。
应当理解,全通波束形成器配置成在所得的全通信号yc(k,n)中保持来自(M个电输入信号的)所有方向的所有信号分量不被衰减。同样,应当理解,目标消除波束形成器配置成在所得的目标消除的信号向量yb(k,n)中最大程度地衰减来自(M个电输入信号的)目标方向的信号分量。
在实施例中,听力装置包括话音活动检测器,用于在特定时间点估计声音信号中是否存在人话音。在实施例中,话音活动检测器适于在特定时间点估计声音信号中是否存在特定频率的人话音。这具有使能在分别(估计)存在噪声或语音的时间段期间确定与噪声或语音有关的参数的优点。在本说明书中,话音信号包括来自人类的语音信号。其还可包括由人类语音系统产生的其它形式的发声(如唱歌)。在实施例中,话音活动检测器单元适于将用户当前的声环境分类为“话音”或“无话音”环境。这具有下述优点:包括用户环境中的人发声(如语音)的电传声器信号的时间段可被识别,因而与仅包括其它声源(如自然或人工产生的噪声)的时间段分离。在实施例中,话音活动检测器适于将用户自己的话音也检测为“话音”。作为备选,话音活动检测器适于从“话音”的检测排除用户自己的话音。在实施例中,听力装置包括专用自我话音活动检测器,用于检测特定输入声音(如话音)是否源自听力装置用户的话音。
在实施例中,换算向量h(k,n)在估计(在声场中)不存在人话音的时刻n和频率k进行计算。在实施例中,换算向量h(k,n)在估计(声场中)仅存在噪声的时刻n和频率k进行计算。
全通信号yc(k,n)和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)可以不同方式进行估计,如跨预定或动态定义的时间段。在实施例中,该时间段根据预期或检测到的声学环境确定。
在实施例中,全通信号yc(k,n)和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)由下式表达:
其中i=1,2,…,M-1,及其中L为用于计算Δi(k,n)的数据样本的数量。
在本说明书中,两个值或函数之间的“差”广义地意为两个值或函数之间的绝对或相对偏差的度量。在实施例中,两个值(v1,v2)之间的差表达为两个值的比(v1/v2)。在实施例中,两个值之间的差表达为两个值的代数差(v1-v2),如代数差的数值(|v1-v2|)。
根据本发明,换算向量h(k,n)根据全通信号yc(k,n)和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)生成从而提供修改的换算向量hmod(k,n)。
在实施例中,引入修改的换算因子hmod,i(k,n),其定义为:
其中i=1,2,…,M-1。阈值ηi通过全通波束形成器c和目标消除波束形成器B针对视向的每一目标消除的信号yb,i(k,n)的幅度响应之间的差确定。修改的换算因子hmod,i(k,n)(i=1,2,…,M-1)定义修改的换算向量hmod(k,n)。视向定义为从输入单元(传声器M1,M2)朝向目标声源的方向,也由视向量确定(在一些情形下,视向等同于用户看向的方向(如当假定用户看向目标声源的方向时))。
在实施例中,阈值ηi在10dB和50dB之间的范围中,例如30dB级。
在实施例中,在时(两个传声器),全通信号yc(k,n)和目标消除的信号yb(k,n)之间的能量差Δ(k,n)由下式表达:
其中L为用于计算Δ(k,n)的数据样本的数量。
在实施例中,L可根据听力装置中的采样速率fs配置。在实施例中,在采样速率fs=20kHz的情形下,L的较好选择为在从100到400的范围中(对应于5-20ms)。在实施例中,L根据当前声学环境(如用户环境中当前存在的目标信号和/或噪声信号的性质)动态确定。
在实施例中,在M=2(两个传声器)的情形下,当能量差Δ(k,n)小于或等于预定阈值η时(意味着yn(k,n)=yc(k,n)*h(k,n)),不修改换算因子h(k,n)。在实施例中,当能量差Δ(k,n)大于预定阈值η时(意味着yn(k,n)=yc(k,n)*h(k,n)=0),换算因子h(k,n)为零。这可具有针对来自视向的信号提供适当的GSC波束形成器性态的优点。
在实施例中,阈值η通过全通波束形成器和目标消除波束形成器在视向的幅度响应之间的差确定。从而可确定适当的阈值η。在实施例中,阈值η在10dB和50dB之间的范围中,如30dB级。
在实施例中,当前相应目标声源的视向量d(k)的估计量dest(k)保存在听力装置的存储器中。在实施例中,当前相应目标声源的视向量d(k)的估计量dest(k)在离线程序中确定,如在针对特定用户验配听力装置期间确定,或者在听力装置位于录音室中的头部-躯干模型上时在校准程序中确定。
在实施例中,听力装置配置成使得当前相应目标声源的视向量d(k)的估计量dest(k)动态确定。从而,GSC波束形成器可适于相对于用户移动未处于固定方向(如前向)的声源和目标声源。
在实施例中,目标消除波束形成器在视向不具有完美的零值。这是典型的假设,尤其当GSC波束形成器的输出基于视向量的(可能预定的)估计量时。
在实施例中,听力装置包括使用户能影响目标消除波束形成器的用户接口。在实施例中,听力装置配置成使用户能经用户接口指明当前的视向(例如当前的视向是否偏离假定的视向)。在实施例中,用户接口包括使用户能指明目标声源相对于用户的当前位置的图形界面(藉此适当的视向量可针对当前用途进行选择,例如针对不同的相应情形从多个预定视向量进行选择)。
在实施例中,听力装置适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。在实施例中,听力装置包括用于增强输入信号并提供处理后的输出信号的信号处理单元。数字助听器的各个方面在[Schaub;2008]中描述。
在实施例中,听力装置包括用于基于处理后的电信号提供由用户感知为声学信号的刺激的输出单元。在实施例中,输出单元包括耳蜗植入物的多个电极或者骨导听力装置的振动器。在实施例中,输出单元包括输出变换器。在实施例中,输出变换器包括用于将刺激作为声学信号提供给用户的接收器(扬声器)。在实施例中,输出变换器包括用于将刺激作为颅骨的机械振动提供给用户的振动器(如在附着在骨头上的听力装置中或在骨锚式听力装置中)。
在实施例中,听力装置为相对小的装置。在实施例中,听力装置具有0.15m级的最大外尺寸(如手持移动电话)。在实施例中,听力装置具有0.08m级的最大外尺寸(如头戴式耳机)。在实施例中,听力装置具有0.04m级的最大外尺寸(如听力仪器)。
在实施例中,听力装置为便携装置,例如包括本机能源如电池例如可再充电电池的装置。
在实施例中,听力装置包括输入变换器(传声器系统和/或直接电输入(如无线接收器))和输出变换器之间的正向或信号通路。在实施例中,信号处理单元位于该正向通路中。在实施例中,信号处理单元适于根据用户的特定需要提供随频率而变的增益。在实施例中,听力装置包括具有用于分析输入信号(如确定电平、调制、信号类型、声反馈估计量等)的功能件的分析通路。在实施例中,分析通路和/或信号通路的部分或所有信号处理在频域进行。在实施例中,分析通路和/或信号通路的部分或所有信号处理在时域进行。
在实施例中,听力装置包括模数(AD)转换器以将表示声学信号的模拟电信号转换为数字音频信号。在AD转换器中,模拟信号用预定采样频率或速率fs进行采样,fs例如在8kHz到40kHz的范围中(适应应用的具体需要),以在离散时间点tn(或n)提供数字样本xn(或x[n])。
在实施例中,听力装置包括数模(DA)转换器以将数字信号转换为模拟输出信号,例如用于经输出变换器呈现给用户。
在实施例中,听力装置如传声器单元包括用于提供输入信号的时频表示(k,n)的TF转换单元。在实施例中,时频表示包括所涉及信号在特定时间(指数n)和频率(指数k)范围的相应复值或实值的阵列或映射。在实施例中,TF转换单元包括用于对(时变)输入信号进行滤波并提供多个(时变)输出信号的滤波器组,每一输出信号包括截然不同的输入信号频率范围。在实施例中,TF转换单元包括用于将时变输入信号转换为频域中的(时变)信号的傅里叶变换单元。在实施例中,听力装置考虑的、从最小频率fmin到最大频率fmax的频率范围包括从20Hz到20kHz的典型人听频范围的一部分,例如从20Hz到12kHz的范围的一部分。在实施例中,助听装置的正向通路和/或分析通路的信号拆分为NI个频带,其中NI例如大于5,如大于10,如大于50,如大于100,如大于500,至少其部分个别进行处理。在实施例中,助听装置适于在NP个不同频道中处理正向通路和/或分析通路的信号(NP≤NI),每一频道包括多个频带。频道宽度可均匀或非均匀(例如宽度随频率增加)、重叠或非重叠。
在实施例中,听力装置还包括用于所涉及应用的其它适宜功能,如反馈抑制、压缩、降噪等。
在实施例中,听力装置包括听音装置如助听器、听力仪器例如适于位于用户耳朵处或者完全或部分位于耳道中的听力仪器、头戴式耳机、耳麦、耳朵保护装置或其组合。
用途
此外,本发明提供上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置的用途。
方法
一方面,本申请还提供听力装置的运行方法,该方法包括(下述步骤):
-通过提供M个电输入信号,在听力装置的环境中从包括目标声源的声场拾取声音;
-将视向量d(k)定义为包括元素dm(k)的M维向量,m=1,2,…,M,第m个元素dm(k)定义从目标信号源到第m个传声器的声传递函数或者从第m个(输入)传声器到参考传声器的相对声传递函数,其中k为频率指数;
-提供当前相应目标声源的视向量d(k)的估计量dest(k);
-提供广义旁瓣相消器结构,其用于基于M个电输入信号和视向量d(k)的估计量dest(k)估计来自目标声源的目标信号s(k,n)的估计量e(k,n),其中n为时间指数,目标方向为从听力装置到目标声源的方向,目标信号的估计包括:
--提供全通波束形成器,其配置成保持来自所有方向的所有信号分量不衰减并提供全通信号yc(k,n);及
--提供目标消除波束形成器,其配置成最大程度地衰减来自目标方向的信号分量并提供目标消除的信号向量yb(k,n),其中yb(k,n)=[yb,1(k,n),…,yb,M- 1(k,n)]T,及yb,i(k,n)为第i个目标消除的信号;
--产生应用于目标消除的信号向量yb(k,n)的换算向量h(k,n)并提供换算后的目标消除的信号yn(k,n);
-从全通信号yc(k,n)减去换算后的目标消除的信号yn(k,n),从而提供目标信号s(k,n)的估计量e(k,n)。本发明方法还包括使得换算向量h(k,n)根据全通信号yc(k,n)的能量和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)生成,其中i为从1到M-1的指数。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的及权利要求中限定的装置的部分或所有结构特征可与本发明方法的实施结合,反之亦然。方法的实施具有与对应装置一样的优点。
计算机可读介质
本发明进一步提供保存包括程序代码的计算机程序的有形计算机可读介质,当计算机程序在数据处理系统上运行时,使得数据处理系统执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。除了保存在有形介质如磁盘、CD-ROM、DVD、硬盘、或任何其它机器可读的介质上,计算机程序也可经传输介质如有线或无线链路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置处运行。
数据处理系统
本发明进一步提供数据处理系统,包括处理器和程序代码,程序代码使得处理器执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
助听系统
另一方面,本申请提供包括上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置及包括辅助装置的助听系统。
在实施例中,该系统适于在听力装置和辅助装置之间建立通信链路以使信息(如控制和状态信号,可能音频信号)能进行交换或从一装置转发给另一装置。
在实施例中,辅助装置是或包括音频网关设备,其适于(如从娱乐装置例如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC)接收多个音频信号,及适于选择和/或组合所接收音频信号(或信号组合)中的适当信号以传给听力装置。在实施例中,辅助装置是或包括遥控器,用于控制听力装置的功能和运行。在实施例中,遥控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制音频处理装置的功能的APP(听力装置包括到智能电话的适当无线接口,例如基于蓝牙或一些其它标准化或专有方案)。
在实施例中,辅助装置是或包括移动电话如智能电话。
在实施例中,辅助装置是另一听力装置。在实施例中,助听系统包括两个听力装置,适于实施双耳助听系统如双耳助听器系统。
定义
在本说明书中,“听力装置”指适于改善、增强和/或保护用户的听觉能力的装置如听力仪器或有源耳朵保护装置或其它音频处理装置,其通过从用户环境接收声信号、产生对应的音频信号、可能修改该音频信号、及将可能已修改的音频信号作为可听见的信号提供给用户的至少一只耳朵而实现。“听力装置”还指适于以电子方式接收音频信号、可能修改该音频信号、及将可能已修改的音频信号作为听得见的信号提供给用户的至少一只耳朵的装置如头戴式耳机或耳麦。听得见的信号例如可以下述形式提供:辐射到用户外耳内的声信号、作为机械振动通过用户头部的骨结构和/或通过中耳的部分传到用户内耳的声信号、及直接或间接传到用户耳蜗神经的电信号。
听力装置可构造成以任何已知的方式进行佩戴,如作为佩戴在耳后的单元(具有将辐射的声信号导入耳道内的管或者具有安排成靠近耳道或位于耳道中的扬声器)、作为整个或部分安排在耳廓和/或耳道中的单元、作为连到植入在颅骨内的固定结构的单元、或作为整个或部分植入的单元等。听力装置可包括单一单元或几个彼此电子通信的单元。
更一般地,听力装置包括用于从用户环境接收声信号并提供对应的输入音频信号的输入变换器和/或以电子方式(即有线或无线)接收输入音频信号的接收器、用于处理输入音频信号的信号处理电路、及用于根据处理后的音频信号将听得见的信号提供给用户的输出装置。在一些听力装置中,放大器可构成信号处理电路。在一些听力装置中,输出装置可包括输出变换器,例如用于提供空传声信号的扬声器或用于提供结构或液体传播的声信号的振动器。在一些听力装置中,输出装置可包括一个或多个用于提供电信号的输出电极。
在一些听力装置中,振动器可适于经皮或由皮将结构传播的声信号传给颅骨。在一些听力装置中,振动器可植入在中耳和/或内耳中。在一些听力装置中,振动器可适于将结构传播的声信号提供给中耳骨和/或耳蜗。在一些听力装置中,振动器可适于例如通过卵圆窗将液体传播的声信号提供到耳蜗液体。在一些听力装置中,输出电极可植入在耳蜗中或植入在颅骨内侧上,并可适于将电信号提供给耳蜗的毛细胞、一个或多个听觉神经、听觉皮层和/或大脑皮层的其它部分。
“助听系统”指包括一个或两个听力装置的系统。“双耳助听系统”指包括一个或两个听力装置并适于协同地向用户的两只耳朵提供听得见的信号的系统。助听系统或双耳助听系统还可包括“辅助装置”,其与听力装置通信并影响和/或受益于听力装置的功能。辅助装置例如可以是遥控器、音频网关设备、移动电话、广播系统、汽车音频系统或音乐播放器。听力装置、助听系统或双耳助听系统例如可用于补偿听力受损人员的听觉能力损失、增强或保护正常听力人员的听觉能力和/或将电子音频信号传给人。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1A-1D分别示出了根据本发明的听力装置的第一、第二、第三和第四实施例。
图2示出了包括安装在用户的第一和第二耳朵处的第一和第二听力装置的示例性听力装置系统,定义了相对于用户的前向和后向,前向(视向)定义为用户当前看的方向(鼻子的方向)。
图3A-3B示出了当视向为0度时用于广义旁瓣相消器结构的波束图案,图3A示出了计算的自由场逼近,图3B示出了测得的声场,实线图和虚线图分别表示全通和目标消除波束形成器。
图4示出了广义旁瓣波束形成器结构的视向的实际(非理想)幅度响应。
图5A-5B示出了根据本发明的助听系统实施例的示例性应用场合,图5A示出了用户、双耳助听器系统、及包括用于系统的用户接口的辅助装置,及图5B示出了实施在运行用于初始化定向系统的APP的辅助装置上的用户接口。
通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出。对于本领域技术人员来说,基于下面的详细描述,本发明的其它实施方式将显而易见。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等(统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、及配置成执行本说明书中描述的多个不同功能的其它适当硬件。计算机程序应广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
本申请涉及使用广义旁瓣相消器结构(GSC)的听力装置应用中的自适应波束形成器。在该应用中,GSC结构中的约束和阻塞矩阵使用目标源和传声器之间的传递函数的估计量特别设计以确保最佳的波束形成器性能。估计量可在听力装置的测量中获得,其放在头部-躯干模拟器上。当使用前述估计的传递函数时,GSC在特殊但真实的情形下可无意地衰减目标声音,其中包括目标和噪声信号的所有信号均源自视向量反映的视向。这由GSC结构中的(对于视向)非理想阻塞矩阵引起。
在听力装置中,传声器阵列波束形成器通常用于空间上衰减背景噪声源。许多种波束形成器可在文献中发现,例如参见[Brandstein&Ward;2001]及其中的参考文献。最小方差无失真响应(MVDR)波束形成器在传声器阵列信号处理中广泛使用。在理想情形下,MVDR波束形成器保持来自目标方向(也称为视向)的信号不变,同时最大程度地衰减来自其它方向的声音信号。广义旁瓣相消器(GSC)结构是MVDR波束形成器的等同表示,相较其初始形式的直接实施提供计算和数值优势。在本说明书中,我们聚焦于听力装置应用中的GSC结构。
图1A-1D分别示出了根据本发明的听力装置(如助听器)的第一、第二、第三和第四实施例。
图1A示出了GSC结构GSC体现在听力装置HD的实施例。目标信号源TSS(信号s)位于相对于听力装置一距离处。听力装置包括M个输入单元IUm(m=1,2,…,M),如输入变换器例如传声器,如传声器阵列。每一输入单元IUm接收目标信号s的通过从目标信号源TSS到相应输入单元IUm的相应传递函数dm(m=1,2,…,M)修改的版本sm(m=1,2,…,M)。视向量d定义为d=[d1,…,dM]T。每一输入单元IUm将电输入信号ym(m=1,2,…,M)提供为输出。输入单元IUm在工作时连接到广义旁瓣结构(GSC)。GSC波束形成器基于来自输入单元的电输入信号提供目标信号的估计量e。非必须地,听力装置HD包括信号处理单元SPU(虚线边框),用于进一步处理目标信号的估计量e。在实施例中,信号处理单元SPU适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。信号处理单元SPU提供处理后的输出信号OUT并在工作时连接到非必需的输出单元OU(虚线边框)以基于处理后的电输出信号提供由用户感知为声学信号的刺激。输出单元OU例如可包括耳蜗植入物的多个电极。作为备选,输出单元包括输出变换器如接收器(扬声器),用于将刺激作为声学信号提供给用户,或者包括用于将刺激作为颅骨的机械振动提供给用户的振动器。
图1B示出了如图1A中所示的听力装置HD的实施例,但还包括用于提供视向量d的估计量dest的视向量估计单元LVU。视向量d定义为包括元素dm的M维向量,m=1,2,…,M,第m个元素dm定义从目标信号源s到第m个输入单元IUm(每一输入单元如包括传声器)的声学传递函数或者从第m个输入单元到参考单元的相对声学传递函数。视向量d通常将随频率而变,可以随时间而变(如果目标源和听力装置相对于彼此移动)。视向量估计单元LVU例如可包括保存各个传递函数的估计量的存储器(如在使用听力装置之前在离线程序中确定,或者在使用听力装置期间估计)。在图1B的实施例中,听力装置HD还包括与视向量估计单元LVU有关的控制单元CONT和用户接口UI。视向量估计单元LVU例如可由控制单元CONT控制以在特定情形下加载视向量d的适宜估计量dest,例如经用户接口UI控制或影响,例如通过在目标声源的具有预存的对应视向量的多个预定位置(如到目标声源的方向)之中选择。作为备选,视向量d可动态确定(估计)。图1B的听力装置HD还包括话音活动(或语音)检测器VAD,用于在特定时间点估计声音信号中是否存在人话音。在实施例中,话音活动检测器适于在特定时间点估计声音信号中是否存在特定频率的人话音。话音活动检测器可配置成监视一个(如单一)或多个电输入信号ym(可能其中的每一个)。
图1C示出了如图1B中的听力装置HD的实施例,但其中更详细地示出了GSC波束形成器和输入单元的实施。所有信号在频域进行表示。因此,每一输入单元IUm(m=1,2,…,M)包括输入变换器ITm(如传声器),提供时变电输入信号s’m,其连接到分析滤波器组AFB以将时域信号s’m转换为(时-)频域传声器信号ym(k,n)。目标源信号记为s(k,n),其中k为频率指数及n为时间指数;dm(k)为从s(k,n)到第m个输入变换器ITm(如传声器)的传递函数,其中m=1,...,M,及输入变换器/传声器信号记为ym(k,n)。为了方便,假定传递函数将为时不变函数。广义旁瓣相消器GSC包括功能单元AP-BF(c(k))、TC-BF(B(k))、SCU(h(k,n))和组合单元(在此为加法器,+)。视向量估计单元LVU和话音活动检测器VAD可以也可不包括在GSC单元中(在图1B中示为在GSC单元外面)。在AP-BF(c(k))单元中,c(k)∈CM×1(其中C指一组复数)指时不变约束向量,其也称为全通波束形成器AP-BF。在TC-BF(B(k))单元中,B(k)∈CM×(M-1)指阻塞(或目标消除)波束形成器TC-BF。在SCU(h(k,n))单元中,换算向量h(k,n)∈C(M-1)×1通过使GSC输出信号e(k,n)的均方误差最小化而获得。理想地,全通波束形成器c(k)不修改来自视向的目标信号。目标消除波束形成器B(k)正交于c(k),其在视向具有零值从而将(理想地)完全消除目标源信号。
图1D示出了如图1C中所示的听力装置HD的实施例,但为简单起见,其仅包括两个输入变换器(在此为两个传声器M1,M2),即M=2。然而,该理论和获得的结果可容易地调整并用于M>2的情形。由于选择M=2,矩阵B(k)变为向量b(k),其输出信号向量yb(k,n)为标量yb(k,n),及换算向量h(k,n)为换算因子h(k,n)。如图1D中所示,GSC波束形成器(在时刻n和频率k)的输出e(k,n)等于yc(k,n)-yb(k,n)·h(k,n)。
众所周知,尽管无失真响应约束,MVDR波束形成器仍能抵消来自视向的有用信号。例如这可以是在混响房间中的情形,当有用的目标信号的反射通过目标消除波束形成器时,其输出信号yb(k,n)从而与目标信号相关联。目标消除也可因视向量估计误差而出现。存在一些复杂的解决该问题的方案,如引入自适应目标消除波束形成器B(k,n)或在设计波束形成器时考虑视向量误差的概率,及提出更准确的视向量估计。
在本申请中,提出一种简单的解决方案(针对特定情形)。本发明提出对GSC结构进行简单的修改,其解决了在所有信号均源自视向的情形下不合需要的目标信号衰减的问题。该问题及其解决方案的例子在下面说明。
图2示出了包括安装在用户U的第一和第二耳朵处的第一和第二听力装置(分别为HD1和HD2)的示例性听力装置系统,定义了相对于用户的前向(标记为“前”的箭头)和后向(标记为“后”的箭头),从输入单元(传声器M1,M2)朝向目标声源TSS(s)的“视向”定义为用户当前看向的方向(假定等于前向,即“鼻子的方向”(图2中的“鼻子”))。第一和第二听力装置HD1,HD2中的每一个分别包括第一和第二传声器M1和M2(或包括第一和第二传声器的传声器阵列),传声器之间具有间隔dmic。
全通波束形成器和目标消除波束形成器
在自由场情形下,视向量d可容易地确定。假定助听器用户面向声源,及该方向(0度)定义为视向(参见图2中的“视向”)。目标声音和两个传声器M1,M2位于水平面中。使用位于物理传声器之间的中间的虚拟参考传声器即dref=1,(自由场)视向量d0变为:
其中ω=2πf,及Td=dmic/cl,其中f为频率,dmic为两个传声器之间的距离,及cl表示cl≈340m/s的声速。此外,d0的单位范数版d定义为:
全通波束形成器c和目标消除波束形成器b通过下述定义给出:
cHd=1∧bHd=O(3)
因此,
c=d(4)
b=[d2,-d1]H(5)
通过将等式(2)代入到等式(4)和(5)中,可确定这两个波束形成器的波束形成器系数。
图3A-3B示出了当视向为0度时用于广义旁瓣相消器结构的波束图(幅度[dB]对从-180度到180度的角度),图3A示出了计算的自由场逼近,图3B示出了测得的声场,实线图和虚线图分别表示全通和目标消除波束形成器。
图3A示出了传声器阵列的示例频率f=1kHz时的波束图,其中传声器距离dmic=13mm。如预期的,全通波束形成器c在视向(0度)具有单位响应,而目标消除波束形成器b在该方向具有完美的零值(尽管我们仅可观察到幅度低于-80度)。
然而,在实践中,传递函数dm并不简单地表达为等式(2)。因此,需要从视向量估计量dest推导波束形成器系数。因此,等式(4)和(5)变为:
c=dest(6)
b=[dest,2-dest,1]H(7)
为估计dest,助听器已被安装在录音室中的头部-躯干模拟器上。播放白噪声目标信号s(n),从视向(0度)入射。传声器信号向量y(n)=[y1(n),...,yM(n)]T定义为:
y(n)=s(n)d(8)
传声器信号协方差矩阵Ryy=E[y(n)yH(n)],其中E[·]指统计预期算子,可估计为:
其中N通过白噪声校准信号s(n)的持续时间确定。从等式(9),视向量估计量dest可使用对应于协方差矩阵估计量的最大特征值的特征向量发现,其中该特征向量进一步归一化为具有单位范数。
图3B示出了在真实声场中示例频率f=1kHz下的波束图。我们观察到,全通波束形成器(实线图)仅逼近单位响应;然而,更重要地,目标消除波束形成器(虚线图)不具有完美的零值,而是具有约35dB的衰减。增大N的值导致更大的衰减。然而,在真实情形下,仅可实现有限的衰减值,而不是理论上期望的-∞dB响应,当limN→∞dest=d时。换言之,每当N≠∞时,目标消除问题将出现,因而我们在实践中将仅获得来自视向的目标信号的有限衰减。
输出信号e(k,n)的最小化尤其是目标消除问题在下面说明。
GSC输出信号e(k,n)通过下式表达:
e(k,n)=yc(k,n)-h(k,n)yb(k,n)(10)
如图1C、1D中所示。为确保GSC波束形成器不衰减需要的(如语音)信号,在只有噪声的时间段期间估计换算因子h(k,n),即当话音活动检测器VAD指明“只有噪声”情形时(参见图1C、1D中的信号NV(k,n))。h(k,n)的计算由下式表达:
hopt(k,n)=argminh(k,n)E[|e(k,n)|2],当VAD=0时(11)
其中E[·]指统计预期算子。等式(11)的闭合式解为:
其中δ>0为调整参数。
本发明具体涉及目标和所有噪声信号均源自视向的声学情形。在理想情形下,由于全通波束形成器在视向的单位响应,全通波束形成器c的输出信号yc(k,n)包含目标和噪声信号的混合。由于目标消除波束形成器b在视向的完美量值,输出信号yb(k,n)在理想情形下将为零,如图3A中所示。通过分析等式(12),由于δ>0,我们获得h(k,n)=0;因此,我们获得e(k,n)=yc(k,n),即所有信号无修改地通过GSC结构。该结果在该情形下是符合需要的,因为所有信号均源自视向。
然而,在实践中,目标消除波束形成器b不具有完美的零值,如图3B中所示;其在视向具有相当大但有限的衰减,如40dB。再次分析等式(12),我们观察到,分子E[y* b(k,n)yc(k,n)]现在具有非零值,及分母E[y* b(k,n)yb(k,n)]的第一部分也为非零且数值上低于分子。当调整参数δ具有较小数值时,所得的换算因子h(k,n)将为h(k,n)≠0,这是不合需要的。
图4示出了广义旁瓣波束形成器结构的视向的实际(非理想)幅度响应(幅度[dB]对频率[kHz],对于从0到10kHz的范围)。图4示出了对于来自视向的信号的GSC传递函数。理想地,其对于所有频率将为0dB,但由于非理想的目标消除波束形成器b及等式(12)中的h(k,n)的更新程序,获得的响应远非需要的响应。在一些频率下(在图4的例子中约2kHz)观察到多于30dB的衰减。
实际上,图4中的响应可考虑为为显露问题而夸大的例子,因为所有信号均源自视向。然而,在其他情形下,如主要目标信号来自视向及低电平噪声信号来自其他方向,目标消除问题尽管减少但仍具有影响。
另外,如果目标源位于刚刚偏离视向的地方,如由于助听器用户未直接面向声源而偏离5度,则该源信号将以有限的衰减通过目标消除波束形成器,理想或非理想情形如图3A-3B中所示。即使其被认为是目标信号,GSC结构将部分地消除该信号。
下面说明修改等式(12)中的换算因子更新以解决目标消除问题。该解决方案的简单使其在仅具有有限处理能力的助听器中很有吸引力。
如先前所述,在所有信号源位于视向的特定情形下的问题因非理想的目标消除波束形成器b引起。因而,在等式(12)中,分母变得小于分子。固定的调整参数δ不能解决该问题,因为目标源电平影响分子和分母的数值。
为解决该问题,提出引入h(k,n)的估计与波束形成器输出信号yc(k,n)和yb(k,n)之间的能量差Δ(k,n)的相关性,其由下式表达:
其中L为用于计算Δ(k,n)的数据样本的数量。
当所有信号源均位于视向时,能量差Δ(k,n)最大。这将是理想或非理想目标消除波束形成器b的情形,因为目标消除波束形成器在视向具有零值(即使其不理想),参见图3A-3B中的例子。因此,提出监视能量差Δ(k,n)以控制换算因子h的估计。从而引入修改的换算因子hmod(k,n),其定义为:
阈值η通过全通波束形成器c和目标消除波束形成器b在视向的幅度响应之间的差确定。在图3B所示的例子中,适当的η值例如将为η=30dB。总的来说,该阈值可适应特定应用(及非必须地,随频率而变)。
已表明,在所有(目标)源信号从前向入射及混合输入信号包含带噪声语音信号的情形下,相较于根据本发明的修改后的GSC波束形成器,(传统的)GSC波束形成器具有相当大的均方误差。这表明不合需要的目标信号消除在传统的GSC波束形成器中发生,而根据本发明的修改后的GSC波束形成器解决了该问题。还可表明这两个GSC结构在五种另外的声音环境(汽车、演讲、会议、聚会、餐厅)中没有差异,这表明所提出的GSC修改在其他情形下未引入非自然信号。
图5A-5B示出了根据本发明的助听系统的实施例的示例性应用场合。
图5A示出了包括与便携式(手持)辅助装置AD通信的左(第一)和右(第二)听力装置HAD1,HAD2的双耳助听系统如双耳助听器系统的实施例,辅助装置用作双耳助听器系统的用户接口UI。在实施例中,双耳助听器系统包括辅助装置AD(及用户接口UI)。辅助装置AD的用户接口UI如图5B中所示。用户接口包括显示助听系统的用户及目标声源相对于用户的多个预定位置的显示器(如触敏显示器)。经用户接口的显示(在标题“波束形成器初始化”下面),用户U被指示:
-将源符号拖曳到当前目标信号源的适宜位置;
-按压“开始”以使所选方向活动(在波束形成滤波器中,例如图1A-1D中的GSC)。
这些指令应提示用户:
-将源符号相对于用户放置在目标声源预期将位于其处的方向(如用户正面或者在不同于正面的角度,如或);
-按压“开始”以开始将所选方向用作以目标声源为目标的波束形成器的“视向”(例如参见图1B中的波束形成器GSC的dest输入)。
因此,鼓励用户通过将声源符号(具有灰色阴影内环的圆形图标)拖曳到其相对于用户的大约位置(例如偏离正向(参见图2中的“前”),正向假定为默认值)而选择当前目标声源的位置。“波束形成器初始化”例如实施为辅助装置AD(如智能电话)的APP。优选地,当该程序开始时(通过按压“开始”),所选位置(如角度,可能及到用户的距离)传给左和右听力装置以用于选择适当的相应(可能预定的,如保存在系统/装置的存储器中)滤波权重集或用于计算前述权重。在图5A-5B的实施例中,包括用户接口UI的辅助装置AD适于拿在用户U的手中,因此方便显示和/或指明目标声源的当前位置。
图5A-5B中所示的用户接口可用在图1A-1D所示的听力装置如助听器的任何实施例中。
优选地,听力装置和辅助装置之间的通信基于高于100kHz频率下的某种调制。优选地,用于在听力装置和辅助装置之间建立通信的频率低于70GHz,例如位于从50MHz到70GHz的范围中,例如高于300MHz,例如在高于300MHz的ISM范围中,例如在900MHz范围中或在2.4GHz范围中或在5.8GHz范围中或在60GHz范围中(ISM=工业、科学和医学,这样的标准化范围例如由国际电信联盟ITU定义)。在实施例中,无线链路基于标准化或专用技术。在实施例中,无线链路基于蓝牙技术(如蓝牙低功率技术)或有关技术。
在图5A的实施例中,示出了记为IA-WL(如左和右听力装置之间的感应链路)和WL-RF(如辅助装置AD和左听力装置HADl之间及辅助装置AD和右听力装置HADr之间的RF链路(如蓝牙))的无线链路(通过对应的天线和收发器电路实施在装置中,在图5A的左和右听力装置中分别记为RF-IA-Rx/Tx-l和RF-IA-Rx/Tx-r)。
在实施例中,辅助装置AD是或包括音频网关设备,其适于(如从娱乐装置例如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC)接收多个音频信号,及适于选择和/或组合所接收音频信号(或信号组合)中的适当信号以传给听力装置。在实施例中,辅助装置是或包括遥控器,用于控制听力装置的功能和运行。在实施例中,辅助装置AD是或包括移动电话如智能电话或类似装置。在实施例中,遥控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制音频处理装置的功能的APP(听力装置包括到智能电话的适当无线接口,例如基于蓝牙(如蓝牙低功率)或一些其它标准化或专有方案)。
在本说明书中,智能电话可包括(A)移动电话与(B)个人计算机的结合:
-(A)移动电话包括传声器、扬声器、和到公用电话交换网(PSTN)的(无线)接口;
-(B)个人计算机包括处理器、存储器、操作系统(OS)、用户接口(如键盘和显示器,例如集成在触敏显示器中)和无线数据接口(包括网页浏览器),使用户能下载和执行实施特定功能特征(例如显示从因特网取回的信息,遥控另一装置,组合来自智能电话的多个不同传感器(如照相机、扫描仪、GPS、传声器等)和/或外部传感器的信息以提供特殊特征等)的应用程序(APP)。
综上所述,本申请解决了在听力装置应用(如用于补偿用户的听力受损的助听器)中使用GSC结构时出现的问题。该问题因非理想的目标消除波束形成器引起。因而,从视向入射的目标信号可被无意地衰减多达30dB。为解决该问题,提出监视来自全通波束形成器和目标消除波束形成器的输出信号之间的差以在GSC更新中控制时变调整参数。所提出的解决方案的优点在于其简单,这在仅具有有限计算能力的便携式(小尺寸)听力装置中是至关重要的因素。所提出的解决方案还可具有解决目标消除问题而不引入其他非自然信号的优点。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或“耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非明确指出,在此公开的任何方法的步骤不必须精确按所公开的顺序执行。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一般原理可应用于其他方面。
权利要求不限于在此所示的各个方面,而是包含与权利要求语言一致的全部范围,其中除非明确指出,以单数形式提及的元件不意指“一个及只有一个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
因而,本发明的范围应依据权利要求进行判断。
参考文献
●[Schaub;2008]ArthurSchaub,DigitalhearingAids,ThiemeMedical.Pub.,2008.
●[Brandstein&Ward;2001]M.BrandsteinandD.Ward,MicrophoneArrays:SignalProcessingTechniquesandApplications.Berlin,Heidelberg,Germany:Springer,Jun.2001.
Claims (14)
1.一种听力装置,包括:
-用于在听力装置的环境中从包括目标声源的声场拾取声音的传声器阵列,所述传声器阵列包括用于拾取听力装置周围的声场的每一版本并提供M个电输入信号的M个传声器,视向量d(k)定义为包括元素dm(k)的M维向量,m=1,2,…,M,第m个元素dm(k)定义从目标信号源到第m个传声器的声传递函数或者从第m个(输入)传声器到参考传声器的相对声传递函数,其中k为频率指数;
-视向量单元,用于提供当前相应目标声源的视向量d(k)的估计量dest(k);
-广义旁瓣相消器,用于提供来自目标声源的目标信号s(k,n)的估计量e(k,n),其中n为时间指数,目标方向为从听力装置到目标声源的方向,所述广义旁瓣相消器包括:
--全通波束形成器,配置成保持来自所有方向的所有信号分量不衰减并提供全通信号yc(k,n);及
--目标消除波束形成器,配置成最大程度地衰减来自目标方向的信号分量并提供目标消除的信号向量yb(k,n),其中yb(k,n)=[yb,1(k,n),…,yb,M- 1(k,n)]T,及yb,i(k,n)为第i个目标消除的信号;
--换算单元,用于产生应用于目标消除的信号向量yb(k,n)的换算向量h(k,n)并提供换算后的目标消除的信号yn(k,n);
--组合单元,用于从全通信号yc(k,n)减去换算后的目标消除的信号yn(k,n),从而提供目标信号s(k,n)的估计量e(k,n);其中来自传声器阵列的M个电输入信号和视向量单元连接到广义旁瓣相消器,及
其中所述换算单元配置成使得换算向量h(k,n)根据全通信号yc(k,n)的能量和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)生成,其中i为从1到M-1的指数。
2.根据权利要求1所述的听力装置,包括话音活动检测器,用于在特定时间点估计声音信号中是否存在人话音。
3.根据权利要求2所述的听力装置,其中所述换算向量h(k,n)在估计不存在人话音的时刻n和频率k时进行计算。
4.根据权利要求1所述的听力装置,其中全通信号yc(k,n)和目标消除的信号yb,i(k,n)之间的能量差Δi(k,n)由下式表达:
其中i=1,2,…,M-1,及其中L为用于计算Δi(k,n)的数据样本的数量。
5.根据权利要求4所述的听力装置,其中所述换算向量h(k,n)的各个元素由下式定义的修改的换算因子hmod,i(k,n)代替:
其中i=1,2,…,M-1,阈值ηi通过全通波束形成器c和目标消除波束形成器B针对每一目标消除的信号yb,i(k,n)在视向的幅度响应之间的差确定。
6.根据权利要求5所述的听力装置,其中所述阈值ηi在10dB和50dB之间的范围中。
7.根据权利要求1所述的听力装置,其中传声器的数量M等于2,及其中全通信号yc(k,n)和目标消除的信号yb(k,n)之间的能量差Δ(k,n)由下式表达:
其中L为用于计算Δ(k,n)的数据样本的数量。
8.根据权利要求7所述的听力装置,其中当所述能量差Δ(k,n)小于或等于预定阈值η时,不修改换算因子h(k,n);及其中当所述能量差Δ(k,n)大于预定阈值η时,换算因子h(k,n)为零。
9.根据权利要求1所述的听力装置,其中当前相应目标声源的视向量d(k)的估计量dest(k)保存在听力装置的存储器中。
10.根据权利要求1所述的听力装置,配置成使得当前相应目标声源的视向量d(k)的估计量dest(k)动态确定。
11.根据权利要求1所述的听力装置,其中目标消除波束形成器在视向不具有完美的零值。
12.根据权利要求1所述的听力装置,包括使用户能影响目标消除波束形成器的用户接口。
13.根据权利要求1所述的听力装置,包括助听器、头戴式耳机、耳麦、耳朵保护装置或其组合。
14.一种听力装置的运行方法,所述方法包括:
-通过提供M个电输入信号,在听力装置的环境中从包括目标声源的声场拾取声音;
-将视向量d(k)定义为包括元素dm(k)的M维向量,m=1,2,…,M,第m个元素dm(k)定义从目标信号源到第m个传声器的声传递函数或者从第m个(输入)传声器到参考传声器的相对声传递函数,其中k为频率指数;
-提供当前相应目标声源的视向量d(k)的估计量dest(k);
-提供广义旁瓣相消器结构,其用于基于M个电输入信号和视向量d(k)的估计量dest(k)估计来自目标声源的目标信号s(k,n)的估计量e(k,n),其中n为时间指数,目标方向为从听力装置到目标声源的方向,目标信号的估计包括:
--提供全通波束形成器,其配置成保持来自所有方向的所有信号分量不衰减并提供全通信号yc(k,n);及
--提供目标消除波束形成器,其配置成最大程度地衰减来自目标方向的信号分量并提供目标消除的信号向量yb(k,n),其中yb(k,n)=[yb,1(k,n),…,yb,M-1(k,n)]T,及yb,i(k,n)为第i个目标消除的信号;
--产生应用于目标消除的信号向量yb(k,n)的换算向量h(k,n)并提供换算后的目标消除的信号yn(k,n);
--从全通信号yc(k,n)减去换算后的目标消除的信号yn(k,n),从而提供目标信号s(k,n)的估计量e(k,n);
其中使得换算向量h(k,n)根据全通信号yc(k,n)的能量和目标消除的信号yb,i(k,n)的能量之间的差Δi(k,n)生成,其中i为从1到M-1的指数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14185117 | 2014-09-17 | ||
EP14185117.0 | 2014-09-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105430587A true CN105430587A (zh) | 2016-03-23 |
CN105430587B CN105430587B (zh) | 2020-04-14 |
Family
ID=51541025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510595725.4A Active CN105430587B (zh) | 2014-09-17 | 2015-09-17 | 包括gsc波束形成器的听力装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9635473B2 (zh) |
EP (1) | EP2999235B1 (zh) |
CN (1) | CN105430587B (zh) |
DK (1) | DK2999235T3 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108235208A (zh) * | 2016-12-15 | 2018-06-29 | 西万拓私人有限公司 | 用于运行助听器设备的方法 |
CN108535694A (zh) * | 2017-03-03 | 2018-09-14 | 通用汽车环球科技运作有限责任公司 | 活动说话者的位置估计 |
CN108574922A (zh) * | 2017-03-09 | 2018-09-25 | 奥迪康有限公司 | 包括声音的无线接收器的听力装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK3148213T3 (en) * | 2015-09-25 | 2018-11-05 | Starkey Labs Inc | DYNAMIC RELATIVE TRANSFER FUNCTION ESTIMATION USING STRUCTURED "SAVING BAYESIAN LEARNING" |
US9992585B1 (en) * | 2017-05-24 | 2018-06-05 | Starkey Laboratories, Inc. | Hearing assistance system incorporating directional microphone customization |
DK179837B1 (en) | 2017-12-30 | 2019-07-29 | Gn Audio A/S | MICROPHONE APPARATUS AND HEADSET |
US10425745B1 (en) | 2018-05-17 | 2019-09-24 | Starkey Laboratories, Inc. | Adaptive binaural beamforming with preservation of spatial cues in hearing assistance devices |
DK3672280T3 (da) | 2018-12-20 | 2023-06-26 | Gn Hearing As | Høreaggregat med accelerationsbaseret stråleformning |
CN112120730B (zh) * | 2020-10-21 | 2024-04-02 | 重庆大学 | 一种基于混合子空间投影的广义旁瓣相消超声成像方法 |
US20230396936A1 (en) * | 2022-06-02 | 2023-12-07 | Gn Hearing A/S | Hearing device with own-voice detection |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006006935A1 (en) * | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
WO2005065012A3 (en) * | 2003-12-24 | 2008-01-10 | Nokia Corp | A method for efficient beamforming using a complementary noise separation filter |
US20110075859A1 (en) * | 2009-09-28 | 2011-03-31 | Samsung Electronics Co., Ltd. | Apparatus for gain calibration of a microphone array and method thereof |
US20120057722A1 (en) * | 2010-09-07 | 2012-03-08 | Sony Corporation | Noise removing apparatus and noise removing method |
US20120093333A1 (en) * | 2010-10-19 | 2012-04-19 | National Chiao Tung University | Spatially pre-processed target-to-jammer ratio weighted filter and method thereof |
WO2012061151A1 (en) * | 2010-10-25 | 2012-05-10 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control |
CN102664023A (zh) * | 2012-04-26 | 2012-09-12 | 南京邮电大学 | 一种麦克风阵列语音增强的优化方法 |
CN103026733A (zh) * | 2010-07-26 | 2013-04-03 | 高通股份有限公司 | 用于多麦克风位置选择性处理的系统、方法、设备和计算机可读媒体 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007106399A2 (en) * | 2006-03-10 | 2007-09-20 | Mh Acoustics, Llc | Noise-reducing directional microphone array |
US20120082322A1 (en) * | 2010-09-30 | 2012-04-05 | Nxp B.V. | Sound scene manipulation |
DK3190587T3 (en) * | 2012-08-24 | 2019-01-21 | Oticon As | Noise estimation for noise reduction and echo suppression in personal communication |
-
2015
- 2015-09-15 EP EP15185162.3A patent/EP2999235B1/en active Active
- 2015-09-15 DK DK15185162.3T patent/DK2999235T3/da active
- 2015-09-16 US US14/855,979 patent/US9635473B2/en active Active
- 2015-09-17 CN CN201510595725.4A patent/CN105430587B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005065012A3 (en) * | 2003-12-24 | 2008-01-10 | Nokia Corp | A method for efficient beamforming using a complementary noise separation filter |
WO2006006935A1 (en) * | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
US20110075859A1 (en) * | 2009-09-28 | 2011-03-31 | Samsung Electronics Co., Ltd. | Apparatus for gain calibration of a microphone array and method thereof |
CN103026733A (zh) * | 2010-07-26 | 2013-04-03 | 高通股份有限公司 | 用于多麦克风位置选择性处理的系统、方法、设备和计算机可读媒体 |
US20120057722A1 (en) * | 2010-09-07 | 2012-03-08 | Sony Corporation | Noise removing apparatus and noise removing method |
US20120093333A1 (en) * | 2010-10-19 | 2012-04-19 | National Chiao Tung University | Spatially pre-processed target-to-jammer ratio weighted filter and method thereof |
WO2012061151A1 (en) * | 2010-10-25 | 2012-05-10 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control |
CN102664023A (zh) * | 2012-04-26 | 2012-09-12 | 南京邮电大学 | 一种麦克风阵列语音增强的优化方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108235208A (zh) * | 2016-12-15 | 2018-06-29 | 西万拓私人有限公司 | 用于运行助听器设备的方法 |
CN108535694A (zh) * | 2017-03-03 | 2018-09-14 | 通用汽车环球科技运作有限责任公司 | 活动说话者的位置估计 |
CN108574922A (zh) * | 2017-03-09 | 2018-09-25 | 奥迪康有限公司 | 包括声音的无线接收器的听力装置 |
CN108574922B (zh) * | 2017-03-09 | 2021-08-24 | 奥迪康有限公司 | 包括声音的无线接收器的听力装置 |
Also Published As
Publication number | Publication date |
---|---|
US20160080873A1 (en) | 2016-03-17 |
CN105430587B (zh) | 2020-04-14 |
US9635473B2 (en) | 2017-04-25 |
EP2999235A1 (en) | 2016-03-23 |
DK2999235T3 (da) | 2020-01-20 |
EP2999235B1 (en) | 2019-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108600907B (zh) | 定位声源的方法、听力装置及听力系统 | |
CN105430587A (zh) | 包括gsc波束形成器的听力装置 | |
CN107690119B (zh) | 配置成定位声源的双耳听力系统 | |
US10231062B2 (en) | Hearing aid comprising a beam former filtering unit comprising a smoothing unit | |
CN106878895B (zh) | 包括改进的反馈抵消系统的听力装置 | |
US10165373B2 (en) | Hearing device comprising a beamformer filtering unit | |
EP2916321B1 (en) | Processing of a noisy audio signal to estimate target and noise spectral variances | |
CN107801139B (zh) | 包括反馈检测单元的听力装置 | |
US10154353B2 (en) | Monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system | |
US11245976B2 (en) | Earphone signal processing method and system, and earphone | |
CN104980865A (zh) | 包括双耳降噪的双耳助听系统 | |
CN104980870A (zh) | 使用辅助装置对助听装置的多传声器降噪系统进行自校准 | |
US11109166B2 (en) | Hearing device comprising direct sound compensation | |
US9699574B2 (en) | Method of superimposing spatial auditory cues on externally picked-up microphone signals | |
CN105323692A (zh) | 用于反馈抑制的方法和设备 | |
WO2020035158A1 (en) | Method of operating a hearing aid system and a hearing aid system | |
EP2916320A1 (en) | Multi-microphone method for estimation of target and noise spectral variances | |
US11671767B2 (en) | Hearing aid comprising a feedback control system | |
EP3041270B1 (en) | A method of superimposing spatial auditory cues on externally picked-up microphone signals | |
US11438712B2 (en) | Method of operating a hearing aid system and a hearing aid system | |
EP4199541A1 (en) | A hearing device comprising a low complexity beamformer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |