CN113453134A - 听力装置及其运行方法和相应数据处理系统 - Google Patents

听力装置及其运行方法和相应数据处理系统 Download PDF

Info

Publication number
CN113453134A
CN113453134A CN202110619673.5A CN202110619673A CN113453134A CN 113453134 A CN113453134 A CN 113453134A CN 202110619673 A CN202110619673 A CN 202110619673A CN 113453134 A CN113453134 A CN 113453134A
Authority
CN
China
Prior art keywords
smoothing
time constant
signal
hearing device
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110619673.5A
Other languages
English (en)
Other versions
CN113453134B (zh
Inventor
M·S·佩德森
J·M·德哈恩
J·詹森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oticon AS
Original Assignee
Oticon AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oticon AS filed Critical Oticon AS
Priority to CN202110619673.5A priority Critical patent/CN113453134B/zh
Publication of CN113453134A publication Critical patent/CN113453134A/zh
Application granted granted Critical
Publication of CN113453134B publication Critical patent/CN113453134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/30Monitoring or testing of hearing aids, e.g. functioning, settings, battery power
    • H04R25/305Self-monitoring or self-testing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/405Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/502Customised settings for obtaining desired overall acoustical characteristics using analog signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/007Protection circuits for transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/021Behind the ear [BTE] hearing aids
    • H04R2225/0216BTE hearing aids having a receiver in the ear mould
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/41Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/67Implantable hearing aids or parts thereof not covered by H04R25/606
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/25Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • H04R25/552Binaural
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/60Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles
    • H04R25/604Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers
    • H04R25/606Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers acting directly on the eardrum, the ossicles or the skull, e.g. mastoid, tooth, maxillary or mandibular bone, or mechanically stimulating the cochlea, e.g. at the oval window

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

本申请公开了听力装置及其运行方法和相应数据处理系统,其中所述听力装置包括:第一和第二传声器(MBTE1,MBTE2),用于将输入声音分别转换为第一和第二电输入信号(IN1,IN2);及自适应波束形成器滤波单元(BFU),配置成基于所述第一和第二电输入信号(IN1,IN2)以及所述第一和第二电输入信号(IN1,IN2)的协方差矩阵自适应提供合成的波束成形信号(YBF)。所述自适应波束形成器滤波单元(BFU)包括平滑单元,配置成根据所述第一和第二电输入信号(IN1,IN2)的协方差随时间的变化,随着用于平滑的时间常数的自适应变化而自适应平滑所述协方差矩阵的元素,提供自适应平滑的协方差矩阵。所述自适应波束形成器滤波单元(BFU)配置成利用所述自适应平滑的协方差矩阵确定所述波束成形信号(YBF)。

Description

听力装置及其运行方法和相应数据处理系统
本申请为2017年5月31日申请的、发明名称为“包括含有平滑单元的波束形成器滤波单元的助听器”的中国专利申请201710400520.5的分案申请。
技术领域
本申请涉及助听器领域,如助听器。
背景技术
在助听器中通过波束形成进行空间滤波(定向性)是衰减不想要的噪声的有效方式,因为随方向而变的增益可抵消来自一方向的噪声同时保留从另一方向进来的感兴趣的声音,藉此可能提高语音可懂度。通常,听力仪器中的波束形成器具有波束图,其被连续调整以使噪声最小化同时来自目标方向的声音不被改变。由于噪声信号的声学性质随时间变化,波束形成器实施为自适应系统,其调整定向波束图以使噪声最小化同时目标声音(方向)不被改变。
尽管有潜在的好处,但自适应定向性也具有一些缺点。在变动的声环境中,自适应系统需要快速反应。这样的快速系统的参数估计量将具有高差异,这将在稳定环境中导致更差的性能。
发明内容
本发明提出一种平滑方案,其在变动环境中提供自适应参数的更多平滑及在更稳定的声环境中提供自适应参数的较少平滑。
另一方面,基于自适应协方差平滑的平滑方案,其在感兴趣的声源方向变化的环境或情形下有利(例如存在一个以上固定不动的声源,及一个以上固定不动的声源在不同的时间点活动,例如一个接一个,或者无关联)。
助听器
在本申请的第一方面,提供适于在工作位置时位于用户耳朵处或耳朵中或耳后或者完全或部分植入在用户头部中的助听器。该助听器包括:
-第一和第二传声器(MBTE1,MBTE2),用于将输入声音分别转换为第一电输入信号IN1和第二电输入信号IN2
-自适应波束形成器滤波单元(BFU),用于基于第一和第二电输入信号提供合成波束成形信号YBF,自适应波束形成器滤波单元包括:
--第一存储器,包括表示第一波束图(C1)的第一组复值、随频率而变的加权参数W11(k),W12(k),其中k为频率指数,k=1,2,…,K;
--第二存储器,包括表示第二波束图(C2)的第二组复值、随频率而变的加权参数W21(k),W22(k);
---其中,第一和第二组加权参数W11(k),W12(k)和W21(k),W22(k)分别预先确定及可能在助听器运行期间进行更新;
--自适应波束形成器处理单元,用于提供表示自适应波束图(ABP)的自适应确定的自适应参数β(k),其配置成在来自目标方向的声音实质上不被改变的约束条件下尽可能多地衰减不想要的噪声;及
--合成波束形成器(Y),用于基于第一和第二电输入信号IN1和IN2、第一和第二组复值随频率而变的加权参数W11(k),W12(k)和W21(k),W22(k)、及合成的复值随频率而变的自适应参数β(k)提供所述合成波束成形信号YBF,其中β(k)可确定为:
Figure BDA0003099286840000021
其中,*指复共轭,及<·>指统计预期算子,c为常数。助听器适于使得所述自适应波束形成器滤波单元(BFU)包括平滑单元,用于通过随时间平滑复数表达式C2 *·C1和实数表达式|C2|2而实施统计预期算子。
在本申请的第二方面,提供适于在工作位置时位于用户耳朵处或耳朵中或耳后或者完全或部分植入在用户头部中的助听器。该助听器包括:
-第一和第二传声器(MBTE1,MBTE2),用于将输入声音分别转换为第一电输入信号IN1和第二电输入信号IN2
-自适应波束形成器滤波单元(BFU),用于基于第一和第二电输入信号提供合成波束成形信号YBF,自适应波束形成器滤波单元包括:
--第一存储器,包括表示第一波束图(C1)的第一组复值、随频率而变的加权参数W11(k),W12(k),其中k为频率指数,k=1,2,…,K;
--第二存储器,包括表示第二波束图(C2)的第二组复值、随频率而变的加权参数W21(k),W22(k);
---其中,第一和第二组加权参数W11(k),W12(k)和W21(k),W22(k)分别预先确定及可能在助听器运行期间进行更新;
--自适应波束形成器处理单元,用于提供表示自适应波束图(ABP)的自适应确定的自适应参数β(k),其配置成在来自目标方向的声音实质上不被改变的约束条件下尽可能多地衰减不想要的噪声;及
--合成波束形成器(Y),用于基于第一和第二电输入信号IN1和IN2、第一和第二组复值随频率而变的加权参数W11(k),W12(k)和W21(k),W22(k)、及合成的复值随频率而变的自适应参数β(k)提供所述合成波束成形信号YBF,其中自适应波束形成器处理单元配置成从下面的表达式确定自适应参数β(k):
Figure BDA0003099286840000031
其中wC1和wC2为分别表示第一波束形成器(C1)和第二波束形成器(C2)的波束形成器权重,Cv为噪声协方差矩阵,及H指厄米转置。
在实施例中,
Figure BDA0003099286840000032
换言之,第一和第二波束图优选相互直交。
在实施例中,第一波束图(C1)表示目标保持波束形成器,例如实施为延迟和求和波束形成器。在实施例中,第二波束图(C2)表示目标抵消波束形成器,例如实施为延迟和求减波束形成器。
β的表达式在广义旁瓣抵消器结构中具有基础,其中在双传声器的特殊情形下,具有(假定
Figure BDA0003099286840000033
):
wGsC(k)=wC1(k)-wC2(k)β*(k)
其中(忽略频率指数k)
Figure BDA0003099286840000041
其中,E[·]表示预期算子。VAD=0表示语音不存在的情形(例如在给定时段仅存在噪声)。x表示输入信号或者输入信号的处理后版本(例如x=[X1(k,m),X2(k,m)]T)。
我们注意到,可从信号
Figure BDA0003099286840000042
Figure BDA0003099286840000043
直接得到β(参见第一方面)或者可从噪声协方差矩阵Cv得到β,即
Figure BDA0003099286840000044
(参见第二方面)。这可以是实施的选择。例如,如果信号C1和C2已经在装置或算法中在别处使用,从这些信号直接得到β是有利的
Figure BDA0003099286840000045
但是如果我们需要改变视向(从而改变wC1和wC2),在预期算子内包括权重是不利的。在该情形下,从噪声协方差矩阵Cv得到β是有利的(如在第二方面中。从而wC1和wC2将不是平滑的一部分,因而β可基于例如目标DOA的变化(其将导致wC1和wC2的变化,其中wC1=[W11 W12]T和wC2=[W21 W22]T)而快速变化)。根据该方法确定β的实施例例如在图18中示出(使用或未使用根据本发明的协方差平滑)。
在实施例中,自适应波束形成器滤波单元配置成根据第一和第二电输入信号的协方差随时间的变化(ΔC)针对所述电输入信号提供协方差矩阵的自适应平滑,包括用于所述平滑的自适应变化的时间常数(τattrel),其中所述时间常数对于低于第一阈值(ΔCth1)的协方差变化具有第一值(τatt1rel1)及对于高于第二阈值(ΔCth2)的协方差变化具有第二值(τatt2rel2),其中时间常数的第一值大于相应的第二值,而第一阈值(ΔCth1)小于或等于第二阈值(ΔCth2)。在实施例中,自适应波束形成器滤波单元配置成提供噪声协方差矩阵Cv的自适应平滑。在实施例中,自适应波束形成器滤波单元配置成使得噪声协方差矩阵Cv在仅存在噪声时更新。在实施例中,助听器包括话音活动检测器,用于提供在给定时间点输入信号是否包括语音的(二元或连续,如基于频带的)指示。
从而可提供一种改进的波束形成器滤波单元。
统计预期算子通过平滑运算进行逼近,例如实施为移动平均,例如通过低通滤波器如FIR滤波器实施,例如通过IIR滤波器实施。
在实施例中,平滑单元配置成对复数表达式C2 *·C1和实数表达式|C2|2应用实质上一样的平滑时间常数。在实施例中,平滑时间常数包括增高和释放时间常数τatt和τrel。在实施例中,增高和释放时间常数实质上相等。从而在估计量中没有平滑运算引入的偏差。在实施例中,平滑单元配置成使能在平滑时使用不同的增高和释放时间常数τatt和τrel。在实施例中,用于复数表达式C2 *·C1和实数表达式|C2|2的平滑的增高时间常数τatt实质上相等。在实施例中,用于复数表达式C2 *·C1和实数表达式|C2|2的平滑的释放时间常数τrel实质上相等。
在实施例中,平滑单元配置成使合成自适应参数β(k)平滑。在实施例中,平滑单元配置成使得合成自适应参数β(k)的平滑时间常数不同于复数表达式C2 *·C1和实数表达式|C2|2的平滑时间常数。
在实施例中,平滑单元配置成使得合成自适应参数β(k)的平滑涉及的增高和释放时间常数大于复数表达式C2 *·C1和实数表达式|C2|2的平滑涉及的相应增高和释放时间常数。这具有随信号电平而变的表达式C2 *·C1和|C2|2的平滑可相对更快执行的优点(使得突然的电平变化(尤其是电平降低)可被快速检测到)。合成自适应参数β(k)的增大的方差通过执行自适应参数β(k)的相对慢的平滑进行处理(提供平滑的自适应参数β(k)=<β(k)>)。
在实施例中,平滑单元配置成使得复数表达式C2 *·C1和实数表达式|C2|2的平滑涉及的增高和释放时间常数自适应确定。
在实施例中,平滑单元配置成使得合成自适应参数β(k)的平滑涉及的增高和释放时间常数自适应确定。在实施例中,平滑单元包括低通滤波器。在实施例中,低通滤波器适于使能使用不同的增高和释放系数。在实施例中,平滑单元包括实施为具有固定或可配置的时间常数的IIR滤波器的低通滤波器。
在实施例中,平滑单元包括实施为具有固定时间常数的IIR滤波器及具有可配置时间常数的IIR滤波器的低通滤波器。在实施例中,平滑单元配置成使得平滑时间常数取0和1之间的值。接近0的系数应用具有长时间常数的平均,而接近1的系数应用短时间常数。在实施例中,所述IIR滤波器中的至少一个为一阶IIR滤波器。在实施例中,平滑单元包括多个一阶IIR滤波器。
在实施例中,平滑单元配置成通过函数单元确定可配置的时间常数,其提供在实数表达式|C2|2由具有第一时间常数的IIR滤波器滤波时的第一已滤波值和在实数表达式|C2|2由具有第二时间常数的IIR滤波器滤波时的第二已滤波值之间的差的预定函数,其中第一时间常数小于第二时间常数。在实施例中,平滑单元包括使用第一和第二时间常数对实数表达式|C2|2进行滤波并提供第一和第二已滤波值的两个一阶IIR滤波器,及包括用于提供实数表达式|C2|2的所述第一和第二已滤波值之间的差的组合单元(如求和或求差单元)和用于提供可配置的时间常数的函数单元,和用于使用可配置的时间常数对实数表达式|C2|2进行滤波的一阶IIR滤波器。
在实施例中,函数单元包括ABS单元,其提供第一和第二已滤波值之间的差的绝对值。
在实施例中,第一和第二时间常数为固定时间常数。
在实施例中,第一时间常数为固定时间常数,及第二时间常数为可配置的时间常数。
在实施例中,预定函数为第一和第二已滤波值之间的差的递减函数。在实施例中,预定函数为第一和第二已滤波值之间的差的单调递减函数。第一和第二已滤波值之间的差越大,平滑应越快地执行,即时间常数越小。
在实施例中,预定函数为二元函数、分段线性函数和连续单调函数中的一个。在实施例中,预定函数为S形函数。
在实施例中,平滑单元包括实施为IIR滤波器的相应低通滤波器,其使用可配置的时间常数对表达式C2 *·C1的实数和虚数部分及实数表达式|C2|2进行滤波,其中可配置的时间常数从|C2|2确定。
在实施例中,助听器包括适于位于用户耳朵处或耳朵中或者适于完全或部分植入在用户头部中的听力仪器、头戴式耳机、耳麦、耳朵保护装置或其组合。
在实施例中,助听器适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。在实施例中,助听器包括用于增强输入信号并提供处理后的输出信号的信号处理单元。
在实施例中,助听器包括用于提供可由用户感知为声音的输出刺激的输出单元(如扬声器或振动器或耳蜗植入件的电极)。在实施例中,助听器包括第一和第二传声器及输出单元之间的正向或信号通路。在实施例中,波束形成器滤波单元位于正向通路中。在实施例中,信号处理单元适于根据用户的特定需要提供随电平和频率而变的增益。在实施例中,助听器包括具有用于分析电输入信号(如确定电平、调制、信号类型、声反馈估计量等)的功能件的分析通路。在实施例中,分析通路和/或正向通路的部分或所有信号处理在频域进行。在实施例中,分析通路和/或正向通路的部分或所有信号处理在时域进行。
在实施例中,表示声信号的模拟电信号在模数(AD)转换过程中转换为数字音频信号,其中模拟信号以预定采样频率或采样速率fs进行采样,fs例如在从8kHz到48kHz的范围中(适应应用的特定需要)以在离散的时间点tn(或n)提供数字样本xn(或x[n]),每一音频样本通过预定的Ns比特表示声信号在tn时的值,Ns例如在从1到16比特的范围中。数字样本x具有1/fs的时间长度,如50μs,对于fs=20kHz。在实施例中,多个音频样本按时间帧安排。在实施例中,一时间帧包括64个或128个音频数据样本。根据实际应用可使用其它帧长度。
在实施例中,助听器包括模数(AD)转换器以按预定的采样速率如20kHz对模拟输入进行数字化。在实施例中,助听器包括数模(DA)转换器以将数字信号转换为模拟输出信号,例如用于经输出变换器呈现给用户。
在实施例中,助听器如第一和第二传声器中的每一个包括(TF-)转换单元,用于提供输入信号的时频表示。在实施例中,时频表示包括所涉及信号在特定时间和频率范围的相应复值或实值的阵列或映射。在实施例中,TF转换单元包括滤波器组,用于对(时变)输入信号进行滤波并提供多个(时变)输出信号,每一输出信号包括截然不同的输入信号频率范围。在实施例中,TF转换单元包括用于将时变输入信号转换为频域中的(时变)信号的傅里叶变换单元。在实施例中,助听器考虑的、从最小频率fmin到最大频率fmax的频率范围包括从20Hz到20kHz的典型人听频范围的一部分,例如从20Hz到12kHz的范围的一部分。在实施例中,助听器的正向通路和/或分析通路的信号拆分为NI个频带,其中NI例如大于5,如大于10,如大于50,如大于100,如大于500,至少部分频带个别地处理。在实施例中,助听器适于在NP个不同频道处理正向和/或分析通路的信号(NP≤NI)。频道可以宽度一致或不一致(如宽度随频率增加)、重叠或不重叠。每一频道包括一个或多个频带。
在实施例中,助听器为便携装置,例如包括本机能源如电池例如可再充电电池的装置。
在实施例中,助听器包括听力仪器,如适于位于耳朵处或者完全或部分位于用户耳道中或者完全或部分植入在用户头部中的听力仪器。
在实施例中,助听器包括多个检测器,其配置成提供与助听器的当前物理环境(如当前声环境)有关、和/或与佩戴助听器的用户的当前状态有关、和/或与助听器的当前状态或运行模式有关的状态信号。作为备选或另外,一个或多个检测器可形成与助听器(如无线)通信的外部装置的一部分。外部装置例如可包括另一助听装置、遥控器、音频传输装置、电话(如智能电话)、外部传感器等。
在实施例中,多个检测器中的一个或多个对全带信号起作用(时域)。在实施例中,多个检测器中的一个或多个对频带拆分的信号起作用((时-)频域)。
在实施例中,多个检测器包括电平检测器,用于估计正向通路的信号的当前电平。在实施例中,多个检测器包括噪底检测器。在实施例中,多个检测器包括电话模式检测器。
在特定实施例中,助听器包括话音检测器(VD),用于确定输入信号是否包括话音信号(在特定时间点)。在本说明书中,话音信号包括来自人类的语音信号。其还可包括由人类语音系统产生的其它形式的发声(如唱歌)。在实施例中,话音检测器单元适于将用户当前的声环境分类为话音或无话音环境。这具有下述优点:包括用户环境中的人类发声(如语音)的电传声器信号的时间段可被识别,因而与仅包括其它声源(如人工产生的噪声)的时间段分离。在实施例中,话音检测器适于还将用户自己的话音检测为话音。作为备选,话音检测器适于从话音检测排除用户自己的话音。在实施例中,话音活动检测器适于在用户自己的话音与其它话音之间区分。
在实施例中,助听器包括自我话音检测器,用于检测特定输入声音(如话音)是否源自系统用户的话音。在实施例中,助听器的传声器系统适于能够在用户自己的话音和另一人的话音之间进行区分及可能与非话音声音区分开。
在实施例中,存储器包括多个固定的自适应参数βfix,j(k),j=1,…,Nfix,其中Nfix为固定波束图的数量,表示不同的(第三)固定波束图,其可根据例如来自用户接口的控制信号或者基于来自一个或多个检测器的信号进行选择。在实施例中,固定波束形成器的选择取决于来自自我话音检测器和/或来自电话模式检测器的信号。
在实施例中,助听装置包括分类单元,配置成基于来自(至少部分)检测器的输入信号及可能其它输入对当前情形进行分类。在本说明书中,“当前情形”由下面的一个或多个定义:
a)物理环境(如包括当前电磁环境,例如出现计划或未计划由助听器接收的电磁信号(包括音频和/或控制信号),或者当前环境不同于声学的其它性质);
b)当前声学情形(输入电平、反馈等);
c)用户的当前模式或状态(运动、温度等);
d)助听装置和/或与助听器通信的另一装置的当前模式或状态(所选程序、自上次用户交互之后消逝的时间等)。
在实施例中,助听器还包括用于所涉及应用的其它适宜功能,如压缩、降噪、反馈抑制等。
在实施例中,助听器包括听力仪器,例如适于位于耳朵处或者完全或部分位于用户耳道中或者完全或部分植入在用户头部中的听力仪器、头戴式耳机、耳麦、耳朵保护装置或其组合。
用途
此外,本发明提供上面描述的、“具体实施方式”中详细描述的及权利要求中限定的助听器的用途。在实施例中,提供在包括一个或多个听力仪器、头戴式耳机、耳麦、有源耳朵保护系统等的系统中的用途,例如免提电话系统、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
助听器的运行方法
在一方面,提供适于在工作位置时位于用户耳朵处或耳朵中或耳后或者完全或部分植入在用户头部中的助听器的运行方法。该方法包括:
-提供(例如将输入声音转换为)第一电输入信号IN1和第二电输入信号IN2
-基于第一和第二电输入信号自适应提供合成波束成形信号YBF
--将表示第一波束图(C1)的第一组复值、随频率而变的加权参数W11(k),W12(k)保存在第一存储器中,其中k为频率指数,k=1,2,…,K;
--将表示第二波束图(C2)的第二组复值、随频率而变的加权参数W21(k),W22(k)保存在第二存储器中;
---其中,第一和第二组加权参数W11(k),W12(k)和W21(k),W22(k)分别预先确定及可能在助听器运行期间进行更新;
--提供表示自适应波束图(ABP)的自适应确定的自适应参数β(k),其配置成在来自目标方向的声音实质上不被改变的约束条件下尽可能多地衰减不想要的噪声;及
--基于第一和第二电输入信号IN1和IN2、第一和第二组复值随频率而变的加权参数W11(k),W12(k)和W21(k),W22(k)、及合成的复值随频率而变的自适应参数β(k)提供所述合成波束成形信号YBF,其中β(k)可确定为:
Figure BDA0003099286840000111
其中,*指复共轭,及<·>指统计预期算子,c为常数。该方法还包括随时间平滑复数表达式C2 *·C1和实数表达式|C2|2
在第二方面,提供适于在工作位置时位于用户耳朵处或耳朵中或耳后或者完全或部分植入在用户头部中的助听器的运行方法。该方法包括:
-提供(例如将输入声音转换为)第一电输入信号IN1和第二电输入信号IN2
-基于第一和第二电输入信号自适应提供合成波束成形信号YBF
--将第一波束图(C1)的第一组复值、随频率而变的加权参数W11(k),W12(k)保存在第一存储器中,其中k为频率指数,k=1,2,…,K;
--将表示第二波束图(C2)的第二组复值、随频率而变的加权参数W21(k),W22(k)保存在第二存储器中;
---其中,第一和第二组加权参数W11(k),W12(k)和W21(k),W22(k)分别预先确定及可能在助听器运行期间进行更新;
--提供表示自适应波束图(ABP)的自适应确定的自适应参数β(k),其配置成在来自目标方向的声音实质上不被改变的约束条件下尽可能多地衰减不想要的噪声;及
--基于第一和第二电输入信号IN1和IN2、第一和第二组复值随频率而变的加权参数W11(k),W12(k)和W21(k),W22(k)、及合成的复值随频率而变的自适应参数β(k)提供所述合成波束成形信号YBF,其中合成的复值、随频率而变的自适应参数β(k)从下面的表达式确定:
Figure BDA0003099286840000121
其中wC1和wC2为分别表示第一波束形成器(C1)和第二波束形成器(C2)的波束形成器权重,Cv为噪声协方差矩阵,及H指厄米转置。
在实施例中,
Figure BDA0003099286840000122
换言之,第一和第二波束图优选相互直交。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的或权利要求中限定的装置的部分或所有结构特征可与本发明方法的实施结合,反之亦然。方法的实施具有与对应装置一样的优点。
自适应协方差矩阵平滑方法
在另一方面,本发明提供基于自适应协方差平滑的平滑方案。自适应协方差平滑在感兴趣的声源方向变化的环境或情形下是有利的,例如在存在一个以上(隔开的)固定不动或者半固定的声源的情形下,这些声源在不同的时间点活动,例如一个接着一个,或者时间上无关联。
提供听力装置如助听器的运行方法。该方法包括:
-提供(例如将输入声音转换为)第一电输入信号X1和第二电输入信号X2
-基于第一和第二电输入信号自适应提供合成波束成形信号YBF,其利用根据第一和第二电输入信号的协方差随时间的变化(ΔC)针对所述电输入信号进行协方差矩阵的自适应平滑,包括用于所述平滑的自适应变化的时间常数(τattrel);
--其中所述时间常数对于低于第一阈值(ΔCth1)的协方差变化具有第一值(τatt1rel1)及对于高于第二阈值(ΔCth2)的协方差变化具有第二值(τatt2rel2),其中时间常数的第一值大于相应的第二值,而第一阈值(ΔCth1)小于或等于第二阈值(ΔCth2)。
在实施例中,第一X1和第二X2电输入信号按第一时频表示X1(k,m)和第二时频表示X2(k,m)提供,其中k为频率指数,k=1,…,K及m时间帧指数。在实施例中,第一和第二电输入信号的协方差随时间的变化(ΔC)与一个或多个(可能重叠的)时间帧上的变化有关(即Δm≥1)。
在实施例中,时间常数分别表示增高和释放时间常数(τattrel)。
包括自适应波束形成器的听力装置
还提供配置成实施自适应协方差矩阵平滑方法的听力装置。
进一步提供听力装置如助听器。该听力装置包括:
-第一和第二传声器(M1,M2),用于将输入声音分别转换为第一电输入信号IN1和第二电输入信号IN2
-自适应波束形成器滤波单元(BFU),配置成基于第一和第二电输入信号自适应提供合成波束成形信号YBF,其利用根据第一和第二电输入信号的协方差随时间的变化(ΔC)针对所述电输入信号进行协方差矩阵的自适应平滑,包括用于所述平滑的自适应变化的时间常数(τattrel);
--其中所述时间常数对于低于第一阈值(ΔCth1)的协方差变化具有第一值(τatt1rel1)及对于高于第二阈值(ΔCth2)的协方差变化具有第二值(τatt2rel2),其中时间常数的第一值大于相应的第二值,而第一阈值(ΔCth1)小于或等于第二阈值(ΔCth2)。
这具有提供改进的听力装置的优点,其适合在具有多个竞争讲话者的动态听音环境中确定来自声源的声音的到达方向(和/或随时间的位置)(因而操纵波束朝向当前活动的声源)。
计算机可读介质
本发明进一步提供保存包括程序代码的计算机程序的有形计算机可读介质,当计算机程序在数据处理系统上运行时,使得数据处理系统执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
作为例子但非限制,前述有形计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁性存储装置,或者可用于执行或保存指令或数据结构形式的所需程序代码并可由计算机访问的任何其他介质。如在此使用的,盘包括压缩磁盘(CD)、激光盘、光盘、数字多用途盘(DVD)、软盘及蓝光盘,其中这些盘通常磁性地复制数据,同时这些盘可用激光光学地复制数据。上述盘的组合也应包括在计算机可读介质的范围内。除保存在有形介质上之外,计算机程序也可经传输介质如有线或无线链路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置处运行。
数据处理系统
一方面,本发明进一步提供数据处理系统,包括处理器和程序代码,程序代码使得处理器执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
听力系统
另一方面,本发明提供包括上面描述的、“具体实施方式”中详细描述的及权利要求中限定的助听器及包括辅助装置的听力系统。
在实施例中,该听力系统适于在助听器和辅助装置之间建立通信链路以使信息(如控制和状态信号,可能音频信号)能在其间进行交换或从一装置转发给另一装置。
在实施例中,辅助装置是或包括音频网关设备,其适于(如从娱乐装置例如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC)接收多个音频信号,及适于选择和/或组合所接收音频信号(或信号组合)中的适当信号以传给助听器。在实施例中,辅助装置是或包括遥控器,用于控制助听器的功能和运行。在实施例中,遥控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制音频处理装置的功能的APP(助听器包括适当的到智能电话的无线接口,例如基于蓝牙或一些其它标准化或专有方案)。在实施例中,辅助装置是或包括智能电话或类似通信装置。
在实施例中,辅助装置为另一助听器。在实施例中,听力系统包括适于实施双耳助听器系统的两个助听器。
在实施例中,双耳助听器系统(例如双耳助听器系统的第一和第二助听器中的每一个)配置成双耳地交换平滑的β值以基于第一和第二助听器的两个第一和第二平滑的β值β1(k),β2(k)的组合产生一个联合的βbin(k)值。
定义
在本说明书中,“助听器”指适于改善、增强和/或保护用户的听觉能力的装置如听力仪器或有源耳朵保护装置或其它音频处理装置,其通过从用户环境接收声信号、产生对应的音频信号、可能修改该音频信号、及将可能已修改的音频信号作为可听见的信号提供给用户的至少一只耳朵而实现。“助听器”还指适于以电子方式接收音频信号、可能修改该音频信号、及将可能已修改的音频信号作为听得见的信号提供给用户的至少一只耳朵的装置如头戴式耳机或耳麦。听得见的信号例如可以下述形式提供:辐射到用户外耳内的声信号、作为机械振动通过用户头部的骨结构和/或通过中耳的部分传到用户内耳的声信号、及直接或间接传到用户耳蜗神经的电信号。
助听器可构造成以任何已知的方式进行佩戴,如作为佩戴在耳后的单元(具有将辐射的声信号导入耳道内的管或者具有安排成靠近耳道或位于耳道中的扬声器)、作为整个或部分安排在耳廓和/或耳道中的单元、作为连到植入在颅骨内的固定结构的单元、或作为整个或部分植入的单元等。助听器可包括单一单元或几个彼此电子通信的单元。
更一般地,助听器包括用于从用户环境接收声信号并提供对应的输入音频信号的输入变换器和/或以电子方式(即有线或无线)接收输入音频信号的接收器、用于处理输入音频信号的(通常可配置的)信号处理电路、及用于根据处理后的音频信号将听得见的信号提供给用户的输出装置。在一些助听器中,放大器可构成信号处理电路。信号处理电路通常包括一个或多个(集成或单独的)存储元件,用于执行程序和/或用于保存在处理中使用(或可能使用)的参数和/或用于保存适合助听器功能的信息和/或用于保存例如结合到用户的接口和/或到编程装置的接口使用的信息(如处理后的信息,例如由信号处理电路提供)。在一些助听器中,输出装置可包括输出变换器,例如用于提供空传声信号的扬声器或用于提供结构或液体传播的声信号的振动器。在一些助听器中,输出装置可包括一个或多个用于提供电信号的输出电极。
在一些助听器中,振动器可适于经皮或由皮将结构传播的声信号传给颅骨。在一些助听器中,振动器可植入在中耳和/或内耳中。在一些助听器中,振动器可适于将结构传播的声信号提供给中耳骨和/或耳蜗。在一些助听器中,振动器可适于例如通过卵圆窗将液体传播的声信号提供到耳蜗液体。在一些助听器中,输出电极可植入在耳蜗中或植入在颅骨内侧上,并可适于将电信号提供给耳蜗的毛细胞、一个或多个听觉神经、听觉皮层和/或大脑皮层的其它部分。
“听力系统”指包括一个或两个助听器的系统。“双耳听力系统”指包括两个助听器并适于协同地向用户的两只耳朵提供听得见的信号的系统。听力系统或双耳听力系统还可包括一个或多个“辅助装置”,其与助听器通信并影响和/或受益于助听器的功能。辅助装置例如可以是遥控器、音频网关设备、移动电话(如智能电话)、广播系统、汽车音频系统或音乐播放器。助听器、听力系统或双耳听力系统例如可用于补偿听力受损人员的听觉能力损失、增强或保护正常听力人员的听觉能力和/或将电子音频信号传给人。
本发明的实施例如可用在下述应用中:助听器、头戴式耳机、耳麦、耳朵保护系统或其组合。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1示出了自适应波束形成器构造,其中在第k个频道Y(k)中的自适应波束形成器通过将缩放自适应因子β(k)的目标抵消波束形成器从全向波束形成器减去而产生。
图2示出了与图1中所示类似的自适应波束形成器,但自适应波束图Y(k)通过将缩放自适应因子β(k)的目标抵消波束形成器C2(k)从另一固定波束图C1(k)减去而产生。
图3示出了怎样从等式(1)计算自适应因子β的示例性框图,其在分子中包含C* 2C1的平均值及在分母中包含C* 2C2=|C2|2的平均值。
图4示出了一阶IIR滤波器的框图,其中平滑性质受系数(coet)控制。
图5A示出了输入信号|C2|2的平滑的例子,其中长时间常数将提供稳定的估计量,但如果电平突然从高电平变到低电平,收敛时间将慢。
图5B示出了输入信号|C2|2的平滑的例子,其中时间常数短并在电平变化时具有快速收敛,但总估计量具有较高的差异。
图6示出了图4中给出的低通滤波器可怎样用不同的增高和释放系数实施的框图。
图7示出了怎样从等式(1)计算自适应因子β的示例性框图,但相较于图3,不仅对C* 2C1和|C2|2低通滤波,而且对计算的自适应因子β低通滤波。
图8A示出了改进的低通滤波器的第一示例性框图。
图8B示出了改进的低通滤波器的第二示例性框图。
图9示出了来自图8A或8B中所示的改进的低通滤波器的所得估计量。
图10示出了具有与图8A中所示类似的低通滤波器结构的改进的低通滤波器的示例性框图,但在图10中,自适应系数取决于|C2|2的电平变化。
图11示出了具有与图10中所示类似的低通滤波器结构的改进的低通滤波器的示例性框图,但在图11的实施例中,自适应系数(coef)从|C2|2的两个分别用固定的慢和快时间常数低通滤波的估计量之间的差进行估计。
图12示出了根据本发明的助听器的实施例,包括位于用户耳后的BTE部分和位于用户耳道中的ITE部分。
图13A示出了根据本发明的助听器的第一实施例的框图。
图13B示出了根据本发明的助听器的第二实施例的框图。
图14示出了根据本发明实施例的用于提供助听器的合成波束成形信号YBF的自适应波束形成器的运行方法的流程图。
图15A、15B和15C示出了根据本发明的可变时间常数协方差估计器的一般实施例。
图15A示意性地示出了根据本发明的协方差平滑单元,包括预平滑单元(PreS)和可变平滑单元(VarS)。
图15B示出了预平滑单元的实施例。
图15C示出了可变平滑单元(VarS)的实施例,其提供协方差估计量
Figure BDA0003099286840000181
Figure BDA0003099286840000182
Figure BDA0003099286840000183
的自适应平滑。
图16A、16B、16C和16D示出了根据本发明的可变时间常数协方差估计器的一般实施例。
图16A示意性地示出了根据本发明的基于波束成形信号C1,C2的协方差平滑单元。
图16B示出了基于波束成形信号C1,C2的预平滑单元的实施例。
图16C示出了适于图16B的预平滑单元的可变平滑单元(VarS)的实施例。
图16D示意性地示出了根据本发明的基于平滑的协方差矩阵(<│C2│2>,<C1C2*>)确定β。
图17A示意性地示出了根据本发明的基于平滑的协方差矩阵确定β的第一实施例(对照图3)。
图17B示意性地示出了根据本发明的基于平滑的协方差矩阵和另外的平滑确定β的第二实施例(对照图7)。
图18示意性地示出了根据本发明的确定β的第三实施例。
通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出。对于本领域技术人员来说,基于下面的详细描述,本发明的其它实施方式将显而易见。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等(统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、及配置成执行本说明书中描述的多个不同功能的其它适当硬件。计算机程序应广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
图1和图2分别示出了双传声器波束形成器构造,用于在多个(K个)子频带提供空间滤波的(波束成形)信号Y(k),k=1,2,…,K。子频带信号X1(k),X2(k)由分析滤波器组(“滤波器组”)基于相应的(数字化)传声器信号提供。两个波束形成器C1(k)和C2(k)由相应的组合单元(相乘单元x和求和单元+)提供为输入信号的(复值)线性组合:
C1(k)=w11(k)·X1(k)+w12(k)·X2(k)
C2(k)=w21(k)·X1(k)+w22(k)·X2(k)
图1示出了自适应波束形成器构造,其中在第k个频道Y(k)中的自适应波束形成器通过将缩放自适应因子β(k)的目标抵消波束形成器C2(k)从全向波束形成器C1(k)减去而产生。换言之,Y(k)=C1(k)-β·C2(k)。两个波束形成器C1,C2优选直交,使得[w11w12][w21w22]H=0。
图2示出了与图1中所示类似的自适应波束形成器,但自适应波束图Y(k)通过将缩放自适应因子β(k)的目标抵消波束形成器C2(k)从另一固定波束图C1(k)减去而产生。而图1中的C1(k)为全向波束图,在此的波束图为朝向C2(k)的反方向具有零值的波束形成器,如图2中与C1(k)和C2(k)附图标记相邻的心脏形符号所示。也可使用其它固定波束图C1(k)和C2(k)。
给定频带k的自适应波束图Y(k)通过线性组合两个波束形成器C1(k)和C2(k)获得。C1(k)和C2(k)为传声器信号的不同(可能固定的)线性组合。
波束图例如可以是全向延迟和求和波束形成器C1(k)及具有指向目标方向的零向的延迟和求减波束形成器C2(k)(目标抵消波束形成器)的组合,如图1中所示;或者其可以是两个延迟和求减波束形成器,如图2中所示,其中一个C1(k)朝向目标方向具有最大增益,而另一个波束形成器为目标抵消波束形成器。也可应用波束形成器的其它组合。优选地,波束形成器应直交,即[w11w12][w21w22]H=0。自适应波束图通过使目标抵消波束形成器C2(k)缩放复值、随频率而变的自适应缩放因子β(k)并将其从C1(k)减去得到,即
Y(k)=C1(k)-β(k)C2(k)
波束形成器适于在传声器信号由点-噪声目标声源(存在附加噪声源)组成的情形下最佳地工作。在该情形下,缩放因子β(k)适于在来自目标方向的声音不被改变的约束条件下使噪声最小化。对于每一频带k,自适应因子β(k)可以不同的方式得到。解可在下面的闭合式中得到:
Figure BDA0003099286840000201
其中*指复共轭,<·>指统计预期算子,其可在时间平均的实施中逼近。作为备选,自适应因子可通过LMS或NLMS等式更新:
Figure BDA0003099286840000202
在下面,我们省略频道指数k。在(1)中,自适应因子β通过跨输入数据求平均进行估计。跨数据求平均的简单方法是通过对数据低通滤波,如图3中所示。
图3示出了怎样从等式(1)计算自适应因子β的框图,其在分子中包含
Figure BDA0003099286840000211
的平均值及在分母中包含
Figure BDA0003099286840000212
的平均值。我们通过对两项低通滤波获得平均值。由于
Figure BDA0003099286840000213
通常为复数,我们对
Figure BDA0003099286840000214
的实部和虚部分开地低通滤波。在实施例中,我们对
Figure BDA0003099286840000215
的量值和相位分开地低通滤波。合成自适应因子β通过实施等式(1)的代数函数的适当功能单元从输入波束形成器信号C1和C2确定,即从输入C2提供C2 *的复共轭单元conj、从输入C1和C2 *提供复合乘C1·C2 *的相乘单元x。量值平方单元|·|2提供输入C2的量值平方|C2|2。复值和实值子频带信号C1·C2 *和|C2|2分别由低通滤波单元LP进行低通滤波以提供等式(1)的β表达式中的分子和分母(在LP滤波器之前或之后(在此为之后),常数c通过求和单元+被加到|C2|2的实值以提供分母的表达式。合成自适应因子β由相除单元·/·基于输入num(分子)和den(分母)提供)。
前述低通滤波器LP例如可通过一阶IIR滤波器实施,如图4中所示。IIR滤波器由求和单元+、延迟元素z-1和相乘单元x实施以引入(可能可变的)平滑元素。图4示出了一阶IIR滤波器,其中平滑性质受系数coef控制。该系数可取0和1之间的值。接近0的系数应用具有长时间常数的平均,而接近1的系数应用短时间常数。换言之,如果系数接近1,仅应用小量平滑,而接近0的系数将更高量的平滑应用于输入信号。通过一阶IIR滤波器求平均具有指数式衰减。由于我们对输入(|C2|2和C* 2C1的实部及虚部)应用平滑,如果输入电平突然从高电平变为低电平,自适应因子β的收敛将迟钝。
这在图5A和5B中示出,其示出了从较高到较低的电平(“电平”)变化和根据LP滤波器的平滑系数平滑的估计量的相应时间相干性(“时间”)。图5A示出了输入信号|C2|2的平滑的例子,其中长时间常数将提供稳定的估计量,但如果电平突然从高电平变到低电平,收敛时间将慢。通过选择更小的时间常数,可实现更快的收敛,但估计量也将具有更高的差异。这在图5B中示出,其示出了输入信号|C2|2的平滑的例子,其中时间常数短并在电平变化时提供快速收敛,但总估计量具有较高的差异。
我们提出不同的方法来克服该问题。简单的延伸是在低通滤波器中使能不同的增高和释放常数。这样的低通滤波器在图6中示出。
图6示出了图4中给出的低通滤波器可怎样用不同的增高和释放系数实施的框图。不同的时间常数根据输入是递增(增高)还是递减(释放)进行应用。藉此,在突然电平变化时可能快速调整。然而,不同的增高和释放时间将导致偏差的估计量。
图7示出了怎样从等式(1)计算自适应因子β的示例性框图,但相较于图3,不仅对
Figure BDA0003099286840000221
和|C2|2低通滤波,而且对计算的自适应因子β低通滤波。其具有在
Figure BDA0003099286840000222
和|C2|2的平均值对电平降低敏感的同时β的低通滤波对电平降低不敏感。因而我们可将平滑的部分从
Figure BDA0003099286840000223
和|C2|2移到β。藉此,可通过应用更小的时间常数允许更大的
Figure BDA0003099286840000224
和<|C2|2>估计量差异。因而,在输入电平突然减小的情形下,获得更快的收敛。在图7中,我们提出不仅平滑用于β估计的分子和分母,而且平滑估计的β值,即
Figure BDA0003099286840000225
平滑β估计量的优点在于该估计量对输入电平的突然降低不太敏感。因此,我们可将更短的时间常数应用于(1)的分子和分母中使用的低通滤波器。藉此,在突然减小电平的情形下可更快地适应。通过后平滑β,我们对付增大的估计差异。
另一选择是应用自适应平滑系数,其在检测到突然的输入电平变化时变化。这样的低通滤波器的实施例在图8A和8B中示出。
图8A示出了改进的低通滤波器的第一示例性框图。该低通滤波器能够基于通过具有(如固定的)快时间常数的低通滤波器(IIR滤波器,参见图4)滤波的输入信号(输入)和通过具有(可变的)较慢时间常数的低通滤波器滤波的输入信号之间的差改变其时间常数(或等效的系数coef)。如果两个低通滤波器之间的所述差ΔInput高,表明输入电平的突然变化。输入电平的该变化将使具有慢时间常数的低通滤波器的时间常数变为更快的时间常数(功能模块fcn中所示的映射函数指明随着输入信号差ΔInput的增加而从慢到快适应的变化(较大到较小的时间常数))。藉此,当发生突然输入电平变化时,低通滤波器将能够更快的适应。如果仅看到输入电平的小变化,则应用较慢的时间常数。通过由具有不同时间常数的低通滤波器对输入信号滤波(参见LP滤波的输入),将能够检测到电平何时突然变化。基于电平差,可通过非线性函数(图8A中的fcn)调节系数。在实施例中,如果信号之间的绝对差大于给定阈值,非线性函数在慢和快时间常数之间变化。无论何时检测到突然电平变化,平滑系数从慢时间常数变为更快的时间常数,藉此使能快速收敛直到达到新的输入电平为止。当估计量已收敛时,时间常数返回到其较慢的值。藉此,不仅获得快速收敛,而且在输入电平不波动时使估计量的差异较小。为使该功能单元能对正及负电平变化起作用(及直接对复合信号起作用),该功能单元包括先于ΔInput到时间常数映射函数的量值单元|·|。
图8B示出了改进的低通滤波器的第二示例性框图。该实施例类似于图8A的实施例,但输入差信号在具有固定的快和慢平滑系数的两个已滤波信号基础上产生,及所得的已调整的平滑系数coef用于控制分开的、提供LP已滤波输入的IIR滤波器的平滑。
从图8A或8B中所示的低通滤波器所得的平滑估计量在图9中示出。当检测到输入电平变化时,时间常数被调整以从慢适应变为更快的收敛(相较于示出更慢收敛的虚线,参见图5A)。一旦该估计量已适应新电平,时间常数变回到较慢的值。藉此获得更快的收敛(相较于示出使用较慢时间常数收敛的虚线)。
图10示出了具有与图8A中所示类似的低通滤波器结构的改进的低通滤波器的示例性框图,但在图10中,自适应系数取决于|C2|2的电平变化。当对等式(1)的分子和分母低通滤波时,在分子和分母应用同样的时间常数很重要。在此,我们提出自适应系数取决于|C2|2的电平变化。在图10中,自适应时间常数用作慢低通滤波器的系数。
图11示出了具有与图10中所示类似的低通滤波器结构的改进的低通滤波器的示例性框图,但在图11的实施例中,自适应系数coef从|C2|2的两个分别用固定的慢和快时间常数低通滤波的估计量之间的差进行估计(参见图8B)。在图11中,具有固定的快和固定的慢时间常数的、分开的低通滤波器用于估计自适应系数。同样,其它因子可用于控制低通滤波器的系数。例如,话音活动检测器可用于暂停更新(通过将系数设为0)。在该情形下,自适应系数仅在语音停顿期间更新。
图12示出了根据本发明的助听器的实施例,包括位于用户耳后的BTE部分和位于用户耳道中的ITE部分。
图12示出了形成为耳内接收器式(RITE)助听器的示例性助听器HD,其包括适于位于耳廓后面的BTE部分(BTE)和适于位于用户耳道中并具有输出变换器(如扬声器/接收器,SPK)的部分(ITE)(例如图13A、13B例示的助听器HD)。BTE部分和ITE部分通过连接元件IC连接(如电连接)。在图12的助听器实施例中,BTE部分包括两个输入变换器MBTE1,MBTE2(在此为传声器),每一输入变换器提供表示来自环境的输入声音信号SBTE的电输入音频信号。在图12的场合,输入声音信号SBTE包括来自声源S的贡献,S例如足够远离用户(因而远离听力装置HD),使得其对声学信号SBTE的贡献处于声学远场中。图12的助听器还包括两个无线接收器WLR1,WLR2,用于提供相应的直接接收的辅助音频和/或信息信号。助听器HD还包括衬底SUB,其上安装多个功能上根据所涉及应用进行划分的电子元件(模拟、数字、无源元件等),但包括彼此连接并经电导体Wx连接到输入和输出单元的可配置的信号处理单元SPU、波束形成器滤波单元BFU和存储器单元MEM。所提及的功能单元(及其它元件)可根据所涉及的应用按电路和元件进行划分(例如为了大小、功耗、模拟-数字处理等),例如集成在一个或多个集成电路中,或者作为一个或多个集成电路和一个或多个分开的电子元件(如电感器、电容器等)的组合。可配置的信号处理单元SPU提供增强的音频信号(参见图13A、13B中的信号OUT),其用于呈现给用户。在图12的助听器装置实施例中,ITE部分包括扬声器(接收器)SPK形式的输出单元,用于将电信号OUT转换为声信号(提供或贡献于耳膜处的声信号SED)。在实施例中,ITE部分还包括包含输入变换器(如传声器)MITE的输入单元,用于将表示来自环境(包括来自声源S)的输入声音信号SITE的电输入音频信号提供在耳道处或耳道中。在另一实施例中,助听器可仅包括BTE传声器MBTE1,MBTE2。在另一实施例中,助听器可仅包括ITE传声器MITE。在又一实施例中,助听器可包括位于不同于耳道处的别处的输入单元IT3与位于BTE部分和/或ITE部分中的一个或多个输入单元结合。ITE部分还包括引导元件如圆顶DO,用于引导并将ITE部分定位在用户耳道中。
图12中例示的助听器HD为便携装置,及还包括用于对BTE部分和ITE部分的电子元件供电的电池BAT。
助听器HD包括定向传声器系统(波束形成器滤波单元BFU),适于增强佩戴助听器装置的用户的局部环境中的多个声源中的目标声源。在实施例中,该定向系统适于检测(如自适应检测)传声器信号的特定部分(如目标部分和/或噪声部分)源自哪一方向。在实施例中,波束形成器滤波单元适于从用户接口(如遥控器或智能电话)接收关于目前的目标方向的输入。存储器单元MEM例如可包括预定(或自适应确定)的复值、随频率而变的常数Wij,其定义预定(或自适应确定)的“固定”波束图(如全向、目标抵消等)连同定义波束成形信号YBF(例如参见图13A、13B)。
图12的助听器可构成或形成根据本发明的助听器和/或双耳助听器系统的一部分。
根据本发明的助听器HD可包括用户接口UI,例如如图12中所示实施在辅助装置AUX如遥控器中,例如实施为智能电话或其它便携(或固定不动的)电子装置中的APP。在图12的实施例中,用户接口UI的屏幕示出了平滑波束形成APP。控制或影响自适应波束形成的当前平滑的参数,在此为确定自适应波束形成器参数β时涉及的低通滤波器的快和慢平滑系数(参见结合图8A、8B和图10、11的描述),可经平滑波束形成APP(具有副标题“定向性、配置平滑参数”)进行控制。平滑参数“快系数”和“慢系数”可经相应的滑动块设定为最小值(0)和最大值(1)之间的值。当前设定的值(在此分别为0.8和0.2)被图示在跨越可配置的值范围的(灰色阴影)条上的滑动块位置处的屏幕上。这些系数也可示为得到的参数如时间常数或其它描述如“平静”或“好斗”。系数可从时间常数得到,即coef=1-exp(-1/(fs*τ)),其中fs为时间帧的采样率,τ为时间常数。屏幕底部的箭头使能变到APP的前一和后一屏,及两个箭头之间的圆点上的标签带出使能选择装置的其它APP或特征的菜单。
辅助装置和助听器适于使能经例如无线通信链路(参见图12中的虚线箭头WL2)将表示当前选择的方向(如果偏离预定方向(已经保存在助听器中))的数据传给助听器。通信链路WL2例如可基于远场通信,例如蓝牙或蓝牙低功率(或类似技术),通过助听器HD和辅助装置AUX中的适当天线和收发器电路实施,由助听器中的收发器单元WLR2指明。
图13A示出了根据本发明的助听器的第一实施例的框图。图13A的助听器例如可包括如图1、2中所示的双传声器波束形成器构造及用于(进一步)处理波束成形信号YBF并提供处理后的信号OUT的信号处理单元SPU。信号处理单元可配置成对波束成形信号应用随电平和频率而变的整形,例如以补偿用户的听力受损。处理后的信号OUT馈给输出单元以作为可感知为声音的信号呈现给用户。在图13A的实施例中,输出单元包括扬声器SPK,用于将处理后的信号OUT作为声音呈现给用户。助听器的从传声器到扬声器的正向通路可在时域工作。助听器还可包括用户接口UI和一个或多个检测器DET,从而使用户输入和检测器输入(例如来自图12中所示的用户接口)能由波束形成器滤波单元BFU接收。从而可提供所得自适应参数β的自适应功能。
图13B示出了根据本发明的助听器的第二实施例的框图。图13B的助听器功能上类似于图13A的助听器,也包括如图1、2中所示的双传声器波束形成器构造,但信号(时域输入信号IN1和IN2)由相应的分析滤波器组FBA1和FBA2分别提供为子频带信号IN1(k)和IN2(k),其中k=1,2,…,K。因此,用于(进一步)处理波束成形信号YBF(k)的处理单元SPU配置成在多个(K个)频带处理波束成形信号YBF(k)并提供处理后的(子频带)信号OU(k),k=1,2,…,K。信号处理单元可配置成对波束成形信号应用随电平和频率而变的整形,例如以补偿用户的听力受损(和/或富有挑战性的声环境)。处理后的频带信号OU(k)馈给合成滤波器组FBS,其用于将频带信号OU(k)转换为单一时域处理后的(输出)信号OUT,该信号馈给输出单元以作为可感知为声音的刺激呈现给用户。在图13B的实施例中,输出单元包括扬声器SPK,用于将处理后的信号OUT作为声音呈现给用户。助听器的从传声器MBTE1,MBTE2到扬声器SPK的正向通路(主要)在时频域(在K个子频带)工作。
图14示出了根据本发明实施例的用于提供助听器的合成波束成形信号YBF的自适应波束形成器的运行方法的流程图。
该方法配置成使适于在工作位置时位于用户耳朵处或耳朵中或耳后或者完全或部分植入在用户头部中的助听器运行。
该方法包括:
S1,将输入声音转换为第一电输入信号IN1和第二电输入信号IN2
S2,基于第一和第二电输入信号自适应提供合成波束成形信号YBF
S3,将表示第一波束图(C1)的第一组复值、随频率而变的加权参数W11(k),W12(k)保存在第一存储器中,其中k为频率指数,k=1,2,…,K;
将表示第二波束图(C2)的第二组复值、随频率而变的加权参数W21(k),W22(k)保存在第二存储器中;
其中,第一和第二组加权参数W11(k),W12(k)和W21(k),W22(k)分别预先确定及可能在助听器运行期间进行更新;
S4,提供表示自适应波束图(ABP)的自适应确定的自适应参数β(k),其配置成在来自目标方向的声音实质上不被改变的约束条件下尽可能多地衰减不想要的噪声;及
S5,基于第一和第二电输入信号IN1和IN2、第一和第二组复值随频率而变的加权参数W11(k),W12(k)和W21(k),W22(k)、及合成的复值随频率而变的自适应参数β(k)提供所述合成波束成形信号YBF,其中β(k)可确定为:
Figure BDA0003099286840000281
其中,*指复共轭,及<·>指统计预期算子,c为常数;
S6,随时间平滑复数表达式C2 *·C1和实数表达式|C2|2
用于准确的目标估计和跟踪的自适应协方差矩阵平滑方法
在本发明的另一方面,自适应平滑协方差矩阵的方法概述如下。该方案的具体用途是用于(自适应)估计来自目标声源的声音到达人(如助听器例如根据本发明的助听器的用户)的方向。
该方法例示为根据本发明的用于自适应参数β(k)的平滑的备选方案(参见图16A-16D和17A、17B)。
信号模型
我们考虑进入由M个传声器组成的传声器阵列的第i个传声器的信号x的下面的信号模型:
xi(n)=si(n)+vi(n) (1)
其中s为目标信号,v为噪声信号,及n指时间样本指数。对应的向量记法为
x(n)=s(n)+v(n) (2)
其中x(n)=[x1(n);x2(n),…,xM(n)]T。在下面,我们考虑时频域中的信号模型。对应的模型因而由下式给出
X(k,m)=S(k,m)+V(k,m)(3)
其中k指频道指数及m指时间帧指数。同样,X(k,m)=[X1(k,m),X2(k,m),…,XM(k,m)]T。第i个传声器处的信号xi为目标信号si和噪声vi的线性混合。vi为来自不同方向的所有噪声贡献及传声器噪声的和。参考传声器处的目标信号sref由目标信号s与目标位置和参考传声器的位置之间的声传递函数h卷积给出。因而,其它传声器处的目标信号由参考传声器处的目标信号与传声器之间的相对传递函数d=[1,d2,…,dM]T卷积给出,即si=s*h*di。相对传递函数d取决于目标信号的位置。由于这通常是感兴趣的方向,我们将d称为视向量。在每一频道,因而我们定义参考传声器处的目标功率谱密度
Figure BDA0003099286840000291
Figure BDA0003099286840000292
其中<·>指预期值。同样,参考传声器处的噪声功率谱密度由下式给出
Figure BDA0003099286840000293
对于纯净信号s,第k个频道处的传声器间互谱协方差矩阵则由下式给出
Figure BDA0003099286840000294
其中H指厄米转置。我们注意到,MxM矩阵Cs(k,m)为秩为1的矩阵,因为Cs(k,m)的每一列正比于d(k,m)。类似地,到达传声器阵列的噪声信号的传声器间互功率谱密度矩阵由下式给出
Figure BDA0003099286840000295
其中Γ(k,m0)为噪声的MxM噪声协方差矩阵,在过去的一些时间测得(帧指数m0)。由于对每一频道指数的所有运算均一样,在下面,只要可能,为了记法方便,我们均跳过频率指数k。同样,只要可能,我们跳过时间帧指数m。有噪声信号的传声器间互功率谱密度矩阵则由下式给出
C=Cs+Cv (8)
Figure BDA0003099286840000296
其中目标和噪声信号假定不相关。描述目标信号的第一项Cs为秩为1的矩阵的事实意味着语音信号的有益部分(即目标部分)假定相干/有方向。语音信号的无益部分(例如因后期混响引起的信号分量,其通常不相干,即从许多同时存在的方向到达)由第二项捕获。
协方差矩阵估计
在只有两个传声器的情形下,视向量估计量可基于有噪声输入协方差矩阵和仅噪声协方差矩阵的估计量有效率地得到。我们将第一传声器选择为参考传声器。有噪声协方差矩阵估计量由下式给出
Figure BDA0003099286840000301
其中*指复共轭。有噪声协方差矩阵的每一元素通过对输入信号的外积XXH低通滤波进行估计。我们通过具有平滑因子α∈[0;1]的一阶IIR低通滤波器估计每一元素,即
Figure BDA0003099286840000302
因而,我们需要低通滤波四个不同的值(两个实值和一个复值),即
Figure BDA0003099286840000303
Figure BDA0003099286840000304
我们不需要
Figure BDA0003099286840000305
因为
Figure BDA0003099286840000306
假定目标位置在语音停顿时不明显改变,即有利于使用给出准确估计量的慢时间常数保持来自先前语音时间段的目标信息。这意味着
Figure BDA0003099286840000307
不总是用同一时间常数更新及在语音停顿时不收敛到
Figure BDA0003099286840000308
通常是这样。在伴随语音不存在的长时间段中,该估计量将使用接近1的平滑因子(非常慢地)朝向Cno收敛。协方差矩阵Cno可表示目标DOA为零度(前向)的情形,使得系统在语音不存在时使前向优先。
以类似的方式,我们估计噪声协方差矩阵中的元素,在该情形下
Figure BDA0003099286840000309
噪声协方差矩阵在仅存在噪声时更新。目标是否存在可通过基于调制的话音活动检测器确定。应注意,“目标存在”(参见图15C)不必然与“仅噪声”的反义相同。控制更新的VAD指示器可从瞬间SNR或者调制指数估计量的不同阈值得到。
自适应平滑
视向量估计的性能高度取决于平滑因子α的选择,其控制
Figure BDA00030992868400003010
的更新速率。当α接近零时,准确的估计量可在空间上固定不动的情形下获得。当α接近1时,估计器将能够追踪快速空间变化,例如当追踪对话情形的两个讲话者时。理想地,我们想要获得准确的估计量及快速追踪能力,这在平滑因子方面自相矛盾因而需要找到好的平衡。为了同时获得空间上固定不动情形下的准确估计量及快速追踪能力,提出自适应平滑方案。
为了控制可变平滑因子,归一化的协方差
Figure BDA0003099286840000311
可被观察,其为目标DOA的变化的指示器(其中
Figure BDA0003099286840000312
和Cx12为复数)。
在实践实施如便携装置例如助听器中,我们首选避免除法及减少计算数量,因而我们提出下面的对数归一化协方差测度
Figure BDA0003099286840000313
计算(对数)归一化协方差测度的两个实例,即快速实例
Figure BDA00030992868400003118
和具有可变更新速率的实例
Figure BDA0003099286840000314
快速实例
Figure BDA0003099286840000315
基于快速方差估计量
Figure BDA0003099286840000316
其中
Figure BDA0003099286840000317
为快速时间常数平滑因子,及对应的快速协方差估计量
Figure BDA0003099286840000318
根据
Figure BDA0003099286840000319
对于具有可变更新速率的实例
Figure BDA00030992868400003110
的类似表达式,基于使用可变平滑因子
Figure BDA00030992868400003111
的等效估计器
Figure BDA00030992868400003112
Figure BDA00030992868400003113
可写为
Figure BDA00030992868400003114
其中
Figure BDA00030992868400003115
为快速时间常数平滑因子,及对应的快速协方差估计量
Figure BDA00030992868400003116
根据
Figure BDA00030992868400003117
可变估计器的平滑因子
Figure BDA0003099286840000321
在可变估计器的该归一化协方差测度与可变估计器的归一化协方差测度偏离太多时变到快速时间常数平滑因子,否则平滑因子为慢时间常数平滑因子,即
Figure BDA0003099286840000322
其中α0为慢时间常数平滑因子,即
Figure BDA0003099286840000323
及∈为常数。应注意,跨频带k使用同样的平滑因子
Figure BDA0003099286840000324
图15A、15B和15C示出了根据本发明的可变时间常数协方差估计器的一般实施例。
图15A示意性地示出了根据本发明的协方差平滑单元。该协方差单元包括预平滑单元PreS和可变平滑单元VarS。预平滑单元PreS在K个频带进行瞬间协方差矩阵C(m)=X(m)X(m)H(例如表示有噪声输入信号X的协方差/方差)的随时间初始平滑并提供预平滑的协方差矩阵估计量X11,X12和X22(<C>pre=<X(m)X(m)H>,其中<·>指随时间LP平滑)。可变平滑单元VarS根据声环境的变化基于自适应确定的增高和释放时间进行信号X11,X12和X22的可变平滑,并提供平滑的协方差估计量
Figure BDA0003099286840000325
Figure BDA0003099286840000326
预平滑单元PreS进行随时间初始平滑(由用于提供输入信号Xi(k,m)的量值平方的ABS平方单元│·│2及随后的由低通滤波器LP提供的低通滤波图示)以提供预平滑的协方差估计量Cx11,Cx12和Cx22,如图15B中所示。X1和X2例如可表示助听器的第一(如前)和第二(如后)(通常有噪声的)传声器信号。元素Cx11和Cx22表示方差(如输入信号振幅的变化),而元素Cx12表示协方差(如表示相位(因而及方向)(和振幅)的变化)。
图15C示出了可变平滑单元VarS的实施例,其提供协方差估计量
Figure BDA0003099286840000327
Figure BDA0003099286840000328
Figure BDA0003099286840000329
的自适应平滑,如上所述。
“目标存在”输入例如为来自话音活动检测器的控制输入。在实施例中,“目标存在”输入(参见图15A中的信号TP)为在给定时间帧或时间段存在语音的二元估计量(如1或0)。在实施例中,“目标存在”输入表示在当前输入信号(如传声器信号之一,例如X1(k,m))中存在(或不存在)语音的概率。在后一情形下,“目标存在”输入可取0和1之间的区间中的值。“目标存在”输入例如可以是来自话音活动检测器(参见图15C中的VAD)的输出,例如如本领域已知的。
快Rel Coef、快Atk Coref、慢Rel Coef和慢Atk Coef分别为固定的(例如在该步骤使用之前确定)快和慢增高和释放时间。通常,快增高和释放时间短于慢增高和释放时间。在实施例中,时间常数(参见图15A中的信号TC)保存在助听器的存储器中(例如参见图15A中的MEM)。在实施例中,时间常数可在助听器使用期间更新。
应注意,y=log(max(Im{x12}+1,0))-log(x11)的计算的目标(参见图15C右部的形成确定平滑因子
Figure BDA0003099286840000331
的一部分的两个实例)在于检测声学声音场景的变化,例如目标方向的突然变化(例如因商讨/对话的当前讲话者的切换引起)。图15C中的示例性实施为了计算简单(这在具有有限功率预算的听力装置中很重要)进行选择,如通过转换到对数域提供的。数学上更正确(但计算上更复杂)的实施是计算y=x12/x11(如图3和图7(及图17A、17B)图示的的确定例示的)。
图15C中使用的自适应低通滤波器例如可如图4中所示实施,其中coef为平滑因子
Figure BDA0003099286840000332
(或
Figure BDA0003099286840000333
)。
图16A、16B和16C示出了如上概述的可变时间常数协方差估计器的特定实施例。图16A、16B和16C实施例与图15A、15B和15C的一般实施例的差别在于输入为通过波束图C1和C2形成的波束成形信号(代替直接的传声器信号x)。图16D示意性地示出了根据本发明的基于平滑的协方差矩阵(<│C2│2>,<C1C2*>)确定β(如图17A、17B中例示的)。
上面的方案例如可适合自适应估计在不同位置(如在水平面中相对于佩戴一个或多个根据本发明的助听器的用户的不同角度)处交替活动的声源的到达方向。
图17A对应于图3,及图17B对应于图7。但在图17A和17B中,根据本发明的(及如图16A-16C中图示的)可变时间常数协方差估计器用于自适应平滑β。
图18包括预平滑单元PreS、可变平滑单元VarS和计算单元Beta,也在图17A和17B中示出,但在备选实施例中。
图18示出了根据本发明的可怎样从(如平滑的)噪声协方差矩阵<Cv>确定β(在语音停顿期间,VAD=0),与计算波束形成器相反。LP模块可以时变(如自适应),例如结合图15C和图16C所示。代替示出所有相乘,在图18中示出了用于确定计算β的分子num和分母den的两个矩阵相乘模块(分别为NUMC和DENC)。该实施的优点在于波束形成器系数可被修改而不会影响平滑。缺点在于该实施需要更多的乘法和另外的LP滤波器。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的和/或权利要求中限定的装置的结构特征可与本发明方法的步骤结合。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或“耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非另行指明,在此公开的任何方法的步骤不精确限于相应说明的顺序。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一般原理可应用于其他方面。
权利要求不限于在此所示的各个方面,而是包含与权利要求语言一致的全部范围,其中除非明确指出,以单数形式提及的元件不意指“一个及只有一个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
因而,本发明的范围应依据权利要求进行判断。

Claims (15)

1.一种听力装置,包括:
第一和第二传声器(MBTE1,MBTE2),用于将输入声音分别转换为第一和第二电输入信号(IN1,IN2);
自适应波束形成器滤波单元(BFU),配置成基于所述第一和第二电输入信号(IN1,IN2)以及所述第一和第二电输入信号(IN1,IN2)的协方差矩阵自适应提供合成的波束成形信号(YBF),所述自适应波束形成器滤波单元(BFU)包括:
平滑单元,配置成根据所述第一和第二电输入信号(IN1,IN2)的协方差随时间的变化,随着用于平滑的时间常数的自适应变化而自适应平滑所述协方差矩阵的元素,提供自适应平滑的协方差矩阵;
其中,所述自适应波束形成器滤波单元(BFU)配置成利用所述自适应平滑的协方差矩阵确定所述波束成形信号(YBF)。
2.根据权利要求1所述的听力装置,其中所述时间常数对于低于第一阈值的协方差变化具有第一值及对于高于第二阈值的协方差变化具有第二值,其中时间常数的第一值大于相应的第二值,而第一阈值小于或等于第二阈值。
3.根据权利要求1所述的听力装置,包括相应的时间到时频转换单元,用于分别按时频表示X1(k,m)和X2(k,m)提供第一电输入信号X1和第二电输入信号X2,其中k为频率指数,k=1,…,K,m为时间帧指数。
4.根据权利要求1所述的听力装置,其中所述第一和第二电输入信号(IN1,IN2)的协方差随时间的变化与跨一个或多个时间帧的变化有关。
5.根据权利要求1所述的听力装置,其中所述时间常数分别表示增高和释放时间常数。
6.根据权利要求1所述的听力装置,其中所述平滑单元包括实施为具有固定时间常数的IIR滤波器及具有可配置时间常数的IIR滤波器的低通滤波器(LP)。
7.根据权利要求6所述的听力装置,其中所述平滑单元配置成使得平滑时间常数取0到1之间的值,其中接近0的系数应用具有第一时间常数的平均,而接近1的系数应用第二时间常数,其中所述第一时间常数大于所述第二时间常数。
8.根据权利要求6所述的听力装置,其中所述平滑单元包括多个一阶IIR滤波器。
9.根据权利要求6所述的听力装置,其中所述IIR滤波器为一阶IIR滤波器。
10.根据权利要求1所述的听力装置,其中所述自适应波束形成器滤波单元(BFU)配置成基于自适应平滑的有噪声输入协方差矩阵和自适应平滑的仅噪声协方差矩阵的估计量估计视向量。
11.根据权利要求1所述的听力装置,配置成自适应估计从目标声源到佩戴听力装置的人的声音的到达方向。
12.根据权利要求1所述的听力装置,其中所述平滑单元包括提供预平滑的协方差估计量(Cx11,Cx12,Cx22)的预平滑单元(PreS)和提供自适应平滑的协方差估计量
Figure FDA0003099286830000021
的可变平滑单元(VarS)。
13.听力装置的运行方法,所述方法包括:
提供第一和第二电输入信号(IN1,IN2);
利用所述电输入信号的协方差矩阵的自适应平滑基于所述第一和第二电输入信号(IN1,IN2)自适应提供波束成形信号(YBF),所述自适应平滑包括根据所述第一和第二电输入信号的协方差随时间的变化自适应改变用于平滑的时间常数。
14.根据权利要求13所述的方法,其中所述时间常数对于低于第一阈值的协方差变化具有第一值及对于高于第二阈值的协方差变化具有第二值,其中时间常数的第一值大于相应的第二值,而第一阈值小于或等于第二阈值。
15.一种数据处理系统,包括处理器和计算机程序,当所述计算机程序由所述处理器执行时实现根据权利要求13所述的方法。
CN202110619673.5A 2016-05-30 2017-05-31 听力装置及其运行方法和相应数据处理系统 Active CN113453134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110619673.5A CN113453134B (zh) 2016-05-30 2017-05-31 听力装置及其运行方法和相应数据处理系统

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP16172042.0 2016-05-30
EP16172042 2016-05-30
CN202110619673.5A CN113453134B (zh) 2016-05-30 2017-05-31 听力装置及其运行方法和相应数据处理系统
CN201710400520.5A CN107454538B (zh) 2016-05-30 2017-05-31 包括含有平滑单元的波束形成器滤波单元的助听器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201710400520.5A Division CN107454538B (zh) 2016-05-30 2017-05-31 包括含有平滑单元的波束形成器滤波单元的助听器

Publications (2)

Publication Number Publication Date
CN113453134A true CN113453134A (zh) 2021-09-28
CN113453134B CN113453134B (zh) 2023-06-06

Family

ID=56092822

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110619673.5A Active CN113453134B (zh) 2016-05-30 2017-05-31 听力装置及其运行方法和相应数据处理系统
CN201710400520.5A Active CN107454538B (zh) 2016-05-30 2017-05-31 包括含有平滑单元的波束形成器滤波单元的助听器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201710400520.5A Active CN107454538B (zh) 2016-05-30 2017-05-31 包括含有平滑单元的波束形成器滤波单元的助听器

Country Status (4)

Country Link
US (2) US10231062B2 (zh)
EP (2) EP3253075B1 (zh)
CN (2) CN113453134B (zh)
DK (2) DK3509325T3 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
DK3413589T3 (da) 2017-06-09 2023-01-09 Oticon As Mikrofonsystem og høreanordning der omfatter et mikrofonsystem
DK3525488T3 (da) 2018-02-09 2020-11-30 Oticon As Høreanordning, der omfatter en stråleformerfiltreringsenhed til reduktion af feedback
JP6845373B2 (ja) * 2018-02-23 2021-03-17 日本電信電話株式会社 信号分析装置、信号分析方法及び信号分析プログラム
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
DK3588981T3 (da) * 2018-06-22 2022-01-10 Oticon As Høreanordning der omfatter en akustisk hændelsesdetektor
EP3837861B1 (en) * 2018-08-15 2023-10-04 Widex A/S Method of operating a hearing aid system and a hearing aid system
EP3854108A1 (en) 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
EP3629602A1 (en) * 2018-09-27 2020-04-01 Oticon A/s A hearing device and a hearing system comprising a multitude of adaptive two channel beamformers
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN113841419A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
EP3942845A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11445294B2 (en) 2019-05-23 2022-09-13 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
JP2022535229A (ja) 2019-05-31 2022-08-05 シュアー アクイジッション ホールディングス インコーポレイテッド 音声およびノイズアクティビティ検出と統合された低レイテンシオートミキサー
EP3764660B1 (en) * 2019-07-10 2023-08-30 Analog Devices International Unlimited Company Signal processing methods and systems for adaptive beam forming
CN114467312A (zh) 2019-08-23 2022-05-10 舒尔获得控股公司 具有改进方向性的二维麦克风阵列
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
US11330366B2 (en) 2020-04-22 2022-05-10 Oticon A/S Portable device comprising a directional system
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
EP4007308A1 (en) 2020-11-27 2022-06-01 Oticon A/s A hearing aid system comprising a database of acoustic transfer functions
EP4040806A3 (en) * 2021-01-18 2022-12-21 Oticon A/s A hearing device comprising a noise reduction system
US11330378B1 (en) 2021-01-20 2022-05-10 Oticon A/S Hearing device comprising a recurrent neural network and a method of processing an audio signal
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统
EP4156711A1 (en) * 2021-09-28 2023-03-29 GN Audio A/S Audio device with dual beamforming
US20230308817A1 (en) 2022-03-25 2023-09-28 Oticon A/S Hearing system comprising a hearing aid and an external processing device
EP4287646A1 (en) 2022-05-31 2023-12-06 Oticon A/s A hearing aid or hearing aid system comprising a sound source localization estimator

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473701A (en) * 1993-11-05 1995-12-05 At&T Corp. Adaptive microphone array
US20030147538A1 (en) * 2002-02-05 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Reducing noise in audio systems
US20080049948A1 (en) * 2006-04-05 2008-02-28 Markus Christoph Sound system equalization
CN102474694A (zh) * 2009-07-15 2012-05-23 唯听助听器公司 在助听器系统中自适应地抑制风噪声的方法和处理单元以及助听器系统
CN103098132A (zh) * 2010-08-25 2013-05-08 旭化成株式会社 声源分离装置、声源分离方法、以及程序
US20140126745A1 (en) * 2012-02-08 2014-05-08 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651071A (en) * 1993-09-17 1997-07-22 Audiologic, Inc. Noise reduction system for binaural hearing aid
WO2001097558A2 (en) * 2000-06-13 2001-12-20 Gn Resound Corporation Fixed polar-pattern-based adaptive directionality systems
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US7970123B2 (en) * 2005-10-20 2011-06-28 Mitel Networks Corporation Adaptive coupling equalization in beamforming-based communication systems
EP1994788B1 (en) 2006-03-10 2014-05-07 MH Acoustics, LLC Noise-reducing directional microphone array
CN102809742B (zh) * 2011-06-01 2015-03-18 杜比实验室特许公司 声源定位设备和方法
CN102499712B (zh) * 2011-09-30 2014-07-23 重庆大学 一种基于特征空间的前后向自适应波束形成方法
CN102970638B (zh) * 2011-11-25 2016-01-27 斯凯普公司 处理信号
EP3462452A1 (en) * 2012-08-24 2019-04-03 Oticon A/s Noise estimation for use with noise reduction and echo cancellation in personal communication
WO2014046916A1 (en) * 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
EP3057340B1 (en) * 2015-02-13 2019-05-22 Oticon A/s A partner microphone unit and a hearing system comprising a partner microphone unit
CN105044706B (zh) * 2015-06-18 2018-06-29 中国科学院声学研究所 一种自适应波束形成方法
US9980055B2 (en) * 2015-10-12 2018-05-22 Oticon A/S Hearing device and a hearing system configured to localize a sound source
DK3236672T3 (da) * 2016-04-08 2019-10-28 Oticon As Høreanordning, der omfatter en stråleformerfiltreringsenhed

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473701A (en) * 1993-11-05 1995-12-05 At&T Corp. Adaptive microphone array
US20030147538A1 (en) * 2002-02-05 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Reducing noise in audio systems
US20080049948A1 (en) * 2006-04-05 2008-02-28 Markus Christoph Sound system equalization
CN102474694A (zh) * 2009-07-15 2012-05-23 唯听助听器公司 在助听器系统中自适应地抑制风噪声的方法和处理单元以及助听器系统
CN103098132A (zh) * 2010-08-25 2013-05-08 旭化成株式会社 声源分离装置、声源分离方法、以及程序
US20140126745A1 (en) * 2012-02-08 2014-05-08 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals

Also Published As

Publication number Publication date
US10231062B2 (en) 2019-03-12
CN113453134B (zh) 2023-06-06
DK3509325T3 (da) 2021-03-22
EP3253075B1 (en) 2019-03-20
DK3253075T3 (en) 2019-06-11
EP3509325A2 (en) 2019-07-10
US20170347206A1 (en) 2017-11-30
US11109163B2 (en) 2021-08-31
EP3509325A3 (en) 2019-11-06
CN107454538A (zh) 2017-12-08
US20190158965A1 (en) 2019-05-23
CN107454538B (zh) 2021-06-25
EP3253075A1 (en) 2017-12-06
EP3509325B1 (en) 2021-01-27

Similar Documents

Publication Publication Date Title
CN107454538B (zh) 包括含有平滑单元的波束形成器滤波单元的助听器
CN107484080B (zh) 音频处理装置及用于估计声音信号的信噪比的方法
CN107360527B (zh) 包括波束形成器滤波单元的听力装置
US10631102B2 (en) Microphone system and a hearing device comprising a microphone system
EP2916321B1 (en) Processing of a noisy audio signal to estimate target and noise spectral variances
US10861478B2 (en) Audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal
CN107872762B (zh) 话音活动检测单元及包括话音活动检测单元的听力装置
CN110035367B (zh) 反馈检测器及包括反馈检测器的听力装置
CN109660928B (zh) 包括用于影响处理算法的语音可懂度估计器的听力装置
CN107046668B (zh) 单耳语音可懂度预测单元、助听器及双耳听力系统
US10433076B2 (en) Audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal
CN111432318B (zh) 包括直接声音补偿的听力装置
CN110740412A (zh) 包括语音存在概率估计器的听力装置
CN112492434A (zh) 包括降噪系统的听力装置
US11483663B2 (en) Audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal
CN114697846A (zh) 包括反馈控制系统的助听器
EP4199541A1 (en) A hearing device comprising a low complexity beamformer
CN115278494A (zh) 包括耳内输入变换器的听力装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant