CN108235211A - 包括动态压缩放大系统的听力装置及其运行方法 - Google Patents
包括动态压缩放大系统的听力装置及其运行方法 Download PDFInfo
- Publication number
- CN108235211A CN108235211A CN201711415505.4A CN201711415505A CN108235211A CN 108235211 A CN108235211 A CN 108235211A CN 201711415505 A CN201711415505 A CN 201711415505A CN 108235211 A CN108235211 A CN 108235211A
- Authority
- CN
- China
- Prior art keywords
- signal
- snr
- level
- noise
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006835 compression Effects 0.000 title claims abstract description 142
- 238000007906 compression Methods 0.000 title claims abstract description 142
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 87
- 230000003321 amplification Effects 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000004048 modification Effects 0.000 claims abstract description 53
- 238000012986 modification Methods 0.000 claims abstract description 53
- 238000012805 post-processing Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims description 51
- 230000000694 effects Effects 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 6
- 230000000638 stimulation Effects 0.000 claims description 5
- 230000007774 longterm Effects 0.000 description 39
- 230000006870 function Effects 0.000 description 37
- 230000008859 change Effects 0.000 description 34
- 238000001228 spectrum Methods 0.000 description 30
- 239000003638 chemical reducing agent Substances 0.000 description 28
- 238000013507 mapping Methods 0.000 description 27
- 230000009467 reduction Effects 0.000 description 23
- 239000003775 serotonin noradrenalin reuptake inhibitor Substances 0.000 description 23
- 230000002123 temporal effect Effects 0.000 description 21
- 230000005236 sound signal Effects 0.000 description 18
- 238000012360 testing method Methods 0.000 description 17
- 230000005611 electricity Effects 0.000 description 14
- 210000004027 cell Anatomy 0.000 description 13
- 230000009021 linear effect Effects 0.000 description 13
- 238000012935 Averaging Methods 0.000 description 12
- 102100031145 Probable low affinity copper uptake protein 2 Human genes 0.000 description 12
- 101710095010 Probable low affinity copper uptake protein 2 Proteins 0.000 description 12
- 230000004807 localization Effects 0.000 description 12
- 102100031577 High affinity copper uptake protein 1 Human genes 0.000 description 11
- 101710196315 High affinity copper uptake protein 1 Proteins 0.000 description 11
- 230000015556 catabolic process Effects 0.000 description 11
- 238000006731 degradation reaction Methods 0.000 description 11
- 238000013461 design Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 101001063878 Homo sapiens Leukemia-associated protein 1 Proteins 0.000 description 8
- 101000934341 Homo sapiens T-cell surface glycoprotein CD5 Proteins 0.000 description 8
- 102100030893 Leukemia-associated protein 1 Human genes 0.000 description 8
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 8
- 230000005534 acoustic noise Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002708 enhancing effect Effects 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000010010 raising Methods 0.000 description 6
- 210000003477 cochlea Anatomy 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 101100162403 Arabidopsis thaliana ALEU gene Proteins 0.000 description 4
- 208000032041 Hearing impaired Diseases 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 210000003625 skull Anatomy 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- 230000010370 hearing loss Effects 0.000 description 3
- 231100000888 hearing loss Toxicity 0.000 description 3
- 208000016354 hearing loss disease Diseases 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 206010002953 Aphonia Diseases 0.000 description 2
- 101100129499 Arabidopsis thaliana MAX2 gene Proteins 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 210000003027 ear inner Anatomy 0.000 description 2
- 210000000959 ear middle Anatomy 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000010358 mechanical oscillation Effects 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000005424 photoluminescence Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 101100129496 Arabidopsis thaliana CYP711A1 gene Proteins 0.000 description 1
- 101100398248 Arabidopsis thaliana KIN10 gene Proteins 0.000 description 1
- 101100083446 Danio rerio plekhh1 gene Proteins 0.000 description 1
- 206010011891 Deafness neurosensory Diseases 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 210000003926 auditory cortex Anatomy 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000000860 cochlear nerve Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000001259 mesencephalon Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/35—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
- H04R25/356—Amplitude, e.g. amplitude shift or compression
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/41—Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了包括动态压缩放大系统的听力装置及其运行方法,其中所述听力装置包括输入单元、输出单元及动态压缩放大系统,该系统包括:电平估计器单元,用于提供所述电输入信号的电平估计量;电平后处理单元,用于根据第一控制信号提供所述电输入信号的修改的电平估计量;电平压缩单元,用于根据修改的电平估计量及表示用户的听觉能力的听力数据提供压缩放大增益;增益后处理单元,用于根据第二控制信号提供修改的压缩放大增益;控制单元,配置成分析所述电输入信号及提供所述电输入信号的分类,及基于所述分类提供第一和第二控制信号;及所述听力装置还包括正向增益单元,用于将修改的压缩放大增益应用于所述电输入信号或者其处理后的版本。
Description
技术领域
本申请涉及听力装置如助听器领域。
背景技术
通过在保持对较大声信号的舒适性的同时恢复轻声信号的可听度,压缩放大(CA)也被设计成克服因感觉神经听力损失引起的语音感知的降级(听力损失补偿,HLC)。
验配根据,或专用或一般(例如澳大利亚国家声学实验室的NAL-NL2,例如参见[Keidser et al.;2011])提供安静情形下的语音的目标增益和压缩比。其唯一的例外是西方大学已针对噪声情形下的语音产生DSLm[i/o]5.0(加拿大安大略的西方大学的合乎需要的感觉级(DSL)版本5.0,例如参见[Scollie et al.;2005])的目标,然而,迄今为止,这些目标尚未被助听器行业广泛采用。
总之,在目前的助听器(HA)中使用的典型CA方案针对安静情形下的语音进行设计和验配。它们独立于环境中存在的噪声量应用增益和压缩,这通常导致两个主要问题:
1、有噪声语言环境中的SNR降级;
2、纯噪声环境中的不合需要的放大。
接下来的几个小部分描述这两个问题及当前HA中通常实施的传统对策。
问题1:有噪声语言环境中的SNR降级
在有噪声语音情形下(正的但非无限的长期信噪比(SNR)),典型CA导致与静态压缩比、时域分辨率(即电平估计时间常数)和频率分辨率(即电平估计子频带的数量)成正比的长期SNR降级。[Naylor&Johannesson;2009]已表明,压缩系统的输出处的长期SNR可比输入处的长期SNR高或低。这取决于环境内的实际长期输入SNR、信号和噪声的调制特性、另外及系统的压缩特性(如电平估计时间常数、电平估计通道的数量和压缩比)之间的交互作用。具有听力损失的个体的SNR需求根据多个因素(参见[Naylor;2016])可变化很大,对于这个及其它问题的讨论而言。
应记住,使用降噪(NR)系统提高长期SNR将不会阻止典型CA引起的长期SNR降级:
-如果NR被放在CA前面,通过NR获得的长期SNR提高至少部分可能被CA抵消;
-如果NR被放在CA后面,CA引起的长期SNR降级可增加NR的压力。
问题2:纯噪声环境中的不合需要的噪声放大
在其中不存在语音的或多或少有噪声的环境中(SNR接近负无穷大),典型CA应用增益,就像输入信号为同一电平的纯净语音一样,
-这从终端用户的角度可能不合需要;及
-从噪声管理的角度(降噪(NR)系统通常嵌入在HA中)达不到预期目标;
--如果NR被放在CA前面,CA在噪声信号上施加与NR所施加的衰减成正比的增益。由NR实现的、希望的噪声衰减至少部分可能被CA抵消;
--如果NR被放在CA后面,由CA引起的噪声放大增加NR的压力。
传统的对策:环境特有CA配置
上面描述的两个问题在特定声音环境(音景)中出现。在噪声、不起眼/轻声噪声或者大声噪声情形下的语音环境中的听力损失补偿需要不同于安静情形下的语音环境的CA配置方法。传统上,针对上面的两个问题提出的解决方案已基于环境分类:所测量的音景被分类为预定类型的环境,通常
-安静情形下的语音;
-噪声情形下的语音;
-大声噪声;
-不起眼/轻声噪声。
对于每一环境,压缩方案的特性可被校正,对设置应用一些偏移(参见下面)。分类可使用下面的任何一个:
-硬决策:每一所测量的音景被描述为预定环境,针对其一些距离测度被最小化。应用对应的偏移设置;
-软决策:每一音景被描述为预定环境的组合。每一环境在组合中的权重与一些距离测度成反比。所采用的偏移设置通过使用相应的权重(如线性组合)一起“渐变”预定设置而产生。
使用环境特有CA配置减轻问题1
在典型CA方案中,长期SNR降级(问题1)通常通过应用下述步骤进行限制:
1、检测噪声情形下的语音环境;
2、应用对应的使CA线性化的偏移设置。
线性化通常可通过下述步骤实现:
1、减小压缩比;
2、增大电平估计时间常数;和/或
3、减少电平估计通道的数量。
然而,这样的解决方案具有严重的限制:
1、在上面列出的三种线性化方法中,只有前两种方法可容易地使用动态设计(可控的时间常数和/或压缩比)实现。基于动态变化数量的电平估计通道的设计十分复杂。
2、环境分类趋于非常慢地起作用以保证稳定且平滑的环境跟踪,即使使用“软决策”也是如此。因此,短期SNR变化(大声语音音素与轻声语音音素和短的语音停顿交替)不能被适当处理。在语音停顿期间的背景噪声在CA未被足够线性化时可能变得太大声(过度放大)。相反,如果CA被太强地线性化,大声语音可能变得令人不舒适地大声,而轻声语音可能听不见。
3、相当粗糙的环境聚类尤其在使用“硬决策”时可导致一些欠佳性态。
更一般地,通过直接遵行压缩比、电平估计时间常数和/或电平估计通道的数量的配置而限制长期SNR降级实际上降低了优化语音可听度恢复即听力损失补偿(HLC)所需要的自由度,而前述优化实际上是CA的首要目标。
应记住(如上面提及的),使用降噪(NR)系统提高长期SNR将不会阻止典型CA引起的长期SNR降级。
使用环境特有CA配置减轻问题2
在典型CA方案中,在纯噪声环境中的不合需要的放大(问题2)通常通过应用下述步骤进行限制:
1、检测不起眼/轻声噪声或者大声噪声环境;
2、应用对应的偏移设置以减小增益。
这样的负增益偏移(衰减偏移)通常可应用于在HA验配期间确定的CA特征曲线。
然而,这样的解决方案具有实践限制:环境分类引擎设计来解决问题1和2。为此,其被训练以区分至少3种环境:噪声、噪声情形下的语音、安静情形下的语音。假定问题1通过另一专用引擎解决,分类引擎可被使得更鲁棒,如果其仅必须像话音活动检测器(VAD)那样表现,即如果其必须区分存在语音和不存在语音的环境。
发明内容
本申请涉及听力装置如助听器,其包括用于适应输入声音信号的电平的动态范围的动态压缩放大系统,例如适应佩戴听力装置的人如听力受损人员的减小的动态范围。本发明的实施解决因将(传统的)压缩放大应用于有噪声信号而产生的噪声的不合需要的放大的问题。
听力装置
本发明的目标在于提供一种动态系统,其降低目前技术发展水平的压缩放大(CA)在有噪声环境中的负面影响。
在本申请的一方面,提供听力装置如助听器。该听力装置包括
-输入单元,用于接收或提供表示时变和频变声音信号的具有第一动态范围的电平的电输入信号,所述电输入信号包括目标信号和/或噪声信号;
-输出单元,用于提供表示所述电输入信号或者其处理后的版本的、可由用户感知为声音的输出刺激;
-动态压缩放大系统,包括
--电平估计器单元,用于提供所述电输入信号的电平估计量;
--电平后处理单元,用于根据第一控制信号提供所述电输入信号的修改的电平估计量;
--电平压缩单元,用于根据修改的电平估计量及表示用户的听觉能力的听力数据提供压缩放大增益;
--增益后处理单元,用于根据第二控制信号提供修改的压缩放大增益。
所述听力装置还包括
--控制单元,配置成分析所述电输入信号及提供所述电输入信号的分类,及基于所述分类提供第一和第二控制信号;
-正向增益单元,用于将修改的压缩放大增益应用于所述电输入信号或者其处理后的版本。
从而,可提供用于助听器的改进的压缩系统。
在下面,根据本发明的动态压缩放大系统称为“SNR驱动的压缩放大系统”及缩写为SNRCA。
SNR驱动的压缩放大系统SNRCA为目标在于下述方面的压缩放大(CA):
-使CA引起的长期SNR降级最小化。该功能称为SNRCA的“压缩放松”。
-针对非常低SNR(即仅噪声)环境,应用规定的增益的(配置的)减小。该功能称为SNRCA的“增益放松”特征。
压缩放松
由CA引起的SNR降级平均起来被最小化。CA仅在输入信号的SNR局部低(参见下面)时线性化,导致HLC性能的最小降低,当:
-短期SNR低时,即当SNR具有时间强局部化的低值时(例如语音停顿、被背景噪声强力破坏的轻声音素);和/或
-SNR在特定估计通道中低时,即当SNR具有频率强局部化的低值时(例如实质上包含噪声但不包含语音能量的一些子频带)。
线性化使用估计的电平后处理实现。该功能称为SNRCA的“压缩放松”特征。
增益放松
该特征对于非常低SNR(即仅噪声)的环境施加规定增益的(配置的)减小。减小使用规定的增益后处理实现。该功能称为SNRCA的“增益放松”特征。
在本说明书中,目标信号为计划由用户听的信号。在实施例中,目标信号为语音信号。在本说明书中,噪声信号包括来自非计划由用户听的一个或多个信号源的信号。在实施例中,非计划由用户听的一个或多个信号源包括话音和/或非话音信号源,例如人为或自然产生的声音源,例如交通噪声、风噪、乱哄哄的说话声(不同话音的难懂的混合)等。
听力装置包括正向通路,其包括从输入单元到输出单元的电信号通路,包括正向增益单元(增益施加单元)及可能的另外的信号处理单元。
在实施例中,听力装置如控制单元适于使得电输入信号的分类标示用户的当前声学环境。在实施例中,控制单元配置成按多个不同的类别对声学环境进行分类,所述多个不同的类别例如包括下述之一或多个:噪声情形下的语音、安静情形下的语音、噪声和纯净语音。在实施例中,控制单元配置成将噪声分类为大声噪声和轻声噪声。
在实施例中,控制单元配置成根据(或基于)电输入信号或者其处理后的版本中的目标信号和噪声信号分量的当前混合进行分类。
在实施例中,听力装置包括话音活动检测器,用于识别电输入信号包括语音的时间段和不包括语音的时间段,或者识别以某一概率包括语音或者不包括语音的时间段,并提供标示这些时间段的话音活动信号。在实施例中,话音活动检测器配置成在多个子频带中提供话音活动信号。在实施例中,话音活动检测器配置成使得话音活动信号标示语音不存在似然。
在实施例中,控制单元配置成根据当前的目标信号与噪声信号的比提供分类。在本说明书中,在给定时刻的信噪比(SNR)包括表示音频如来自佩戴听力装置的用户的环境的声音的电输入信号的估计的目标信号分量和估计的噪声信号分量。在实施例中,信噪比基于目标和噪声信号分量的估计的电平或功率或能量的比。在实施例中,信噪比为基于有噪声输入信号的电平或功率或能量与噪声信号分量的估计的电平或功率或能量的比的先验信噪比。在实施例中,信噪比基于宽带信号分量估计量(例如在时域中,SNR=SNR(t),其中t为时间)。在实施例中,信噪比基于子频带信号分量估计量(例如在时频域中,SNR=SNR(t,f),其中t为时间及f为频率)。
在实施例中,听力装置适于使得电输入信号可被接收或提供为多个子频带信号。在实施例中,听力装置(如输入单元)包括分析滤波器组,用于将电输入信号提供为多个子频带信号。在实施例中,听力装置(如输出单元)包括合成滤波器组,用于从多个子频带信号提供时域的电输出信号。
在实施例中,听力装置包括存储器,其中存储用户的听力数据或者源自其的数据或算法。在实施例中,用户的听力数据包括表征用户的听力受损的数据(例如与正常听觉能力的偏差)。在实施例中,听力数据包括用户的随频率而变的听觉阈电平。在实施例中,听力数据包括用户的随频率而变的不舒适的电平。在实施例中,听力数据包括在听觉阈和不舒适电平之间的、用户的随频率而变的动态范围的电平的表示。
在实施例中,电平压缩单元配置成根据验配算法确定压缩放大增益。在实施例中,验配算法为标准化验配算法。在实施例中,验配算法基于一般(如NAL-NL1或NAL-NL2或DSLm[i/o]5.0)或者预定的专有验配算法。在实施例中,用户的听力数据或者源自其的数据或算法包括用户特有随电平和频率而变的增益。在此基础上,电平压缩单元配置成针对(给定时间的)电输入信号的给定(修改的)电平提供适当的(随频率和电平而变的)增益。
在实施例中,电平检测器单元配置成提供电输入信号的包络的电平的估计量。在实施例中,电输入信号的分类包括指明电输入信号的包络的当前或平均电平。在实施例中,电平检测器单元配置成确定顶跟踪器或底跟踪器(包络),从其可得到噪底和调制指数。可用作电平检测器单元或者形成其一部分的电平检测器例如在WO2003081947A1中描述。
在实施例中,听力装置包括配置成分别提供电输入信号的电平的第一和第二估计量的第一和第二电平估计器,所述电平的第一和第二估计量分别使用第一和第二时间常数确定,其中第一时间常数小于第二时间常数。换言之,第一和第二电平估计器分别对应于快和慢电平估计器,分别提供快和慢电平估计量。在实施例中,第一电平估计器配置成跟踪电输入信号(例如包括语音)(或者其处理后的版本)的包络的瞬时电平。在实施例中,第二电平估计器配置成跟踪电输入信号(或者其处理后的版本)的包络的平均电平。在实施例中,第一和/或第二电平估计量在子频带中提供。
在实施例中,控制单元配置成确定电输入信号或者其处理后的版本的第一和第二信噪比,其中第一和第二信噪比分别称为局部SNR和全局SNR,及其中局部SNR指相对短时间(τL)和子频带特有(ΔfL)信噪比,及其中全局SNR指相对长时间(τG)和宽带(ΔfG)信噪比,及其中确定全局SNR涉及的时间常数τG和频率范围ΔfG大于确定局部SNR涉及的对应时间常数τL和频率范围ΔfL。在实施例中,τL远小于τG(τL<<τG)。在实施例中,ΔfL远小于ΔfG(ΔfL<<ΔfG)。
在实施例中,控制单元配置成基于电输入信号或者其处理后的版本的第一和/或第二信噪比确定第一和/或第二控制信号。在实施例中,控制单元配置成分别使用第一和第二电平估计量确定第一和/或第二信噪比。第一“快”信噪比称为局部SNR。第二“慢”信噪比称为全局SNR。在实施例中,第一“快”局部信噪比为子频带特有。在实施例中,第二“慢”全局信噪比基于宽带信号。
在实施例中,控制单元配置成基于第一和第二信噪比确定第一控制信号。在实施例中,控制单元配置成基于第一(局部)和第二(全局)信噪比的比较确定第一控制信号。在实施例中,控制单元配置成在第一SNR值小于第二SNR值时对于递减的第一SNR值增大电平估计量。在实施例中,控制单元配置成在第一SNR值小于第二SNR值时对于递增的第一SNR值减小电平估计量。在实施例中,控制单元配置成对于第一SNR值大于第二SNR值不修改电平估计量。
在实施例中,控制单元配置成基于电输入信号或者其处理后的版本的平滑的信噪比确定第二控制信号。在实施例中,控制单元配置成基于第二(全局)信噪比确定第二控制信号。
在实施例中,控制单元配置成根据所述话音活动信号确定第二控制信号。在实施例中,控制单元配置成在话音活动信号标示语音不存在似然时基于第二(全局)信噪比确定第二控制信号。
在实施例中,听力装置包括助听器(如听力仪器,例如适于位于用户耳朵处或者完全或部分位于耳道中或者完全或部分植入在用户头部中的听力仪器)、头戴式耳机、耳麦、耳朵保护装置或其组合。
在实施例中,听力装置适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。在实施例中,听力装置包括信号处理单元,用于增强电输入信号并提供处理后的输出信号,例如包括对用户的听力受损的补偿。
听力装置包括输出单元,用于基于处理后的电信号提供由用户感知为声信号的刺激。在实施例中,输出单元包括耳蜗植入物的多个电极或者骨导听力装置的振动器。在实施例中,输出单元包括输出变换器。在实施例中,输出变换器包括用于将刺激作为声信号提供给用户的接收器(扬声器)。在实施例中,输出变换器包括用于将刺激作为颅骨的机械振动提供给用户的振动器(例如在附着到骨头的或骨锚式听力装置中)。
听力装置包括用于提供表示声音的电输入信号的输入单元。在实施例中,输入单元包括输入变换器如传声器,用于将输入声音转换为电输入信号。在实施例中,输入单元包括用于接收包括声音的无线信号及用于提供表示所述声音的电输入信号的无线接收器。在实施例中,听力装置包括定向传声器系统(例如包括波束形成器滤波单元),其适于对来自环境的声音进行空间滤波从而增强佩戴听力装置的用户的局部环境中的多个声源之中的目标声源。在实施例中,定向系统适于检测(如自适应检测)传声器信号的特定部分源自哪一方向。
在实施例中,听力装置包括用于从另一装置如通信装置或另一听力装置接收直接电输入信号的天线和收发器电路。在实施例中,听力装置包括(可能标准化的)电接口(例如连接器的形式),用于从另一装置如通信装置或另一听力装置接收有线直接电输入信号。在实施例中,直接电输入信号表示或包括音频信号和/或控制信号和/或信息信号。在实施例中,听力装置包括用于对所接收的直接电输入进行解调的解调电路,以提供表示音频信号和/或控制信号的直接电输入信号,例如用于设置听力装置的运行参数(如音量)和/或处理参数。总的来说,听力装置的发射器和天线及收发器电路建立的无线链路可以是任何类型。在实施例中,无线链路在功率约束条件下使用,例如由于听力装置包括便携式(通常电池驱动的)装置。在实施例中,无线链路为基于近场通信的链路,例如基于发射器部分和接收器部分的天线线圈之间的感应耦合的感应链路。在另一实施例中,无线链路基于远场电磁辐射。在实施例中,经无线链路的通信根据特定调制方案进行安排,例如模拟调制方案,如FM(调频)或AM(调幅)或PM(调相),或数字调制方案,如ASK(幅移键控)如开-关键控、FSK(频移键控)、PSK(相移键控)如MSK(最小频移键控)或QAM(正交调幅)。在实施例中,无线链路基于标准化或专用技术。在实施例中,无线链路基于蓝牙技术(如蓝牙低功率技术)。
在实施例中,听力装置是便携式装置,例如包括本地能源如电池例如可再充电电池的装置。
在实施例中,听力装置包括输入变换器(传声器系统和/或直接电输入(如无线接收器))和输出变换器之间的正向或信号通路。在实施例中,信号处理单元位于正向通路中。在实施例中,信号处理单元适于根据用户的具体需要提供随频率而变的增益。在实施例中,听力装置包括具有用于分析输入信号(如确定电平、调制、信号类型、声反馈估计量等)的功能件的分析通路。在实施例中,分析通路和/或信号通路的部分或所有信号处理在频域进行。在实施例中,分析通路和/或信号通路的部分或所有信号处理在时域进行。
在实施例中,表示声信号的模拟电信号在模数(AD)转换过程中转换为数字音频信号,其中模拟信号以预定采样频率或采样速率fs进行采样,fs例如在从8kHz到48kHz的范围中(适应应用的特定需要)以在离散的时间点tn(或n)提供数字样本xn(或x[n]),每一音频样本通过预定的Nb比特表示声信号在tn时的值,Nb例如在从1到48比特的范围中如24比特。数字样本x具有1/fs的时间长度,如对于fs=20kHz,50μs。在实施例中,多个音频样本按时间帧安排。在实施例中,一时间帧包括64或者128个音频数据样本。根据实际应用可使用其它帧长度。
在实施例中,听力装置包括模数(AD)转换器以按预定的采样速率如20kHz对模拟输入进行数字化。在实施例中,听力装置包括数模(DA)转换器以将数字信号转换为模拟输出信号,例如用于经输出变换器呈现给用户。
在实施例中,听力装置如传声器单元和/或收发器单元包括用于提供输入信号的时频表示的TF转换单元。在实施例中,时频表示包括所涉及信号在特定时间和频率范围的相应复值或实值的阵列或映射。在实施例中,TF转换单元包括用于对(时变)输入信号进行滤波并提供多个(时变)输出信号的滤波器组,每一输出信号包括截然不同的输入信号频率范围。在实施例中,TF转换单元包括用于将时变输入信号转换为频域中的(时变)信号的傅里叶变换单元。在实施例中,听力装置考虑的、从最小频率fmin到最大频率fmax的频率范围包括从20Hz到20kHz的典型人听频范围的一部分,例如从20Hz到12kHz的范围的一部分。在实施例中,听力装置的正向通路和/或分析通路的信号拆分为M个频带,其中M例如大于5,如大于10,如大于50,如大于100,如大于500,其至少部分个别地进行处理。在实施例中,听力装置适于在Q个不同频道处理正向和/或分析通路的信号(M≤Q)。频道可以宽度一致或不一致(如宽度随频率增加)、重叠或不重叠。
在实施例中,听力装置包括多个检测器,配置成提供与听力装置的当前网络环境(如当前声环境)有关、和/或与佩戴听力装置的用户的当前状态有关、和/或与听力装置的当前状态或运行模式有关的状态信号。作为备选或另外,一个或多个检测器可形成与听力装置(如无线)通信的外部装置的一部分。外部装置例如可包括另一听力装置、遥控器、音频传输装置、电话(如智能电话)、外部传感器等。
在实施例中,多个检测器中的一个或多个作用于全频带信号(时域)。在实施例中,多个检测器中的一个或多个作用于频带拆分信号((时-)频域)。
在实施例中,多个检测器包括用于估计正向通路信号的当前电平的电平检测器。在实施例中,预定判据包括正向通路信号的当前电平是高于还是低于给定(L-)阈值。
在特定实施例中,听力装置包括话音检测器(VD),用于确定输入信号(在特定时间点)是否包括话音信号。在本说明书中,话音信号包括来自人类的语音信号。其还可包括由人类语音系统产生的其它形式的发声(如唱歌)。在实施例中,话音检测器单元适于将用户当前的声环境分类为“话音”或“无话音”环境。这具有下述优点:包括用户环境中的人发声(如语音)的电传声器信号的时间段可被识别,因而与仅包括其它声源(如人工产生的噪声)的时间段分离。在实施例中,话音检测器适于将用户自己的话音也检测为“话音”。作为备选,话音检测器适于从“话音”的检测排除用户自己的话音。
在实施例中,听力装置包括自我话音检测器,用于检测特定输入声音(如话音)是否源自系统用户的话音。在实施例中,听力装置的传声器系统适于能够在用户自己的话音及另一人的话音之间进行区分及可能与无话音声音区分。
在实施例中,听力装置包括分类单元,配置成基于来自(至少部分)检测器的输入信号及可能其它输入对当前情形进行分类。在本说明书中,“当前情形”意指下述之一或多个:
a)物理环境(如包括当前电磁环境,例如发生计划或者未计划由听力装置接收的电磁信号(如包括音频和/或控制信号),或者当前环境不同于声学的其它性质);
b)当前声学情形(输入电平、声学反馈等);
c)用户的当前模式或状态(运动、温度、活动等);
d)听力装置和/或与该听力装置通信的另一装置的当前模式或状态(所选的程序、自上次用户交互作用之后已消逝的时间等)。
在实施例中,听力装置还包括用于所涉及应用的其它适宜功能,如反馈抑制等。
用途
此外,本发明提供上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置的用途。在实施例中,提供在包括音频分布的系统如包括传声器和扬声器的系统中的用途。在实施例中,提供在包括一个或多个听力仪器、头戴式耳机、耳麦、有源耳朵保护系统等的系统中的用途,例如免提电话系统、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
方法
一方面,提供听力装置如助听器的运行方法。该方法包括:
-接收或提供表示时变和频变声音信号的具有第一动态范围的电平的电输入信号,所述电输入信号包括目标信号和/或噪声信号;
-提供所述电输入信号的电平估计量;
-根据第一控制信号提供所述电输入信号的修改的电平估计量;
-根据修改的电平估计量及表示用户的听觉能力的听力数据提供压缩放大增益;
-根据第二控制信号提供修改的压缩放大增益;
-分析所述电输入信号以提供所述电输入信号的分类,及基于所述分类提供第一和第二控制信号;
-将修改的压缩放大增益应用于所述电输入信号或者其处理后的版本;及
-提供表示所述电输入信号或者其处理后的版本的、可由用户感知为声音的输出刺激。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的或权利要求中限定的听力装置的部分或所有结构特征可与本发明方法的实施结合,反之亦然。方法的实施具有与对应听力装置一样的优点。
计算机可读介质
本发明进一步提供保存包括程序代码的计算机程序的有形计算机可读介质,当计算机程序在数据处理系统上运行时,使得数据处理系统执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
作为例子但非限制,前述有形计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁性存储装置,或者可用于执行或保存指令或数据结构形式的所需程序代码并可由计算机访问的任何其他介质。如在此使用的,盘包括压缩磁盘(CD)、激光盘、光盘、数字多用途盘(DVD)、软盘及蓝光盘,其中这些盘通常磁性地复制数据,同时这些盘可用激光光学地复制数据。上述盘的组合也应包括在计算机可读介质的范围内。除保存在有形介质上之外,计算机程序也可经传输介质如有线或无线链路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置处运行。
数据处理系统
一方面,本发明进一步提供数据处理系统,包括处理器和程序代码,程序代码使得处理器执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
听力系统
另一方面,本发明提供包括上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置及包括辅助装置的听力系统。
在实施例中,该听力系统适于在听力装置和辅助装置之间建立通信链路以使信息(如控制和状态信号,可能音频信号)能在其间进行交换或从一装置转发给另一装置。
在实施例中,辅助装置是或包括音频网关设备,其适于(如从娱乐装置例如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC)接收多个音频信号,及适于选择和/或组合所接收音频信号(或信号组合)中的适当信号以传给听力装置。在实施例中,辅助装置是或包括遥控器,用于控制听力装置的功能和运行。在实施例中,遥控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制音频处理装置的功能的APP(听力装置包括适当的到智能电话的无线接口,例如基于蓝牙或一些其它标准化或专有方案)。
在实施例中,辅助装置为另一听力装置。在实施例中,听力系统包括适于实施双耳听力系统如双耳助听器系统的两个听力装置。
APP
另一方面,本发明还提供称为APP的非短暂应用。APP包括可执行指令,其配置成在辅助装置上运行以实施用于上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置或听力系统的用户接口。在实施例中,该APP配置成在移动电话如智能电话或另一使能与所述听力装置或听力系统通信的便携装置上运行。
定义
在本说明书中,“听力装置”指适于改善、增强和/或保护用户的听觉能力的装置如助听器例如听力仪器或有源耳朵保护装置或其它音频处理装置,其通过从用户环境接收声信号、产生对应的音频信号、可能修改该音频信号、及将可能已修改的音频信号作为可听见的信号提供给用户的至少一只耳朵而实现。“听力装置”还指适于以电子方式接收音频信号、可能修改该音频信号、及将可能已修改的音频信号作为听得见的信号提供给用户的至少一只耳朵的装置如头戴式耳机或耳麦。听得见的信号例如可以下述形式提供:辐射到用户外耳内的声信号、作为机械振动通过用户头部的骨结构和/或通过中耳的部分传到用户内耳的声信号、及直接或间接传到用户耳蜗神经的电信号。
听力装置可构造成以任何已知的方式进行佩戴,如作为佩戴在耳后的单元(具有将辐射的声信号导入耳道内的管或者具有安排成靠近耳道或位于耳道中的输出变换器如扬声器)、作为整个或部分安排在耳廓和/或耳道中的单元、作为连到植入在颅骨内的固定结构的单元如振动器、或作为可连接的或者整个或部分植入的单元等。听力装置可包括单一单元或几个彼此电子通信的单元。扬声器可连同听力装置的其它元件一起设置在壳体中,或者本身可以是外部单元(可能与柔性引导元件如圆顶状元件结合)。
更一般地,听力装置包括用于从用户环境接收声信号并提供对应的输入音频信号的输入变换器和/或以电子方式(即有线或无线)接收输入音频信号的接收器、用于处理输入音频信号的(通常可配置的)信号处理电路、及用于根据处理后的音频信号将听得见的信号提供给用户的输出单元。信号处理单元可适于在时域或者多个频带中处理输入信号。在一些听力装置中,放大器和/或压缩器可构成信号处理电路。信号处理电路通常包括一个或多个(集成或单独的)存储元件,用于执行程序和/或用于保存在处理中使用(或可能使用)的参数和/或用于保存适合听力装置功能的信息和/或用于保存例如结合到用户的接口和/或到编程装置的接口使用的信息(如处理后的信息,例如由信号处理电路提供)。在一些听力装置中,输出单元可包括输出变换器,例如用于提供空传声信号的扬声器或用于提供结构或液体传播的声信号的振动器。在一些听力装置中,输出单元可包括一个或多个用于提供电信号的输出电极(例如用于电刺激耳蜗神经的多电极阵列)。
在一些听力装置中,振动器可适于经皮或由皮将结构传播的声信号传给颅骨。在一些听力装置中,振动器可植入在中耳和/或内耳中。在一些听力装置中,振动器可适于将结构传播的声信号提供给中耳骨和/或耳蜗。在一些听力装置中,振动器可适于例如通过卵圆窗将液体传播的声信号提供到耳蜗流体。在一些听力装置中,输出电极可植入在耳蜗中或植入在颅骨内侧上,并可适于将电信号提供给耳蜗的毛细胞、一个或多个听觉神经、听觉脑干、听觉中脑、听觉皮层和/或大脑皮层及相关结构的其它部分。
听力装置如助听器可适应特定用户的需要,例如适应听力受损。听力装置的可配置的信号处理电路可适于应用输入信号的随频率和电平而变的压缩放大。定制的随频率和电平而变的增益可在验配过程中通过验配系统基于用户的听力数据如听力图使用通用或专用验配规程进行确定。随频率和电平而变的增益例如可体现在处理参数中,例如经到编程装置(验配系统)的接口上传到听力装置,并由听力装置的可配置的信号处理电路所执行的处理算法使用。
“听力系统”指包括一个或两个听力装置的系统。“双耳听力系统”指包括两个听力装置并适于协同地向用户的两只耳朵提供听得见的信号的系统。听力系统或双耳听力系统还可包括一个或多个“辅助装置”,其与听力装置通信并影响和/或受益于听力装置的功能。辅助装置例如可以是遥控器、音频网关设备、移动电话(如智能电话)或音乐播放器。听力装置、听力系统或双耳听力系统例如可用于补偿听力受损人员的听觉能力损失、增强或保护正常听力人员的听觉能力和/或将电子音频信号传给人。听力装置或听力系统例如可形成广播系统、耳朵保护系统、免提电话系统、汽车音频系统、娱乐(如卡拉OK)系统、远程会议系统、教室放大系统等的一部分或者与其交互作用。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,同时为简洁起见省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1示出了根据本发明的听力装置的实施例。
图2A示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第一实施例。
图2B示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第二实施例。
图2C示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第三实施例。
图2D示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第四实施例。
图2E示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第五实施例。
图2F示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第六实施例。
图3示出了根据本发明的包括SNR驱动的压缩放大系统的听力装置实施例的简化框图。
图4A示出了局部SNR估计单元的实施例。
图4B示出了全局SNR估计单元的实施例。
图5A示出了根据本发明的电平修改单元的实施例。
图5B示出了根据本发明的增益修改单元的实施例。
图6A示出了根据本发明的电平后处理单元的实施例。
图6B示出了根据本发明的增益后处理单元的实施例。
图7示出了根据本发明的听力装置运行方法的实施例的流程图。
图8A示出了有噪声语音的CA和SNRCA的时域电平包络估计量。
图8B示出了对于仅有噪声的信号段,CA和SNRCA传递的放大增益。
图8C示出了CA处理有噪声语音的输出的谱图。
图8D示出了SNRCA处理有噪声语音的输出的谱图。
图8E示出了CA处理有噪声语音的输出的谱图。
图8F示出了SNRCA处理有噪声语音的输出的谱图。
图9A示出了强调制的时域信号、弱调制的时域信号及这两个信号的和在CA系统的输入处的时域包络的短期和长期功率。
图9B示出了强调制的时域信号、弱调制的时域信号及这两个信号的和在CA系统的输出处的时域包络的短期和长期功率。
图9C示出了图9A的弱调制的时域信号为噪声时的CA系统输入和输出SNR。
图9D示出了图9A的强调制的时域信号为噪声时的CA系统输入和输出SNR。
图9E示出了强调制的时域信号、弱调制的时域信号及这两个信号的和在CA系统的输入处的时域包络的短期和长期功率。
图9F示出了强调制的时域信号、弱调制的时域信号及这两个信号的和在CA系统的输出处的时域包络的短期和长期功率。
图9G示出了图9E的弱调制的时域信号为噪声时的CA系统输入和输出SNR。
图9H示出了图9E的强调制的时域信号为噪声时的CA系统输入和输出SNR。
图9I示出了强调制的频域信号、弱调制的频域信号及这两个信号的和在CA系统的输入处的频谱包络的子频带和宽带功率。
图9J示出了强调制的频域信号、弱调制的频域信号及这两个信号的和在CA系统的输出处的频谱包络的子频带和宽带功率。
图9K示出了图9I的弱调制的信号为噪声时的CA系统输入和输出SNR。
图9L示出了图9I的强调制的信号为噪声时的CA系统输入和输出SNR。
图9M示出了强调制的频域信号、弱调制的频域信号及这两个信号的和在CA系统的输入处的频谱包络的子频带和宽带功率。
图9N示出了强调制的频域信号、弱调制的频域信号及这两个信号的和在CA系统的输出处的频谱包络的子频带和宽带功率。
图9O示出了图9M的弱调制的信号为噪声时的CA系统输入和输出SNR。
图9P示出了图9M的强调制的信号为噪声时的CA系统输入和输出SNR。
为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,同时故意省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。
通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出。对于本领域技术人员来说,基于下面的详细描述,本发明的其它实施方式将显而易见。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等(统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、及配置成执行本说明书中描述的多个不同功能的其它适当硬件。术语“计算机程序”应广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
下面概述压缩放大(CA)的概念以突出本发明的SNR驱动的压缩放大系统(SNRCA)解决的问题。
压缩放大(CA)被设计和用于恢复语音可听度。
对于压缩器(即CA方案)的输入处的信号x[n],例如电输入信号(时域),n为采样的时间指数,可将x[n]写为M个子频带信号xm[n]的和:
M个子频带中的每一个可用作电平估计通道并产生lm,τ[n],通过(通常正方形)整流及其后的(可能非线性和时变的)低通滤波(平滑运算)获得的功率电平的估计量。低通滤波算子Hm的强度通过希望的电平估计时间常数τ确定。例如,对于正方形整流,
lm,τ[n]=Hm(|xm[n]|2,n,τ)
使用压缩特征曲线,即使每一通道的电平lm与通道增益gm(lm)映射的函数,压缩器针对每一估计的电平lm,τ[n]计算可应用于xm[n]以产生放大的第m个子频带ym[n]的增益gm[n]=gm(lm,τ[n]:
ym[n]=gm[n]xm[n]
在下述约束条件下,增益gm[n]为估计的输入电平lm,τ[n]的函数,即gm[n]=gm(lm,τ[n]):对于两个估计的电平lsoft和lloud,其中
lsoft<lloud
对应的增益gsoft=g(lsoft)和gloud=g(lloud)满足:
gsoft≥gloud
然而,压缩比将不为负,这样,总是满足下面的条件:
lsoftgsoft≤lloudgloud
压缩器输出信号y[n]可重构如下:
然而,应用于有噪声信号,CA趋于使SNR降级,表现为噪声放大器(更多细节参见下面的部分)。换言之,压缩器输出处的SNR即SNRO可能小于压缩器输入处的SNR即SNRI:
SNRO≤SNRI
1、压缩放大和SNR降级
根据压缩器输入处的长期宽带SNR,典型CA(在某些声学情形下)在SNR方面可能降低效果,如上面提及的。在接下来的多个小部分更详细地讨论这方面之前,请看下面的一些定义:
时间常数
τL和τG为满足下式的平均时间常数:
τL≤τG
τL表示相对短时间:其量级通常对应于音素或音节的长度(即1到小于100ms)。
τG表示相对长时间:其量级通常对应于一个、两个、几个词甚至句子的长度(即0.5s到5s以上)。
通常,τL与τG之间的量级的差大,即
τL<<τG
例如τL≤10τG。
带宽
ΔfL和ΔfG为满足下式的带宽:
ΔfL≤ΔfG
ΔfL表示相对窄带宽,其通常为听觉滤波器组中使用的带宽,即从几Hz到几kHz。
ΔfG表示处理后的信号的全带宽。其定义为采样频率fs的一半,即ΔfG=fs/2。在当前HA中,通常在8到16kHz之间。
通常,ΔfL与ΔfG之间的量级的差大,即
ΔfL<<ΔfG
例如ΔfL≤10ΔfG。
输入和输出信号
压缩器(CA方案)的输入信号例如电输入信号记为x[n],其中n为采样的时间指数。
压缩器(CA方案)的输出信号记为y[n].。
x和y均为宽带信号,即它们使用全带宽ΔfG。
xm[n]为输入信号x[n]的M个子频带的第m个子频带。其带宽ΔfL,m小于ΔfG:相较于x,xm被频率局部化。
ym[n]为输出信号y[n]的M个子频带的第m个子频带。其带宽ΔfL,m小于ΔfG:相较于y,ym被频率局部化。
应注意,如果将x拆分为M个子频带xm的滤波器组为均匀滤波器组,则对于所有m,ΔfL,mΔfL。在本说明书的其余部分,我们假定使用常数带宽的子频带,即ΔfL,m=ΔfL,不损失一般性:假定信号被拆分为M′个子频带,具有非恒定的带宽ΔfL,m′,可选择带宽ΔfL,m=ΔfL,其为带宽ΔfL,m′的最大公约数,即ΔfL,m′=Cm′ΔfL,对于所有m′,Cm′为严格正整数。新的子频带数为
增益应用中的子频带中的电平估计可进行仿真:
更大子频带中的增益应用可进行仿真:
具有τG=KG/fs的宽带输入信号段既不被时域局部化也不被频域局部化,因为其表示宽带长时间段。
具有τG=KG/fs的宽带输出信号段既不被时域局部化也不被频域局部化,因为其表示宽带长时间段。
具有τL=KL/fs的宽带输入信号段被时域局部化但不被频域局部化,因为其表示宽带短时间段。
具有τG=KG/fs的子频带输入信号段被频域局部化但不被时域局部化,因为其表示子频带长时间段。
具有τG=KG/fs的子频带输出信号段被频域局部化但不被时域局部化,因为其表示子频带长时间段。
具有τL=KL/fs的宽带输出信号段被时域局部化但不被频域局部化,因为其表示宽带短时间段。
具有τL=KL/fs的子频带输入信号段被时频局部化,因为其表示子频带短时间段。
具有τL=KL/fs的子频带输出信号段被时频局部化,因为其表示子频带短时间段。
附加噪声模型
宽带输入信号x[n]可建模为宽带输入语音信号s[n]和宽带输入噪声(干扰)d[n]的和:
x[n]=s[n]+d[n]
子频带输入信号xm[n]可建模为输入子频带语音信号sm[n]和输入子频带噪声(干扰)dm[n]的和:
xm[n]=sm[n]+dm[n]
宽带输出信号y[n]可建模为宽带输出语音信号ys[n]和宽带输出噪声(干扰)yd[n]的和:
y[n]=ys[n]+yd[n]
子频带输出信号ym[n]可建模为输出子频带语音信号和输出子频带噪声(干扰)的和:
输入功率
为跨时间τL=KL/fs的平均子频带输入信号功率
应注意,在CA中,电平估计级针对提供估计量即
为跨时间τL=KL/fs的平均子频带输入语音功率
为跨时间τL=KL/fs的平均子频带输入噪声功率
应注意,在SNRCA中,噪声功率估计器用于针对噪声功率提供估计量即
还应注意,(Cauchy-Schwarz不等式),仅在sm和dm正交(不相关及零均值)时保持相等。
为跨时间τL=KL/fs的平均宽带输入信号功率
为跨时间τL=KL/fs的平均宽带输入语音功率
为跨时间τL=KL/fs的平均宽带输入噪声功率
应注意(Cauchy-Schwarz不等式),仅在s和d正交(不相关和零均值)时成立等式。
为跨时间τG=KτL=KKL/fs=KG/fs的平均宽带输入信号功率,具有ΔfG=MΔfL
为跨时间τG=KτL=KKL/fs=KG/fs的平均宽带输入语音功率,具有ΔfG=MΔfL
为跨时间τG=KτL=KKL/fs=KG/fs的平均宽带输入噪声功率,具有ΔfG=MΔfL
应注意(Cauchy-Schwarz不等式),仅在s和d正交(不相关及零均值)时成立等式。
输出功率
为跨时间τL=KL/fs的平均子频带输出信号功率
为跨时间τL=KL/fs的平均子频带输出语音功率
为跨时间τL=KL/fs的平均子频带输出噪声功率
为跨时间τL=KL/fs的平均宽带输出信号功率
为跨时间τL=KL/fs的平均宽带输出语音功率
为跨时间τL=KL/fs的平均宽带输出噪声功率
为跨时间的平均宽带输出信号功率,具有ΔfG=MΔfL
为跨时间τG=KτL=KKL/fs=KG/fs的平均宽带输出语音功率,具有ΔfG=MΔfL
为跨时间τG=KτL=KKL/fs=KG/fs的平均宽带输出噪声功率,具有ΔfG=MAfL
输入SNR
为跨时间τL=KL/fs的平均子频带输入SNR
为跨时间τL=KL/fs的平均宽带输入SNR
为跨时间τG=KG/fs的平均子频带输入SNR
为跨时间τG=KG/fs的平均宽带输入SNR
输出SNR
为跨时间τL=KL/fs的平均子频带输出SNR
为跨时间τL=KL/fs的平均宽带输出SNR
为跨时间τG=KG/fs的平均子频带输出SNR
为跨时间τG=KG/fs的平均宽带输出SNR
全局和局部SNR
术语“输入全局SNR”或者简单地“全局SNR”指基于压缩器的宽带(即全带宽ΔfG)输入信号x计算并跨相对长时间τG求平均的信噪比:
术语“输出全局SNR”指基于压缩器的宽带(即全带宽ΔfG)输出信号y计算并跨相对长时间τG求平均的信噪比:
术语“输入局部SNR”或者简单地“局部SNR”可互换并根据上下文指:
基于压缩器的宽带(即全带宽ΔfG)输入信号x计算并跨相对短时间τL求平均的信噪比
或者基于压缩器的子频带(即带宽ΔfL,m)输入信号xm计算并跨相对长时间τG求平均的信噪比
或者基于压缩器的子频带(即带宽ΔfL)输入信号xm计算并跨相对短时间τL求平均的信噪比
在所讨论的上下文中,只要符合下述条件,局部SNR被记为SNRL:
-关于使用3种类型中的哪一个没有含糊不清;或者
-SNRL可由3种类型中的任何一种代替。
SNR和调制的时域包络
设a为两个正交信号u和v的和,即
a=u+v
及
设u具有相较v的时域包络被更多调制的时域包络。这意味着的方差大于的方差即
其中
及
这些方差可估计如下:
设u具有大于v的长期功率,即
该情形由图9A上的例子示出,其中信号和被分别记为PutauL、PvtauL、PatauL、PutauG、PvtauG和PatauG。
相当稳定,而被强调制。在时域包络的尖峰上(约0.4s和1.25s),总功率以为主:
因为
另一方面,在调制的包络谷(约0.6s和1.6s)中,总功率实质上仅由形成:
因为
设b为CA以a为输入时的输出,具有u和v的压缩版bu和bv:
b=bu+bv
和(在图9B上分别记为PbutauL、PbvtauL、PbtauL、PbutauG、PbvtauG和PbtauG)分别为它们的短期功率和长期功率。
图9A和9B示出了强调制的信号u趋于获得比弱调制的信号v少的平均增益。为此,长期输出SNR可能不同于长期输入SNR
如果u表示语音及v表示噪声(情形1a),音景可描述如下:
-(正的长期输入SNR):u与v之间的长期功率关系定义如上,即语音比噪声大声。
-语音比稳态噪声被更多调制。
-CA引入SNR降级如图9C所示(和分别记为SNRitauL、SNRitauG、SNRotauL和SNRotauG),因为具有最低SNR的短时间段为具有最低短时功率且接收最多增益的段。
-典型的音景:轻声噪声下的语音。
-音景似然:高。a通常可能是相对轻声及未调制的噪声下的语音。例如办公室、家庭等。
-音景相关性:高。在该类电平下,应用压缩放大,从而SNR可能被降级。应注意,如果输入SNR极大(音景纯净语音),即则输出SNR实际上不被降级,即
注意:该情形可能碰巧是宽带,即如果u=s,v=d,a=x,bu=yu,bv=yv和b=y,或者在一些子频带m中,即u=sm,v=dm,a=xm, 和b=ym。
如果v表示语音及u表示噪声(情形1b),音景可描述如下:
-(负的长期输入SNR):u与v之间的长期功率关系定义如上,即噪声比语音大声。
-语音相比噪声被较少调制。
-CA引入SNR提高如图9D所示(和分别记为SNRitauL、SNRitauG、SNRotauL和SNRotauG),因为具有最高SNR的短时间段为具有最低短时功率并得到最高增益的段。
-典型音景:中等/大声噪声下的轻声语音。
-音景似然:低。a可能是受到大声且强调制的噪声破坏的相对轻声的语音。一些特定大声噪声可被调制(如气锤),然而,我们不能期望HI用户在这样的音景中华太多的时间。此外,语音相较v通常被多得多地调制,从而SNR提高可以忽略不计。
-音景相关性:低。该类噪声源的响度通常处于放大为线性及增益接近0dB的范围中。此外,在现代HI中,前述大声且冲击性的噪声通常使用专门的瞬间降噪算法进行衰减。
注意:该情形可能碰巧是宽带,即如果u=s,v=d,a=x,bu=yu,bv=yv和b=y,或者在一些子频带m中,即u=sm,v=dm,a=xm, 和b=ym。
设u具有小于v的长期功率,即
该情形由图9E上的例子示出,其中信号和被分别记为PutauL、PvtauL、PatauL、PutauG、PvtauG和PatauG。
相当稳定,而被强调制。因为v具有比u多的功率,a的时域包络几乎与v的时域包络一样平。总的来说,总功率以为主,即
时域包络的尖峰上(约0.4s和1.25s)除外,其中不可忽略,即
甚至
设b为CA以a为输入时的输出,具有u和v的压缩版bu和bv:
b=bu+bv
和(在图9F上分别记为PbutauL、PbvtauL、PbtauL、PbutauG、PbvtauG和PvtauG)分别为它们的短期功率和长期功率。
图9E和9F示出了强调制的信号u趋于接收比弱调制的信号v少的平均增益。为此,长期输出SNR可能不同于长期输入SNR
如果u表示语音及v表示噪声(情形2a),
-(负的长期输入SNR):u与v之间的长期功率关系定义如上,即噪声比语音大声。
-语音比噪声被更多调制。
-CA引入SNR降级如图9G所示(和分别记为SNRitauL、SNRitauG、SNRotauL和SNRotauG),因为具有最低SNR的短时间段为具有最低短时功率且接收最多增益的段。
-典型的音景:中等/大声噪声下的轻声语音。
-音景似然:中等。a通常可能是相当大声但未调制的噪声下的语音。尽管该情形理论上非常可能,但NR系统在CA前面的使用(参见部分2)降低了CA输入处这样的信号的可能性。趋于将其变换为轻声噪声下的音景语音(情形1a)。
-音景相关性:高。如果这样的信号存在于CA输入处,甚至具有放在CA前面的NR系统(参见部分2),这意味着NR系统不能够从噪声提取语音,因为噪声比语音强得多所得的信号具有平的包络。该音景对于线性化的放大没有相关性:实际上,尽管包络水平可能位于放大非线性的范围中,但平的包络产生几乎恒定的增益,即最小SNR降级。然而,这样的音景具有高相关性,因为其实际上趋于为(仅)噪声音景在该情形下,HI用户可能受益于减小的放大(参见上面的发明内容部分中关于增益放松的描述)而不是线性化的放大。
注意:该情形可能碰巧是宽带,即如果u=s,v=d,a=x,bu=yu,bv=yv和b=y,或者在一些子频带m中,即u=sm,v=dm,a=xm, 和b=ym。
如果v表示语音及u表示噪声(情形2b),
-(正的长期输入SNR):u与v之间的长期功率关系定义如上,即语音比噪声大声。
-语音相比噪声被较少调制。
-CA引入SNR提高如图9H所示(和分别记为SNRitauL、SNRitauG、SNRotauL和SNRotauG),因为具有最高SNR的短时间段为具有最低短时功率且接收最多增益的段。
-典型音景:轻声噪声下的语音。
-音景似然:中等。a可能是受轻声但强调制的噪声破坏的语音。一些特定轻声噪声可能被强调制(如计算机键盘声)。另一方面,语音通常比v多得多地调制,可能不比调制的噪声少很多地调制。这样,SNR提高可忽略不计。
-音景相关性:低。这样的低电平和调制的噪声可能不需要任何线性化,因为它们可能包含用于HI用户的相应信息。如针对语音一样,甚至可预期典型的压缩放大表现。另一方面,如果噪声真被强调制且令人烦恼(轻声的冲击性噪声),应使用专门的瞬间降噪算法。
注意:该情形可能碰巧是宽带,即如果u=s,v=d,a=x,bu=yu,bv=yv和b=y,或者在一些子频带m中,即u=sm,v=dm,a=xm, 和b=ym。
调制的时域包络的压缩放大的总结
-仅语音比噪声被更多调制的情形(1a和2a)最可能且确实相关:本讨论可限于两种情形:正-负输入SNR。
-在负输入SNR的情形下(情形2a),SNR提高不可能。然而,代替使用线性化技术(如压缩放松),减小放大更有帮助(如使用增益放松)。
-当输入SNR为正时(情形1a)CA趋于使SNR降级。在该情形下,在时域使CA局部线性化(如使用压缩放松)可限制SNR降级。
SNR和调制的频谱包络
设am为两个正交子频带信号um和vm的和,即
am=um+vm
及
设um具有比vm高的频谱对比度,即um具有比vm的频谱包络更多调制的频谱包络。这意味着的方差大于的方差,即
其中
及
方差可分别估计如下:
设u具有大于v的宽带功率,即
Pu,τ≥Pv,τ
该情形由图9I上的例子示出,其中信号Pu,τ,Pv,τ和Pa,τ分别记为Pum、Pvm、Pam、Pu、Pv和Pa。
相当稳定,而被强调制。
在频谱包络的尖峰上(例如约200Hz),总功率以为主:
因为
另一方面,在调制的包络谷(如8kHz)中,总功率实质上仅由组成:
因为
设bm为CA以a为输入时的输出,具有分别为um和vm的压缩版的和
和Pb,τ(在图9J上分别记为Pbum,Pbvm,Pbm,Pbu,Pbv和Pb)分别为它们的子频带和宽带功率。
图9I和9J示出了强调制的信号um趋于获得比弱调制的信号vm少的平均增益。为此,宽带输出SNR SNRO,τ可能不同于宽带输入SNR SNRI,τ。
如果um表示语音及vm表示噪声(情形1a),音景可描述如下:
-SNRI,τ≥0(正的宽带输入SNR):u与v之间的宽带功率关系定义如上,即Pu,τ≥Pv,τ。语音比噪声大声。
-语音比噪声大的频谱对比度。
-CA引入SNR降级(SNRI,τ≥SNRO,τ),如图9K所示(SNRI,m,τ,SNRI,τ,SNRO,m,τ和SNRO,τ分别记为SNRim,SNRi,SNRom和SNRo),因为具有最低SNR的子频带趋于为具有最低子频带功率Pa,m,τ且接收最多增益的子频带(与电平变化根据压缩映射曲线产生增益变化的时域情形相反,在频域,由电平变化按频率的函数产生的增益变化可能不遵循压缩映射曲线。作为频率的函数的电平变化甚至可使用膨胀映射曲线产生增益变化。然而,作为沿频率轴的电平变化的函数的平均增益变化产生压缩映射曲线,其中求平均基于HA用户验配的增益的足够大的样本进行。换言之,平均验配的增益展现沿频率轴的压缩电平-增益映射曲线)。
-典型的音景:轻声噪声下的语音。
-音景似然:高。a通常可能是相对轻声具有平的功率谱密度的噪声下的语音。例如办公室、家庭等。
-音景相关性:高。在该类电平下,应用压缩放大,从而SNR可能被降级。应注意,如果输入SNR极大(音景纯净语音),即SNRI,τ→+∞,则输出SNR不能被降级,即SNRO,τ→+∞。
注意:该情形可能跨长期(τ=τG)或者短期(τ=τL)发生。
如果vm表示语音及um表示噪声(情形1b),音景可描述如下:
-SNRI,τ≤0(负的宽带输入SNR):u与v之间的宽带功率关系定义如上,即Pu,τ≥Pv,τ。噪声比语音大声。
-噪声相比语音具有更大频谱对比度。
-CA引入SNR提高(SNRI,τ≤SNRO,τ),如图9L所示(SNRI,m,τ,SNRI,τ,SNRO,m,τ和SNRO,τ分别记为SNRim,SNRi,SNRom和SNRo),因为具有最高SNR的子频带趋于是具有最低子频带功率Pa,m,τ且顺便接收最多增益的子频带(与电平变化根据压缩映射曲线产生增益变化的时域情形相反,在频域,由电平变化按频率的函数产生的增益变化可能不遵循压缩映射曲线。作为频率的函数的电平变化甚至可使用膨胀映射曲线产生增益变化。然而,作为沿频率轴的电平变化的函数的平均增益变化产生压缩映射曲线,其中求平均基于HA用户验配的增益的足够大的样本进行。换言之,平均验配的增益展现沿频率轴的压缩电平-增益映射曲线)。
-典型音景:大声噪声下的语音。
-音景似然:低。a可能是受到大声且强着色的噪声破坏的相对轻声的语音。总的来说,语音相较具vm有大得多的频谱对比度。实际上,相较语音具有大得多的频谱对比度的有噪声信号相当不可能。对于大多数有噪声信号,频谱对比度类似于最糟糕情形下的语音。如果NR系统放在CA前面(参见部分2),这更不可能:NR将在噪声比语音大声的子频带中应用强衰减,实际上使得CA输入处的噪声功率谱密度变平。这样,总的来说,SNR提高预期可忽略不计。
-音景相关性:中等。该类有噪声信号的响度可能在放大非线性的范围中。另一方面,其也可能足够大声从而达到线性放大的电平范围。
注意:该情形可能跨长期(τ=τG)或者短期(τ=τL)发生。
设v具有大于u的宽带功率,即
Pv,τ≥Pu,τ
该情形由图9M上的例子示出,其中信号Pu,τ,Pv,τ和Pa,τ分别记为Pum、Pvm、Pam、Pu、Pv和Pa。
相当稳定,而被强调制。
因为vm具有比um多的功率,am具有相对弱的频谱对比度,类似于vm。总的来说,总功率以为主,即
在频谱包络的尖峰上(例如约200Hz处)除外,其中不可忽略,即
甚至
设bm为CA以a为输入时的输出,具有分别为um和vm的压缩版的和
和Pb,τ(在图9N上分别记为Pbum,Pbvm,Pbm,Pbu,Pbv和Pb)分别为它们的子频带和宽带功率。
图9M和9N示出了强调制的信号um趋于获得比弱调制的信号vm少的平均增益。为此,宽带输出SNR SNRO,τ可能不同于宽带输入SNRSNRI,τ。
如果um表示语音及vm表示噪声(情形2a),音景可描述如下:
-SNRI,τ≤0(负的宽带输入SNR):u与v之间的宽带功率关系定义如上,即Pv,τ≥Pu,τ。噪声比语音大声。
-语音比噪声大的频谱对比度。
-CA引入SNR降级(SNRI,τ≥SNRO,τ),如图9O所示(SNRI,m,τ,SNRI,τ,SNRO,m,τ和SNRO,τ分别记为SNRim,SNRi,SNRom和SNRo),因为具有最低SNR的子频带趋于为具有最低子频带功率Pa,m,τ且顺便获得最高增益的子频带(与电平变化根据压缩映射曲线产生增益变化的时域情形相反,在频域,由电平变化按频率的函数产生的增益变化可能不遵循压缩映射曲线。作为频率的函数的电平变化甚至可使用膨胀映射曲线产生增益变化。然而,作为沿频率轴的电平变化的函数的平均增益变化产生压缩映射曲线,其中求平均基于HA用户验配的增益的足够大的样本进行。换言之,平均验配的增益展现沿频率轴的压缩电平-增益映射曲线)。
-典型的音景:中等/大声噪声下的轻声语音。
-音景似然:中等。a通常可能是相当大声、具有平的功率谱密度的语音。尽管该情形理论上非常可能,但NR系统在CA前面的使用(参见部分2)降低了CA输入处这样的信号的可能性。
-音景相关性:高。如果这样的信号存在于CA输入处,甚至具有放在CA前面的NR系统(参见部分2),这意味着NR系统不能够从噪声提取语音,因为噪声比语音强得多(Pv,τ>>Pu,τ)。在这样的情形下,可能的SNR降级相较于压缩器实际上正放大以噪声为主甚至纯噪声的信号的事实相对可忽略不计。这样,该音景对于线性化的放大没有相关性。然而,其具有高相关性,因为其实际上趋于为(仅)噪声音景如果这样的音景趋于持续,HI用户可能受益于减小的放大(参见发明内容中关于增益放松的描述)而不是线性化的放大。
注意:该情形可能跨长期(τ=τG)或者短期(τ=τL)发生。
如果vm表示语音及um表示噪声(情形2b),音景可描述如下:
-SNRI,τ≥0(正的宽带输入SNR):u与v之间的宽带功率关系定义如上,即Pv,τ≥Pu,τ。语音比噪声大声。
-噪声相比语音具有更大频谱对比度。
-CA引入SNR提高(SNRI,τ≤SNRO,τ),如图9P所示(SNRI,m,τ,SNRI,τ,SNRO,m,τ和SNRO,τ分别记为SNRim,SNRi,SNRom和SNRo),因为具有最高SNR的子频带趋于是具有最低子频带功率Pa,m,τ且还接收最多增益的子频带(与电平变化根据压缩映射曲线产生增益变化的时域情形相反,在频域,由电平变化按频率的函数产生的增益变化可能不遵循压缩映射曲线。作为频率的函数的电平变化甚至可使用膨胀映射曲线产生增益变化。然而,作为沿频率轴的电平变化的函数的平均增益变化产生压缩映射曲线,其中求平均基于HA用户验配的增益的足够大的样本进行。换言之,平均验配的增益展现沿频率轴的压缩电平-增益映射曲线)。
-典型音景:轻声噪声下的语音。
-音景似然:低。a可能是受到轻声但强着色的噪声破坏的语音。总的来说,语音相较具vm有大得多的频谱对比度。实际上,相较语音具有大得多的频谱对比度的有噪声信号相当不可能。对于大多数有噪声信号,频谱对比度类似于最糟糕情形下的语音。如果NR系统放在CA前面(参见部分2),这更不可能:NR将在噪声比语音大声的子频带中应用强衰减,实际上使得CA输入处的噪声功率谱密度变平。这样,总的来说,SNR提高预期可忽略不计。
-音景相关性:高。在该类电平下,应用压缩放大,从而SNR可被提高。
注意:该情形可能跨长期(τ=τG)或者短期(τ=τL)发生。
调制的频谱包络的压缩放大的总结
-仅语音比噪声具有更大频谱对比度的情形(1a和2a)足够可能且相关:本讨论可限于两种情形:正-负输入SNR。
-在负输入SNR的情形下(情形2a),SNR提高不可能。然而,代替使用线性化技术(如压缩放松),减小放大更有帮助(如使用增益放松)。
-当输入SNR为正时(情形1a)CA趋于使SNR降级。在该情形下,在频域使CA局部线性化(如使用压缩放松)可限制SNR降级。
结论(CA及SNR降级)
理论上,CA在SNR方面不是系统性地坏事。然而,可预期CA导致SNR提高的情形几乎不可能和无关,尤其是,就像在现代听力仪器(参见下一部分)中一样,CA放在降噪(NR)系统后面。因此,CA在SNR方面应视为全局达不到预期目标。
2、降噪和压缩放大
由于降噪(NR)系统性地提高SNR(SNRO≥SNRI),而CA在其输入处为负时提高SNR,即如果SNRI<0,SNRO≥SNRI;但CA在其输入处为正时使SNR降级,即如果SNRI>0,SNRO≤SNRI(参见部分1,SNR和调制的时域包络及SNR和调制的频谱包络),人们可能被诱使得出最佳设置是将CA放在NR前面从而使SNR提高的机会最大化的结论。
然而,这样的设计忽视了:
-放在压缩器输出处的NR限于单信号NR技术,如谱减/齐纳滤波。实际上,噪声抵消和波束形成因为需要使用来自多个传声器的信号而只能放在压缩器的前面。因此,将NR放在CA后面迫使对所使用的NR算法有所技术限制,人为约束NR性能。
-具有正和负SNRI的环境不具有相等的可能性:实际上,假定佩戴助听器的听力受损人员将不会在非常嘈杂的环境中呆太多时间是合理的,在那样的环境中CA理论上可提高信噪比。他们将自然地首选在下述环境中呆更多时间:
--电平低到中等,及SNRI为正(相对安静或者轻声噪声下的语音);
--电平低及SNRI十足的负(没有语音也没有大声的噪声源的安静环境)。因为噪声电平趋于非常低,其非常可能低于第一压缩拐点,即处于线性放大的输入电平区域中,使得压缩器对于SNR提高可能无用。即使噪声电平不低于第一压缩拐点,这样类型的噪声不能被强调制,大大限制了CA在SNR提高方面的好处。
一方面,假定可设计任意好的NR方案,其能够去除100%的噪声,即系统性地产生无限输出SNR,与放在CA前面还是后面无关。另一方面,众所周知,NR方案仅可衰减信号(通过定义)。这样,在CA输入处,如果NR放在CA前面,有噪声的输入信号仅能比没有NR或者NR放在CA后面的情形更轻声。如果使用上面描述的任意好的NR方案,整个系统(NR和CA)的输出信号具有无限SNR(与NR放在哪儿无关),但如果NR放在CA后面,其相较于放在CA前面被次放大。实际上,如果NR放在CA后面,CA分析噪声破坏的信号,其仅可比无噪声版更大声且顺便获得较少增益,这将导致较差的HLC性能。因此,NR方案越好,越感觉应将NR放在CA前面。
最好将NR放在CA前面。对于根据本发明的基于SNR的CA,实际上没有理由不将NR放在压缩器输出处。
为完整的目的,让我们讨论放在压缩器输入处的NR及放在压缩器输出处的NR。
NR相对于CA放置
使用降噪(NR)系统(例如包括定向性(空间滤波/波束形成)和噪声抑制)可能提供全局SNR提高,但不阻止典型CA引起的SNR降级。这与NR位置(即CA的输入或输出处)无关。
NR在CA输出处
源信号的SNR可以为:
-负:CA可提供一些SNR提高。然而,SNR将保持为负。这样的信号对于任何NR方案仍然极富挑战性,尤其在限于谱减/齐纳滤波技术(参见上面的讨论)时。从听力损失补偿的角度,这样的信号应被视为纯噪声,限制放大甚至完全关闭可能更好。
-正:CA将使SNR降级,增加对更多NR的需要。从NR的角度,这种表现显然达不到目标。
NR在CA输入处
只要NR不能够将SNR增大到无穷大(这当然不现实),在NR输出处仍然有残余噪声。NR输出信号的SNR可以为:
-负:如果残余噪声仍然非常强,SNR可能为负。在该情形下,CA可帮助进一步增大SNR。然而,在听力损失补偿的角度,这样的信号应被视为纯噪声,限制放大甚至完全关闭可能更好。
-正:如果残余噪声足够弱,SNR可能为正。在该情形下,CA趋于减小SNR,这从NR的角度达不到目标。
实际上,NR方案越好,NR输出处的SNR为正的可能性越高。换言之,NR方案越好,增强的CA的设计越重要,其能够使SNR降级最小化。这可用例如根据本发明的SNRCA系统实现,其限制SNR降级的量。
3、SNR驱动的压缩放大系统(SNRCA)
SNRCA为设计来减轻因将CA应用于有噪声信号引起的不合需要的噪声放大的概念。另一方面,其对无噪声信号提供典型CA似的放大。
在上面的部分1中描述的4种情形(针对时域和频域的1a、1b、2a和2b)之中,对于现代HA(即使用放在压缩器前面的NR的HA),只有情形1a和2a是有关的使用情形,其描述了SNRCA必须怎样表现及必须实现什么:
1、情形1a:对于有噪声语音信号(全局输入SNR:低到高)即噪声情形下的语音,SNRCA必须显著减小在低局部(子频带和/或短信号段)输入SNR信号部分可能出现的不合需要的噪声放大,同时在高局部(子频带和/或短信号段)输入SNR信号部分保持典型CA似的放大(即将不显著偏离典型CA放大)。
2、情形1a:对于纯净语音信号(全局输入SNR:无限或非常高),SNRCA必须提供典型CA似的放大,即将不显著偏离典型CA放大:没有引起注意的失真也没有过度放大或者放大不足。
3、情形2a:对于纯(弱调制的)噪声信号(全局输入SNR:负无穷大或者非常低),SNRCA必须放松CA分配的放大(减小总增益)(典型CA就像信号为语音一样分配增益,即忽视全局SNR)。
上面的3种使用情形可解释如下:
1、对于(局部)SNR低于全局SNR的局部信号部分,SNRCA必须减小压缩以避免不合需要的噪声放大,同时对(局部)SNR高于全局SNR的局部信号部分保持压缩以避免放大不足及过度放大。这是关于线性化的要求,即压缩放松。
2、SNRCA必须确保纯/纯净语音接收规定的放大。这是关于语音失真最小化的要求。
3、SNRCA必须避免像语音信号那样放大纯噪声信号。这是关于增益放松的要求。
要求:语音失真最小化
最小失真要求将仅通过线性化和增益放松机制的适当设计和配置进行保证,使得在非常高SNR条件下,它们将不在远离典型CA实现的规定的增益和压缩的方向修改预期增益。
要求:线性化/压缩放松
可能设想通过基于SNR估计量增大电平估计使用的时间常数而实现随SNR而变的线性化。
然而,这种解决方案具有严重的限制:慢下来的CA使不合需要的噪声放大最小化,但冒着在语音开始或者瞬间过度放大的风险。
作为代替,提出提供电平估计量的基于SNR的后处理。在实施例中,提供SNR控制的电平抵消,藉此SNRCA对于递减的SNR使电平估计线性化。
要求:增益放松
当信号不包含语音但仅包含弱调制的噪声时,即当全局(长期及跨子频带)SNR变得非常低时,提供增益放松。
CA逻辑上将这样的噪声信号放大对应于其电平的增益。然而,噪声的这种放大是否真正有用是有疑问的?实际上
-所传送的增益计划针对语音可听度恢复的目的进行分配。纯噪声信号不匹配该使用情形。
-除CA之外,助听器通常还将应用降噪(NR)方案。如上所述,显然,在噪声信号被降噪衰减的同时CA放大噪声信号起反作用。
换言之,CA传送的增益在这些情形下必须(至少部分)放松。因为这样的信号被弱调制,电平估计的时域分辨率(TDR,即所使用的电平估计时间常数)所起的作用趋于零。因此,这样的增益放松不能通过线性化(增大时间常数、估计的电平后校正等)实现。
然而,SNRCA通过减小“电平-增益曲线”单元的输出处的增益实现增益放松,如图3中所示。
SNRCA处理及处理元件:简短描述
使用持续的局部(短期和子频带)及全局(长期和宽带)SNR估计,所提出的SNR驱动的压缩放大系统(SNRCA)能够:
-在限制放大不足的同时提供线性化的压缩以防止SNR降级,并完全避免过度放大;
-在不存在语音的情形下提供减小的增益以防止不合需要的噪声放大。
相较于典型CA,SNRCA由3个新的部分组成:
-局部和全局SNR估计阶段;
-通过估计的电平后处理而线性化(压缩放松);
-通过后处理压缩特性的应用传送的增益进行增益减小(增益放松)。
SNRCA处理及处理元件:完整描述
图1示出了根据本发明的包括SNR驱动的动态压缩放大系统(SNRCA)的听力装置HD的第一实施例。听力装置HD包括用于接收或提供表示时变声音信号的、具有第一动态范围的电平的电输入信号IN的输入单元IU,该电输入信号包括目标信号和/或噪声信号;及用于提供表示电输入信号IN或者其处理后的版本的、可由用户感知为声音的输出刺激(如空气中的声波、身体中的振动或电刺激)的输出单元OU。听力装置HD还包括动态(SNR驱动的)压缩放大系统SNRCA,用于根据用户的听觉能力提供随频率和电平而变的增益(放大或衰减)MCAG,在本发明中称为修改的压缩放大增益。听力装置HD还包括正向增益单元GAU,用于将修改的压缩放大增益MCAG施加到电输入信号IN或者其处理后的版本。听力装置HD的正向通路定义成包括从输入单元IU到输出单元OU的电信号通路。正向通路包括增益施加单元GAU,可能及另外的信号处理单元。
动态(SNR驱动的)压缩放大系统SNRCA(在下面称为SNRCA单元,在图1中由点线矩形框标示)包括电平估计单元LEU,用于提供电输入信号IN的电平估计量LE。CA按(可能在子频带中)估计的信号包络电平LE的函数施加增益。信号IN可建模为包络调制的载波信号。CA的目标包括根据时域包络电平进行足够的增益分配以补偿募集效应,保证可听度。为此,仅调制的包络包含有关信息即电平信息。载波信号,按照定义,不包含任何电平信息。这样,CA的分析部分目标在于实现精确和准确的包络调制跟踪,同时消除载波信号。包络调制为以相当慢的功率电平变化编码的信息(时域信息)。该调制产生跨频率范围非均匀出现的功率变化:频谱包络(频域信息)将随时间(相当慢地)变化(子频带时域包络调制,亦称作时域调制的频谱包络)。结果,CA必须使用足够高的时域分辨率(TDR)以保证包络变化的良好跟踪。在这样的最佳TDR,载波信号包络是平的,即未被调制。其仅包含相位信息,而包络包含(平方)幅度信息,其为与CA有关的信息。然而,以较高的TDR观察,载波信号的或多或少的泛音和有噪声性质变得可测量,破坏估计的包络。所使用的TDR必须足够高以保证很好地跟踪时域包络调制(如果希望更线性的表现,其明确可更低)但不能太高,否则,包络电平估计量趋于受到残余载波信号的破坏。在语音情形下,信号通过人发音声道的解剖学确定,其性质被严重减弱[Ladefoged,1996]。尽管性别、年龄和个体差异,人体解剖学产生类似且非常好地界定的信号,如元音,例如[Peterson and Barney,1952]。语音基本源自肺部的空气脉冲振动,非必须地,触发喉内声带的周期振动(或多或少的泛音和有噪声载波信号),声带则经受声道的谐振(频谱包络),其还包括因嘴巴和舌头运动引起的修改(调制的时域包络)。因舌头和嘴巴引起的修改在时域产生相当慢的电平和频率变化(时域调制的频谱包络)。在更高的TDR时,语音还包括分类为时域精细结构(TFS)的更精细的元素,其包括因空气的收缩及随后的释放引起的更精细的泛音和有噪声特性以形成例如摩擦辅音。载波信号实际上为TFS的模型,而包络调制为因声道运动引起的效果的模型。越来越多的研究表明,具有感觉神经听力损失的个体失去了从TFS提取信息的能力,例如[Moore,2008;Moore,2014]。这随着年龄增长更为明显,随着客户变老,他们在访问语音中的TFS线索方面的困难时间递增[Souza&Kitch,2001]。结果,这意味着他们在可懂度方面严重依赖于语音包络。为估计电平,CA方案必须选择包络并去除载波信号。为实现该处理,LEU包括信号整流(通常平方整流),其后为(可能非线性且时变的)低通滤波器。整流步骤去除相位信息但保留幅度信息。低通滤波步骤使不是包络调制的一部分但由载波信号整流期间产生的高频分量引起的残余高频幅度变化平滑。为改善该处理,通常可预处理IN以使其具有分析性,例如使用希尔伯特变换。SNRCA单元还包括电平后处理单元LPP,用于根据第一控制信号CTR1提供输入信号IN的修改的电平估计量MLE(基于电平估计量LE)。SNRCA单元还包括电平压缩单元L2G(也称为电平-增益单元),用于根据修改的电平估计量MLE和表示用户的听觉能力的听力数据(HLD,例如被提供在听力装置的存储器中,及电平压缩单元L2G可经用户特有数据信号USD访问(如形成电平压缩单元L2G的一部分))提供压缩放大增益CAG。用户的听力数据包括表征用户的听力受损(例如偏离正常听觉能力)的数据,通常包括用户的随频率而变的听觉阈电平。电平压缩单元配置成根据验配算法确定压缩放大增益CAG从而提供用户特有随电平和频率而变的增益。在此基础上,电平压缩单元配置成针对(给定时间的)电输入信号的给定(修改的)电平MLE提供适当的(随频率和电平而变的)增益。SNRCA单元还包括增益后处理单元GPP,用于根据第二控制信号CTR2提供修改的压缩放大增益MCAG。
SNRCA单元还包括控制单元CTRU,配置成分析电输入信号IN(或源自其的信号)并提供电输入信号IN的分类,从而基于该分类提供第一和第二控制信号CTR1、CTR2。
图2A示出了用于根据本发明的例如如图1中所示的听力装置HD的动态压缩放大系统SNRCA的控制单元CTRU(在图2A中由点线矩形框标示)的第一实施例。控制单元CTRU配置成按多个不同的类别对声学环境进行分类。多个不同的类别例如可包括下述之一或多个:噪声情形下的语音、安静情形下的语音、噪声和纯净语音。控制单元CTRU包括分类单元CLU,配置成基于电输入信号IN(作为备选或者另外,基于来自一个或多个检测器的状态信号STA或者受其影响,在图2A中用虚线标示)对(例如佩戴听力装置的用户周围的)当前声学情形进行分类并提供标示或表征该声学环境(和/或当前电输入信号)的输出CLA。控制单元CTRU包括电平和增益修改单元LGMOD,用于提供第一和第二控制信号CTR1和CTR2,其用于分别在SNRCA单元的电平后处理单元LPP和增益后处理单元GPP中修改电平和增益(例如参见图1)。
图2B示出了用于根据本发明的听力装置HD的动态压缩放大系统SNRCA的控制单元CTRU的第二实施例。图2B的控制单元与图2A的实施例类似。差别在于图2A的分类单元CLU在图2B中示为包括局部和全局信噪比估计单元(分别为LSNRU和GSNRU)。局部信噪比估计单元LSNRU提供相对短时间(τL)和子频带特有(ΔfL)的信噪比(信号LSNR),称为局部SNR。全局信噪比估计单元GSNRU提供相对长时间(τG)和宽带(ΔfG)信噪比(信号GSNR),称为全局SNR。术语相对长和相对短在本说明书中指确定全局SNR(GSNR)涉及的时间常数τG和频率范围ΔfG大于确定局部SNR(LSNR)涉及的对应时间常数τL和频率范围ΔfL。局部SNR和全局SNR(分别为信号LSNR和GSNR)馈给电平和增益修改单元LGMOD并用于确定控制信号CTR1和CTR2。
图2C示出了用于根据本发明的听力装置HD的动态压缩放大系统SNRCA的控制单元CTRU的第三实施例。图2C的控制单元与图2A和图2B的实施例类似。图2C中所示的控制单元CTRU的实施例包括第一和第二电平估计器(分别为LEU1和LEU2),配置成分别提供电输入信号IN的电平的第一和第二电平估计量LE1和LE2。电平的第一和第二估计量LE1和LE2分别使用第一和第二时间常数确定,其中第一时间常数小于第二时间常数。第一和第二电平估计器LEU1和LEU2因而分别对应于(相对)快和(相对)慢电平估计器,从而分别提供快和慢电平估计量LE1和LE2。第一和/或第二电平估计量LE1、LE2在子频带中提供。在图2C的实施例中,第一和第二电平估计量LE1和LE2分别馈给第一信噪比单元LSNRU,从而通过处理快和慢电平估计量LE1和LE2提供局部SNR(信号LSNR)。局部SNR(信号LSNR)馈给第二信噪比单元GSNRU,从而通过处理局部SNR(例如平滑(如求平均),例如提供宽带值)而提供全局SNR(信号GSNR)。在图2C的实施例中,全局SNR和局部SNR(信号GSNR和LSNR)馈给电平修改单元LMOD,在其基础上,提供用于在SNRCA单元(参见图1)的电平后处理单元LPP中修改电输入信号的电平的第一控制信号CTR1。图2C中所示的控制单元CTRU的实施例还包括语音不存在似然估计单元SALEU形式的话音活动检测器,用于识别电输入信号IN(或者其处理后的版本)包括语音的时间段及不包括语音的时间段(话音活动检测),或者识别以某一概率包括语音或不包括语音的时间段(话音活动估计),并提供标示识别结果的语音不存在似然估计信号SALE。语音不存在似然估计单元SALEU优选配置成在多个子频带中提供语音不存在似然估计信号SALE。在实施例中,语音不存在似然估计单元SALEU配置成使得语音不存在似然估计信号SALE标示语音不存在可能性。在图2C的实施例中,全局SNR和语音不存在似然估计信号SALE馈给增益修改单元GMOD,在其基础上,提供用于修改SNRCA单元(参见图1)的增益后处理单元GPP的增益的第二控制信号CTR2。
图2D示出了用于根据本发明的听力装置HD的动态压缩放大系统SNRCA的控制单元CTRU的第四实施例。图2D的控制单元与图2C的实施例类似。然而,在图2D中所示的控制单元CTRU的实施例中,提供全局SNR(信号GSNR)而不是局部SNR(信号LSNR)的第二信噪比单元GSNRU(直接)接收第一(相对快)电平估计量LE1,及另外,第二(相对慢)电平估计量LE2,并配置成使全局SNR(信号GSNR)的确定基于两个信号进行。
图2E示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第五实施例。图2E的控制单元与图2D的实施例类似。然而,在图2E所示的控制单元CTRU的实施例中,用于提供标示“无语音”环境的语音不存在似然估计信号SALE的语音不存在似然估计单元SALEU将来自第二信噪比单元GSNRU的GSNR(全局SNR)取为输入,即电输入信号IN的处理后的版本,而不是直接将电输入信号IN取为输入(如图2C、2D中所示)。
图2F示出了用于根据本发明的听力装置的动态压缩放大系统的控制单元的第六实施例。图2F的控制单元CTRU与图2E的实施例类似。然而,在图2F所示的控制单元实施例中,提供全局SNR(信号GSNR)的第二信噪比单元GSNRU配置成使全局SNR(信号GSNR)的确定基于局部SNR(信号LSNR,如图2C中所示),而不是基于第一(相对快)电平估计量LE1和第二(相对慢)电平估计量LE2(如图2D、2E中所示)。
图3示出了根据本发明的包括动态压缩放大系统SNRCA的听力装置HD的第二实施例的简化框图。图3实施例的SNRCA单元可分为五个部分:
1、电平包络估计阶段(包括单元LEU1、LEU2),分别提供快和慢电平估计量LE1和LE2。时域包络的电平在高(LE1)和低(LE2)时域分辨率下进行估计。
-高时域分辨率(TDR)包络估计量LE1是调制的时域包络在最高希望的TDR下的估计量。最高TDR意味着TDR足够高以包含所有包络变化但足够小以去除由整流的载波信号引起的大部分信号纹波。这样的高TDR提供关于信号包络电平的强时间局部化信息。为了该目的,LEU1使用小的时间常数τL。由LEU1传递的平滑效果设计成提供准确和精确的调制的包络电平估计量,没有由整流的载波信号引起的残余纹波(即语音时域精细结构TFS)。
-低时域分辨率(TDR)包络估计量LE2是时域包络平均值的估计量。包络调制用希望的强度平滑:LE2为包络变化的全局(平均)观测结果。相较于LEU1,LEU2使用低TDR即大时间常数τG。
2、SNR估计阶段(包括单元NPEU、LSNRU、GSNRU和SALEU),其可提供并包括:
-局部SNR估计量:短时间和子频带(参见下面提供信号LSNR的单元LSNRU的详细描述);
-全局SNR估计量:长时间和宽带(参见下面提供信号GSNR的单元GSNRU的详细描述);
-语音不存在似然估计阶段(单元SALEU),提供标示给定时间的电输入信号IN中存在或不存在话音的可能性的信号SALE。为了该目的,根据希望的语音不存在似然估计质量,可使用任何适当的语音存在概率(即软决策)算法或者平滑的VAD或者语音停顿检测(平滑的硬决策)(参见[Ramirez,Gorriz,Segura,2007],不同的现代方法的概览)。然而,应注意,为保持所需要的计算资源低电流(在电池驱动的便携电子装置如助听器中是有利的),提出将全局SNR估计量(信号GSNR)再次用于语音不存在估计:在GSNR信号上应用滞后(如果GSNR足够高,输出为0(语音);或者如果GSNR足够低,输出为1(没有语音)),其后为可变时间常数低通滤波。时间常数受基于信号GSNR的变化量的决策控制。如果变化小,时间常数无穷大(冻结更新)。如果变化足够大,时间常数因此有限。变化的幅度通过将非线性滤波应用于滞后输出进行估计。
-噪声功率估计单元NPEU可使用任何适当的算法。根据希望的噪声功率估计质量,可使用相对简单的算法(如[Doblinger;1995])或者更复杂的算法(如[Cohen&Berdugo,2002])。然而,为保持所需要的计算资源低电流(在电池驱动的便携电子装置如助听器中是有利的),提出提供基于非线性低通滤波器的噪底估计器实施,其基于输入信号选择平滑时间常数,类似于[Doblinger;1995],具有下面描述的增强:上升和释放模式之间的决策通过调制的包络(再用LE1)和调制的包络平均(再用LE2)的观察数据增强。噪声功率估计器在输入信号正释放时使用小时间常数,否则其使用大时间常数,类似于[Doblinger;1995]。增强如下:大时间常数在调制的包络高于平均包络(LE1大于LE2)或者在LE1正增大时甚至可能变得无穷大(估计量更新冻结)。该设计被优化以在语音停顿期间和自然发声的音素之间传送高质量的噪声功率估计量。实际上,过估计包含语音的信号段上的噪声(设计中的典型问题,类似于[Doblinger;1995])不代表与传统降噪(NR)应用中类似的重大危险。尽管过估计的噪声功率立即产生低估的局部SNR(参见单元LSNRU,图4A),其进而限定比必要的更接近零的电平偏离量(参见单元LMOD,图5A),可能对用于馈送压缩特性的电平将没有任何作用。实际上,噪声功率过估计与语音功率成正比。然而,语音功率越大,在单元LPP(图6A)中快速估计量(信号DBLE1,其为按dB转换的快速电平估计量LE1)大于偏置的慢速估计量BLE2的机会越大,其通过所选的最大化函数(单元MAX)馈送压缩特性。
3、电平包络后处理阶段(包括单元LMOD和LPP),提供修改的估计的电平(信号MLE),其通过将调制的包络的电平(信号LE1)即包络的瞬时或短期电平、包络平均电平(信号LE2)即包络的长期电平、及取决于局部和全局SNR(信号LSNR、GSNR)的电平偏离偏差(信号CTR1)相结合获得。相较于瞬间短期电平(信号LE1),修改的估计的电平(信号MLE)对于降级的SNR条件可提供线性化的表现(压缩放松)。
4、压缩特性(包括提供信号CAG的单元L2G):其由电平-增益映射曲线函数组成。该曲线使用M个子频带电平估计量作为输入产生Q个不同通道之中的每一通道q的通道增益gq,q=0,...,Q-1。输出信号CAG包含Gq,Q个通道增益按dB转换,即Gq=20log10(gq)。如果M个估计子频带和Q个增益通道具有一对一关系(暗含M=Q),电平-增益映射简单地为gm=gm(lm)。如果不使用这样的平凡映射,例如当M<Q时,映射使用一些插值(为简单起见,通常零阶插值)进行。在该情形下,每一gq可能为M个电平估计量lm的函数,即gq=gq(l0,...,lM-1),m=0,...,M-1。映射经常在将电平估计量转换为dB之后实现,即Gq(L0,...,LM-1),Lm=10log10(lm)。作为输入,代替电输入信号IN的包络的电平的“真实”估计量LE1,其接收修改的(在LPP单元中后处理的)电平估计量MLE。换言之,MLE包含M个子频带电平估计量(参见LPP单元,图6A)。
5、增益后处理阶段(包括提供修改的增益(信号MCAG)的单元GMOD和GPP):语音不存在似然估计量(信号SALE,参见图2C-2F)控制增益减小偏离量(参见提供控制信号CTR2的单元GMOD)。施加在压缩特性的输出上(信号CAG),其在纯噪声环境中放松规定的增益,从而提供修改的压缩放大增益(信号MCAG)。
如图1的实施例中一样,修改的压缩放大增益(信号MCAG)在正向单元GAU(如乘法器,如果增益在线性域中进行表达;或者求和单元,如果增益在对数域中进行表达)中施加到正向通路的信号。如图1中所示,听力装置HD还包括输入单元IU和输出单元OU,在其间形成正向通路。正向通路通过适当定位的滤波器组(如本领域众所周知的,包括相应的分析和合成滤波器组)拆分为子频带,或者可在时域运行(宽带)。
正向通路可包括另外的处理单元,例如用于应用其它信号处理算法,例如频移、频率变换、波束形成、降噪等。
局部SNR估计(单元LSNRU)
图4A示出了局部SNR估计单元LSNRU的实施例。LSNRU单元根据希望的SNR估计质量可使用任何适当的算法(如[Ephraim&Malah;1985])。然而,为保持所需要的计算资源低电流(在电池驱动的便携电子装置如助听器中是有利的),提出使用基于最大似然SNR估计器的实施。设为高TDR电平估计器LEU1在第m个子频带的输出信号LE1,即有噪声语音的时频局部功率的估计量,为噪声功率估计器NPEU在第m个子频带的输出信号NPE,即在子频带m的时频局部噪声功率的估计量,及为输入局部SNR的估计量。按如下获得:
为SNR估计器单元LSNRU的输出信号LSNR。通过将转换为分贝获得:
要求饱和,因为没有它,信号可达到无限的值(具体地,等于由计算期间使用的饱和函数导致的负无穷大的值)。这通常可产生:
-对于接近于0,强量化误差;及对于非常大的过流问题。
-必须在后面的阶段进行平滑(参见全局SNR估计,GSNRU单元)。没有饱和,极值在平滑期间将引入巨大的滞后。
必须进行Ξfloor,m和Ξceil,m跨越的运行范围的选择,使得平滑的
-将不被太强地偏差
-将不会由于极值而滞后
[Ξfloor,m,Ξceil,m]的典型值为[-25,100]dB。
在LSNRU单元中,信号W1包含信号LE1和NPE的零底(单元MAX1)差(单元SUB1),转换成分贝(单元DBCONV1),即信号W2包含转换为分贝(单元DBCONV2)的信号NPE。单元SUB2计算DW,即信号W1和W2之间的差,即单元MAX2使DW以信号F为底,F为具有由单元FLOOR产生的值Ξfloor,m的恒定信号。单元MIN使MAX2单元的输出以信号C为天花板,C为具有由单元CEIL产生的值Ξceil,m的恒定信号。MIN的输出信号为信号LSNR,其由给出,如上所述。
全局SNR估计(单元GSNRU)
图4B示出了全局SNR估计单元GSNRU的实施例。GSNRU单元根据希望的SNR估计质量可使用任何专门的(即独立于局部SNR估计)和适当的算法(如[Ephraim&Malah;1985])。然而,为保持所需要的计算资源低电流(在电池驱动的便携电子装置如助听器中是有利的),提出通过在分贝域跨时间和频率对局部SNR求平均简单地估计输入全局SNR。对于全局SNR的估计量(单元GSNRU的输出信号GSNR)和局部SNR的估计量(单元LSNRU的输出信号LSNR):
A为线性低通滤波器,通常为一阶无限脉冲响应滤波器,配置成使得τG为总平均时间常数,即使得为全局输入SNR转换为dB的估计量:
其中为GSNRU单元的输出(信号GSNR)。
在GSNRU单元中,包含M个局部SNR估计量的输入信号LSNR被拆分(单元SPLIT)成M个不同的输出信号(LSNR0,LSNR1,LSNR2,…LSNRM-1),它们中的每一个包含转换成分贝的第m个局部SNR,即单元A0,A1,A2,…,AM-1分别对LSNR0,LSNR1,LSNR2,…LSNRM-1应用线性低通滤波器A并分别产生输出信号AOUT0,AOUT1,AOUT2,…,AOUTM-1。这些输出信号分别包含在单元ADDMULT中,信号AOUT0,AOUT1,AOUT2,…,AOUTM-1被求和然后乘以因子1/M以产生包含如上所述的的输出信号GSNR。
图5A示出了电平修改单元LMOD的实施例。所需要的线性化(压缩放松)的量在LMOD单元中计算。LMOD单元的输出信号CTR1为电平估计偏离量,使用dB格式。单元LPP(参见图3和6A)使用CTR1对估计的电平LE1和LE2进行后处理使得在输入SNR递减时CA表现为正获得线性化。SNR2ΔL单元包含将偏置局部估计的SNR(信号BLSNR)变换为电平估计偏离信号CTR1的映射函数。
为产生偏置局部SNR(循环BLSNR),单元ADD将SNR偏差(信号ΔSNR)加到局部SNR(信号LSNR):
单元SNR2ΔSNR通过映射(信号GSNR)即全局SNR(参见GSNRU单元,图3)对于每一子频带m产生SNR偏差(信号ΔLSNR)如下:
h=ΔΞmin,m-s·Ξmin,m
r=-h/s
ΔΞmin,m<ΔΞmax,m≤0,分别指子频带m的最小和最大SNR偏差;Ξmin,m<Ξmax,m,子频带m的、分别在ΔΞmin,m和ΔΞmax,m饱和的阈值SNR值。
单元SNR2ΔL通过映射每一子频带m的偏置局部SNR(信号BLSNR)产生电平估计偏离量ΔLm[n](信号CTR1)如下:
h=ΔLmax,m-s·Bmin,m
r=-h/s
ΔLmin,m<ΔLmax,m≤0,分别指子频带m的最小和最大电平估计偏离量;Bmin,m<Bmax,m,子频带m的、分别在ΔLmax,m和ΔLmin,m饱和的阈值SNR值。
图5B示出了增益修改单元GMOD的实施例。所需要的衰减量(增益放松),其为语音不存在似然的函数,在GMOD单元中计算。语音不存在似然(信号SALE)在似然-归一化增益单元LH2NG中被映射到归一化的修改增益信号NORMMODG。LH2NG单元中实施的映射函数将为[0,1]的SALE范围映射到同样为[0,1]的修改增益NORMMODG范围。单元MULT通过使NORMMODG乘以恒定信号MAXMODG产生修改增益(输出信号CTR2)。GMODMAX单元存储希望的最大增益修改值,其定义恒定信号MAXMODG。该值使用dB格式并严格为正。该值在以0dB开始并通常跨高达6、10或12dB的范围中配置。映射函数具有下面的形式,对于子频带m中语音不存在似然pm[n](信号SALE)和子频带m的输出权重wm[n](信号NORMMODG):
wm[n]=min(f(max(pm[n]-ptol,0),1/(1-ptol)),1)
ptol定义公差(低于ptol的似然产生等于零的修改增益),f为跨区间[ptol,1]具有1/(1-ptol)的平均斜率的映射函数。然而,为保持所需要的计算资源低电流(在电池驱动的便携电子装置如助听器中是有利的),提出简单地使f跨[ptol,1]线性,即
wm[n]=min(1/(1-ptol)·max(pm[n]-ptol,0),1)
通常,ptol的最小值为ptol=1/2。
-当由单元SALEU(图3)提供的语音不存在似然估计量pm[n](信号SALE)超出ptol时,增益减小偏离量即修改增益(信号CTR2)变为非零。
-信号CTR2与信号SALE成正比地增加并在SALE等于1时达到其最大值MAXMODG。
图6A示出了电平后处理单元LPP的实施例。所需要的线性化(压缩放松)在LPP单元中施加。电平估计量(输入信号LE1和LE2)分别在DBCONV1和DBCONV2单元中转换为dB:
及
LPP单元输出(信号MLE)通过针对每一子频带m将局部和全局电平估计量(分别为和)与来自LMOD单元的电平偏离量(信号CTR1)进行组合而获得:
图6B示出了增益后处理单元GPP的实施例。所需要的衰减(增益放松)在GPP单元中施加。为产生输出信号MCAG(修改的CA增益),GPP单元使用2个输入:信号CAG(CA增益,其为电平-增益映射单元L2G的输出)和信号CTR2(其为GMOD单元的输出)。二者均按dB格式化。信号CTR2包含必须从CAG减去以产生MCAG的增益校正。单元SUB执行该减运算。
然而,在单元L2G(参见图3)中,经常的情形是,增益(信号CAG)使用不同于估计的电平(信号MLE)和/或比其高的FDR。估计的电平(信号MLE)在被映射到增益Gq[n]=Gq(L0,τ[n],...,LM-1,τ[n])(信号CAG)之前被(通常零阶插值),q=0,...,Q-1。在该情形下,增益校正(信号CTR2)必须馈给类似的插值阶段(单元INTERP)以用CAG使用的FDR产生以内插值替换的修改增益(信号MG)。MG可从CAG减去(在单元SUB中)以产生修改的CA增益MCAG。
图7示出了根据本发明的听力装置的运行方法的实施例的流程图。该方法包括下面概述的步骤S1-S8。
S1,接收或提供表示时变声音信号的具有第一动态范围的电平的电输入信号,所述电输入信号包括目标信号和/或噪声信号;
S2,提供所述电输入信号的电平估计量;
S3,根据第一控制信号提供所述电输入信号的修改的电平估计量;
S4,根据修改的电平估计量及表示用户的听觉能力的听力数据提供压缩放大增益;
S5,根据第二控制信号提供修改的压缩放大增益;
S6,分析所述电输入信号以提供所述电输入信号的分类,及基于所述分类提供第一和第二控制信号;
S7,将修改的压缩放大增益应用于所述电输入信号或者其处理后的版本;
S8,提供表示所述电输入信号或者其处理后的版本的、可由用户感知为声音的输出刺激。
如果方便或者适当,一些步骤可按不同于上面概述的另一顺序执行(或实际上并行执行)。
图8A示出了不同的时域电平包络估计量。信号INDB为图3的输入信号IN的平方并转换为分贝的信号(dB SPL-时间[s])。电平估计量LE1为高时域分辨率(TDR)电平估计器LEU1的输出。其通常表示典型CA方案针对音素时域分辨率调谐而产生的电平估计量:音素被个别地电平估计。然而,这样的高精度跟踪对于语音停顿(输入SNR等于负无穷大)或者强噪声破坏的轻声音素(十分负的输入SNR)传送高增益。另一方面,SNRCA使用的电平估计量MLE(图6A的单元LPP的输出信号)在语音停顿期间或者针对被噪声太强破坏的轻声音素逆着长期电平变弱。在低局部输入SNR信号段,放大被线性化,即压缩被放松。此外,MLE在大声音素期间等于LE1以保证预期的压缩并避免过度放大。在高局部输入SNR,放大不被线性化,即压缩不被放松。
图8B示出了由CA和SNRCA在不存在语音的信号段传送的增益。在该图的上部,信号INDB为图3的输入信号IN的平方并转换为dBSPL。其包含高达17.5秒的有噪声语音,之后仅为噪声。在28秒有有噪声的点击。在该图的下部,增益CAG为L2G单元(参见图3)的输出。其通常表示典型CA方案产生的增益。高增益针对低电平背景噪声传送。另一方面,增益MCAG(GPP单元的输出,参见图3),其由SNRCA使用,在几秒之后被放松。SNRCA经SALEU单元(参见图3)认识到输入全局SNR足够低。这意味着语音不再存在。放大被减小。应注意,该系统对于潜在的非稳态噪声例如位于28秒处的冲击性点击噪声鲁棒:增益保持放松。
图8C示出了CA处理有噪声语音的输出的谱图。在语音停顿或者轻声音素期间,背景噪声接收相当高的增益。这样的现象被称为“泵浦”及通常为SNR降级的时域征兆。
图8D示出了SNRCA处理有噪声语音的输出的谱图。在语音停顿或者轻声音素期间,背景噪声相较于CA处理(图8C)得到小得多的增益,因为放大被线性化,即压缩被放松。这强有力地限制了SNR降级。
图8E示出了CA处理有噪声语音的输出的谱图。当语音不存在时(约从14秒到39秒),背景噪声接收非常高的增益,产生不合需要的噪声放大。
图8F示出了SNRCA处理有噪声语音的输出的谱图。当语音不存在时(约从14秒到39秒),一旦SNRCA已认识到语音不存在并开始放松增益(约在18秒处),背景噪声不会获得非常高的增益,避免不合需要的噪声放大。
总之,传统的压缩放大(CA)针对安静情形下的语音设计(即通过验配根据进行规定)。具有现实世界(有噪声)信号的CA具有下述性质(时域和频域):
a)如果输入SNR>0,压缩器输出处的SNR小于压缩器输入处的SNR(SNR降级);
b)如果输入SNR<0,压缩器输出处的SNR大于压缩器输入处的SNR(SNR提高);
c)情形b)不可能,尤其在使用降噪时;
d)当压缩器输入处的SNR趋向负无穷大(仅噪声)时,可能根本不放大更好。
从a)得出的结论:如果信号有噪声,压缩可能是差的想法。想法:按SNR的函数放松压缩。
从d)得出的结论:纯噪声信号不被强调制,这样,压缩比(作为时间常数、通道数量和增益图中的静态压缩比的函数)具有有限的影响。想法:另一方面,放松放大可能是合理的,因为施加的增益针对同样电平的纯净语音确定。
SNRCA概念/想法:使用SNR估计驱动压缩放大。
-如果信号有噪声,使扬声器线性化(压缩放松)。
-如果信号为纯噪声,减小增益(增益放松)(在增益图的输出处施加衰减)。
-根据本发明的SNRCA概念不是降噪系统,而实际上与降噪互补。降噪越好,该系统带来的好处越多。实际上,NR越好,在压缩器输入处具有正SNR的机会越大。
本发明的实施例例如在动态电平压缩有关的应用如助听器中有用。本发明还可在下述应用中有用:头戴式耳机、耳麦、耳朵保护系统、免提电话系统、移动电话、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的及权利要求中限定的装置的结构特征可与本发明方法的步骤结合。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或“耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非明确指出,在此公开的任何方法的步骤不必须精确按所公开的顺序执行。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一般原理可应用于其他方面。
权利要求不限于在此所示的各个方面,而是包含与权利要求语言一致的全部范围,其中除非明确指出,以单数形式提及的元件不意指“一个及只有一个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
因而,本发明的范围应依据权利要求进行判断。
缩写词
参考文献
●[Keidser et al.;2011]Keidser G,Dillon H,Flax M,Ching T,Brewer S.(2011).The NAL-NL2 prescription procedure.Audiology Research,1:e24.
●[Scollie et al.;2005]Scollie,S,Seewald,R,Cornelisse,L,Moodie,S,Bagatto,M,Laurnagaray,D,Beaulac,S,&Pumford,J.(2005).The Desired SensationLevel Multistage Input/Output Algorithm.Trends in Amplification,9(4):159-197.
●[Naylor;2016)],Naylor,G.(2016).Theoretical Issues of Validity inthe Measurement of Aided Speech Reception Threshold in Noise for ComparingNonlinear Hearing Aid Systems.Journal of the American Academy of Audiology,27(7),504-514.
●[Naylor&Johannesson;2009],Naylor,G.&Johannesson,R.B.(2009).Long-term Signal-to-Noise Ratio(SNR)at the input and output of amplitudecompression systems.Journal of the American Academy of Audiology,Vol.20,No.3,pp.161-171.
●[Doblinger;1995]Doblinger,Gerhard."Computationally efficient speechenhancement by spectral minima tracking in subbands."Power 1(1995):2.
●[Cohen&Berdugo,2002]Cohen,I.,&Berdugo,B.(2002).Noise estimation byminima controlled recursive averaging for robust speech enhancement.IEEEsignal processing letters,9(1),12-15.
●[Ephraim&Malah;1985],Ephraim,Yariv,and David Malah."Speechenhancement using a minimum mean-square error log-spectral amplitudeestimator."Acoustics,Speech and Signal Processing,IEEE Transactions on 33.2(1985):443-445.
●[Ramirez,Gorriz,Segura,2007]J.Ramirez,J.M.Gorriz and J.C.Segura(2007).Voice Activity Detection.Fundamentals and Speech Recognition SystemRobustness,Robust Speech Recognition and Understanding,Michael Grimm andKristian Kroschel(Ed.).
●[Peterson and Barney,1952]Peterson,G.E.,&Barney,H.L.(1952).Controlmethods used in a study of the vowels.The Journal of the acoustical societyof America,24(2),175-184.
●[Ladefoged,1996]Ladefoged,P.(1996).Elements of acousticphonetics.University of Chicago Press.
●[Moore,2008]Moore,B.C.J.(2008).The choice of compression speed inhearing aids:theoretical and practical considerations and the role ofindividual differences.Trends in Amplification,12(2),103–12.
●[Moore,2014]Moore,B.C.J.(2014).Auditory Processing of Temporal FineStructure:Effects of Age and Hearing Loss.World Scientific Publishing CompanyLtd.Singapore.
●[Souza&Kitch,2001]Souza,P,E.&Kitch,V.(2001).The contribution ofamplitude envelope cues to sentence identification in young and agedlisteners.Ear and Hearing,22(4),112-119.
Claims (15)
1.一种听力装置,包括:
-输入单元,用于接收或提供表示时变和频变声音信号的具有第一动态范围的电平的电输入信号,所述电输入信号包括目标信号和/或噪声信号;
-输出单元,用于提供表示所述电输入信号或者其处理后的版本的、可由用户感知为声音的输出刺激;及
-动态压缩放大系统,包括
--电平估计器单元,用于提供所述电输入信号的电平估计量;
--电平后处理单元,用于根据第一控制信号提供所述电输入信号的修改的电平估计量;
--电平压缩单元,用于根据修改的电平估计量及表示用户的听觉能力的听力数据提供压缩放大增益;
--增益后处理单元,用于根据第二控制信号提供修改的压缩放大增益;
--控制单元,配置成分析所述电输入信号及提供所述电输入信号的分类,及基于所述分类提供第一和第二控制信号;及
-正向增益单元,用于将修改的压缩放大增益应用于所述电输入信号或者其处理后的版本。
2.根据权利要求1所述的听力装置,其中所述电输入信号的所述分类标示用户的当前声学环境。
3.根据权利要求1所述的听力装置,其中所述控制单元配置成根据电输入信号或者其处理后的版本中的目标信号和噪声信号分量的当前混合提供所述分类。
4.根据权利要求1所述的听力装置,包括话音活动检测器,用于识别电输入信号包括语音的时间段和不包括语音的时间段,或者识别以某一概率包括语音或者不包括语音的时间段,并提供标示这些时间段的话音活动信号。
5.根据权利要求1所述的听力装置,其中所述控制单元配置成根据当前的目标信号与噪声信号的比提供所述分类。
6.根据权利要求1所述的听力装置,其中电输入信号被接收或提供为多个子频带信号。
7.根据权利要求1所述的听力装置,包括存储器,其中存储用户的听力数据或者源自所述听力数据的数据或算法。
8.根据权利要求1所述的听力装置,其中电平检测器单元配置成提供电输入信号的包络的电平的估计量。
9.根据权利要求1所述的听力装置,包括配置成分别提供电输入信号的电平的第一和第二估计量的第一和第二电平估计器,所述电平的第一和第二估计量分别使用第一和第二时间常数确定,其中第一时间常数小于第二时间常数。
10.根据权利要求1所述的听力装置,其中控制单元配置成确定电输入信号或者其处理后的版本的第一和第二信噪比,其中第一和第二信噪比分别称为局部SNR和全局SNR,及其中局部SNR指相对短时间(τL)和子频带特有(ΔfL)信噪比,及其中全局SNR指相对长时间(τG)和宽带(ΔfG)信噪比,及其中确定全局SNR涉及的时间常数τG和频率范围ΔfG大于确定局部SNR涉及的对应时间常数τL和频率范围ΔfL。
11.根据权利要求10所述的听力装置,其中第一控制信号基于第一和第二信噪比确定。
12.根据权利要求1所述的听力装置,其中第二控制信号基于电输入信号或者其处理后的版本的平滑的信噪比确定。
13.根据权利要求4所述的听力装置,其中第二控制信号根据话音活动信号确定。
14.根据权利要求1所述的听力装置,包括助听器、头戴式耳机、耳麦、耳朵保护装置或其组合。
15.听力装置的运行方法,包括:
-接收或提供表示时变和频变声音信号的具有第一动态范围的电平的电输入信号,所述电输入信号包括目标信号和/或噪声信号;
-提供所述电输入信号的电平估计量;
-根据第一控制信号提供所述电输入信号的修改的电平估计量;
-根据修改的电平估计量及用户的听力数据提供压缩放大增益;
-根据第二控制信号提供修改的压缩放大增益;
-分析所述电输入信号以提供所述电输入信号的分类,及基于所述分类提供第一和第二控制信号;
-将修改的压缩放大增益应用于所述电输入信号或者其处理后的版本;及
-提供表示所述电输入信号或者其处理后的版本的、可由用户感知为声音的输出刺激。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/389,143 | 2016-12-22 | ||
US15/389,143 US10362412B2 (en) | 2016-12-22 | 2016-12-22 | Hearing device comprising a dynamic compressive amplification system and a method of operating a hearing device |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108235211A true CN108235211A (zh) | 2018-06-29 |
CN108235211B CN108235211B (zh) | 2021-12-14 |
Family
ID=60782084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711415505.4A Active CN108235211B (zh) | 2016-12-22 | 2017-12-22 | 包括动态压缩放大系统的听力装置及其运行方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10362412B2 (zh) |
EP (1) | EP3340657B1 (zh) |
CN (1) | CN108235211B (zh) |
DK (1) | DK3340657T3 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113132882A (zh) * | 2021-04-16 | 2021-07-16 | 深圳木芯科技有限公司 | 多动态范围压扩方法和系统 |
CN114667742A (zh) * | 2019-11-04 | 2022-06-24 | 西万拓私人有限公司 | 用于运行听力系统的方法以及听力系统 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3704870B1 (en) * | 2017-11-02 | 2021-10-20 | Two Pi GmbH | Method for processing an acoustic speech input signal and audio processing device |
WO2021195429A1 (en) * | 2020-03-27 | 2021-09-30 | Dolby Laboratories Licensing Corporation | Automatic leveling of speech content |
EP3961624B1 (de) * | 2020-08-28 | 2024-09-25 | Sivantos Pte. Ltd. | Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals |
DE102021211879A1 (de) * | 2021-10-21 | 2023-04-27 | Sivantos Pte. Ltd. | Hörgerät und Verfahren zum Betrieb eines solchen |
CN116545468B (zh) * | 2023-07-07 | 2023-09-08 | 成都明夷电子科技有限公司 | 一种高速波束赋形芯片 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6198830B1 (en) * | 1997-01-29 | 2001-03-06 | Siemens Audiologische Technik Gmbh | Method and circuit for the amplification of input signals of a hearing aid |
EP2002688A1 (en) * | 2006-03-31 | 2008-12-17 | Widex A/S | Hearing aid and method of estimating dynamic gain limitation in a hearing aid |
CN101529929A (zh) * | 2006-09-05 | 2009-09-09 | Gn瑞声达A/S | 具有基于直方图的声环境分类的助听器 |
US20110013792A1 (en) * | 2009-02-09 | 2011-01-20 | Kenji Iwano | Hearing aid |
CN102047691A (zh) * | 2008-09-10 | 2011-05-04 | 唯听助听器公司 | 助听器中的声音处理方法以及助听器 |
EP2375781A1 (en) * | 2010-04-07 | 2011-10-12 | Oticon A/S | Method for controlling a binaural hearing aid system and binaural hearing aid system |
US20120250883A1 (en) * | 2009-12-25 | 2012-10-04 | Mitsubishi Electric Corporation | Noise removal device and noise removal program |
CN105022316A (zh) * | 2014-05-01 | 2015-11-04 | Gn瑞声达A/S | 用于数字音频信号的多频带信号处理器 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2375781A (en) * | 1941-08-08 | 1945-05-15 | Chrysler Corp | Power transmission |
US6868163B1 (en) * | 1998-09-22 | 2005-03-15 | Becs Technology, Inc. | Hearing aids based on models of cochlear compression |
US7092877B2 (en) | 2001-07-31 | 2006-08-15 | Turk & Turk Electric Gmbh | Method for suppressing noise as well as a method for recognizing voice signals |
US7333623B2 (en) | 2002-03-26 | 2008-02-19 | Oticon A/S | Method for dynamic determination of time constants, method for level detection, method for compressing an electric audio signal and hearing aid, wherein the method for compression is used |
WO2008106036A2 (en) | 2007-02-26 | 2008-09-04 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
EP2512157B1 (en) * | 2011-04-13 | 2013-11-20 | Oticon A/s | Hearing device with automatic clipping prevention and corresponding method |
WO2012161717A1 (en) * | 2011-05-26 | 2012-11-29 | Advanced Bionics Ag | Systems and methods for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels |
JP6090120B2 (ja) * | 2012-11-12 | 2017-03-08 | ヤマハ株式会社 | 信号処理システムおよび信号処理方法 |
CN105122843B (zh) | 2013-04-09 | 2019-01-01 | 索诺瓦公司 | 向用户提供听力辅助的方法和系统 |
US11614508B1 (en) | 2021-10-25 | 2023-03-28 | Q Bio, Inc. | Sparse representation of measurements |
-
2016
- 2016-12-22 US US15/389,143 patent/US10362412B2/en active Active
-
2017
- 2017-12-22 CN CN201711415505.4A patent/CN108235211B/zh active Active
- 2017-12-22 EP EP17210174.3A patent/EP3340657B1/en active Active
- 2017-12-22 DK DK17210174.3T patent/DK3340657T3/da active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6198830B1 (en) * | 1997-01-29 | 2001-03-06 | Siemens Audiologische Technik Gmbh | Method and circuit for the amplification of input signals of a hearing aid |
EP2002688A1 (en) * | 2006-03-31 | 2008-12-17 | Widex A/S | Hearing aid and method of estimating dynamic gain limitation in a hearing aid |
CN101529929A (zh) * | 2006-09-05 | 2009-09-09 | Gn瑞声达A/S | 具有基于直方图的声环境分类的助听器 |
CN102047691A (zh) * | 2008-09-10 | 2011-05-04 | 唯听助听器公司 | 助听器中的声音处理方法以及助听器 |
US20110013792A1 (en) * | 2009-02-09 | 2011-01-20 | Kenji Iwano | Hearing aid |
US20120250883A1 (en) * | 2009-12-25 | 2012-10-04 | Mitsubishi Electric Corporation | Noise removal device and noise removal program |
EP2375781A1 (en) * | 2010-04-07 | 2011-10-12 | Oticon A/S | Method for controlling a binaural hearing aid system and binaural hearing aid system |
CN105022316A (zh) * | 2014-05-01 | 2015-11-04 | Gn瑞声达A/S | 用于数字音频信号的多频带信号处理器 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114667742A (zh) * | 2019-11-04 | 2022-06-24 | 西万拓私人有限公司 | 用于运行听力系统的方法以及听力系统 |
CN113132882A (zh) * | 2021-04-16 | 2021-07-16 | 深圳木芯科技有限公司 | 多动态范围压扩方法和系统 |
CN113132882B (zh) * | 2021-04-16 | 2022-10-28 | 深圳木芯科技有限公司 | 多动态范围压扩方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
EP3340657B1 (en) | 2020-11-04 |
DK3340657T3 (da) | 2021-01-04 |
US20180184213A1 (en) | 2018-06-28 |
EP3340657A1 (en) | 2018-06-27 |
US10362412B2 (en) | 2019-07-23 |
CN108235211B (zh) | 2021-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11245993B2 (en) | Hearing device comprising a noise reduction system | |
CN107484080B (zh) | 音频处理装置及用于估计声音信号的信噪比的方法 | |
US10966034B2 (en) | Method of operating a hearing device and a hearing device providing speech enhancement based on an algorithm optimized with a speech intelligibility prediction algorithm | |
US10231062B2 (en) | Hearing aid comprising a beam former filtering unit comprising a smoothing unit | |
CN108235211A (zh) | 包括动态压缩放大系统的听力装置及其运行方法 | |
US10580437B2 (en) | Voice activity detection unit and a hearing device comprising a voice activity detection unit | |
CN107801139B (zh) | 包括反馈检测单元的听力装置 | |
CN106507258B (zh) | 一种听力装置及其运行方法 | |
US10154353B2 (en) | Monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system | |
CN107547983B (zh) | 用于提高目标声音的可分离性的方法和听力装置 | |
US20240029751A1 (en) | Sound processing with increased noise suppression | |
US10433076B2 (en) | Audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal | |
CN108235181B (zh) | 在音频处理装置中降噪的方法 | |
US20220124444A1 (en) | Hearing device comprising a noise reduction system | |
US10321243B2 (en) | Hearing device comprising a filterbank and an onset detector | |
US10262675B2 (en) | Enhancement of noisy speech based on statistical speech and noise models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |