CN114567845A - 包括声学传递函数数据库的助听器系统 - Google Patents
包括声学传递函数数据库的助听器系统 Download PDFInfo
- Publication number
- CN114567845A CN114567845A CN202111426116.8A CN202111426116A CN114567845A CN 114567845 A CN114567845 A CN 114567845A CN 202111426116 A CN202111426116 A CN 202111426116A CN 114567845 A CN114567845 A CN 114567845A
- Authority
- CN
- China
- Prior art keywords
- hearing aid
- vector
- atf
- user
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 title claims abstract description 117
- 238000012546 transfer Methods 0.000 title claims abstract description 89
- 239000013598 vector Substances 0.000 claims abstract description 150
- 230000001419 dependent effect Effects 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 101000799554 Homo sapiens Protein AATF Proteins 0.000 claims description 14
- 102100034180 Protein AATF Human genes 0.000 claims description 14
- 230000005236 sound signal Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 8
- 230000001902 propagating effect Effects 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 5
- 230000000996 additive effect Effects 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 210000003128 head Anatomy 0.000 description 81
- 238000000034 method Methods 0.000 description 34
- 238000012360 testing method Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 210000005069 ears Anatomy 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000007476 Maximum Likelihood Methods 0.000 description 7
- 230000033001 locomotion Effects 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 210000000613 ear canal Anatomy 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- OQCFWECOQNPQCG-UHFFFAOYSA-N 1,3,4,8-tetrahydropyrimido[4,5-c]oxazin-7-one Chemical compound C1CONC2=C1C=NC(=O)N2 OQCFWECOQNPQCG-UHFFFAOYSA-N 0.000 description 1
- RXKGHZCQFXXWFQ-UHFFFAOYSA-N 4-ho-mipt Chemical compound C1=CC(O)=C2C(CCN(C)C(C)C)=CNC2=C1 RXKGHZCQFXXWFQ-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001055 chewing effect Effects 0.000 description 1
- 210000000860 cochlear nerve Anatomy 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000003054 facial bone Anatomy 0.000 description 1
- 210000001097 facial muscle Anatomy 0.000 description 1
- 235000021474 generally recognized As safe (food) Nutrition 0.000 description 1
- 235000021473 generally recognized as safe (food ingredients) Nutrition 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/405—Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/552—Binaural
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/554—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/60—Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/51—Aspects of antennas or their circuitry in or for hearing aids
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了包括声学传递函数数据库的助听器系统,所述助听器系统包括:连接到M个传声器的处理器;及包括ATF向量的多个字典Δp的数据库Θ,其中p为人指数,ATF向量的元素ATFm为表示在传声器系统安装在自然人或人造人(p’)的头上或耳朵中时声音从目标声源的方向或位置(θ)到M个传声器中的每一个的随方向或位置(θ)而变的及随频率(k)而变的传播的、随频率而变的声学传递函数,k为频率指数;其中所述字典Δp中的每一个包括给定人(p)对相对于传声器系统的多个不同方向或位置θj的ATF向量;处理器配置成至少在学习运行模式下基于所述数据库Θ的所述多个字典Δp、所述电输入信号xm(n)及声学传播通道的模型确定所述用户的个人化ATF向量(ATF*)。
Description
技术领域
本申请涉及助听器领域,尤其涉及波束形成/降噪。
背景技术
绝对或相对声学传递函数(AATF或RATF)的估计对于听力装置中的算法的适当起作用很重要,例如为了调整波束形成器朝向感兴趣的信号源。EP3413589A1描述了用于估计相对声学传递函数的“字典方法”。
发明内容
在本发明中,提出EP3413589A1的概念的延伸,其可a)导致更好的估计性能;b)降低搜索字典时的计算复杂性;及c)得出关于助听器用户的头部特征和/或助听器在用户耳朵上的位置的信息(这可有利于其它算法,例如传声器位置均衡等)。
第一助听器系统
在本申请的一方面,提供第一助听器系统,其包括配置成佩戴在用户耳朵处的头上或者用户耳朵中的助听器。助听器可包括:
-包括设置在所述助听器中的M个传声器的传声器系统,其中M大于或等于2,传声器系统适于从环境拾取声音并提供M个对应的电输入信号xm(n),m=1,…,M,n表示时间,给定传声器处的环境声音包括下述信号的混合:
--在助听器由用户佩戴时经声学传播通道从目标声源的方向或位置(θ)传播到助听器的第m个传声器的目标声音信号sm(n);及
--在第m个传声器的位置处存在的可能的附加噪声信号vm(n),其中声学传播通道建模为xm(n)=sm(n)hm(θ)+vm(n),其中hm(θ)为该声学传播通道对声音的声学脉冲响应。
助听器系统可包括:
-连接到M个传声器的处理器;及
-包括ATF向量的字典Δp’的数据库Θ,ATF(Acoustic Transfer Function,声学传递函数)向量的元素ATFm,m=1,…,M为表示在传声器系统安装在自然人或人造人(p’)的头上或耳朵中时声音从目标声源的方向或位置(θ)到M个传声器中的每一个的随方向或位置(θ)而变的及随频率(k)而变的传播的、随频率而变的声学传递函数,k为频率指数,k=1,…,K,K为频带数量;其中所述字典Δp’包括所述人(p’)对相对于传声器系统的多个不同方向或位置θj,j=1,…,J的ATF向量;及其中所述字典Δp’的所述ATF向量为助听器方位特定的向量,及其中所述字典Δp’包括,对于所述多个不同方向或位置θj,j=1,…,J,所述人(p’)的头上的多个不同助听器方位的ATF向量。
从而可提供改进的助听器系统。
在术语“方向或位置”中,术语“方向”意为相对于助听器用户具有相同角度(例如鼻子方向)的不同位置(如果在距用户足够距离处,这可导致大致一样的声学传递函数(ATF))。
(通过传声器系统拾取的给定电输入信号定义的)给定声学情形的个人化ATF向量因而可包括对于具体目标声源方向/位置θ*和具体助听器方位来自给定(自然或人造)人p’(已针对该人产生字典Δp’)的字典的、每一传声器(m=1,…,M)的随频率(k=1,…,K)而变的声学传递函数。
声源相对于助听器的传声器(对于每一传声器,在数据库Θ的字典Δp’中可能存在声学传递函数)的具体方向/位置(θj)的数量(J)可以是大于或等于2的任何数量,例如在2到24的范围中,例如在4到16的范围中。
处理器因而可配置成(从数据库Θ的字典Δp’)确定(例如选择)所述用户对于通过电输入信号xm,m=1,…,M定义的给定声学情形的个人化ATF向量向量包括元素即每一传声器一个元素。个人化ATF向量针对给定自然或人造人p’从字典Δp’确定,因而可提供关于估计的目标声源方向/位置θ*的信息以及用户头上的所涉及的助听器的当前方位的估计量。该信息可用作助听器的其它部分的输入,例如用于将处理算法如波束形成算法应用于正向通路的一个或多个信号的信号处理器(例如参见图3中作为处理器(SP)的输入的ATF*,p*,θ*,或者图4中作为波束形成器滤波器(BF)的输入的d*θ,θ*)。
目标声源相对于助听器(或者更具体地,相对于传声器系统)的方向或位置(θ)例如可以是传声器系统的M个传声器之中的参考传声器(m=i)(例如参见图1C(M1L,M1R))。在助听器由用户佩戴时,声音从目标声源的方向或位置(θ)到助听器的第m个传声器的声学传播通道的模型xm(n)=sm(n)hm(θ)+vm(n)可被变换到频域,即Xm(k,l)=Sm(k,l)Hm(θ,k)+Vm(k,l),其中Zm(k,l)(Z=X,S,H,V)为对应的时域表示zm(n)的频域版(例如傅里叶变换,例如短时傅里叶变换(STFT)),l为时间指数例如时间帧指数,Z(z)为声学传播通道的模型中的X(x)(有噪声信号)、S(s)(目标信号)、H(h)(传播通道响应)或V(v)(噪声)。Hm(θ,k)表示声音从“θ处”的声源到助听器的传声器系统的第m个传声器的(绝对)声学传递函数。
M个传声器可按预定几何配置进行布置。术语“预定几何配置”例如可包括传声器位于助听器的壳体中(例如BTE部分或者ITE部分中;或者BTE部分和ITE部分中,在安装到用户头上时,具有通过连接元件(如适应用户容貌的管或线缆)提供的相当恒定的相互布置)。
术语“自然或人造人”可理解为覆盖真实的人以及人造人(例如基于人头和躯干的物理或计算机模型)或者这些人的原型。“自然人”指人类,例如(但通常不)包括用户。“人造人”例如可以是模型,例如来自Brüel&Sound&Vibration Measurement A/S的头和躯干模拟器(HATS)4128C或者来自GRAS Sound and Vibration A/S的头和躯干模型KEMAR或者人的声学传播特性的类似如计算机模型。“人造人”例如可通过“平均头部特征”表征,例如通过组合真人的几个测得的特征而得到。当试图以尽可能小的数据库表示尽可能多的真实头部时,前述“平均头部特征”或“原型头部”有用,小数据库因计算复杂性(搜索)原因和存储器复杂性(存储)原因而符合需要(例如用在低功率设备如助听器中)。例如,可用单一女性“原型”头部代表所有女性,对于男性和孩童,类似。一般地,将用几个“原型头部”来构成数据库。不同的头部特征例如可包括头(大小、形状)、耳朵(大小、形状、位置)、鼻子(大小、形状、位置)、发型、肩膀(形状和大小)等。
随频率而变的声学传递函数可以是绝对或相对声学传递函数,即以特定频率采样的从声源位置到不同传声器的声学传递函数除以以相同频率采样的从声源位置到特定传声器(参考传声器)的声学传递函数。
助听器可包括适于位于用户的耳朵(耳廓)处或后面的BTE部分(例如参见图1A、1B)。传声器系统的M个传声器中的至少部分(如两个以上)可设置在BTE部分中。助听器可包括适于位于用户的耳道处或耳道中的ITE部分。ITE部分可包括传声器系统的M个传声器中的至少部分(如一个以上)。
处理器可配置成基于a)数据库Θ(的字典Δp’)、b)电输入信号xm(n),m=1,…,M和c)具有预定或自适应调节的频率的声学传播通道模型确定用户的个人化ATF向量个人化ATF向量例如可持续确定,例如每时间帧l确定。个人化ATF向量例如可在由标示“新的声学情形”的触发器触发时确定(根据声音电平或频谱含量的变化,例如高于某一阈值度量)。个人化ATF向量例如可根据特定助听器程序或运行模式的启动(如助听器系统的加电)进行确定。
随频率而变的声学传递函数ATF可包括绝对声学传递函数AATF。为确定绝对声学传递函数即字典Δp中的AATF向量Hθ,设x1(n),…,xM(n)指由助听器的传声器拾取的(优选纯净的)测试信号(例如在声学实验室如无回声室中录制)从给定方向或位置(θ)到第m个传声器的绝对声学传递函数AATF(有时称为头部相关传递函数HRTF)Hm(θ,k)可使用本领域已知的程序进行估计。例如,测试声音信号为啁啾声信号(其频率随时间增加的音调信号)可能有益;在该情形下,AATF可使用[Farina,2000]中概述的程序进行估计。助听器例如可假定按计划(传声器的计划方位)安装在给定的自然或人造人的头上。
随频率而变的声学传递函数ATF可包括相对声学传递函数RATF。为从对应的绝对声学传递函数Hθ确定相对声学传递函数(RATF)如字典Δp中的RATF向量dθ,第m个传声器和方向(θ)的RATF向量(dθ)的元素为dm(k,θ)=Hm(θ,k)/Hi(θ,k),其中Hi(θ,k)为从给定方向或位置(θ)到传声器系统的M个传声器中的参考传声器(m=i)的(绝对)声学传递函数。(给定的自然或人造人的)前述绝对和相对声学传递函数可(例如在使用助听器系统之前)进行估计并存储在数据库Θ中(或者数据库Θ的(针对特定自然或人造人的)(分)字典Δp中)。对于来自给定方向或位置(θ)的声音所得的(绝对)声学传递函数(AATF)向量Hθ记为
H(θ,k)=[H1(θ,k)…HM(θ,k)]T,k=1,…,K
来自该方向或位置的相对声学传递函数(RATF)向量dθ记为
d(θ,k)=[d1(θ,k)…dM(θ,k)]T,k=1,…,K
针对不同助听器方位、不同助听器类型(传声器系统配置)、不同的人造和/或自然人(p)、不同的声源方向/位置等在不同频率下的绝对和/或相对声学传递函数可在所涉及的助听器使用之前进行测量并存储在数据库Θ的有关(个人特有的)字典(Δp)中。
数据库Θ可包括多个不同的字典Δp,例如对应于不同的(人造或自然)人(例如具有不同的声学传播特性,例如由不同的头部(或头部特征)导致或受其影响)。不同的字典的数量可以是1或者大于1的任何数量。给定应用的不同字典的相应数量可确定为个人化相对声学传递函数的准确度与计算复杂性之间的折中。为限制计算复杂性,有兴趣将不同字典的数量保持在低于最大值,例如低于100,例如低于10。
用户头上的不同的助听器方位可与通过多个传声器中的至少两个的传声器轴有关,例如参见图1A、1B。不同的助听器方位例如可通过具有水平参考方向的倾斜角描述(例如在水平面中的倾斜角(图1B),或者出水平面(图1A))。不同的助听器方位例如可通过具有给定参考方向的空间中的任何倾斜角描述,当然,一些倾斜角(由于耳朵的容貌)比其它倾斜角更可能。
助听器可适于使得,在助听器被正确地(按计划)安装在用户耳朵处或耳朵中时,可形成通过位于水平面中的多个传声器中的至少两个并指向用户的向前方向的参考传声器轴。参考方向例如可定义为在看向正前方时用户鼻子的方向,例如参见图1C中的LOOK-DIR或者REF-DIRL,REF-DIRR。用户头上的不同的助听器方位例如可与角度有关。助听器方位特定的AATF向量或RATF向量的元素可以分别是绝对或相对声学传递函数或 表示从目标信号源到M个传声器中的每一个(m=1,…,M)的随方向或位置(θ)而变的、随助听器方位而变的以及随频率(k)而变的声学传递函数,或者表示相对于M个传声器中的参考传声器(m=i)的声学传递函数。对于助听器的每一传声器(m),数据库Θ可包括相对于传声器系统的多个不同方向或位置(θ)的绝对或相对传递函数(或)。对于每一方向或位置(θ),数据库Θ可包括用户头上的多个不同的助听器方位的绝对或相对传递函数( 或)。对于每一助听器方位数据库Θ可包括多个不同频率(k)的绝对或相对传递函数(或)。
数据库Θ可包括P个字典Δp,p=1,..,P,其包括对应的多个不同的自然或人造人(p)的AATF向量和/或RATF向量处理器可配置成基于数据库Θ的P个字典Δp,p=1,..,P、电输入信号xm(n),m=1,…,M和声学传播通道的模型确定用户的个人化(随频率而变的)AATF向量或RATF向量不同的人(p)可能具有不同的头部。个人特定的AATF向量或RATF向量的元素分别为绝对或相对传递函数和分别表示从目标信号源到M个传声器中的每一个(m=1,…,M)的随方向或位置(θ)而变的、随人(p,p=1,…,P)而变的、随助听器方位而变的以及随频率(k)而变的绝对声学传递函数和相对于M个传声器中的参考传声器(m=i)的相对声学传递函数不同的人P的数量例如可大于2,如大于5,如大于10,例如在2到100的范围中。
多个字典Δp,p=1,..,P可与对应的具有不同头部例如不同大小或不同形状或不同特有特征如头发、鼻子、耳朵大小或位置等的头部的多个不同的自然或人造人(p)相关联。多个字典Δp,p=1,..,P可与针对其已生成如测得具体的AATF向量或RATF向量的不同的自然或人造人相关联。
可针对部分或所有频率指数(k)使用同样的AATF向量或RATF向量或Hθ,p,dθ,p或来估计给定的个人化AATF向量或RATF向量(H*θ,d*θ)而确定不同频率指数(k)时用户的个人化AATF向量或RATF向量(H*θ,d*θ)。处理器可配置成从联合在一起跨部分或所有频带k的数据库Θ的各个AATF向量或RATF向量或Hθ,p,dθ,p或分别确定用户的个人化AATF向量或RATF向量(H*θ或d*θ)。换言之,用户的个人化AATF向量或RATF向量(H*θ,d*θ)通过选择部分或所有频带的(相同的)候选AATF向量或RATF向量而找到(不使用一个频率指数值k(k’)时的一个元素或 及另一值k(k”)时的另一元素或)。
用户的个人化AATF向量H*θ或RATF向量d*θ可通过统计方法或学习算法确定。用户的个人化AATF向量H*θ或RATF向量d*θ可通过本领域可获得的多种不同方法确定,例如,最大可能性估计(MLE)方法,例如参见EP3413589A1。其它方法可包括统计方法,例如均方误差(MSE)、递归分析(例如最小平方(LS))、概率方法(如MLE)、有监督的学习(如神经网络算法)。
用户的个人化AATF向量H*θ或RATF向量d*θ可通过使价值函数最小化进行确定。用户的个人化ATF向量ATF*可与最佳匹配优化判据(如价值函数)的特定的人p=p*、特定的声源方向/位置θj=θ*及特定的助听器方位的值相关联。助听器例如可配置成记录一个或多个个人化参数(如人p*),例如在学习运行模式下,例如参见图5A。这可用于获得用户的头部特征的指示(当随时间记录时,如果人p*对应于同样的p值)。个人化参数例如可连同指明用于确定所涉及的参数值的电输入信号的质量(如信噪比(SNR)或估计的噪声电平或信号电平等)的参数一起存储。从而,可使记录的个人化参数值合格。记录的与低于阈值的质量参数相关联的值可在它们可能例如在助听器中使用之前舍弃。助听器可配置成仅在电输入信号相关联的质量高于某一阈值时记录个人化参数值。
在记录的(可能通过信号质量参数使得适格的)个人化参数p*一致地等于p的特定值pu的情形下,与该人(pu)相关联的ATF向量的字典Δpu可被助听器使用,代替基于包括不同人的多个字典的数据集提出的估计方案。这样的转变可在验配期间进行,例如在某一记录时间段如一个月或几个月(例如3个月)之后,或者在助听器系统的学习运行模式之后。助听器可配置成根据记录的数据和转变条件自行进行转变。
助听器系统可配置成随时间记录估计的个人化ATF向量ATF*从而建立不同方向/位置的个人化声学传递函数的数据库。助听器例如可配置成仅记录与电输入信号的质量(如估计的SNR)高于某一阈值相关联的个人化ATF向量ATF*。
对于电输入信号的每一给定值,处理器可配置成对于频率指数k,k=1,…,K的所有值试验(如评估)相同的、给定人(p)的AATF向量或RATF向量的字典Δp。对于给定电输入信号,处理器可配置成对于频率指数k,k=1,…,K的所有值、对于人(p)头上的多个不同的助听器方位试验(如评估)与候选方向或位置(θ)对应的不同人p,p=1,…,P的AATF向量或RATF向量的字典Δp。
处理器可配置成选择与特定助听器方位对应的AATF向量或RATF向量其为在给定声学情形对所述用户最佳的个人化AATF向量H*θ或RATF向量d*θ。“最佳”可关于价值函数而言,例如使价值函数最小化的RATF向量,例如在最大可能性方面最佳。处理器可配置成选择与特定方向或位置及特定助听器方位对应的AATF向量或RATF向量其为对所述用户最佳的个人化AATF向量H*θ或RATF向量d*θ。从而,可估计目标声源的具体方向或位置和/或具体助听器方位。
处理器可配置成选择与特定的人(p)和特定的助听器方位对应的AATF向量或RATF向量其为在给定声学情形对所述用户最佳的个人化AATF向量H*θ或RATF向量d*θ。处理器可配置成选择与特定的人(p*)和特定的助听器方位对应的AATF向量或RATF向量其为对所述用户最佳的个人化AATF向量H*θ或RATF向量d*θ。“最佳”可关于价值函数而言,例如使价值函数最小化的AATF向量或RATF向量,例如在最大可能性方面最佳。从而可估计目标声源的具体方向或位置和/或具体的“人”(例如特定头部大小和/或其它身体有关的特征)和/或具体的助听器方位。
助听器可包括数据库Θ。助听器可包括存储器,所述数据库Θ存储于其中。存储器可连接到处理器。处理器可形成助听器的一部分。助听器可包括数据库及处理器。助听器系统可由助听器构成。助听器可配置成至少在特定运行模式(如学习运行模式)下或者在特定助听器程序时使用数据库确定在给定声学情形(通过来自传声器系统的M个传声器的特定电输入信号反映)的个人化绝对或相对声学传递函数。
助听器可包括信号处理器,其用于处理电输入信号并根据一个或多个处理算法如波束形成算法、降噪算法、压缩算法等提供处理后的输出信号。
助听器可包括连接到信号处理器的输出变换器,用于将处理后的信号呈现为可由用户感知为来自环境的声音的刺激(至少在正常运行模式下)。
助听器可包括波束形成器滤波器,配置成基于电输入信号和波束形成器权重提供空间滤波的信号,其中波束形成器权重使用所述用户的个人化AATF向量H*θ或RATF向量d*θ确定。滤波器权重可自适应更新。助听器可配置成在波束形成器滤波器中应用个人化绝对或相对声学传递函数以确定(如自适应更新)波束形成器权重。MVDR波束形成器的滤波器权重例如可被确定(如自适应确定),如EP3253075A1中所述。
数据库Θ可存储在助听器例如经通信链路可访问的设备或系统上。数据库Θ可存储在可经通信链路连接到助听器的辅助设备的存储器中。处理器可形成辅助设备的一部分。数据库Θ可存储在助听器例如经通信网络如因特网可访问的服务器上。
助听器可由空气传导型助听器、骨导型助听器、耳蜗植入型助听器或其组合构成或者包括空气传导型助听器、骨导型助听器、耳蜗植入型助听器或其组合。
助听器系统可包括数据库Θ存储于其中的辅助设备。助听器和辅助设备可包括使能在其间交换数据的天线和收发器电路。数据库Θ可存储在可经通信链路连接到助听器的辅助设备的存储器中。处理器可形成辅助设备的一部分。辅助设备可包括遥控设备或者用于控制助听器系统的运行的APP。辅助设备可由智能电话或者具有通信(和处理)能力的另一便携电子设备构成或者包括智能电话或者具有通信(和处理)能力的另一便携电子设备。
助听器系统可配置成包括某一(如可配置的)持续时间的学习运行模式,其中从数据库Θ选择的最佳的人(p*)基于涉及数据库Θ中(例如针对所选或所有位置(θj)、方位和频率指数k,k=1,…,K的值)表示的人(p=1,2,…,P)的多个如所有字典Δp的多个(如所有)AATF向量或RATF向量的特定如穷尽搜索进行确定。所选位置或方位或频率可基于现有知识(例如聚焦于当前情形实际可行的值)提供。当学习模式结束时,可进入正常运行模式,其中在学习模式期间最常确定的最佳的人被选择为助听器系统的当前用户的最佳表示(p**,例如参见图5A)。从而,在正常运行模式下可节约计算功率。这基于用户(的例如头部)的声音传播/反射特性随时间不变化(太多)的假设。然而,一些变化可能因不同的发型或服装等引入,但这可通过在助听器系统每次加电时启动学习模式而进行考虑。
在助听器系统每次加电期间或之后(或者经请求,例如来自用户接口),可进入(可能短的)学习运行模式。短的学习运行模式例如可具有分钟级的持续时间,例如少于30分钟,如少于10分钟,如少于5分钟。在短的学习模式期间,助听器系统的当前用户在候选头和躯干特征方面的最佳表示可进行估计并在助听器系统的随后的正常运行模式下例如保持固定,参见图5A。同样,在短的学习模式期间,助听器系统的当前用户的头上的助听器方位的最佳表示可进行估计并在助听器系统的随后的正常运行模式下例如保持固定,参见图5B。
此外,用户头上的助听器的方位(如倾斜角)可假定随时间不快速变化。与正常或预计情形的任何(大的)偏差可假定在安装助听器期间因设备加电而引入。因此,如针对最佳的人(p**)的检测所指出的,最佳方位可在学习模式下(例如在加电之后)针对给定助听器(针对不同的电输入信号)连续确定并在随后的正常运行模式下保持固定。在最佳的人(p**)已基于涉及数据库Θ中(例如针对所选或所有位置(θj)、方位和频率指数k,k=1,…,K的值)最佳的人(p=p**)的字典Δp**的多个(如所有)AATF向量或RATF向量的特定如穷尽搜索确定之后,例如可确定最佳方位再次说明,当学习模式结束时,可进入正常运行模式,其中在学习模式期间最常确定的最佳的人(p**)被选择为助听器系统的当前用户的最佳表示(p**,例如参见图5A),在学习模式期间最常确定的方位被选择为助听器安装于其处的耳朵处的助听器的当前方位的最佳表示(例如参见图5B)。
在双耳助听器系统的情形下,左和右助听器可假定与同一人(头部)相关联,例如通过在双耳助听器系统的两个助听器之间交换信息。在双耳助听器系统的情形下,左和右助听器可假定与助听器的不同方位相关联(例如由双耳助听器系统的左和右助听器独立确定)。
在正常运行模式下,在学习运行模式之后,至少在头和躯干特征方面最佳的人(p**)可能已被确定,非必须地,助听器(或用户的左和右耳处的助听器)的最佳方位已被确定。在该情形下,针对给定电输入信号确定适当的声学传递函数的剩余计算被大大减少(仅包括目标声音的不同位置或到达方向(θj))。在双耳助听器系统的情形下,左和右助听器可被假定在左和右助听器处与目标声音的相同位置或到达方向(θj)相关联(或者至少左和右助听器的两个角度之间的已知关系,其通过目标声源相对于头部中心的具体位置以及左和右助听器之间的距离确定,例如参见EP2928214A1,如图3D)。
当最佳的人(p**)已在学习运行模式下确定时,其可假定恒定不变(例如直到进行用户启动的“重新校准”为止),仅助听器的方位在助听器(系统)加电之后在学习模式下确定。
(例如5-10分钟持续时间的)短的学习运行模式例如可以某一频率重复,例如每小时或每3小时,以检查所确定的(优化的)人(如头部)和/或助听器的方位(如倾斜角)的有效性。学习运行模式也可在传感器如助听器电路板上的加速计表明助听器已被重新安装时重复。
“正常运行模式”在本说明书中可指不同于“学习模式”的其它运行模式。
在多个不同的实施例中,下面描述的助听器的特征可与第一助听器系统组合。
第二助听器系统
另一方面,提供第二助听器系统,其包括配置成佩戴在用户耳朵处的头上或者用户耳朵中的助听器。助听器可包括:
-包括设置在所述助听器中的M个传声器的传声器系统,其中M大于或等于2,传声器系统适于从环境拾取声音并提供M个对应的电输入信号xm(n),m=1,…,M,n表示时间,给定传声器处的环境声音包括下述信号的混合:
--在助听器由用户佩戴时经声学传播通道从目标声源的方向或位置(θ)传播到助听器的第m个传声器的目标声音信号sm(n);及
--在第m个传声器的位置处存在的可能的附加噪声信号vm(n),其中声学传播通道建模为xm(n)=sm(n)hm(θ)+vm(n),其中hm(θ)为该声学传播通道对声音的声学脉冲响应。
助听器系统可包括:
-连接到M个传声器的处理器;及
-包括ATF向量的字典Δp的数据库Θ,ATF向量的元素ATFm(θ,p,k),m=1,…,M为表示在传声器系统安装在自然人或人造人(p)的头上或耳朵中时声音从目标声源的位置(θ)到M个传声器中的每一个的随方向或位置(θ)而变的及随频率(k)而变的传播的、随频率而变的声学传递函数,k为频率指数,k=1,…,K,K为频带数量;其中所述字典Δp包括所述人(p)对相对于传声器系统的多个不同方向或位置θj,j=1,…,J的ATF向量ATF。
数据库可包括P个字典Δp,p=1,..,P,其中p为人指数,所述字典包括对应的多个不同的自然或人造人(p)的ATF向量ATF。
处理器可配置成至少在学习模式下基于所述数据库Θ的所述P个字典Δp、所述电输入信号xm(n),m=1,…,M及声学传播通道的模型确定所述用户的个人化ATF向量ATF*。
P个字典Δp中的每一个可包括对于多个不同的方向或位置θj,j=1,…,J,所述人(p)的头上的多个不同的助听器方位的助听器方位特定的ATF向量每一ATF向量随频率而变(k=1,…,K),例如如图2A(p=1),2B(p=P)中所示。
第一助听器系统的特征和助听器的特征可与第二助听器系统组合。
助听器
(第一和第二)助听器系统可包括助听器或者可由助听器构成。
助听器可适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。助听器可包括用于增强输入信号并提供处理后的输出信号的信号处理器。
助听器可包括输出单元,用于基于处理后的电信号提供由用户感知为声学信号的刺激。输出单元可包括耳蜗植入件的多个电极(对于CI型助听器)或者骨导助听器的振动器。输出单元可包括输出变换器。输出变换器可包括用于将刺激作为声信号提供给用户的接收器(扬声器)(例如在声学(基于空气传导的)助听器中)。输出变换器可包括用于将刺激作为颅骨的机械振动提供给用户的振动器(例如在附着到骨头的或骨锚式助听器中)。
助听器可包括用于提供表示声音的电输入信号的输入单元。输入单元可包括用于将输入声音转换为电输入信号的输入变换器如传声器。输入单元可包括无线接收器,用于接收包括或表示声音的无线信号并提供表示所述声音的电输入信号。无线接收器例如可配置成接收在无线电频率范围(3kHz到300GHz)的电磁信号。无线接收器例如可配置成接收在光频率范围(例如红外光300GHz到430THz或者可见光如430THz到770THz)的电磁信号。
助听器可包括定向传声器系统,其适于对来自环境的声音进行空间滤波从而增强佩戴助听器的用户的局部环境中的多个声源之中的目标声源。定向系统可适于检测(如自适应检测)传声器信号的特定部分源自哪一方向。这可以例如现有技术中描述的多种不同方式实现。在助听器中,传声器阵列波束形成器通常用于空间上衰减背景噪声源。许多波束形成器变型可在文献中找到。最小方差无失真响应(MVDR)波束形成器广泛用在传声器阵列信号处理中。理想地,MVDR波束形成器保持来自目标方向(也称为视向)的信号不变,而最大程度地衰减来自其它方向的声音信号。广义旁瓣抵消器(GSC)结构是MVDR波束形成器的等同表示,其相较原始形式的直接实施提供计算和数字表示优点。
助听器可包括天线和收发器电路(如无线接收器),用于从另一装置无线接收直接电输入信号,另一装置如娱乐设备(例如电视机)、通信装置、无线传声器或另一助听器。直接电输入信号可表示或包括音频信号和/或控制信号和/或信息信号。助听器可包括用于对所接收的直接电输入信号进行解调的解调电路,从而提供表示音频信号和/或控制信号的直接电输入信号,例如用于设置助听器的运行参数(如音量)和/或处理参数。一般地,助听器的天线及收发器电路建立的无线链路可以是任何类型。无线链路可在两个装置之间建立,例如在娱乐装置(如TV)与助听器之间,或者在两个助听器之间,例如经第三中间装置(如处理装置,例如遥控装置、智能电话等)。无线链路可在功率限制条件下使用,例如因为助听器可能由便携式(通常电池驱动的)设备构成或者包括便携式(通常电池驱动的)设备。无线链路可以是基于近场通信的链路,例如基于发射器部分和接收器部分的天线线圈之间的感应耦合的感应链路。无线链路可基于远场电磁辐射。经无线链路的通信可根据特定调制方案进行安排,例如模拟调制方案,如FM(调频)或AM(调幅)或PM(调相),或数字调制方案,如ASK(幅移键控)如开-关键控、FSK(频移键控)、PSK(相移键控)如MSK(最小频移键控)或QAM(正交调幅)等。
助听器与另一装置之间的通信可在基带中(音频频率范围,例如在0到20kHz之间)。优选地,助听器与另一装置之间的通信基于高于100kHz频率的某类调制。优选地,用于在助听器和另一装置之间建立通信链路的频率低于70GHz,例如位于从50MHz到70GHz的范围中,例如高于300MHz,例如在高于300MHz的ISM范围中,例如在900MHz范围中或在2.4GHz范围中或在5.8GHz范围中或在60GHz范围中(ISM=工业、科学和医学,这样的标准化范围例如由国际电信联盟ITU定义)。无线链路可基于标准化或专用技术。无线链路可基于蓝牙技术(如蓝牙低功耗技术)。
助听器可以是便携(即配置成可穿戴)装置或形成其一部分,如包括本机能源如电池例如可再充电电池的装置。助听器可以是轻质、容易穿戴的装置,例如具有小于100g如小于20g的总重量。
助听器可包括输入单元(如输入变换器,例如传声器或传声器系统和/或直接电输入(如无线接收器))和输出单元如输出变换器之间的正向或信号通路。信号处理器可位于该正向通路中。信号处理器可适于根据用户的特定需要提供随频率而变的增益。助听器可包括具有用于分析输入信号(如确定电平、调制、信号类型、声反馈估计量等)的功能件的分析通路。分析通路和/或信号通路的部分或所有信号处理可在频域进行。分析通路和/或信号通路的部分或所有信号处理可在时域进行。
表示声信号的模拟电信号可在模数(AD)转换过程中转换为数字音频信号,其中模拟信号以预定采样频率或采样速率fs进行采样,fs例如在从8kHz到48kHz的范围中(适应应用的特定需要)以在离散的时间点tn(或n)提供数字样本xn(或x[n]),每一音频样本通过预定的Nb比特表示声信号在tn时的值,Nb例如在从1到48比特的范围中如24比特。每一音频样本因此使用Nb比特量化(导致音频样本的2Nb个不同的可能的值)。数字样本x具有1/fs的时间长度,如50μs,对于fs=20kHz。多个音频样本可按时间帧安排。一时间帧可包括64个或128个音频数据样本。根据实际应用可使用其它帧长度。
助听器可包括模数(AD)转换器以按预定的采样速率如20kHz对模拟输入(例如来自输入变换器如传声器)进行数字化。助听器可包括数模(DA)转换器以将数字信号转换为模拟输出信号,例如用于经输出变换器呈现给用户。
助听器如输入单元和/或天线及收发器电路包括用于提供输入信号的时频表示的时频(TF)转换单元。时频表示可包括所涉及信号在特定时间和频率范围的相应复值或实值的阵列或映射。TF转换单元可包括用于对(时变)输入信号进行滤波并提供多个(时变)输出信号的滤波器组,每一输出信号包括截然不同的输入信号频率范围。TF转换单元可包括用于将时变输入信号转换为(时-)频域中的(时变)信号的傅里叶变换单元。助听器考虑的、从最小频率fmin到最大频率fmax的频率范围可包括从20Hz到20kHz的典型人听频范围的一部分,例如从20Hz到12kHz的范围的一部分。通常,采样率fs大于或等于最大频率fmax的两倍,即fs≥2fmax。助听器的正向通路和/或分析通路的信号可拆分为NI个(例如均匀宽度的)频带,其中NI例如大于5,如大于10,如大于50,如大于100,如大于500,至少其部分个别进行处理。助听器可适于在NP个不同频道处理正向和/或分析通路的信号(NP≤NI)。频道可以宽度一致或不一致(如宽度随频率增加)、重叠或不重叠。
助听器可配置成在不同模式下运行,如正常模式及一个或多个特定模式,例如可由用户选择或者可自动选择。运行模式可针对特定声学情形或环境进行优化。运行模式可包括低功率模式,其中助听器的功能被减少(例如以便节能),例如禁用无线通信和/或禁用助听器的特定特征。
助听器可包括多个检测器,其配置成提供与助听器的当前网络环境(如当前声环境)有关、和/或与佩戴助听器的用户的当前状态有关、和/或与助听器的当前状态或运行模式有关的状态信号。作为备选或另外,一个或多个检测器可形成与助听器(如无线)通信的外部装置的一部分。外部装置例如可包括另一助听器、遥控器、音频传输装置、电话(如智能电话)、外部传感器等。
多个检测器中的一个或多个可对全带信号起作用(时域)。多个检测器中的一个或多个可对频带拆分的信号起作用((时-)频域),例如在有限的多个频带中。
多个检测器可包括用于估计正向通路的信号的当前电平的电平检测器。检测器可配置成确定正向通路的信号的当前电平是否高于或低于给定(L-)阈值。电平检测器作用于全频带信号(时域)。电平检测器作用于频带拆分信号((时-)频域)。
助听器可包括话音活动检测器(VAD),用于估计输入信号(在特定时间点)是否(或者以何种概率)包括话音信号。在本说明书中,话音信号可包括来自人类的语音信号。其还可包括由人类语音系统产生的其它形式的发声(如唱歌)。话音活动检测器单元可适于将用户当前的声环境分类为“话音”或“无话音”环境。这具有下述优点:包括用户环境中的人发声(如语音)的电传声器信号的时间段可被识别,因而与仅(或主要)包括其它声源(如人工产生的噪声)的时间段分离。话音活动检测器可适于将用户自己的话音也检测为“话音”。作为备选,话音活动检测器可适于从“话音”的检测排除用户自己的话音。
助听器可包括自我话音检测器,用于估计特定输入声音(如话音,如语音)是否(或以何种概率)源自听力装置系统用户的话音。助听器的传声器系统可适于能够进行用户自己的话音与另一人的话音及可能与无话音声音的区分。
多个检测器可包括运动检测器,例如加速度传感器。运动检测器可配置成检测用户的面部肌肉和/或骨头的例如因语音或咀嚼(如颌部运动)引起的运动并提供标示该运动的检测器信号。
助听器可包括分类单元,配置成基于来自(至少部分)检测器的输入信号及可能其它输入对当前情形进行分类。在本说明书中,“当前情形”可由下面的一个或多个定义:
a)物理环境(如包括当前电磁环境,例如出现计划或未计划由助听器接收的电磁信号(包括音频和/或控制信号),或者当前环境不同于声学的其它性质);
b)当前声学情形(输入电平、反馈等);及
c)用户的当前模式或状态(运动、温度、认知负荷等);
d)助听器和/或与助听器通信的另一装置的当前模式或状态(所选程序、自上次用户交互之后消逝的时间等)。
分类单元可基于或者包括神经网络,例如经训练的神经网络。
助听器可包括声学(和/或机械)反馈控制(如抑制)或回声消除系统。助听器还可包括用于所涉及应用的其它适宜功能,如压缩、降噪等。
助听器可包括听力仪器,例如适于位于用户耳朵处或者完全或部分位于耳道中的听力仪器,例如耳机、耳麦、耳朵保护装置或其组合。助听系统可包括喇叭扩音器(包括多个输入变换器和多个输出变换器,例如用在音频会议情形),例如包括波束形成器滤波单元,例如提供多个波束形成能力。
应用
一方面,提供如上所述的、“具体实施方式”部分中详细描述的和权利要求中限定的助听器系统或者助听器的应用。可提供在包括音频分布的系统中的应用。可提供在包括一个或多个助听器(如听力仪器)、耳机、耳麦、主动耳朵保护系统等的系统中的应用,例如免提电话系统、远程会议系统(例如包括喇叭扩音器)、广播系统、卡拉OK系统、教室放大系统等。
双耳助听器系统
另一方面,提供包括第一和第二如上所述的、“具体实施方式”部分中详细描述的和权利要求中限定的助听器的双耳助听器系统。第一和第二助听器中的每一个可包括配置成使能在其间交换数据的收发器电路,例如经中间设备(如辅助设备)或系统进行交换。
双耳助听器系统可包括辅助设备。
双耳助听器系统可适于在第一和第二助听器与辅助设备之间建立通信链路以使得信息(如控制和状态信号,可能音频信号)可进行交换或者从一装置转发给另一装置。
辅助设备可包括遥控器、智能电话或者其它便携或可穿戴电子装置智能手表等。
辅助设备可由遥控器构成或者包括遥控器,其用于控制助听器的功能和运行。遥控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制助听器系统的功能的APP(助听器包括适当的到智能电话的无线接口,例如基于蓝牙或一些其它标准化或专有方案)。
辅助设备可由音频网关设备构成或者包括音频网关设备,其适于(例如从娱乐装置如TV或音乐播放器、从电话设备如移动电话或者从计算机如PC)接收多个音频信号并适于选择和/或组合所接收的音频信号中的适当信号(或信号组合)以传给助听器。
APP
另一方面,本发明还提供称为APP的非短暂应用。APP包括可执行指令,其配置成在辅助设备上运行以实施用于上面描述的、“具体实施方式”中详细描述的及权利要求中限定的助听器或听力系统的用户接口。APP可配置成在移动电话如智能电话或另一使能与所述助听器或听力系统通信的便携装置上运行。
本发明的实施例如可用在助听器应用中,例如波束形成、自我话音估计、自我话音检测、关键词检测等。
助听器或者助听器系统的运行方法
助听器系统的运行方法,助听器系统包括配置成佩戴在用户耳朵处的头上或者用户耳朵中的助听器,所述方法包括:
-通过多个传声器提供包括来自用户环境的环境声音的、对应的多个电输入信号xm(n),m=1,…,M,n表示时间,其中所述多个电输入信号中的给定电输入信号的环境声音包括下述信号的混合:
--在助听器由用户佩戴时经声学传播通道从目标声源的方向或位置(θ)传播到助听器的第m个传声器的目标声音信号sm(n);及
--在第m个传声器的位置处存在的可能的附加噪声信号vm(n),其中声学传播通道建模为xm(n)=sm(n)hm(θ)+vm(n),其中hm(θ)为该声学传播通道对声音的声学脉冲响应。
所述方法还可包括:
-提供或能够访问包括ATF向量的字典Δp的数据库Θ,ATF向量的元素ATFm(θ,p,k),m=1,…,M为表示在传声器系统安装在自然人或人造人(p)的头上或耳朵中时声音从目标声源的位置(θ)到M个传声器中的每一个的随方向或位置(θ)而变的及随频率(k)而变的传播的、随频率而变的声学传递函数,k为频率指数,k=1,…,K,K为频带数量;其中所述字典Δp包括所述人(p)对相对于传声器系统的多个不同方向或位置θj,j=1,…,J的ATF向量ATF。
所述方法还可包括:
-使得数据库Θ包括P个字典Δp,p=1,..,P,其中p为人指数,所述字典包括对应的多个不同的自然或人造人(p)的ATF向量ATF;及
-至少在学习模式下处理所述数据库Θ的所述P个字典Δp、所述电输入信号xm(n),m=1,…,M及声学传播通道的模型从而确定所述用户的个人化ATF向量ATF*。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的或权利要求中限定的装置或系统的部分或所有结构特征可与本发明方法的实施结合,反之亦然。方法的实施具有与对应装置或系统一样的优点。
所述方法还可包括:
-至少在学习模式下处理所述数据库Θ的所述P个字典Δp、所述电输入信号xm(n),m=1,…,M及声学传播通道的模型从而确定所述用户的个人化ATF向量ATF*。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1A示意性地示出了佩戴包括左和右助听器的助听器系统的人(p)的头部的Q个示例,其中右助听器按计划安装(传声器轴平行于水平参考方向),在上图中,左助听器安装成其传声器方向相较于参考方向从水平面倾斜第一相当小的倾斜角在下图中,左助听器安装成其传声器方向相较于参考方向从水平面倾斜不同的第Q个相当大的倾斜角
图1B示意性地示出了佩戴包括左和右助听器的助听器系统的人(p)的头部的Q个示例,其中左助听器按计划安装(平行于水平参考方向),在上图中,右助听器安装成其传声器方向相较于参考方向从水平面倾斜第一相当小的倾斜角在下图中,右助听器安装成其传声器方向相较于参考方向从水平面倾斜不同的第Q个相当大的倾斜角
图1C示意性地示出了在用户的前半平面中包括(点)声源的环境中佩戴双耳助听器系统的用户的典型几何设置;
图1D示意性地示出了佩戴包括左和右助听器的助听器系统的人(p)的头部,其中左和右助听器按计划安装(平行于水平参考方向),其中测试声音相对于人头的中心位于水平面中的J个方向(通过角度θj,j=1,…,J表示);
图1E示意性地示出了佩戴包括左和右助听器的助听器系统的人(p=1,…,P)的头部的P个示例,其中不同的人的头部具有不同的特征,在此为头部大小ap;
图2A示意性地示出了对于给定的第一测试人员(p=1),针对不同位置(θj,j=1,…,J)、针对不同助听器方位的每一位置、以及针对每一频率指数(k,k=1,…,K)的每一助听器方位的声学传递函数ATF的测量结果的组合;
图2B示意性地示出了与图2A同样的组合,但针对第P个测试人员,每一人(p,p=1,…,P)假定具有不同的头部声学特征例如不同的头部大小(ap);
图3示意性地示出了根据本发明的助听器的示例性框图;
图4示出了根据本发明的助听器的示例性框图,其包括具有个人化权重的波束形成器;
图5A示出了用于从字典中的候选头和躯干特征(“人”)集合确定最佳的头和躯干特征的学习模式以及随后的、其中在学习模式时确定的最佳的人特定的头和躯干特征(“人”)固定的正常模式;
图5B示出了用于确定助听器在用户头上的最佳方位(当前方位的最佳表示)的学习模式以及随后的、其中在学习模式时确定的最佳方位固定的正常模式;
个人化参数例如可连同指明用于确定所涉及的参数值的电输入信号的质量(如信噪比(SNR)或估计的噪声电平或信号电平等)的参数一起存储。从而记录的个人化参数可被使得合格。
通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出。对于本领域技术人员来说,基于下面的详细描述,本发明的其它实施方式将显而易见。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等(统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微机电系统(MEMS)、(例如专用)集成电路、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、印刷电路板(PCB)(如柔性PCB)、及配置成执行本说明书中描述的多个不同功能的其它适当硬件,例如用于感测和/或记录环境、装置、用户等的物理性质的传感器。计算机程序应广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
本发明涉及配置成估计助听器(或助听器系统)的用户的个人化绝对或相对声学传递函数的助听器(例如包括传声器阵列)或者双耳助听器系统。
本发明基于绝对声学传递函数(AATF)和/或相对声学传递函数(RATF)的字典即从目标信号源到助听器系统中的任何传声器和/或相对于参考传声器的声学传递函数可得到的假设。基本上,所提出的方案目标在于在字典中找到在“用于”产生当前观察到的(有噪声)目标信号方面具有最高可能性(或其它优化度量)(在字典项之中)的AATF或RATF。
该字典元素则可用于波束形成目的(绝对或相对声学传递函数为大多数波束形成器如MVDR波束形成器的元素)。
另外,由于每一AATF或RATF字典元素具有与其对应的方向或位置,从而提供到达方向(DOA)的估计量。类似地,由于每一AATF或RATF字典元素可具有与其相关联的相应助听器方位,从而提供助听器方位的估计量(或者其与计划/预计方位的偏差)。类似地,由于每一AATF或RATF字典元素可具有对应的与其相关联的人(或头部特征),从而能提供用户的头部特征的估计量。
对于传声器系统的各个传声器,数据库Θ则可包括对应的声源方向或位置(例如通过水平角θ标示)的值以及从该位置处的声源到所涉及的传声器的、不同频率下的绝对传递函数AATF或相对传递函数RATF(AATF(k,θ)或RATF(k,θ),k表示频率)。所提出的方案可针对数据库的绝对或相对声学传递函数(因而及方向/位置)的子集或全部以及传声器计算可能性(或其它度量,如基于价值函数的度量)并指向具有最大可能性(或其它度量)的方向/位置。
传声器系统例如可构成或形成适于位于用户耳朵中和/或耳朵处的听力装置如助听器的一部分。一方面,提供根据本发明的包括左和右听力装置的听力系统,每一听力装置包括传声器系统。在实施例中,左和右听力装置(如助听器)配置成分别位于用户的左和右耳中和/或左和右耳处。
本发明方法从候选AATF或RATF的字典选择实际的AATF或RATF。使用候选AATF或RATF的字典确保所得的AATF或RATF物理上似真,这是利用助听装置的传声器位于用户头上的特定位置处的现有知识的方式。根据本发明,数据库包括来自几个(可能许多个)不同的头部的AATF或RATF和/或在用户头上处于不同位置的助听装置的AATF或RATF。
所提出的想法包括扩展的字典,其中扩展包括:
a)来自同一人但以不同的HA位置(如倾斜)进行测量的几个AATF或RATF;
b)来自相同角度/位置但针对几个(可能许多个)人(头部)的AATF或RATF;
c)a)与b)的组合;
d)扩展的字典可包含每一耳朵个别的AATF或RATF,或者两只耳朵的传声器的组合的集合(例如用于双耳波束形成)。
当试验字典元素(以决定对当前情形起作用(最佳)的AATF或RATF)时,我们可试验(如评估)扩展的字典的特定子集,例如:
a)对于每一候选方向/位置,对于所有频率试验(如评估)与特定HA倾斜(方位)对应的AATF或RATF向量的子集。选择AATF或RATF向量的最佳子集,例如在最大可能性方面;
b)对于每一候选方向/位置,对于所有频率试验(如评估)与特定头部对应的AATF或RATF向量的子集。选择AATF或RATF向量的最佳子集,例如在最大可能性方面;
c)a)与b)的组合;
d)子集可描述双耳AATF或RATF(例如使用M=3或M=4个传声器),或者单耳AATF或RATF,通常使用M=2或M=3维AATF或RATF向量。
“试验”例如可意为“评估”传递函数的给定子集之中的给定候选传递函数的“可能性”并挑选满足给定优化条件(例如具有最大可能性,ML)的候选传递函数。
该方法具有下述优点:
1)通常更好的性能,因为我们考虑一致的、关于HA位置(a)或用户头部特征的信息。例如,所有AATF或RATF向量对应于特定头部;
2)明显更低的搜索复杂性:我们不进行其中(对于所有频率、HA方位(如倾斜)、人(如头部)的)所有AATF或RATF向量组合均被穷尽地试验(如评估)的穷尽搜索。而是,它们在物理上似真的子集中进行试验(如评估),即仅“应被放在一起的”AATF或RATF向量被试验;
3)所选子集提供潜在的HA位置或用户头部类型/大小的估计量。该信息可被传递以提高其它算法例如用于补偿传声器位置等的算法的性能;
4)如果独立地应用于每一只耳朵(即单耳),我们能检测HA位置/倾斜是否跨耳朵不同(参见图1A、1B)。如果联合应用于两只耳朵(即双耳设置),确定正确的AATF或RATF集合的性能预期增加,因为使用更多测量结果。
图1A和1B中的每一个示出了用户U佩戴包括左和右听力装置HDL,HDR的双耳听力系统,这些听力装置不同地安装在用户的左和右耳处,在图1A中,一个听力装置的传声器轴指向离开水平面的方向在图1B中,一个听力装置的传声器轴不指向用户的视向(θ≠0)。
图1A示出了佩戴包括左和右助听器的助听器系统的人(如测试对象p)的头部的Q个示例,其中右助听器HDR按计划安装(传声器轴平行于水平参考方向(REF-DIRR))。在上图中,左助听器HDL安装成其传声器方向MIC-DIRL相较于参考方向(REF-DIRL)从水平面倾斜第一相当小的倾斜角在下图中,左助听器HDL安装成其传声器方向MIC-DIRL相较于参考方向从水平面倾斜不同的第Q个相当大的倾斜角(通过黑点)指明在与之间可存在其它倾斜角(即符号表示q=1,…,Q)。
图1B示意性地示出了佩戴包括左和右助听器(HDL,HDR)的助听器系统的人(如测试对象p)的头部的Q个示例,其中左助听器HDL按计划安装(平行于水平参考方向(REF-DIRL)),在上图中,右助听器HDR安装成其传声器方向MIC-DIRR相较于参考方向(REF-DIRL)从水平面倾斜第一相当小的倾斜角在下图中,右助听器HDR安装成其传声器方向相较于参考方向从水平面倾斜不同的第Q个相当大的倾斜角再次说明,(通过黑点)指明在与之间可存在其它倾斜角(即符号表示q=1,…,Q)。
图1C示意性地示出了在其头部佩戴包括左和右听力装置(HDL,HDR)如助听器的双耳听力系统的用户在用户的前(左)半平面中包括(点)声源S的环境中的典型几何设置,前(左)半平面通过声源S与用户头部的中心(例如形成坐标系的中心)之间的距离确定。用户的鼻子确定用户(或测试对象p)的视向LOOK-DIR,从而确定相应的相对于用户的前向和后向(参见图1C的左部中记为前和后的箭头)。声源S在(例如通过用户耳朵的)水平面中与用户的视向成角度(-)θs进行定位。左和右听力装置(HDL,HDR)彼此间隔开一定距离地分别位于用户(或测试对象p)的左和右耳(EarL,EarR)处。左和右听力装置(HDL,HDR)中的每一个包括相应的前(M1x)和后(M2x)传声器(x=L(left),R(right)),用于从环境拾取声音。前(M1x)和后(M2x)传声器间隔开一距离ΔLM(例如10mm)分别位于左和右听力装置上,(在听力装置被正确地安装在用户耳朵处时)由两组传声器的中心形成的轴分别确定左和右听力装置的相应参考方向(REF-DIRL,REF-DIRR),参见图1A、1B和1C。声源方向可确定在用户的左和右耳处接收到的声音的共同到达方向。来自声源S的声音到达左和右听力装置的真实到达方向在实践中将不同于由箭头ds确定的方向(dsL,dsR)(差异越大,声源越靠近用户)。如果考虑必要,正确的角度(θL,θR)例如可从几何设置(包括角度θs、距离ds和听力装置之间的距离)进行确定。
如图1A、1B中所示,听力装置如助听器可能不必然指向与理想位置REF-DIR对应的位置。助听器可能倾斜某一(出水平面)仰角(参见图1A),作为备选或另外,助听器可能指向稍微不同于预期的水平方向(参见图1B中的角度),或其组合(例如具有出水平面分量以及在水平面中但偏离参考方向的分量)。数据库Θ(例如对于左和右助听器(HDL,HDR)中的每一个各一个,例如每一数据库适合并存储于相应的助听器中)配置成考虑该情形,因为不同的字典Δp包括(每一传声器m)对于不同人p的多个不同助听器方位以及对于声源的每一方向/位置θj的声学传递函数ATF(并作为频率k的函数)。
如图1A中所示,运动传感器如加速计或陀螺仪(在图1A中记为acc)可用于估计听力仪器相较于水平面是否倾斜(参见图1A中左听力装置HDL上的加速计acc以及相对于重力方向的倾斜角的标示(通过重力加速度g表示))。磁力计可有助于确定两个仪器是否未指向相同方向。这样的指示可用于确定由根据本发明确定的个人化助听器方位提供的指示是否合格。
图1D示意性地示出了佩戴包括左和右助听器(HDL,HDR)的助听器系统的人(p)的头部的J个示例,其中左和右助听器以给定助听器方位进行安装(例如按计划(平行于水平参考方向)),其中测试声音相对于人头的中心位于水平面中的J个方向/位置(在此通过相对于位于绕测试对象p的圆上(即距测试对象的距离固定)的声源的角度θj,j=1,…,J表示)。每一角度步长为360°/J,例如,对于J=12,步长为30°,或者,对于J=24,步长为15°。对于给定的人p、给定的助听器方位和给定的频率k,声学传递函数如绝对声学传递函数示意性地由从θ2处的声源到右助听器HDR的传声器Mi(例如定义为参考传声器)的虚线箭头标示。假定给定的人p的声学传递函数ATF(绝对声学传递函数AATF或相对声学传递函数RATF)的字典Δp包括针对每一传声器(m=1,..,M)、声源的每一方向/位置(θj,j=1,…,J)、每一助听器方位q=1,…,Q)以及所有频率(k=1,…,K)的值。数据库可包括针对不同的人造或自然人(p=1,…,P)的多个(类似“配备的”)字典Δp。
图1E示意性地示出了佩戴包括左和右助听器(HDL,HDR)的助听器系统的人(p=1,…,P)的头部的P个示例,其中不同的人的头部具有不同的特征,在此为头部大小ap。测试对象1具有相对更小的头部,而测试对象P具有相对更大的头部。如黑点所示,在数据库Θ中可能存在多个不同的人(测试对象)(即p=1,2,…,P的符号表示)的声学传递函数(不同的字典Δp)。人的数量例如可大于5,如大于10,如小于20。在图1E的给定例子中,示出了在频率k时方向/位置θ=0°的声源(测试声音)到右助听器的传声器Mi的声学传递函数ATF(ATFm(θ=0,k)。然而,应当理解,针对每一传声器m(可能针对每一助听器(HDL,HDR))、每一方向/位置θj、(非必须地)每一助听器方位每一频率指数k的声学传递函数被记录并存储在数据库的人特定的字典Δp中。这在图2A、2B中示出。助听器特定的数据库(ΘL,ΘR)例如分别存储在左和右助听器(HDL,HDR)的每一个中,或者存储在可共同访问的设备或系统中,例如可经智能电话或其它便携设备的APP访问。
图2A示意性地示出了对于给定的第一测试人员(p=1),针对右助听器HDR的不同传声器(m=1,…,M)和/或针对包括左和右助听器(HDL,HDR)的双耳听力系统、针对不同方向/位置(θj,j=1,…,J)的每一传声器、针对不同助听器方位 的每一方向/位置、以及针对每一频率指数(k,k=1,…,K)的每一助听器方位的声学传递函数的测量结果的组合。图2A(和2B)中的ATF指包括元素ATFm,m=1,…,M的向量。针对不同方向/位置的几何测量设置如图1D中所示(图1D示出了图2A所示的测量的一部分)。针对不同助听器方位的几何测量设置通过图2A(和2B)的右下部分中的插图图示。测量可在右助听器HDR和左助听器HDL的传声器上个别地进行。测量结果可分别存储在左和右助听器中(数据库ΘL和ΘR),或者存储在左和右助听器中之一或每一个的共同数据库ΘC中,或者存储在与左和/或右助听器通信的另一设备或系统中。图2A的数据例如被组织在字典Δp=1中。
图2B示意性地示出了与图2A同样的组合,但针对第P个测试人员,每一人(p,p=1,…,P)假定具有不同的头部声学特征例如不同的头部大小(ap)。图2A的数据例如按字典Δp=P进行组织。
假定针对人1(图2A)和人P(图2B)“之间”可能的、另外的人p’的同样的声学传递函数被测量并存储在相应数据库(ΘL,ΘR,ΘC)中。声源相对于助听器(传声器系统或传声器)的方向或位置由符号θj表示并在图2A、2B(和1C、1D)中示为水平面中的角度,例如(在人或用户处于站立位置时)通过人或用户的耳朵的水平面。然而,其也可指示例如水平面(如图1C中所示)中的位置如(θs,ds)或者出水平面的位置(如x,y,z)。数据库中存储的声学传递函数ATF可以是或表示绝对声学传递函数AATF或相对声学传递函数RATF。
图3示出了根据本发明的助听器HD的示例性框图。助听器HD例如可配置成佩戴在用户耳朵处的头上或者用户耳朵中(或者部分植入在用户耳朵处的头部中)。助听器包括:包括按预定几何配置设置在助听器的壳体中的M个传声器(在此为两个,M1,M2)的传声器系统。传声器系统适于从环境拾取声音并提供对应的电输入信号xm(n),m=1,2,其中n表示时间。给定传声器处的环境声音可包括下述信号(按多个不同的量)的混合:a)在助听器由用户佩戴时经声学传播通道从目标声源的方向或位置(θ)传播到助听器的第m个传声器的目标声音信号sm(n);及b)在第m个传声器的位置处存在的可能的附加噪声信号vm(n)。声学传播通道建模为xm(n)=sm(n)hm(θ)+vm(n),其中hm(θ)为该声学传播通道对声音的声学脉冲响应。助听器包括连接到接收电信号(X1,X2)的传声器(M1,M2)的处理器PRO。电信号(X1,X2)在此通过相应的分析滤波器组(FB-A1,FB-A2)按时频表示(k,l)提供为子频带信号。电信号(X1,X2)中的一个或多个(在此为两个)进一步馈给用于估计人话音(如语音)的存在或不存在的话音活动检测器VAD。话音活动检测器提供话音活动控制信号V-NV,其指明输入信号(在给定时间点)是否(或者以何种概率)包括话音信号。话音活动控制信号V-NV被馈给处理器PRO,可能在估计当前声学传递函数ATF时使用。助听器还包括包含ATF向量的字典Δp的数据库Θ(MEM[DB]),ATF向量的元素ATFm(θ,p,k),m=1,…,M为表示声音从目标声源的位置(θ)到M(在此M=2)个传声器中的每一个的随方向或位置(θ)而变的及随频率(k)而变的传播的、随频率而变的声学传递函数,k为频率指数,k=1,…,K,K为频带数量。声学传递函数在传声器系统(如助听器装置)安装在自然人或人造人p的头上或耳朵中时确定。传声器系统优选按等于或者尽可能接近助听器的配置的配置安装在人上(例如风格与用户佩戴的助听器的风格相同)。字典Δp包括所述人p对相对于传声器系统的多个不同方向或位置θj,j=1,…,J及(非必须地)对所述人p的头上的多个不同助听器方位对多个不同的方向或位置θj,j=1,…,J的ATF向量在图3中,P个人的字典Δp存储在数据库中。处理器PRO连接到数据库(MEM[DB])并配置成基于数据库Θ、电输入信号xm(n),m=1,…,M(在此m=1,2)及声学传播通道的模型确定用户的个人化ATF向量ATF*θ。用户的个人化ATF向量ATF*可通过本领域可获得的多种不同方法确定,例如,最大可能性估计(MLE)方法,例如参见EP3413589A1。其它统计方法例如可包括均方误差(MSE)、递归分析(例如最小平方(LS))、概率方法(如MLE)、有监督的学习(如神经网络算法)。用户的个人化ATF向量ATF*例如可通过使价值函数最小化确定。处理器PRO可配置成在给定时间用给定电输入信号将用户的个人化ATF向量ATF*确定为ATF向量ATF*即针对每一传声器、每一频率k的声学传递函数(相对或绝对)。个人化ATF向量ATF*θ从字典Δp确定,选择的向量与特定的人p=p*、特定的声源方向/位置θj=θ*及特定的助听器方位相关联因而可提供关于用户头部的特征、估计的目标声源方向/位置θ*以及所涉及的助听器的当前方位的估计量的信息。处理器PRO可配置成将该信息呈现给助听器的其它部分,例如在图4中,呈现给用于将处理算法如波束形成算法应用于正向通路的一个或多个信号的信号处理器SP。在图3的实施例中,用户的个人化ATF向量ATF*以及与(当前)个人化ATF向量相关联的相应特定的人p=p*、特定的声源方向/位置θj=θ*及特定的助听器方位的值被馈给信号处理器SP。助听器例如可配置成记录一个或多个个人化参数(如人p*)。这可用于获得用户的头部特征的指示(当随时间记录时,如果人p*对应于同样的p值)。个人化参数例如可连同指明用于确定所涉及的参数值的电输入信号的质量(如信噪比(SNR)或估计的噪声电平或信号电平等)的参数一起存储。(例如参见图4)。
图3的助听器HD包括正向(音频信号)通路,配置成处理电输入信号(IN1,IN2)及提供用于呈现给用户的增强的(处理后的)输出信号。正向通路包括工作时彼此连接的输入变换器(在此为传声器(M1,M2))、相应的分析滤波器组(FB-A1,FB-A2)、信号处理器SP、合成滤波器组FBS和输出变换器(在此为扬声器SPK)。
处理器PRO和信号处理器SP可形成同一数字信号处理器的一部分(或者可以是独立的单元)。分析滤波器组(FB-A1,FB-A2)、处理器PRO、信号处理器SP、合成滤波器组FBS和话音活动检测器VAD可形成同一数字信号处理器的一部分(或者可以是独立的单元)。
合成滤波器组FBS配置成将多个子频带信号转换为一个时域信号。信号处理器SP配置成将一个或多个处理算法应用于电输入信号(如波束形成和压缩放大)并提供处理后的输出信号OUT以经输出变换器呈现给用户。输出变换器(在此为扬声器SPK)配置成将表示声音的信号转换为可由用户感知为声音的刺激(例如空气中的振动、或骨中振动、或耳蜗神经的电刺激的形式)。
助听器可包括使能与另一设备如智能电话或者任何其它便携或固定不动的设备或系统交换数据的收发器。数据库Θ可位于另一设备中。类似地,处理器PRO可位于另一设备中。
图4示出了根据本发明的助听器HD的示例性框图,其包括具有个人化权重的波束形成器。图4的实施例与图3的实施例类似,但另外包括SNR估计器SNRE、数据记录器D-LOG和波束形成器滤波器BF。SNR估计器SNRE配置成估计当前信噪比(SNR)(当前电输入信号(IN1,IN2)或者信号(如波束形成的信号YBF)或源自其的信号的质量的相当的估计量)。SNR估计量(SNR)被馈给处理器PRO(可能及助听器的其它部分,例如波束形成器和/或助听器增益控制器HA-G)。数据记录器D-LOG可连同指明用于确定所涉及的参数值的电输入信号的质量(如信噪比或估计的噪声电平或信号电平等)的参数一起存储个人化参数PMT*(例如特定的人p=p*、特定的声源方向/位置θj=θ*和与(当前)个人化ATF向量ATF*(如绝对或相对声学传递函数(H*θ或d*θ))相关联的特定助听器方位)。数据记录器D-LOG从处理器PRO接收个人化参数PMT*。个人化参数PMT*可使用SNR估计量确定是否合格,使得仅在高于阈值的SNR确定的个人化参数被记录(例如存储)在数据记录器D-LOG中。处理器PRO将针对当前声学情形(由电输入信号(IN1,IN2)反映,非必须地,及通过话音活动检测器VAD反映)确定的个人化声学传递函数(在此为相对声学传递函数d*θ,非必须地,及与其相关联的当前方向/位置(θj=θ*))馈给信号处理器SP尤其是波束形成器滤波器BF。波束形成器滤波器BF还接收时频表示(k,l)的电输入信号(IN1,IN2),其中k和l分别为频率指数和时间(时间帧)指数。波束形成器滤波器BF根据电输入信号(X1(k,l),X2(k,l))和个人化的相对声学传递函数(d*θ)提供波束形成的信号YBF,例如如EP3253075A1中所述。波束形成的信号YBF被馈给助听器增益控制器HA-G,其用于根据用户需要将(例如通过压缩算法提供的)随频率而变的增益应用于波束形成的信号,例如补偿用户的听力受损。助听器增益控制器HA-G将处理后的信号OUT提供为子频带信号,其被馈给合成滤波器组FBS转换为时域信号out(如图3中一样)。波束形成器滤波器和助听器增益控制器HA-G形成信号处理器SP的一部分,如图4中记为SP的虚线矩形所示。图4的所有完全数字的功能部件(FB-A1,FB-A2,VAD,PRO,SNRE,D-LOG,BF,HA-G,FBS,非必须地,及存储器MEM)可形成定制或标准的(适于音频处理的)数字信号处理器的一部分。存储器MEM例如可实施为单独的芯片。
助听器HD例如处理器PRO例如可配置成随时间记录估计的个人化ATF向量ATF*(如d*θ),从而建立不同方向/位置时的个人化声学传递函数的数据库。助听器例如处理器PRO例如可配置成仅记录与电输入信号的质量(如SNR)高于某一阈值相关联的个人化ATF向量ATF*。在记录的(可能通过信号质量参数确定合格的)个人化参数p*一致地等于p的特定值pu的情形下,与人pu相关联的ATF向量的字典Δpu可被助听器使用,代替所提出的估计方案。助听器例如处理器PRO可配置成根据记录的数据和转变条件(例如关于为其存储个人化声学传递函数的、多个存储的方向/位置,和/或关于个人化ATF向量ATF*已跨其进行记录的最小时间,和/或关于估计的AATF向量的质量)自身进行转变。
图5A示出了用于确定最佳的人(p*)(例如头和躯干特征)的学习模式以及随后的、其中在学习模式持续期间确定的最佳的人(p**)固定的正常模式。图5B示出了用于确定助听器在用户头上的最佳方位(当前方位的最佳表示)的学习模式以及随后的、其中在学习模式时确定的最佳方位固定的正常模式;
图5A和5B的左部示出了从时间t=t0到时间t=t1即持续时间ΔtLM=t1-t0的学习模式,例如≤1天,如≤1小时,如≤10分钟。在学习模式期间,给定电输入信号(反映特定声学情形)的相应声学传递函数可使用数据库Θ的所有字典Δp,p=1,…,P进行确定,如本申请中公开的。这例如可简要地描述如下。
可遵循下述过程:对于给定电输入信号,对于数据库Θ的每一字典Δp,p=1,…,P(或者其物理上似真的子集),通过针对位置(θj,j=1,…,J)(或其子集)确定价值函数而找到(与人p对应的)给定字典的最佳位置(θj*p),然后最终将P个字典(或其子集)之中的最佳位置(θj*)选择为展现最低价值函数(如最大可能性)的位置(θj*)。从而能够自动估计最佳的人(p*)(及非必须地,助听器方位)(为与具有最低价值函数的位置(θj*)源自其的字典Δp相关联的人(及非必须地,助听器方位))。
上述过程可用于在图5A和5B的学习模式下确定每一数据点。例如可在助听器系统每次加电期间或之后(或者经请求,例如来自用户接口)进入学习运行模式。
在学习模式已结束之后,与最频繁用于估计目标信号源的当前位置(θ*)的字典Δp相关联的人(p**)(图5A)及助听器方位(非必须)(图5B)可保持固定,至少固定某一时间量,从而将估计当前位置(或者最好与当前电输入信号对应的声学传递函数)的过程简化到单一字典Δp**(参见图5A、5B的右部中对于t>t1的“正常模式”)。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的及权利要求中限定的装置的结构特征可与本发明方法的步骤结合。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或“耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非明确指出,在此公开的任何方法的步骤不必须精确按所公开的顺序执行。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一般原理可应用于其他方面。
权利要求不限于在此所示的各个方面,而是包含与权利要求语言一致的全部范围,其中除非明确指出,以单数形式提及的元件不意指“一个及只有一个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
参考文献
·[Farina,2000]:Farina,Angelo."Simultaneous measurement of impulseresponse and distortion with a swept-sine technique."Audio EngineeringSociety Convention 108.Paper 5093,Audio Engineering Society,February 1,2000.
·EP3413589A1(Oticon)12.12.2018.
·EP3253075A1(Oticon)06.12.2017.
·EP2928214A1(Oticon)07.10.2015.
Claims (15)
1.一种助听器系统,包括配置成佩戴在用户耳朵处的头上或者用户耳朵中的助听器,所述助听器包括:
-包括设置在所述助听器中的M个传声器的传声器系统,其中M大于或等于2,传声器系统适于从环境拾取声音并提供M个对应的电输入信号xm(n),m=1,…,M,n表示时间,给定传声器处的环境声音包括下述信号的混合:
--在助听器由用户佩戴时经声学传播通道从目标声源的方向或位置(θ)传播到助听器的第m个传声器的目标声音信号sm(n);及
--在第m个传声器的位置处存在的可能的附加噪声信号vm(n),其中声学传播通道建模为xm(n)=sm(n)hm(θ)+vm(n),其中hm(θ)为该声学传播通道对声音的声学脉冲响应;
所述助听器系统包括:
-连接到M个传声器的处理器;及
-包括ATF向量的多个字典Δp,p=1,…,P的数据库Θ,其中p为人指数,ATF向量的元素ATFm,m=1,…,M为表示在传声器系统安装在自然人或人造人(p’)的头上或耳朵中时声音从目标声源的方向或位置(θ)到M个传声器中的每一个的随方向或位置(θ)而变的及随频率(k)而变的传播的、随频率而变的声学传递函数,k为频率指数,k=1,…,K,K为频带数量;其中所述字典Δp中的每一个包括给定人(p)对相对于传声器系统的多个不同方向或位置θj,j=1,…,J的ATF向量;及
其中处理器配置成至少在学习运行模式下基于所述数据库Θ的所述多个字典Δp、所述电输入信号xm(n),m=1,…,M及声学传播通道的模型确定所述用户的个人化ATF向量(ATF*)。
2.根据权利要求1所述的助听器系统,其中,所述随频率而变的声学传递函数ATF包括相对声学传递函数RATF。
6.根据权利要求1所述的助听器系统,其中,用户的个人化AATF向量或RATF向量(H*或d*)分别通过统计方法或学习算法确定。
7.根据权利要求6所述的助听器系统,其中,用户的个人化AATF向量或RATF向量(H*或d*)通过使价值函数最小化进行确定。
8.根据权利要求1所述的助听器系统,配置成随时间记录估计的个人化ATF向量(ATF*)从而建立针对不同方向/位置的个人化声学传递函数的数据库。
9.根据权利要求1所述的助听器系统,配置成在助听器系统加电期间或之后或者基于来自用户的请求或者在一个或多个传感器指明助听器的位置变化时进入所述学习运行模式。
10.根据权利要求1所述的助听器系统,其中,对于给定电输入信号,处理器配置成至少在所述学习运行模式下针对频率指数k,k=1,…,K的所有值评估不同人p,p=1,…,P的AATF向量或RATF向量(Hθ,p,dθ,p)的字典Δp中与候选方向或位置(θ)对应的每一字典并在此基础上确定最佳的人(p*)。
15.根据权利要求1所述的助听器系统,包括配置成基于所述电输入信号和波束形成器权重提供空间滤波的信号的波束形成器滤波器,其中波束形成器权重使用所述用户的个人化AATF向量或RATF向量(H*,d*)确定。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20210249 | 2020-11-27 | ||
EP20210249.7 | 2020-11-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114567845A true CN114567845A (zh) | 2022-05-31 |
Family
ID=73642627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111426116.8A Pending CN114567845A (zh) | 2020-11-27 | 2021-11-26 | 包括声学传递函数数据库的助听器系统 |
Country Status (3)
Country | Link |
---|---|
US (2) | US11991499B2 (zh) |
EP (1) | EP4007308A1 (zh) |
CN (1) | CN114567845A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4059233A1 (en) * | 2019-11-14 | 2022-09-21 | Starkey Laboratories, Inc. | Ear-worn electronic device configured to compensate for hunched or stooped posture |
US11259127B2 (en) * | 2020-03-20 | 2022-02-22 | Oticon A/S | Hearing device adapted to provide an estimate of a user's own voice |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100754385B1 (ko) * | 2004-09-30 | 2007-08-31 | 삼성전자주식회사 | 오디오/비디오 센서를 이용한 위치 파악, 추적 및 분리장치와 그 방법 |
EP2882203A1 (en) * | 2013-12-06 | 2015-06-10 | Oticon A/s | Hearing aid device for hands free communication |
EP2928210A1 (en) | 2014-04-03 | 2015-10-07 | Oticon A/s | A binaural hearing assistance system comprising binaural noise reduction |
EP3253075B1 (en) | 2016-05-30 | 2019-03-20 | Oticon A/s | A hearing aid comprising a beam former filtering unit comprising a smoothing unit |
DK3285501T3 (da) * | 2016-08-16 | 2020-02-17 | Oticon As | Høresystem, der omfatter et høreapparat og en mikrofonenhed til at opfange en brugers egen stemme |
EP3373602A1 (en) * | 2017-03-09 | 2018-09-12 | Oticon A/s | A method of localizing a sound source, a hearing device, and a hearing system |
EP4184950A1 (en) * | 2017-06-09 | 2023-05-24 | Oticon A/s | A microphone system and a hearing device comprising a microphone system |
-
2021
- 2021-10-26 EP EP21204737.7A patent/EP4007308A1/en active Pending
- 2021-11-09 US US17/522,275 patent/US11991499B2/en active Active
- 2021-11-26 CN CN202111426116.8A patent/CN114567845A/zh active Pending
-
2024
- 2024-04-17 US US18/638,520 patent/US20240276157A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US11991499B2 (en) | 2024-05-21 |
US20240276157A1 (en) | 2024-08-15 |
EP4007308A1 (en) | 2022-06-01 |
US20220174428A1 (en) | 2022-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230269549A1 (en) | Hearing aid device for hands free communication | |
CN108600907B (zh) | 定位声源的方法、听力装置及听力系统 | |
US9591411B2 (en) | Self-calibration of multi-microphone noise reduction system for hearing assistance devices using an auxiliary device | |
US10587962B2 (en) | Hearing aid comprising a directional microphone system | |
CN113316073A (zh) | 用于估计声学传递函数的助听器系统 | |
US20190104370A1 (en) | Hearing assistance device | |
US20240276157A1 (en) | A hearing aid system comprising a database of acoustic transfer functions | |
US20230388721A1 (en) | Hearing aid system comprising a sound source localization estimator | |
EP3833043B1 (en) | A hearing system comprising a personalized beamformer | |
US12063477B2 (en) | Hearing system comprising a database of acoustic transfer functions | |
US20240114296A1 (en) | Hearing aid comprising a speaker unit | |
CN116399333A (zh) | 用于监视和检测听力仪器是否被正确安装的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |