CN107547983A - 用于提高目标声音的可分离性的方法和听力装置 - Google Patents
用于提高目标声音的可分离性的方法和听力装置 Download PDFInfo
- Publication number
- CN107547983A CN107547983A CN201710502898.6A CN201710502898A CN107547983A CN 107547983 A CN107547983 A CN 107547983A CN 201710502898 A CN201710502898 A CN 201710502898A CN 107547983 A CN107547983 A CN 107547983A
- Authority
- CN
- China
- Prior art keywords
- band
- sub
- group
- signal
- envelope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000002708 enhancing effect Effects 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 45
- 230000006870 function Effects 0.000 claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 33
- 238000012986 modification Methods 0.000 claims description 13
- 230000008447 perception Effects 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000005728 strengthening Methods 0.000 claims description 4
- 238000004321 preservation Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 2
- 230000001010 compromised effect Effects 0.000 claims description 2
- 230000000638 stimulation Effects 0.000 claims description 2
- 230000000873 masking effect Effects 0.000 description 20
- 230000005236 sound signal Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 210000000988 bone and bone Anatomy 0.000 description 6
- 210000003477 cochlea Anatomy 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000005611 electricity Effects 0.000 description 4
- 210000003625 skull Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 210000003926 auditory cortex Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 210000003027 ear inner Anatomy 0.000 description 2
- 210000000959 ear middle Anatomy 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000010358 mechanical oscillation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 102000015427 Angiotensins Human genes 0.000 description 1
- 108010064733 Angiotensins Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 208000009205 Tinnitus Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 239000002416 angiotensin derivative Substances 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 230000001055 chewing effect Effects 0.000 description 1
- 210000000860 cochlear nerve Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000001097 facial muscle Anatomy 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000001259 mesencephalon Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 231100000886 tinnitus Toxicity 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/554—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/41—Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Otolaryngology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了用于提高目标声音的可分离性的方法和听力装置,其中所述听力装置包括输入单元;分析滤波器组;信号处理单元,连接到所述分析滤波器组并包括:频带分组单元,用于基于多个子频带信号之间的可比特性将子频带安排成子频带组;包络提取单元,用于计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;用于提供每一子频带组的增强函数的增强单元,配置成增强组包络中的峰值和/或衰减组包络中的谷值;及组合单元,用于使每一个别子频带组的子频带中的信号乘以所涉及子频带组的相应增强函数或者其缩放版以提供增强的子频带信号。
Description
技术领域
本发明总体上涉及用于提高听力受损用户感知上将目标声音与竞争声音分离的能力的方法,其中目标声音和竞争声音叠加在合成输入信号中。更具体地,本发明涉及在子频带之间应用共同调制以提高分离效果。
背景技术
听力完全未受损的人可将信号的复杂混合分解为多个个别的信号,使得他们能注意他们选择的信号。另一方面,具有听力损失的人在存在其它竞争声音的情形下理解语音通常具有较大困难。现有的助听器技术未提供足够的支持来满足他们在复杂听音环境下的需要。这是因为经现有技术助听器的放大仅能够恢复声音的可听度和响度。使用现有技术助听器并不恢复“分离”声音的复杂混合的能力。
因此,需要提供一种听力仪器如助听器,其不仅恢复通过听力仪器提供给助听器用户的声音的可听度和响度,而且提高听力受损用户感知上将目标声音 (例如声音)与竞争声音(如环境中的多个讲话者或其它噪声)分离的能力。
发明内容
本发明的目的在于增强共同调制线索。
听力装置
在广义方面,本发明提供一种听力装置如助听器,其配置成至少部分在时频域(基于子频带级)运行及配置成提高听力装置接收的目标(语音)信号的感知,合成信号包括所述目标信号和竞争信号分量(“噪声”或“掩蔽声音”)。该听力装置包括基于共同调制的感知增强单元。该感知单元配置成监视至少部分(所选)子频带中的竞争声音分量的调制(如调幅)。代替试图提高所述子频带的(目标)信噪比,感知单元以可实际上减小(至少部分)子频带中的信噪比进行配置,其通过将反映竞争声音分量的所述调制的共同调制应用于至少部分子频带进行。
在本申请的一方面,提供用于提高听力受损用户感知上将目标声音与竞争声音分离的能力的听力装置,目标声音和竞争声音形成具有给定频率范围的合成声音信号。该听力装置还包括:
-输入单元,用于将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-分析滤波器组,用于将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带并提供对应的子频带信号;
-信号处理单元,连接到所述分析滤波器组并包括
--频带分组单元,用于基于多个子频带信号之间的可比特性将子频带安排成子频带组;
--包络提取单元,用于计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;
--用于提供每一子频带组的增强函数的增强单元,配置成增强组包络中的峰值和/或衰减组包络中的谷值;及
--组合单元,用于使每一个别子频带组的子频带中的信号乘以所涉及子频带组的相应增强函数或者其缩放版以提供增强的子频带信号。
从而可提供改进的听力装置。
在本发明中,术语“频带”和“子频带”可互换地使用,在指示所涉及方法或装置的工作频率范围的子范围方面没有任何计划的差别。类似地,术语“组”(当结合一组频带或子频带使用时)和“子频带组”具有一样的含义。
在实施例中,组合单元配置成使给定子频带组的大部分或所有子频带信号与对应于该组的增强函数相乘。在实施例中,组合单元配置成使给定子频带组的大部分或所有子频带信号与对应于该组的增强函数的(可能个别)缩放的版本相乘。
在实施例中,信号处理单元包括包括另一处理单元,用于将随频率和/或电平而变的增益或衰减和/或其它信号处理算法应用于子频带信号或增强的子频带信号以提供处理后的子频带信号。
在实施例中,听力装置包括合成滤波器组,用于将处理后的子频带信号转换为时域电输出信号。
在实施例中,听力装置包括用于将时域电输出信号转换为可由用户感知为声音的刺激的输出单元。在实施例中,输出单元包括耳蜗植入物的多个电极或者骨导听力装置的振动器。在实施例中,输出单元包括输出变换器。在实施例中,输出变换器包括用于将刺激作为声信号提供给用户的接收器(扬声器)。在实施例中,输出变换器包括用于将刺激作为颅骨的机械振动提供给用户的振动器(例如在附着到骨头的或骨锚式听力装置中)。
在实施例中,听力装置包括助听器、头戴式耳机、耳麦、耳朵保护装置或其组合。
在实施例中,听力装置适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。在实施例中,听力装置包括用于增强输入信号并提供处理后的输出信号的信号处理单元。
在实施例中,输入单元包括用于将输入声音转换为电输入信号的输入变换器如传声器。在实施例中,输入单元包括用于接收包括声音的无线信号并提供表示所述声音的电输入信号的无线接收器。在实施例中,听力装置包括定向传声器系统,其适于对来自环境的声音进行空间滤波,从而例如相对于佩戴听力装置的用户的局部环境中的其它声源增强目标声源。在实施例中,定向系统适于检测(如自适应检测)传声器信号的特定部分源自哪一方向(例如目标信号,和/或一个或多个噪声源)。
在实施例中,听力装置包括用于从另一装置如通信装置或另一听力装置 (例如建立到另一装置的通信链路)无线接收直接电输入信号的天线和收发器电路。在实施例中,无线链路基于标准化或专有技术。在实施例中,无线链路基于蓝牙技术(如蓝牙低功率技术)。
在实施例中,听力装置具有0.15m级的最大外尺寸(如手持移动电话)。在实施例中,听力装置具有0.08m级的最大外尺寸(如头戴式耳机)。在实施例中,听力装置具有0.04m级的最大外尺寸(如听力仪器)。
在实施例中,听力装置为便携装置,例如包括本机能源如电池例如可再充电电池的装置。
在实施例中,听力装置包括输入变换器(传声器系统和/或直接电输入(如无线接收器))和输出变换器之间的正向或信号通路。在实施例中,信号处理单元位于正向通路中。在实施例中,信号处理单元适于根据用户的特定需要提供随频率而变的增益。在实施例中,听力装置包括具有用于分析输入信号(如确定电平、调制、信号类型、声反馈估计量等)的功能件的分析通路。在实施例中,分析通路和/或信号通路的部分或所有信号处理在频域进行。在实施例中,分析通路和/或信号通路的部分或所有信号处理在时域进行。
在实施例中,表示声信号的模拟电信号在模数(AD)转换过程中转换为数字音频信号,其中模拟信号以预定采样频率或采样速率fs进行采样,fs例如在从8kHz到48kHz的范围中(适应应用的特定需要)以在离散的时间点tn (或n)提供数字样本xn(或x[n]),每一音频样本通过预定的Ns比特表示声信号在tn时的值,Ns例如在从1到48比特的范围中如24比特。数字样本x具有1/fs的时间长度,如50μs,对于fs=20kHz。在实施例中,多个音频样本按时间帧安排。在实施例中,一时间帧包括64个或128个音频数据样本。根据实际应用可使用其它帧长度。
在实施例中,听力装置包括模数(AD)转换器以按预定的采样速率如 20kHz对模拟输入进行数字化。在实施例中,听力装置包括数模(DA)转换器以将数字信号转换为模拟输出信号,例如用于经输出变换器呈现给用户。
在实施例中,听力装置如传声器单元和/或收发器单元包括TF转换单元 (如分析滤波器组),用于提供输入信号的时频表示。在实施例中,时频表示包括所涉及信号在特定时间和频率范围的相应复值或实值的阵列或映射。在实施例中,TF转换单元包括滤波器组,用于对(时变)输入信号进行滤波并提供多个(时变)输出信号,每一输出信号包括截然不同的输入信号频率范围。在实施例中,TF转换单元包括用于将时变输入信号转换为频域中的(时变)信号的傅里叶变换单元。在实施例中,听力装置考虑的、从最小频率fmin到最大频率fmax的频率范围包括从20Hz到20kHz的典型人听频范围的一部分,例如从 20Hz到12kHz的范围的一部分。在实施例中,听力装置的正向通路和/或分析通路的信号拆分为NI个子频带,其中NI例如大于5,如大于10,如大于50,如大于100,如大于500,至少部分频带个别地处理。在实施例中,听力装置适于在NP个不同频道处理正向和/或分析通路的信号(NP≤NI)。频道可以宽度一致或不一致(如宽度随频率增加)、重叠或不重叠。
在实施例中,听力装置包括多个检测器,其配置成提供与听力装置的当前物理环境(如当前声环境)有关、和/或与佩戴听力装置的用户的当前状态有关、和/或与听力装置的当前状态或运行模式有关的状态信号。作为备选或另外,一个或多个检测器可形成与助听器(如无线)通信的外部装置的一部分。外部装置例如可包括另一助听装置、遥控器、音频传输装置、电话(如智能电话)、外部传感器等。
在实施例中,多个检测器中的一个或多个对全带信号起作用(时域)。在实施例中,多个检测器中的一个或多个对频带拆分的信号起作用((时-)频域)。
在实施例中,多个检测器包括电平检测器,用于估计正向通路的信号的当前电平。在实施例中,预定判据包括正向通路的信号的当前电平是高于还是低于给定(L-)阈值。在实施例中,预定判据包括正向通路的信号的当前电平是否在一个或多个电平值范围内。
在特定实施例中,听力装置包括话音检测器(VD),用于确定输入信号是否包括话音信号(在特定时间点)。在本说明书中,话音信号包括来自人类的语音信号。其还可包括由人类语音系统产生的其它形式的发声(如唱歌)。在实施例中,话音检测器单元适于将用户当前的声环境分类为话音或无话音环境。这具有下述优点:包括用户环境中的人类发声(如语音)的电传声器信号的时间段可被识别,因而与仅包括其它声源(如人工产生的噪声)的时间段分离。在实施例中,话音检测器适于还将用户自己的话音检测为话音。作为备选,话音检测器适于从话音检测排除用户自己的话音。
在实施例中,听力装置包括自我话音检测器,用于检测特定输入声音(如话音)是否源自系统用户的话音。在实施例中,听力装置的传声器系统适于能够在用户自己的话音和另一人的话音之间进行区分及可能与非话音声音区分开。
在实施例中,多个检测器包括运动检测器如加速度传感器。在实施例中,运动检测器配置成检测用户的面部肌肉和/或骨头例如因语音或咀嚼(如颌部运动)引起的运动并提供标示该运动的检测器信号。
在实施例中,助听装置包括分类单元,配置成基于来自(至少部分)检测器的输入信号及可能其它输入对当前情形进行分类。在本说明书中,“当前情形”由下面的一个或多个定义:
a)物理环境(如包括当前电磁环境,例如出现计划或未计划由听力装置接收的电磁信号(包括音频和/或控制信号),或者当前环境不同于声学的其它性质);
b)当前声学情形(输入电平、反馈等);
c)用户的当前模式或状态(运动、温度等);
d)助听装置和/或与听力装置通信的另一装置的当前模式或状态(所选程序、自上次用户交互之后消逝的时间等)。
在实施例中,听力装置包括声学(和/或机械)反馈抑制系统。在实施例中,听力装置还包括用于所涉及应用的其它适宜功能,如压缩、降噪等。
在实施例中,听力装置包括听音装置,例如助听器,例如听力仪器,例如适于位于耳朵处或者完全或部分位于用户耳道中的听力仪器,例如头戴式耳机、耳麦、耳朵保护装置或其组合。
用途
此外,本发明提供上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置的用途。在实施例中,提供在包括音频分布的系统中的用途。在实施例中,提供在包括一个或多个听力仪器、头戴式耳机、耳麦、有源耳朵保护系统等的系统中的用途,例如免提电话系统、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
方法
一方面,本申请还提供用于提高听力受损人员感知上将目标声音与竞争声音分离的能力的方法,目标声音和竞争声音形成具有给定频率范围的合成声音信号。该方法包括:
-将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带;
-基于多个子频带之间的可比特性将子频带安排成子频带组;
-计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;及
-使每一个别子频带组的子频带中的信号乘以增强组包络中的峰值和/或衰减组包络中的谷值的函数,从而提供每一所述子频带组的增强包络。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的或权利要求中限定的装置的部分或所有结构特征可与本发明方法的实施结合,反之亦然。方法的实施具有与对应装置一样的优点。
“增强组包络中的峰值和/或衰减组包络中的谷值”的函数也称为增强函数。在实施例中,该方法包括使给定子频带组的所有子频带信号与对应于该组的(增强)函数相乘。在实施例中,组合单元配置成使给定子频带组的所有子频带信号与对应于该组的增强函数的(可能个别)缩放的版本相乘。
组包络例如可通过下面的方法之一(单独或组合)进行确定:
a、半波整流,之后低通滤波;
b、一次一个频带,然后包络的非加权或加权平均;
c、滤波器组,处于该组中的通过频带及未处于该组中的归零频带,然后提取所得时间波形的包络,-->这是组包络;
d、滤波器组,使处于该组中的频带乘以加权系数及未处于该组中的归零频带,然后提取所得时间波形的包络,-->这是组包络;
e、希尔伯特包络。
在实施例中,可比特性包括所述多个子频带中的信号包络之间的相关。
在实施例中,该方法包括:
-对于每一所述子频带,计算该频带的包络;
-对于每一子频带组,计算特定子频带组中的每一子频带的包络和对应的组包络之间的相关;
-对于每一子频带组,计算所涉及子频带组中的每一子频带的增强包络;
-对于每一子频带,使该频带中的信号与该频带的增强包络相乘。
在实施例中,该方法包括:
-在实施例中,该方法包括:
-计算每一所述子频带的包络之间的相关,从而提供相关矩阵C;
-基于所述相关矩阵C将子频带分组为子频带组;
-计算每一子频带组的组包络。
在实施例中,将子频带安排成子频带组(“分组”)包括下面的步骤:
-定义相关阈值C_thr;
-选择相关矩阵C的具有最高阈上值的和的行;
-将所选行中其相关大于C_thr的子频带指定为第一子频带组的成员。
在实施例中,分组还包括:
-将相关矩阵C的行和列中对应于所述第一子频带组的子频带的元素设定为等于零,从而提供修改的相关矩阵CM;
-选择所述修改的相关矩阵CM的具有最高阈上相关的和的行;
-将所选行中其相关大于C_thr的子频带指定为第二子频带组的成员。
在实施例中,组包络的峰值的增强及组包络中谷值的衰减包括下面的步骤:
-定义调制增强m_enh;
-对于所定义的调制增强m_enh,保存组包络的均值、调制深度m_group 和在时间n相对于所述均值的当前振幅偏移的流水账,其中调制深度由 m_group给出;
-对于每一相应子频带组中的每一子频带:
--使当前时间窗口中的信号乘以(1+p(n)*c(n)*m_enh),其中0<p(n)<1,及其中p(n)为频带包络的与组包络的相关的函数。
在实施例中,调制增强m_enh被分成两个增强部分,一个控制峰值增强的程度,及一个控制谷值加深的程度。
在实施例中,可比特性为每一单独的子频带的振幅变化中的基频F0k,其中k为子频带指数。
计算机可读介质
本发明进一步提供保存包括程序代码的计算机程序的有形计算机可读介质,当计算机程序在数据处理系统上运行时,使得数据处理系统执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
作为例子但非限制,前述有形计算机可读介质可包括RAM、ROM、 EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁性存储装置,或者可用于执行或保存指令或数据结构形式的所需程序代码并可由计算机访问的任何其他介质。如在此使用的,盘包括压缩磁盘(CD)、激光盘、光盘、数字多用途盘(DVD)、软盘及蓝光盘,其中这些盘通常磁性地复制数据,同时这些盘可用激光光学地复制数据。上述盘的组合也应包括在计算机可读介质的范围内。除保存在有形介质上之外,计算机程序也可经传输介质如有线或无线链路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置处运行。
数据处理系统
一方面,本发明进一步提供数据处理系统,包括处理器和程序代码,程序代码使得处理器执行上面描述的、“具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
包括数据处理系统的听力装置
一方面,本申请还提供一种听力装置如助听器,用于提高听力受损用户感知上将目标声音与竞争声音分离的能力,其中所述听力装置包括上面描述的、“具体实施方式”中详细描述的及权利要求中限定的数据处理系统。
从而提供流隔离线索增强的输出信号以呈现给听力装置的用户。
听力系统
另一方面,本发明提供包括上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置及包括辅助装置的听力系统。
在实施例中,该听力系统适于在听力装置和辅助装置之间建立通信链路以使信息(如控制和状态信号,可能音频信号)能在其间进行交换或从一装置转发给另一装置。在实施例中,听力系统配置成运行使能经辅助装置控制听力系统的功能的APP。
在实施例中,辅助装置是或包括音频网关设备,其适于(如从娱乐装置例如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC)接收多个音频信号,及适于选择和/或组合所接收音频信号(或信号组合)中的适当信号以传给听力装置。在实施例中,辅助装置是或包括遥控器,用于控制听力装置的功能和运行。在实施例中,辅助装置是或包括智能电话。在实施例中,遥控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制音频处理装置的功能的APP(听力装置包括适当的到智能电话的无线接口,例如基于蓝牙或一些其它标准化或专有方案)。
在实施例中,辅助装置为另一听力装置。在实施例中,听力系统包括适于实施双耳听力系统如双耳听力装置系统的两个听力装置。在实施例中,听力系统包括适于实施或形成双耳助听器系统的一部分的两个听力装置。
APP
另一方面,本发明还提供称为APP的非短暂应用。APP包括可执行指令,其配置成在辅助装置上运行以实施用于上面描述的、“具体实施方式”中详细描述的及权利要求中限定的听力装置或听力系统的用户接口。在实施例中,该 APP配置成在移动电话如智能电话或另一使能与所述听力装置或听力系统通信的便携装置上运行。在实施例中,该APP配置成控制听力系统的功能。
定义
在本说明书中,“听力装置”指适于改善、增强和/或保护用户的听觉能力的装置如听力仪器或有源耳朵保护装置或其它音频处理装置,其通过从用户环境接收声信号、产生对应的音频信号、可能修改该音频信号、及将可能已修改的音频信号作为可听见的信号提供给用户的至少一只耳朵而实现。“听力装置”还指适于以电子方式接收音频信号、可能修改该音频信号、及将可能已修改的音频信号作为听得见的信号提供给用户的至少一只耳朵的装置如头戴式耳机或耳麦。听得见的信号例如可以下述形式提供:辐射到用户外耳内的声信号、作为机械振动通过用户头部的骨结构和/或通过中耳的部分传到用户内耳的声信号、及直接或间接传到用户耳蜗神经的电信号。
听力装置可构造成以任何已知的方式进行佩戴,如作为佩戴在耳后的单元 (具有将辐射的声信号导入耳道内的管或者具有安排成靠近耳道或位于耳道中的扬声器)、作为整个或部分安排在耳廓和/或耳道中的单元、作为连到植入在颅骨内的固定结构的单元、或作为整个或部分植入的单元等。听力装置可包括单一单元或几个彼此电子通信的单元。
更一般地,听力装置包括用于从用户环境接收声信号并提供对应的输入音频信号的输入变换器和/或以电子方式(即有线或无线)接收输入音频信号的接收器、用于处理输入音频信号的(通常可配置的)信号处理电路、及用于根据处理后的音频信号将听得见的信号提供给用户的输出装置。在一些听力装置中,放大器可构成信号处理电路。信号处理电路通常包括一个或多个(集成或单独的)存储元件,用于执行程序和/或用于保存在处理中使用(或可能使用)的参数和/或用于保存适合听力装置功能的信息和/或用于保存例如结合到用户的接口和/或到编程装置的接口使用的信息(如处理后的信息,例如由信号处理电路提供)。在一些听力装置中,输出装置可包括输出变换器,例如用于提供空传声信号的扬声器或用于提供结构或液体传播的声信号的振动器。在一些听力装置中,输出装置可包括一个或多个用于提供电信号的输出电极。
在一些听力装置中,振动器可适于经皮或由皮将结构传播的声信号传给颅骨。在一些听力装置中,振动器可植入在中耳和/或内耳中。在一些听力装置中,振动器可适于将结构传播的声信号提供给中耳骨和/或耳蜗。在一些听力装置中,振动器可适于例如通过卵圆窗将液体传播的声信号提供到耳蜗液体。在一些听力装置中,输出电极可植入在耳蜗中或植入在颅骨内侧上,并可适于将电信号提供给耳蜗的毛细胞、一个或多个听觉神经、听觉脑干、听觉中脑、听觉皮层和/或大脑皮层的其它部分。
“听力系统”指包括一个或两个听力装置的系统。“双耳听力系统”指包括两个听力装置并适于协同地向用户的两只耳朵提供听得见的信号的系统。听力系统或双耳听力系统还可包括一个或多个“辅助装置”,其与听力装置通信并影响和/或受益于听力装置的功能。辅助装置例如可以是遥控器、音频网关设备、移动电话(如智能电话)、广播系统、汽车音频系统或音乐播放器。听力装置、听力系统或双耳听力系统例如可用于补偿听力受损人员的听觉能力损失、增强或保护正常听力人员的听觉能力和/或将电子音频信号传给人。
本发明的实施例如可用在下述应用中:助听器、头戴式耳机、耳麦、耳朵保护系统、免提电话系统、移动电话等。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1A和1B示出了使掩蔽信号在多个子频带上共同调制提高与掩蔽信号一起存在的目标信号的听觉感知的基本原理。
图2A示出了根据本发明的方法的第一部分的实施例。
图2B示出了根据本发明的方法的第二部分的实施例。
图3示出了根据本发明的方法的第一实施例的流程图。
图4示出了根据本发明的方法的第二实施例的流程图。
图5A示出了根据本发明第一实施例的助听器的简化框图。
图5B示出了根据本发明第二实施例的助听器的简化框图。
图6示出了根据本发明实施例的信号处理单元的简化框图。
图7A示出了包括与辅助装置通信的左和右听力装置的双耳助听器系统的实施例。
图7B示出了用于根据本发明的双耳助听器系统的用作用户接口的辅助装置。
通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出。对于本领域技术人员来说,基于下面的详细描述,本发明的其它实施方式将显而易见。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等 (统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、及配置成执行本说明书中描述的多个不同功能的其它适当硬件。计算机程序应广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
本申请涉及听力装置如助听器领域。
图1A和1B示出了使掩蔽信号在多个子频带上共同调制提高与掩蔽信号一起存在的目标信号的听觉感知的基本原理。示出了多个(在此为5个)子频带信号F1,F2,F3,F4,F5,对于1s的时间段(参见水平轴“时间(s)”),具有 -1和1之间的(归一化)相对振幅。
用于提高听力受损用户感知上分离目标声音和竞争声音的能力的关键线索之一为共同调制,其中“共同调制”指跨多个子频带共享的调幅(例如参见 [Hall et al.,1984]或者[Nelken et al.,1999])。图1A和1B表示共同调制及其感知结果的示意性图示:当存在多个共同调制的掩蔽频带时,目标声音和掩蔽声音看上去感知上更可分离。
在图1A和1B所示的例子中,示出了与具有时变包络的“噪声”(即非目标)信号(附图标记2)混合的相当恒定包络的目标信号(附图标记1)的示意性振幅-时间曲线。中间子频带F3中的目标声音1被中间子频带F3中的竞争声音2掩蔽,很难检测到该目标(图1A)。附图所示的原理在于,多个(共同调制的)“掩蔽频带”的存在(图1B)似乎使目标声音1与掩蔽声音2彼此感知上分离更容易(由图1B的子频带F3中更清楚地出现恒定包络目标信号1 指明)。对此,自[Hall et al.,1984]开始,及从许多随后的、在共同调制的侧向频带添加到掩蔽声音时发现改进的检测阈值的研究,均有大量证据。
图1A中所示的曲线示出了共同调制在增强目标声音1与掩蔽声音2的感知可分离性方面的作用。在图1A中,目标声音1和掩蔽声音2仅在第三子频带F3中存在,图1A的其它频带F1、F2、F4和F5均无声,即它们既不包含目标声音也不包含掩蔽声音。在图1B中,第三子频带F3仍包含目标声音1和掩蔽声音2,但其它子频带F1、F2、F4和F5包含掩蔽声音频率分量。具体地,在图1B中,在所有子频带F1-F5中均存在掩蔽声音能量,掩蔽声音跨这些频带共同调制,如图1B的上部中记为M的箭头所示。具有几个共同调制的掩蔽频带的感知结果在于其提供帮助听者感知上分离掩蔽声音和目标声音的线索。尽管目标声音1在图1A和1B中一样,但听者在图1B所示的例子中更容易检测到目标声音1。
应注意,子频带F1、F2、F4和F5中掩蔽声音的存在产生信噪比,在此我们意指所有这些子频带中的能量的和实质上比竞争信号仅在F3中存在的情形 (如图1A中所示)更差。然而,由于掩蔽声音在子频带之间的共同调制,在图1B的情形下获得更好的目标检测(感知)。在图1A和1B所示的简单例子中使能改进窄带目标的检测的原理被认为对使多个宽带目标彼此分开同样重要。
图1A和1B中所示的例子示出了使本发明提供的解决方案与现有技术降噪系统区分开的实质特征。即,现有技术降噪系统将掩蔽声音能量看待为对目标的感知固有地不利,它们的目标在于减少掩蔽声音。与现有技术方法相反,根据本发明的解决方案包括增强共同调制线索,目标在于在听力受损人员中(至少部分)恢复非常重要的正常听力的分离能力,及普遍认为的信念一定程度上作为目前专利申请的动机。
如图1A和1B所示,输入信号通常为既包括目标信号(如语音信号)又包括竞争信号(如背景噪声和/或一个或多个竞争话音信号)的合成信号。根据本发明,按下面的过程对给合成输入信号执行信号流分离,其包括:
i、将合成输入信号细分到多个子频带(频带1、频带2、……频带N,例如参见图2A);
ii、基于相应频带中的类似特性(即各个时变频带信号的对每一频带均类似的特性,如频带信号的包络或特征频率,如基频,例如参见图2A)对子频带进行分组;
iii、对每一确定的子频带组,计算相应频带中的信号的组包络(例如参见图2B);及
iv、使每一个别组的频带中的信号乘以增强组包络的峰值(振幅或能量) 和/或衰减组包络中的谷值(振幅或能量)的函数(例如参见图2B)。
因而,根据本发明的第一方面(其实施例如图3中所示),提供用于提高听力受损人员的感知上分离目标声音和竞争声音的能力的方法,目标声音和竞争声音形成具有给定频率范围的合成声音信号,其中该方法包括下面的步骤:
-将所述合成声音信号的频率范围细分为多个子频带;
-基于多个子频带的信号的可比特性对子频带进行分组;
-对每一子频带组,计算组包络;
-使每一个别子频带组的频带中的信号乘以增强组包络的峰值和/或衰减组包络中的谷值的函数。
在实施例中,对于子频带组内的一些频带,峰值增强的量值大于该子频带组内的其它频带的峰值增强的量值。在实施例中,增强的量值随个别频带的包络和组包络之间的相关而变。在第一方面的实施例中,对子频带组内的一些频带,谷值衰减的量值大于该子频带组内的其它频带。在实施例中所,衰减的量值随个别频带的包络与组包络之间的相关而变。
应注意,增强或衰减的量值可被使得随每一个别频带的包络与其子频带组的包络的相关而变,即使非基于相关的方法(如基频F0)用于选择子频带组也是如此。
在实施例中,可比特性为所述多个子频带中的信号包络之间的相关(例如在彼此展现相关的那些频带中,特定范围的相关度量(如互相关)分配给同一子频带组)。
在实施例中,可比特性为每一单独的子频带的随时间的振幅变化中的基频 F0k(和/或其谐波),其中k为子频带指数。
在实施例中,该方法包括步骤:
-对于每一所述子频带,计算该频带的包络;
-对于每一子频带组,计算特定子频带组中的每一频带的包络和对应的组包络之间的相关;
-对于每一子频带组,计算该子频带组中的每一频带的增强包络;
-对于每一频带,使该频带中的信号与该频带的增强包络相乘。
在实施例中,该方法包括步骤:
-对于每一所述子频带,计算该频带的包络;
-计算每一所述子频带的包络之间的相关,从而提供相关矩阵C;
-基于所述相关矩阵C将子频带分组为子频带组;
-计算每一子频带组的组包络;
-对于每一子频带组,计算特定子频带组中的每一频带的包络和对应的组包络之间的相关;
-对于每一子频带组,计算该子频带组中的每一子频带的增强包络;
-对于每一子频带,使该频带中的信号与该子频带的增强包络相乘。
在第一方面的实施例中,分组包括步骤:
-定义相关阈值C_thr;
-选择相关矩阵C的具有最高阈上值的和的行;
-将所选行中其相关大于C_thr的频带指定为第一组的成员;
-将相关矩阵C的行和列中对应于所述第一子频带组的频带的元素设定为等于零,从而提供修改的相关矩阵CM;
-选择所述修改的相关矩阵CM的具有最高阈上相关的和的行;
-将所选行中其相关大于C_thr的频带指定为第二子频带组的成员。
在实施例中,其中2组以上频带被确定,优选形成第二修改的相关矩阵 CM’,及选择第三频带组,依此类推,直到修改的矩阵的所有非对角元素均低于C_thr为止或者直到达到一些预定的最大组数为止。
在第一方面的实施例中,组包络的峰值的加强及组包络中谷值的衰减包括下面的步骤:
-定义调制增强m_enh;
-对于所定义的调制增强m_enh,保存组包络的均值、调制深度m_group 和在时间n相对于所述均值的当前振幅偏移的流水账,其中偏移值c(n)给出组包络相对于其移动平均的当前值。时变函数c(n)表示组调制包络并定义成使得在组包络高于其移动平均时c(n)为正及在组包络低于其移动平均时c(n)为负;
-对于每一相应子频带组(指数j)中的每一子频带(指数k):
--使当前时间窗口中的信号乘以(1+p(n)*c(n)*m_enh)(在下面结合图6的描述中称为“增强包络”或“增强函数”fe(j,p(k,n))),其中0<p(n)<1,及其中p(n)确定在给定时间点在频带k中施加多少m_enh;p(n)例如可设定为取决于频带包络与组包络的相关;
--使信号乘以(1+p(n)*c(n)*m_enh),从而增大该组的频带之间的共同调制的峰值的量值及加深其谷值。
在实施例中,子频带特有参数p(n)取决于来自检测器或分类器的输入。
在第一方面的实施例中,调制增强m_enh分成两个增强部分,一个控制峰值增强的程度,及一个控制谷值加深的程度。这具有两部分的增强可独立控制的优点。在实施例中,可对最大允许的峰值增强进行具体限制。在实施例中,可对最大允许的谷值衰减进行具体限制,例如以防止调制包络与零信号振幅交叉从而产生大于100%的调制(过调制)。
根据本发明的第二方面,提供用于提高听力受损用户感知上将目标声音与竞争声音分离的能力的听力装置,其中该听力装置包括处理器,配置成执行根据本发明第一方面的方法,从而提供流分离线索增强的输出信号呈现给听力装置的用户。
在第二方面的实施例中,听力装置是或包括助听器。
根据本发明的第三方面,提供一种包括处理器的数据处理系统,处理器被提供适于执行根据本发明第一方面的方法的至少部分(如大部分或所有)步骤的软件。
根据本发明的第四方面,提供能够执行根据本发明第一方面的方法的软件,该软件可存储在有形计算机可读介质上或者编码为有形计算机可读介质上的一个或多个指令或代码。计算机可读介质包括适于存储包括程序代码的计算机程序的计算机存储介质,当计算机程序在处理系统上运行时,使得数据处理系统执行根据本发明第一方面的方法的至少部分(如大部分或所有)步骤。
图2A示出了根据本发明的方法的第一部分的实施例,及图2B示出了根据本发明的方法的第二部分的实施例。
参考图2A,信号8被提供给滤波器组(如一组带通滤波器10、11)。在图1A和1B所示的例子中,使用五个这样的带通滤波器,但应当理解,只要需要,可使用任何适当数量的这样的滤波器。带通滤波器10、11中的每一相应滤波器提供带通(子频带)输出信号12。频带可重叠或者不重叠。子频带 (1、……N)可一起覆盖助听器的一部分或整个频率范围,例如从0Hz(或 20Hz或更大)到8kHz(或更大,如10kHz或更大)。
尽管图2A中的例子将子频带分配为2组子频带,该方法可容易地扩展,以具有3个以上子频带组。
来自每一相应带通滤波器的带通输出信号12被提供给对应的包络提取器 13、14,其将包络确定为相应带通滤波器提供的(子频带)输出信号的时间的函数。包络提取例如可通过滤波、整流和滤波、希尔伯特变换或者锁相环技术进行。
基于每一相应频带1-N的确定的信号包络,计算N个子频带信号的信号包络之间的相关(参见图5B、6中的Y(k,m)),从而获得相关矩阵C。基于血管紧张素C的内容,子频带1-N的分组可按如下进行:
部分A:频带的互相关、阈值建立和分组
a、定义相关阈值C_thr;
b、选择相关矩阵C的具有最高阈上值的和的行;
c、将所选行中其相关大于C_thr的频带指定为组1的成员;
d、将相关矩阵C的行和列的对应于组1频带的相关值设定为等于零,从而提供修改的相关矩阵CM;
e、选择(在先前步骤中修改的)所述修改的相关矩阵CM的具有最高阈上相关的和的行;
f、将所选行中其相关大于C_thr的频带指定为组2的成员。
上面概述的用于获得子频带组的过程通过另一非限制性例子说明,其中初始相关矩阵为:
在该例子中,相关阈值C_thr设定为0.75(该值可根据具体情形(声环境、子频带的配置、用户的听力受损等)进行不同地选择,例如选择为大于0.75或小于0.75)。初始矩阵的具有阈上值的元素在上面突出显示。
相关矩阵C的具有最高的阈上值的和的行为行4(频带4)。
行4的具有大于C_thr的相关值的频带被选择为组1。
因而,组1由频带3、频带4和频带5组成。
对应于组1的矩阵元素被设定为等于零,从而产生修改的矩阵:
选择上面的修改的矩阵的具有最高的阈上相关的和的行。在该例子中,行 1和行2均具有1.9的和,对应的频带1和2被选择为组2。
根据本发明,作为备选,子频带的分组可基于不同于上面描述的相关方法的其它方法。
在本发明的实施例中,子频带的分组基于每一单独的子频带k的基频F0k的识别及随后分组频带,其具有在预定范围内的基频F0k。在子频带分组之后,该方法按下面的部分B描述的继续(参见图2B)。
在已进行分组之后,每一或确定的子频带组经历图2B中指出的步骤。
在步骤19,对子频带组j(在图2A所示的例子中,j=1或2),计算组包络。组包络可使用多个不同的方法计算,如求平均例如频率加权的平均,其中,例如,频带通过其对语音理解的重要性进行加权。另一方法可以是求和及随后提取所得信号的包络。根据所涉及的应用,可使用其它加权方案,例如根据预期的输入信号例如输入信号的特性。
在步骤20,计算属于组j的每一个别频带的包络与计算的组包络之间的相关。
在步骤21,基于步骤20中确定的相关计算增强包络。
在步骤22,属于特定子频带组的每一子频带中的信号被乘以步骤21中确定的增强包络,从而提供所希望的分离线索增强的信号。
根据本发明的实施例,增强包络的计算包括下面的步骤:
步骤B:增强包络的计算
a、定义给定子频带组的调制增强m_enh;
b、对于所定义的调制增强m_enh,
c、保存包括组包络的下述值的流水账:
i、均值;
ii、调制深度m_group;及
iii、在时间n相对于均值的当前振幅偏移,如本申请别处所述,表达为 c(n);
d、对于子频带组中的每一子频带:
i、确定子频带的频带包络;
ii、使当前时间窗口中的子频带信号乘以(1+p(n)*c(n)*m_enh),其中p(n) 在0和1之间并可取决于包括但不限于频带包络与组包络的相关、来自检测器的输入、来自分类器的输入等的因素。
由于上面的项c(iii)下面的c(n)反映组包络的调制,使信号乘以 (1+p(n)*c(n)*m_enh)增大子频带组中的频带之间的共同调制的峰值及加深谷值。
根据一实施例,调制增强m_enh被再分为两个部分,一个控制峰值增强的程度,及一个控制谷值加深的程度。
参考图3,示出了说明根据本发明的方法的实施例的基本步骤的流程图。
在步骤23,提供输入信号,例如来自助听器中的传声器的(处理后的、时变)输出信号(例如包括目标信号x与噪声分量v的混合)。在步骤24,输入信号的总频率范围(或者其一部分)被再分为多个子频带。在图1A-1B中,示出了五个这样的频带,但也可使用另一数量的子频带(相邻或分开的)。在步骤25,确定子频带中的信号的可比特性。可比特性的例子可以是每一子频带 (k)的信号包络或者每一单独的子频带的随时间的振幅变化中的基频F0k。
在步骤26,子频带基于步骤25中确定的可比特性进行分组。在所描述的实施例中,子频带分组为两个子频带组:组1和组2,但应当理解,也可使用其它组数。
在步骤27,按如上所述,对每一确定的子频带组(j=1,2),计算组包络。
在步骤28和29,分别地,每一子频带中的信号乘以增强特定子频带组的组包络的峰值及衰减该特定子频带组的组包络的谷值的(增强)函数(分别对于组1和组2)。
图4示出了说明根据本发明的方法的第二实施例的流程图。
在步骤30,提供输入信号,例如来自助听器中的传声器的(处理后的)输出信号。在步骤31,输入信号的总频率范围(或其一部分)再分为多个子频带,及在步骤32,计算每一子频带中的信号的包络。
在步骤33,计算每一子频带信号的包络之间的相关,从而提供相关矩阵C (例如如上面给出的数例中所示)。
在步骤34,基于相关矩阵C进行子频带的分组。
在步骤35,确定在步骤34中找到的每一子频带组的组包络。
在步骤36,对于每一子频带组,确定每一频带包络和对应的组包络之间的相关。
在步骤37,基于步骤36中得到的相关,计算每一子频带组中的每一子频带的增强包络。
在步骤38,每一单独的子频带中的信号乘以步骤37中确定的该频带的增强包络。
图5A示出了根据本发明第一实施例的助听器的简化框图,及图5B示出了根据本发明第二实施例的助听器的简化框图。
参考图5A,示出了配置成执行根据本发明的方法的助听器(HA)39的示意性框图。助听器39包括输入单元(IU)41,其被提供输入变换器43如传声器,用于将声输入40转换为电信号,该电信号提供给A/D转换器(AD)44。来自A/D转换器的数字信号提供给信号处理单元(SPU)45,其包括用于执行根据本发明的方法的多个不同步骤的软件代码。处理后的输出数字信号提供给输出单元(OU)42中的D/A转换器(DA)46,来自D/A转换器46的模拟信号驱动输出变换器(OT)47如扬声器(接收器),其将电输出信号转换为声输出信号48。在实施例中,输出单元可(另外或作为备选)包括用于骨导型助听器的振动器或者耳蜗植入型助听器的多电极阵列。信号处理单元45的输出可以是通过根据本发明的方法提供的流分离线索增强的信号或者其处理后的版本(例如参见图6)。此外,信号处理单元45可包括分析滤波器组(FBA),配置成将频率范围再分为多个子频带(例如上面的图1A、1B中描述的五个频带F1,F2,F3,F4和F5),及包括对应的合成滤波器组(FBS),配置成将子频带重新组合为一个单一频带。图5B示出了结合图5A所述的助听器,但在输入变换器IT和输出变换器OT之间的助听器正向通路中包括分开的分析滤波器组 AFB和合成滤波器组SFB。另外,为信号处理单元SPU的输入和输出信号的子频带信号分别记为Y(k,m)和Z(k,m),k为频率指数(k=1,…,N)及n为时间帧指数。
图6示出了根据本发明实施例的信号处理单元的简化框图。图5B中所示的输入单元IU将时域电输入信号y(n)提供为表示听力装置的工作频率范围中的合成输入声音信号(如包括多个语音信号分量)的数字样本,t为时间,n为时间样本指数。图5B中所示的分析滤波器组FBA将助听器的工作频率范围或其一部分再分为合成声音信号的多个子频带Y(k,m),k为子频带指数(k=1,…, N,N为子频带数),m为时间帧指数。每一帧包括多个样本,如64或128个。帧不重叠或者重叠,通常重叠。连接到分析滤波器组FBA并接收子频带信号 Y(k,m)的信号处理单元SPU包括子频带分组单元BGU,用于基于多个子频带信号Y(k,m)之间的可比特性将子频带(k)安排成子频带组SBGj,j=1,…,NSBG,并提供分组的子频带信号YSBGj(k,m)。NSBG为子频带组的数量。NBSG例如取决于目标信号的类型。NBSG例如可取决于当前存在的噪声源的类型和数量。NBSG至少为1,如大于或等于2。在图6的示例性实施例中,NSBG=3。三个子频带组SBG1,SBG2和SBG3由子频带信号YSBG1(k,m),YSBG2(k,m),YSBG3(k,m)表示。在实施例中,三组子频带信号一起构成合成声音信号的N个子频带信号Y(k,m) (例如相应的子频带组一起(在数学意义上)由子频带k=1,…,N组成)。用于形成子频带组的多个子频带Y(k,m)之间的可比特性例如可与子频带之间的类似调制性质有关。在实施例中,可比特性包括所述多个子频带中的信号包络之间的相关。在实施例中,子频带分组单元BGU配置成将给定子频带分配给给定子频带组,如果其满足分配给该子频带组的可比特性判据(例如处于距特性的给定值的距离测度内(或者大于或小于给定值等),如给定相关值)。信号处理单元SPU还包括包络提取单元EXU,用于计算分别由子频带信号 YSBG1(k,m),YSBG2(k,m),YSBG3(k,m)表示的每一子频带组SBGj的组包络。包络提取单元EXU将相应的组包络信号EG(j),j=1,…,NSBG(在此NSBG=3)提供为输出。每一组包络信号EG(1),EG(2),EG(3)包括峰值和谷值(如上面包络提取单元 EXU示意性指出的)。组包络例如可确定为所涉及的子频带组的每一包络的平均,或者使用频率加权的平均,其中频带例如通过其对语音理解的重要性加权。信号处理单元SPU还包括增强单元EHU,用于提供相应的增强函数fe(j), j=1,…,NSBG(在此NSBG=3)。每一增强函数fe(1),fe(2),fe(3)增强相应组包络信号EG(1),EG(2),EG(3)中的峰值和/或衰减其中的谷值。从而可确定增强的组包络信号EHG(j)=EG(j)*fe(j),j=1,…,NSBG(在此NSBG=3)(如上面的增强单元EHU 示意性指出的)。在实施例中,增强函数fe(1),fe(2),fe(3),其(或可)在子频带组之间不同,也可在子频带组内的子频带之间不同,例如根据定义所涉及子频带组的组包络和所涉及子频带的包络之间的差的参数。换言之,fe(j)=fe(j,p),其中p为例如与组包络和频带包络之间的相关有关的参数。子频带参数p因而可依赖于子频带指数k(及也可随时间而变,p=p(k,n))。在实施例中,给定子频带组j的不同子频带kj的增强函数fe(j)为fe(j)的缩放版(例如取决于各个子频带kj的参数)。相应的相乘单元“X”配置成使每一个别子频带组(图6中的 SBG1,SBG2,SBG3)中的子频带信号(图6中的YSBG1(k,m),YSBG2(k,m), YSBG3(k,m))乘以相应的增强函数fe(1),fe(2),fe(3)(或其个别化版本fe(j,p(k,n))) 以提供增强的子频带信号(图6中的ESSBG1(k,m),ESSBG2(k,m),ESSBG3(k,m))。各个增强的子频带信号ES(k,m),k=1,…,N(由图6中的增强的子频带信号 ESSBG1(k,m),ESSBG2(k,m),ESSBG3(k,m)构成)已通过子频带之间的共同调制的增强而修改从而提高用户分离目标信号和噪声的能力。在图6的信号处理单元 SPU的实施例中,增强的子频带信号被(另外的)处理单元FPU处理,例如将随频率和/或电平而变的增益施加到增强的子频带信号以提供(进一步)处理的信号Z(k,m),k=1,…,N。其它处理算法可另外(或作为备选)在处理单元FPU 中应用,如反馈消除、降噪等。在实施例中,输入单元可包括一个以上传声器,如两个以上。在实施例中,听力装置包括多输入波束形成器滤波单元,用于提供空间滤波的信号。在多个子频带组的子频带中提供共同调制的方案可单独地应用于每一传声器输入信号和/或应用于空间滤波的(波束成形)信号。
图7A示出了包括与辅助装置通信的左和右听力装置的双耳助听器系统的实施例,及图7B示出了用于双耳助听器系统的用作用户接口的辅助装置。
图7A示出了双耳听力系统的实施例,包括左(第二)和右(第一)听力装置HAl,HAr与用作双耳助听器系统的用户接口UI的便携(手持)辅助装置 AD通信。在实施例中,双耳听力系统包括辅助装置Aux(及用户接口UI)。在图7A的实施例中,示出了记为IA-WL(如左和右听力装置之间的感应链路) 和WL-RF(如辅助装置Aux和左听力装置HAl之间的及辅助装置Aux和右听力装置HAr之间的RF链路(如蓝牙))的无线链路(在装置中通过对应的天线和收发器电路实施,在图7A中为简化起见在左和右听力装置中分别示为 RF-IA-Rx/Tx-l和RF-IA-Rx/Tx-r)。在图7A所示的声学情形下,主要声源如人的话音,记为目标声音,位于用户U的右边;及噪声声场,可能包括竞争话音 /语音信号和/或自然或人为噪声,记为“噪声”,在用户周围示出。
辅助装置Aux的用户接口UI如图7B中所示。用户接口包括显示器(如触敏显示器),其显示用于控制听力系统及关于双耳听力系统(或双侧助听器系统或单一助听器)的功能的多个预定行动的听力仪器远程控制APP的屏幕。在例示APP(的部分)中,用户U具有经多个预定(或可配置的)程序之一的选择影响运行模式的选择,每一程序针对特定声学情形进行优化(在“选择程序”框中)。示例性的声学情形为:多环境、对话、音乐、耳鸣和共同调制,每一情形示为启动元件,其通过点击在元件上一次选择一个。每一示例性声学情形与左和右听力装置的特定算法和特定处理参数(程序)的启动相关联。在图7B 的例子中,声学情形“共同调制”已被选择(如屏幕上对应启动元件的粗斜体突出显示指明的)。声学情形“共同调制”指听力系统的特定运行模式,其中在用户的声环境中目标(语音)声源(在图7A中由目标声音指明)与一个或多个噪声源(或竞争话音源)一起存在。在图7B例示的远程控制APP屏幕中,用户具有帮助识别目标声源的选择(参见框“共同调制增强。选择目标信号”)。用户具有点击表示目标源的笑脸图标的选择并被鼓励按压(压住) 该图标一时间段,其中目标声音存在于用户环境中。从而,助听器在识别目标信号(参见图1A、1B中的1,包括存在目标信号的子频带)的谱特性的任务中被引导,及在相邻的子频带中应用适当的共同调制(“噪声”的特性,参见图1A、1B中的2)。作为备选,该任务可自动执行,例如由左和右听力装置个别地执行,或者共同执行,和/或与辅助装置协作执行(例如使用辅助装置的一个或多个传声器信号)。噪声分量(在图7A中记为“噪声”)可以是来自交通、汽车噪声、机械装置(风扇、空调等)的“人造”噪声,但也可包括来自不同于目标源的其他人的(竞争)话音。
包括用户接口UI的辅助装置Aux适于拿在用户U的手中,因此方便显示关于助听器系统的信息和/或方便用户影响其功能。在听力系统的音频流传输运行模式下,音频信号(如来自电话对话或音乐或其它声音)可从辅助装置传给左和右助听器(使用无线链路WL-RF,及非必须地IA-WL,参见图7A中的信号ADCDl和ADCDr)。在远程控制运行模式下(如图7B中所示),控制数据和/或信息数据(和/或音频数据)可在辅助装置及左和右听力装置之间交换 (使用无线链路WL-RF,及非必须地IA-WL,参见图7A中的信号ADCDl和 ADCDr)。
听力装置和辅助装置之间及左和右听力装置之间的无线通信链路(图7A 中的WL-RF,IA-WL)为了必要的带宽和频谱的可用部分可基于任何适当的技术。在实施例中,听力装置和辅助装置之间的无线通信链路WL-RF基于远场 (如辐射场)通信,例如根据蓝牙或蓝牙低功率或类似标准或专有方案。在实施例中,左和右听力装置之间的无线通信链路IA-WL基于近场(如感应)通信。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的和/或权利要求中限定的装置的结构特征可与本发明方法的步骤结合。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或“耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非另行指明,在此公开的任何方法的步骤不精确限于相应说明的顺序。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一般原理可应用于其他方面。
权利要求不限于在此所示的各个方面,而是包含与权利要求语言一致的全部范围,其中除非明确指出,以单数形式提及的元件不意指“一个及只有一个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
因而,本发明的范围应依据权利要求进行判断。
参考文献
●[Hall et al.,1984]Hall,J.W.,Haggard,M.P.,Fernandes,M.A.(1984). "Detection in noise by spectro-temporal pattern analysis",J.Acoust.Soc.Am.76,50- 56.
●[Nelken et al.,1999]Nelken I.,Rotman Y.,and Yosef O.B.(1999).“Responses of auditory cortex neurons to structural features of naturalsounds,” Nature 397,154–157.
Claims (15)
1.用于提高听力受损用户感知上将目标声音与竞争声音分离的能力的听力装置,目标声音和竞争声音形成具有给定频率范围的合成声音信号,所述听力装置包括:
-输入单元,用于将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-分析滤波器组,用于将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带并提供对应的子频带信号;
-信号处理单元,连接到所述分析滤波器组并包括
--频带分组单元,用于基于多个子频带信号之间的可比特性将子频带安排成子频带组;
--包络提取单元,用于计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;
--用于提供每一子频带组的增强函数的增强单元,配置成增强组包络中的峰值和/或衰减组包络中的谷值;及
--组合单元,用于使每一个别子频带组的子频带中的信号乘以所涉及子频带组的相应增强函数或者其缩放版以提供增强的子频带信号。
2.根据权利要求1所述的听力装置,其中所述信号处理单元包括另一处理单元,用于将随频率和/或电平而变的增益或衰减和/或其它信号处理算法应用于子频带信号或增强的子频带信号以提供处理后的子频带信号。
3.根据权利要求1所述的听力装置,包括合成滤波器组,用于将处理后的子频带信号转换为时域电输出信号。
4.根据权利要求3所述的听力装置,包括用于将时域电输出信号转换为可由用户感知为声音的刺激的输出单元。
5.根据权利要求1所述的听力装置,包括助听器、头戴式耳机、耳麦、耳朵保护装置或其组合。
6.用于提高听力受损人员感知上将目标声音与竞争声音分离的能力的方法,目标声音和竞争声音形成具有给定频率范围的合成声音信号,所述方法包括:
-将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带;
-基于多个子频带之间的可比特性将子频带安排成子频带组;
-计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;
-使每一个别子频带组的子频带中的信号乘以增强组包络中的峰值和/或衰减组包络中的谷值的函数,从而提供每一所述子频带组的增强包络。
7.根据权利要求6所述的方法,其中所述可比特性包括所述多个子频带中的信号包络之间的相关。
8.根据权利要求6所述的方法,包括步骤:
-对于每一所述子频带,计算该频带的包络;
-对于每一子频带组,计算特定子频带组中的每一子频带的包络和对应的组包络之间的相关;
-对于每一子频带组,计算所涉及子频带组中的每一子频带的增强包络;
-对于每一子频带,使该频带中的信号与该频带的增强包络相乘。
9.根据权利要求6所述的方法,包括步骤:
-计算每一所述子频带的包络之间的相关,从而提供相关矩阵C;
-基于所述相关矩阵C将子频带分组为子频带组;
-计算每一子频带组的组包络。
10.根据权利要求6所述的方法,其中所述分组包括下面的步骤:
-定义相关阈值C_thr;
-选择相关矩阵C的具有最高阈上值的和的行;
-将所选行中其相关大于C_thr的子频带指定为第一子频带组的成员。
11.根据权利要求10所述的方法,其中所述分组还包括:
-将相关矩阵C的行和列中对应于所述第一子频带组的子频带的元素设定为等于零,从而提供修改的相关矩阵CM;
-选择所述修改的相关矩阵CM的具有最高阈上相关的和的行;
-将所选行中其相关大于C_thr的子频带指定为第二子频带组的成员。
12.根据权利要求6所述的方法,其中组包络的峰值的增强及组包络中谷值的衰减包括下面的步骤:
-定义调制增强m_enh;
-对于所定义的调制增强m_enh,保存组包络的均值、调制深度m_group和在时间n相对于所述均值的当前振幅偏移的流水账,其中调制深度由m_group给出;
-对于每一相应子频带组中的每一子频带:
--使当前时间窗口中的信号乘以(1+p(n)*c(n)*m_enh),其中0≤p(n)≤1,及其中p(n)为频带包络的与组包络的相关的函数。
13.根据权利要求6所述的方法,其中调制增强m_enh被分成两个增强部分,一个控制峰值增强的程度,及一个控制谷值加深的程度。
14.根据权利要求6所述的方法,其中可比特性为每一单独的子频带的振幅变化中的基频F0k,其中k为子频带指数。
15.一种助听器,配置成至少部分基于子频带级运行,及配置成提高助听器接收的、包括目标语音信号和竞争声音分量的合成信号中目标语音信号的感知,所述助听器包括基于共同调制的感知增强单元。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16176513 | 2016-06-27 | ||
EP16176513.6 | 2016-06-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107547983A true CN107547983A (zh) | 2018-01-05 |
CN107547983B CN107547983B (zh) | 2021-04-27 |
Family
ID=56263604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710502898.6A Active CN107547983B (zh) | 2016-06-27 | 2017-06-27 | 用于提高目标声音的可分离性的方法和听力装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10560790B2 (zh) |
EP (1) | EP3264799B1 (zh) |
CN (1) | CN107547983B (zh) |
DK (1) | DK3264799T3 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111053970A (zh) * | 2018-10-17 | 2020-04-24 | 奥迪康医疗有限公司 | 互相关阈值估计方法 |
WO2021114545A1 (zh) * | 2019-12-11 | 2021-06-17 | 江苏爱谛科技研究院有限公司 | 一种声音增强方法及声音增强系统 |
WO2021129197A1 (zh) * | 2019-12-25 | 2021-07-01 | 荣耀终端有限公司 | 一种语音信号处理方法及装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102544250B1 (ko) * | 2018-07-03 | 2023-06-16 | 삼성전자주식회사 | 소리를 출력하는 디바이스 및 그 방법 |
US11694708B2 (en) * | 2018-09-23 | 2023-07-04 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11264014B1 (en) | 2018-09-23 | 2022-03-01 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
WO2020245631A1 (en) * | 2019-06-05 | 2020-12-10 | Harman International Industries, Incorporated | Sound modification based on frequency composition |
KR20220066886A (ko) * | 2019-09-24 | 2022-05-24 | 소니그룹주식회사 | 신호 처리 장치, 신호 처리 방법 및 프로그램 |
DE102019218808B3 (de) * | 2019-12-03 | 2021-03-11 | Sivantos Pte. Ltd. | Verfahren zum Trainieren eines Hörsituationen-Klassifikators für ein Hörgerät |
CN117079657B (zh) * | 2023-10-16 | 2024-01-26 | 中国铁塔股份有限公司 | 压限处理方法、装置、电子设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
CN1573930A (zh) * | 2003-06-12 | 2005-02-02 | 阿尔派株式会社 | 语音修正装置 |
US20070053522A1 (en) * | 2005-09-08 | 2007-03-08 | Murray Daniel J | Method and apparatus for directional enhancement of speech elements in noisy environments |
CN101287306A (zh) * | 2007-04-11 | 2008-10-15 | 奥迪康有限公司 | 助听器 |
CN101361124A (zh) * | 2006-11-27 | 2009-02-04 | 索尼计算机娱乐公司 | 声音处理装置和声音处理方法 |
US20090103742A1 (en) * | 2007-10-23 | 2009-04-23 | Swat/Acr Portfolio Llc | Hearing Aid Apparatus |
CN102984634A (zh) * | 2011-11-22 | 2013-03-20 | 南京工程学院 | 一种数字助听器非等宽子带自动增益控制方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6732073B1 (en) * | 1999-09-10 | 2004-05-04 | Wisconsin Alumni Research Foundation | Spectral enhancement of acoustic signals to provide improved recognition of speech |
US8023673B2 (en) | 2004-09-28 | 2011-09-20 | Hearworks Pty. Limited | Pitch perception in an auditory prosthesis |
US8139787B2 (en) * | 2005-09-09 | 2012-03-20 | Simon Haykin | Method and device for binaural signal enhancement |
DE102015207706B3 (de) * | 2015-04-27 | 2016-08-18 | Sivantos Pte. Ltd. | Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals |
-
2017
- 2017-06-27 EP EP17178001.8A patent/EP3264799B1/en active Active
- 2017-06-27 US US15/634,465 patent/US10560790B2/en active Active
- 2017-06-27 CN CN201710502898.6A patent/CN107547983B/zh active Active
- 2017-06-27 DK DK17178001.8T patent/DK3264799T3/da active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
CN1573930A (zh) * | 2003-06-12 | 2005-02-02 | 阿尔派株式会社 | 语音修正装置 |
US20070053522A1 (en) * | 2005-09-08 | 2007-03-08 | Murray Daniel J | Method and apparatus for directional enhancement of speech elements in noisy environments |
CN101361124A (zh) * | 2006-11-27 | 2009-02-04 | 索尼计算机娱乐公司 | 声音处理装置和声音处理方法 |
CN101287306A (zh) * | 2007-04-11 | 2008-10-15 | 奥迪康有限公司 | 助听器 |
US20090103742A1 (en) * | 2007-10-23 | 2009-04-23 | Swat/Acr Portfolio Llc | Hearing Aid Apparatus |
CN102984634A (zh) * | 2011-11-22 | 2013-03-20 | 南京工程学院 | 一种数字助听器非等宽子带自动增益控制方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111053970A (zh) * | 2018-10-17 | 2020-04-24 | 奥迪康医疗有限公司 | 互相关阈值估计方法 |
CN111053970B (zh) * | 2018-10-17 | 2024-04-09 | 奥迪康医疗有限公司 | 互相关阈值估计方法 |
WO2021114545A1 (zh) * | 2019-12-11 | 2021-06-17 | 江苏爱谛科技研究院有限公司 | 一种声音增强方法及声音增强系统 |
US11570553B2 (en) | 2019-12-11 | 2023-01-31 | Jiangsu aidiSciTech Reseach Institute Co., Ltd. | Method and apparatus for sound enhancement |
WO2021129197A1 (zh) * | 2019-12-25 | 2021-07-01 | 荣耀终端有限公司 | 一种语音信号处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20170374478A1 (en) | 2017-12-28 |
DK3264799T3 (da) | 2019-07-29 |
EP3264799A1 (en) | 2018-01-03 |
CN107547983B (zh) | 2021-04-27 |
US10560790B2 (en) | 2020-02-11 |
EP3264799B1 (en) | 2019-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107547983A (zh) | 用于提高目标声音的可分离性的方法和听力装置 | |
EP3514792B1 (en) | A method of optimizing a speech enhancement algorithm with a speech intelligibility prediction algorithm | |
CN103716744B (zh) | 具有随脑电波而变的音频处理的听力装置 | |
EP3214620B1 (en) | A monaural intrusive speech intelligibility predictor unit, a hearing aid system | |
US10154353B2 (en) | Monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system | |
CN107371111B (zh) | 用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统 | |
Chen et al. | Predicting the intelligibility of reverberant speech for cochlear implant listeners with a non-intrusive intelligibility measure | |
CN105848078A (zh) | 双耳听力系统 | |
CN105323690A (zh) | 基于自然声音信号诱发的听觉诱发电位的自动实时助听器验配 | |
CN107484080A (zh) | 音频处理装置及用于估计声音信号的信噪比的方法 | |
CN107864440A (zh) | 包括eeg记录和分析系统的助听系统 | |
CN105872923A (zh) | 包括双耳语音可懂度预测器的听力系统 | |
US11564048B2 (en) | Signal processing in a hearing device | |
CN107872762A (zh) | 话音活动检测单元及包括话音活动检测单元的听力装置 | |
EP3934279A1 (en) | Personalization of algorithm parameters of a hearing device | |
EP2890159A1 (en) | Methods and apparatus for processing audio signals | |
CN107454537A (zh) | 包括滤波器组和起始检测器的听力装置 | |
CN108235181A (zh) | 在音频处理装置中降噪的方法 | |
Koning et al. | Speech onset enhancement improves intelligibility in adverse listening conditions for cochlear implant users | |
CN106254998A (zh) | 包括用于掩蔽耳鸣的信号发生器的听力装置 | |
CN108235211A (zh) | 包括动态压缩放大系统的听力装置及其运行方法 | |
CN107426663A (zh) | 包括波束形成器滤波单元和增益单元的可配置的助听器 | |
Leijon et al. | Fast amplitude compression in hearing aids improves audibility but degrades speech information transmission | |
Eneman et al. | Auditory-profile-based physical evaluation of multi-microphone noise reduction techniques in hearing instruments | |
Grant et al. | An objective measure for selecting microphone modes in OMNI/DIR hearing aid circuits |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |