CN107547983B - 用于提高目标声音的可分离性的方法和听力装置 - Google Patents

用于提高目标声音的可分离性的方法和听力装置 Download PDF

Info

Publication number
CN107547983B
CN107547983B CN201710502898.6A CN201710502898A CN107547983B CN 107547983 B CN107547983 B CN 107547983B CN 201710502898 A CN201710502898 A CN 201710502898A CN 107547983 B CN107547983 B CN 107547983B
Authority
CN
China
Prior art keywords
signal
group
sub
envelope
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710502898.6A
Other languages
English (en)
Other versions
CN107547983A (zh
Inventor
G·琼斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oticon AS
Original Assignee
Oticon AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oticon AS filed Critical Oticon AS
Publication of CN107547983A publication Critical patent/CN107547983A/zh
Application granted granted Critical
Publication of CN107547983B publication Critical patent/CN107547983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/0332Details of processing therefor involving modification of waveforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • H04R25/554Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/41Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了用于提高目标声音的可分离性的方法和听力装置,其中所述听力装置包括输入单元;分析滤波器组;信号处理单元,连接到所述分析滤波器组并包括:频带分组单元,用于基于多个子频带信号之间的可比特性将子频带安排成子频带组;包络提取单元,用于计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;用于提供每一子频带组的增强函数的增强单元,配置成增强组包络中的峰值和/或衰减组包络中的谷值;及组合单元,用于使每一个别子频带组的子频带中的信号乘以所涉及子频带组的相应增强函数或者其缩放版以提供增强的子频带信号。

Description

用于提高目标声音的可分离性的方法和听力装置
技术领域
本发明总体上涉及用于提高听力受损用户感知上将目标声音与竞争声音分 离的能力的方法,其中目标声音和竞争声音叠加在合成输入信号中。更具体地, 本发明涉及在子频带之间应用共同调制以提高分离效果。
背景技术
听力完全未受损的人可将信号的复杂混合分解为多个个别的信号,使得他 们能注意他们选择的信号。另一方面,具有听力损失的人在存在其它竞争声音 的情形下理解语音通常具有较大困难。现有的助听器技术未提供足够的支持来 满足他们在复杂听音环境下的需要。这是因为经现有技术助听器的放大仅能够 恢复声音的可听度和响度。使用现有技术助听器并不恢复“分离”声音的复杂 混合的能力。
因此,需要提供一种听力仪器如助听器,其不仅恢复通过听力仪器提供给 助听器用户的声音的可听度和响度,而且提高听力受损用户感知上将目标声音 (例如声音)与竞争声音(如环境中的多个讲话者或其它噪声)分离的能力。
发明内容
本发明的目的在于增强共同调制线索。
听力装置
在广义方面,本发明提供一种听力装置如助听器,其配置成至少部分在时 频域(基于子频带级)运行及配置成提高听力装置接收的目标(语音)信号的 感知,合成信号包括所述目标信号和竞争信号分量(“噪声”或“掩蔽声 音”)。该听力装置包括基于共同调制的感知增强单元。该感知单元配置成监 视至少部分(所选)子频带中的竞争声音分量的调制(如调幅)。代替试图提 高所述子频带的(目标)信噪比,感知单元以可实际上减小(至少部分)子频 带中的信噪比进行配置,其通过将反映竞争声音分量的所述调制的共同调制应用于至少部分子频带进行。
在本申请的一方面,提供用于提高听力受损用户感知上将目标声音与竞争 声音分离的能力的听力装置,目标声音和竞争声音形成具有给定频率范围的合 成声音信号。该听力装置还包括:
-输入单元,用于将时域电输入信号y(n)提供为数字样本,数字样本在形 成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为 时间样本指数;
-分析滤波器组,用于将所述合成声音信号的所述工作频率范围或其一部 分细分为多个子频带并提供对应的子频带信号;
-信号处理单元,连接到所述分析滤波器组并包括
--频带分组单元,用于基于多个子频带信号之间的可比特性将子频带安排 成子频带组;
--包络提取单元,用于计算每一所述子频带组的组包络,所述组包络包括 峰值和谷值;
--用于提供每一子频带组的增强函数的增强单元,配置成增强组包络中的 峰值和/或衰减组包络中的谷值;及
--组合单元,用于使每一个别子频带组的子频带中的信号乘以所涉及子频 带组的相应增强函数或者其缩放版以提供增强的子频带信号。
从而可提供改进的听力装置。
在本发明中,术语“频带”和“子频带”可互换地使用,在指示所涉及方 法或装置的工作频率范围的子范围方面没有任何计划的差别。类似地,术语 “组”(当结合一组频带或子频带使用时)和“子频带组”具有一样的含义。
在实施例中,组合单元配置成使给定子频带组的大部分或所有子频带信号 与对应于该组的增强函数相乘。在实施例中,组合单元配置成使给定子频带组 的大部分或所有子频带信号与对应于该组的增强函数的(可能个别)缩放的版 本相乘。
在实施例中,信号处理单元包括包括另一处理单元,用于将随频率和/或电 平而变的增益或衰减和/或其它信号处理算法应用于子频带信号或增强的子频带 信号以提供处理后的子频带信号。
在实施例中,听力装置包括合成滤波器组,用于将处理后的子频带信号转 换为时域电输出信号。
在实施例中,听力装置包括用于将时域电输出信号转换为可由用户感知为 声音的刺激的输出单元。在实施例中,输出单元包括耳蜗植入物的多个电极或 者骨导听力装置的振动器。在实施例中,输出单元包括输出变换器。在实施例 中,输出变换器包括用于将刺激作为声信号提供给用户的接收器(扬声器)。 在实施例中,输出变换器包括用于将刺激作为颅骨的机械振动提供给用户的振 动器(例如在附着到骨头的或骨锚式听力装置中)。
在实施例中,听力装置包括助听器、头戴式耳机、耳麦、耳朵保护装置或 其组合。
在实施例中,听力装置适于提供随频率而变的增益和/或随电平而变的压缩 和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率 压缩)以补偿用户的听力受损。在实施例中,听力装置包括用于增强输入信号 并提供处理后的输出信号的信号处理单元。
在实施例中,输入单元包括用于将输入声音转换为电输入信号的输入变换 器如传声器。在实施例中,输入单元包括用于接收包括声音的无线信号并提供 表示所述声音的电输入信号的无线接收器。在实施例中,听力装置包括定向传 声器系统,其适于对来自环境的声音进行空间滤波,从而例如相对于佩戴听力 装置的用户的局部环境中的其它声源增强目标声源。在实施例中,定向系统适 于检测(如自适应检测)传声器信号的特定部分源自哪一方向(例如目标信号, 和/或一个或多个噪声源)。
在实施例中,听力装置包括用于从另一装置如通信装置或另一听力装置 (例如建立到另一装置的通信链路)无线接收直接电输入信号的天线和收发器 电路。在实施例中,无线链路基于标准化或专有技术。在实施例中,无线链路 基于蓝牙技术(如蓝牙低功率技术)。
在实施例中,听力装置具有0.15m级的最大外尺寸(如手持移动电话)。 在实施例中,听力装置具有0.08m级的最大外尺寸(如头戴式耳机)。在实施 例中,听力装置具有0.04m级的最大外尺寸(如听力仪器)。
在实施例中,听力装置为便携装置,例如包括本机能源如电池例如可再充 电电池的装置。
在实施例中,听力装置包括输入变换器(传声器系统和/或直接电输入(如 无线接收器))和输出变换器之间的正向或信号通路。在实施例中,信号处理 单元位于正向通路中。在实施例中,信号处理单元适于根据用户的特定需要提 供随频率而变的增益。在实施例中,听力装置包括具有用于分析输入信号(如 确定电平、调制、信号类型、声反馈估计量等)的功能件的分析通路。在实施 例中,分析通路和/或信号通路的部分或所有信号处理在频域进行。在实施例中, 分析通路和/或信号通路的部分或所有信号处理在时域进行。
在实施例中,表示声信号的模拟电信号在模数(AD)转换过程中转换为 数字音频信号,其中模拟信号以预定采样频率或采样速率fs进行采样,fs例如 在从8kHz到48kHz的范围中(适应应用的特定需要)以在离散的时间点tn (或n)提供数字样本xn(或x[n]),每一音频样本通过预定的Ns比特表示声 信号在tn时的值,Ns例如在从1到48比特的范围中如24比特。数字样本x具 有1/fs的时间长度,如50μs,对于fs=20kHz。在实施例中,多个音频样本按时间帧安排。在实施例中,一时间帧包括64个或128个音频数据样本。根据实 际应用可使用其它帧长度。
在实施例中,听力装置包括模数(AD)转换器以按预定的采样速率如 20kHz对模拟输入进行数字化。在实施例中,听力装置包括数模(DA)转换器 以将数字信号转换为模拟输出信号,例如用于经输出变换器呈现给用户。
在实施例中,听力装置如传声器单元和/或收发器单元包括TF转换单元 (如分析滤波器组),用于提供输入信号的时频表示。在实施例中,时频表示 包括所涉及信号在特定时间和频率范围的相应复值或实值的阵列或映射。在实 施例中,TF转换单元包括滤波器组,用于对(时变)输入信号进行滤波并提供 多个(时变)输出信号,每一输出信号包括截然不同的输入信号频率范围。在 实施例中,TF转换单元包括用于将时变输入信号转换为频域中的(时变)信号 的傅里叶变换单元。在实施例中,听力装置考虑的、从最小频率fmin到最大频 率fmax的频率范围包括从20Hz到20kHz的典型人听频范围的一部分,例如从 20Hz到12kHz的范围的一部分。在实施例中,听力装置的正向通路和/或分析 通路的信号拆分为NI个子频带,其中NI例如大于5,如大于10,如大于50, 如大于100,如大于500,至少部分频带个别地处理。在实施例中,听力装置 适于在NP个不同频道处理正向和/或分析通路的信号(NP≤NI)。频道可以宽 度一致或不一致(如宽度随频率增加)、重叠或不重叠。
在实施例中,听力装置包括多个检测器,其配置成提供与听力装置的当前 物理环境(如当前声环境)有关、和/或与佩戴听力装置的用户的当前状态有关、 和/或与听力装置的当前状态或运行模式有关的状态信号。作为备选或另外,一 个或多个检测器可形成与助听器(如无线)通信的外部装置的一部分。外部装 置例如可包括另一助听装置、遥控器、音频传输装置、电话(如智能电话)、 外部传感器等。
在实施例中,多个检测器中的一个或多个对全带信号起作用(时域)。在 实施例中,多个检测器中的一个或多个对频带拆分的信号起作用((时-)频 域)。
在实施例中,多个检测器包括电平检测器,用于估计正向通路的信号的当 前电平。在实施例中,预定判据包括正向通路的信号的当前电平是高于还是低 于给定(L-)阈值。在实施例中,预定判据包括正向通路的信号的当前电平是 否在一个或多个电平值范围内。
在特定实施例中,听力装置包括话音检测器(VD),用于确定输入信号 是否包括话音信号(在特定时间点)。在本说明书中,话音信号包括来自人类 的语音信号。其还可包括由人类语音系统产生的其它形式的发声(如唱歌)。 在实施例中,话音检测器单元适于将用户当前的声环境分类为话音或无话音环 境。这具有下述优点:包括用户环境中的人类发声(如语音)的电传声器信号 的时间段可被识别,因而与仅包括其它声源(如人工产生的噪声)的时间段分 离。在实施例中,话音检测器适于还将用户自己的话音检测为话音。作为备选, 话音检测器适于从话音检测排除用户自己的话音。
在实施例中,听力装置包括自我话音检测器,用于检测特定输入声音(如 话音)是否源自系统用户的话音。在实施例中,听力装置的传声器系统适于能 够在用户自己的话音和另一人的话音之间进行区分及可能与非话音声音区分开。
在实施例中,多个检测器包括运动检测器如加速度传感器。在实施例中, 运动检测器配置成检测用户的面部肌肉和/或骨头例如因语音或咀嚼(如颌部运 动)引起的运动并提供标示该运动的检测器信号。
在实施例中,助听装置包括分类单元,配置成基于来自(至少部分)检测 器的输入信号及可能其它输入对当前情形进行分类。在本说明书中,“当前情 形”由下面的一个或多个定义:
a)物理环境(如包括当前电磁环境,例如出现计划或未计划由听力装置 接收的电磁信号(包括音频和/或控制信号),或者当前环境不同于声学的其它 性质);
b)当前声学情形(输入电平、反馈等);
c)用户的当前模式或状态(运动、温度等);
d)助听装置和/或与听力装置通信的另一装置的当前模式或状态(所选程 序、自上次用户交互之后消逝的时间等)。
在实施例中,听力装置包括声学(和/或机械)反馈抑制系统。在实施例中, 听力装置还包括用于所涉及应用的其它适宜功能,如压缩、降噪等。
在实施例中,听力装置包括听音装置,例如助听器,例如听力仪器,例如 适于位于耳朵处或者完全或部分位于用户耳道中的听力仪器,例如头戴式耳机、 耳麦、耳朵保护装置或其组合。
用途
此外,本发明提供上面描述的、“具体实施方式”中详细描述的及权利要 求中限定的听力装置的用途。在实施例中,提供在包括音频分布的系统中的用 途。在实施例中,提供在包括一个或多个听力仪器、头戴式耳机、耳麦、有源 耳朵保护系统等的系统中的用途,例如免提电话系统、远程会议系统、广播系 统、卡拉OK系统、教室放大系统等。
方法
一方面,本申请还提供用于提高听力受损人员感知上将目标声音与竞争声 音分离的能力的方法,目标声音和竞争声音形成具有给定频率范围的合成声音 信号。该方法包括:
-将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率 范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带;
-基于多个子频带之间的可比特性将子频带安排成子频带组;
-计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;及
-使每一个别子频带组的子频带中的信号乘以增强组包络中的峰值和/或衰 减组包络中的谷值的函数,从而提供每一所述子频带组的增强包络。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的 或权利要求中限定的装置的部分或所有结构特征可与本发明方法的实施结合, 反之亦然。方法的实施具有与对应装置一样的优点。
“增强组包络中的峰值和/或衰减组包络中的谷值”的函数也称为增强函 数。在实施例中,该方法包括使给定子频带组的所有子频带信号与对应于该组 的(增强)函数相乘。在实施例中,组合单元配置成使给定子频带组的所有子 频带信号与对应于该组的增强函数的(可能个别)缩放的版本相乘。
组包络例如可通过下面的方法之一(单独或组合)进行确定:
a、半波整流,之后低通滤波;
b、一次一个频带,然后包络的非加权或加权平均;
c、滤波器组,处于该组中的通过频带及未处于该组中的归零频带,然后 提取所得时间波形的包络,-->这是组包络;
d、滤波器组,使处于该组中的频带乘以加权系数及未处于该组中的归零 频带,然后提取所得时间波形的包络,-->这是组包络;
e、希尔伯特包络。
在实施例中,可比特性包括所述多个子频带中的信号包络之间的相关。
在实施例中,该方法包括:
-对于每一所述子频带,计算该频带的包络;
-对于每一子频带组,计算特定子频带组中的每一子频带的包络和对应的 组包络之间的相关;
-对于每一子频带组,计算所涉及子频带组中的每一子频带的增强包络;
-对于每一子频带,使该频带中的信号与该频带的增强包络相乘。
在实施例中,该方法包括:
-在实施例中,该方法包括:
-计算每一所述子频带的包络之间的相关,从而提供相关矩阵C;
-基于所述相关矩阵C将子频带分组为子频带组;
-计算每一子频带组的组包络。
在实施例中,将子频带安排成子频带组(“分组”)包括下面的步骤:
-定义相关阈值C_thr;
-选择相关矩阵C的具有最高阈上值的和的行;
-将所选行中其相关大于C_thr的子频带指定为第一子频带组的成员。
在实施例中,分组还包括:
-将相关矩阵C的行和列中对应于所述第一子频带组的子频带的元素设定 为等于零,从而提供修改的相关矩阵CM
-选择所述修改的相关矩阵CM的具有最高阈上相关的和的行;
-将所选行中其相关大于C_thr的子频带指定为第二子频带组的成员。
在实施例中,组包络的峰值的增强及组包络中谷值的衰减包括下面的步骤:
-定义调制增强m_enh;
-对于所定义的调制增强m_enh,保存组包络的均值、调制深度m_group 和在时间n相对于所述均值的当前振幅偏移的流水账,其中调制深度由 m_group给出;
-对于每一相应子频带组中的每一子频带:
--使当前时间窗口中的信号乘以(1+p(n)*c(n)*m_enh),其中0<p(n)<1, 及其中p(n)为频带包络的与组包络的相关的函数。
在实施例中,调制增强m_enh被分成两个增强部分,一个控制峰值增强的 程度,及一个控制谷值加深的程度。
在实施例中,可比特性为每一单独的子频带的振幅变化中的基频F0k,其 中k为子频带指数。
计算机可读介质
本发明进一步提供保存包括程序代码的计算机程序的有形计算机可读介质, 当计算机程序在数据处理系统上运行时,使得数据处理系统执行上面描述的、 “具体实施方式”中详细描述的及权利要求中限定的方法的至少部分(如大部 分或所有)步骤。
作为例子但非限制,前述有形计算机可读介质可包括RAM、ROM、 EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁性存储装置,或 者可用于执行或保存指令或数据结构形式的所需程序代码并可由计算机访问的 任何其他介质。如在此使用的,盘包括压缩磁盘(CD)、激光盘、光盘、数字 多用途盘(DVD)、软盘及蓝光盘,其中这些盘通常磁性地复制数据,同时这 些盘可用激光光学地复制数据。上述盘的组合也应包括在计算机可读介质的范围内。除保存在有形介质上之外,计算机程序也可经传输介质如有线或无线链 路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置 处运行。
数据处理系统
一方面,本发明进一步提供数据处理系统,包括处理器和程序代码,程序 代码使得处理器执行上面描述的、“具体实施方式”中详细描述的及权利要求 中限定的方法的至少部分(如大部分或所有)步骤。
包括数据处理系统的听力装置
一方面,本申请还提供一种听力装置如助听器,用于提高听力受损用户感 知上将目标声音与竞争声音分离的能力,其中所述听力装置包括上面描述的、 “具体实施方式”中详细描述的及权利要求中限定的数据处理系统。
从而提供流隔离线索增强的输出信号以呈现给听力装置的用户。
听力系统
另一方面,本发明提供包括上面描述的、“具体实施方式”中详细描述的 及权利要求中限定的听力装置及包括辅助装置的听力系统。
在实施例中,该听力系统适于在听力装置和辅助装置之间建立通信链路以 使信息(如控制和状态信号,可能音频信号)能在其间进行交换或从一装置转 发给另一装置。在实施例中,听力系统配置成运行使能经辅助装置控制听力系 统的功能的APP。
在实施例中,辅助装置是或包括音频网关设备,其适于(如从娱乐装置例 如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC)接收多 个音频信号,及适于选择和/或组合所接收音频信号(或信号组合)中的适当信 号以传给听力装置。在实施例中,辅助装置是或包括遥控器,用于控制听力装 置的功能和运行。在实施例中,辅助装置是或包括智能电话。在实施例中,遥 控器的功能实施在智能电话中,该智能电话可能运行使能经智能电话控制音频 处理装置的功能的APP(听力装置包括适当的到智能电话的无线接口,例如基 于蓝牙或一些其它标准化或专有方案)。
在实施例中,辅助装置为另一听力装置。在实施例中,听力系统包括适于 实施双耳听力系统如双耳听力装置系统的两个听力装置。在实施例中,听力系 统包括适于实施或形成双耳助听器系统的一部分的两个听力装置。
APP
另一方面,本发明还提供称为APP的非短暂应用。APP包括可执行指令, 其配置成在辅助装置上运行以实施用于上面描述的、“具体实施方式”中详细 描述的及权利要求中限定的听力装置或听力系统的用户接口。在实施例中,该 APP配置成在移动电话如智能电话或另一使能与所述听力装置或听力系统通信 的便携装置上运行。在实施例中,该APP配置成控制听力系统的功能。
定义
在本说明书中,“听力装置”指适于改善、增强和/或保护用户的听觉能力 的装置如听力仪器或有源耳朵保护装置或其它音频处理装置,其通过从用户环 境接收声信号、产生对应的音频信号、可能修改该音频信号、及将可能已修改 的音频信号作为可听见的信号提供给用户的至少一只耳朵而实现。“听力装置” 还指适于以电子方式接收音频信号、可能修改该音频信号、及将可能已修改的 音频信号作为听得见的信号提供给用户的至少一只耳朵的装置如头戴式耳机或 耳麦。听得见的信号例如可以下述形式提供:辐射到用户外耳内的声信号、作 为机械振动通过用户头部的骨结构和/或通过中耳的部分传到用户内耳的声信号、 及直接或间接传到用户耳蜗神经的电信号。
听力装置可构造成以任何已知的方式进行佩戴,如作为佩戴在耳后的单元 (具有将辐射的声信号导入耳道内的管或者具有安排成靠近耳道或位于耳道中 的扬声器)、作为整个或部分安排在耳廓和/或耳道中的单元、作为连到植入在 颅骨内的固定结构的单元、或作为整个或部分植入的单元等。听力装置可包括 单一单元或几个彼此电子通信的单元。
更一般地,听力装置包括用于从用户环境接收声信号并提供对应的输入音 频信号的输入变换器和/或以电子方式(即有线或无线)接收输入音频信号的接 收器、用于处理输入音频信号的(通常可配置的)信号处理电路、及用于根据 处理后的音频信号将听得见的信号提供给用户的输出装置。在一些听力装置中, 放大器可构成信号处理电路。信号处理电路通常包括一个或多个(集成或单独 的)存储元件,用于执行程序和/或用于保存在处理中使用(或可能使用)的参 数和/或用于保存适合听力装置功能的信息和/或用于保存例如结合到用户的接 口和/或到编程装置的接口使用的信息(如处理后的信息,例如由信号处理电路 提供)。在一些听力装置中,输出装置可包括输出变换器,例如用于提供空传 声信号的扬声器或用于提供结构或液体传播的声信号的振动器。在一些听力装 置中,输出装置可包括一个或多个用于提供电信号的输出电极。
在一些听力装置中,振动器可适于经皮或由皮将结构传播的声信号传给颅 骨。在一些听力装置中,振动器可植入在中耳和/或内耳中。在一些听力装置中, 振动器可适于将结构传播的声信号提供给中耳骨和/或耳蜗。在一些听力装置中, 振动器可适于例如通过卵圆窗将液体传播的声信号提供到耳蜗液体。在一些听 力装置中,输出电极可植入在耳蜗中或植入在颅骨内侧上,并可适于将电信号 提供给耳蜗的毛细胞、一个或多个听觉神经、听觉脑干、听觉中脑、听觉皮层 和/或大脑皮层的其它部分。
“听力系统”指包括一个或两个听力装置的系统。“双耳听力系统”指包 括两个听力装置并适于协同地向用户的两只耳朵提供听得见的信号的系统。听 力系统或双耳听力系统还可包括一个或多个“辅助装置”,其与听力装置通信 并影响和/或受益于听力装置的功能。辅助装置例如可以是遥控器、音频网关设 备、移动电话(如智能电话)、广播系统、汽车音频系统或音乐播放器。听力 装置、听力系统或双耳听力系统例如可用于补偿听力受损人员的听觉能力损失、 增强或保护正常听力人员的听觉能力和/或将电子音频信号传给人。
本发明的实施例如可用在下述应用中:助听器、头戴式耳机、耳麦、耳朵 保护系统、免提电话系统、移动电话等。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为 清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所 必要的细节,而省略其他细节。在整个说明书中,同样的附图标记用于同样或 对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些 及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1A和1B示出了使掩蔽信号在多个子频带上共同调制提高与掩蔽信号一 起存在的目标信号的听觉感知的基本原理。
图2A示出了根据本发明的方法的第一部分的实施例。
图2B示出了根据本发明的方法的第二部分的实施例。
图3示出了根据本发明的方法的第一实施例的流程图。
图4示出了根据本发明的方法的第二实施例的流程图。
图5A示出了根据本发明第一实施例的助听器的简化框图。
图5B示出了根据本发明第二实施例的助听器的简化框图。
图6示出了根据本发明实施例的信号处理单元的简化框图。
图7A示出了包括与辅助装置通信的左和右听力装置的双耳助听器系统的 实施例。
图7B示出了用于根据本发明的双耳助听器系统的用作用户接口的辅助装 置。
通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而, 应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说 明目的给出。对于本领域技术人员来说,基于下面的详细描述,本发明的其它 实施方式将显而易见。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用 于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易 见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方 面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等 (统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元 素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微处理器、微控制器、数字信号处理器(DSP)、现场可 编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、 及配置成执行本说明书中描述的多个不同功能的其它适当硬件。计算机程序应 广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件 模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、 程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
本申请涉及听力装置如助听器领域。
图1A和1B示出了使掩蔽信号在多个子频带上共同调制提高与掩蔽信号一 起存在的目标信号的听觉感知的基本原理。示出了多个(在此为5个)子频带 信号F1,F2,F3,F4,F5,对于1s的时间段(参见水平轴“时间(s)”),具有 -1和1之间的(归一化)相对振幅。
用于提高听力受损用户感知上分离目标声音和竞争声音的能力的关键线索 之一为共同调制,其中“共同调制”指跨多个子频带共享的调幅(例如参见 [Hall et al.,1984]或者[Nelken et al.,1999])。图1A和1B表示共同调制及其感 知结果的示意性图示:当存在多个共同调制的掩蔽频带时,目标声音和掩蔽声 音看上去感知上更可分离。
在图1A和1B所示的例子中,示出了与具有时变包络的“噪声”(即非目 标)信号(附图标记2)混合的相当恒定包络的目标信号(附图标记1)的示 意性振幅-时间曲线。中间子频带F3中的目标声音1被中间子频带F3中的竞争 声音2掩蔽,很难检测到该目标(图1A)。附图所示的原理在于,多个(共 同调制的)“掩蔽频带”的存在(图1B)似乎使目标声音1与掩蔽声音2彼此 感知上分离更容易(由图1B的子频带F3中更清楚地出现恒定包络目标信号1 指明)。对此,自[Hall et al.,1984]开始,及从许多随后的、在共同调制的侧向 频带添加到掩蔽声音时发现改进的检测阈值的研究,均有大量证据。
图1A中所示的曲线示出了共同调制在增强目标声音1与掩蔽声音2的感 知可分离性方面的作用。在图1A中,目标声音1和掩蔽声音2仅在第三子频 带F3中存在,图1A的其它频带F1、F2、F4和F5均无声,即它们既不包含目 标声音也不包含掩蔽声音。在图1B中,第三子频带F3仍包含目标声音1和掩 蔽声音2,但其它子频带F1、F2、F4和F5包含掩蔽声音频率分量。具体地, 在图1B中,在所有子频带F1-F5中均存在掩蔽声音能量,掩蔽声音跨这些频带共同调制,如图1B的上部中记为M的箭头所示。具有几个共同调制的掩蔽 频带的感知结果在于其提供帮助听者感知上分离掩蔽声音和目标声音的线索。 尽管目标声音1在图1A和1B中一样,但听者在图1B所示的例子中更容易检 测到目标声音1。
应注意,子频带F1、F2、F4和F5中掩蔽声音的存在产生信噪比,在此我 们意指所有这些子频带中的能量的和实质上比竞争信号仅在F3中存在的情形 (如图1A中所示)更差。然而,由于掩蔽声音在子频带之间的共同调制,在 图1B的情形下获得更好的目标检测(感知)。在图1A和1B所示的简单例子 中使能改进窄带目标的检测的原理被认为对使多个宽带目标彼此分开同样重要。
图1A和1B中所示的例子示出了使本发明提供的解决方案与现有技术降噪 系统区分开的实质特征。即,现有技术降噪系统将掩蔽声音能量看待为对目标 的感知固有地不利,它们的目标在于减少掩蔽声音。与现有技术方法相反,根 据本发明的解决方案包括增强共同调制线索,目标在于在听力受损人员中(至 少部分)恢复非常重要的正常听力的分离能力,及普遍认为的信念一定程度上 作为目前专利申请的动机。
如图1A和1B所示,输入信号通常为既包括目标信号(如语音信号)又包 括竞争信号(如背景噪声和/或一个或多个竞争话音信号)的合成信号。根据本 发明,按下面的过程对给合成输入信号执行信号流分离,其包括:
i、将合成输入信号细分到多个子频带(频带1、频带2、……频带N,例 如参见图2A);
ii、基于相应频带中的类似特性(即各个时变频带信号的对每一频带均类 似的特性,如频带信号的包络或特征频率,如基频,例如参见图2A)对子频 带进行分组;
iii、对每一确定的子频带组,计算相应频带中的信号的组包络(例如参见 图2B);及
iv、使每一个别组的频带中的信号乘以增强组包络的峰值(振幅或能量) 和/或衰减组包络中的谷值(振幅或能量)的函数(例如参见图2B)。
因而,根据本发明的第一方面(其实施例如图3中所示),提供用于提高 听力受损人员的感知上分离目标声音和竞争声音的能力的方法,目标声音和竞 争声音形成具有给定频率范围的合成声音信号,其中该方法包括下面的步骤:
-将所述合成声音信号的频率范围细分为多个子频带;
-基于多个子频带的信号的可比特性对子频带进行分组;
-对每一子频带组,计算组包络;
-使每一个别子频带组的频带中的信号乘以增强组包络的峰值和/或衰减组 包络中的谷值的函数。
在实施例中,对于子频带组内的一些频带,峰值增强的量值大于该子频带 组内的其它频带的峰值增强的量值。在实施例中,增强的量值随个别频带的包 络和组包络之间的相关而变。在第一方面的实施例中,对子频带组内的一些频 带,谷值衰减的量值大于该子频带组内的其它频带。在实施例中所,衰减的量 值随个别频带的包络与组包络之间的相关而变。
应注意,增强或衰减的量值可被使得随每一个别频带的包络与其子频带组 的包络的相关而变,即使非基于相关的方法(如基频F0)用于选择子频带组也 是如此。
在实施例中,可比特性为所述多个子频带中的信号包络之间的相关(例如 在彼此展现相关的那些频带中,特定范围的相关度量(如互相关)分配给同一 子频带组)。
在实施例中,可比特性为每一单独的子频带的随时间的振幅变化中的基频 F0k(和/或其谐波),其中k为子频带指数。
在实施例中,该方法包括步骤:
-对于每一所述子频带,计算该频带的包络;
-对于每一子频带组,计算特定子频带组中的每一频带的包络和对应的组 包络之间的相关;
-对于每一子频带组,计算该子频带组中的每一频带的增强包络;
-对于每一频带,使该频带中的信号与该频带的增强包络相乘。
在实施例中,该方法包括步骤:
-对于每一所述子频带,计算该频带的包络;
-计算每一所述子频带的包络之间的相关,从而提供相关矩阵C;
-基于所述相关矩阵C将子频带分组为子频带组;
-计算每一子频带组的组包络;
-对于每一子频带组,计算特定子频带组中的每一频带的包络和对应的组 包络之间的相关;
-对于每一子频带组,计算该子频带组中的每一子频带的增强包络;
-对于每一子频带,使该频带中的信号与该子频带的增强包络相乘。
在第一方面的实施例中,分组包括步骤:
-定义相关阈值C_thr;
-选择相关矩阵C的具有最高阈上值的和的行;
-将所选行中其相关大于C_thr的频带指定为第一组的成员;
-将相关矩阵C的行和列中对应于所述第一子频带组的频带的元素设定为 等于零,从而提供修改的相关矩阵CM
-选择所述修改的相关矩阵CM的具有最高阈上相关的和的行;
-将所选行中其相关大于C_thr的频带指定为第二子频带组的成员。
在实施例中,其中2组以上频带被确定,优选形成第二修改的相关矩阵 CM’,及选择第三频带组,依此类推,直到修改的矩阵的所有非对角元素均低 于C_thr为止或者直到达到一些预定的最大组数为止。
在第一方面的实施例中,组包络的峰值的加强及组包络中谷值的衰减包括 下面的步骤:
-定义调制增强m_enh;
-对于所定义的调制增强m_enh,保存组包络的均值、调制深度m_group 和在时间n相对于所述均值的当前振幅偏移的流水账,其中偏移值c(n)给出组 包络相对于其移动平均的当前值。时变函数c(n)表示组调制包络并定义成使得 在组包络高于其移动平均时c(n)为正及在组包络低于其移动平均时c(n)为负;
-对于每一相应子频带组(指数j)中的每一子频带(指数k):
--使当前时间窗口中的信号乘以(1+p(n)*c(n)*m_enh)(在下面结合图6的 描述中称为“增强包络”或“增强函数”fe(j,p(k,n))),其中0<p(n)<1,及其 中p(n)确定在给定时间点在频带k中施加多少m_enh;p(n)例如可设定为取决 于频带包络与组包络的相关;
--使信号乘以(1+p(n)*c(n)*m_enh),从而增大该组的频带之间的共同调制 的峰值的量值及加深其谷值。
在实施例中,子频带特有参数p(n)取决于来自检测器或分类器的输入。
在第一方面的实施例中,调制增强m_enh分成两个增强部分,一个控制峰 值增强的程度,及一个控制谷值加深的程度。这具有两部分的增强可独立控制 的优点。在实施例中,可对最大允许的峰值增强进行具体限制。在实施例中, 可对最大允许的谷值衰减进行具体限制,例如以防止调制包络与零信号振幅交 叉从而产生大于100%的调制(过调制)。
根据本发明的第二方面,提供用于提高听力受损用户感知上将目标声音与 竞争声音分离的能力的听力装置,其中该听力装置包括处理器,配置成执行根 据本发明第一方面的方法,从而提供流分离线索增强的输出信号呈现给听力装 置的用户。
在第二方面的实施例中,听力装置是或包括助听器。
根据本发明的第三方面,提供一种包括处理器的数据处理系统,处理器被 提供适于执行根据本发明第一方面的方法的至少部分(如大部分或所有)步骤 的软件。
根据本发明的第四方面,提供能够执行根据本发明第一方面的方法的软件, 该软件可存储在有形计算机可读介质上或者编码为有形计算机可读介质上的一 个或多个指令或代码。计算机可读介质包括适于存储包括程序代码的计算机程 序的计算机存储介质,当计算机程序在处理系统上运行时,使得数据处理系统 执行根据本发明第一方面的方法的至少部分(如大部分或所有)步骤。
图2A示出了根据本发明的方法的第一部分的实施例,及图2B示出了根据 本发明的方法的第二部分的实施例。
参考图2A,信号8被提供给滤波器组(如一组带通滤波器10、11)。在 图1A和1B所示的例子中,使用五个这样的带通滤波器,但应当理解,只要需 要,可使用任何适当数量的这样的滤波器。带通滤波器10、11中的每一相应 滤波器提供带通(子频带)输出信号12。频带可重叠或者不重叠。子频带 (1、……N)可一起覆盖助听器的一部分或整个频率范围,例如从0Hz(或 20Hz或更大)到8kHz(或更大,如10kHz或更大)。
尽管图2A中的例子将子频带分配为2组子频带,该方法可容易地扩展, 以具有3个以上子频带组。
来自每一相应带通滤波器的带通输出信号12被提供给对应的包络提取器 13、14,其将包络确定为相应带通滤波器提供的(子频带)输出信号的时间的 函数。包络提取例如可通过滤波、整流和滤波、希尔伯特变换或者锁相环技术 进行。
基于每一相应频带1-N的确定的信号包络,计算N个子频带信号的信号包 络之间的相关(参见图5B、6中的Y(k,m)),从而获得相关矩阵C。基于血管 紧张素C的内容,子频带1-N的分组可按如下进行:
部分A:频带的互相关、阈值建立和分组
a、定义相关阈值C_thr;
b、选择相关矩阵C的具有最高阈上值的和的行;
c、将所选行中其相关大于C_thr的频带指定为组1的成员;
d、将相关矩阵C的行和列的对应于组1频带的相关值设定为等于零,从 而提供修改的相关矩阵CM
e、选择(在先前步骤中修改的)所述修改的相关矩阵CM的具有最高阈上 相关的和的行;
f、将所选行中其相关大于C_thr的频带指定为组2的成员。
上面概述的用于获得子频带组的过程通过另一非限制性例子说明,其中初 始相关矩阵为:
Figure RE-BDA0001334090050000201
在该例子中,相关阈值C_thr设定为0.75(该值可根据具体情形(声环境、 子频带的配置、用户的听力受损等)进行不同地选择,例如选择为大于0.75或 小于0.75)。初始矩阵的具有阈上值的元素在上面突出显示。
相关矩阵C的具有最高的阈上值的和的行为行4(频带4)。
行4的具有大于C_thr的相关值的频带被选择为组1。
因而,组1由频带3、频带4和频带5组成。
对应于组1的矩阵元素被设定为等于零,从而产生修改的矩阵:
Figure RE-BDA0001334090050000202
选择上面的修改的矩阵的具有最高的阈上相关的和的行。在该例子中,行 1和行2均具有1.9的和,对应的频带1和2被选择为组2。
根据本发明,作为备选,子频带的分组可基于不同于上面描述的相关方法 的其它方法。
在本发明的实施例中,子频带的分组基于每一单独的子频带k的基频F0k的识别及随后分组频带,其具有在预定范围内的基频F0k。在子频带分组之后, 该方法按下面的部分B描述的继续(参见图2B)。
在已进行分组之后,每一或确定的子频带组经历图2B中指出的步骤。
在步骤19,对子频带组j(在图2A所示的例子中,j=1或2),计算组包 络。组包络可使用多个不同的方法计算,如求平均例如频率加权的平均,其中, 例如,频带通过其对语音理解的重要性进行加权。另一方法可以是求和及随后 提取所得信号的包络。根据所涉及的应用,可使用其它加权方案,例如根据预 期的输入信号例如输入信号的特性。
在步骤20,计算属于组j的每一个别频带的包络与计算的组包络之间的相 关。
在步骤21,基于步骤20中确定的相关计算增强包络。
在步骤22,属于特定子频带组的每一子频带中的信号被乘以步骤21中确 定的增强包络,从而提供所希望的分离线索增强的信号。
根据本发明的实施例,增强包络的计算包括下面的步骤:
步骤B:增强包络的计算
a、定义给定子频带组的调制增强m_enh;
b、对于所定义的调制增强m_enh,
c、保存包括组包络的下述值的流水账:
i、均值;
ii、调制深度m_group;及
iii、在时间n相对于均值的当前振幅偏移,如本申请别处所述,表达为 c(n);
d、对于子频带组中的每一子频带:
i、确定子频带的频带包络;
ii、使当前时间窗口中的子频带信号乘以(1+p(n)*c(n)*m_enh),其中p(n) 在0和1之间并可取决于包括但不限于频带包络与组包络的相关、来自检测器 的输入、来自分类器的输入等的因素。
由于上面的项c(iii)下面的c(n)反映组包络的调制,使信号乘以 (1+p(n)*c(n)*m_enh)增大子频带组中的频带之间的共同调制的峰值及加深谷值。
根据一实施例,调制增强m_enh被再分为两个部分,一个控制峰值增强的 程度,及一个控制谷值加深的程度。
参考图3,示出了说明根据本发明的方法的实施例的基本步骤的流程图。
在步骤23,提供输入信号,例如来自助听器中的传声器的(处理后的、时 变)输出信号(例如包括目标信号x与噪声分量v的混合)。在步骤24,输入 信号的总频率范围(或者其一部分)被再分为多个子频带。在图1A-1B中,示 出了五个这样的频带,但也可使用另一数量的子频带(相邻或分开的)。在步 骤25,确定子频带中的信号的可比特性。可比特性的例子可以是每一子频带 (k)的信号包络或者每一单独的子频带的随时间的振幅变化中的基频F0k
在步骤26,子频带基于步骤25中确定的可比特性进行分组。在所描述的 实施例中,子频带分组为两个子频带组:组1和组2,但应当理解,也可使用 其它组数。
在步骤27,按如上所述,对每一确定的子频带组(j=1,2),计算组包络。
在步骤28和29,分别地,每一子频带中的信号乘以增强特定子频带组的 组包络的峰值及衰减该特定子频带组的组包络的谷值的(增强)函数(分别对 于组1和组2)。
图4示出了说明根据本发明的方法的第二实施例的流程图。
在步骤30,提供输入信号,例如来自助听器中的传声器的(处理后的)输 出信号。在步骤31,输入信号的总频率范围(或其一部分)再分为多个子频带, 及在步骤32,计算每一子频带中的信号的包络。
在步骤33,计算每一子频带信号的包络之间的相关,从而提供相关矩阵C (例如如上面给出的数例中所示)。
在步骤34,基于相关矩阵C进行子频带的分组。
在步骤35,确定在步骤34中找到的每一子频带组的组包络。
在步骤36,对于每一子频带组,确定每一频带包络和对应的组包络之间的 相关。
在步骤37,基于步骤36中得到的相关,计算每一子频带组中的每一子频 带的增强包络。
在步骤38,每一单独的子频带中的信号乘以步骤37中确定的该频带的增 强包络。
图5A示出了根据本发明第一实施例的助听器的简化框图,及图5B示出了 根据本发明第二实施例的助听器的简化框图。
参考图5A,示出了配置成执行根据本发明的方法的助听器(HA)39的示 意性框图。助听器39包括输入单元(IU)41,其被提供输入变换器43如传声 器,用于将声输入40转换为电信号,该电信号提供给A/D转换器(AD)44。 来自A/D转换器的数字信号提供给信号处理单元(SPU)45,其包括用于执行 根据本发明的方法的多个不同步骤的软件代码。处理后的输出数字信号提供给 输出单元(OU)42中的D/A转换器(DA)46,来自D/A转换器46的模拟信 号驱动输出变换器(OT)47如扬声器(接收器),其将电输出信号转换为声 输出信号48。在实施例中,输出单元可(另外或作为备选)包括用于骨导型助 听器的振动器或者耳蜗植入型助听器的多电极阵列。信号处理单元45的输出 可以是通过根据本发明的方法提供的流分离线索增强的信号或者其处理后的版 本(例如参见图6)。此外,信号处理单元45可包括分析滤波器组(FBA), 配置成将频率范围再分为多个子频带(例如上面的图1A、1B中描述的五个频 带F1,F2,F3,F4和F5),及包括对应的合成滤波器组(FBS),配置成将子频 带重新组合为一个单一频带。图5B示出了结合图5A所述的助听器,但在输入 变换器IT和输出变换器OT之间的助听器正向通路中包括分开的分析滤波器组 AFB和合成滤波器组SFB。另外,为信号处理单元SPU的输入和输出信号的 子频带信号分别记为Y(k,m)和Z(k,m),k为频率指数(k=1,…,N)及n为时间 帧指数。
图6示出了根据本发明实施例的信号处理单元的简化框图。图5B中所示 的输入单元IU将时域电输入信号y(n)提供为表示听力装置的工作频率范围中 的合成输入声音信号(如包括多个语音信号分量)的数字样本,t为时间,n为 时间样本指数。图5B中所示的分析滤波器组FBA将助听器的工作频率范围或 其一部分再分为合成声音信号的多个子频带Y(k,m),k为子频带指数(k=1,…, N,N为子频带数),m为时间帧指数。每一帧包括多个样本,如64或128个。 帧不重叠或者重叠,通常重叠。连接到分析滤波器组FBA并接收子频带信号Y(k,m)的信号处理单元SPU包括子频带分组单元BGU,用于基于多个子频带 信号Y(k,m)之间的可比特性将子频带(k)安排成子频带组SBGj,j=1,…,NSBG, 并提供分组的子频带信号YSBGj(k,m)。NSBG为子频带组的数量。NBSG例如取决 于目标信号的类型。NBSG例如可取决于当前存在的噪声源的类型和数量。NBSG至少为1,如大于或等于2。在图6的示例性实施例中,NSBG=3。三个子频带 组SBG1,SBG2和SBG3由子频带信号YSBG1(k,m),YSBG2(k,m),YSBG3(k,m)表示。在实施例中,三组子频带信号一起构成合成声音信号的N个子频带信号Y(k,m) (例如相应的子频带组一起(在数学意义上)由子频带k=1,…,N组成)。用 于形成子频带组的多个子频带Y(k,m)之间的可比特性例如可与子频带之间的类 似调制性质有关。在实施例中,可比特性包括所述多个子频带中的信号包络之 间的相关。在实施例中,子频带分组单元BGU配置成将给定子频带分配给给 定子频带组,如果其满足分配给该子频带组的可比特性判据(例如处于距特性 的给定值的距离测度内(或者大于或小于给定值等),如给定相关值)。信号 处理单元SPU还包括包络提取单元EXU,用于计算分别由子频带信号 YSBG1(k,m),YSBG2(k,m),YSBG3(k,m)表示的每一子频带组SBGj的组包络。包络提 取单元EXU将相应的组包络信号EG(j),j=1,…,NSBG(在此NSBG=3)提供为输 出。每一组包络信号EG(1),EG(2),EG(3)包括峰值和谷值(如上面包络提取单元 EXU示意性指出的)。组包络例如可确定为所涉及的子频带组的每一包络的平 均,或者使用频率加权的平均,其中频带例如通过其对语音理解的重要性加权。 信号处理单元SPU还包括增强单元EHU,用于提供相应的增强函数fe(j), j=1,…,NSBG(在此NSBG=3)。每一增强函数fe(1),fe(2),fe(3)增强相应组包络信 号EG(1),EG(2),EG(3)中的峰值和/或衰减其中的谷值。从而可确定增强的组包络 信号EHG(j)=EG(j)*fe(j),j=1,…,NSBG(在此NSBG=3)(如上面的增强单元EHU 示意性指出的)。在实施例中,增强函数fe(1),fe(2),fe(3),其(或可)在子频 带组之间不同,也可在子频带组内的子频带之间不同,例如根据定义所涉及子 频带组的组包络和所涉及子频带的包络之间的差的参数。换言之,fe(j)=fe(j,p), 其中p为例如与组包络和频带包络之间的相关有关的参数。子频带参数p因而 可依赖于子频带指数k(及也可随时间而变,p=p(k,n))。在实施例中,给定子频带组j的不同子频带kj的增强函数fe(j)为fe(j)的缩放版(例如取决于各个子频 带kj的参数)。相应的相乘单元“X”配置成使每一个别子频带组(图6中的 SBG1,SBG2,SBG3)中的子频带信号(图6中的YSBG1(k,m),YSBG2(k,m), YSBG3(k,m))乘以相应的增强函数fe(1),fe(2),fe(3)(或其个别化版本fe(j,p(k,n))) 以提供增强的子频带信号(图6中的ESSBG1(k,m),ESSBG2(k,m),ESSBG3(k,m))。 各个增强的子频带信号ES(k,m),k=1,…,N(由图6中的增强的子频带信号 ESSBG1(k,m),ESSBG2(k,m),ESSBG3(k,m)构成)已通过子频带之间的共同调制的增 强而修改从而提高用户分离目标信号和噪声的能力。在图6的信号处理单元 SPU的实施例中,增强的子频带信号被(另外的)处理单元FPU处理,例如将 随频率和/或电平而变的增益施加到增强的子频带信号以提供(进一步)处理的 信号Z(k,m),k=1,…,N。其它处理算法可另外(或作为备选)在处理单元FPU 中应用,如反馈消除、降噪等。在实施例中,输入单元可包括一个以上传声器, 如两个以上。在实施例中,听力装置包括多输入波束形成器滤波单元,用于提 供空间滤波的信号。在多个子频带组的子频带中提供共同调制的方案可单独地应用于每一传声器输入信号和/或应用于空间滤波的(波束成形)信号。
图7A示出了包括与辅助装置通信的左和右听力装置的双耳助听器系统的 实施例,及图7B示出了用于双耳助听器系统的用作用户接口的辅助装置。
图7A示出了双耳听力系统的实施例,包括左(第二)和右(第一)听力 装置HAl,HAr与用作双耳助听器系统的用户接口UI的便携(手持)辅助装置 AD通信。在实施例中,双耳听力系统包括辅助装置Aux(及用户接口UI)。 在图7A的实施例中,示出了记为IA-WL(如左和右听力装置之间的感应链路) 和WL-RF(如辅助装置Aux和左听力装置HAl之间的及辅助装置Aux和右听 力装置HAr之间的RF链路(如蓝牙))的无线链路(在装置中通过对应的天 线和收发器电路实施,在图7A中为简化起见在左和右听力装置中分别示为 RF-IA-Rx/Tx-l和RF-IA-Rx/Tx-r)。在图7A所示的声学情形下,主要声源如人 的话音,记为目标声音,位于用户U的右边;及噪声声场,可能包括竞争话音 /语音信号和/或自然或人为噪声,记为“噪声”,在用户周围示出。
辅助装置Aux的用户接口UI如图7B中所示。用户接口包括显示器(如触 敏显示器),其显示用于控制听力系统及关于双耳听力系统(或双侧助听器系 统或单一助听器)的功能的多个预定行动的听力仪器远程控制APP的屏幕。在 例示APP(的部分)中,用户U具有经多个预定(或可配置的)程序之一的选 择影响运行模式的选择,每一程序针对特定声学情形进行优化(在“选择程序” 框中)。示例性的声学情形为:多环境、对话、音乐、耳鸣和共同调制,每一 情形示为启动元件,其通过点击在元件上一次选择一个。每一示例性声学情形 与左和右听力装置的特定算法和特定处理参数(程序)的启动相关联。在图7B 的例子中,声学情形“共同调制”已被选择(如屏幕上对应启动元件的粗斜体 突出显示指明的)。声学情形“共同调制”指听力系统的特定运行模式,其中 在用户的声环境中目标(语音)声源(在图7A中由目标声音指明)与一个或 多个噪声源(或竞争话音源)一起存在。在图7B例示的远程控制APP屏幕中, 用户具有帮助识别目标声源的选择(参见框“共同调制增强。选择目标信 号”)。用户具有点击表示目标源的笑脸图标的选择并被鼓励按压(压住)该 图标一时间段,其中目标声音存在于用户环境中。从而,助听器在识别目标信 号(参见图1A、1B中的1,包括存在目标信号的子频带)的谱特性的任务中 被引导,及在相邻的子频带中应用适当的共同调制(“噪声”的特性,参见图1A、1B中的2)。作为备选,该任务可自动执行,例如由左和右听力装置个别 地执行,或者共同执行,和/或与辅助装置协作执行(例如使用辅助装置的一个 或多个传声器信号)。噪声分量(在图7A中记为“噪声”)可以是来自交通、 汽车噪声、机械装置(风扇、空调等)的“人造”噪声,但也可包括来自不同 于目标源的其他人的(竞争)话音。
包括用户接口UI的辅助装置Aux适于拿在用户U的手中,因此方便显示 关于助听器系统的信息和/或方便用户影响其功能。在听力系统的音频流传输运 行模式下,音频信号(如来自电话对话或音乐或其它声音)可从辅助装置传给 左和右助听器(使用无线链路WL-RF,及非必须地IA-WL,参见图7A中的信 号ADCDl和ADCDr)。在远程控制运行模式下(如图7B中所示),控制数据 和/或信息数据(和/或音频数据)可在辅助装置及左和右听力装置之间交换 (使用无线链路WL-RF,及非必须地IA-WL,参见图7A中的信号ADCDl和 ADCDr)。
听力装置和辅助装置之间及左和右听力装置之间的无线通信链路(图7A 中的WL-RF,IA-WL)为了必要的带宽和频谱的可用部分可基于任何适当的技 术。在实施例中,听力装置和辅助装置之间的无线通信链路WL-RF基于远场 (如辐射场)通信,例如根据蓝牙或蓝牙低功率或类似标准或专有方案。在实 施例中,左和右听力装置之间的无线通信链路IA-WL基于近场(如感应)通信。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的 和/或权利要求中限定的装置的结构特征可与本发明方法的步骤结合。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形 式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具 有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件 和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元 件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或 “耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何 及所有组合。除非另行指明,在此公开的任何方法的步骤不精确限于相应说明 的顺序。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者 “可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发 明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多 个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在 此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一 般原理可应用于其他方面。
权利要求不限于在此所示的各个方面,而是包含与权利要求语言一致的全 部范围,其中除非明确指出,以单数形式提及的元件不意指“一个及只有一 个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
因而,本发明的范围应依据权利要求进行判断。
参考文献
●[Hall et al.,1984]Hall,J.W.,Haggard,M.P.,Fernandes,M.A.(1984). "Detection in noise by spectro-temporal pattern analysis",J.Acoust.Soc.Am.76,50- 56.
●[Nelken et al.,1999]Nelken I.,Rotman Y.,and Yosef O.B.(1999).“Responses of auditory cortex neurons to structural features of naturalsounds,” Nature 397,154–157.

Claims (15)

1.用于提高听力受损用户感知上将目标声音与竞争声音分离的能力的听力装置,目标声音和竞争声音形成具有给定频率范围的合成声音信号,所述听力装置包括:
-输入单元,用于将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-分析滤波器组,用于将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带并提供对应的子频带信号;
-信号处理单元,连接到所述分析滤波器组并包括
--频带分组单元,用于基于多个子频带信号之间的可比特性将子频带安排成子频带组;
--包络提取单元,用于计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;
--用于提供每一子频带组的增强函数的增强单元,配置成增强组包络中的峰值和/或衰减组包络中的谷值;及
--组合单元,用于使每一个别子频带组的子频带中的信号乘以所涉及子频带组的相应增强函数或者其缩放版以提供增强的子频带信号。
2.根据权利要求1所述的听力装置,其中所述信号处理单元包括另一处理单元,用于将随频率和/或电平而变的增益或衰减和/或其它信号处理算法应用于子频带信号或增强的子频带信号以提供处理后的子频带信号。
3.根据权利要求1所述的听力装置,包括合成滤波器组,用于将处理后的子频带信号转换为时域电输出信号。
4.根据权利要求3所述的听力装置,包括用于将时域电输出信号转换为可由用户感知为声音的刺激的输出单元。
5.根据权利要求1所述的听力装置,包括助听器、头戴式耳机或其组合。
6.用于提高听力受损人员感知上将目标声音与竞争声音分离的能力的方法,目标声音和竞争声音形成具有给定频率范围的合成声音信号,所述方法包括:
-将时域电输入信号y(n)提供为数字样本,数字样本在形成所述给定频率范围的一部分的工作频率范围中表示所述合成声音信号,n为时间样本指数;
-将所述合成声音信号的所述工作频率范围或其一部分细分为多个子频带;
-基于多个子频带之间的可比特性将子频带安排成子频带组;
-计算每一所述子频带组的组包络,所述组包络包括峰值和谷值;
-使每一个别子频带组的子频带中的信号乘以增强组包络中的峰值和/或衰减组包络中的谷值的函数,从而提供每一所述子频带组的增强包络。
7.根据权利要求6所述的方法,其中所述可比特性包括所述多个子频带中的信号包络之间的相关。
8.根据权利要求6所述的方法,包括步骤:
-对于每一所述子频带,计算该频带的包络;
-对于每一子频带组,计算特定子频带组中的每一子频带的包络和对应的组包络之间的相关;
-对于每一子频带组,计算所涉及子频带组中的每一子频带的增强包络;
-对于每一子频带,使该频带中的信号与该频带的增强包络相乘。
9.根据权利要求6所述的方法,包括步骤:
-计算每一所述子频带的包络之间的相关,从而提供相关矩阵C;
-基于所述相关矩阵C将子频带分组为子频带组;
-计算每一子频带组的组包络。
10.根据权利要求9所述的方法,其中所述分组包括下面的步骤:
-定义相关阈值C_thr;
-选择相关矩阵C的、其阈上值的和最高的行;
-将所选行中其相关大于C_thr的子频带指定为第一子频带组的成员。
11.根据权利要求10所述的方法,其中所述分组还包括:
-将相关矩阵C的行和列中对应于所述第一子频带组的子频带的元素设定为等于零,从而提供修改的相关矩阵CM
-选择所述修改的相关矩阵CM的、其阈上值的和最高的行;
-将所选行中其相关大于C_thr的子频带指定为第二子频带组的成员。
12.根据权利要求6所述的方法,其中组包络的峰值的增强及组包络中谷值的衰减包括下面的步骤:
-定义调制增强m_enh;
-对于所定义的调制增强m_enh,保存组包络的均值、调制深度m_group和在时间n相对于所述均值的当前振幅偏移c(n)的流水账,其中调制深度由m_group给出;
-对于每一相应子频带组中的每一子频带:
--使当前时间窗口中的信号乘以(1+p(n)*c(n)*m_enh),其中0<p(n)<1,及其中p(n)为频带包络的与组包络的相关的函数。
13.根据权利要求6所述的方法,其中调制增强m_enh被分成两个增强部分,一个控制峰值增强的程度,及一个控制谷值加深的程度。
14.根据权利要求6所述的方法,其中可比特性为每一单独的子频带的振幅变化中的基频F0k,其中k为子频带指数。
15.一种助听器,配置成至少部分基于子频带级运行,及配置成提高助听器接收的、包括目标语音信号和竞争声音分量的合成信号中目标语音信号的感知,所述助听器包括基于共同调制的感知增强单元,所述感知增强单元配置成监视至少部分子频带中的所述竞争声音分量的振幅调制及将反映所述竞争声音分量的振幅调制的共同调制应用于所述至少部分子频带。
CN201710502898.6A 2016-06-27 2017-06-27 用于提高目标声音的可分离性的方法和听力装置 Active CN107547983B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16176513 2016-06-27
EP16176513.6 2016-06-27

Publications (2)

Publication Number Publication Date
CN107547983A CN107547983A (zh) 2018-01-05
CN107547983B true CN107547983B (zh) 2021-04-27

Family

ID=56263604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710502898.6A Active CN107547983B (zh) 2016-06-27 2017-06-27 用于提高目标声音的可分离性的方法和听力装置

Country Status (4)

Country Link
US (1) US10560790B2 (zh)
EP (1) EP3264799B1 (zh)
CN (1) CN107547983B (zh)
DK (1) DK3264799T3 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102544250B1 (ko) * 2018-07-03 2023-06-16 삼성전자주식회사 소리를 출력하는 디바이스 및 그 방법
US11264014B1 (en) 2018-09-23 2022-03-01 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11694708B2 (en) * 2018-09-23 2023-07-04 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
EP3639886B1 (en) * 2018-10-17 2021-04-21 Oticon Medical A/S Cross-correlation threshold estimation method (xtem)
WO2020245631A1 (en) * 2019-06-05 2020-12-10 Harman International Industries, Incorporated Sound modification based on frequency composition
CN114467139A (zh) * 2019-09-24 2022-05-10 索尼集团公司 信号处理装置、信号处理方法和程序
DE102019218808B3 (de) * 2019-12-03 2021-03-11 Sivantos Pte. Ltd. Verfahren zum Trainieren eines Hörsituationen-Klassifikators für ein Hörgerät
CN111107478B (zh) 2019-12-11 2021-04-09 江苏爱谛科技研究院有限公司 一种声音增强方法及声音增强系统
CN113038318B (zh) * 2019-12-25 2022-06-07 荣耀终端有限公司 一种语音信号处理方法及装置
CN117079657B (zh) * 2023-10-16 2024-01-26 中国铁塔股份有限公司 压限处理方法、装置、电子设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
CN1573930A (zh) * 2003-06-12 2005-02-02 阿尔派株式会社 语音修正装置
CN101287306A (zh) * 2007-04-11 2008-10-15 奥迪康有限公司 助听器
CN101361124A (zh) * 2006-11-27 2009-02-04 索尼计算机娱乐公司 声音处理装置和声音处理方法
CN102984634A (zh) * 2011-11-22 2013-03-20 南京工程学院 一种数字助听器非等宽子带自动增益控制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6732073B1 (en) * 1999-09-10 2004-05-04 Wisconsin Alumni Research Foundation Spectral enhancement of acoustic signals to provide improved recognition of speech
US8023673B2 (en) * 2004-09-28 2011-09-20 Hearworks Pty. Limited Pitch perception in an auditory prosthesis
US20070053522A1 (en) * 2005-09-08 2007-03-08 Murray Daniel J Method and apparatus for directional enhancement of speech elements in noisy environments
WO2007028250A2 (en) * 2005-09-09 2007-03-15 Mcmaster University Method and device for binaural signal enhancement
US8005246B2 (en) * 2007-10-23 2011-08-23 Swat/Acr Portfolio Llc Hearing aid apparatus
DE102015207706B3 (de) * 2015-04-27 2016-08-18 Sivantos Pte. Ltd. Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
CN1573930A (zh) * 2003-06-12 2005-02-02 阿尔派株式会社 语音修正装置
CN101361124A (zh) * 2006-11-27 2009-02-04 索尼计算机娱乐公司 声音处理装置和声音处理方法
CN101287306A (zh) * 2007-04-11 2008-10-15 奥迪康有限公司 助听器
CN102984634A (zh) * 2011-11-22 2013-03-20 南京工程学院 一种数字助听器非等宽子带自动增益控制方法

Also Published As

Publication number Publication date
US10560790B2 (en) 2020-02-11
CN107547983A (zh) 2018-01-05
EP3264799B1 (en) 2019-05-01
US20170374478A1 (en) 2017-12-28
EP3264799A1 (en) 2018-01-03
DK3264799T3 (da) 2019-07-29

Similar Documents

Publication Publication Date Title
CN107547983B (zh) 用于提高目标声音的可分离性的方法和听力装置
US11245993B2 (en) Hearing device comprising a noise reduction system
JP7250418B2 (ja) 音響信号の信号対ノイズ比を推定するオーディオ処理装置及び方法
EP3514792B1 (en) A method of optimizing a speech enhancement algorithm with a speech intelligibility prediction algorithm
CN105848078B (zh) 双耳听力系统
US10701494B2 (en) Hearing device comprising a speech intelligibility estimator for influencing a processing algorithm
US9369102B2 (en) Methods and apparatus for processing audio signals
CN107147981B (zh) 单耳侵入语音可懂度预测单元、助听器及双耳助听器系统
CN106507258B (zh) 一种听力装置及其运行方法
CN107371111B (zh) 用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统
US10154353B2 (en) Monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system
US11109166B2 (en) Hearing device comprising direct sound compensation
US20220124444A1 (en) Hearing device comprising a noise reduction system
US11330375B2 (en) Method of adaptive mixing of uncorrelated or correlated noisy signals, and a hearing device
CN106254998B (zh) 包括用于掩蔽耳鸣的信号发生器的听力装置
CN107454537B (zh) 包括滤波器组和起始检测器的听力装置
CN108769884B (zh) 双耳电平和/或增益估计器及包括双耳电平和/或增益估计器的听力系统
CN112995876A (zh) 听力装置中的信号处理
US9420382B2 (en) Binaural source enhancement
CN108235211A (zh) 包括动态压缩放大系统的听力装置及其运行方法
EP4106346A1 (en) A hearing device comprising an adaptive filter bank

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant