CN115314824B - 用于助听器的信号处理方法、装置、电子设备及存储介质 - Google Patents
用于助听器的信号处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115314824B CN115314824B CN202211244767.XA CN202211244767A CN115314824B CN 115314824 B CN115314824 B CN 115314824B CN 202211244767 A CN202211244767 A CN 202211244767A CN 115314824 B CN115314824 B CN 115314824B
- Authority
- CN
- China
- Prior art keywords
- signal
- sound
- human
- hearing aid
- human voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/30—Monitoring or testing of hearing aids, e.g. functioning, settings, battery power
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种用于助听器的信号处理方法、装置、电子设备及存储介质,该方法进行信号处理时,可以根据当前环境对应的音频输出模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号处理的灵活性,进而提升助听器用户对声音信息的辨识度。
Description
技术领域
本发明涉及信号数据处理领域,特别是涉及一种用于助听器的信号处理方法、装置、电子设备及存储介质。
背景技术
助听器是一种小型扩音器,把原本听不到的声音加以扩大,再利用听障者的残余听力,使声音能送到大脑听觉中枢,而感觉到声音,用于帮助听力障碍的用户听取外界的声音。
助听器通常会将所接收到的声音调整至预先设定的声音强度或者由用户操作助听器上的音量键以调整所接收到的声音,然而,在声源环境复杂的环境下,目前的助听器无法对接收到的声音信号进行处理,导致用户无法听清期望听到的声音,进而降低了助听器用户对声音信息的辨识度。
故需要提供一种用于助听器的信号处理方法及装置,以解决上述的技术问题。
发明内容
本发明实施例提供一种用于助听器的信号处理方法及装置,可以灵活地对声音信号进行处理,进而提升助听器用户对声音信息的辨识度。
本发明实施例提供一种用于助听器的信号处理方法,其包括:
采集当前环境的声音信号;
确定所述当前环境对应的音频输出模式;
当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;
当所述音频输出模式为对话模式,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号。
在本发明所述的用于助听器的信号处理方法中,所述基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强,包括:
确定每个人声信号对应的音频文本,并识别所述音频文本对应的语义;
确定所述人声信号的数量;
根据所述音频文本对应的语义以及所述人声信号的数量,对目标人声信号进行音量增强。
在本发明所述的用于助听器的信号处理方法中,所述根据所述音频文本对应的语义以及所述人声信号的数量,对目标人声信号进行音量增强,包括:
检测所述人声信号的数量是否大于预设数量;
当检测到所述人声信号的数量大于预设数量时,基于所述助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图;
根据所述音频文本对应的语义,预估当前环境对应的场景类型;
基于所述信号热度地图在所述人声信号中选择音强最大的人声信号为候选人声信号、以及在所述人声信号中选择所述麦克风阵列预设范围内的人声信号为候选人声信号;
根据所述场景类型在选择的候选人声信号中确定目标人声信号;
获取与所述场景类型对应的音量调参权重,并利用所述音量调参权重提高所述目标人声信号的音量。
在本发明所述的用于助听器的信号处理方法中,所述基于所述助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图,包括:
获取所述助听器的麦克风阵列中麦克风之间的互相关信息;
基于所述互相关信息,确定麦克风采集的信号之间的信号时延;
计算所述信号时延与声波传播速度之间的乘积,得到每个麦克风之间的相对位置间距;
基于所述相对位置间距,确定人声信号与所述麦克风阵列的相对角度;
根据所述相对角度以及相对位置间距,预估所述人声信号相对于所述麦克风阵列的相对位置;
以所述麦克风阵列为基准,基于所述人声信号相对于所述麦克风阵列的相对位置,构建当前环境对应的信号地图,并将每个人声信号的音强添加至所述信号地图中,得到信号热度地图。
在本发明所述的用于助听器的信号处理方法中,还包括:
当检测到所述人声信号的数量小于预设数量时,根据所述音频文本对应的语义,确定所述人声信号对应的有效声音内容;
对所述有效声音内容对应的语音信号进行音量增强。
在本发明所述的用于助听器的信号处理方法中,还包括:
采集所述人声信号的播放信号;
提取所述人声信号对应的第一信号音频特征以及所述播放信号对应的第二信号音频特征;
根据所述第一信号音频特征以及第二信号音频特征,确定所述人声信号的信号衰减;
基于所述信号衰减抑制人声信号中的回声信号,并降低所述播放信号的音量。
在本发明所述的用于助听器的信号处理方法中,所述确定所述当前环境对应的音频输出模式之前,还包括:
检测所述声音信号中环境噪声的声音强度是否大于预设值;
当检测到所述声音信号中环境噪声的声音强度大于预设值时,滤除所述声音信号中的环境噪声。
本发明实施例还提供一种用于助听器的信号处理装置,其包括:
采集模块,用于采集当前环境的声音信号;
确定模块,用于确定所述当前环境对应的音频输出模式;
增强模块,用于当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;
输出模块,用于当所述音频输出模式为对话模式,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号。
本发明实施例还提供一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时执行上述用于助听器的信号处理方法。
本发明实施例还提供一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述用于助听器的信号处理方法。
本发明的用于助听器的信号处理方法及用于助听器的信号处理装置在采集当前环境的声音信号后,确定所述当前环境对应的音频输出模式,当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;当所述音频输出模式为对话模式,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号,可见,本发明的用于助听器的信号处理方法及用于助听器的信号处理装置,可以根据当前环境对应的音频输出模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号处理的灵活性,进而提升助听器用户对声音信息的辨识度。
附图说明
图1为本发明的用于助听器的信号处理方法的流程示意图;
图2为本发明的用于助听器的信号处理方法的信号热度图;
图3为本发明的用于助听器的信号处理方法的另一流程示意图
图4为本发明的用于助听器的信号处理装置的一实施例的结构示意图;
图5为本发明的用于助听器的信号处理装置的一实施例的增强模块的结构示意图;
图6为本发明的用于助听器的信号处理装置所在的电子设备的工作环境结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本发明的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本发明具体实施例,其不应被视为限制本发明未在此详述的其它具体实施例。
在以下的说明中,本发明的具体实施例将参考由一部或多部计算机所执行之作业的步骤及符号来说明,除非另有述明。因此,其将可了解到这些步骤及操作,其中有数次提到为由计算机执行,包括了由代表了以一结构化型式中的数据之电子信号的计算机处理单元所操纵。此操纵转换该数据或将其维持在该计算机之内存系统中的位置处,其可重新配置或另外以本领域技术人员所熟知的方式来改变该计算机之运作。该数据所维持的数据结构为该内存之实体位置,其具有由该数据格式所定义的特定特性。但是,本发明原理以上述文字来说明,其并不代表为一种限制,本领域技术人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本发明的用于助听器的信号处理方法及用于助听器的信号处理装置可设置在任何的电子设备中,用于采集当前环境的声音信号,确定所述当前环境对应的音频输出模式,当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;当所述音频输出模式为对话模式,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号。
该电子设备包括但不限于个人计算机、服务器计算机、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。该用于助听器的信号处理装置优选为进行信号处理的助听器,可以根据当前环境对应的音频输出模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号处理的灵活性,进而提升助听器用户对声音信息的辨识度。
目前基于助听器的信号处理方案中,在声源环境复杂的环境下,目前的助听器无法对接收到的声音信号进行处理,导致用户无法听清期望听到的声音,进而降低了助听器用户对声音信息的辨识度。
本发明提供一种用于助听器的信号处理方案,采集当前环境的声音信号,确定所述当前环境对应的音频输出模式,当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;当所述音频输出模式为对话模式,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号,可见,本发明的用于助听器的信号处理方法及用于助听器的信号处理装置可以灵活地对声音信号进行处理,进而提升助听器用户对声音信息的辨识度。
请参照图1,图1为本发明的用于助听器的信号处理方法的一实施例的流程图。本实施例的用于助听器的信号处理方法可使用上述的电子设备进行实施,本实施例的用于助听器的信号处理方法包括:
步骤101、采集当前环境的声音信号。
步骤102、确定当前环境对应的音频输出模式。
步骤103、当音频输出模式为增强模式时,在声音信号中识别人声信号,并基于每个人声信号对应的语义以及人声信号的数量对目标人声信号进行音量增强。
步骤104、当音频输出模式为对话模式,基于人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号。
下面详细说明本实施例的用于助听器的信号处理方法。
在步骤101中,可以通过助听器的麦克风采集当前环境的声音信号,包括音乐、背景音、合成音和提示音等音频信号。
在步骤102中,确定助听器用户当前环境为多人声环境,在多人声环境下,如演唱会、地铁站等人声信号较多的地方,本发明提供的助听器可以进行人声增强,即,确定该当前环境对应的音频输出模式为增强模式;又比如,比如,当前环境为多人会议环境,在多人会议环境下,可能会存在某些汇报者的语速过快,导致助听器用户难以听清汇报者所汇报的内容,即,确定该当前环境对应的音频输出模式为对话模式。其中,可以结合声音信号中人声信号的数量以及预设的环境监测模型确定当前环境对应的环境类型,以确定该当前环境对应的音频输出模式。
在步骤103中,对声音信号中的人声进行识别,并确定每个人声信号对应的语义、以及人生信号的数量;基于语义和数量,对目标人声信号进行音量增强,即,可选地,在一些实施例中,步骤“基于每个人声信号对应的语义以及人声信号的数量对目标人声信号进行音量增强”,具体可以包括:
(11)确定每个人声信号对应的音频文本,并识别音频文本对应的语义;
(12)确定人声信号的数量;
(13)根据音频文本对应的语义以及人声信号的数量,对目标人声信号进行音量增强。
其中,根据人声信号的数量,确定助听器用户当前环境对应的场景。比如,当检测到人声信号的数量大于预设值时,确定其所在的环境为多人声环境,在多人声环境下,如演唱会、地铁站等人声信号较多的地方,本发明提供的助听器可以根据语义在多个人声信号中确定目标人声信号,并对其进行音量增强,即,可选地,在一些实施例中,步骤“根据音频文本对应的语义以及人声信号的数量,对目标人声信号进行音量增强”,具体可以包括:
(21)检测人声信号的数量是否大于预设数量;
(22)当检测到人声信号的数量大于预设数量时,基于助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图;
(23)根据音频文本对应的语义,预估当前环境对应的场景类型;
(24)基于信号热度地图在人声信号中选择音强最大的人声信号为候选人声信号、以及在人声信号中选择所述麦克风阵列预设范围内的人声信号为候选人声信号;
(25)根据场景类型在选择的候选人声信号中确定目标人声信号;
(26)获取与场景类型对应的音量调参权重,并利用音量调参权重提高目标人声信号的音量。
例如,具体的,可以基于助听器中麦克风阵列的结构特性以及每个人声信号的音强,构建当前环境对应的信号热度地图,该信号热度地图用于表征每个人声信号的位置以及其声音强度,如图2所示,该信号热度地图包括候选人声信号对应的A点、B点、C点以及D点,还包括非候选人声信号对应的E点和F点、以及助听器所在位置S点,其中,A点与S点的距离最大,且A点的声音强度最高,并且,A点的人声信号对应的语义为“XXX”,其为某首歌的歌词,故,可以预估当前环境对应的场景类型为演奏场景,因此,可以将A点对应的人声信号、以及离S点最近的C点对应的人声信号确定为目标人声信号,并基于演奏场景对应的音量调参权重提高目标人声信号的音量,如提高A点对应的人声信号的音量30%、以及提高C点对应的人声信号的音量50%,便于助听器用户可以听清A点的人声以及最近的C点的人声。
需要说明的是,在本发明中,具体利用麦克风阵列的结构特性对人声信号进行声源定位,并结合每个人声信号的音强,构建当前环境对应的信号热度地图,即,可选地,在一些实施例中,步骤“基于助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图”,具体可以包括:
(31)获取助听器的麦克风阵列中麦克风之间的互相关信息;
(32)基于互相关信息,确定麦克风采集的信号之间的信号时延;
(33)计算信号时延与声波传播速度之间的乘积,得到每个麦克风之间的相对位置间距;
(34)基于相对位置间距,确定人声信号与麦克风阵列的相对角度;
(35)根据相对角度以及相对位置间距,预估人声信号相对于所述麦克风阵列的相对位置;
(36)以麦克风阵列为基准,基于人声信号相对于麦克风阵列的相对位置,构建当前环境对应的信号地图,并将每个人声信号的音强添加至信号地图中,得到信号热度地图。
由于助听器包括左助听器和右助听器,因此,不同的人声信号距离左助听器和右助听器的距离不同,比如,人声信号距离左助听器更近、距离右助听器更远,所以左助听器所采集到的人声信号中的信号分量大于右助听器采集器件所采集到的人声信号中的信号分量,故,可以分别对左助听器所采集到的人声信号的信号分量以及右助听器采集器件所采集到的人声信号的信号分量进行互相关分析,进而得到左助听器所采集到的人声信号的信号分量以及右助听器采集器件所采集到的人声信号的信号分量之间的信号时延,接着,计算信号时延与声波传播速度之间的乘积,得到每个麦克风之间的相对位置间距,即,左助听器与右助听器之间的距离,例如,可以对左助听器所采集到的人声信号A1的语音分量A1S和右助听器采集器件所采集到的人声信号A2的语音分量A2S进行广义互相关分析,分析两者之间的相位差,得到延时差Δt。由此,可以知道声源信号到左助听器的距离L1和声源信号到右助听器的距离L2之间的关系为cΔt=L1-L2,其中,c为声波传播速度。进一步的,基于该相对位置间距、左助听器到地面的高度以及右助听器到地面的高度,预估人声信号相对于所述麦克风阵列的相对位置,最后,以麦克风阵列为基准,基于人声信号相对于麦克风阵列的相对位置,构建当前环境对应的信号地图,并将每个人声信号的音强添加至信号地图中,得到信号热度地图。
需要说明的是,该麦克风可以是全向麦克风和/或指向麦克风。全向麦克风对于来自不同角度的声音,其灵敏度是基本相同的,其头部采用压力感应的原理设计,振膜只接受来自外界的压力。指向麦克风主要采用压力梯度的原理设计,通过头部腔体后面的小孔,振膜接受到正反两面的压力,因此振膜受不同方向的压力并不相同,麦克风具有了指向性。例如,该麦克风阵列可以是由一定数目的麦克风组成、用来对声场的空间特性进行采样并处理的系统,其可以包括各自拾音区不完全相同的多个麦克风MIC1到MICn,其中n是大于等于2的自然数。例如,取决于各个麦克风的相对位置关系,麦克风阵列可以分为:线性阵列,其阵元中心位于同一条直线上;平面阵列,其阵元中心分布在一个平面上;以及空间阵列,其阵元中心分布在立体空间中。
此外,当检测到人声信号的数量小于或等于预设值时,确定其所在的环境为简单人声环境,如三人以下的会话环境,此时,则可以根据音频文本的语音,对人声信号中的有效声音内容进行音量增强,即,可选地,本发明的用于助听器的信号处理方法具体还可以包括:
(41)当检测到人声信号的数量小于预设数量时,根据音频文本对应的语义,确定人声信号对应的有效声音内容;
(42)对有效声音内容对应的语音信号进行音量增强。
其中,有效声音内容为有具体含义的声音内容,比如,对于一段较长的人声信号而言,可以将该人声信号对应的音频文本中的介词和语气助词确定为无效声音内容,将除无效声音内容外的声音内容确定为有效声音内容,并对有效声音内容对应的语音信号进行音量增强,由此,便于助听器用户获取到该音频文本的主要内容。
在步骤104中,比如,当前环境为多人会议环境,在多人会议环境下,可能会存在某些汇报者的语速过快,导致助听器用户难以听清汇报者所汇报的内容,故,可以基于人声信号的时间戳顺序保存人声信号,并根据预设音速调整参数对保存的人声信号进行音速调整,该音速调整参数可以由助听器用户预先设置,也可以是根据实际进行调整,具体可以根据实际情况进行选择,在此不作赘述。
需要说明的是,由于数字助听器集成度高且体积较小,其容易与耳道形成封闭或半封闭的空间,播放的人声信号在封闭或半封闭的空间经过多次反射而导致信号失真,最后,会与外部的人声信号一起被麦克风采集从而形成回声,因此,在一些实施例中,还可以包括:
(51)采集人声信号的播放信号;
(52)提取人声信号对应的第一信号音频特征以及播放信号对应的第二信号音频特征;
(53)根据第一信号音频特征以及第二信号音频特征,确定人声信号的信号衰减;
(54)基于信号衰减抑制人声信号中的回声信号,并降低播放信号的音量。
例如,具体的,可以利用卷积神经网络(Convolutional Neural Networks, CNN)提取人声信号对应的第一信号音频特征以及播放信号对应的第二信号音频特征,其中,音频特征可以携带有声音信号的功率谱和基音周期特征,功率谱是指信号功率随着频率的变化情况,即信号功率在频域的分布状况,基因周期是指人发声过程中声带每开启和闭合一次的周期时间,即可以用于指示有效音频信号的参数,进一步的,可以获取预设的语音信号处理模型,然后,采用语音信号处理模型,构建第一信号音频特征对应的第一语音向量和第二信号音频特征对应的第二语音向量,最后,基于第一语音向量和第二语音向量,确定人声信号的信号衰减,在得到信号衰减后,可以确定信号衰减对应的信号衰减值,然后,计算采集信号与信号衰减值之间的乘积,最后,利用该乘积对人声信号中的回声进行抑制,并降低播放信号的音量。
另外,还需要说明的是,当前环境的声音信号中可能会存在大量的噪声,而这些噪声会影响后续人身信号的处理过程,故,在一些实施例中,可以对声音信号的噪声进行滤除,即,可选地,在一些实施例中,步骤“确定当前环境对应的音频输出模式”之前,具体还可以包括:
(61)检测声音信号中环境噪声的声音强度是否大于预设值;
(62)当检测到声音信号中环境噪声的声音强度大于预设值时,滤除声音信号中的环境噪声。
声音强度,简称声强,是声音的物理客观量。声音强度取决于单位时间内作用于单位面积上声音能量的大小,单位是瓦/平方米•秒。声强在数量等级上称为声强级,声强级单位是分贝,可以用仪器来测定。由此可见,声强并不等同于声强级。但在临床上,声音强度通常是用声强级来表示的。
例如,具体的,可以获取噪声识别模型,利用噪声识别模型在声音信号中识别环境噪声,然后,检测环境噪声的声音强度,当检测到环境噪声的声音强度大于60分贝时,则滤除声音信号中的环境噪声,随后,执行步骤103、步骤104或步骤105。
这样即完成了本实施例的用于助听器的信号处理过程。
本实施例的用于助听器的信号处理方法在采集当前环境的声音信号后,确定当前环境对应的音频输出模式,当音频输出模式为增强模式时,在声音信号中识别人声信号,并基于每个人声信号对应的语义以及人声信号的数量对目标人声信号进行音量增强;当音频输出模式为对话模式,基于人声信号的时间戳顺序保存人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号,可见,本发明的用于助听器的信号处理方法,可以根据当前环境对应的音频输出模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号处理的灵活性,进而提升助听器用户对声音信息的辨识度。
本申请实施例还提供一种用于助听器的信号处理方法,其中,该用于助听器的信号处理装置集成在智能助听器中,请参阅图3,具体流程如下:
步骤201、智能助听器采集当前环境的声音信号。
步骤202、智能助听器确定当前环境对应的音频输出模式。
步骤203、智能助听器当音频输出模式为增强模式时,在声音信号中识别人声信号,并基于每个人声信号对应的语义以及人声信号的数量对目标人声信号进行音量增强。
步骤204、智能助听器当音频输出模式为对话模式,基于人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号。
由上可知,智能助听器可以根据当前环境对应的音频输出模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号处理的灵活性,进而提升助听器用户对声音信息的辨识度。
本发明还提供一种用于助听器的信号处理装置,请参照图4,图4为本发明的用于助听器的信号处理装置的一实施例的结构示意图,本实施例的用于助听器的信号处理装置可使用上述的用于助听器的信号处理方法进行实施。本实施例的用于助听器的信号处理装置30包括采集模块301、确定模块302、增强模块303、输出模块304、以及播放模块305,具体如下:
采集模块301,用于采集当前环境的声音信号。
确定模块302,用于确定当前环境对应的音频输出模式;
增强模块303,用于当音频输出模式为增强模式时,在声音信号中识别人声信号,并基于每个人声信号对应的语义以及人声信号的数量对目标人声信号进行音量增强。
输出模块304,用于当音频输出模式为对话模式,基于人声信号的时间戳顺序保存人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号。
可选地,在一些实施例中,请参阅图5,图5为本发明的用于助听器的信号处理装置的一实施例的调增强模块的结构示意图,该增强模块303具体可以包括:
识别单元3031,用于确定每个人声信号对应的音频文本,并识别所述音频文本对应的语义;
确定单元3032,用于确定人声信号的数量;
增强单元3033,用于根据音频文本对应的语义以及人声信号的数量,对目标人声信号进行音量增强。
可选地,在一些实施例中,增强单元3033具体可应用于:检测人声信号的数量是否大于预设数量;当检测到人声信号的数量大于预设数量时,基于助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图;根据音频文本对应的语义,预估当前环境对应的场景类型;基于信号热度地图在人声信号中选择音强最大的人声信号为候选人声信号、以及在人声信号中选择麦克风阵列预设范围内的人声信号为候选人声信号;根据场景类型在选择的候选人声信号中确定目标人声信号;获取与场景类型对应的音量调参权重,并利用音量调参权重提高目标人声信号的音量。
可选地,在一些实施例中,增强单元3033具体可应用于:获取助听器的麦克风阵列中麦克风之间的互相关信息;基于互相关信息,确定麦克风采集的信号之间的信号时延;计算信号时延与声波传播速度之间的乘积,得到每个麦克风之间的相对位置间距;基于相对位置间距,确定人声信号与麦克风阵列的相对角度;根据相对角度以及相对位置间距,预估人声信号相对于所述麦克风阵列的相对位置;以麦克风阵列为基准,基于人声信号相对于麦克风阵列的相对位置,构建当前环境对应的信号地图,并将每个人声信号的音强添加至所述信号地图中,得到信号热度地图。
可选地,在一些实施例中,增强单元3033具体还可应用于:将当检测到人声信号的数量小于预设数量时,根据音频文本对应的语义,确定人声信号对应的有效声音内容;对有效声音内容对应的语音信号进行音量增强。
这样即完成了本实施例的用于助听器的信号处理装置30与用户之间的信号处理过程。
本实施例的用于助听器的信号处理装置的具体工作原理与上述用于助听器的信号处理方法的实施例中的描述相同或相似,具体请参见上述用于助听器的信号处理方法的实施例中的详细描述。
本实施例的用于助听器的信号处理装置在采集当前环境的声音信号后,确定当前环境对应的音频输出模式,当音频输出模式为增强模式时,在声音信号中识别人声信号,并基于每个人声信号对应的语义以及人声信号的数量对目标人声信号进行音量增强;当音频输出模式为对话模式,基于人声信号的时间戳顺序保存人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号,可见,本发明的用于助听器的信号处理装置,可以根据当前环境对应的音频输出模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号处理的灵活性,进而提升助听器用户对声音信息的辨识度。
如本申请所使用的术语“组件”、“模块”、“系统”、“接口”、“进程”等等一般地旨在指计算机相关实体:硬件、硬件和软件的组合、软件或执行中的软件。例如,组件可以是但不限于是运行在处理器上的进程、处理器、对象、可执行应用、执行的线程、程序和/或计算机。通过图示,运行在控制器上的应用和该控制器二者都可以是组件。一个或多个组件可以有在于执行的进程和/或线程内,并且组件可以位于一个计算机上和/或分布在两个或更多计算机之间。
图6和随后的讨论提供了对实现本发明所述的信息处理装置所在的电子设备的工作环境的简短、概括的描述。图6的工作环境仅仅是适当的工作环境的一个实例并且不旨在建议关于工作环境的用途或功能的范围的任何限制。实例电子设备1012包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。
尽管没有要求,但是在“计算机可读指令”被一个或多个电子设备执行的通用背景下描述实施例。计算机可读指令可以经由计算机可读介质来分布(下文讨论)。计算机可读指令可以实现为程序模块,比如执行特定任务或实现特定抽象数据类型的功能、对象、应用编程接口(API)、数据结构等等。典型地,该计算机可读指令的功能可以在各种环境中随意组合或分布。
图6图示了包括本发明的信息处理装置中的一个或多个实施例的电子设备1012的实例。在一种配置中,电子设备1012包括至少一个处理单元1016和存储器1018。根据电子设备的确切配置和类型,存储器1018可以是易失性的(比如RAM)、非易失性的(比如ROM、闪存等)或二者的某种组合。该配置在图1中由线框1014图示。
在其他实施例中,电子设备1012可以包括附加特征和/或功能。例如,电子设备1012还可以包括附加的存储装置(例如可移除和/或不可移除的),其包括但不限于磁存储装置、光存储装置等等。这种附加存储装置在图6中由存储装置1020图示。在一个实施例中,用于实现本文所提供的一个或多个实施例的计算机可读指令可以在存储装置1020中。存储装置1020还可以存储用于实现操作系统、应用程序等的其他计算机可读指令。计算机可读指令可以载入存储器1018中由例如处理单元1016执行。
本文所使用的术语“计算机可读介质”包括计算机存储介质。计算机存储介质包括以用于存储诸如计算机可读指令或其他数据之类的信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。存储器1018和存储装置1020是计算机存储介质的实例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光存储装置、盒式磁带、磁带、磁盘存储装置或其他磁存储设备、或可以用于存储期望信息并可以被电子设备1012访问的任何其他介质。任意这样的计算机存储介质可以是电子设备1012的一部分。
电子设备1012还可以包括允许电子设备1012与其他设备通信的通信连接1026。通信连接1026可以包括但不限于调制解调器、网络接口卡(NIC)、集成网络接口、射频发射器/接收器、红外端口、USB连接或用于将电子设备1012连接到其他电子设备的其他接口。通信连接1026可以包括有线连接或无线连接。通信连接1026可以发射和/或接收通信媒体。
术语“计算机可读介质”可以包括通信介质。通信介质典型地包含计算机可读指令或诸如载波或其他传输机构之类的“己调制数据信号”中的其他数据,并且包括任何信息递送介质。术语“己调制数据信号”可以包括这样的信号:该信号特性中的一个或多个按照将信息编码到信号中的方式来设置或改变。
电子设备1012可以包括输入设备1024,比如键盘、鼠标、笔、语音输入设备、触摸输入设备、红外相机、视频输入设备和/或任何其他输入设备。电子设备1012中也可以包括输出设备1022,比如一个或多个显示器、扬声器、打印机和/或任意其他输出设备。输入设备1024和输出设备1022可以经由有线连接、无线连接或其任意组合连接到电子设备1012。在一个实施例中,来自另一个电子设备的输入设备或输出设备可以被用作电子设备1012的输入设备1024或输出设备1022。
电子设备1012的组件可以通过各种互连(比如总线)连接。这样的互连可以包括外围组件互连(PCI)(比如快速PCI)、通用串行总线(USB)、火线(IEEE 13104)、光学总线结构等等。在另一个实施例中,电子设备1012的组件可以通过网络互连。例如,存储器1018可以由位于不同物理位置中的、通过网络互连的多个物理存储器单元构成。
本领域技术人员将认识到,用于存储计算机可读指令的存储设备可以跨越网络分布。例如,可经由网络1028访问的计算设备1030可以存储用于实现本发明所提供的一个或多个实施例的计算机可读指令。电子设备1012可以访问计算设备1030并且下载计算机可读指令的一部分或所有以供执行。可替代地,电子设备1012可以按需要下载多条计算机可读指令,或者一些指令可以在电子设备1012处执行并且一些指令可以在计算设备1030处执行。
本文提供了实施例的各种操作。在一个实施例中,所述的一个或多个操作可以构成一个或多个计算机可读介质上存储的计算机可读指令,其在被电子设备执行时将使得计算设备执行所述操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必需是顺序相关的。本领域技术人员将理解具有本说明书的益处的可替代的排序。而且,应当理解,不是所有操作必需在本文所提供的每个实施例中存在。
而且,尽管已经相对于一个或多个实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件、资源等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或多个其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的方法。
综上所述,虽然本发明已以实施例揭露如上,实施例前的序号仅为描述方便而使用,对本发明各实施例的顺序不造成限制。并且,上述实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。
Claims (8)
1.一种用于助听器的信号处理方法,应用于助听器,其特征在于,包括:
采集当前环境的声音信号;
确定所述当前环境对应的音频输出模式;
当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;
当所述音频输出模式为对话模式时,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号;
其中所述基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强,包括:
确定每个人声信号对应的音频文本,并识别所述音频文本对应的语义;
确定所述人声信号的数量;
检测所述人声信号的数量是否大于预设数量;
当检测到所述人声信号的数量大于预设数量时,基于所述助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图;
根据所述音频文本对应的语义,预估当前环境对应的场景类型;
基于所述信号热度地图在所述人声信号中选择音强最大的人声信号以及在所述人声信号中选择所述麦克风阵列预设范围内的人声信号为候选人声信号;
根据所述场景类型在选择的候选人声信号中确定目标人声信号;
获取与所述场景类型对应的音量调参权重,并利用所述音量调参权重提高所述目标人声信号的音量。
2.根据权利要求1所述的方法,其特征在于,所述基于所述助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图,包括:
获取所述助听器的麦克风阵列中麦克风之间的互相关信息;
基于所述互相关信息,确定麦克风采集的信号之间的信号时延;
计算所述信号时延与声波传播速度之间的乘积,得到每个麦克风之间的相对位置间距;
基于所述相对位置间距,确定人声信号与所述麦克风阵列的相对角度;
根据所述相对角度以及相对位置间距,预估所述人声信号相对于所述麦克风阵列的相对位置;
以所述麦克风阵列为基准,基于所述人声信号相对于所述麦克风阵列的相对位置,构建当前环境对应的信号地图,并将每个人声信号的音强添加至所述信号地图中,得到信号热度地图。
3.根据权利要求1所述的方法,其特征在于,还包括:
当检测到所述人声信号的数量小于预设数量时,根据所述音频文本对应的语义,确定所述人声信号对应的有效声音内容;
对所述有效声音内容对应的语音信号进行音量增强。
4.根据权利要求1至3任一项所述的方法,其特征在于,还包括:
采集所述人声信号的播放信号;
提取所述人声信号对应的第一信号音频特征以及所述播放信号对应的第二信号音频特征;
根据所述第一信号音频特征以及第二信号音频特征,确定所述人声信号的信号衰减值;
基于所述信号衰减值抑制人声信号中的回声信号,并降低所述播放信号的音量。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述确定所述当前环境对应的音频输出模式之前,还包括:
检测所述声音信号中环境噪声的声音强度是否大于预设值;
当检测到所述声音信号中环境噪声的声音强度大于预设值时,滤除所述声音信号中的环境噪声。
6.一种用于助听器的信号处理装置,应用于助听器,其特征在于,包括:
采集模块,用于采集当前环境的声音信号;
确定模块,用于确定所述当前环境对应的音频输出模式;
增强模块,用于当所述音频输出模式为增强模式时,在所述声音信号中识别人声信号,并基于每个人声信号对应的语义以及所述人声信号的数量对目标人声信号进行音量增强;
输出模块,用于当所述音频输出模式为对话模式时,基于所述人声信号的时间戳顺序保存所述人声信号;根据预设音速调整参数对保存的人声信号进行音速调整,并输出调整后人声信号;
其中所述增强模块具体用于确定每个人声信号对应的音频文本,并识别所述音频文本对应的语义;
确定所述人声信号的数量;
检测所述人声信号的数量是否大于预设数量;
当检测到所述人声信号的数量大于预设数量时,基于所述助听器的麦克风阵列和每个人声信号的音强,构建当前环境对应的信号热度地图;
根据所述音频文本对应的语义,预估当前环境对应的场景类型;
基于所述信号热度地图在所述人声信号中选择音强最大的人声信号以及在所述人声信号中选择所述麦克风阵列预设范围内的人声信号为候选人声信号;
根据所述场景类型在选择的候选人声信号中确定目标人声信号;
获取与所述场景类型对应的音量调参权重,并利用所述音量调参权重提高所述目标人声信号的音量。
7.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1-5任一项所述用于助听器的信号处理方法的步骤。
8.一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求1至5中任一项所述用于助听器的信号处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211244767.XA CN115314824B (zh) | 2022-10-12 | 2022-10-12 | 用于助听器的信号处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211244767.XA CN115314824B (zh) | 2022-10-12 | 2022-10-12 | 用于助听器的信号处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115314824A CN115314824A (zh) | 2022-11-08 |
CN115314824B true CN115314824B (zh) | 2022-12-27 |
Family
ID=83868315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211244767.XA Active CN115314824B (zh) | 2022-10-12 | 2022-10-12 | 用于助听器的信号处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115314824B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021136962A1 (en) * | 2020-01-03 | 2021-07-08 | Orcam Technologies Ltd. | Hearing aid systems and methods |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109493877B (zh) * | 2017-09-12 | 2022-01-28 | 清华大学 | 一种助听装置的语音增强方法和装置 |
CN109671433B (zh) * | 2019-01-10 | 2023-06-16 | 腾讯科技(深圳)有限公司 | 一种关键词的检测方法以及相关装置 |
US11375322B2 (en) * | 2020-02-28 | 2022-06-28 | Oticon A/S | Hearing aid determining turn-taking |
CN112750456A (zh) * | 2020-09-11 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 即时通信应用中的语音数据处理方法、装置及电子设备 |
CN113259824B (zh) * | 2021-05-14 | 2021-11-30 | 谷芯(广州)技术有限公司 | 一种实时多通道数字助听器降噪方法和系统 |
-
2022
- 2022-10-12 CN CN202211244767.XA patent/CN115314824B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021136962A1 (en) * | 2020-01-03 | 2021-07-08 | Orcam Technologies Ltd. | Hearing aid systems and methods |
Also Published As
Publication number | Publication date |
---|---|
CN115314824A (zh) | 2022-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108269569B (zh) | 语音识别方法和设备 | |
CN107799126B (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
JP6889698B2 (ja) | 音声を増幅する方法及び装置 | |
CN101023469B (zh) | 数字滤波方法和装置 | |
US8280072B2 (en) | Microphone array with rear venting | |
US20140185824A1 (en) | Forming virtual microphone arrays using dual omnidirectional microphone array (doma) | |
US20090010450A1 (en) | Microphone Array With Rear Venting | |
CN103026733A (zh) | 用于多麦克风位置选择性处理的系统、方法、设备和计算机可读媒体 | |
CN106872945B (zh) | 声源定位方法、装置和电子设备 | |
US20090010451A1 (en) | Microphone Array With Rear Venting | |
JP4150795B2 (ja) | 聴覚補助装置、音声信号処理方法、音声処理プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 | |
CN108476072A (zh) | 用于声音识别的众包数据库 | |
CN111385688A (zh) | 一种基于深度学习的主动降噪方法、装置及系统 | |
CN107450882B (zh) | 一种调节声音响度的方法、装置及存储介质 | |
WO2022199405A1 (zh) | 一种语音控制方法和装置 | |
CN112104965B (zh) | 一种扩声方法及扩声系统 | |
US11582562B2 (en) | Hearing system comprising a personalized beamformer | |
CN116132875B (zh) | 一种辅听耳机的多模式智能控制方法、系统及存储介质 | |
CN115314824B (zh) | 用于助听器的信号处理方法、装置、电子设备及存储介质 | |
Levin et al. | Near-field signal acquisition for smartglasses using two acoustic vector-sensors | |
CN113613157A (zh) | 耳机及其佩戴状态检测方法、装置及存储介质 | |
Li et al. | Speech enhancement algorithm based on sound source localization and scene matching for binaural digital hearing aids | |
CN115312067B (zh) | 基于人声的声音信号识别方法、装置及存储介质 | |
Karthikeyan et al. | Speech enhancement approach for body-conducted unvoiced speech based on Taylor–Boltzmann machines trained DNN | |
CN114127846A (zh) | 语音跟踪收听设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |