基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法
技术领域
本发明涉及电子耳蜗领域,特别是指一种基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法。
背景技术
人的耳蜗毛细胞是接收声音的感觉细胞。当耳蜗毛细胞损伤严重时,就会出现严重的听力损伤。电子耳蜗就是替代已损伤毛细胞,通过电刺激听觉神经重新获得声音信号的一种电子装置。图1显示的是电子耳蜗的结构示意图。电子耳蜗由体外机部件和植入体部件两部分组成,体外机部件主要包括传声器(如麦克风等)、言语处理器和发射线圈,植入体部件主要包括接收线圈、刺激器及多通道电极阵列组成。
在系统连接正常的情况下,麦克风接收声信号,通过言语处理器,将声信号进行分析处理并编码,通过头件(发射线圈)透过皮肤传送到植入体部件的接收线圈,经过刺激器的解码处理后,产生相应频率及电流强度的脉冲信号并传送到各个刺激电极。通过电极刺激听神经,将脉冲信号传到听觉中枢从而为使用者产生听觉。
耳蜗位于骨前庭的前内侧,形似蜗牛壳,其尖朝向前外侧,称蜗顶。底朝向后内侧称蜗底。基底膜是一个贯穿耳蜗底部自顶部的膜状结构。外淋巴的机械振动,在基底膜形成一个行波,行波在基底膜的不同部位形成不同的共振幅度。基底膜的机械特性决定了不同频率声音在基底膜相应位置产生最大位移,从而导致支配该部位的听神经纤维所受的刺激最大。高频声引起耳蜗底回的听神经兴奋最强,顶回的神经兴奋则由低频声引起。听觉信息编码的部位编码理论认为:声音的频率信息是通过基底膜不同部位神经纤维发放冲动来传递的。即,声音不同频率的信息由不同的听觉通道传输。部位编码反映了耳蜗将原声刺激分解成独立的子带信号的滤波能力。这些不同子带信号的中心频率与耳蜗上的不同位置相对应。
电子耳蜗通过植入电极的位置来模拟正常耳蜗的部位编码:植入的电极在鼓阶由蜗底向蜗尖依次排列,刺激由高到低不同频率敏感的听神经。植入电极的不同位置,对应于信号处理策略中划分的不同的频段。“电极-频率”对应关系受到电极插入深度,扭结程度和神经元存活情况等因素影响。正常人的耳蜗中有大约3000个左右的纤毛细胞,分别被调谐在从20到20,000Hz之间的不同频率上,同时,每一个纤毛细胞中有10到20个刺激听觉的神经纤维,它们将信息传向中枢神经系统。根据部位编码,声音的不同频率信息由不同的听觉通道传输。假设每个神经纤维为一条频率传输通道,较之现在电子耳蜗有限数目的电极所能提供的频率传输通路,正常人耳能提供频率分辨力比电子耳蜗要高出几个数量级。
由于目前电极制造技术及如何在耳蜗中放置电极技术的限制,很难再增加植入电极的数量。在此背景下,美国Advanced Bionics公司率先实现了“虚拟通道”这项创新的处理方案。“虚拟通道”利用相邻电极间产生同时电流“虚拟”出一个新的刺激点,在不增加电极数的前提下,增加实际刺激的通道数。随后,奥地利的MED-EL公司也在其新一代产品中实现了“虚拟通道”技术。Advanced Bionics和MED-EL公司的刺激器电流源数目和电极数一致。从当前的研究结果来看,两家公司的“虚拟通道”技术并未在统计上被证明大幅提高植入者的听音能力和效果。
发明内容
有鉴于此,本发明的目的在于提出一种基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法,提升电子耳蜗使用者的听音能力,改善在噪声背景下的言语识别效果。
基于上述目的本发明提供的一种基于峰值选取的电子耳蜗虚拟通道信号处理系统,包括分析单元、选取单元和处理单元,其中:
所述的分析单元,用于对传输的声信号通过分解模块进行预处理,把信号分解为A个频段,并根据可用电极的数目,将A个频段合并为M个通道,同时保存A个频段的能量;
所述的选取单元,用于分别计算该M个通道的能量,选择能量最大的N个通道且N小于M,峰值选取模块根据每个通道所含频段能量的不同,在每个所选通道内再进行峰值选取,然后映射电流刺激参数;
所述的处理单元,用于根据电子耳蜗使用者对每个电极电刺激舒适阈值和感知阈值调整电流刺激参数,并根据此参数控制两个相邻电极产生同时刺激,依次在该N个通道上实现虚拟通道。
可选的,所述的电子耳蜗能够提供至少2组独立电流源。
可选的,所述的分解模块对声信号进行预处理,是对输入的信号通过高通滤波,对低于12kHZ的信号做每十倍频程有6dB衰减的预加重处理。
可选的,所述的分解模块采用快速傅里叶变换(FFT)方法,把信号分解为A个频段。
可选的,所述的分解模块利用Greenwood公式将A个频段合并为M个通道。
可选的,所述的选取单元是直接将通道内包含的频段能量相加来分别计算该M个通道的能量。
可选的,所述的峰值选取模块映射电流刺激参数是根据每个通道中峰值的相对位置,确定用刺激产生该峰值时两个独立电流源上电流强度的比例。
可选的,所述的峰值选取模块根据电子耳蜗使用者对电子耳蜗每个电极电刺激舒适阈值和感知阈值调整电流刺激参数,将计算得到的电流刺激参数经对数函数y=Alog10(x)+B进行压缩,压缩到电刺激动态范围[xmin,xmax],其中常数A,B可通过如下公式得到:
B=MCL-Alog10xmax
其中THR是电子耳蜗使用者的每个电极的电刺激感知阈值,MCL是电子耳蜗使用者的每个电极的电刺激舒适阈值。
基于上述目的,本发明还提供了一种基于峰值选取的电子耳蜗虚拟通道信号处理的方法,包括以下步骤:
对传输的声信号进行处理并把信号分解为A个频段,根据可用电极的数目,将A个频段合并为M个通道,传送M个通道和能量;
分别计算该M个通道的能量,选择能量最大的N个通道且N小于M,根据每个通道所含频段能量的不同,在每个所选通道内再进行峰值选取,映射电流刺激参数;
根据电子耳蜗使用者对每个电极电刺激舒适阈值和感知阈值调整电流刺激参数,并控制两个相邻电极产生同时刺激,依次在N个通道上实现虚拟通道。
可选的,所述的电子耳蜗能够提供至少2组独立电流源。
可选的,所述的对信号进行处理是通过高通滤波,对低于12kHZ的信号做每十倍频程有6dB衰减的预加重处理。
可选的,所述的信号分解为A个频段,采用快速傅里叶变换(FFT)方法。
可选的,所述的将A个频段合并为M个通道,是利用Greenwood公式。
可选的,所述的计算该M个通道的能量是直接将通道内包含的频段能量相加。
可选的,所述的映射电流刺激参数是根据每个通道中峰值的相对位置,确定用刺激产生该峰值时两个独立电流源上电流强度的比例。
可选的,所述的根据电子耳蜗使用者对每个电极电刺激舒适阈值和感知阈值调整电流刺激参数,是将计算得到的电流刺激参数经对数函数y=Alog10(x)+B进行压缩,压缩到电刺激动态范围[xmin,xmax],其中常数A,B可通过如下公式得到:
B=MCL-Alog10xmax
其中THR是电子耳蜗使用者的每个电极的电刺激感知阈值,MCL是电子耳蜗使用者的每个电极的电刺激舒适阈值。
从上面所述可以看出,本发明提供的基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法,通过对声信号进行采集、分析、两次选取、处理的过程,最后实现了虚拟通道。尤为重要的两次峰值选取提高了其频率分辨能力,以期改善在噪音背景下的言语识别效果和提升其对声调语言的理解能力。
附图说明
图1为现有技术中的电子耳蜗系统结构示意图;
图2为本发明基于峰值选取的电子耳蜗虚拟通道信号处理系统实施例的结构示意图;
图3为本发明基于峰值选取的电子耳蜗虚拟通道信号处理方法实施例的流程示意图;
图4为本发明两电极同时发放脉冲示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图2为本发明基于峰值选取的电子耳蜗虚拟通道信号处理系统实施例的结构示意图,如图所示该信号处理系统实施例包括分析单元201、选取单元202以及处理单元203,其中:
分析单元201,主要功能包括:
1)分解模块对该声信号进行预处理,可以是对输入的信号通过高通滤波,对低于12kHZ的信号做每十倍频程有6dB衰减的预加重处理;
2)把信号分解为A个频段,分解模块可以采用快速傅里叶变换(FFT)方法完成;
3)根据电子耳蜗系统可用电极的数目M,分解模块可以利用Greenwood公式将该A个频段合并为M个通道,同时保存该A个频段的能量。
选取单元202,与该分析单元201相连,主要功能包括:
1)分别计算该M个通道的能量,一般的是直接将通道内包含的频段能量相加,并按照能量从大到小对该M个通道进行排序;
2)完成第一次选取,选择其中能量最大的N(N小于M)个通道;
3)完成第二次选取,峰值选取模块在所选取的N个通道中,根据每个通道所含能量的不同,在该N个通道中的每个通道内再进行峰值选取;
4)映射电流刺激参数:峰值选取模块可以根据每个通道中峰值的相对位置,确定用刺激产生该峰值时两个独立电流源上电流强度的比例。
处理单元203,与选取单元202相连,主要功能包括:
1)根据电子耳蜗使用者对每个电极电刺激舒适阈值和感知阈值,调整该选取单元202计算获得的电流刺激参数,较佳的将计算得到的电流刺激参数经对数函数y=Alog10(x)+B进行压缩,压缩到电刺激动态范围[xmin,xmax],其中常数A,B可通过如下公式得到:
B=MCL-Alog10xmax
其中THR是电子耳蜗使用者的每个电极的电刺激感知阈值,MCL是电子耳蜗使用者的每个电极的电刺激舒适阈值;
2)最终确定每个通道产生虚拟通道的个数为u,通常u的变化范围从1-8;
3)根据所述的调整后电流刺激参数控制两个相邻电极产生同时刺激,依次在所述N个通道上实现虚拟通道。
根据本发明实施例,电子耳蜗能够提供至少2组独立电流源。
图3为本发明基于峰值选取的电子耳蜗虚拟通道信号处理方法实施例的流程示意图,包括:
步骤301,对信号进行处理并把信号分解为A个频段,根据可用电极的数目M,将A个频段合并为M个通道,传送M个通道和能量,具体实现过程如下:
1)对传送的声信号进行预处理:电子耳蜗需能够提供至少2组独立的电流源,在优选实施例中,对传声器采集的声信号进行16kHz的采样处理,信号通过高通滤波,对低于12kHZ的信号做每十倍频程有6dB衰减的预加重处理。
2)采用快速傅里叶变换(FFT)的方法,把预加重后的信号分解为A个频段:在优选实施例中,是把信号分解为256个频段。首先对一帧256点(帧移为128点)的短视信号,进行加汉宁窗处理,然后进行FFT运算。FFT输出的结果为256点的复数,取其中128个有效点(需要去除直流分量点),信号被分为128个频带,256个频段。
3)根据电子耳蜗系统可用电极的数目M,将A个频段合并为M个通道:在优选实施例中,可用电极为22个,将该256个频段根据Greenwood教授1961年提出的耳蜗基底膜位置和频率的对应关系合并为22个电极对应的频率通道。
4)传送M个通道和能量:传送22个频率通道和能量。
步骤302,分别计算该M个通道的能量,选择能量最大的N个通道,其中N小于M,根据每个通道所含频段能量的不同,在每个所选通道内再进行峰值选取,映射电流刺激参数并传送给处理单元,具体实现过程如下:
1)分别计算该M个通道的能量,选择能量最大的N个通道并按照从小到大的顺序排列:在优选实施例中,将22个通道的每个通道内包含的频段能量相加,对该22个通道按照能量从大到小排列,选择其中能量最大的12个通道并保存通道的能量En(n≤M)。
2)根据每个通道所含频段能量的不同,在每个所选通道内再进行峰值选取:由于12个通道的带宽不同,所包含的FFT频段也不一样,通常,小于1000Hz的通道一般包含2-4个FFT频段,大于1000Hz的通道一般包含4-16个FFT频段。选取峰值后,记录峰值在通道中的具体位置和通道中包含的总FFT频段数即Pn(R,T),其中n≤22、R代表峰值的位置、T代表通道中的FFT频段数。
3)根据峰值选取的结果,映射电流刺激参数:指定一帧时间内(通常信号处理一帧时间在4-20ms之间),在每个通道中峰值的相对位置,确定用刺激产生该峰值时两个独立电流源上电流强度的比例。表示如下:Vn(E1,E2,D1,D2),Vn代表第n个通道刺激参数,E1是刺激用电极1,E2是刺激用电极2,D1是电极1刺激强度比例,D2是电极2刺激强度比例。计算方法如下:
E1=n
E2=n+1
D1=(T-R+1)/T
D2=(R-1)/T
4)把映射的电流刺激参数传送给处理单元。
通常,步骤301和302是在电子耳蜗的言语处理器中实现。
步骤303,根据电子耳蜗使用者对每个电极电刺激舒适阈值和感知阈值调整电流刺激参数,并控制两个相邻电极产生同时刺激,依次在N个通道上实现虚拟通道,此步骤可以在电子耳蜗植入体部件中完成,具体实现过程如下:
1)处理单元根据电子耳蜗使用者对每个电极电刺激舒适阈值和感知阈值调整电流刺激参数:可以在植入体部件的刺激器中采用将计算得到的电流刺激参数经对数函数y=Alog10(x)+B进行压缩,压缩到电刺激动态范围[xmin,xmax],其中常数A,B可通过如下公式得到:
B=MCL-Alog10xmax
其中THR是电子耳蜗使用者的每个电极的电刺激感知阈值,MCL是电子耳蜗使用者的每个电极的电刺激舒适阈值。
2)最终确定每个通道产生虚拟通道的个数为u,通常u的变化范围从1-8。
3)根据调整后的电流刺激参数控制两个相邻电极产生同时刺激,依次在N个通道上实现虚拟通道。
如图4所示,在“虚拟通道”策略下输入一个扫频信号时,为两电极同时发放脉冲示意图。在具体实施例中,随着输入频率的变化,计算出的峰值的频率不同,两个电极产生电刺激脉冲的幅度亦不同。
本发明的技术方案针对于具体两个独立电流源以上同时结合峰值提取技术,优点是在通过“虚拟通道”提高频率分辨率的同时,通过峰值提取减少有效刺激通道个数,从而达到增加刺激在时域的分辨率。因而有力的提高了电子耳蜗使用者的听音能力,通过提高电子耳蜗频率分辨能力,改善了电子耳蜗使用者在噪声背景下的言语识别效果、提升使用者对声调语言尤其是汉语的理解能力。
所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。