CN103190966B - 增强时域信息的人工耳蜗虚拟通道信息处理系统和方法 - Google Patents

增强时域信息的人工耳蜗虚拟通道信息处理系统和方法 Download PDF

Info

Publication number
CN103190966B
CN103190966B CN201310085625.8A CN201310085625A CN103190966B CN 103190966 B CN103190966 B CN 103190966B CN 201310085625 A CN201310085625 A CN 201310085625A CN 103190966 B CN103190966 B CN 103190966B
Authority
CN
China
Prior art keywords
channel
passage
energy
mod
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310085625.8A
Other languages
English (en)
Other versions
CN103190966A (zh
Inventor
平利川
陈洪斌
唐国芳
王松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Nurotron Neural Electronic Technology Co Ltd
Original Assignee
Zhejiang Nurotron Neural Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Nurotron Neural Electronic Technology Co Ltd filed Critical Zhejiang Nurotron Neural Electronic Technology Co Ltd
Priority to CN201310085625.8A priority Critical patent/CN103190966B/zh
Publication of CN103190966A publication Critical patent/CN103190966A/zh
Application granted granted Critical
Publication of CN103190966B publication Critical patent/CN103190966B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明公开了增强时域信息的人工耳蜗虚拟通道信息处理系统和方法,包括分析单元将数字信号分解为M个频带,根据可用电极,将M个频带合并为N个通道;第一级峰值选取单元计算N个通道能量,选择能量最大的A个通道;幅度调整单元固定低、高频通道界限,将A个通道分高频和低频通道;固定可接受基频范围,对低频通道调制;第二级峰值选取单元,计算N个通道的每个通道内最大频段位置;声-电刺激单元将调制后的低频通道声-电转换,得到对应电极刺激量;将高频通道声-电转换,根据第二级峰值选取单元的最大频段位置,设置电流分配参数,确定两相邻电极电流强度比例,得到高频通道对应两相邻电极刺激量。从而,提升人工耳蜗使用者的听音能力。

Description

增强时域信息的人工耳蜗虚拟通道信息处理系统和方法
技术领域
本发明涉及人工耳蜗领域,特别是指增强时域信息的人工耳蜗虚拟通道信息处理系统和方法。
背景技术
人的耳蜗毛细胞是接收声音的感觉细胞。当耳蜗毛细胞损伤严重时,就会出现严重的听力损伤。人工耳蜗就是替代已损伤毛细胞,通过电刺激听觉神经重新获得声音信号的一种人工装置。图1显示的是人工耳蜗的结构示意图。人工耳蜗由体外机部件和植入体部件两部分组成,体外机部件主要包括传声器(如麦克风等)、言语处理器和发射线圈,植入体部件主要包括接收线圈、刺激器及多通道电极阵列组成。
在系统连接正常的情况下,麦克风接收声信号,通过言语处理器,将声信号进行分析处理并编码,通过头件(发射线圈)透过皮肤传送到植入体部件的接收线圈,经过刺激器的解码处理后,产生相应频率及电流强度的脉冲信号并传送到各个刺激电极。通过电极刺激听神经,将脉冲信号传到听觉中枢从而为使用者产生听觉。
耳蜗位于骨前庭的前内侧,形似蜗牛壳,其尖朝向前外侧,称蜗顶。底朝向后内侧称蜗底。基底膜是一个贯穿耳蜗底部自顶部的膜状结构。外淋巴的机械振动,在基底膜形成一个行波,行波在基底膜的不同部位形成不同的共振幅度。基底膜的机械特性决定了不同频率声音在基底膜相应位置产生最大位移,从而导致支配该部位的听神经纤维所受的刺激最大。高频声引起耳蜗底回的听神经兴奋最强,顶回的神经兴奋则由低频声引起。听觉信息编码的部位编码理论认为:声音的频率信息是通过基底膜不同部位神经纤维发放冲动来传递的。即,声音不同频率的信息由不同的听觉通道传输。部位编码反映了耳蜗将原声刺激分解成独立的子带信号的滤波能力。这些不同子带信号的中心频率与耳蜗上的不同位置相对应。
人工耳蜗通过植入电极的位置来模拟正常耳蜗的部位编码:植入的电极在鼓阶由蜗底向蜗尖依次排列,刺激由高到低不同频率敏感的听神经。植入电极的不同位置,对应于信号处理策略中划分的不同的频段。“电极—频率”对应关系受到电极插入深度,扭结程度和神经元存活情况等因素影响。正常人的耳蜗中有大约3000个左右的纤毛细胞,分别被调谐在从20到20,000Hz之间的不同频率上,同时,每一个纤毛细胞中有10到20个刺激听觉的神经纤维,它们将信息传向中枢神经系统。根据部位编码,声音的不同频率信息由不同的听觉通道传输。假设每个神经纤维为一条频率传输通道,较之现在人工耳蜗有限数目的电极所能提供的频率传输通路,正常人耳能提供频率分辨力比人工耳蜗要高出几个数量级。
由于目前电极制造技术及如何在耳蜗中放置电极技术的限制,很难再增加植入电极的数量。在此背景下,美国Advanced Bionics公司率先实现了“虚拟通道”这项创新的处理方案。“虚拟通道”利用相邻电极间产生同时电流“虚拟”出一个新的刺激点,在不增加电极数的前提下,增加实际刺激的通道数。随后,奥地利的MED-EL公司也在其新一代产品中实现了“虚拟通道”技术。Advanced Bionics和MED-EL公司的刺激器电流源数目和电极数一致。从当前的研究结果来看,两家公司的“虚拟通道”技术并未在统计上被证明大幅提高植入者的听音能力和效果。
另一方面,人工耳蜗植入者通过包络的周期性来获得语音周期性信息,尤其是基频信息。增强基频信息的传送对提升使用者对声调语言尤其是汉语的理解能力至关重要。目前,已经有研究表明,增强时域包络的周期性调制,在原有Cochlear公司的ACE(advanced coding combination, 高级混合编码策略)编码策略中加入周期性幅度信息,一定程度上改善了植入者的音乐感知效果。
但虚拟通道与增强时域包络信息周期性的结合,是现有技术中从没有过的。
发明内容
有鉴于此,本发明的目的在于提出一种增强时域信息的人工耳蜗虚拟通道信息处理系统和方法,提升人工耳蜗使用者的听音能力,改善植入者对声调语言和音乐的识别效果。
基于上述目的本发明提供的增强时域信息的人工耳蜗虚拟通道信息处理系统,包括:
声信号采集单元,用于采集外界的声信号;
转换成数字信号单元,与所述声信号采集单元相连,将采集的声信号转换成数字信号;
基频提取单元,与所述转换成数字信号单元相连,用于对数字信号进行基频(F0)提取;
分析单元,与所述转换成数字信号单元相连,用于将数字信号分解为M个频带,根据系统的可用电极数,将M个频带合并为N个通道;
第一级峰值选取单元,与所述分析单元相连,用于分别计算该N个通道的能量,选择能量最大的A个通道,并得到A个通道的包络能量值;
幅度调整单元,与所述第一级峰值选取单元和基频提取单元相连,用于固定低频与高频通道的界限,将A个通道分为高频通道和低频通道;然后固定可接受的基频范围,对低频通道的能量进行调制;
第二级峰值选取单元,与所述分析单元相连,计算并保留所述分析单元中合并的N个通道的每个通道内最大频段的位置;
声-电刺激单元,将调制后的低频通道进行声-电转换,然后得到低频通道对应电极的刺激量;将高频通道进行声-电转换,然后根据所述第二级峰值选取单元的N个通道的每个通道内最大频段的位置,设置电流分配参数,确定刺激产生该高频通道的最大频段时两个相邻独立电极上电流强度的比例,最后得到高频通道对应两个相邻独立电极上的刺激量。
可选地。所述的声信号采集单元通过自动增益控制的采样系统,准确无失真采集25-100dB动态范围的声信号。
可选地,所述的基频提取单元对数字信号进行基频(F0)提取:利用数字信号的平均幅度差函数:
d ( i , τ ) = Σ I = 1 W [ x ( i ) - x ( i + τ ) ] ^ 2
其中,x(i)是输入的数字信号;τ为估计时延,取值同帧长;d(i,τ)是信号的周期,其最小值对应的是τ=τ0=1/F0;W是一帧语音中采样点的个数。
进一步地,所述的基频提取单元由于d(i,τ)的幅度变化范围比较大,在实时计算时,对d(i,τ)进行一个归一化处理:即
dd ( i , τ ) = τ * d ( i , τ ) Σ j = 1 τ d ( i , τ )
在按上述方法获得归一化后的d(记为dd(i,τ))的第一个极小值,其对应的τ为信号基频的倒数,即1/F0。
进一步地,所述的基频提取单元在实时计算时,为降低计算量,在计算
d ( i , τ ) = Σ I = 1 W [ x ( i ) - x ( i + τ ) ] ^ 2
时,仅对一帧内的信号进行每S个点计算一次d(i,τ):
Σ i = 1 W [ x ( i * s ) - x ( i * s + τ ) ] ^ 2 .
进一步地,所述的幅度调整单元固定可接受的基频范围[F0_min,F0_max],然后按如下方法对低频通道的能量进行调制:设低频通道所得通道能量AL(i),调制后的通道能量AL_mod(i)为:
当F0_min<F0<F0_max时,AL_mod(i)=AL(i)*cos(2π*F0*t);
当F0<F0_min时,AL_mod(i)=AL(i);
当F0>F0_max时,AL_mod(i)=AL(i);
其中,t是一帧信号的时间。
进一步地,所述的声-电刺激单元将调制后的低频通道能量AL_mod(i),按如下方法转换为低频通道电流值EL(i):
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(A-Amin)/(Amax-Amin)]^p;
p取值范围为0.2—0.5;Emin和Emax分别对应于预先测量的植入者电极的电刺激感知阈值(T)和舒适阈值(C)的参数;[Amin–Amax]为通道声信号幅度输入范围;
所得低频通道对应电极E(i)的刺激量为EL(i);
将接收的高频通道的通道能量AH(i),按上述方法转换为高频通道电流值EH(i);
然后,根据第二级峰值选取单元的N个通道的每个通道内最大频段的位置,设置电流分配参数:在一帧时间内,以N个通道的每个通道内最大频段的位置,确定刺激产生该峰值时两个相邻独立电极上电流强度的比例;首先,设通道内包含频段数为K个,其中K的取值范围为2-30;B为1至K个频段内最大频段能量位置,则通道对应电极E(i)和E(i+1)的电流比例为:[B/K,1-B/K];
最后根据公式:EH(i)*B/K和EL(i)*(1-B/K),分别得到高频通道对应的电极E(i)和E(i+1)的刺激量。
基于上述目的,本发明还提供了增强时域信息的人工耳蜗虚拟通道信息处理方法,包括以下步骤:
采集外界的声信号,将采集的声信号转换成数字信号;
对数字信号进行基频(F0)提取;
并且将数字信号分解为M个频带,然后将分频处理后的M个频带合并为N个通道;进行第一级峰值选取,分别计算该N个通道的能量,选择能量最大的A个通道,并得到A个通道的包络能量值;进行第二级峰值选取:计算并保留合并的N个通道的每个通道内最大频段的位置;
根据第一级峰值选取的能量最大的A个通道和包络能量值,以及提取的信号基频进行声信号的幅度调整:固定低频与高频通道的界限,将A个通道分为高频通道和低频通道;然后固定可接受的基频范围,对低频通道的能量进行调制;
将调制后的低频通道进行声-电转换,然后得到低频通道对应电极的刺激量;将高频通道进行声-电转换,然后根据所述第二级峰值选取的N个通道的每个通道内最大频段的位置,设置电流分配参数,确定刺激产生该高频通道的最大频段时两个相邻独立电极上电流强度的比例,最后得到高频通道对应两个相邻独立电极上的刺激量。
可选地,所述对低频通道的能量进行调制是按照如下方式进行:
固定可接受的基频范围[F0_min,F0_max],然后对低频通道的能量进行调制:
设低频通道所得通道能量AL(i),调制后的通道能量AL_mod(i)为:
当F0_min<F0<F0_max时,AL_mod(i)=AL(i)*cos(2π*F0*t);
当F0<F0_min时,AL_mod(i)=AL(i);
当F0>F0_max时,AL_mod(i)=AL(i);
其中,t是一帧信号的时间。
进一步地,所述的进行声-电刺激是将调制后的低频通道能量AL_mod(i),按如下方法转换为低频通道电流值EL(i):
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(A-Amin)/(Amax-Amin)]^p;
p取值范围为0.2—0.5;Emin和Emax分别对应于预先测量的植入者电极的电刺激感知阈值(T)和舒适阈值(C)的参数;[Amin–Amax]为通道声信号幅度输入范围;
所得低频通道对应电极E(i)的刺激量为EL(i);
将得到的高频通道的通道能量AH(i),按上述方法转换为高频通道电流值EH(i);
然后,根据第二级峰值选取的N个通道的每个通道内最大频段的位置,设置电流分配参数:在一帧时间内,以N个通道的每个通道内最大频段的位置,确定刺激产生该峰值时两个相邻独立电极上电流强度的比例;首先,设通道内包含频段数为K个,其中K的取值范围为2-30;B为1至K个频段内最大频段能量位置,则通道对应电极E(i)和E(i+1)的电流比例为:[B/K,1-B/K];
最后根据公式:EH(i)*B/K和EL(i)*(1-B/K),分别得到高频通道对应的电极E(i)和E(i+1)的刺激量。
从上面所述可以看出,本发明提供的增强时域信息的人工耳蜗虚拟通道信息处理系统和方法,通过在人工耳蜗信号处理的过程中对低频通道增强时域包络信息;对高频通道使用虚拟通道,增加频率感知。从而,可以提高人工耳蜗使用者的音调感知和识别效果。
附图说明
图1为现有技术中的人工耳蜗系统结构示意图;
图2为本发明增强时域信息的人工耳蜗虚拟通道信息处理系统的一个实施例示意图;
图3为本发明增强时域信息的人工耳蜗虚拟通道信息处理方法的一个实施例示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
参阅图2所示,为本发明增强时域信息的人工耳蜗虚拟通道信息处理系统的一个实施例示意图,其中:
声信号采集单元201,采集外界的声信号。
较佳地,声信号通过自动增益控制的采样系统,准确无失真采集25-100dB动态范围的声信号。
转换成数字信号单元202,与所述声信号采集单元201相连:
在本发明的一个实施例中,将采集的声信号转换成数字信号,为了达到一定的转换精度,使用16位的模数转换器。
基频提取单元203,与所述转换成数字信号单元202相连,其主要功能包括:
1)对数字信号进行基频(F0)提取。
首先,数字信号的平均幅度差函数为:
d ( i , &tau; ) = &Sigma; I = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
其中,x(i)是输入的数字信号;τ为估计时延,取值同帧长;d(i,τ)是信号的周期,其最小值对应的是τ=τ0=1/F0;W是一帧语音中采样点的个数。
由于d(i,τ)的幅度变化范围比较大,在实时计算时,会引起一些意想不到的误差。较佳地,对d(i,τ)进行一个归一化处理:即
dd ( i , &tau; ) = &tau; * d ( i , &tau; ) &Sigma; j = 1 &tau; d ( i , &tau; )
在按上述方法获得归一化后的d(记为dd(i,τ))的第一个极小值,其对应的τ为信号基频的倒数,即1/F0。
另外,在实时计算时,为降低计算量,在计算
d ( i , &tau; ) = &Sigma; i = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
时,仅对一帧内的信号进行每S个点计算一次d(i,τ):
&Sigma; i = 1 W [ x ( i * s ) - x ( i * s + &tau; ) ] ^ 2
2)将基频F0传送给幅度调整单元206。
分析单元204,与所述转换成数字信号单元202相连,其主要功能包括:
1)将数字信号分解为M个频带,可以利用数字信号处理芯片(DSP)对采集到的声信号进行分频处理。较佳地,数字信号处理芯片(DSP)采用快速傅里叶变换(FFT)方法完成。其中,M的取值范围为32-128。
2)将分频处理后的M个频带合并为N个通道:根据人工耳蜗系统可用电极的数目N,可以利用Greenwood公式将该M个频带合并为N个通道,分别获得每个通道的包络能量。其中,N的取值范围为2-24。
第一级峰值选取单元205,与所述分析单元204相连,其主要功能包括:
1)分别计算该N个通道的能量,选择能量最大的A个通道,并得到A个通道的包络能量值。其中,A<N。
2)将A个通道以及得到的A个通道的包络能量值一起传送给幅度调整单元206。
幅度调整单元206,与所述第一级峰值选取单元205和基频提取单元203相连,其主要功能包括:
1)接收基频提取单元203传送的基频F0。接收第一级峰值选取单元205传送的A个通道以及得到的A个通道的包络能量值。
2)固定低频与高频通道的界限(FR_TH),在本发明的实施例中,界限(FR_TH)为1kHz。对第一峰值选取单元205给出的A个通道进行分类,通道截止频率低于界限(FR_TH)为低频通道,高于界限(FR_TH)为高频通道。
3)固定可接受的基频范围[F0_min,F0_max],然后对低频通道的能量进行调制。
设低频通道所得通道能量AL(i),调制后的通道能量AL_mod(i)为:
当F0_min<F0<F0_max时,AL_mod(i)=AL(i)*cos(2π*F0*t);
当F0<F0_min时,AL_mod(i)=AL(i);
当F0>F0_max时,AL_mod(i)=AL(i);
其中,t是一帧信号的时间。
4)将高频通道的通道能量,以及调制后的低频通道的通道能量传送给声-电刺激单元208。
第二级峰值选取单元207,与所述分析单元204相连,其主要功能包括:
1)计算并保留分析单元203中合并的N个通道的每个通道内最大频段的位置。
2)将N个通道的每个通道内最大频段的位置传送给声-电刺激单元208。
声-电刺激单元208,其主要功能包括:
1)将接收的调制后的低频通道能量AL_mod(i),按如下方法转换为低频通道电流值EL(i):
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(A-Amin)/(Amax-Amin)]^p;
p取值范围为0.2—0.5;Emin和Emax分别对应于预先测量的植入者电极的电刺激感知阈值(T)和舒适阈值(C)的参数;[Amin–Amax]为通道声信号幅度输入范围。
从而,所得低频通道对应电极E(i)的刺激量为EL(i)。
2)将接收的高频通道的通道能量AH(i),按上述方法转换为高频通道电流值EH(i)。
然后,根据第二级峰值选取单元207的N个通道的每个通道内最大频段的位置,设置电流分配参数:在一帧时间内,以N个通道的每个通道内最大频段的位置,确定刺激产生该峰值时两个相邻独立电极上电流强度的比例。首先,设通道内包含频段数为K个,其中K的取值范围为2-30;B为1至K个频段内最大频段能量位置,则通道对应电极E(i)和E(i+1)的电流比例为:[B/K,1-B/K]。从而,根据公式:EH(i)*B/K和EL(i)*(1-B/K),分别得到高频通道对应的电极E(i)和E(i+1)的刺激量。
参阅图3所示,为本发明增强时域信息的人工耳蜗虚拟通道信息处理的方法的一个实施例示意图,其中:
步骤301,采集外界的声信号。
较佳地,声信号通过自动增益控制的采样系统,准确无失真采集25-100dB动态范围的声信号。
步骤302,将采集的声信号转换成数字信号:在本发明的一个实施例中,为了达到一定的转换精度,使用16位的模数转换器。
步骤303,对数字信号进行基频(F0)提取。其主要实施过程如下:
对数字信号进行基频(F0)提取。
首先,数字信号的平均幅度差函数为:
d ( i , &tau; ) = &Sigma; I = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
其中,x(i)是输入的数字信号;τ为估计时延,取值同帧长;d(i,τ)是信号的周期,其最小值对应的是τ=τ0=1/F0;W是一帧语音中采样点的个数。
由于d(i,τ)的幅度变化范围比较大,在实时计算时,会引起一些意想不到的误差。较佳地,对d(i,τ)进行一个归一化处理:即
dd ( i , &tau; ) = &tau; * d ( i , &tau; ) &Sigma; j = 1 &tau; d ( i , &tau; )
在按上述方法获得归一化后的d(记为dd(i,τ))的第一个最小值,其对应的τ为信号基频的倒数,即1/F0。
另外,在实时计算时,为降低计算量,在计算
d ( i , &tau; ) = &Sigma; I = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
时,仅对一帧内的信号进行每S个点计算一次d(i,τ):
&Sigma; i = 1 W [ x ( i * s ) - x ( i * s + &tau; ) ] ^ 2
步骤304,将数字信号分解为M个频带,然后将分频处理后的M个频带合并为N个通道。其主要实施过程如下:
1)将数字信号分解为M个频带,可以利用数字信号处理芯片(DSP)对采集到的声信号进行分频处理。较佳地,数字信号处理芯片(DSP)采用快速傅里叶变换(FFT)方法完成。其中,M的取值范围为32-128。
2)将分频处理后的M个频带合并为N个通道:根据人工耳蜗系统可用电极的数目N,可以利用Greenwood公式将该M个频段合并为N个通道,分别获得每个通道的包络能量。其中,N的取值范围为2-24。
步骤305,进行第一级峰值选取,分别计算该N个通道的能量,选择能量最大的A个通道,并得到A个通道的包络能量值。其中,A<N。
步骤306,根据第一级峰值选取的能量最大的A个通道和包络能量值,以及提取的信号基频进行声信号的幅度调整。其主要实施过程如下:
1)固定低频与高频通道的界限(FR_TH),在本发明的实施例中,界限(FR_TH)为1kHz。对第一峰值选取的A个通道给进行分类,通道截止频率低于界限(FR_TH)为低频通道,高于界限(FR_TH)为高频通道。
2)固定可接受的基频范围[F0_min,F0_max],然后对低频通道的能量进行调制。
设低频通道所得通道能量AL(i),调制后的通道能量AL_mod(i)为:
当F0_min<F0<F0_max时,AL_mod(i)=AL(i)*cos(2π*F0*t);
当F0<F0_min时,AL_mod(i)=AL(i);
当F0>F0_max时,AL_mod(i)=AL(i);
其中,t是一帧信号的时间。
步骤307,进行第二级峰值选取:计算并保留合并的N个通道的每个通道内最大频段的位置。
步骤308,进行声-电刺激,其主要实施过程如下:
1)将步骤306得到的调制后的低频通道能量AL_mod(i),按如下方法转换为低频通道电流值EL(i):
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(A-Amin)/(Amax-Amin)]^p;
p取值范围为0.2—0.5;Emin和Emax分别对应于预先测量的植入者电极的电刺激感知阈值(T)和舒适阈值(C)的参数;[Amin–Amax]为通道声信号幅度输入范围。
从而,所得低频通道对应电极E(i)的刺激量为EL(i)。
2)将步骤306得到的高频通道的通道能量AH(i),按上述方法转换为高频通道电流值EH(i)。
然后,根据第二级峰值选取的N个通道的每个通道内最大频段的位置,设置电流分配参数:在一帧时间内,以N个通道的每个通道内最大频段的位置,确定刺激产生该峰值时两个相邻独立电极上电流强度的比例。首先,设通道内包含频段数为K个,其中K的取值范围为2-30;B为1至K个频段内最大频段能量位置,则通道对应电极E(i)和E(i+1)的电流比例为:[B/K,1-B/K]。从而,根据公式:EH(i)*B/K和EL(i)*(1-B/K),分别得到高频通道对应的电极E(i)和E(i+1)的刺激量。
在本发明的一个具体实施例中,声信号首先通过自动增益控制的采集系统,准确无失真的采集25-100dB动态范围的声信号,采用率为16K。随后,高性能的数字信号处理芯片(DSP)可以对采集到的声信号进行256点FFT处理,128个频带,并按可用电极的个数(本实施例中为20个),将128个频带合并为20个通道,同时保留当前帧的包络能量。如下表所示,为20个通道的频率对应关系:
电极-通道 起止频率范围(Hz) 包含FFT点数(以128为总频段数)
1 [91,213] 2
2 [213,335] 2
3 [335,457] 2
4 [457,579] 2
5 [579,701] 2
6 [701,823] 2
7 [823,945] 2
8 [945,1066] 2
9 [1066,1249] 3
10 [1249,1493] 4
11 [1493,1737] 4
12 [1737,2041] 5
13 [2041,2468] 7
14 [2468,2895] 7
15 [2895,3382] 8
16 [3382,3991] 10
17 [3991,4723] 12
18 [4723,5576] 14
19 [5576,6612] 17
20 [6612,7770] 19
挑选其中能量最大的8个通道能量,假设为1,2,3,4通道和10,12,13,14通道;能量分别为A1,A2,A3,A4,A10,A12,A13,A14;同时,计算并保存24个通道内的最大能量频段Fmax。
所述基频处理对预处理后的数字信号进行基频(F0)提取,设信号的平均幅度差函数为:
d ( i , &tau; ) = &Sigma; i = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
其中x(i)是输入信号,估计时延τ,取值同帧长,取20ms;W值为256;d(i,τ)的最小值对应的τ0,就是信号的周期。
由于d(i,τ)的幅度变化范围比较大,在实时计算时,会引起一些意想不到的误差,在本发明中对d(i,τ)进行一个归一化处理:
dd ( i , &tau; ) = &tau; * d ( i , &tau; ) &Sigma; j = 1 &tau; d ( i , &tau; )
另外,在本发明中,为降低计算量,在计算
d ( i , &tau; ) = &Sigma; i = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
对一帧内的信号进行计算,即为每S个点计算一次d(i,τ):在本例中,S取16。
&Sigma; i = 1 W [ x ( i * s ) - x ( i * s + &tau; ) ] ^ 2
在按上述方法获得dd(i,τ)的值之后,选择dd(i,τ)第一个极小值作为周期值,假设所得F0值为200Hz。
设1kHz为低频和高频的界限(FR_TH),在本例中,前4个通道为低频通道,后4个通道为高频通道。
设可接受的基频范围是:F0_min=100Hz,F0_max=400Hz。F0=200Hz在可接受范围内。对低频通道能量调整为:
AL_mod(1)=AL(1)*cos(2π*200*t);
AL_mod(2)=AL(2)*cos(2π*200*t);
AL_mod(3)=AL(3)*cos(2π*200*t);
AL_mod(4)=AL(4)*cos(2π*200*t);
其中,t是一帧信号的时间,在本发明的实施例中,一帧为256点,采样率是16K,则t为16ms。
当T值取0,C值取植入体最大放电电流时,
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(A-Amin)/(Amax-Amin)]^p;p取值范围为0.2;当Amax=75dB,Amin=35dB,将Amax设为1,Amin归一化为1/10^(40/10);计算得到对应电极E1-E4的刺激电流EL1,EL2,EL3,EL4;
所得高频通道能量值AH10-AH13,也按上述公式转换为电流值EH10-EH13。根据第二级峰值选择的值,设置电流分配参数:在一帧时间内,以每个通道中峰值的相对位置确定用刺激产生该峰值时两个独立电流源上电流强度的比例。下表内说明了本例所述情况的电流分配关系:
从上面的描述可以看出,本发明增强时域信息的人工耳蜗虚拟通道信息处理系统和方法,创造性的提出了在人工耳蜗信号处理的低频段增强时域包络信息周期性,在较高频段使用虚拟通道,增加频率感知;本发明显著提升了人工耳蜗使用者的听音能力和音调感知,以及对频率的分辨能力;与此同时,改善了植入者对声调语言和音乐的识别效果;最后,整个增强时域信息的人工耳蜗虚拟通道信息处理系统和方法实现起来简便易行。
所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种增强时域信息的人工耳蜗虚拟通道信息处理系统,其特征在于,
声信号采集单元,用于采集外界的声信号;
转换成数字信号单元,与所述声信号采集单元相连,将采集的声信号转换成数字信号;
基频提取单元,与所述转换成数字信号单元相连,用于对数字信号进行基频F0提取;
分析单元,与所述转换成数字信号单元相连,用于将数字信号分解为M个频带,根据系统的可用电极数,将M个频带合并为N个通道;
第一级峰值选取单元,与所述分析单元相连,用于分别计算该N个通道的能量,选择能量最大的A个通道,并得到A个通道的包络能量值;
幅度调整单元,与所述第一级峰值选取单元和基频提取单元相连,用于固定低频与高频通道的界限,将A个通道分为高频通道和低频通道;然后固定可接受的基频范围,对低频通道的能量进行调制;
第二级峰值选取单元,与所述分析单元相连,计算并保留所述分析单元中合并的N个通道的每个通道内最大频段的位置;
声-电刺激单元,将调制后的低频通道进行声-电转换,然后得到低频通道对应电极的刺激量;将高频通道进行声-电转换,然后根据所述第二级峰值选取单元的N个通道的每个通道内最大频段的位置,设置电流分配参数,确定刺激产生该高频通道的最大频段时两个相邻独立电极上电流强度的比例,最后得到高频通道对应两个相邻独立电极上的刺激量。
2.根据权利要求1所述的系统,其特征在于,所述的声信号采集单元通过自动增益控制的采样系统,准确无失真采集25-100dB动态范围的声信号。
3.根据权利要求1所述的系统,其特征在于,所述的基频提取单元对数字信号进行基频F0提取:利用数字信号的平均幅度差函数:
d ( i , &tau; ) = &Sigma; i = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
其中,x(i)是输入的数字信号;τ为估计时延,取值同帧长;d(i,τ)是信号的周期,其最小值对应的是τ=τ0=1/F0;W是一帧语音中采样点的个数。
4.根据权利要求3所述的系统,其特征在于,所述的基频提取单元由于d(i,τ)的幅度变化范围比较大,在实时计算时,对d(i,τ)进行一个归一化处理:即
dd ( i , &tau; ) = &tau; * d ( i , &tau; ) &Sigma; j = 1 &tau; d ( i , &tau; )
在按归一化处理获得归一化后的dd(i,τ)的第一个极小值,其对应的τ为信号基频的倒数,即1/F0。
5.根据权利要求4所述的系统,其特征在于,所述的基频提取单元在实时计算时,为降低计算量,在计算
d ( i , &tau; ) = &Sigma; i = 1 W [ x ( i ) - x ( i + &tau; ) ] ^ 2
时,仅对一帧内的信号进行每S个点计算一次d(i,τ):
&Sigma; i = 1 W [ x ( i * s ) - x ( i * s + &tau; ) ] ^ 2 .
6.根据权利要求3所述的系统,其特征在于,所述的幅度调整单元固定可接受的基频范围[F0_min,F0_max],然后按如下方法对低频通道的能量进行调制:设低频通道所得通道能量AL(i),调制后的通道能量AL_mod(i)为:
当F0_min<F0<F0_max时,AL_mod(i)=AL(i)*cos(2π*F0*t);
当F0<F0_min时,AL_mod(i)=AL(i);
当F0>F0_max时,AL_mod(i)=AL(i);
其中,t是一帧信号的时间。
7.根据权利要求1至6任意一项所述的系统,其特征在于,所述的声-电刺激单元将调制后的低频通道能量AL_mod(i),按如下方法转换为低频通道电流值EL(i):
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(AL_mod(i)-Amin)/(Amax-Amin)]^p;
p取值范围为0.2—0.5;Emin和Emax分别对应于预先测量的植入者电极的电刺激感知阈值(T)和舒适阈值(C)的参数;[Amin,Amax]为通道声信号幅度输入范围区间;
所得低频通道对应电极E(i)的刺激量为EL(i);
将接收的高频通道的通道能量AH(i),按上述方法转换为高频通道电流值EH(i);
然后,根据第二级峰值选取单元的N个通道的每个通道内最大频段的位置,设置电流分配参数:在一帧时间内,以N个通道的每个通道内最大频段的位置,确定刺激产生该峰值时两个相邻独立电极上电流强度的比例;首先,设通道内包含频段数为K个,其中K的取值范围为2-30;B为1至K个频段内最大频段能量位置,则通道对应电极E(i)和E(i+1)的电流比例为:[B/K,1-B/K];
最后根据公式:EH(i)*B/K和EH(i)*(1-B/K),分别得到高频通道对应的电极E(i)和E(i+1)的刺激量。
8.一种增强时域信息的人工耳蜗虚拟通道信息处理方法,其特征在于,包括:
采集外界的声信号,将采集的声信号转换成数字信号;
对数字信号进行基频F0提取;
并且将数字信号分解为M个频带,然后将分频处理后的M个频带合并为N个通道;进行第一级峰值选取,分别计算该N个通道的能量,选择能量最大的A个通道,并得到A个通道的包络能量值;进行第二级峰值选取:计算并保留合并的N个通道的每个通道内最大频段的位置;
根据第一级峰值选取的能量最大的A个通道和包络能量值,以及提取的信号基频进行声信号的幅度调整:固定低频与高频通道的界限,将A个通道分为高频通道和低频通道;然后固定可接受的基频范围,对低频通道的能量进行调制;
将调制后的低频通道进行声-电转换,然后得到低频通道对应电极的刺激量;将高频通道进行声-电转换,然后根据所述第二级峰值选取的N个通道的每个通道内最大频段的位置,设置电流分配参数,确定刺激产生该高频通道的最大频段时两个相邻独立电极上电流强度的比例,最后得到高频通道对应两个相邻独立电极上的刺激量。
9.根据权利要求8所述的方法,其特征在于,所述对低频通道的能量进行调制是按照如下方式进行:
固定可接受的基频范围[F0_min,F0_max],然后对低频通道的能量进行调制:
设低频通道所得通道能量AL(i),调制后的通道能量AL_mod(i)为:
当F0_min<F0<F0_max时,AL_mod(i)=AL(i)*cos(2π*F0*t);
当F0<F0_min时,AL_mod(i)=AL(i);
当F0>F0_max时,AL_mod(i)=AL(i);
其中,t是一帧信号的时间。
10.根据权利要求9所述的方法,其特征在于,所述的进行声-电刺激是将调制后的低频通道能量AL_mod(i),按如下方法转换为低频通道电流值EL(i):
则AL_mod(i)<Amin时,EL(i)=Emin;
则Amin<AL_mod(i)<Amax时,EL(i)=Emin+(Emax-Emin)*k;
则AL_mod(i)>Amax时,EL(i)=Emax;
其中,k=[(AL_mod(i)-Amin)/(Amax-Amin)]^p;
p取值范围为0.2—0.5;Emin和Emax分别对应于预先测量的植入者电极的电刺激感知阈值(T)和舒适阈值(C)的参数;[Amin,Amax]为通道声信号幅度输入范围区间;
所得低频通道对应电极E(i)的刺激量为EL(i);
将得到的高频通道的通道能量AH(i),按上述方法转换为高频通道电流值EH(i);
然后,根据第二级峰值选取的N个通道的每个通道内最大频段的位置,设置电流分配参数:在一帧时间内,以N个通道的每个通道内最大频段的位置,确定刺激产生该峰值时两个相邻独立电极上电流强度的比例;首先,设通道内包含频段数为K个,其中K的取值范围为2-30;B为1至K个频段内最大频段能量位置,则通道对应电极E(i)和E(i+1)的电流比例为:[B/K,1-B/K];
最后根据公式:EH(i)*B/K和EH(i)*(1-B/K),分别得到高频通道对应的电极E(i)和E(i+1)的刺激量。
CN201310085625.8A 2013-03-15 2013-03-15 增强时域信息的人工耳蜗虚拟通道信息处理系统和方法 Active CN103190966B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310085625.8A CN103190966B (zh) 2013-03-15 2013-03-15 增强时域信息的人工耳蜗虚拟通道信息处理系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310085625.8A CN103190966B (zh) 2013-03-15 2013-03-15 增强时域信息的人工耳蜗虚拟通道信息处理系统和方法

Publications (2)

Publication Number Publication Date
CN103190966A CN103190966A (zh) 2013-07-10
CN103190966B true CN103190966B (zh) 2015-04-22

Family

ID=48713906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310085625.8A Active CN103190966B (zh) 2013-03-15 2013-03-15 增强时域信息的人工耳蜗虚拟通道信息处理系统和方法

Country Status (1)

Country Link
CN (1) CN103190966B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103892939B (zh) * 2014-04-11 2016-03-23 浙江诺尔康神经电子科技股份有限公司 提高汉语声调识别率的人工耳蜗言语处理器和方法
AU2016335681B2 (en) * 2015-10-09 2018-11-01 Med-El Elektromedizinische Geraete Gmbh Estimation of harmonic frequencies for hearing implant sound coding using active contour models
CN105513604B (zh) * 2016-01-05 2022-11-18 浙江诺尔康神经电子科技股份有限公司 一种基频轮廓提取的人工耳蜗言语处理方法和系统
CN105662706B (zh) * 2016-01-07 2018-06-05 深圳大学 增强时域表达的人工耳蜗信号处理方法及系统
CN105596119B (zh) * 2016-01-27 2017-11-14 山东大学 增强音乐旋律感知的耳蜗电极主辅布置、装置、系统及方法
CN106621033B (zh) * 2016-11-30 2019-09-27 深圳信息职业技术学院 一种电子耳蜗言语处理方法和系统
US20200375667A1 (en) * 2018-03-21 2020-12-03 Marek Polak Semiautomated Robotic Cochlear Implant Surgery
EP3836830A4 (en) * 2018-08-14 2022-05-11 Nurotone Medical Ltd. COCHLEAR IMPLANT STIMULATION SYSTEM AND METHOD

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101716108A (zh) * 2009-11-20 2010-06-02 中国科学院声学研究所 一种电子耳蜗信号处理及电刺激编码系统及其处理方法
CN102525734A (zh) * 2012-02-23 2012-07-04 杭州诺尔康神经电子科技有限公司 基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011031918A1 (en) * 2009-09-11 2011-03-17 Med-El Elektromedizinische Geraete Gmbh Low pulse rate cochlear implant stimulation in conjunction with a separate representation of fundamental frequencies and voiced/unvoiced distinctions

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101716108A (zh) * 2009-11-20 2010-06-02 中国科学院声学研究所 一种电子耳蜗信号处理及电刺激编码系统及其处理方法
CN102525734A (zh) * 2012-02-23 2012-07-04 杭州诺尔康神经电子科技有限公司 基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法

Also Published As

Publication number Publication date
CN103190966A (zh) 2013-07-10

Similar Documents

Publication Publication Date Title
CN103190966B (zh) 增强时域信息的人工耳蜗虚拟通道信息处理系统和方法
CN102973277B (zh) 一种频率跟随响应信号测试系统
CN102596309B (zh) 低脉冲频率耳蜗植入物刺激协同基频的单独表示和浊音/清音区别
AU2011280051B2 (en) Envelope specific stimulus timing
US8019430B2 (en) Stimulating auditory nerve fibers to provide pitch representation
CN102579159B (zh) 电子耳蜗宽动态范围压缩处理信号的言语处理器和方法
CN101716108B (zh) 一种电子耳蜗信号处理及电刺激编码系统
CN101743036A (zh) 具有宽带低频滤波器的电神经刺激
CN104661700A (zh) 听力植入物中的瞬变声音的减小
CN102525734B (zh) 基于峰值选取的电子耳蜗虚拟通道信号处理系统和方法
CN104307100B (zh) 一种提高人工耳蜗音高感知能力的方法及系统
CN103892939A (zh) 提高汉语声调识别率的人工耳蜗言语处理器和方法
CN101773429A (zh) 人工电子耳蜗以及一种双刺激速率言语处理方法
CN103142328B (zh) 电子耳蜗多通道调整动态范围的言语处理器和方法
Chen et al. Real-time spectrum estimation–based dual-channel speech-enhancement algorithm for cochlear implant
CN101803972B (zh) 一种人工电子耳蜗系统及物理电极自动选择方法
CN111150934B (zh) 人工耳蜗汉语声调编码策略的评估系统
CN110772713B (zh) 具有改进的用于确定时间精细结构参数的方法的耳蜗刺激系统
CN103190965B (zh) 基于语音端点检测的人工耳蜗自动增益控制方法和系统
Kandzia et al. Binaural measurement of bone conduction click evoked otoacoustic emissions in adults and infants
CN203001232U (zh) 一种耳塞式声音辅助感知装置
Zirn et al. Objective assessment of optimal group delays in cochlear implants
Chen et al. ACE Speech Processing Strategy and Feature Analysis in CI Device
Öztürk et al. AN INVESTIGATION OF NOISE RESISTANCE OF SPEECH STRATEGIES IN COCHLEAR INPLANTS
Maretic Optimizing Stimulation Strategies in Cochlear Implants for Music Listening

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: Yuhang District, Hangzhou City, Zhejiang Province, 311121 West No. 1500 Building 1 room 325

Applicant after: Hangzhou Nuorkang Neural Electronic Technology Co., Ltd.

Address before: The city of Hangzhou City, Zhejiang Province, 310011 Qingchun Road, Room 302 No. 118

Applicant before: Hangzhou Nuorkang Neural Electronic Technology Co., Ltd.

C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: Yuhang District, Hangzhou City, Zhejiang Province, 311121 West No. 1500 Building 1 room 325

Applicant after: Zhejiang Nurotron Neural Electronic Technology Co., Ltd.

Address before: Yuhang District, Hangzhou City, Zhejiang Province, 311121 West No. 1500 Building 1 room 325

Applicant before: Hangzhou Nuorkang Neural Electronic Technology Co., Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: HANGZHOU NUORKANG NEURAL ELECTRONIC TECHNOLOGY CO., LTD. TO: ZHEJIANG NUROTRON NEURAL ELECTRONIC TECHNOLOGY CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant