CN101953722B - 一种电子耳蜗及其声音信号处理方法 - Google Patents

一种电子耳蜗及其声音信号处理方法 Download PDF

Info

Publication number
CN101953722B
CN101953722B CN2010102791038A CN201010279103A CN101953722B CN 101953722 B CN101953722 B CN 101953722B CN 2010102791038 A CN2010102791038 A CN 2010102791038A CN 201010279103 A CN201010279103 A CN 201010279103A CN 101953722 B CN101953722 B CN 101953722B
Authority
CN
China
Prior art keywords
signal
noise
subband
frame
ninit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102791038A
Other languages
English (en)
Other versions
CN101953722A (zh
Inventor
原猛
冯海泓
孟庆林
平利川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN2010102791038A priority Critical patent/CN101953722B/zh
Publication of CN101953722A publication Critical patent/CN101953722A/zh
Application granted granted Critical
Publication of CN101953722B publication Critical patent/CN101953722B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Prostheses (AREA)

Abstract

本发明涉及一种电子耳蜗及其声音信号处理方法。利用预处理模块对输入声信号进行预处理,输入的每一帧信号变成N个子带信号的输出;通过多子带信噪比统计分析模块,经预处理模块的Ninit帧信号作为初始化信号,计算出帧信号中的每个子带的噪声统计特性和判决门限,然后对帧信号是否为噪声进行判决,判决为噪声的信号送入参考噪声统计信息更新模块对参考噪声对应子带平均能量进行更新,并对该子带参考噪声统计特性和判决门限更新;同时,检测初始化信号的能量是否大于等于预先设定的噪声预警门限,如果不是,则成功开启智能节电功能;通过射频正常运行和低功耗运行控制模块,利用判决为噪声帧信号的个数和时间分布来判决控制射频正常运行或低功耗运行。

Description

一种电子耳蜗及其声音信号处理方法
技术领域
本发明涉及电子耳蜗领域和语音信号处理领域,特别涉及一种电子耳蜗及其声音信号处理方法。
背景技术
电子耳蜗技术是现在世界上最为成功的神经假体,通过用电流直接刺激听神经,使听力严重损失的人恢复听觉,已帮助全球超过12万电子耳蜗植入者不同程度的恢复了听力。由于电子耳蜗采用电极刺激的方式补偿重度感音性听力损失,包括信息传输电路、电极电流供给电路和言语处理器电路等主要耗电部分,大部分集中在射频电路发射能量部分,电子耳蜗的电能消耗相对于助听器要高出很多。通常耳背式助听器需要一粒专用电池,工作时长达1到2周,而耳背式电子耳蜗需要三粒专用电池,工作时长仅为1到3天。国内可以买到的电子耳蜗专用电池价格在每粒2~5元不等,故电子耳蜗工作一年可能约需要730元~5475元不等,对于我国中低收入家庭来说负担较大,且涉及环境污染。另外,频繁的更换电池或给电池充电也会给日常使用带来不便。即便在用体佩机时,采用2节或3节五号电池,工作时长一般也只在在1天左右。
下面是两款电子耳蜗的能耗情况实例:
Advanced Bionics公司某型号电子耳蜗,使用专用锂离子充电电池,一节电池使用时间大于14小时,配用AA电池仓,可使用三节5号电池,普通三节5号电池使用时间大于18小时。
澳大利亚Cochlear公司某型号电子耳蜗,使用一节或二节5号电池,实际使用情况看,二节电池的音质优于一节。普通二节5号电池使用时间大于24小时。
国内外相关研究近况:目前国内还没有正式走向市场的国产化电子耳蜗产品,有几家产品正处于临床阶段,没有采用语音信号处理方法进行节能降耗相关的文献资料报道。国外电子耳蜗公司的产品,都有采用自动增益控制(AGC)的方法来调整增益以使人听起来舒服,美国麻省理工学院有关于AGC可以降低能耗的研究文献,但是没有看到各家公司关于电子耳蜗采用语音信号处理方法降低能耗的报道。很多关于电子耳蜗节电的方法都是从电路板级、集成电路级出发进行研究的。
另外,在语音信号处理领域,语音端点检测也被称为语音活动检测,研究问题包括噪声边界检测、单词和孤立字检测等,常被用于语音自动识别中的前期处理,也常被用于网络电话通信、语音增强、回声抵消等应用领域。具体的实现方法也是多种多样,基本的方法是利用短时能量、过零率、信息熵、倒谱、高阶统计量、线性预测编码等。
当前应用最广泛的电子耳蜗言语编码策略,如:连续交替采用方案CIS(continuousinterleaved sampling),高级混合编码方案ACE(advanced confined encoding)都是通过植入电极产生速率恒定的电刺激脉冲,刺激耳蜗不同位置来模拟正常耳蜗的部位编码。植入的电极在鼓阶由蜗底向蜗尖依次排列,刺激由高到低不同频率敏感的听神经。分频带处理是常规电子耳蜗言语编码策略中常用的技术。植入电极的不同位置,对应于信号处理策略中划分的不同的频段,电子耳蜗的主要耗电部分就是射频(RF)发射,即其后面的部分,能够在无有效声音信息的时候降低RF发射功率即可节省大部分的电能。
发明内容
本发明的目的在于,解决电子耳蜗在正常工作时耗电量较大,需要电子耳蜗植入者频繁更换电池的问题,从而提供一种经济性、环保价值高及人性化的电子耳蜗及其语音信号处理方法。
为实现上述发明目的,本发明提出一种电子耳蜗及其声音信号处理方法。
一种电子耳蜗,该电子耳蜗利用预处理模块对输入的声信号进行预处理,经过电子耳蜗言语处理中编码策略前段的分频带处理后,输入的每一帧信号变成N个子带信号的输出,其特征在于,
该电子耳蜗还包括:多子带信噪比统计分析模块、参考噪声的统计信息更新模块及射频正常运行和低功耗运行的控制模块;
所述的多子带信噪比统计分析模块,用于将经预处理模块处理后的Ninit帧信号作为初始化信号,计算出每一帧信号中的每一个子带的噪声统计特性和判决门限,然后对每一帧信号是否为噪声进行判决,判决为噪声的信号送入所述的参考噪声的统计信息更新模块;同时,检测初始化信号的能量是否大于等于预先设定的噪声预警门限,如果是,则开启智能节电功能失败;如果不是,则成功开启智能节电功能;所述的Ninit帧信号中的Ninit表示帧的个数,取值范围是25≤Ninit≤50;所述的N个子带中的N表示电子耳蜗使用言语编码策略前段的分频带处理后将每一帧信号分成的子带数,取值范围是8≤N≤24;
所述的参考噪声的统计信息更新模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号对参考噪声的对应子带平均能量进行更新,并对该子带参考噪声统计特性和判决门限更新,然后,用于所述的多子带信噪比统计分析模块中帧信号是否为噪声的判决;
所述的射频正常运行和低功耗运行的控制模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号的个数和时间分布来判决开启或停止言语编码策略后段处理及射频正常运行或低功耗运行;如果低功耗开启,系统回到初始化完成后的状态。
该系统还包括:辨识非噪声信号特性模块;所述的辨识非噪声信号特性模块用于检测所述的多子带信噪比统计分析模块判决为非噪声的帧信号是语音信号还是其他信号,并且把其中的非语音信号输送给所述的参考噪声的统计信息更新模块进行参考噪声信息更新,以此实现针对低方差缓变噪声的自适应调整。
所述的辨识非噪声信号特性模块对所述的多子带信噪比统计分析模块判决为非噪声信号的第k帧信号进行基音周期检测,然后,进行谐波搜索,最后,根据语音中浊音的谐波特性,通过对非噪声信号的基频和谐波进行提取,判断当前非噪声信号是否为语音;另外,根据预先设置的语音、电话铃声、音乐这三种声音对不同的子带进行不同的加权,用于对非噪声特性判决的辅助。
一种电子耳蜗的声音信号处理方法,该方法包括步骤:
步骤1):该电子耳蜗利用预处理模块对输入的声信号进行预处理,经过电子耳蜗言语处理中编码策略前段的分频带处理后,输入的每一帧信号变成N个子带信号的输出;
步骤2):通过多子带信噪比统计分析模块,把电子耳蜗经预处理模块处理后的Ninit帧信号作为初始化信号,计算出每一帧信号中的每一个子带的噪声统计特性和判决门限,然后对每一帧信号是否为噪声进行判决,判决为噪声的信号送入所述的参考噪声的统计信息更新模块;同时,检测初始化信号的能量是否大于等于预先设定的噪声预警门限,如果是,则开启智能节电功能失败;如果不是,则成功开启智能节电功能;
步骤3):通过参考噪声的统计信息更新模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号对参考噪声的对应子带平均能量进行更新,并对该子带参考噪声统计特性和判决门限更新,然后,用于所述的多子带信噪比统计分析模块中帧信号是否为噪声的判决;
步骤4):最后,通过射频正常运行或低功耗运行的控制模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号的个数和时间分布来判决开启或停止言语编码策略后段处理及射频正常运行或的低功耗运行;如果低功耗运行,系统回到初始化完成后的状态。
所述的步骤2)中,
如果分频带处理后的信号为时域表现形式,则按式(1)计算其能量;其中,第i个频带的信号的时域表示为xi(k,q),i表示第i个子带,k表示第k帧信号,q表示第k帧信号中第q个采样点,0<q<NF+1;
Ex i ( k ) = Σ q = 1 NF x i 2 ( k , q ) . . . ( 1 )
如果分频带处理后的信号为频域表现形式,则按式(2)计算其能量;其中,X(k,t)为第k帧信号的频域表示形式,t表示第i个子带中每个频点的坐标;
Ex i ( k ) = Σ t = Ni N i + 1 - 1 X 2 ( k , t ) . . . ( 2 )
如果k>Ninit不成立,则按照式(3)滑动平均的方式计算第i个子带的平均噪声能量Eni(k);
当k>1时,Eni(k)=αExi(k)+(1-α)Eni(k-1)
当k=1时,Eni(k)=Exi(k)    (3)
式(3)中,
Figure BSA00000266131000043
k表示第k帧信号,
在得到Eni(Ninit)后,设Thi0为预先根据特定电子耳蜗信号的增益情况设定的第i个子带的能量门限,判断如果Eni(Ninit)>Thi0成立,则系统报警,告知电子耳蜗植入者此智能节电功能初始化失败,功能开启失败;如果Eni(Ninit)>Thi0不成立,则按照式(4)计算前Ninit个帧信号的信噪比
Figure BSA00000266131000044
Figure BSA00000266131000045
式(4)中,0<k<Ninit+1;经过初始化以后,始终会保存Ninit×N个能量值。
当0<k<Ninit+1时,计算
Figure BSA00000266131000046
的方差σni 2(Ninit),合理假设
Figure BSA00000266131000047
服从均值为0的高斯分布,然后按照式(5)利用σni 2(Ninit)计算第i个子带的信噪比判决门限ηi(Ninit);
η i ( Ninit ) = 2 σn i 2 ( Ninit ) · erfc - 1 ( 2 P FA ) - - - ( 5 )
式(5)中,PFA为虚警概率,此处设为5%,erfc-1为补余误差函数的反函数;
如果k>Ninit成立,则计算帧信号xi(k)的信噪比
Figure BSA00000266131000049
把它和最新更新的ηi(k)做比较,然后进行判断,如果
Figure BSA000002661310000410
则使第k帧第i个子带非噪声信号标志为Vflagi(k)=1;否则,Vflagi(k)=0;然后将判决结果进行下一步的子带综合分析;其中,ηi会在两种情况下进行自动更新;一是利用σni 2(Ninit)计算第i个子带的信噪比判决门限ηi(Ninit),另一是在所述的参考噪声的统计信息更新模块中实时更新判决门限ηi
N个子带都做完信噪比统计分析判决后进行对当前帧信号判决是噪声信号还是非噪声信号。
所述的步骤2)中,对每一帧信号是否为噪声进行判决的步骤包括:
所述的多子带信噪比统计分析模块要判决当前帧信号中的子带是环境噪声还是非环境噪声的判决准则是:
式(6)中,H0为当前帧信号为环境噪声,H1为当前帧信号为非环境噪声;
首先,利用式(6)对N个Vflagi进行子带综合分析,如果Vflagi(k)=1的个数M>N/2,则初步判定第k帧信号为非噪声信号,送入所述的射频正常运行和低功耗运行的控制模块来控制射频正常运行,并开启言语编码策略后段,同时令全频带标志位Vflag(k)=1;如果Vflagi(k)=1的个数M<N/2,则初步判定第k帧信号为噪声信号,并送入所述的参考噪声的统计信息更新模块来更新判决门限ηi和所述的射频正常运行和低功耗运行开启的控制模块来控制射频低功耗运行,并关闭言语编码策略后段,同时令全频带标志位Vflag(k)=0。
所述的步骤2)中,对每一帧信号是否为噪声进行判决的步骤包括:
对当前帧信号进行总体判断,那么按照式(7)对各个子带的进行总体判断:
Figure BSA00000266131000053
式(7)中,H0为当前帧信号为环境噪声,H1为当前帧信号为非环境噪声,wi为预先设定的对应每个通道的权值,1≤i≤N。
式(6)和式(7)为对每一帧信号是否为噪声进行判决的两种方法,实际操作时只选择一种,推荐优先选择(7)。
所述的步骤3)中,
该系统初始化后实时保存Ninit×N个子带的能量值,所述的参考噪声的统计信息更新模块利用每一帧被所述的多子带信噪比统计分析模块判为噪声的结果对参考噪声模型进行更新,即删除Ninit个帧中的第一个,然后整体前移,再把刚才判决为噪声帧信号放在第Ninit位上,每完成Ninit/2次更新后按照式(8)用滑动平均的方式计算每一帧中的每一个子带噪声的平均能量;
当k>1时,Eni(k)=αExi(k)+(1-α)Eni(k-1)
当k=1时,Eni(k)=Exi(k)    (8)
式(8)中,
Figure BSA00000266131000061
Eni(k)表示第k帧第i个子带的平均噪声能量;k表示第k帧信号;
计算第i个子带对应的当前帧的信噪比
Figure BSA00000266131000062
并计算第i个子带噪声的方差σni(k),并由此计算判决门限ηi(k);最后,实时更新判决门限ηi用于所述的多子带信噪比统计分析模块中。
本发明的优点在于,本发明通过利用声音信号处理中语音端点检测和自适应技术,结合环境中有无有效声音信息实现了一种电子耳蜗智能节电方法,可以在安静环境下实现电子耳蜗的电能消耗;另一个优点在于本发明直接利用电子耳蜗中各种编码策略中常用的分频带处理的结果,设计了一种信噪比变量作为统计量用于端点检测,没有引入复杂的计算,利于实时处理。
附图说明
图1电子耳蜗框图;
图2所述的多子带信噪比统计分析模块工作流程图;
图3所述的辨识非噪声信号特性的模块工作流程图;
图4所述的参考噪声的统计信息更新模块工作流程图;
图5所述的射频正常运行和低功耗运行的控制模块工作流程图。
具体实施方式
下面结合附图,对本发明作进一步的说明,并更详细地描述本发明的最佳实施例。
本发明提出的电子耳蜗框图,如图1所示。首先,声信号输入电子耳蜗麦克风,经过预处理后进入言语编码策略前段,其中会将信号分为N个频率子带,具体N的值根据使用的言语编码策略决定;输入所述的多子带信噪比统计分析模块的信号是时域分帧和频域分频带的信号,分帧和分频带情况与言语编码策略相同,帧长为NF,对应的时长为20ms,根据采样率进行转换,相邻帧间重叠率为Noverlap=50%,把打开电子耳蜗后的Ninit,在实施例中Ninit=50帧信号作为初始化噪声信号,计算出每一个子带的噪声统计特性和判决门限,然后对相应的子带后面的帧信号是否为噪声进行判决,同时判决为噪声的信号送入参考噪声的统计信息更新模块3,对参考噪声统计特性和判决门限进行更新;如果判决的帧信号为噪声信号,则触发所述的射频正常运行和低功耗运行的控制模块来控制射频低功耗运行;如果判决的帧信号为非噪声信号,则触发所述的射频发射开启和停止的控制模块来开启射频发射。
如果系统要求对言语声和其他突发声音进行区分,就要增加辨识非噪声信号特性模块2。那么由多子带信噪比统计分析模块1初步判断为非噪声的信号送入辨识非噪声信号特性模块2中,用于辨识当前帧信号是语音或其他信号,对于缓变的其他噪声信号送入参考噪声的统计信息更新模块3,对参考噪声统计特性和判决门限进行更新,并用于多子带信噪比统计分析模块1中帧信号是否为噪声的判决。
所述的多子带信噪比统计分析模块工作流程图,如图2所示。利用电子耳蜗言语处理中编码策略前段的前50帧信号分频带处理后的N个子带的输出,计算每个子带的能量。将本发明中设计的信噪比作为统计量,首先实时统计用于初始化的环境噪声,计算出环境噪声信噪比的统计模型和第i个子带的判决门限ηi(0<i≤N),然后,包括以下步骤:
步骤10):实时计算初始化后的子带能量Exi(k);
步骤11):判断k>50是否成立,如果k>50成立,转至步骤15);如果k>50不成立,转至步骤12);
步骤12):计算相应子带的平均噪声能量Eni(k),然后判断Eni(50)>Thi0是否成立,如果Eni(50)>Thi0成立,转至步骤30);如果Eni(50)>Thi0不成立,转至步骤13);
步骤13):计算这50帧中所有帧信号的信噪比
Figure BSA00000266131000071
并计算其方差σni 2(50);
步骤14):计算第i个子带的信噪比判决门限ηi(50);
步骤15):计算帧信号Xi(k)的信噪比
Figure BSA00000266131000072
步骤16):把和最新更新的ηi做比较,如果
Figure BSA00000266131000074
成立,则转至步骤17),如果
Figure BSA00000266131000075
不成立,则转至步骤18);其中,判决门限ηi会在参考噪声的统计信息更新模块3中实行实时更新;
步骤17):则第k帧第i个子带非噪声信号标志位Vflagi(k)=1;
步骤18):则第k帧第i个子带非噪声信号标志位Vflagi(k)=0;
步骤19):用于N个子带的综合分析。
所述的辨识非噪声信号特性的模块工作流程图,如图3所示。对于多子带信噪比统计分析模块1中判决为非噪声的信号进行特性判定,判断其为语音信号或其他。包括以下步骤:
步骤21):利用了语音中浊音的特性,即浊音的谐波特性,对第k帧非噪声信号进行基音周期检测;
步骤22):利用了语音中浊音的特性,即浊音的谐波特性,对第k帧非噪声信号进行谐波成分搜索;
步骤23):最后根据语音中浊音的特性判断该帧信号是否为语音。
其中,步骤21)和步骤22)均运用根据预先设置的几类声音(语音、电话铃声、音乐)对不同的子带进行不同的加权的方法对非噪声特性判决的辅助。
所述的参考噪声的统计信息更新模块工作流程图,如图4所示。包括以下步骤:
步骤24):利用每一帧被多子带信噪比统计分析模块1和辨识非噪声信号特性模块2判决为非语音的信号的第i个子带的信息实时对参考噪声的子带平均能量进行更新,具体更新方法为滑动平均,并对缓存中存储的50帧的N个子带的能量值进行更新;
步骤25):计算出第i个子带的参考信噪比
Figure BSA00000266131000081
方差和判决门限ηi(k);
步骤26):实时更新判决门限ηi(k)用于多子带信噪比统计分析模块1。
所述的射频正常运行或低功耗运行的控制模块工作流程图,如图5所示。图中给出了从射频正常运行状态7到中间转移状态再到射频低功耗运行状态9的状态转换。其中,中间转移状态使系统保持原状态,即电极正常刺激刺激或低功耗刺激状态。具体说明:在射频低功耗运行状态9后,如果下一帧判决Vflag=0,则保持原状态,如果Vflag=1,则进入中间转移状态31;之后如果Vflag=0则返回射频低功耗运行状态9,如果Vflag=1则系统进入射频正常运行状态7;进入射频正常运行状态7后,等待0.5秒后,判断0.5秒后的第一帧信号如果Vflag=0则系统进入中转状态32,如果Vflag=1则保持系统状态不变,再等待0.5秒后重新做此判断;系统若进入中转状态32,之后第一帧信号如果Vflag=1则返回射频正常运行状态7,如果Vflag=0则进入下一个中间转移状态33;后面的中间转移状态33~38可以依照中间转移状态32判决方法类推;如果系统进入中间转移状态39,则判断下一帧如果Vflag=1,则回到射频正常运行状态7,如果Vflag=0,则进入射频低功耗运行状态9。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种电子耳蜗,该电子耳蜗利用预处理模块对输入的声信号进行预处理,经过电子耳蜗言语处理中编码策略前段的分频带处理后,输入的每一帧信号变成N个子带信号的输出,其特征在于,
该电子耳蜗还包括:多子带信噪比统计分析模块、参考噪声的统计信息更新模块及射频正常运行和低功耗运行的控制模块;
所述的多子带信噪比统计分析模块,用于将经预处理模块处理后的Ninit帧信号作为初始化信号,计算出每一帧信号中的每一个子带的噪声统计特性和判决门限,然后对每一帧信号是否为噪声进行判决,判决为噪声的信号送入所述的参考噪声的统计信息更新模块;同时,检测初始化信号的能量是否大于等于预先设定的噪声预警门限,如果是,则开启智能节电功能失败;如果不是,则成功开启智能节电功能;所述的Ninit帧信号中的Ninit表示帧的个数,取值范围是25≤Ninit≤50;所述的N个子带中的N表示电子耳蜗使用言语编码策略前段的分频带处理后将每一帧信号分成的子带数,取值范围是8≤N≤24;
所述的参考噪声的统计信息更新模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号对参考噪声的对应子带平均能量进行更新,并对该子带参考噪声统计特性和判决门限更新,然后,用于所述的多子带信噪比统计分析模块中帧信号是否为噪声的判决;
所述的射频正常运行和低功耗运行的控制模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号的个数和时间分布来判决电子耳蜗系统的工作方式,所述的工作方式有两种,一是开启言语编码策略后段处理且射频正常运行,二是停止言语编码策略后段处理且射频低功耗运行,其中如果该电子耳蜗系统进入所述第二种工作方式,则该系统回到初始化完成后的状态。
2.根据权利要求1所述的电子耳蜗,其特征在于,该系统还包括:辨识非噪声信号特性模块;所述的辨识非噪声信号特性模块用于检测所述的多子带信噪比统计分析模块判决为非噪声的帧信号是语音信号还是其他信号,并且把其中的非语音信号输送给所述的参考噪声的统计信息更新模块进行参考噪声信息更新,以此实现针对低方差缓变噪声的自适应调整。
3.根据权利要求2所述的电子耳蜗,其特征在于,所述的辨识非噪声信号特性模块对所述的多子带信噪比统计分析模块判决为非噪声信号的第k帧信号进行基音周期检测,然后,进行谐波搜索,最后,根据语音中浊音的谐波特性,通过对非噪声信号的基频和谐波进行提取,判断当前非噪声信号是否为语音;另外,根据预先设置的语音、电话铃声、音乐这三种声音对不同的子带进行不同的加权,用于对非噪声特性判决的辅助。
4.一种电子耳蜗的声音信号处理方法,该方法包括步骤:
步骤1):该电子耳蜗利用预处理模块对输入的声信号进行预处理,经过电子耳蜗言语处理中编码策略前段的分频带处理后,输入的每一帧信号变成N个子带信号的输出;
步骤2):通过多子带信噪比统计分析模块,把电子耳蜗经预处理模块处理后的Ninit帧信号作为初始化信号,计算出每一帧信号中的每一个子带的噪声统计特性和判决门限,然后对每一帧信号是否为噪声进行判决,判决为噪声的信号送入所述的参考噪声的统计信息更新模块;同时,检测初始化信号的能量是否大于等于预先设定的噪声预警门限,如果是,则开启智能节电功能失败;如果不是,则成功开启智能节电功能;
步骤3):通过参考噪声的统计信息更新模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号对参考噪声的对应子带平均能量进行更新,并对该子带参考噪声统计特性和判决门限更新,然后,用于所述的多子带信噪比统计分析模块中帧信号是否为噪声的判决;
步骤4):最后,通过射频正常运行和低功耗运行的控制模块,利用所述的多子带信噪比统计分析模块判决为噪声的帧信号的个数和时间分布来判决开启或停止言语编码策略后段处理及射频正常运行或低功耗运行;如果低功耗运行,系统回到初始化完成后的状态。
5.根据权利要求4所述的电子耳蜗的声音信号处理方法,其特征在于,所述的步骤2)中,
如果分频带处理后的信号为时域表现形式,则按式(1)计算其能量;其中,第i个频带的信号的时域表示为xi(k,q),i表示第i个子带,k表示第k帧信号,q表示第k帧信号中第q个采样点,0<q<NF+1;
Ex i ( t ) = &Sigma; q = 1 NF x i 2 ( k , q ) . . . ( 1 )
如果分频带处理后的信号为频域表现形式,则按式(2)计算其能量;其中,X(k,t)为第k帧信号的频域表示形式,t表示第i个子带中每个频点的坐标;
Ex i ( k ) = &Sigma; t = Ni N i + 1 - 1 X 2 ( k , t ) . . . ( 2 )
如果k>Ninit不成立,则按照式(3)滑动平均的方式计算第i个子带的平均噪声能量Eni(k);
当k>1时,Eni(k)=αExi(k)+(1-α)Eni(k-1)
当k=1时,Eni(k)=Exi(k)                        (3)
式(3)中,
Figure FDA00001732021600031
k表示第k帧信号,
在得到Eni(Ninit)后,设Thi0为预先根据特定电子耳蜗信号的增益情况设定的第i个子带的能量门限,判断如果Eni(Ninit)>Thi0成立,则系统报警,告知电子耳蜗植入者此智能节电功能初始化失败,功能开启失败;如果Eni(Ninit)>Thi0不成立,则按照式(4)计算前Ninit个帧信号的信噪比
Figure FDA00001732021600032
Figure FDA00001732021600033
式(4)中,0<k<Ninit+1;经过初始化以后,始终会保存Ninit×N个能量值;
当0<k<Ninit+1时,计算
Figure FDA00001732021600034
的方差
Figure FDA00001732021600035
合理假设
Figure FDA00001732021600036
服从均值为0的高斯分布,然后按照式(5)利用
Figure FDA00001732021600037
计算第i个子带的信噪比判决门限ηi(Ninit);
&eta; i ( Ninit ) = 2 &sigma;n i 2 ( Ninit ) &CenterDot; erfc - 1 ( 2 P FA ) - - - ( 5 )
式(5)中,PFA为虚警概率,此处设为5%,erfc-1为补余误差函数的反函数;
如果k>Ninit成立,则计算帧信号xi(k)的信噪比
Figure FDA00001732021600039
把它和最新更新的ηi(k)做比较,然后进行判断,如果
Figure FDA000017320216000310
则使第k帧第i个子带非噪声信号标志为Vflagi(k)=1;否则,Vflagi(k)=0;然后将判决结果进行下一步的子带综合分析;其中,ηi会在两种情况下进行自动更新;一是利用
Figure FDA000017320216000311
计算第i个子带的信噪比判决门限ηi(Ninit),另一是在所述的参考噪声的统计信息更新模块中实时更新判决门限ηi
N个子带都做完信噪比统计分析判决后进行对当前帧信号判决是噪声信号还是非噪声信号。
6.根据权利要求4所述的电子耳蜗的声音信号处理方法,其特征在于,所述的步骤2)中,对每一帧信号是否为噪声进行判决的步骤包括:
所述的多子带信噪比统计分析模块要判决当前帧信号中的子带是环境噪声还是非环境噪声的判决准则是:
Figure FDA000017320216000312
式(6)中,H0为当前帧信号为环境噪声,H1为当前帧信号为非环境噪声;
首先,利用式(6)对N个Vflagi进行子带综合分析,如果Vflagi(k)=1的个数M>N/2,则初步判定第k帧信号为非噪声信号,送入所述的射频正常运行和低功耗运行的控制模块来控制射频正常运行并开启言语编码策略后段,同时令全频带标志位Vflag(k)=1;如果Vflagi(k)=1的个数M<N/2,则初步判定第k帧信号为噪声信号,并送入所述的参考噪声的统计信息更新模块来更新判决门限ηi和所述的射频正常运行和低功耗运行的控制模块来控制射频低功耗运行和停止言语编码策略后段,同时令全频带标志位Vflag(k)=0。
7.根据权利要求4所述的电子耳蜗的声音信号处理方法,其特征在于,所述的步骤2)中,对每一帧信号是否为噪声进行判决的步骤包括:
对当前帧信号进行总体判断,那么按照式(7)对各个子带的
Figure FDA00001732021600041
进行总体判断:
Figure FDA00001732021600042
式(7)中,H0为当前帧信号为环境噪声,H1为当前帧信号为非环境噪声,wi为预先设定的对应每个通道的权值,1≤i≤N。
8.根据权利要求5所述的电子耳蜗的声音信号处理方法,其特征在于,所述的步骤3)中,
该系统初始化后实时保存Ninit×N个子带的能量值,所述的参考噪声的统计信息更新模块利用每一帧被所述的多子带信噪比统计分析模块判为噪声的结果对参考噪声模型进行更新,即删除Ninit个帧中的第一个,然后整体前移,再把刚才判决为噪声帧信号放在第Ninit位上,每完成Ninit/2次更新后按照式(8)用滑动平均的方式计算每一帧中的每一个子带噪声的平均能量;
当k>1时,Eni(k)=αExi(k)+(1-α)Eni(k-1)
当k=1时,Eni(k)=Exi(k)                  (8)
式(8)中,
Figure FDA00001732021600043
Eni(k)表示第k帧第i个子带的平均噪声能量;k表示第k帧信号;
计算第i个子带对应的当前帧的信噪比
Figure FDA00001732021600044
并计算第i个子带噪声的方差σni(k),并由此计算判决门限ηi(k);最后,实时更新判决门限ηi用于所述的多子带信噪比统计分析模块中。
CN2010102791038A 2010-09-10 2010-09-10 一种电子耳蜗及其声音信号处理方法 Expired - Fee Related CN101953722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102791038A CN101953722B (zh) 2010-09-10 2010-09-10 一种电子耳蜗及其声音信号处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102791038A CN101953722B (zh) 2010-09-10 2010-09-10 一种电子耳蜗及其声音信号处理方法

Publications (2)

Publication Number Publication Date
CN101953722A CN101953722A (zh) 2011-01-26
CN101953722B true CN101953722B (zh) 2012-11-21

Family

ID=43481485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102791038A Expired - Fee Related CN101953722B (zh) 2010-09-10 2010-09-10 一种电子耳蜗及其声音信号处理方法

Country Status (1)

Country Link
CN (1) CN101953722B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123947B (zh) * 2013-04-27 2017-05-31 中国科学院声学研究所 基于带限正交分量的声音编码方法和系统
CN107040858A (zh) * 2017-06-19 2017-08-11 上海市第六人民医院 一种人工耳蜗言语算法实验装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2462509Y (zh) * 2001-01-18 2001-11-28 王明堂 语音电子耳蜗
CN1896955A (zh) * 2006-05-15 2007-01-17 清华大学深圳研究生院 电子耳蜗听觉仿真平台、仿真试验方法及算法比较方法
CN101001666A (zh) * 2004-05-07 2007-07-18 先进仿生学公司 耳蜗刺激装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2462509Y (zh) * 2001-01-18 2001-11-28 王明堂 语音电子耳蜗
CN101001666A (zh) * 2004-05-07 2007-07-18 先进仿生学公司 耳蜗刺激装置
CN1896955A (zh) * 2006-05-15 2007-01-17 清华大学深圳研究生院 电子耳蜗听觉仿真平台、仿真试验方法及算法比较方法

Also Published As

Publication number Publication date
CN101953722A (zh) 2011-01-26

Similar Documents

Publication Publication Date Title
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
US9721560B2 (en) Cloud based adaptive learning for distributed sensors
CN105764018B (zh) 一种基于智能终端的自主验配助听器系统及其方法
US9412373B2 (en) Adaptive environmental context sample and update for comparing speech recognition
US9466288B2 (en) Comparing differential ZC count to database to detect expected sound
CN101599269B (zh) 语音端点检测方法及装置
US20150066498A1 (en) Analog to Information Sound Signature Detection
CN111836178A (zh) 包括关键词检测器及自我话音检测器和/或发射器的听力装置
CN106714023A (zh) 一种基于骨传导耳机的语音唤醒方法、系统及骨传导耳机
CN103903627A (zh) 一种语音数据的传输方法及装置
JP2007501444A (ja) 信号対雑音比による音声認識方法
CN107767861A (zh) 语音唤醒方法、系统及智能终端
CN106155621B (zh) 可识别声源位置的关键词语音唤醒系统及方法及移动终端
EP1933301A3 (en) Speech recognition method and system with intelligent speaker identification and adaptation
CN106161755A (zh) 一种关键词语音唤醒系统及唤醒方法及移动终端
CN111837179B (zh) 捕获噪声用于模式识别处理的系统和方法
CN103079160A (zh) 一种自动验配数字式助听器及其方法
CN205491151U (zh) 一种麦克风及移动终端
CN110673821B (zh) 一种智能设备唤醒反馈方法及智能设备
CN102052036A (zh) 声控窗控制系统及其方法
CN103901782A (zh) 一种声控方法、电子设备及声控装置
CN101953722B (zh) 一种电子耳蜗及其声音信号处理方法
CN109040905A (zh) 一种低功耗音箱及其工作方法
CN110473536A (zh) 一种唤醒方法、装置和智能设备
CN206861615U (zh) 一种烟灶联动系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121121

Termination date: 20150910

EXPY Termination of patent right or utility model