CN102496374B - 听力补偿方法 - Google Patents

听力补偿方法 Download PDF

Info

Publication number
CN102496374B
CN102496374B CN201110422710XA CN201110422710A CN102496374B CN 102496374 B CN102496374 B CN 102496374B CN 201110422710X A CN201110422710X A CN 201110422710XA CN 201110422710 A CN201110422710 A CN 201110422710A CN 102496374 B CN102496374 B CN 102496374B
Authority
CN
China
Prior art keywords
frequency
signal
noise
spectrum
compensation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110422710XA
Other languages
English (en)
Other versions
CN102496374A (zh
Inventor
梁瑞宇
许海燕
张福涛
奚吉
张卓
张学武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Campus of Hohai University
Original Assignee
Changzhou Campus of Hohai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Campus of Hohai University filed Critical Changzhou Campus of Hohai University
Priority to CN201110422710XA priority Critical patent/CN102496374B/zh
Publication of CN102496374A publication Critical patent/CN102496374A/zh
Application granted granted Critical
Publication of CN102496374B publication Critical patent/CN102496374B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种针对高频听损患者的听力补偿方法,包括:将语音信号转换为输入信号;将输入信号进行降噪以及端点检测,从而判断声音段和噪音段;将信号频谱和噪声频谱划分为六个频域,根据信号段和噪声段的不同频域的频谱的比例关系,按大小以1/2的幂次替代进行标准化;通过慢放因子从所述输入信号自适应的导出降频语音输出信号,将所述降频语音输出信号转换成降频语音。本发明的听力补偿方法方法能很好的保持汉语语音的声调信息,提高听障患者对汉语语音的理解度,相对于现有的降频技术来说,对汉语语音和环境声音的识别率平均高10%到15%。

Description

听力补偿方法
技术领域
本发明涉及一种音频信号处理的方法,特别是涉及一种针对高频听损患者的听力补偿方法。
背景技术
中国有一亿三千万人有不同程度听力损失,而其中很大一部分患者需要配带合适的助听器。高频听力损失是临床最常见的听力损失形式,中国患者中有90%的人存在高频听力损失。高频听损意味着患者感知低频声音很好,而对高频声音听不清,甚至听不到。但是,在语言中,清辅音一般在不低于2000Hz的高频区。这些辅音虽然只占2%的能量,但是却有56%的清晰度。缺失了这些声音,成人辨识语言困难。更严重的是,对于幼儿来说,则无法学习发音和许多语法规则,变得既聋又哑。
传统的听力增强方法是振幅放大技术,但是却不适用于高频听损患者。从技术上来说,高频处的听力损失越严重,就需要越多的增益才能获得可听性。但是,这些增益要受到回声、低频掩蔽特性或者放大系统的输出性能的限制,几乎不可能获得足够的增益。此外,高频听力损失超过70dB时,内毛细胞的功能已损失殆尽。此时,振幅放大不但对语言理解没有作用,反而会产生失真,不适及反馈啸叫。而且,由于声音的向上扩散掩蔽特性,很多助听器甚至采用降低增益的方法来降低助听器的噪声。
中国的老龄化问题日趋严重,老龄化耳聋的比例必然也不断增加。无手术危险,技术可升级的降频助听技术必然成为中国高频患者的首选技术。在国外,降频助听技术研究的较早,并形成四类主要方法:声码器、慢速回放、频率转移和频率压缩。声码器是最早的降频技术,但是生成的降频信号屏蔽了一些重要的低频信息,所以并没体现出显著的高频性能改善。最早的商业助听技术是慢速回放,其原理是以比采样速度慢的速率来播放音频信号。该技术可以保留频率成分的比例关系,但是信号在时间轴上拉伸,造成输入输出间的不同步,从而引起失真。频率转移技术的原理将高频信息转移到低频部分,并与原来低频信号相加。该技术能较好的保留谐波频率间的比例关系,但是由于频率成分间存在交叠,会屏蔽有用的低频信息。此外,还会移入不需要的高频背景噪声。同其它技术相比,比较直接的降频技术是以固定因子降低所有频率成分,称为线性压缩技术。但是研究显示该技术并没有明显改善患者的高频听力。与之对应的是非线性压缩技术,即保持低频信号不变,高频信号以较大比例压缩。由于频率信息间没有交叠,所以该技术保留了元音信号的理解度。在近期一些实验研究中,该技术体现出了较显著的听觉改善。此外,还有一些结合的方法,如幅度放大低频信号,移动中频信号,非线性压缩高频信号,也取得了一些成果。
上述研究虽然获得了一些成果,针对听障患者的测试取得了一些有益的反馈。首先,从算法原理上看,频率转移技术和频率压缩技术是将高频信息以不同方式搬移到截止频率以下的低频区。但是,对于重度听力患者,其截止频率一般在1000Hz到2500Hz之间,这意味着要转移或压缩的高频区域是低频区的2倍以上(语音频率在8000Hz以下)。这些频率区域必然要进行取舍,但是不同的声音,其频率的分布不同,目前还没有一种方法来进行取舍。其次,上述这些方法只是针对母语为英语的患者进行测试,针对汉语的降频技术的报道多为综述或介绍性的论文。然而,研究表明,汉语和英语各有特点,在听觉感知过程中有很大差别。首先,英语是语调语言,而汉语是声调语言。声调信息是汉语的重要组成部分,对提高汉语语言的可懂度有重要贡献。其次,汉语中包含较多的清辅音,而清辅音虽然能量较少,但频率较高,无法被高频听损患者感知。其次,像汉语中的/j/、/q/、/x/,在英语中并无相同发音。
由此可见,上述现有的降频助听技术,显然仍存在有不便与缺陷,而亟待加以进一步改进。为了解决降频助听技术存在的问题,相关领域技术人员莫不费尽心思来谋求解决之道,但长久以来一直未见适用的方法被发展完成,而一般现有的降频助听技术又不能适切的解决上述问题,此显然是相关业者急欲解决的问题。
发明内容
本发明的主要目的在于,克服现有的降频助听技术存在的缺陷,而提供一种新型的针对高频听损患者的听力补偿方法,所要解决的技术问题是使其能够在保证可听的情况下,维持声音的自然度,从而更加适于实用,且具有产业上的利用价值。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。依据本发明提出的一种针对高频听损患者的听力补偿方法,包括:
将语音信号转换为输入信号;
将输入信号进行降噪以及端点检测,从而判断声音段和噪音段;
将信号频谱和噪声频谱划分为六个频域:0Hz~250Hz,250Hz~500Hz,500Hz~1000Hz,1000Hz~2000Hz,2000Hz~4000Hz和4000Hz~8000Hz,根据信号段和噪声段的不同频域的频谱的比例关系,按大小以1/2的幂次替代进行标准化;
通过慢放因子从所述输入信号自适应的导出降频语音输出信号,将所述降频语音输出信号转换成降频语音。
前述的听力补偿方法,其中,所述语音信号通过傅里叶变换为所述输入信号。
前述的听力补偿方法,其中,所述降频语音输出信号通过傅里叶反变换为所述降频语音。
前述的听力补偿方法,所述慢放因子
Figure GDA0000370387140000031
yi和yJ表示信号频谱的归一化幅度(i和J代表不同的频域),J代表截止频率所在的频域,ci和cJ表示人耳对不同声音区域所需的慢放比例,此处,J+2代表忽略高于截止频率的第一个频带对慢放因子的影响。
借由上述技术方案,本发明听力补偿方法至少具有下列优点:
1、本发明的听力补偿方法能很好的保持汉语语音的声调信息,提高听障患者对汉语语音的理解度。
2、本发明的听力补偿方法能自适应的调节慢放因子,在保证可听的情况下,维持声音的自然度。
3、本发明提出的方法对于传统降频方法无法改善的高频声音,保持较高的声音识别率。
综上所述,本发明的听力补偿方法,能够在保证可听的情况下,维持声音的自然度。其具有上述诸多的优点及实用价值,并在同类方法中未见有类似的设计公开发表或使用而确属创新,具有较大的改进,在技术上有较大的进步,并产生了好用及实用的效果,且较现有的降频助听技术具有增进的多项功效,从而更加适于实用,而具有产业的广泛利用价值,诚为一新颖、进步、实用的新设计。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
图1为本发明所述的听力补偿方法的流程图;
图2为不同噪声的平均识别率。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的听力补偿方法其具体实施方式、结构、特征及其功效,详细说明如后。
请参阅图1所示,本发明较佳实施例的听力补偿方法,包括:
首先将语音信号通过傅里叶变换为输入信号;
然后将输入信号进行降噪以及端点检测,从而判断声音段和噪音段;
将信号频谱和噪声频谱划分为六个频域:0Hz~250Hz,250Hz~500Hz,500Hz~1000Hz,1000Hz~2000Hz,2000Hz~4000Hz和4000Hz~8000Hz,根据信号段和噪声段的不同频域的频谱的比例关系,按大小以1/2的幂次替代进行标准化;
最后通过慢放因子从所述输入信号自适应的导出降频语音输出信号,降频语音输出信号通过傅里叶反变换为降频语音。
慢放因子
Figure GDA0000370387140000051
yi和yJ表示信号频谱的归一化幅度(i和J代表不同的频域),J代表截止频率所在的频域,ci和cJ表示人耳对不同声音区域所需的慢放比例,此处,J+2代表忽略高于截止频率的第一个频带对慢放因子的影响。
图2为不同信噪比下,各种背景噪声下的声音平均识别率。十五种噪声为:十五种噪声的类型为:1为时速190海里的喷气飞机,2为时速450海里的喷气飞机,3为驱逐舰引擎,4为驱逐舰操作间,5为F16座舱,6为第一工厂车间1,7为第二工厂车间,8为高频信道,9为机枪,10为军用车辆,11为粉红噪声,12为乱糟糟的语音,13为坦克,14为车辆内部,15为白噪声。由图可知,白噪声15的频谱分布均匀,对识别率的影响适中,这说明在信噪比相同的情况下,每个区域对识别率的干扰是不同的。机枪噪声9、军用车辆10和车辆内部噪声14对识别率的影响较低,相比于其它噪声识别率至少高15%,其频谱分布较单一,且都集中在500Hz以下的低频区域;识别最差的是高频信道8噪声,其频谱主要集中在250到4000Hz之间,且各频域的比例几乎相同,而人类对500Hz到3000Hz的频率范围最敏感。从其它噪声也可以看出,频域3和频域4的能量高,其识别率就低。虽然识别率也有起伏,如粉红噪声11与F16座舱噪声5相似,识别率差别也在15%之内。
上述的本发明的听力补偿方法的技术创新,对于现今同行业的技术人员来说均具有许多可取之处,而确实具有技术进步性。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (1)

1.一种针对高频听损患者的听力补偿方法,其特征在于包括:
将语音信号通过傅里叶变换转换为输入信号;将输入信号进行降噪以及端点检测,判断声音段和噪音段;
将信号频谱和噪声频谱划分为六个频域:0Hz~250Hz,250Hz~500Hz,500Hz~1000Hz,1000Hz~2000Hz,2000Hz~4000Hz和4000Hz~8000Hz,根据信号段和噪声段的不同频域的频谱的比例关系,按大小以1/2的幂次替代进行标准化;
通过慢放因子从按大小以1/2的幂次替代进行标准化后的输入信号自适应的导出降频语音输出信号,将所述降频语音输出信号通过傅里叶反变换转换成降频语音
所述慢放因子
Figure FDA0000370387130000011
其中yi和yJ表示信号频谱的归一化幅度,i和J代表不同的频域,J代表截止频率所在的频域,ci和CJ表示人耳对不同声音区域所需的慢放比例,此处,J+2代表忽略高于截止频率的第一个频带对慢放因子的影响。
CN201110422710XA 2011-12-16 2011-12-16 听力补偿方法 Expired - Fee Related CN102496374B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110422710XA CN102496374B (zh) 2011-12-16 2011-12-16 听力补偿方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110422710XA CN102496374B (zh) 2011-12-16 2011-12-16 听力补偿方法

Publications (2)

Publication Number Publication Date
CN102496374A CN102496374A (zh) 2012-06-13
CN102496374B true CN102496374B (zh) 2013-11-20

Family

ID=46188191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110422710XA Expired - Fee Related CN102496374B (zh) 2011-12-16 2011-12-16 听力补偿方法

Country Status (1)

Country Link
CN (1) CN102496374B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI603627B (zh) * 2015-07-03 2017-10-21 元鼎音訊股份有限公司 處理聲音段之方法及其電腦程式產品及助聽器

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427433A (zh) * 2013-08-20 2015-03-18 杨国屏 声音处理的方法及开放式播音装置
CN104510492A (zh) * 2013-10-06 2015-04-15 吴伟 不可听信号的听诊方法及装置
CN106157978B (zh) * 2015-04-15 2020-04-07 宏碁股份有限公司 语音信号处理装置及语音信号处理方法
CN106157966B (zh) * 2015-04-15 2019-08-13 宏碁股份有限公司 语音信号处理装置及语音信号处理方法
CN106686490A (zh) * 2016-12-20 2017-05-17 安徽乐年健康养老产业有限公司 一种语音采集处理方法
CN106714037A (zh) * 2016-12-20 2017-05-24 安徽乐年健康养老产业有限公司 一种适用于老人的声音采集装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Preliminary results of a novel enhancement method for high-frequency hearing loss;Umut Arioza,, Kemal Arda, Umit Tuncel;《computer methods and programs in biomedicine》;20110630;正文 *
Umut Arioza,, Kemal Arda, Umit Tuncel.Preliminary results of a novel enhancement method for high-frequency hearing loss.《computer methods and programs in biomedicine》.2011,
梁瑞宇,奚吉,张学武.数字助听器发展现状及其算法综述.《信息化研究》.2011, *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI603627B (zh) * 2015-07-03 2017-10-21 元鼎音訊股份有限公司 處理聲音段之方法及其電腦程式產品及助聽器

Also Published As

Publication number Publication date
CN102496374A (zh) 2012-06-13

Similar Documents

Publication Publication Date Title
CN102496374B (zh) 听力补偿方法
Zorila et al. Speech-in-noise intelligibility improvement based on spectral shaping and dynamic range compression
Healy et al. An algorithm to improve speech recognition in noise for hearing-impaired listeners
Cooke et al. Intelligibility-enhancing speech modifications: the hurricane challenge.
Taal et al. A speech preprocessing strategy for intelligibility improvement in noise based on a perceptual distortion measure
CN1416564A (zh) 减噪仪器及方法
Krause et al. Evaluating the role of spectral and envelope characteristics in the intelligibility advantage of clear speech
TWI504282B (zh) 增加聽障者聽到聲音正確性之方法及助聽器
Lin et al. Subband noise estimation for speech enhancement using a perceptual Wiener filter
JP5654955B2 (ja) 直接音抽出装置および残響音抽出装置
Monson et al. On the use of the TIMIT, QuickSIN, NU-6, and other widely used bandlimited speech materials for speech perception experiments
KR100956167B1 (ko) 한국어 주파수 특성에 맞는 다채널 디지털 보청기의 채널설정방법 및 이를 이용한 다채널 디지털 보청기
Arai et al. Effective speech processing for various impaired listeners
CN104703108A (zh) 一种处于噪声条件下的数字助听器宽动态压缩算法
CN103201793A (zh) 基于语音通信的干扰噪声去除方法和系统
JP5547414B2 (ja) 音声信号調整装置及びその調整方法
Zorila et al. Effectiveness of Near-End Speech Enhancement Under Equal-Loudness and Equal-Level Constraints.
Zorila et al. On the Quality and Intelligibility of Noisy Speech Processed for Near-End Listening Enhancement.
Wang et al. Sub-band noise reduction in multi-channel digital hearing aid
Ngo et al. An integrated approach for noise reduction and dynamic range compression in hearing aids
Hodoshima et al. Intelligibility of speech spoken in noise and reverberation
Hodoshima et al. Enhancing temporal dynamics of speech to improve intelligibility in reverberant environments
Miyauchi̐ et al. A preprocessing technique for improving speech intelligibility in reverberant environments: The effect of steady-state suppression on elderly people.
Hazan et al. Enhancing information-rich regions of natural vcv and sentence materials presented in noise
JPH0956000A (ja) 補聴器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131120

Termination date: 20161216

CF01 Termination of patent right due to non-payment of annual fee