CN113259827A - 基于音频编解码的助听方法、系统、耳机、介质及设备 - Google Patents
基于音频编解码的助听方法、系统、耳机、介质及设备 Download PDFInfo
- Publication number
- CN113259827A CN113259827A CN202110715703.2A CN202110715703A CN113259827A CN 113259827 A CN113259827 A CN 113259827A CN 202110715703 A CN202110715703 A CN 202110715703A CN 113259827 A CN113259827 A CN 113259827A
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency band
- hearing
- khz
- optimized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了一种基于音频编解码的助听方法、系统、耳机、介质及设备,属于音频编解码技术领域。该方法主要包括:在音频编码和/或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和/或正常收听频段的多个分段;根据听觉缺陷频段的听力损失程度,对多个分段进行音频增益处理或频段变更处理,得到优化频段音频;以及将优化频段音频继续进行音频编码和/或解码的后续步骤,以使用户收听到完整的原始音频。通过提供不同的助听方案,根据用户选择的助听方案,对原始音频进行分段,根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理或频段变更处理,以获得优化频段音频,使得用户听到完整的原始音频的内容,达到助听效果。
Description
技术领域
本申请涉及音频编解码技术领域,特别涉及一种基于音频编解码的助听方法、系统、耳机、介质及设备。
背景技术
传统的助听器设备体积较大且设备昂贵,而且有部分人只是听力有些损失,并不愿意佩戴助听器但又有改善听力的意愿。
在现有技术中有两种典型的听力损失及应对方法:一是在某些频段上受损,可以通过修改对应频段的增益来改善;二是在某些频段上受损特别严重,以至于上述方法没有效果,譬如说某些老年人在高频损失很严重,有研究认为当高频听力损失大于60dB时,放大这些频段的声音不但不能改善语言的识别,反而会产生负面效果。有效的做法是将输入音频信号的带宽,匹配到听障人士残余的还具敏感性的有限频带上,即移频压缩算法来改善。上述两种方法的应用,在传统的助听解决方案中,主要是在音频通路上增加上述解决方案,虽然效果不错,但导致系统运算需求增大引起功耗增加,同时增加了系统的时延导致用户体验降低。
发明内容
针对现有技术存在的系统运算需求增大引起功耗增加,同时增加了系统的时延导致用户体验降低问题,本申请主要提供一种基于音频编解码的助听方法、系统、耳机、介质及设备。
为了实现上述目的,本申请采用的一个技术方案是:提供一种基于音频编解码的助听方法,其包括:在音频编码和、或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和、或正常收听频段的多个分段;根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理和、或频段变更处理,得到优化频段音频;以及将优化频段音频继续进行音频编码和、或解码的后续步骤,以使用户收听到完整的原始音频。
本申请采用的另一个技术方案是:提供一种基于音频编解码的助听系统,其包括:音频分段模块,其用于在音频编码和、或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和、或正常收听频段的多个分段;音频处理模块,其用于根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理和、或频段变更处理,得到优化频段音频;以及音频编解码后续模块,其用于将优化频段音频继续进行音频编码和、或解码的后续步骤,以使用户收听到完整的原始音频。
本申请采用的另一个技术方案是:提供一种基于音频编解码的助听耳机,其包括:基于音频编解码的助听系统,其中基于音频编解码的助听系统包括,音频分段模块,其用于在音频编码和、或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和、或正常收听频段的多个分段;音频处理模块,其用于根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理和、或频段变更处理,得到优化频段音频;以及音频编解码后续模块,其用于将优化频段音频继续进行音频编码和、或解码的后续步骤,以使用户收听到完整的原始音频。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行方案一中的基于音频编解码的助听方法。
本申请采用的另一个技术方案是:提供一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行方案一中的基于音频编解码的助听方法。
本申请的技术方案可以达到的有益效果是:本申请设计了一种基于音频编解码的助听方法、系统、耳机、介质及设备。该方法:通过提供不同的助听方案,根据用户选择的助听方案,对原始音频进行分段,根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理或频段变更处理,以获得优化频段音频,使得用于用户听到完整的原始音频的内容,达到助听效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种基于音频编解码的助听方法的一个具体实施方式的示意图;
图2是本申请一种基于音频编解码的助听方法的一个具体实例的流程示意图;
图3是本申请一种基于音频编解码的助听方法的一个具体实例的流程示意图;
图4是本申请一种基于音频编解码的助听方法中方案选择的一个具体实例的流程示意图;
图5是本申请一种基于音频编解码的助听系统的一个具体实施方式的示意图;
图6是本申请一种基于音频编解码的助听系统的一个具体实例的流程示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
传统的助听器设备体积较大且设备昂贵,而且有部分人只是听力有些损失,并不愿意佩戴助听器但又有改善听力的意愿。在现有技术中有两种典型的听力损失及应对方法:一是在某些频段上受损,可以通过修改对应频段的增益来改善;二是在某些频段上受损特别严重,以至于上述方法没有效果,譬如说某些老年人在高频损失很严重,有研究认为当高频听力损失大于60dB时,放大这些频段的声音不但不能改善语言的识别,反而会产生负面效果。有效的做法是将输入音频信号的带宽,匹配到听障人士残余的还具敏感性的有限频带上,即移频压缩算法来改善。上述两种方法的应用,在传统的助听解决方案中,主要是在音频通路上增加上述解决方案,虽然效果不错,但导致系统运算需求增大引起功耗增加,同时增加了系统的时延导致用户体验降低。
本申请的适用场景为:用蓝牙发射器(譬如手机)播放音乐、视频或广播,通过具备助听功能的LC3编码器编码并通过蓝牙传输,用户使用蓝牙耳机或类似的设备收听,有助于用户听懂;或用蓝牙发射器(譬如手机)的麦克风,收集声音并处理(降噪、编码),在蓝牙接收器(譬如蓝牙耳机)上收听,可以有效的改善听觉效果。
本申请的发明构思是:通过提供不同的助听方案,根据用户选择的助听方案,对原始音频进行分段,根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理或频段变更处理,以获得优化频段音频,使得用于用户听到完整的原始音频的内容,达到助听效果。其中,当听觉缺陷频段的听力损失小于或等于预设听力阈值时,对多个分段进行音频增益处理,得到优化频段音频;当听觉缺陷频段的听力损失大于预设听力阈值时,对多个分段进行频段变更处理,得到优化频段音频,频段变更处理包括移频处理和、或压缩处理。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请一种基于音频编解码的助听方法的一个具体实施方式。
在图1所示的具体实施方式中,基于音频编解码的助听方法主要包括:
步骤S101,在音频编码和、或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和、或正常收听频段的多个分段;步骤S102,根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理或频段变更处理,得到优化频段音频;以及步骤S103,将优化频段音频继续进行音频编码和、或解码的后续步骤,以使用户收听到完整的原始音频。
在该具体实施方式中,在音频编码过程中,根据图2所示的编码流程图,对输入音频编码器的音频数据(PCM)进行低延迟改进型离散余弦变换;在助听模块首先将经低延迟改进型离散余弦变换而获得的频谱数据进行分段;再对多个分段进行音频增益处理或频段变更处理,得到优化频段音频;对优化频段音频分别根据图2的流程进行变换域噪声整形、时域噪声整形、量化、噪声电平估计、算术编码残差编码、码流封装等步骤,以使音频数据编码完成、输出,后续解码器直接进行解码输出,以使听障用户听到完整的音频数据,达到助听效果。
在该具体实施方式中,在音频解码过程中,根据图3所示的解码流程图,对输入音频解码器的码流进行算术解码残差解码、噪声填充、全局增益、时域噪声整形解码、变换域噪声整形解码等步骤;在助听模块首先将码流进行分段;再对多个分段进行音频增益处理或频段变更处理,得到优化频段音频;对优化频段音频分别根据图3的流程进行低延迟改进型离散余弦反变换、长期后置滤波解码步骤,完成解码,从而获得音频数据,以使听障用户听到完整的音频数据,达到助听效果。
需要说明的是,可以根据预先设置的高频、中频、低频范围,对频谱数据进行分段,将频谱数据分为高频频段、中频频段、低频频段;或根据音频编解码过程中对子带进行划分的方式,使得频谱数据的分段得以完成;本申请在实施过程中可根据用户的实际情况进行具体分段,在分段的过程中包括但不限于使用上述方式,只需使得分段方便后续的音频增益处理和、或频段变更处理即可。
在本申请的一个具体实施例中,根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理和、或频段变更处理,得到优化频段音频,包括:判断听觉缺陷频段的听力损失程度,当听觉缺陷频段的听力损失程度小于或等于预设听力阈值时,对分段进行音频增益处理,得到优化频段音频;当听觉缺陷频段的听力损失程度大于预设听力阈值时,对分段进行频段变更处理或频段变更处理与音频增益处理,得到优化频段音频,频段变更处理包括移频处理和、或压缩处理。
该具体实施例中,利用预设听力阈值,判断听觉缺陷频段的听力损失程度,以选择相应的助听方案,来实现助听效果。当听觉缺陷频段的听力损失程度小于或等于预设听力阈值时,对多个分段进行音频增益处理,得到优化频段音频;基于修改频段增益来实现助听效果。当听觉缺陷频段的听力损失程度大于预设听力阈值时,对一个或多个分段进行频段变更处理,得到优化频段音频;基于频段变更来实现助听效果;或对多个分段进行频段变更处理与音频增益处理,以使听障用户听到完整的音频数据,达到助听效果。
优选的,可根据预先分别设置的高频、中频、低频范围,对频谱数据进行分段,当用户对中频和、或低频分段的谱系数不敏感时,可使用音频增益处理达到助听效果;当用户对高频分段的谱系数不敏感时,可使用频段变更处理达到助听效果;当用户对中频和、或低频的谱系数以及高频分段的谱系数均不敏感时,可对中频和、或低频的谱系数使用音频增益处理,对高频的谱系数使用频段变更处理达到助听效果。
需要说明的是,预设听力阈值可以根据用户听力受损情况设定。
在本申请的一个具体实例中,根据如图4所示的流程选择不同的方法以实现助听效果;当听觉缺陷频段的听力损失程度小于或等于预设听力阈值时,选择音频增益处理方法;当听觉缺陷频段的听力损失程度大于预设听力阈值时,选择频段变更处理方法,其中频段变更处理方法包括移频压缩处理、移频处理、压缩处理。
在本申请的一个具体实施例中,对分段进行音频增益处理,得到优化频段音频,包括:根据各个分段的预设频段增益,对多个分段中的音频数据分别进行计算,获得各个分段分别对应的优化频段音频。
在本申请的一个具体实例中,以16kHz采样率、10ms帧长为例,预定义NB个预设频段增益,其中预设频段增益的数量应与分段对应,当NB的取值为3,当前原始音频的分段个数为3个,其对应的预设频段增益分别为Gain1,Gain2,Gain3。当根据图2所示的流程图中的原始音频即音频数据(PCM)根据编码流程计算低延迟改进型离散余弦变换,其计算公式如下:
上述公式(1)中的NF为谱系数的数量,在本实例中NF的取值为160。则当前的多个分段可分别为[X(0),X(15)],[X(16),X(60)],[X(61),X(159)]。根据上述分段计算新的频谱,即优化频段音频;其计算方式如下:
X(k)=X(k)*Gain1;k=0,1,2…14
X(k)=X(k)*Gain2;k=15,16,17,18…59
X(k)=X(k)*Gain3;k=60,61,82,63…159
计算获得的[X(0),X(159)]即为优化频段音频,利用图2所示的编码流程图对优化频段音频进行变换域噪声整形、时域噪声整形、量化、噪声电平估计、算术编码残差编码、码流封装等步骤,以使优化频段音频编码完成。优化频段音频通过蓝牙发射端发送到蓝牙接收端,蓝牙接收端收到优化频段音频并按照标准流程解码输出,输出音频的特性即具有助听功能,以达到助听效果。
需要说明的是,为了使得各个分段对应的频段之间的过渡更平滑,在频段过渡的谱系数上应用增益时也可以采用滑动平均(Moving Average)等平滑方法。
在本申请的一个具体实施例中,对分段进行频段变更处理,得到优化频段音频,包括:根据第一预设压缩比,对听觉缺陷频段的音频数据进行压缩处理,获得第一预设目标频段数据;将正常收听频段的音频数据与第一预设目标频段数据进行叠加,获得优化频段音频。
在该具体实施例中,以16kHz采样率、10ms帧长为例,可根据预设听力阈值对原始音频进行分段,将小于或等于预设听力阈值的谱系数分为正常收听频段,将大于预设听力阈值的谱系数分为听力缺陷频段。当预设听力阈值为X(79)对应的谱系数时,将原始音频对应的谱系数分为[X(0),X(79)],[X(80),X(159)];其中[X(0),X(79)]为正常收听频段,[X(80),X(159)]为听力缺陷频段,计算听力缺陷频段与第一预设目标频段的第一预设压缩比,并根据第一预设压缩比对听力缺陷频段的谱系数进行压缩,第一预设目标频段数据;将正常收听频段的音频数据与第一预设目标频段数据进行叠加,获得的[X(0),X(159)]即为优化频段音频,其中[X(80),X(159)]的谱系数均为0。
在本申请的一个具体实例中,针对0kHz~2kHz的分段[X(0),X(39)],2kHz~4kHz的分段[X(40),X(79)],4kHz~6kHz的分段[X(80),X(119)],6kHz~8kHz的分段[X(120),X(159)];若用户对4kHz~8kHz的谱系数不敏感,则可将4kHz~8kHz频段的谱系数移频压缩到2kHz~4kHz频段,其压缩比为2:1。根据压缩比对听力缺陷频段的谱系数进行移频压缩,其移频压缩的过程如下:
利用for(ii=40;ii<80;ii++){X_Compression[ii]=X[80+2*(ii-40)]+X[80+(2*(ii-40)+1)]的方式使得4kHz~8kHz频段的谱系数移频压缩到2kHz~4kHz频段;其中,ii表示为4kHz~8kHz频段谱系数的谱线序号,X_Compression[ii]表示为第一预设目标频段数据。在移频压缩过程中,将4kHz~8kHz频段中的谱系数X[80]与谱系数X[81]进行压缩,并移频至第一预设目标频段中谱线序号为40的谱系数中,即X_Compression[40]=X[80]+X[81];将4kHz~8kHz频段中的谱系数X[82]与谱系数X[83]进行压缩,并移频至第一预设目标频段中谱线序号为41的谱系数中,即X_Compression[41]=X[82]+X[83];以此类推,直至将4kHz~8kHz频段中的谱系数X[158]与谱系数X[159]进行压缩,并移频至第一预设目标频段中谱线序号为79的谱系数中,即X_Compression[79]=X[158]+X[159];使得4kHz~8kHz频段中的所有谱系数均压缩并移频至第一预设目标频段。需要说明的是,在此过程中,0kHz~2kHz频段以及2kHz~4kHz频段的谱系数不进行处理;并且在压缩并移频步骤完成后将原始4kHz~8kHz频段的谱系数清零。将上述移频压缩获得的第一预设目标频段数据与0KHz~8KHz频段的谱系数进行叠加,即根据谱线序列号,将谱线序列号一致的第一预设目标频段数据与听力缺陷频段的谱系数进行叠加,以获得优化频段音频。
在本申请的一个具体实例中,针对0kHz~2kHz的分段[X(0),X(39)],2kHz~4kHz的分段[X(40),X(79)],4kHz~6kHz的分段[X(80),X(119)],6kHz~8kHz的分段[X(120),X(159)];当预设听力阈值为X(119)对应的谱系数时,即用户对6kHz~8kHz频段的谱系数不敏感,则可以将4kHz~8kHz频段中的谱系数压缩到4kHz~6kHz频段,其压缩比为2:1。根据压缩比对频段4kHz~8kHz频段的谱系数进行压缩,其压缩的过程如下:
利用for(ii=80;ii<120;ii++){X_Compression[ii]=X[ii]+X[ii+40]的方式,根据压缩比对4kHz~8kHz频段中的谱系数进行压缩,使得4kHz~8kHz频段中的谱系数压缩到4kHz~6kHz频段;其中,ii表示为4kHz~8kHz频段谱系数的谱线序号,X_Compression[ii]表示为第一预设目标频段数据。在压缩过程中,将4kHz~8kHz频段中的谱系数X[80]与谱系数X[120]进行压缩,并移频至第一预设目标频段中谱线序号为80的谱系数中,即X_Compression[80]=X[80]+X[120];将4kHz~8kHz频段中的谱系数X[81]与谱系数X[121]进行压缩,并移频至第一预设目标频段中谱线序号为81的谱系数中,即X_Compression[81]=X[81]+X[121];以此类推,直至将4kHz~8kHz频段中的谱系数X[119]与谱系数X[159]一并进行压缩,并移频至第一预设目标频段中谱线序号为119的谱系数中,即X_Compression[119]=X[119]+X[159];使得4kHz~8kHz频段中的所有谱系数均压缩并移频至第一预设目标频段。需要说明的是,在此过程中,0kHz~2kHz频段以及2kHz~4kHz频段的谱系数不进行处理;并且在移频压缩步骤完成后将原始6kHz~8kHz频段的谱系数清零。将上述移频压缩获得的第一预设目标频段数据与0kHz~8kHz频段的谱系数进行叠加,即根据谱线序列号,将谱线序列号一致的第一预设目标频段数据与听力缺陷频段的谱系数进行叠加,以获得优化频段音频。
在本申请的一个具体实施例中,对分段进行频段变更处理,得到优化频段音频,还包括:根据第二预设目标频段,对听觉缺陷频段的音频数据进行移频处理,获得第二预设目标频段数据,其中第二预设目标频段在原始音频所在的频段内;将正常收听频段的音频数据与第二预设目标频段数据进行叠加,获得优化频段音频。
在本申请的一个具体实例中,针对0kHz~2kHz的分段[X(0),X(39)],2kHz~4kHz的分段[X(40),X(79)],4kHz~6kHz的分段[X(80),X(119)],6kHz~8kHz的分段[X(120),X(159)];当预设听力阈值为X(79)对应的谱系数时,即用户对4kHz~8kHz频段的谱系数不敏感,则可以直接将4kHz~8kHz频段中的谱系数移频到0kHz~4kHz频段。其移频的过程如下:
利用for(ii=0;ii<80;ii++){X_Compression[ii]=X[80+ii]的方式,将4kHz~8kHz频段的谱系数移频到0kHz~4kHz频段的谱系数中,其中,ii表示为4kHz~8kHz频段谱系数的谱线序号,X_Compression[ii]表示为第二预设目标频段数据。在移频过程中,将4kHz~8kHz频段中的谱系数X[80]移频至第二预设目标频段中谱线序号为0的谱系数中,即X_Compression[0]=X[80];将4kHz~8kHz频段中的谱系数X[81]移频至第二预设目标频段中谱线序号为1的谱系数中,即X_Compression[1]=X[81];以此类推,直至将4kHz~8kHz频段中的谱系数X[159]移频至第二预设目标频段中谱线序号为79的谱系数中,即X_Compression[79]=X[159];使得4kHz~8kHz频段中的所有谱系数均移频至第二预设目标频段。需要说明的是,移频步骤完成后将原始4kHz~8kHz频段的谱系数清零。将上述移频获得的第二预设目标频段数据与0kHz~8kHz频段的谱系数进行叠加,即根据谱线序列号,将谱线序列号一致的第二预设目标频段数据与听力缺陷频段的谱系数进行叠加,以获得优化频段音频。
在本申请的一个具体实施例中,对原始音频进行分段,获得包括听觉缺陷频段的多个分段,包括:根据预设分段数量与预设分段区间,对原始音频进行分段,获得多个分段,其中预设分段数量与预设分段区间均根据历史数据或自定义获得。
该具体实施例中,预设分段数量与预设分段区间由相关的专业人员对听力受损人员测试得到;或自定义,由使用者自己根据产品的APP的图形界面来手动调节,APP可以是安装在蓝牙发射端(譬如PC机、安卓或iOS设备)设备上的。
本申请提供的基于音频编解码的助听方法,基于现有的蓝牙技术和音频编码技术即可实现助听功能(譬如手机加上蓝牙耳机),与助听器相比,体积小佩戴方便且成本低;在编码器内部实现,只需要增加极少量的运算,而且没有增加系统延迟。
需要说明的是,本申请提供的基于音频编解码的助听方法在传统蓝牙与低功耗蓝牙中均适用。
在本申请的一个具体实例中,针对0kHz~2kHz的分段[X(0),X(39)],2kHz~4kHz的分段[X(40),X(79)],4kHz~6kHz的分段[X(80),X(119)],6kHz~8kHz的分段[X(120),X(159)];当用户对2kHz~4kHz频段以及4kHz~8kHz频段均不敏感,则可根据预设频段增益对2kHz~4kHz频段的谱系数和、或0kHz~2kHz以及频段的谱系数进行音频增益处理,并根据第一预设压缩比,将4kHz~8kHz频段的谱系数移频并压缩至第一预设目标频段,即0kHz~2kHz频段。其具体过程如下:
利用for(ii=0;ii<40;ii++){X_Compression[ii]=X[80+2*ii]+X[80+(2*ii+1)]的方式,使得4kHz~8kHz频段的谱系数移频压缩到0kHz~2kHz频段;其中,ii表示为4kHz~8kHz频段谱系数的谱线序号,X_Compression[ii]表示为第一预设目标频段数据。在移频压缩过程中,将4kHz~8kHz频段中的谱系数X[80]与谱系数X[81]进行压缩,并移频至第一预设目标频段中谱线序号为0的谱系数中,即X_Compression[0]=X[80]+X[81];将4kHz~8kHz频段中的谱系数X[82]与谱系数X[83]进行压缩,并移频至第一预设目标频段中谱线序号为1的谱系数中,即X_Compression[1]=X[82]+X[83];以此类推,直至将4kHz~8kHz频段中的谱系数X[158]与谱系数X[159]进行压缩,并移频至第一预设目标频段中谱线序号为39的谱系数中,即X_Compression[39]=X[158]+X[159];使得4kHz~8kHz频段中的所有谱系数均压缩并移频至第一预设目标频段。需要说明的是,在此过程中,对0kHz~2kHz频段和、或2kHz~4kHz频段的谱系数根据预设频段增益进行音频增益处理;并且在移频压缩步骤完成后将原始4kHz~8kHz频段的谱系数清零。将上述移频压缩获得的第一预设目标频段数据与经音频增益处理的0kHz~2kHz频段的谱系数和、或2kHz~4kHz频段的谱系数进行叠加,即根据谱线序列号,将谱线序列号一致的第一预设目标频段数据与经音频增益的谱系数和、或正常收听频段的谱系数进行叠加,以获得优化频段音频;其中若对0kHz~2kHz频段的谱系数进行音频增益处理,则将移频压缩获得的第一预设目标频段数据、经音频增益处理的0kHz~2kHz频段的谱系数以及正常收听频段2kHz~4kHz频段的谱系数根据谱线序列号进行叠加,以获得优化频段音频;若对0kHz~4kHz频段的谱系数进行音频增益处理,则将移频压缩获得的第一预设目标频段数据与经音频增益处理的0kHz~4kHz频段的谱系数根据谱线序列号进行叠加,以获得优化频段音频。
图5示出了本申请一种基于音频编解码的助听系统的具体实施方式。
在图5所示的具体实施方式中,基于音频编解码的助听系统主要包括:模块501的音频分段模块,其用于在音频编码和、或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和、或正常收听频段的多个分段;模块502的音频处理模块,其用于根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理和、或频段变更处理,得到优化频段音频;以及模块503的音频编解码后续模块,其用于将优化频段音频继续进行音频编码和、或解码的后续步骤,以使用户收听到完整的原始音频。
在本申请的一个具体实例中,根据图6所示的流程示意图,将助听模块设置在蓝牙音频编码器中,以实现助听效果。其具体步骤为提供不同的助听方案,用户根据不同的助听方案选定适用于自身的助听方案,方案选定后,具有助听功能的蓝牙音频编码器根据该方案的操作步骤对输入音频进行相应的处理,获得优化频段音频,并根据具有助听功能的蓝牙音频编码器中的步骤将优化频段音频编码,编码的优化频段音频通过蓝牙传输至蓝牙音频解码器,通过蓝牙音频解码器对优化频段音频进行解码,以使用户收听到完整音频。
本申请提供的基于音频编解码的助听系统,可用于执行上述任一实施例描述的基于音频编解码的助听方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个具体实施方式中,提供一种基于音频编解码的助听耳机,其包括:基于音频编解码的助听系统,其中基于音频编解码的助听系统包括,音频分段模块,其用于在音频编码和、或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和、或正常收听频段的多个分段;音频处理模块,其用于根据听觉缺陷频段的听力损失程度,对分段进行音频增益处理和、或频段变更处理,得到优化频段音频;以及音频编解码后续模块,其用于将优化频段音频继续进行音频编码和、或解码的后续步骤,以使用户收听到完整的原始音频。
在该具体实施方式中,在基于音频编解码技术的耳机所在系统中添加助听模块,使得系统成为具有助听功能的系统,基于音频编解码技术的耳机由于添加助听模块,变为基于音频编解码的助听耳机,使得用户只需佩戴本申请的助听耳机,即可实现助听效果,在减少成本的同时挺高用户体验。
在本申请的一个具体实施例中,本申请的基于音频编解码的助听耳机中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请提供的基于音频编解码的助听耳机,可用于执行上述任一实施例描述的基于音频编解码的助听方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述实施例中描述的基于音频编解码的助听方法。
在本申请的一个具体实施方式中,一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行上述实施例中描述的基于音频编解码的助听方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于音频编解码的助听方法,其特征在于,包括:
在音频编码和/或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和/或正常收听频段的多个分段;
根据所述听觉缺陷频段的听力损失程度,对所述分段进行音频增益处理和/或频段变更处理,得到优化频段音频;以及
将所述优化频段音频继续进行所述音频编码和/或解码的后续步骤,以使用户收听到完整的所述原始音频。
2.根据权利要求1所述的基于音频编解码的助听方法,其特征在于,所述根据所述听觉缺陷频段的听力损失程度,对所述分段进行音频增益处理和/或频段变更处理,得到优化频段音频,包括:
判断所述听觉缺陷频段的所述听力损失程度,当所述听觉缺陷频段的所述听力损失程度小于或等于预设听力阈值时,对所述分段进行所述音频增益处理,得到所述优化频段音频;
当所述听觉缺陷频段的所述听力损失程度大于所述预设听力阈值时,对所述分段进行所述频段变更处理或所述频段变更处理与所述音频增益处理,得到所述优化频段音频,所述频段变更处理包括移频处理和/或压缩处理。
3.根据权利要求2所述的基于音频编解码的助听方法,其特征在于,所述对所述分段进行所述音频增益处理,得到所述优化频段音频,包括:
根据各个所述分段的预设频段增益,对多个所述分段中的音频数据分别进行计算,获得所述各个分段分别对应的所述优化频段音频。
4.根据权利要求2所述的基于音频编解码的助听方法,其特征在于,所述对所述分段进行所述频段变更处理,得到所述优化频段音频,包括:
根据第一预设压缩比,对所述听觉缺陷频段的音频数据进行所述压缩处理,获得第一预设目标频段数据;
将所述正常收听频段的音频数据与所述第一预设目标频段数据进行叠加,获得所述优化频段音频。
5.根据权利要求2或4所述的基于音频编解码的助听方法,其特征在于,所述对所述分段进行所述频段变更处理,得到所述优化频段音频,还包括:
根据第二预设目标频段,对所述听觉缺陷频段的音频数据进行所述移频处理,获得第二预设目标频段数据,其中所述第二预设目标频段在所述原始音频所在的频段内;
将所述正常收听频段的音频数据与所述第二预设目标频段数据进行叠加,获得所述优化频段音频。
6.根据权利要求1所述的基于音频编解码的助听方法,其特征在于,所述对原始音频进行分段,获得包括听觉缺陷频段和/或正常收听频段的多个分段,包括:
根据预设分段数量与预设分段区间,对所述原始音频进行分段,获得多个所述分段,其中所述预设分段数量与所述预设分段区间均根据历史数据或自定义获得。
7.一种基于音频编解码的助听系统,其特征在于,包括:
音频分段模块,其用于在音频编码和/或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和/或正常收听频段的多个分段;
音频处理模块,其用于根据所述听觉缺陷频段的听力损失程度,对所述分段进行音频增益处理和/或频段变更处理,得到优化频段音频;以及
音频编解码后续模块,其用于将所述优化频段音频继续进行所述音频编码和/或解码的后续步骤,以使用户收听到完整的所述原始音频。
8.一种基于音频编解码的助听耳机,其特征在于,包括如权利要求7所述的基于音频编解码的助听系统,其中所述助听系统包括,
音频分段模块,其用于在音频编码和/或解码过程中,对原始音频进行分段,获得包括听觉缺陷频段和/或正常收听频段的多个分段;
音频处理模块,其用于根据所述听觉缺陷频段的听力损失程度,对所述分段进行音频增益处理和/或频段变更处理,得到优化频段音频;以及
音频编解码后续模块,其用于将所述优化频段音频继续进行所述音频编码和/或解码的后续步骤,以使用户收听到完整的所述原始音频。
9.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-6中任一项所述的基于音频编解码的助听方法。
10.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器进行通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机指令,所述至少一个处理器操作所述计算机指令以执行如权利要求1-6任一项所述的基于音频编解码的助听方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110715703.2A CN113259827A (zh) | 2021-06-28 | 2021-06-28 | 基于音频编解码的助听方法、系统、耳机、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110715703.2A CN113259827A (zh) | 2021-06-28 | 2021-06-28 | 基于音频编解码的助听方法、系统、耳机、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113259827A true CN113259827A (zh) | 2021-08-13 |
Family
ID=77189918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110715703.2A Pending CN113259827A (zh) | 2021-06-28 | 2021-06-28 | 基于音频编解码的助听方法、系统、耳机、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113259827A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115038024A (zh) * | 2022-06-07 | 2022-09-09 | 深圳市听多多科技有限公司 | 一种基于耳机设备的宽动态压缩助听方法及相关设备 |
CN115171709A (zh) * | 2022-09-05 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 语音编码、解码方法、装置、计算机设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413218A (zh) * | 2011-08-03 | 2012-04-11 | 宇龙计算机通信科技(深圳)有限公司 | 一种自动调节通话音质的方法、装置及通信终端 |
CN102711017A (zh) * | 2012-05-24 | 2012-10-03 | 华为软件技术有限公司 | 一种声音处理方法、装置及系统 |
US20160320840A1 (en) * | 2015-04-30 | 2016-11-03 | Samsung Electronics Co., Ltd. | Sound Outputting Apparatus, Electronic Apparatus, and Control Method Thereof |
CN108834028A (zh) * | 2017-07-14 | 2018-11-16 | 博频(上海)科技股份有限公司 | 音频播放系统 |
CN110611872A (zh) * | 2019-10-09 | 2019-12-24 | 深圳市博音科技有限公司 | 基于多频段增益补偿的自主矫正助听系统及方法 |
CN110677717A (zh) * | 2019-09-18 | 2020-01-10 | 深圳创维-Rgb电子有限公司 | 一种音频补偿方法、智能电视及存储介质 |
CN112367600A (zh) * | 2020-11-27 | 2021-02-12 | 江苏集萃智能集成电路设计技术研究所有限公司 | 一种语音处理方法及基于移动终端的助听器系统 |
CN112992159A (zh) * | 2021-05-17 | 2021-06-18 | 北京百瑞互联技术有限公司 | 一种lc3音频编解码方法、装置及存储介质 |
-
2021
- 2021-06-28 CN CN202110715703.2A patent/CN113259827A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413218A (zh) * | 2011-08-03 | 2012-04-11 | 宇龙计算机通信科技(深圳)有限公司 | 一种自动调节通话音质的方法、装置及通信终端 |
CN102711017A (zh) * | 2012-05-24 | 2012-10-03 | 华为软件技术有限公司 | 一种声音处理方法、装置及系统 |
US20160320840A1 (en) * | 2015-04-30 | 2016-11-03 | Samsung Electronics Co., Ltd. | Sound Outputting Apparatus, Electronic Apparatus, and Control Method Thereof |
CN108834028A (zh) * | 2017-07-14 | 2018-11-16 | 博频(上海)科技股份有限公司 | 音频播放系统 |
CN110677717A (zh) * | 2019-09-18 | 2020-01-10 | 深圳创维-Rgb电子有限公司 | 一种音频补偿方法、智能电视及存储介质 |
CN110611872A (zh) * | 2019-10-09 | 2019-12-24 | 深圳市博音科技有限公司 | 基于多频段增益补偿的自主矫正助听系统及方法 |
CN112367600A (zh) * | 2020-11-27 | 2021-02-12 | 江苏集萃智能集成电路设计技术研究所有限公司 | 一种语音处理方法及基于移动终端的助听器系统 |
CN112992159A (zh) * | 2021-05-17 | 2021-06-18 | 北京百瑞互联技术有限公司 | 一种lc3音频编解码方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
曾向阳等: "《声信号处理基础》", 30 September 2015 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115038024A (zh) * | 2022-06-07 | 2022-09-09 | 深圳市听多多科技有限公司 | 一种基于耳机设备的宽动态压缩助听方法及相关设备 |
CN115171709A (zh) * | 2022-09-05 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 语音编码、解码方法、装置、计算机设备和存储介质 |
CN115171709B (zh) * | 2022-09-05 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 语音编码、解码方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6633239B2 (ja) | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 | |
JP6633232B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 | |
RU2639952C2 (ru) | Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием | |
US20100169082A1 (en) | Enhancing Receiver Intelligibility in Voice Communication Devices | |
CA2705968A1 (en) | A method and an apparatus for processing a signal | |
CN106847303B (zh) | 支持谐波音频信号的带宽扩展的方法、设备和记录介质 | |
US8619999B2 (en) | Audio decoding method and apparatus | |
CN110556118B (zh) | 立体声信号的编码方法和装置 | |
CN113259827A (zh) | 基于音频编解码的助听方法、系统、耳机、介质及设备 | |
EP2671323A1 (en) | Method and apparatus for providing signal processing coefficients | |
CN112992159B (zh) | 一种lc3音频编解码方法、装置、设备及存储介质 | |
WO2017206794A1 (zh) | 一种声道间相位差参数的提取方法及装置 | |
CN114420139A (zh) | 一种下混信号的计算方法及装置 | |
CN113539277B (zh) | 一种保护听力的蓝牙音频解码方法、装置、介质及设备 | |
CN118230746A (zh) | 增强音质的音频解码方法、装置、解码器、介质及设备 | |
JP4530567B2 (ja) | デジタルオーディオ復号装置 | |
CN115527545A (zh) | 一种音频带宽扩展方法、装置、编码方法及介质 | |
Tannous | Non-uniform quantization of arbitrary signals: Applications to Speech, Audio, Photography and Cinema | |
CN116110424A (zh) | 一种语音带宽扩展方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210813 |
|
RJ01 | Rejection of invention patent application after publication |