CN102725791A - 用于音频编解码中的响度和锐度补偿的方法和设备 - Google Patents
用于音频编解码中的响度和锐度补偿的方法和设备 Download PDFInfo
- Publication number
- CN102725791A CN102725791A CN201080052229XA CN201080052229A CN102725791A CN 102725791 A CN102725791 A CN 102725791A CN 201080052229X A CN201080052229X A CN 201080052229XA CN 201080052229 A CN201080052229 A CN 201080052229A CN 102725791 A CN102725791 A CN 102725791A
- Authority
- CN
- China
- Prior art keywords
- signal
- bandwidth
- portions
- signal section
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Abstract
在改善限定在预定带宽内的重构语音信号的感知响度和锐度的方法中,执行步骤:提供(S10)语音信号,以及将提供的信号至少划分成第一信号部分和第二信号部分。随后,调整(S30)第一信号部分,以至少加强第一带宽部分内的预定频率或频率间隔。最后,至少基于第一信号部分来重构(S40)第二信号部分,以及将调整后的第一信号部分与重构的第二信号部分进行组合(S50)以提供具有整体提高的感知响度和锐度的重构语音信号。
Description
技术领域
本发明总体上涉及音频编解码,更具体地,涉及执行或支持对音频编码中的响度和锐度限制的补偿的带宽扩展方案。
背景技术
心理声学领域指的是对声音的感知的研究。这包括:人类如何听、他们的心理响应、以及音乐和声音对人类神经系统的心理影响。具体地,对于现代通信系统的开发,在新的数字音频技术的开发和现有技术的改进中,听觉系统如何处理音频激励的知识很重要。作为多媒体和广播服务中的基本组件的音频编解码器基于关于人类听觉系统的特性的知识来以低的比特率压缩音频信息,进行有效的传输和存储。另外,已经开发了用以模拟对音频质量的主观评估的客观的质量测量方案,其也很大程度上基于心理声学知识。
几乎所有现代音频编解码[1-5]都利用下述概念:仅编码和传送音频信号的部分信号频率分量,以及在解码器中重构音频信号的剩余频率。通常,仅传送信号的低频带(LB),随后借助所称的带宽扩展(BWE)来重构信号的高频带(HB)。在典型的BWE方案中,通过平移或翻转来自相邻频带的可用频率分量(通常是可用的LB)来扩展信号的频率内容。然而,由于重构信号中可以感知的某些伪音,以这种方式重构的信号不具有与原始音频信号的HB精确匹配的HB。为了最小化这些伪音的影响,在BWE方案中,通常将重构HB的增益保持为低于原始HB的增益,其导致重构信号具有修改的心理声学特性。其中最受影响的特性是对响度的感知和对锐度的感知。响度与信号强度或语音信号的声压有关。锐度与语音信号的频率上的能量分布有关,并且随着高频分量的相对增加而增大。当信号是带宽受限信号或应用了传统BWE方案时,感知的重构信号的响度和锐度与原始信号相比有所降低,这导致主观质量下降。
因此,需要能够提高感知的接收/解码信号的响度和锐度的方法和设备。
发明内容
本发明涉及改进的带宽扩展方案。
本发明的一个目的是提供用于改善感知的语音信号质量的方法和系统。
另一目的是能够改善感知的重构语音信号的响度和锐度。
一个特定目的是提供用于处理语音信号的编码器和解码器设备。
另一特定目的是提供用于处理语音信号的方法。
又一个特定目的是提供滤波器设备。
在改善限定在预定带宽内的重构语音信号的感知响度和锐度的第一方面,提供(S10)语音信号。随后,将语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分。随后,调整第一信号部分,以至少加强第一带宽部分内的预定频率或频率间隔。最后,至少基于第一信号部分来重构第二信号部分,以及将调整后的第一信号部分与重构的第二信号部分进行组合以提供具有整体提高的感知响度和锐度的重构语音信号。
在本公开的第二方面,一种用于改善限定在预定带宽内的重构语音信号的感知响度和锐度的系统包括:配置为提供语音信号的装置。另外,在系统中提供了配置为将语音信号至少划分成第一信号部分和第二信号部分的装置,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分。另外,在系统中提供了配置为调整第一信号部分以至少加强第一带宽部分内的预定频率或频率间隔的装置。最后,该系统包括配置为至少基于第一信号部分来重构第二信号部分的装置,以及配置为将调整后的第一信号部分与重构的第二信号部分进行组合以提供具有整体提高的感知响度和锐度的重构语音信号的装置。
在本公开的第三发明,一种在通信系统中用于处理限定在预定带宽内的语音信号的编码器设备包括配置为提供语音信号的装置。另外,该编码器设备包括配置为将语音信号至少划分成第一信号部分和第二信号部分的装置,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分。另外,该编码器设备包括配置为调整第一信号部分以至少加强第一带宽部分内的预定频率或频率间隔的装置,以及配置为用于向另一节点至少传送调整后的第一信号部分的装置。
在本公开的第四方面,一种在通信系统中用于处理限定在预定带宽内的语音信号的解码器设备包括配置为接收语音信号的调整后的第一信号部分的装置。所述调整后的第一信号部分源自:将提供的语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;以及最后调整第一信号部分,以至少加强第一带宽部分内的预定频率或频率间隔。另外,该解码器设备包括配置为至少基于接收的调整后的第一信号部分来重构第二信号部分的装置。最后,该解码器设备包括配置为将接收的调整后的第一信号部分与重构的第二信号部分进行组合以提供具有整体提高的感知响度和锐度的重构语音信号的装置。
在本公开的第五方面,一种在通信系统中用于处理限定在预定带宽内的语音信号的解码器设备包括配置为接收语音信号的第一信号部分的装置。该第一信号部分源自:将提供的语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分。此外,该解码器设备包括配置为调整接收的第一信号部分以至少加强第一带宽部分内的预定频率或频率间隔的装置。最后,该解码器设备包括配置为至少基于第一信号部分来重构第二信号部分的装置,以及配置为将调整后的第一信号部分与重构的第二信号部分进行组合以提供具有整体提高的感知响度和锐度的重构语音信号的装置。
在本公开的第六方面,一种在通信系统中的节点中的编码器设备中处理限定在预定带宽内的语音信号的方法,包括:提供语音信号;以及将语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分。另外,该方法包括:调整第一信号部分以至少加强第一带宽部分内的预定频率或频率间隔;以及向另一节点至少传送调整后的第一信号部分。
在本公开的第七方面,一种在通信系统中的节点中的解码器设备中处理限定在预定带宽内的语音信号的方法,包括:从另一节点接收调整后的第一信号部分。该调整后的第一信号部分源自:将提供的语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;以及调整第一信号部分以至少加强第一带宽部分内的预定频率或频率间隔。此外,该方法包括至少基于第一信号部分来重构第二信号部分,以及将调整后的第一信号部分与重构的第二信号部分进行组合以提供具有整体提高的感知响度和锐度的重构语音信号。
在本公开的第八方面,一种在通信系统中的节点中的解码器设备中处理限定在预定带宽内的语音信号的方法,包括:从另一节点接收语音信号的第一信号部分。该第一信号部分源自:将语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分。此外,该方法包括调整接收的第一信号部分以至少加强第一带宽部分内的预定频率或频率间隔;以及至少基于第一信号部分来重构第二信号部分。最后,该方法包括将调整后的第一信号部分与重构的第二信号部分进行组合以提供具有整体提高的感知响度和锐度的重构语音信号。
在本发明的第九方面,一种在通信系统中用于调整限定在预定带宽内的语音信号的滤波器设备被配置为:调整提供的语音信号的第一信号部分,以至少加强第一带宽部分内的预定频率或频率间隔,其中所述第一信号部分基于语音信号的所述预定带宽的第一带宽部分。
本发明的优点包括:通过对语音信号的一部分进行预滤波来改善重构语音信号的整体感知响度和锐度。
附图说明
通过接合附图参考下面的描述,可以最佳地理解本发明及其其他目的和优点,在附图中:
图1是根据本发明的方法的实施例的示意流程图;
图2是根据本发明的方法的另一实施例的示意流程图;
图3是图2的实施例的工作方案的示意框图;
图4是根据本发明的方法的另一实施例的示意流程图;
图5是图4的实施例的工作方案的示意框图;
图6是根据本发明的设备的实施例的方案的示意框图;
图7是示出外-中耳响应的示图;
图8是示出在现有技术与本发明的效果之间比较的示图;
图9是示出在现有技术与本发明的效果之间进行比较的聆听测试的示图;
图10是根据本发明的设备的另一实施例的方案的示意框图;
图11是本发明的实施例的方案的示意框图。
具体实施方式
本公开涉及通信系统(例如利用带宽扩展方案的系统)中的语音编码/解码,以及用于改善这种系统中的感知质量(特别是用于改善感知响度和锐度)的方法和设备。将从本发明的实施例受益的具体编解码器的示例是AMR-WB(自适应多速率宽带)编解码器。然而,利用带宽扩展的其他编解码器也将从本发明或其实施例受益。
本公开的目的是提供用于调整语音信号以改善信号(例如重构信号)的感知响度和锐度的方法和设备。已经认识到:可以仅对信号的选定部分进行调整或预滤波,使得整个信号的感知质量得到改善。通过考虑人耳的固有响应,可以针对人耳通常最敏感的那些频率来增强语音信号。因此,将使得聆听者仿佛感觉到整个重组或重构的语音信号具有改善的响度和锐度。
参考图1,将描述本发明的改善语音信号的感知响度和锐度的方法的实施例,该语音信号与限定在预定带宽内的自然语音信号对应。在该实施例中,根据本发明的方法不限于具体的节点或网络设备。
最初,提供语音信号S10。可以通过任何传统装置提供语音信号。随后,将语音信号至少划分成S20分别基于该预定带宽的第一带宽部分和第二带宽部分的第一信号部分和第二信号部分。通常,这通过将预定频带分成低频带部分(LB)和高频带部分(HB)来实现。然而,也可以执行其他带宽划分。针对本发明的一个具体示例,预定带宽与0-8.0kHz的频率间隔对应,其中0-6.4kHz的频率表征低频带,而6.4到8.0kHz的频率表征高频带。然而,也可以是其他频率间隔。随后,调整S30第一信号部分,以至少加强第一带宽部分内的预定频率或频率间隔。针对具体示例,该预定频率由内耳响应的中心频率(如3.2kHz)表征,或者是从3.2-6.4kHz的整个频率范围。最后,基于第一信号部分来重构S40第二信号部分或其表征,以及随后将调整后的第一信号部分与重构的第二信号部分进行组合S50以提供具有整体提高的感知响度和锐度的重构语音信号。
作为示例,划分后的语音信号的第一部分的调整以下述方式执行:第一信号部分的能量的至少一部分被分配给第一带宽部分内的选定频率,同时第一信号部分的能量的另一部分被分配给第一带宽部分的高频间隔或区域。以这种方式,随后重构的信号的整体感知响度和锐度与基于语音信号的未滤波或未调整的低频带而重构的语音信号相比将得到改善。
通过以针对BWE方案造成的任何损失而补偿重构信号的整体响度和锐度的方式对语音信号的可用低频带(LB)进行预滤波,可以获得改善的BWE。对重构的高频带(HB)通常不执行预滤波,因为这将增加引入的伪信号的量。术语“预滤波”用于指下述事实:在重构或重组信号之前,执行所公开的滤波或调整。因此,优选地,该滤波或调整仅应用于部分信号,但是感觉到对整个重组或重构信号的影响或改善。
调整步骤S30通常基于对低频带进行预滤波,并且重构步骤S40可以基于BWE或低通滤波。
在下面的描述中,功能步骤将被描述为分布或共享在网络中的两个节点上,如通信系统或网络中的相应的发射器和接收器节点中的编码器和解码器。因此,调整步骤S30或对划分的或选定的第一信号部分的滤波可以在传送第一信号部分或第一信号部分的表征之前或之后执行,下面将描述其细节。
参考图2,描述了一个方法实施例,其中在第一网络节点的解码器或接收器设备中执行对语音信号的第一信号部分(例如低频带的第一信号部分)的滤波或调整。因此,整个过程的各个步骤中的一些步骤将在编码器或发射器设备中执行,而一些将在解码器或接收器设备中执行。在该具体实施例中,以已知方式编码语音信号。因此,优选地,在编码器中执行提供语音信号的步骤S10和将语音信号至少划分成分别基于语音信号的预定带宽的第一带宽部分和第二带宽部分的第一信号部分和第二信号部分的步骤S20。于是,在网络的第二节点的接收器或解码器设备中传送S24和接收S25划分的或选定的第一信号部分或其表征。随后,解码器调整S30接收的第一信号部分或其表征,以加强第一带宽部分内的预定频率或频率间隔。根据已知措施,基于接收的第一信号部分重构S40语音信号的第二信号部分或高频带。最后,调整后的第一信号部分和重构的第二信号部分进行组合S50以提供具有整体改善的感知响度和锐度的重构语音信号。
参考图3,示出了提供的语音信号的各个部分及它们在所描述的方法的执行期间的处理。因此,在图3a中,由信号提供器10以合适的形式提供用于音频语音处理的语音信号。随后由信号划分器20将该信号划分成基于其低频带LB的第一信号部分和基于其高频带HB的第二信号部分。接着,由发射器24传送第一信号部分LB。随后,在接收器25处接收传送的第一信号部分LB。由重构器40(例如优选地使用BWE)基于接收的第一信号部分LB来重构第二信号部分HB或其表征,适配器30对第一信号部分进行调整或滤波,以提供滤波后或调整后的第一信号部分LBf。最后,由组合器50对这两个部分LBf和HB进行组合,以形成改善的重构或重组语音信号。
参考图4,将描述一个方法实施例,其中在编码器或发射器设备中执行对语音信号的第一信号部分(例如低频带)的滤波或调整。在该实施例中,解码器设备也需要进行调整以能够开发本发明的全部益处,这将在下面进行描述。
因此,在编码器或发射器节点或设备中,执行以下步骤:提供S10语音信号;以及将语音信号至少划分成S20第一信号部分和第二信号部分,该第一信号部分和第二语音信号部分分别基于语音信号的预定带宽的第一带宽部分和第二带宽部分。随后,编码器设备调整S30提供的第一信号部分以加强第一带宽部分内的预定频率或频率间隔。接着,将调整后的第一信号部分或其表征传送给S34网络中的节点(如接收器或解码器设备),并且在网络中的该节点处接收S35。另外,编码器提供关于使用了哪种编解码器的可选信息或者为了解码器能够至少基于接收的调整后的第一信号部分(如低频带)重构S40第二信号部分或高频带所必需的任何其他信息。通常,该辅助信息可在两个节点之间的会话协商期间获得,或者是预先已知的,其中编解码器和其他会话参数是经一致同意的。然而,对于某些情况,需要提供附加的辅助信息以帮助第二信号部分的重构。最后,解码器能够组合S50接收的调整后的第一信号部分LBf和重构的第二信号部分HB,以提供具有改善的整体感知响度和锐度的重构语音信号。这在图5中进一步示出。
参考图5,示出了提供的语音信号的各个部分及它们在所描述的方法的执行期间的处理。因此,在图5中,信号提供器10提供语音信号,该信号随后被信号划分器20划分成基于其低频带LB的第一信号部分和基于其高频带HB的第二信号部分。接着,由适配器30对第一信号部分LB进行调整或滤波,以提供滤波后或调整后的第一信号部分LBf。接着由发射器34传送滤波后或调整后的第一信号部分LBf。随后,在接收器35处接收传送的调整后的第一信号部分LBf。与该信号一起提供使得能够进行第二信号部分HB的重构的信息,或者在会话初始化或编解码器协商期间已经提供该信息。由重构器40(例如,优选地使用BWE或低通滤波)基于接收的调整后的第一信号部分LBf重构第二信号部分HB或其表征。最后,由组合器50对这两个部分LBf和HB进行组合,以形成改善的重构或重组语音信号。
参考图6,将描述系统100和设备(如编码器设备1/解码器设备2、发射器/接收器、支持整个方法的第一/第二节点)的实施例。另外,对第一信号部分进行调整或滤波的功能可以作为单独功能来提供,如滤波器设备30,其可以在编码器设备1或解码器设备2、或者系统100中的其他节点中实现,如虚线框30所指示的那样。
参考图6,根据本发明的系统100的实施例包括信号提供器10,用于提供限定在预定带宽内的语音信号。该信号可以提供自系统中的另一节点,或者实际借助麦克风或其他音频设备在编码器设备1登记/生成,或者在系统中的某个其他设备中登记/生成。此外,系统100包括划分器20,用于将语音信号至少划分成两个信号部分,所述两个信号部分基于预定带宽内的两个带宽部分。通常,两个信号部分与信号的低频带LB和高频带HB对应,但是可以执行某种其他划分。另外,系统100包括适配器30,用于对第一信号部分或LB进行滤波或调整,以至少加强第一带宽部分内的预定频率或频率间隔。最后,系统100包括:重构器40,用于重构信号的第二信号部分或HB;以及组合器50,用于组合调整后的第一信号部分和重构的第二信号部分,以提供具有改善的感知质量(如响度和锐度)的重构语音信号。而且,参考图6,系统100包括通信系统中的两个节点,例如具有编码器设备1的第一节点和具有解码器设备2的第二节点,下文将描述其实施例。
根据编码器1的实施例,编码器设备1包括:语音信号提供器10,用于提供语音信号;以及信号划分器20,用于将语音信号划分成第一信号部分和第二信号部分。另外,编码器设备1包括第一信号部分适配器30,用于根据本公开中前面描述的方法调整第一信号部分。此外,编码器1包括信号发射器34,适于至少传送调整后的第一信号部分的表征,以及可选地还传送辅助在系统100的解码器设备2中重构第二信号部分的信息。
根据解码器2的实施例,解码器设备2适于与前面描述的编码器设备1协作。因此,解码器2包括信号接收器35,用于接收调整后的第一信号部分的表征以及任何另外的信息,由上面描述的编码器1提供该调整后的第一信号部分。另外,解码器2包括重构器40,用于基于接收的调整后的第一信号部分来重构语音信号的第二信号部分。最后,解码器2包括组合器50,用于组合接收的调整后的第一信号部分和重构的第二信号部分,以提供具有改善的感知响度和锐度的重构语音信号。
根据编码器1的另一实施例,编码器设备1仅包括:语音信号提供器10,用于提供语音信号;信号划分器20,用于将语音信号划分成第一信号部分和第二信号部分;以及最后包括单元24,用于向通信网络中的第二节点传送第一信号部分或至少其表征。
根据解码器2的另一实施例,解码器设备2包括信号接收器35,用于从上面描述的编码器设备1接收第一信号部分。另外,解码器2包括:第一信号部分适配器30,用于对接收的第一信号部分进行调整或滤波;重构器40,用于基于接收的第一信号部分重构第二信号部分;以及组合器50,用于组合调整后的第一信号部分和重构的第二信号部分,以提供具有改善的感知响度和锐度的重构信号。
下文跟着一些示例,说明可以如何执行对第一信号部分的调整或滤波,以提供期望的对第一带宽部分内的预定频率或频率间隔的加强。这些仅是示例,本领域普通技术人员显然清楚:实际的数学表达式可以修改或不同地表达,同时保持对感知响度和锐度的相同的整体影响。
可以利用下面类型的滤波器实现对中间LB频率(对于具体实施例,通常是约3.2kHz)的加强:
H(z)=α·z-2+β·z-1-γ+β·z+1+α·z+2 (1)
其中,优选系数α=0.1,β=0和γ=0.85。
备选的滤波器实现如下,其影响LB信号的倾斜度(tilt):
H(z)=α·z-1-β+α·z+1 (2)
其中,优选系数α=0.06和β=0.66
或
H(z)=1-μ·z-1 (3)
其中,优选系数μ=0.2。
根据本发明的实施例,如果信号的HB已经通过BWE方案重构或进行了低通滤波,则激活预滤波模块来对信号的LB部分进行预滤波。在该上下文中,术语“预滤波”指的是下述事实:在重构语音信号之前执行滤波。由此,仅部分信号被滤波,但是该滤波对整个重构信号的感知质量有影响。本发明的实施例的预滤波的目的在于加强LB的中间频率或高频。
如前面提到的,考虑包括频率分量0-6.4kHz的典型LB和包括频率分量6.4-8kHz的重构HB。在该场景下,预滤波将加强以3.2kHz为中心的频率,或整个范围3.2-6.4kHz。通常关于正常听力测试主体的外-中耳响应(参见图7)来确定该加强频率。然而,也可以应用其他标准来选择加强频率或频率范围。例如,可以基于消费者(残疾人或正常人)的实际听力分布来调适该调整。
在图8中介绍了对本发明的效果的说明。在该示例中,实线示出了原始语音信号。点虚线与已经应用了传统BWE方案和低通滤波的重构信号对应。最后,虚线与根据本发明的重构信号对应。与原始信号相比,虚线和点虚线示意的信号在大于6kHz的区域中都具有低的能量。除此之外,由于3-4kHz区域中的频率加强,将感觉到虚线示意的信号比点虚线示意的信号更响亮也更尖。换言之,通过放大信号的LB而非HB,可以重构在高频具有很多能量的锐度和响度。这有效避免了伪信号的增加。
求和是在信号的带宽的所有关键频带上进行,函数f(k)对于低频带等于1,而对于最后一些关键频带将增大。该特定响度定义如下:
其中归一化因子E*可以与寂静阈值的倒数或者外-中耳频率响应(参见图7)有关。激励E可以通过下述方式计算:将信号波形转换到频域,随后将频率窗口分组到关键频带。
根据方程(4)、(6)和图7,有可能得到下述结论:即使总信号强度保持不变,通过将可用信号能量分配给3.2kHz区域,可以提高对响度的感觉。
根据方程(5),可以得到下述结论:通过在LB中将能量从低频分配给高频-在求和中较高的频带具有较高的权重,由于增大了k和f(k),所以可以提高对锐度的感觉。
发明人已经根据完善建立的MUSHRA方案[7]执行了广泛的听力测试,,所得的结果在图9示出。白色的柱是参考信号,灰色的柱是本发明的结果,而黑色的柱是现有技术结果。根据该图可以看出,与现有技术相比,根据本发明对信号的调整产生了更接近参考信号的信号,因此与现有技术相比提供了改善的聆听体验。
此外,图10示出了根据本发明的编码器和解码器的功能的示例。
上面描述的步骤、功能、过程和/或块可以使用任何传统技术在硬件中实现,所述传统技术例如是分立电路或集成电路技术,包括通用电路和专用电路。
可选地,此处描述的步骤、功能、过程和/或块中的至少一些可以在供合适的处理设备执行的软件中实现,所述处理设备例如是微处理器、数字信号处理器(DSP)、和/或任何合适的可编程逻辑器件,如现场可编程门阵列(FPGA)器件。
还应该理解,重用网络节点的通用处理能力是可能的。例如,这可以通过对现有软件重新编程或者通过添加新的软件组件来实现。
软件可以实线为计算机程序产品,其通常携带在计算机可读介质上。因此,可以将软件装载进计算机的操作存储器,以由计算机的处理器执行。计算机/处理器不一定要专用于仅执行上面描述的步骤、功能、过程和/或块,而是可以执行其他软件任务。
在下文中,将参考图11描述计算机实现的示例。计算机200包括处理器2010、操作存储器220、以及输入/输出单元230。在该具体示例中,上面描述的步骤、功能、过程和/或块中的至少一些在软件225中实现,软件225被装载进操作存储器220供处理器210执行。处理器210和存储器220经由系统总线彼此互连,以能够完成常规软件执行。I/O单元230可以经由I/O总线互连到处理器210和/或存储器220,以支持相关数据的输入和/或输出,所述相关数据例如是输入参数和/或得到的输出参数。
所提出的用于部分响度和锐度补偿的方案改善了感知质量,同时保持比特率要求和复杂度约束不变。该概念可应用于几乎任何现代音频编解码器或BWE方案。该滤波加强了信号的LB部分的中间频率或高频,以提高对整个重构信号的响度和锐度的感受。换言之,对信号的部分滤波提供了整个信号的改善的感知质量。
参考文献
[1]3GPP TS 26.190,“Adaptive Multi-Rate-Wideband(AMR-WB)speechcodec;Transcoding functions”,2008
[2]3GPP TS 26.290“Extended Adaptive Multi-Rate-Wideband(AMR-WB+)speech codec;Transcoding functions”,2005
[3]3GPP TS 26.404“Enhanced aacPlus encoder SBR part”,2007
[4]ITU-T Rec.G.729.1,“G.729-based embedded variable bit-rate coder:An8-32 kbit/s scalable wideband coder bitstream interoperable with G.729”,2006
[5]ITU-T Rec.G.718,“Frame error robust narrowband and wideband embeddedvariable bit-rate coding of speech and audio from 8-32kbit/s”,2008
[6]H.Fastl and E.Zwicker,“Psychoacoustics:Facts and Models,”Chapter8.7.1and 9.2,Springer,2007
[7]G.Stoll and F.Kozamernik,“EBU listening tests on Internet audiocodecs”,EBU Technical Review,June 2000.
Claims (31)
1.一种改善限定在预定带宽内的重构语音信号的感知响度和锐度的方法,包括步骤:
提供(S10)所述语音信号;
将所述语音信号至少划分成(S20)第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;
调整(S30)所述第一信号部分,以至少加强所述第一带宽部分内的预定频率或频率间隔;
至少基于所述第一信号部分重构(S40)所述第二信号部分;
将所述调整后的第一信号部分与所述重构的第二信号部分进行组合(S50),以提供具有整体改善的感知响度和锐度的重构语音信号。
2.根据权利要求1所述的方法,其中所述调整(S30)步骤包括对所述第一信号部分进行滤波的步骤,其中所述第一信号部分的能量的至少一部分被分配给所述第一带宽部分中的选定频率,同时所述第一信号部分的能量的至少另一部分被分配给所述第一带宽部分的选定高频间隔。
3.根据权利要求2所述的方法,其中所述滤波(S30)步骤根据下述滤波器函数H(z)执行:
H(z)=α·z-2+β·z-1-γ+β·z+1+α·z+2
其中,优选系数α=0.1,β=0,γ=0.85。
4.根据权利要求2所述的方法,其中所述滤波(S30)步骤根据下述滤波器函数H(z)执行:
H(z)=α·z-1-β+α·z+1
其中,优选系数α=0.06和β=0.66。
5.根据权利要求2所述的方法,其中所述滤波(S30)步骤根据下述滤波器函数H(z)执行:
H(z)=1-μ·z-1
其中,优选系数μ=0.2。
6.根据权利要求2所述的方法,还包括步骤:基于固有的外-中耳响应来选择所述第一带宽部分内的所述频率。
7.根据权利要求1-6中任一项所述的方法,其中所述第一带宽部分与所提供的语音信号的低频带(LB)对应,所述第二带宽部分与所提供的语音信号的高频带(HB)对应。
8.根据权利要求7所述的方法,其中所述调整(S30)步骤基于对所述低频带(LB)进行预滤波的步骤,以及重构(S40)所述第二信号部分的所述步骤基于带宽扩展(BWE)或低通滤波。
9.一种用于改善限定在预定带宽内的重构语音信号的感知响度和锐度的系统,包括:
装置(10),被配置为提供所述语音信号;
装置(20),被配置为将所述语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;
装置(30),被配置为调整所述第一信号部分以至少加强所述第一带宽部分内的预定频率或频率间隔;
装置(40),被配置为至少基于所述第一信号部分重构所述第二信号部分;
装置(50),被配置为将所述调整后的第一信号部分与所述重构的第二信号部分进行组合,以提供具有整体改善的感知响度和锐度的重构语音信号。
10.根据权利要求9所述的系统,其中所述装置(30)被配置为通过预滤波来调整所述第一信号部分,其中所述第一信号部分与所述语音信号的低频带(LB)对应,以及所述装置(40)被配置为基于带宽扩展(BWE)或低通滤波来重构所述语音信号的高频带(HB)。
11.一种在通信系统中用于处理限定在预定带宽内的语音信号的编码器设备(1),包括:
装置(10),被配置为提供所述语音信号;
装置(20),被配置为将所述语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;
装置(30),被配置为调整所述第一信号部分以至少加强所述第一带宽部分内的预定频率或频率间隔;
装置(34),被配置为用于向另一节点至少传送调整后的第一信号部分。
12.根据权利要求11所述的编码器设备(1),其中所述装置(30)适于对所述语音信号的低频带(LB)进行预滤波。
13.一种通信系统中用于处理限定在预定带宽内的语音信号的解码器设备(2),包括:
装置(35),被配置为接收调整后的第一信号部分,所述调整后的第一信号部分源自:将提供的语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;以及调整所述第一信号部分,以至少加强所述第一带宽部分内的预定频率或频率间隔;
装置(40),被配置为至少基于所接收的信息和所接收的调整后的第一信号部分来重构所述第二信号部分;
装置(50),被配置为将所接收的调整后的第一信号部分与重构的第二信号部分进行组合,以提供具有整体改善的感知响度和锐度的重构语音信号。
14.根据权利要求13所述的解码器设备(2),其中所述调整后的第一信号部分是预滤波后的低频带(LB)信号部分。
15.一种通信系统中用于处理限定在预定带宽内的语音信号的解码器设备(1),包括:
装置(25),被配置为接收第一信号部分,所述第一信号部分源自:将提供的语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;
装置(30),被配置为调整所述第一信号部分以至少加强所述第一带宽部分内的预定频率或频率间隔;
装置(40),被配置为至少基于所述第一信号部分重构所述第二信号部分;
装置(50),被配置为将调整后的第一信号部分与所述重构的第二信号部分进行组合,以提供具有整体改善的感知响度和锐度的重构语音信号。
16.根据权利要求15所述的解码器设备(2),其中所述装置(30)适于对低频带(LB)信号部分进行预滤波。
17.一种在通信系统的节点中的编码器设备中处理限定在预定带宽内的语音信号的方法,包括:
提供(S10)所述语音信号;
将所述语音信号至少划分成(S20)第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;
调整(S30)所述第一信号部分,以至少加强所述第一带宽部分内的预定频率或频率间隔;
向另一节点传送(S34)调整后的第一信号部分。
18.根据权利要求17所述的方法,其中所述第一带宽部分与所提供的信号的低频带(LB)对应,所述第二带宽部分与所提供的语音信号的高频带(HB)对应。
19.根据权利要求18所述的方法,其中所述调整(S30)步骤基于对所述低频带(LB)进行预滤波。
20.一种在通信系统的节点中的解码器设备中处理限定在预定带宽内的语音信号的方法,包括:
从另一节点接收(S35)调整后的第一信号部分,所述调整后的第一信号部分源自:将提供的语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;以及调整所述第一信号部分,以至少加强所述第一带宽部分内的预定频率或频率间隔;
基于所接收的调整后的第一信号部分重构(S40)所述第二信号部分;
将调整后的第一信号部分与重构的第二信号部分进行组合(S50),以提供具有整体改善的感知响度和锐度的重构语音信号。
21.根据权利要求20所述的方法,其中所述第一带宽部分与所提供的语音信号的低频带(LB)对应,所述第二带宽部分与所提供的语音信号的高频带(HB)对应。
22.根据权利要求21所述的方法,其中所述调整(S30)步骤基于对所述低频带(LB)进行预滤波,以及重构(S40)所述第二信号部分的所述步骤基于带宽扩展或低通滤波。
23.一种在通信系统的节点中的解码器设备中处理限定在预定带宽内的语音信号的方法,包括:
从另一节点接收(S25)所述语音信号的第一信号部分,所述第一信号部分源自:将所述语音信号至少划分成第一信号部分和第二信号部分,所述第一信号部分基于所述预定带宽的第一带宽部分,所述第二信号部分基于所述预定带宽的第二带宽部分;
调整(S30)所接收的第一信号部分以至少加强所述第一带宽部分内的预定频率或频率间隔;
至少基于所述第一信号部分重构(S40)所述第二信号部分;
将调整后的第一信号部分与重构的第二信号部分进行组合(S50)以提供具有整体提高的感知响度和锐度的重构语音信号。
24.根据权利要求23所述的方法,其中所述第一带宽部分与所提供的信号的低频带(LB)对应,所述第二带宽部分与所提供的语音信号的高频带(HB)对应。
25.根据权利要求24所述的方法,其中所述调整(S30)步骤基于对所述低频带(LB)进行预滤波,以及重构(S40)所述第二信号部分的所述步骤基于带宽扩展或低通滤波。
26.根据权利要求17-25中任一项所述的方法,其中所述节点和所述另一节点分别包括编码器和解码器。
27.一种在通信系统中用于调整限定在预定带宽内的语音信号的滤波器设备(30),其中:
所述滤波器设备被配置为:调整提供的语音信号的第一信号部分,以至少加强第一带宽部分内的预定频率或频率间隔,其中所述第一信号部分基于所述语音信号的所述预定带宽的第一带宽部分。
28.根据权利要求27所述的滤波器设备(30),其中:所述第一带宽部分与所提供的语音信号的低频带(LB)对应。
29.根据权利要求28所述的滤波器设备(30),其中:所述调整(S30)步骤与对所述低频带(LB)进行预滤波对应。
30.根据权利要求27所述的滤波器设备(30),其中:所述滤波器设备被配置为对所述第一信号部分进行滤波,其中所述第一信号部分的能量的一部分被分配给所述第一带宽部分中的选定频率,同时所述第一信号部分的能量的另一部分被分配给所述第一带宽部分的高频间隔。
31.根据权利要求27所述的滤波器设备(30),其中所述设备(30)是编码器或解码器设备中的滤波器设备和/或在通信系统的节点中的滤波器设备。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26271409P | 2009-11-19 | 2009-11-19 | |
US61/262,714 | 2009-11-19 | ||
PCT/SE2010/050746 WO2011062535A1 (en) | 2009-11-19 | 2010-06-29 | Methods and arrangements for loudness and sharpness compensation in audio codecs |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102725791A true CN102725791A (zh) | 2012-10-10 |
CN102725791B CN102725791B (zh) | 2014-09-17 |
Family
ID=44059833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080052229.XA Active CN102725791B (zh) | 2009-11-19 | 2010-06-29 | 用于音频编解码中的响度和锐度补偿的方法和设备 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9031835B2 (zh) |
EP (1) | EP2502229B1 (zh) |
JP (1) | JP5812998B2 (zh) |
CN (1) | CN102725791B (zh) |
CA (1) | CA2780962C (zh) |
ES (1) | ES2645415T3 (zh) |
WO (1) | WO2011062535A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107112023A (zh) * | 2014-10-10 | 2017-08-29 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
ES2549953T3 (es) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9620134B2 (en) | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
RU2720357C2 (ru) | 2013-12-19 | 2020-04-29 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ оценки фонового шума, блок оценки фонового шума и машиночитаемый носитель |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US11925433B2 (en) * | 2020-07-17 | 2024-03-12 | Daniel Hertz S.A. | System and method for improving and adjusting PMC digital signals to provide health benefits to listeners |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659625A (zh) * | 2002-05-31 | 2005-08-24 | 沃伊斯亚吉公司 | 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件 |
US20060149532A1 (en) * | 2004-12-31 | 2006-07-06 | Boillot Marc A | Method and apparatus for enhancing loudness of a speech signal |
CN101164104A (zh) * | 2005-04-20 | 2008-04-16 | Qnx软件操作系统(威美科)有限公司 | 用于改善语音质量和可懂度的系统 |
US20080177532A1 (en) * | 2007-01-22 | 2008-07-24 | D.S.P. Group Ltd. | Apparatus and methods for enhancement of speech |
CN101331541A (zh) * | 2005-12-16 | 2008-12-24 | 冲电气工业株式会社 | 频带转换信号生成器和频带扩展装置 |
US7529660B2 (en) * | 2002-05-31 | 2009-05-05 | Voiceage Corporation | Method and device for frequency-selective pitch enhancement of synthesized speech |
WO2009072777A1 (en) * | 2007-12-06 | 2009-06-11 | Electronics And Telecommunications Research Institute | Apparatus and method of enhancing quality of speech codec |
US20090198498A1 (en) * | 2008-02-01 | 2009-08-06 | Motorola, Inc. | Method and Apparatus for Estimating High-Band Energy in a Bandwidth Extension System |
EP2104097A1 (en) * | 2008-03-19 | 2009-09-23 | Oki Electric Industry Co., Ltd. | Voice band expander and expansion method |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1986003873A1 (en) * | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
JP2005010621A (ja) * | 2003-06-20 | 2005-01-13 | Matsushita Electric Ind Co Ltd | 音声帯域拡張装置及び帯域拡張方法 |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US7734462B2 (en) * | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
JP4747835B2 (ja) | 2005-12-27 | 2011-08-17 | ヤマハ株式会社 | オーディオ再生の効果付加方法およびその装置 |
WO2007093726A2 (fr) * | 2006-02-14 | 2007-08-23 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
TW200743382A (en) | 2006-05-03 | 2007-11-16 | Cybervision Inc | Video signal generator |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
JP4783412B2 (ja) | 2008-09-09 | 2011-09-28 | 日本電信電話株式会社 | 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体 |
-
2010
- 2010-06-29 CN CN201080052229.XA patent/CN102725791B/zh active Active
- 2010-06-29 ES ES10831864.3T patent/ES2645415T3/es active Active
- 2010-06-29 WO PCT/SE2010/050746 patent/WO2011062535A1/en active Application Filing
- 2010-06-29 US US13/510,333 patent/US9031835B2/en active Active
- 2010-06-29 JP JP2012539847A patent/JP5812998B2/ja active Active
- 2010-06-29 CA CA2780962A patent/CA2780962C/en active Active
- 2010-06-29 EP EP10831864.3A patent/EP2502229B1/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659625A (zh) * | 2002-05-31 | 2005-08-24 | 沃伊斯亚吉公司 | 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件 |
US7529660B2 (en) * | 2002-05-31 | 2009-05-05 | Voiceage Corporation | Method and device for frequency-selective pitch enhancement of synthesized speech |
US20060149532A1 (en) * | 2004-12-31 | 2006-07-06 | Boillot Marc A | Method and apparatus for enhancing loudness of a speech signal |
CN101164104A (zh) * | 2005-04-20 | 2008-04-16 | Qnx软件操作系统(威美科)有限公司 | 用于改善语音质量和可懂度的系统 |
CN101331541A (zh) * | 2005-12-16 | 2008-12-24 | 冲电气工业株式会社 | 频带转换信号生成器和频带扩展装置 |
US20080177532A1 (en) * | 2007-01-22 | 2008-07-24 | D.S.P. Group Ltd. | Apparatus and methods for enhancement of speech |
WO2009072777A1 (en) * | 2007-12-06 | 2009-06-11 | Electronics And Telecommunications Research Institute | Apparatus and method of enhancing quality of speech codec |
US20090198498A1 (en) * | 2008-02-01 | 2009-08-06 | Motorola, Inc. | Method and Apparatus for Estimating High-Band Energy in a Bandwidth Extension System |
EP2104097A1 (en) * | 2008-03-19 | 2009-09-23 | Oki Electric Industry Co., Ltd. | Voice band expander and expansion method |
Non-Patent Citations (2)
Title |
---|
KOSUKE TSUJINO ET AL.: "LOW-COMPLEXITY BANDWIDTH EXTENSION IN MDCT DOMAIN FOR LOW-BITRATE SPEECH CODING", 《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2009. ICASSP 2009》, 24 April 2009 (2009-04-24), pages 4145 - 4148, XP031460187 * |
VISAR BERISHA,ET AL.: "Bandwidth Extension of Audio Based on Partial Loudness Criteria", 《2006 IEEE 8TH WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING》, 6 October 2006 (2006-10-06), pages 146 - 149, XP031011038 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107112023A (zh) * | 2014-10-10 | 2017-08-29 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
CN107112023B (zh) * | 2014-10-10 | 2020-10-30 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
US11062721B2 (en) | 2014-10-10 | 2021-07-13 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
Also Published As
Publication number | Publication date |
---|---|
WO2011062535A1 (en) | 2011-05-26 |
JP2013511741A (ja) | 2013-04-04 |
CA2780962A1 (en) | 2011-05-26 |
EP2502229A1 (en) | 2012-09-26 |
US9031835B2 (en) | 2015-05-12 |
EP2502229A4 (en) | 2013-06-19 |
EP2502229B1 (en) | 2017-08-09 |
JP5812998B2 (ja) | 2015-11-17 |
ES2645415T3 (es) | 2017-12-05 |
CN102725791B (zh) | 2014-09-17 |
CA2780962C (en) | 2017-09-05 |
US20120221326A1 (en) | 2012-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102725791B (zh) | 用于音频编解码中的响度和锐度补偿的方法和设备 | |
RU2381571C2 (ru) | Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала | |
US8010373B2 (en) | Signal coding and decoding | |
US7430506B2 (en) | Preprocessing of digital audio data for improving perceptual sound quality on a mobile phone | |
Campbell et al. | Audio quality assessment techniques—A review, and recent developments | |
US8391212B2 (en) | System and method for frequency domain audio post-processing based on perceptual masking | |
KR20070028481A (ko) | 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 | |
CA3034686C (en) | Apparatus and method for encoding an audio signal using a compensation value | |
CN102144259A (zh) | 用于产生带宽扩展输出数据的装置和方法 | |
US11037581B2 (en) | Signal processing method and device adaptive to noise environment and terminal device employing same | |
AU8227798A (en) | Method and apparatus for speech enhancement in a speech communication system | |
EP1398761B1 (en) | Bit rate reduction in audio encoders by exploiting inharmonicity effects | |
EP2774148B1 (en) | Bandwidth extension of audio signals | |
JP2005532586A (ja) | オーディオ処理 | |
JP5291004B2 (ja) | 通信ネットワークにおける方法及び装置 | |
Robinson | Perceptual model for assessment of coded audio | |
Drullman | The significance of temporal modulation frequencies for speech intelligibility | |
CN106653035B (zh) | 数字音频编码中码率分配的方法和装置 | |
Muralimanohar et al. | Quality of voices processed by hearing aids: Intra-talker differences | |
Nishimura | Steganographic band width extension for the AMR codec of low-bit-rate modes | |
Wijngaarden et al. | Objective prediction of speech intelligibility at high ambient noise levels using the speech transmission index | |
JP2024043720A (ja) | 調波音・背景音を用いた音声補償プログラム、装置及び方法 | |
Singh et al. | Design of Medium to Low Bitrate Neural Audio Codec | |
van de Par et al. | Informed postprocessing for auditory roughness removal for low-bitrate audio coders | |
Kroon | Speech and Audio Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |