CN105981102A - 音频信号的谐波带宽扩展 - Google Patents
音频信号的谐波带宽扩展 Download PDFInfo
- Publication number
- CN105981102A CN105981102A CN201580007190.2A CN201580007190A CN105981102A CN 105981102 A CN105981102 A CN 105981102A CN 201580007190 A CN201580007190 A CN 201580007190A CN 105981102 A CN105981102 A CN 105981102A
- Authority
- CN
- China
- Prior art keywords
- signal
- band
- low
- processing function
- nonlinear processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 119
- 230000006870 function Effects 0.000 claims abstract description 168
- 238000012545 processing Methods 0.000 claims abstract description 120
- 238000000034 method Methods 0.000 claims abstract description 81
- 230000015572 biosynthetic process Effects 0.000 claims description 87
- 238000003786 synthesis reaction Methods 0.000 claims description 87
- 230000008569 process Effects 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 241000208340 Araliaceae Species 0.000 claims description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 4
- 235000008434 ginseng Nutrition 0.000 claims description 4
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 15
- 230000000712 assembly Effects 0.000 description 6
- 238000000429 assembly Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009987 spinning Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012888 cubic function Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明揭示一种方法,其包括在装置处将输入音频信号分成至少低频带信号及高频带信号。所述低频带信号对应于低频带频率范围且所述高频带信号对应于高频带频率范围。所述方法还包括选择多个非线性处理函数中的非线性处理函数。所述方法进一步包括基于所述低频带信号及所述非线性处理函数产生第一扩展信号。所述方法还包括基于所述第一扩展信号、所述高频带信号或两者产生至少一个调整参数。
Description
优先权主张
本申请案主张2014年2月13日申请的美国临时申请案第61/939,585号和2015年2月9日申请的美国非临时申请案第14/617,524号的优先权,其标题都是“音频信号的谐波带宽扩展”,所述申请案的全部内容以引用的方式并入。
技术领域
本发明大体上涉及音频信号的谐波带宽扩展。
背景技术
技术的进步已产生更小且更强大的计算装置。举例来说,当前存在多种携带型个人计算装置,包括无线计算装置,例如携带型无线电话、个人数字助理(PDA)及传呼装置,其体积小,重量轻且易于由使用者携带。更具体而言,携带型无线电话(例如,蜂窝式电话及因特网协议(IP)电话)可经由无线网络传达语音及数据数据包。此外,许多此类无线电话包括并入于其中的其它类型的装置。举例来说,无线电话还可包括数字静态摄像机、数字视频摄像机、数字记录器及音频档案播放器。
在传统电话系统(例如,公众交换电话网络(PSTN))中,信号带宽限于300赫兹(Hz)至3.4千赫兹(kHz)的频率范围。在宽带(WB)应用(例如,蜂窝式电话及因特网语音通信协议(VoIP))中,信号带宽可横跨50Hz至7kHz的频率范围。超宽带(SWB)译码技术支持扩展至大约16kHz的带宽。将信号带宽自3.4kHz下的窄频电话扩展至16kHz的SWB电话可改良信号重建构的质量、可懂度及逼真度。
SWB译码技术通常涉及编码及传输信号的较低频率部分(例如,50Hz至7kHz,还称为“低频带”)。举例来说,可使用滤波器参数和/或低频带激励信号表示低频带。为了改良译码效率,可能不完全编码及传输信号的较高频率部分(例如,7kHz至16kHz,也称为“高频带”)。接收器可利用信号模型化以产生合成高频带信号。在一些实施中,可将与高频带相关联的数据提供至接收器以协助高频带合成。此类数据可被称作“旁侧信息”,且可包括增益信息、线谱频率(LSF,也被称作线谱对(LSP))等。可通过比较高频带与源自低频带的合成高频带信号来产生旁侧信息。举例来说,合成高频带信号可基于低频带信号及非线性函数。单一非线性函数可用于针对具有相异特性的多个低频带信号产生合成高频带信号。对具有相异特性的信号应用相同的非线性函数可导致在某些情况下(例如,话音对音乐)产生低质量合成高频带信号。结果,合成高频带信号可与高频带信号弱相关。
发明内容
揭示用于音频信号的谐波带宽扩展的系统和方法。编码器可使用音频信号的低频带部分产生用于在解码器处重建构音频信号的高频带部分的信息(例如,调整参数)。举例来说,编码器可基于低频带部分的特性扩展音频信号的低频带部分。经扩展的低频带部分可具有大于低频带部分的带宽。编码器可基于经扩展的低频带部分及高频带部分确定调整参数。
编码器可使用选定非线性处理函数产生经扩展的低频带部分。可基于音频信号的低频带部分的特性自多个非线性处理函数选择所述非线性处理函数。音频信号可对应于特定音频帧或数据包。若低频带部分指示音频信号为强周期性的(例如,具有强谐波分量和/或对应于话音),则信号编码器可选择较高阶非线性函数。若低频带部分指示音频信号为强噪声的(例如,对应于音乐),则信号编码器可选择较低阶非线性函数。编码器可基于高频带与经扩展的低频带部分的比较确定调整参数。
解码器可自编码器接收低频带数据及调整参数。解码器可基于低频带数据产生合成低频带信号。解码器可基于合成低频带信号及选定非线性处理函数产生合成扩展低频带部分。解码器可基于合成扩展低频带部分及调整参数产生合成高频带信号。可通过在解码器处组合合成低频带信号及合成高频带信号来产生输出信号。
在特定实施例中,一种方法包括在装置处将输入音频信号分成至少低频带信号及高频带信号。低频带信号对应于低频带频率范围且高频带信号对应于高频带频率范围。所述方法还包括选择多个非线性处理函数中的非线性处理函数。所述方法进一步包括基于低频带信号及非线性处理函数产生第一扩展信号。所述方法还包括基于第一扩展信号、高频带信号或两者产生至少一个调整参数。
在另一特定实施例中,一种方法包括在装置处接收对应于输入音频信号的至少低频带信号的低频带数据。所述方法也包括解码低频带数据以产生合成低频带音频信号。所述方法进一步包括选择多个非线性处理函数中的非线性处理函数。所述方法还包括基于合成低频带音频信号及非线性处理函数产生合成高频带音频信号。
在另一特定实施例中,一种装置包括存储器及处理器。所述处理器经配置以将输入音频信号分成至少低频带信号及高频带信号。低频带信号对应于低频带频率范围且高频带信号对应于高频带频率范围。所述处理器还经配置以选择多个非线性处理函数中的非线性处理函数。所述处理器经进一步配置以基于低频带信号及非线性处理函数产生第一扩展信号。所述处理器还经配置以基于第一扩展信号、高频带信号或两者产生至少一个调整参数。
在另一特定实施例中,一种装置包括存储器及处理器。所述处理器经配置以接收对应于输入音频信号的至少低频带信号的低频带数据。所述处理器还经配置以解码低频带数据以产生合成低频带音频信号。所述处理器经进一步配置以选择多个非线性处理函数中的非线性处理函数。所述处理器还经配置以基于合成低频带音频信号及非线性处理函数产生合成高频带音频信号。
在另一特定实施例中,计算机可读存储装置存储当由处理器执行时引起所述处理器执行包括将输入音频信号分成至少低频带信号及高频带信号的操作的指令。低频带信号对应于低频带频率范围且高频带信号对应于高频带频率范围。所述操作还包括选择多个非线性处理函数中的非线性处理函数。所述操作进一步包括基于低频带信号及非线性处理函数产生第一扩展信号。所述操作还包括基于第一扩展信号、高频带信号或两者产生至少一个调整参数。
在另一特定实施例中,计算机可读存储装置存储当由处理器执行时引起所述处理器执行包括接收对应于输入音频信号的至少低频带信号的低频带数据的操作的指令。所述操作还包括解码低频带数据以产生合成低频带音频信号。所述操作进一步包括选择多个非线性处理函数中的非线性处理函数。所述操作还包括基于合成低频带音频信号及非线性处理函数产生合成高频带音频信号。
由所揭示的实施例中的至少一者提供的特定优点可包括改良输出信号的合成高频带部分的质量。可通过使用基于低频带部分的音频特性自多个可用非线性处理函数选择的非线性函数产生合成高频带部分来改良输出信号的质量。选定非线性函数可改良在话音情况及非话音情况(例如,音乐)两者下编码器处的输入信号的高频带部分与解码器处的输出信号的合成高频带部分之间的相关性。本发明的其它方面、优点及特征将在审阅包括以下章节的申请案之后变得显而易见:【图式简单说明】、【实施方式】及【申请专利范围】。
附图说明
图1为说明可操作以执行音频信号的谐波带宽扩展的编码器系统的特定实施例的图;
图2为可操作以执行音频信号的谐波带宽扩展的解码器系统的另一特定实施例的图;
图3为可操作以执行音频信号的谐波带宽扩展的系统的另一特定实施例的图;
图4为说明执行音频信号的谐波带宽扩展的方法的特定实施例的流程图;
图5为说明执行音频信号的谐波带宽扩展的方法的另一特定实施例的流程图;及
图6为可操作以根据图1至5的系统及方法执行信号处理操作的无线装置的框图。
具体实施方式
参看图1,展示可操作以执行音频信号的谐波带宽扩展的编码器系统的特定实施例的图,且将所述系统大体上标示为100。在特定实施例中,编码器系统100可集成至编码(或解码)系统或装置中(例如,无线电话或译码器/解码器(CODEC)中)。在其它实施例中,编码器系统100可集成至机顶盒、音乐播放器、视讯播放器、娱乐单元、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元或计算机中。
应注意,在以下描述中,由图1的编码器系统100执行的各种功能经描述为由某些组件或模块执行。组件及模块的此划分仅为了说明目的且并不被认为是限制性的。在替代实施例中,由特定组件或模块执行的功能可在多个组件或模块中划分。此外,在替代实施例中,图1的两个或两个以上组件或模块可集成为单一组件或模块。可使用硬件(例如,场可编程门阵列(FPGA)装置、特殊应用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合实施图1中所说明的每一组件或模块。
编码器系统100包括耦接至低频带编码器108的分析滤波器组110、谐波性估计器106、信号产生器112及参数估计器190。信号产生器112耦接至滤波器114及混频器116。信号产生器112可包括函数选择器180。
在操作期间,分析滤波器组110可接收输入音频信号102。举例来说,输入音频信号102可由麦克风或其它输入装置提供。输入音频信号102可包括话音、噪声、音乐或其组合。输入音频信号102可为超宽带(SWB)信号,其包括在大约50赫兹(Hz)至大约16千赫兹(kHz)的频率范围内的数据。分析滤波器组110可基于频率将输入音频信号102分成多个部分。举例来说,分析滤波器组110可将输入音频信号102分成至少低频带信号122及高频带信号124。在特定实施例中,分析滤波器组110可包括分析滤波器组的集合。分析滤波器组的所述集合可将输入音频信号102分成至少低频带信号122及高频带信号124。在特定实施例中,分析滤波器组110可产生两个以上输出。
在图1的实例中,低频带信号122及高频带信号124占用非重迭频带。举例来说,低频带信号122及高频带信号124可分别占用50Hz至7kHz及7kHz至16kHz的非重迭频带。在替代实施例中,低频带信号122及高频带信号124可分别占用50Hz至8kHz及8kHz至16kHz的非重迭频带。在另一替代实施例中,低频带信号122及高频带信号124重迭(例如,分别为50Hz至8kHz及7kHz至16kHz),此情况可使分析滤波器组110的低通滤波器及高通滤波器具有平滑滚落,如此可简化设计且降低低通滤波器及高通滤波器的成本。使低频带信号122及高频带信号124重迭还可允许实现接收器处低频带及高频带信号的平滑混合,如此可产生较少可闻假影。
应注意,尽管图1的实例说明SWB信号的处理,但此仅为了说明目的且不应被认为是限制性的。在替代实施例中,输入音频信号102可为具有大约50Hz至大约8kHz的频率范围的宽带(WB)信号。在此实施例中,低频带信号122可对应于大约50Hz至大约6.4kHz的频率范围且高频带信号124可对应于大约6.4kHz至大约8kHz的频率范围。
分析滤波器组110可将低频带信号122提供至低频带编码器108且可将高频带信号124提供至参数估计器190。如本文中所描述,参数估计器190可经配置以比较第一扩展信号182与高频带信号124以产生一或多个调整参数178。如本文中所描述,编码器系统100可基于低频带信号122及经选定非线性处理函数以产生第一扩展信号182。混频器116可经配置以通过使用噪声信号176调变第二扩展信号172来产生第一扩展信号182。滤波器114可经配置以通过将来自信号产生器112的第三扩展信号174滤波来产生第二扩展信号172。
低频带编码器108可自分析滤波器组110接收低频带信号122且可产生低频带参数168。低频带参数168可指示低频带信号122的特性。低频带参数168可包括低频带信号122与频谱倾斜、音调增益、滞后、话音模式或其组合相关联的值。
频谱倾斜可涉及通带上频谱包络的形状且可由经量化第一反射系数表示。对于有声声音,频谱能量可随递增频率减少,以使得第一反射系数为负且可能接近-1。无声声音可具有一频谱,所述频谱为平坦的以使得第一反射系数接近零,或在高频处具有更多能量以使得第一反射系数为正且可能接近+1。
话音模式(还称为发声模式)可指示与低频带信号122相关联的音频帧是表示有声声音还是无声声音。话音模式参数可具有基于周期性(例如,零交叉、标准化自相关函数(NACF)、音调增益等)和/或音频帧的语音活动的一或多个测量结果(例如,此类测量结果与临限值之间的关系)的二进制值。在其它实施中,话音模式参数可具有一或多个其它状态来指示例如静寂或背景噪声的模式,或静寂与有声话音之间的转变。低频带编码器108可将低频带参数168提供至信号产生器112。
在特定实施例中,信号产生器112可基于低频带参数168产生低频带信号122。举例来说,信号产生器112可包括本地解码器(或解码器仿真器)。本地解码器可在接收装置处模拟解码器的行为。举例来说,本地解码器可经配置以解碼低频带参数168以产生低频带信号122。在替代实施例中,信号产生器112可自分析滤波器组110接收低频带信号122。
函数选择器180可选择多个可用非线性处理函数118中的非线性处理函数。所述多个可用非线性处理函数118可包括绝对值函数、全波整流函数、半波整流函数、平方函数、立方函数、四幂函数(power of four function)、削波函数或其组合。
函数选择器180可基于低频带信号122的特性选择非线性处理函数。为了说明,函数选择器180可基于低频带参数168或低频带信号122确定特性值。噪声因子可指示对应于低频带信号122的音频帧的周期性。举例来说,噪声因子可对应于与低频带信号122相关联的音调增益、话音模式、频谱倾斜、NACF、零交叉或其组合。如果噪声因子满足第一噪声临限值,那么函数选择器180可选择第一非线性处理函数。举例来说,若噪声因子指示低频带信号122为强周期性的(例如,对应于话音),则函数选择器180可选择高阶幂函数(例如,四幂函数)。如果噪声因子满足第二噪声临限值,那么函数选择器180可选择第二非线性处理函数。举例来说,如果噪声因子指示低频带信号122并非为极周期性的或为类噪声的(例如,对应于音乐),那么函数选择器180可选择低阶幂函数(例如,平方函数)。
在特定实施例中,函数选择器180可在逐音频帧基础上从多个可用非线性处理函数118选择非线性处理函数。此外,可针对输入音频信号102的连续帧选择不同的非线性处理函数。因此,函数选择器180可响应于确定与第一音频帧相关联的参数满足第一条件而选择多个非线性处理函数中的第一非线性处理函数,且可响应于确定与第二音频帧相关联的参数满足第二条件而选择多个非线性处理函数中的第二非线性处理函数。作为说明性实例,可在输入音频信号102在电话呼叫期间对应于话音时与在输入音频信号102在电话呼叫期间对应于保持音乐时应用不同的非线性处理函数。在特定实施例中,与帧相关联的参数为经选择以编码低频带信号的译码模式、帧的周期性、帧中非周期性噪声的量及对应于帧的频谱倾斜中的一者。
信号产生器112可以谐波方式扩展低频带信号122的频谱以包括较高频率范围(例如,对应于高频带信号124的频率范围)。举例来说,信号产生器112可对低频带信号122进行增加取样。低频带信号122可经增加取样以减少应用选定非线性处理函数后的频叠。在特定实施例中,信号产生器112可按特定因子(例如,8)对低频带信号122进行增加取样。在特定实施例中,增加取样操作可包括对低频带信号122进行补零。信号产生器112可通过将选定非线性处理函数应用于经增加取样信号来产生第三扩展信号174。
滤波器114可从信号产生器112接收第三扩展信号174。滤波器114可通过对第三扩展信号174进行滤波来产生第二扩展信号172。举例来说,滤波器114可对第三扩展信号174进行减少取样以使得第二扩展信号172的频率范围(例如,7kHz至16kHz)对应于与高频带信号124相关联的频率范围。为了说明,滤波器114可将带通(例如,高通)滤波操作应用于第三扩展信号174以产生第二扩展信号172。在特定实施例中,滤波器114可将线性变换(例如,离散余弦变换(DCT))应用于第三扩展信号174且可选择对应于高频率范围(例如,7kHz至16kHz)的变换系数。滤波器114可将第二扩展信号172提供至混频器116。
混频器116可组合第二扩展信号172及噪声信号176。混频器116可自噪声产生器(未展示)接收噪声信号176。噪声产生器可经配置以产生单位方差白色伪随机噪声信号。在特定实施例中,噪声信号176可不为白色且可具有随频率变化的功率密度。在特定实施例中,噪声产生器可经配置以将噪声信号176输出为确定性函数,所述函数可在接收装置的解码器处经复制。举例来说,噪声产生器可经配置以产生噪声信号176作为低频带参数168的确定性函数。
混频器116可组合第一比例的噪声信号176及第二比例的第二扩展信号172。举例来说,混频器116可产生第一扩展信号182以具有类似于高频带信号124的谐波能量与噪声能量的比率的谐波能量与噪声能量的比率。混频器116可基于谐波性因子170确定第一比例及第二比例。举例来说,如果谐波性因子170指示高频带信号124与无声声音(例如,音乐或噪声)相关联,那么第一比例可高于第二比例。作为另一实例,如果谐波性因子170指示高频带信号124与有声话音相关联,则第二比例可高于第一比例。在特定实施例中,混频器116可自谐波性因子170确定第一比例(或第二比例)且可根据例如下式的等式导出第二比例(或第一比例):
(第一比例)2+(第二比例)2=1,(等式1)。
替代地,混频器116可基于谐波性因子170自多个比例对选择对应比例对,其中预先计算比例对以满足恒定能量比率,例如等式(1)。第一比例的值的范围可为0.1至0.7且第二比例的值的范围可为0.7至1.0。
谐波性估计器106可基于输入音频信号102的特性(例如,周期性)的估计确定谐波性因子170。在特定实施例中,谐波性估计器106可基于高频带信号124及低频带参数168中的至少一者产生谐波性因子170。举例来说,谐波性估计器106可基于由低频带参数168指示的低频带信号122的特性(例如,周期性)确定谐波性因子170。为了说明,谐波性估计器106可将与音调增益成比例的值指派至谐波性因子170。作为另一实例,谐波性估计器106可基于话音模式确定谐波性因子170。为了说明,谐波性因子170可响应于指示有声音频(例如,话音)的话音模式而具有第一值且可响应于指示无声音频(例如,音乐)的话音模式而具有第二值。
作为另一实例,谐波性估计器106可基于高频带信号124的特性(例如,周期性)确定谐波性因子170。为了说明,谐波性估计器106可基于高频带信号124的自相关系数的最大值确定谐波性因子170,其中在包括一个音调滞后的延迟且不包括零样本的延迟的搜寻范围内执行自相关。在特定实施例中,谐波性估计器106可产生对应于高频带信号124的高频带滤波器参数且可基于高频带滤波器参数确定高频带信号124的特性。
在特定实施例中,谐波性估计器106可基于周期性的另一指示符(例如,音调增益)及临限值确定谐波性因子170。举例来说,如果由低频带参数168指示的音调增益满足第一临限值(例如,大于或等于0.5),那么谐波性估计器106可对高频带信号124执行自相关操作。作为另一实例,如果话音模式指示特定状态(例如,有声话音),那么谐波性估计器106可执行自相关操作。如果音调增益不满足第一临限值和/或若话音模式指示其它状态,那么谐波性因子170可具有默认值。
谐波性估计器106可基于不同于周期性或除周期性之外的特性确定谐波性因子170。举例来说,谐波性因子针对具有大音调滞后的话音信号及具有小音调滞后的话音信号可具有不同值。在特定实施例中,谐波性估计器106可基于在基本频率的倍数下对高频带信号124的能量的测量相对于在其它频率分量下对高频带信号124的能量的测量来确定谐波性因子170。
谐波性估计器106可将谐波性因子170提供至混频器116。如本文中所描述,混频器116可基于谐波性因子170产生第一扩展信号182。混频器116可将第一扩展信号182提供至参数估计器190。
参数估计器190可基于高频带信号124或第一扩展信号182中的至少一者产生调整参数178。举例来说,参数估计器190可基于高频带信号124与第一扩展信号182之间的关系(例如,两个信号的能量之间的差异或比率)产生调整参数178。在特定实施例中,调整参数178可对应于指示两个信号的能量之间的差异或比率的一或多个增益调整参数。在替代实施例中,调整参数178可对应于增益调整参数的经量化指数。在特定实施例中,调整参数178可包括指示高频带信号124的特性的高频带参数。在特定实施例中,参数估计器190可基于高频带信号124且不基于第一扩展信号182产生调整参数178。
参数估计器190可提供调整参数178且低频带编码器108可将低频带参数168提供至多任务器(MUX)。MUX可多任务调整参数178及低频带参数168以产生输出位串流。输出位串流可表示对应于输入音频信号102的经编码音频信号。举例来说,MUX可经配置以将调整参数178插入至输入音频信号102的经编码版本中以在输入音频信号102的再现期间实现增益调整。输出位串流可由传输器传输(例如,经由有线、无线或光学信道)和/或经存储。在接收装置处,可由解多任务器(DEMUX)、低频带解码器、高频带解码器及滤波器组执行反向操作以产生音频信号(例如,提供至扬声器或其它输出装置的输入音频信号102的重建构版本),如参看图2所描述。在特定实施例中,谐波性估计器106可将谐波性因子170提供至MUX,且MUX可将谐波性因子170包括在输出位串流中。
编码器系统100在编码器处使用基于低频带信号122的特性选择的非线性处理函数产生合成高频带信号(例如,第一扩展信号182)。使用选定非线性处理函数可增加在有声状况及无声状况两者下合成高频带信号与高频带信号124之间的相关性。
参看图2,展示可操作以执行音频信号的谐波带宽扩展的解码器系统的特定实施例,且将所述系统大体上标示为200。编码器系统100及解码器系统200可包括在单一装置或单独装置中。
在特定实施例中,解码器系统200可集成至编码(或解码)系统或装置中(例如,无线电话或译码器/解码器(CODEC)中)。在其它实施例中,解码器系统200可集成至机顶盒、音乐播放器、视讯播放器、娱乐单元、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元或计算机中。
应注意,在以下描述中,由图2的解码器系统200执行的各种功能经描述为由某些组件或模块执行。组件及模块的此划分仅为了说明目的且并不被认为是限制性的。在一替代实施例中,由特定组件或模块执行的功能可在多个组件或模块中划分。此外,在一替代实施例中,图2的两个或两个以上组件或模块可集成至单一组件或模块中。可使用硬件(例如,场可编程门阵列(FPGA)装置、特殊应用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合实施图2中所说明的每一组件或模块。
解码器系统200包括耦接至信号产生器112的低频带解码器208、滤波器114、混频器116、高频带信号产生器216及合成滤波器组210。
在操作期间,低频带解码器208可接收低频带数据268。低频带数据268可对应于由图1的编码器系统100产生的输出位串流。举例来说,在解码器系统200处的接收器可接收(例如,经由有线、无线或光学信道)输入位串流。输入位串流可对应于由编码器系统100产生的输出位串流。接收器可将输入位串流提供至解多任务器(DEMUX)。DEMUX可自输入位串流产生低频带数据268及调整参数。在特定实施例中,DEMUX可自输入位串流提取谐波性因子。DEMUX可将低频带数据268提供至低频带解码器208。
低频带解码器208可自低频带数据268提取低频带参数。低频带参数可对应于图1的低频带参数168。低频带解码器208可基于所述低频带参数产生合成低频带信号222。合成低频带信号222可近似于图1的低频带信号122。
信号产生器112可自低频带解码器208接收合成低频带信号222。信号产生器112可基于合成低频带信号222产生第三扩展信号274,如参看图1所描述。举例来说,函数选择器180可基于合成低频带信号222自多个可用非线性处理函数218选择非线性处理函数。信号产生器可扩展合成低频带信号222且可应用所选定非线性处理函数以产生第三扩展信号274。第三扩展信号274可近似于图1的第三扩展信号174。在特定实施例中,函数选择器180基于所接收的参数选择非线性处理函数。举例来说,解码器系统200可接收识别(例如,经由指数)特定非线性处理函数的参数,所述特定非线性处理函数由编码器系统(例如,编码器系统100)应用以编码特定音频帧或音频帧序列。可针对每一帧或当待使用的非线性处理函数改变时接收此参数。
滤波器114可通过对第三扩展信号274进行滤波来产生第二扩展信号272,如参看图1所描述。第二扩展信号272可近似于图1的第二扩展信号172。
混频器116可经由基于谐波性因子270组合噪声信号276及第二扩展信号272来产生第一扩展信号282,如参看图2所描述。噪声信号276可近似于图1的噪声信号176且第一扩展信号282可近似于图1的第一扩展信号182。
谐波性解码器206可接收低频带数据268、调整参数178、所接收的谐波性因子(例如,参数)或其组合。举例来说,谐波性解码器206可自解码器系统200的DEMUX接收低频带数据268、调整参数178、所接收的谐波性因子或其组合。谐波性解码器206可基于低频带数据268、调整参数178、所接收的谐波性因子或其组合产生谐波性因子270。举例来说,谐波性解码器206可自低频带数据268提取低频带参数。作为另一实例,谐波性解码器206可自调整参数178提取高频带参数。谐波性解码器206可基于低频带参数、高频带参数或两者产生经计算的谐波性因子,如参看图1所描述。
谐波性解码器206可将谐波性因子270设定为经计算的谐波性因子或所接收的谐波性因子。在特定实施例中,谐波性解码器206可回应于侦测到所接收的谐波性因子中的错误而将谐波性因子270设定为经计算的谐波性因子。谐波性解码器206可回应于确定所接收的谐波性因子与经计算的谐波性因子之间的差异满足特定临限值而侦测错误。谐波性解码器206可将谐波性因子270提供至混频器116。混频器116可将第一扩展信号282提供至高频带信号产生器216。
高频带信号产生器216可基于调整参数178及第一扩展信号282中的至少一者产生合成高频带信号224。举例来说,高频带信号产生器216可将调整参数178应用于第一扩展信号282以产生合成高频带信号224。为了说明,高频带信号产生器216可按与调整参数178中的至少一者相关联的因子来按比例缩放第一扩展信号282。在特定实施例中,调整参数178中的一或多者可对应于增益调整参数。高频带信号产生器216可将增益调整参数应用于第一扩展信号282以产生合成高频带信号224。合成滤波器组210可接收合成高频带信号224及合成低频带信号222。输出音频信号278可由合成滤波器组210提供至扬声器(或其它输出装置)和/或经存储。
解码器系统200可使用基于指示编码器处接收的输入信号的低频带部分的特性的低频带参数选择的非线性处理函数实现在解码器处产生合成高频带信号。使用选定非线性处理函数产生合成高频带信号可在有声状况及无声状况两者下改良合成高频带信号与输入信号的高频带部分之间的相关性。
参看图3,展示可操作以执行音频信号的谐波带宽扩展的系统的特定实施例,且将所述系统大体上标示为300。
在特定实施例中,系统300(或其部分)可集成至编码(或解码)系统或装置中(例如,无线电话或译码器/解码器(CODEC)中)。在其它实施例中,系统300(或其部分)可集成至机顶盒、音乐播放器、视讯播放器、娱乐单元、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元或计算机中。
应注意,在以下描述中,由图3的系统300执行的各种功能经描述为由某些组件或模块执行。组件及模块的此划分仅为了说明目的且并不被认为系限制性的。在替代实施例中,由特定组件或模块执行的功能可在多个组件或模块中划分。此外,在替代实施例中,图3的两个或两个以上组件或模块可集成至单一组件或模块中。可使用硬件(例如,场可编程门阵列(FPGA)装置、特殊应用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合实施图3中所说明的每一组件或模块。
系统300包括分析滤波器组110、低频带编码器108、谐波性估计器106、参数估计器190及解码器系统200。
在操作期间,分析滤波器组110可接收输入音频信号102。分析滤波器组110可将输入音频信号102分成至少低频带信号122及高频带信号124。
低频带编码器108可自分析滤波器组110接收低频带信号122。低频带编码器108可基于低频带信号122确定低频带参数168,如参看图1所描述。低频带编码器108可将低频带参数168提供至解码器系统200。
谐波性估计器106可接收高频带信号124且可基于高频带信号124产生谐波性因子170。举例来说,谐波性估计器106可基于指示高频带信号124的特性的高频带参数产生谐波性因子170,如参看图1所描述。谐波性估计器106可将谐波性因子170提供至解码器系统200。
参数估计器190可基于高频带信号124产生调整参数178。举例来说,调整参数178可对应于指示高频带信号124的特性的高频带参数。参数估计器190可将调整参数178提供至解码器系统200。解码器系统200可基于调整参数178、低频带参数168、谐波性因子170或其组合产生合成高频带信号224,如参看图2所描述。
系统300使用基于合成低频带信号的特性而选择的非线性处理函数实现在解码器处产生高频带信号。系统300可基于高频带信号124且不基于低频带信号的扩展版本产生调整参数178。在特定实施例中,系统300可通过节省用于扩展输入音频信号102及将扩展信号与噪声信号混合的处理时间而比编码器系统100更快地产生调整参数178。
参看图4,展示执行音频信号的谐波带宽扩展的方法的特定实施例的流程图,且将所述方法大体上标示为400。可由图1的编码器系统100执行方法400。
方法400可包括在装置处将输入音频信号分成至少低频带信号及高频带信号(在402处)。低频带信号可对应于低频带频率范围且高频带信号可对应于高频带频率范围。举例来说,图1的分析滤波器组110可将输入音频信号102分成至少低频带信号122及高频带信号124,如参看图1所描述。低频带信号122可对应于低频带频率范围(例如,50赫兹(Hz)至7千赫兹(kHz))且高频带信号124可对应于高频带频率范围(例如,7kHz至16kHz)。
方法400还可包括选择多个非线性处理函数中的非线性处理函数(在404处)。举例来说,图1的函数选择器180可选择多个可用非线性处理函数118中的特定非线性处理函数,如参看图1所描述。
方法400可进一步包括基于低频带信号及非线性处理函数产生第一扩展信号(在406处)。举例来说,图1的混频器116可基于低频带信号122及选定非线性处理函数产生第一扩展信号182,如参看图1所描述。
方法400还可包括基于第一扩展信号或高频带信号中的至少一者产生至少一个调整参数(在408处)。举例来说,参数调整器190可基于第一扩展信号182或高频带信号124中的至少一者产生调整参数178,如参看图1所描述。
方法400可使用基于低频带信号122的特性选择的非线性处理函数实现在编码器处产生合成高频带信号(例如,第一扩展信号182)。使用选定非线性处理函数可增加在有声状况及无声状况两者下合成高频带信号与高频带信号124之间的相关性。
在特定实施例中,图4的方法400可经由处理单元(例如,中央处理单元(CPU)、数字信号处理器(DSP)或控制器)的硬件(例如,场可编程门阵列(FPGA)装置、特殊应用集成电路(ASIC)等)或经由固件装置或其任何组合实施。作为一实例,可由执行指令的处理器(如关于图6所描述)执行图4的方法400。
参看图5,展示执行音频信号的谐波带宽扩展的方法的特定实施例的流程图,且将所述方法大体上标示为500。可由图2的解码器系统200执行方法500。
方法500可包括在装置处接收对应于输入音频信号的至少低频带信号的低频带数据(在502处)。举例来说,解码器系统200的DEMUX可经由接收器接收输入位串流,如参看图2所描述。作为另一实例,低频带解码器208可接收低频带数据268,如参看图2所描述。
方法500还可包括解码低频带数据以产生合成低频带音频信号(在504处)。举例来说,低频带解码器208可解码低频带数据268以产生合成低频带信号222,如参看图2所描述。
方法500可进一步包括选择多个非线性处理函数中的非线性处理函数(在506处)。举例来说,函数选择器180可选择多个可用非线性处理函数118中的特定非线性处理函数,如参看图2所描述。
方法500还可包括基于合成低频带音频信号及非线性处理函数产生合成高频带音频信号(在508处)。举例来说,高频带信号产生器216可基于合成低频带信号222及选定非线性处理函数产生合成高频带信号224,如参看图2所描述。
方法500可使用基于指示在编码器处接收的输入信号的低频带部分的特性的低频带参数选择的非线性处理函数实现在解码器处产生合成高频带信号。使用选定非线性处理函数产生合成高频带信号可改良在有声状况及无声状况两者下合成高频带信号与输入信号的高频带部分之间的相关性。
在特定实施例中,图5的方法500可经由处理单元(例如,中央处理单元(CPU)、数字信号处理器(DSP)或控制器)的硬件(例如,场可编程门阵列(FPGA)装置、特殊应用集成电路(ASIC)等)或经由固件装置或其任何组合实施。作为一实例,可由执行指令的处理器(如关于图6所描述)执行图5的方法500。
参考图6,描绘无线通信装置的特定说明性实施例的框图,且将所述装置大体上标示为600。装置600包括耦接至存储器632的处理器610(例如,中央处理单元(CPU)、数字信号处理器(DSP)等)。存储器632可包括由处理器610执行的指令660。处理器610还可包括译码器/解码器(CODEC)634,如所展示。CODEC 634可执行本文中所揭示的方法及程序,例如图4的方法400、图5的方法500或两者,和/或指令660可由处理器610执行以执行本文中所揭示的方法及程序,例如图4的方法400、图5的方法500或两者。
CODEC 634可包括编码器690及解码器692。编码器690可包括分析滤波器组110、谐波性估计器106、低频带编码器108、混频器116、信号产生器112、滤波器114及参数估计器190中的一或多者,如所展示。解码器692可包括合成滤波器组210、谐波性解码器206、低频带解码器208、高频带信号产生器216、混频器116及滤波器114中的一或多者,如所展示。在替代实施例中,编码器690及解码器692可驻留在多个处理器内或其部分内。举例来说,装置600可包括多个处理器(例如,DSP及应用程序处理器),且编码器690及解码器692或其组件可包括在多个处理器中的一些或全部中。
可经由专用硬件(例如,电路)、经由执行指令以执行一或多个任务的处理器或其组合实施分析滤波器组110、谐波性估计器106、低频带编码器108、混频器116、信号产生器112、滤波器114、参数估计器190、合成滤波器组210、谐波性解码器206、低频带解码器208、高频带信号产生器216或其组合。作为实例,这些指令可存储在存储器装置中,例如随机访问存储器(RAM)、磁阻式随机访问存储器(MRAM)、自旋力矩转移MRAM(STT-MRAM)、闪存、只读存储器(ROM)、可编程只读存储器(PROM)、固态存储器、可抹除可编程只读存储器(EPROM)、电可抹除可编程只读存储器(EEPROM)、缓存器、硬盘、可移动磁盘或紧密光盘只读存储器(CD-ROM)。
图6还展示耦接至处理器610且耦接至显示器628的显示控制器626。扬声器636及麦克风638可耦接至装置600。举例来说,麦克风638可产生图1的输入音频信号102,且装置600可基于输入音频信号102产生用于传输至接收器的输出位串流,如参看图1所描述。举例来说,输出位串流可由传输器经由处理器610、无线控制器640及天线642传输。作为另一实例,扬声器636可用于输出由装置600根据由接收器接收(例如,经由无线控制器640及天线642)的输入位串流重建构的信号,如参看图2所描述。
在特定实施例中,处理器610、显示控制器626、存储器632及无线控制器640包括在系统级封装或系统单芯片装置(例如,行动台调制解调器(MSM))622中。在特定实施例中,输入装置630(例如,触摸屏和/或小键盘)及电力供应器644耦接至系统单芯片装置622。此外,在特定实施例中,如图6所说明,显示器628、输入装置630、扬声器636、麦克风638、天线642及电力供应器644在系统单芯片装置622的外部。显示器628、输入装置630、扬声器636、麦克风638、天线642及电力供应器644中的每一者可耦接至系统单芯片装置622的组件,例如接口或控制器。
结合所描述的实施例,第一装置可包括用于将输入音频信号分成至少低频带信号及高频带信号的装置,例如分析滤波器组110、经配置以分离音频信号的一或多个其它装置或电路,或其任何组合。低频带信号可对应于低频带频率范围且高频带信号可对应于高频带频率范围。所述装置还可包括用于选择多个非线性处理函数中的非线性处理函数的装置,例如函数选择器180、经配置以自多个非线性处理函数选择非线性处理函数的一或多个其它装置或电路,或其任何组合。所述装置可进一步包括用于基于低频带信号及非线性处理函数产生第一扩展信号的第一装置,例如混频器116、经配置以基于低频带信号及非线性处理函数产生信号的一或多个其它装置或电路,或其任何组合。所述装置还可包括用于基于第一扩展信号、高频带信号或两者产生至少一个调整参数的第二装置,例如参数估计器190、经配置以基于扩展信号和/或高频带信号产生至少一个调整参数的一或多个其它装置或电路,或其任何组合。
结合所描述的实施例,第二装置可包括用于接收对应于输入音频信号的至少低频带信号的低频带数据的装置,例如解码器系统200的组件或耦接至解码器系统200的组件(例如,接收器)、经配置以接收对应于输入音频信号的低频带信号的低频带数据的一或多个其它装置或电路,或其任何组合。所述装置还可包括用于解码低频带数据以产生合成低频带音频信号的装置,例如低频带解码器208、经配置以解码低频带数据以产生合成低频带音频信号的一或多个其它装置或电路,或其任何组合。所述装置可进一步包括用于选择多个非线性处理函数中的非线性处理函数的装置,例如函数选择器180、经配置以选择多个非线性处理函数中的非线性处理函数的一或多个其它装置或电路,或其任何组合。所述装置还可包括用于基于合成低频带音频信号及非线性处理函数产生合成高频带音频信号的装置,例如高频带信号产生器216、经配置以基于合成低频带音频信号及非线性处理函数产生合成高频带音频信号的一或多个其它装置或电路,或其任何组合。
熟悉此项技术者将进一步了解,结合本文中所揭示的实施例所描述的各种说明性逻辑块、配置、模块、电路及算法步骤可实施为电子硬件、由例如硬件处理器的处理装置执行的计算机软件,或两者的组合。上文大体在功能性方面描述各种说明性组件、块、配置、模块、电路及步骤。此功能性经实施为硬件还是可执行软件取决于特定应用及强加于整个系统上的设计约束。对于每一特定应用来说,熟习此项技术者可以变化的方式实施所描述的功能性,但不应将这些实施决策解释为导致脱离本发明的范围。
结合本文中所揭示的实施例而描述的方法或算法的步骤可直接体现于硬件中、由处理器执行的软件模块中,或两者的组合中。软件模块可驻留于存储器装置中,例如随机访问存储器(RAM)、磁阻式随机访问存储器(MRAM)、自旋力矩转移MRAM(STT-MRAM)、闪存、只读存储器(ROM)、可编程只读存储器(PROM)、可抹除可编程只读存储器(EPROM)、电可抹除可编程只读存储器(EEPROM)、缓存器、硬盘、可移动磁盘或紧密光盘只读存储器(CD-ROM)。例示性存储器装置耦接至处理器,以使得处理器可自存储器装置读取信息及将信息写入至存储器装置。在替代方案中,存储器装置可与处理器成一体式。处理器及存储媒体可驻留于特殊应用集成电路(ASIC)中。ASIC可驻留于计算装置或用户终端机中。在替代方案中,处理器及存储媒体可作为离散组件驻留于计算装置或用户终端机中。
提供所揭示的实施例的前述描述以使熟习此项技术者能够制作或使用所揭示的实施例。对于熟习此项技术者而言,这些实施例的各种修改将易于显而易见,且本文中所定义的原理可在不脱离本发明的范围的情况下应用于其它实施例。因此,本发明并不意欲限于本文中所展示的实施例,而应符合可能与如以下申请专利范围所定义的原理及新颖特征相一致的最广泛范畴。
Claims (59)
1.一种方法,其包含:
在装置处,将输入音频信号分为至少低频带信号及高频带信号,所述低频带信号对应于低频带频率范围且所述高频带信号对应于高频带频率范围;
选择多个非线性处理函数中的非线性处理函数;
基于所述低频带信号及所述非线性处理函数产生第一扩展信号;及
基于所述第一扩展信号、所述高频带信号或两者产生至少一个调整参数。
2.根据权利要求1所述的方法,其中所述第一扩展信号是经由混合噪声信号和第二扩展信号来产生,且其中所述至少一个调整参数是基于所述第一扩展信号及所述高频带信号确定。
3.根据权利要求2所述的方法,其中第一比例的所述噪声信号和第二比例的所述第二扩展信号经混合,且其中所述第一比例和所述第二比例是基于所述低频带信号、所述高频带信号或所述输入音频信号中的至少一者的谐波性确定。
4.根据权利要求3所述的方法,其进一步包含基于音频帧中所述输入音频信号的周期性的估计确定所述谐波性。
5.根据权利要求2所述的方法,其进一步包含经由对第三扩展信号进行滤波来产生所述第二扩展信号,其中所述第二扩展信号的带宽对应于所述高频带频率范围。
6.根据权利要求5所述的方法,其进一步包含经由将所述非线性处理函数应用于所述低频带信号来产生所述第三扩展信号。
7.根据权利要求2所述的方法,其中所述第二扩展信号是经由将线性变换应用于第三扩展信号及选择对应于所述高频带频率范围的变换系数来产生。
8.根据权利要求7所述的方法,其中所述线性变换对应于离散余弦变换。
9.根据权利要求1所述的方法,其中所述输入音频信号是使用分析滤波器组分成至少所述低频带信号及所述高频带信号。
10.根据权利要求1所述的方法,其进一步包含确定与所述输入音频信号的帧相关联的参数,其中基于所述参数选择所述非线性处理函数,其中响应于确定所述参数满足第一条件而选择所述多个非线性处理函数中的第一非线性处理函数,且其中响应于确定所述参数满足第二条件而选择所述多个非线性处理函数中的第二非线性处理函数。
11.根据权利要求10所述的方法,其中所述第一非线性处理函数对应于低阶幂函数,
且其中所述第二非线性处理函数对应于高阶幂函数。
12.根据权利要求10所述的方法,其中与所述帧相关联的所述参数为经选择以编码所述低频带信号的写码模式、所述帧的周期性、所述帧中非周期性噪声的量及对应于所述帧的频谱倾斜中的一者。
13.根据权利要求1所述的方法,其中所述至少一个调整参数对应于与所述高频带信号相关联的至少一个增益调整参数。
14.一种方法,其包括:
在装置处,接收对应于输入音频信号的至少低频带信号的低频带数据;
解码所述低频带数据以产生合成低频带音频信号;
选择多个非线性处理函数中的非线性处理函数;及
基于所述合成低频带音频信号及所述非线性处理函数产生合成高频带音频信号。
15.根据权利要求14所述的方法,其进一步包含经由组合所述合成低频带音频信号及所述合成高频带音频信号来产生输出音频信号,其中所述输出音频信号的第一带宽大于所述合成低频带音频信号的第二带宽。
16.根据权利要求14所述的方法,其进一步包含经由混合噪声信号及第二扩展信号来产生第一扩展信号,其中基于所述第一扩展信号及至少一个调整参数产生所述合成高频带音频信号。
17.根据权利要求16所述的方法,其中第一比例的所述第二扩展信号及第二比例的所述噪声信号经混合,且其中所述第一比例及所述第二比例是基于所接收的谐波性参数或所述低频带数据中的至少一者确定。
18.根据权利要求16所述的方法,其中所述合成高频带音频信号是经由按与所述至少一个调整参数相关联的因子来按比例缩放所述第一扩展信号来产生。
19.根据权利要求16所述的方法,其进一步包含经由对第三扩展信号进行滤波来产生所述第二扩展信号,其中所述第二扩展信号对应于高频带频率范围。
20.根据权利要求16所述的方法,其中所述第二扩展信号是经由将线性变换应用于第三扩展信号及选择对应于高频带频率范围的变换系数来产生。
21.根据权利要求20所述的方法,其中所述线性变换对应于离散余弦变换。
22.根据权利要求20所述的方法,其进一步包含基于所述合成低频带音频信号及所述非线性处理函数产生所述第三扩展信号。
23.根据权利要求14所述的方法,其进一步包含基于所接收的参数或所述低频带数据选择所述非线性处理函数。
24.一种设备,其包含:
存储器;及
处理器,其经配置以进行以下操作:
将输入音频信号分成至少低频带信号及高频带信号,所述低频带信号对应于低频带频率范围且所述高频带信号对应于高频带频率范围;
选择多个非线性处理函数中的非线性处理函数;
基于所述低频带信号和所述非线性处理函数产生第一扩展信号;及
基于所述第一扩展信号、所述高频带信号或两者产生至少一个调整参数。
25.根据权利要求24所述的设备,其中所述第一扩展信号是经由混合噪声信号及第二扩展信号来产生,且其中所述至少一个调整参数是基于所述第一扩展信号及所述高频带信号确定。
26.根据权利要求25所述的设备,其中第一比例的所述噪声信号及第二比例的所述第二扩展信号经混合,且其中所述第一比例及所述第二比例是基于所述低频带信号、所述高频带信号或所述输入音频信号中的至少一者的谐波性确定。
27.根据权利要求26所述的设备,其中所述处理器经进一步配置以基于音频帧中所述输入音频信号的周期性的估计确定所述谐波性。
28.根据权利要求25所述的设备,其中所述处理器经进一步配置以经由对第三扩展信号进行滤波来产生所述第二扩展信号,其中所述第二扩展信号的带宽对应于所述高频带频率范围。
29.根据权利要求28所述的设备,其中所述处理器经进一步配置以经由将所述非线性处理函数应用于所述低频带信号来产生所述第三扩展信号。
30.根据权利要求25所述的设备,其中所述第二扩展信号是经由将线性变换应用于第三扩展信号及选择对应于所述高频带频率范围的变换系数来产生。
31.根据权利要求30所述的设备,其中所述线性变换对应于离散余弦变换。
32.根据权利要求24所述的设备,其中所述输入音频信号系使用分析滤波器组分成至少所述低频带信号及所述高频带信号。
33.根据权利要求24所述的设备,其中所述处理器经进一步配置以确定与所述输入音频信号的帧相关联的参数,其中基于所述参数选择所述非线性处理函数,其中响应于确定所述参数满足第一条件而选择所述多个非线性处理函数中的第一非线性处理函数,且其中响应于确定所述参数满足第二条件而选择所述多个非线性处理函数中的第二非线性处理函数。
34.根据权利要求33所述的设备,其中与所述帧相关联的所述参数为经选择以编码所述低频带信号的写码模式、所述帧的周期性、所述帧中非周期性噪声的量及对应于所述帧的频谱倾斜中的一者。
35.根据权利要求24所述的设备,其中所述多个非线性处理函数包括低阶幂函数及高阶幂函数。
36.根据权利要求24所述的设备,其中所述至少一个调整参数对应于与所述高频带信号相关联的至少一个增益调整参数。
37.根据权利要求24所述的设备,其中所述处理器集成到编码器系统中。
38.一种设备,其包含:
存储器;及
处理器,其经配置以进行以下操作:
接收对应于输入音频信号的至少低频带信号的低频带数据;
解码所述低频带数据以产生合成低频带音频信号;
选择多个非线性处理函数中的非线性处理函数;及
基于所述合成低频带音频信号及所述非线性处理函数产生合成高频带音频信号。
39.根据权利要求38所述的设备,其中所述处理器经进一步配置以经由组合所述合成低频带音频信号及所述合成高频带音频信号来产生输出音频信号,其中所述输出音频信号的第一带宽大于所述合成低频带音频信号的第二带宽。
40.根据权利要求38所述的设备,其中所述处理器经进一步配置以经由混合噪声信号及第二扩展信号来产生第一扩展信号,其中基于所述第一扩展信号及至少一个调整参数产生所述合成高频带音频信号。
41.根据权利要求40所述的设备,其中第一比例的所述第二扩展信号及第二比例的所述噪声信号经混合,且其中所述第一比例及所述第二比例是基于所接收的谐波性参数或所述低频带数据中的至少一者确定。
42.根据权利要求40所述的设备,其中所述合成高频带音频信号是经由按与所述至少一个调整参数相关联的因子来按比例缩放所述第一扩展信号来产生。
43.根据权利要求40所述的设备,其中所述处理器经进一步配置以经由对第三扩展信号进行滤波来产生所述第二扩展信号,其中所述第二扩展信号对应于高频带频率范围。
44.根据权利要求40所述的设备,其中所述第二扩展信号是经由将线性变换应用于第三扩展信号及选择对应于高频带频率范围的变换系数来产生。
45.根据权利要求44所述的设备,其中所述线性变换对应于离散余弦变换。
46.根据权利要求44所述的设备,其中所述处理器经进一步配置以基于所述合成低频带音频信号及所述非线性处理函数产生所述第三扩展信号。
47.根据权利要求38所述的设备,其中所述处理器经进一步配置以基于所接收的参数或所述低频带数据选择所述非线性处理函数。
48.根据权利要求38所述的设备,其中所述处理器集成到解码器系统中。
49.一种设备,其包含:
用于将输入音频信号分成至少低频带信号及高频带信号的装置,所述低频带信号对应于低频带频率范围且所述高频带信号对应于高频带频率范围;
用于选择多个非线性处理函数中的非线性处理函数的装置;
用于基于所述低频带信号及所述非线性处理函数产生第一扩展信号的第一装置;
及
用于基于所述第一扩展信号、所述高频带信号或两者产生至少一个调整参数的第二装置。
50.根据权利要求49所述的设备,其中所述第一扩展信号是经由混合噪声信号及第二扩展信号来产生,且其中所述至少一个调整参数是基于所述第一扩展信号及所述高频带信号确定。
51.根据权利要求50所述的设备,其中第一比例的所述噪声信号及第二比例的所述第二扩展信号经混合,且其中所述第一比例及所述第二比例是基于所述低频带信号、所述高频带信号或所述输入音频信号中的至少一者的谐波性确定。
52.一种设备,其包含:
用于接收对应于输入音频信号的至少低频带信号的低频带数据的装置;
用于解码所述低频带数据以产生合成低频带音频信号的装置;
用于选择多个非线性处理函数中的非线性处理函数的装置;及
用于基于所述合成低频带音频信号及所述非线性处理函数产生合成高频带音频信号的装置。
53.根据权利要求52所述的设备,其中所述低频带数据指示所述低频带信号的特性。
54.根据权利要求52所述的设备,其中所述合成高频带音频信号经由按与所述至少一个调整参数相关联的因子来按比例缩放第一扩展信号来产生。
55.一种计算机可读存储装置,其存储当由处理器执行时引起所述处理器执行包含以下各者的操作的指令:
将输入音频信号分成至少低频带信号及高频带信号,所述低频带信号对应于低频带频率范围且所述高频带信号对应于高频带频率范围;
选择多个非线性处理函数中的非线性处理函数;
基于所述低频带信号及所述非线性处理函数产生第一扩展信号;及
基于所述第一扩展信号、所述高频带信号或两者产生至少一个调整参数。
56.根据权利要求55所述的计算机可读存储装置,其中所述第一扩展信号是经由混合噪声信号及第二扩展信号来产生,且其中所述至少一个调整参数是基于所述第一扩展信号及所述高频带信号确定。
57.根据权利要求56所述的计算机可读存储装置,其中所述操作进一步包含:
经由对第三扩展信号进行滤波来产生所述第二扩展信号,其中所述第二扩展信号的带宽对应于所述高频带频率范围;及
经由将所述非线性处理函数应用于所述低频带信号来产生所述第三扩展信号。
58.一种计算机可读存储装置,其存储当由处理器执行时引起所述处理器执行包含以下各者的操作的指令:
接收对应于输入音频信号的至少低频带信号的低频带数据;
解码所述低频带数据以产生合成低频带音频信号;
选择多个非线性处理函数中的非线性处理函数;及
基于所述合成低频带音频信号及所述非线性处理函数产生合成高频带音频信号。
59.根据权利要求58所述的计算机可读存储装置,其中所述操作进一步包含确定与所述输入音频信号的帧相关联的参数,其中基于所述参数选择所述非线性处理函数。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461939585P | 2014-02-13 | 2014-02-13 | |
US61/939,585 | 2014-02-13 | ||
US14/617,524 US9564141B2 (en) | 2014-02-13 | 2015-02-09 | Harmonic bandwidth extension of audio signals |
US14/617,524 | 2015-02-09 | ||
PCT/US2015/015242 WO2015123210A1 (en) | 2014-02-13 | 2015-02-10 | Harmonic bandwidth extension of audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105981102A true CN105981102A (zh) | 2016-09-28 |
CN105981102B CN105981102B (zh) | 2019-11-12 |
Family
ID=53775460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580007190.2A Active CN105981102B (zh) | 2014-02-13 | 2015-02-10 | 音频信号的谐波带宽扩展 |
Country Status (25)
Country | Link |
---|---|
US (1) | US9564141B2 (zh) |
EP (1) | EP3105757B1 (zh) |
JP (1) | JP6290434B2 (zh) |
KR (1) | KR101827665B1 (zh) |
CN (1) | CN105981102B (zh) |
AU (1) | AU2015217340B2 (zh) |
BR (1) | BR112016018575B1 (zh) |
CA (1) | CA2936987C (zh) |
CL (1) | CL2016002009A1 (zh) |
DK (1) | DK3105757T3 (zh) |
ES (1) | ES2777282T3 (zh) |
HU (1) | HUE046891T2 (zh) |
IL (1) | IL246787B (zh) |
MX (1) | MX349848B (zh) |
MY (1) | MY180821A (zh) |
NZ (1) | NZ721890A (zh) |
PH (1) | PH12016501396A1 (zh) |
PL (1) | PL3105757T3 (zh) |
PT (1) | PT3105757T (zh) |
RU (1) | RU2651218C2 (zh) |
SA (1) | SA516371666B1 (zh) |
SG (1) | SG11201605412VA (zh) |
SI (1) | SI3105757T1 (zh) |
TW (1) | TWI559298B (zh) |
WO (1) | WO2015123210A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109791773A (zh) * | 2016-11-04 | 2019-05-21 | 惠普发展公司有限责任合伙企业 | 音频信号的主频率处理 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
US9858941B2 (en) * | 2013-11-22 | 2018-01-02 | Qualcomm Incorporated | Selective phase compensation in high band coding of an audio signal |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
US20160180860A1 (en) * | 2014-12-23 | 2016-06-23 | Qualcomm Incorporated | High order B-spline sampling rate conversion (SRC) |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
RU2714365C1 (ru) * | 2016-03-07 | 2020-02-14 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ гибридного маскирования: комбинированное маскирование потери пакетов в частотной и временной области в аудиокодеках |
EP3382704A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
CN110322882A (zh) * | 2019-05-13 | 2019-10-11 | 厦门亿联网络技术股份有限公司 | 一种生成混合语音数据的方法及系统 |
CN113963703A (zh) * | 2020-07-03 | 2022-01-21 | 华为技术有限公司 | 一种音频编码的方法和编解码设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006116025A1 (en) * | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
EP1739658A1 (en) * | 2005-06-28 | 2007-01-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Frequency extension of harmonic signals |
US20080027718A1 (en) * | 2006-07-31 | 2008-01-31 | Venkatesh Krishnan | Systems, methods, and apparatus for gain factor limiting |
EP1947644A1 (en) * | 2007-01-18 | 2008-07-23 | Harman Becker Automotive Systems GmbH | Method and apparatus for providing an acoustic signal with extended band-width |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0608269B8 (pt) | 2005-04-01 | 2019-09-03 | Qualcomm Inc | método e aparelho para quantização vetorial de uma representação de envelope espectral |
EP1772855B1 (en) * | 2005-10-07 | 2013-09-18 | Nuance Communications, Inc. | Method for extending the spectral bandwidth of a speech signal |
WO2010003557A1 (en) * | 2008-07-11 | 2010-01-14 | Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. | Apparatus and method for generating a bandwidth extended signal |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
EP2953131B1 (en) * | 2009-01-28 | 2017-07-26 | Dolby International AB | Improved harmonic transposition |
JP4892021B2 (ja) * | 2009-02-26 | 2012-03-07 | 株式会社東芝 | 信号帯域拡張装置 |
TWI675367B (zh) * | 2009-05-27 | 2019-10-21 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
BR112012022745B1 (pt) * | 2010-03-09 | 2020-11-10 | Fraunhofer - Gesellschaft Zur Föerderung Der Angewandten Forschung E.V. | dispositivo e método para resposta de magnitude aperfeiçoada e alinhamento temporal em um vocoder de fase com base no método de extenção da largura de banda para sinais de áudio |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
-
2015
- 2015-02-09 US US14/617,524 patent/US9564141B2/en active Active
- 2015-02-10 PT PT157066101T patent/PT3105757T/pt unknown
- 2015-02-10 KR KR1020167024534A patent/KR101827665B1/ko active IP Right Grant
- 2015-02-10 AU AU2015217340A patent/AU2015217340B2/en active Active
- 2015-02-10 MX MX2016010358A patent/MX349848B/es active IP Right Grant
- 2015-02-10 CA CA2936987A patent/CA2936987C/en active Active
- 2015-02-10 PL PL15706610T patent/PL3105757T3/pl unknown
- 2015-02-10 JP JP2016550268A patent/JP6290434B2/ja active Active
- 2015-02-10 CN CN201580007190.2A patent/CN105981102B/zh active Active
- 2015-02-10 TW TW104104441A patent/TWI559298B/zh active
- 2015-02-10 SI SI201531104T patent/SI3105757T1/sl unknown
- 2015-02-10 BR BR112016018575-7A patent/BR112016018575B1/pt active IP Right Grant
- 2015-02-10 MY MYPI2016702572A patent/MY180821A/en unknown
- 2015-02-10 RU RU2016133008A patent/RU2651218C2/ru active
- 2015-02-10 EP EP15706610.1A patent/EP3105757B1/en active Active
- 2015-02-10 WO PCT/US2015/015242 patent/WO2015123210A1/en active Application Filing
- 2015-02-10 ES ES15706610T patent/ES2777282T3/es active Active
- 2015-02-10 NZ NZ721890A patent/NZ721890A/en unknown
- 2015-02-10 DK DK15706610.1T patent/DK3105757T3/da active
- 2015-02-10 SG SG11201605412VA patent/SG11201605412VA/en unknown
- 2015-02-10 HU HUE15706610A patent/HUE046891T2/hu unknown
-
2016
- 2016-07-14 PH PH12016501396A patent/PH12016501396A1/en unknown
- 2016-07-14 IL IL246787A patent/IL246787B/en active IP Right Grant
- 2016-08-10 CL CL2016002009A patent/CL2016002009A1/es unknown
- 2016-08-11 SA SA516371666A patent/SA516371666B1/ar unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006116025A1 (en) * | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
EP1739658A1 (en) * | 2005-06-28 | 2007-01-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Frequency extension of harmonic signals |
US20080027718A1 (en) * | 2006-07-31 | 2008-01-31 | Venkatesh Krishnan | Systems, methods, and apparatus for gain factor limiting |
EP1947644A1 (en) * | 2007-01-18 | 2008-07-23 | Harman Becker Automotive Systems GmbH | Method and apparatus for providing an acoustic signal with extended band-width |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109791773A (zh) * | 2016-11-04 | 2019-05-21 | 惠普发展公司有限责任合伙企业 | 音频信号的主频率处理 |
CN109791773B (zh) * | 2016-11-04 | 2020-03-24 | 惠普发展公司,有限责任合伙企业 | 音频输出产生系统、音频通道输出方法和计算机可读介质 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105981102A (zh) | 音频信号的谐波带宽扩展 | |
CN102934163B (zh) | 用于宽带语音编码的系统、方法、设备 | |
US10297263B2 (en) | High band excitation signal generation | |
RU2636685C2 (ru) | Решение относительно наличия/отсутствия вокализации для обработки речи | |
RU2677453C2 (ru) | Способы, кодер и декодер для линейного прогнозирующего кодирования и декодирования звуковых сигналов после перехода между кадрами, имеющими различные частоты дискретизации | |
JP6526704B2 (ja) | オーディオ信号を処理するための方法、装置、およびコンピュータ可読媒体 | |
CN106663441A (zh) | 改进时域编码与频域编码之间的分类 | |
JP6174266B2 (ja) | ブラインド帯域幅拡張のシステムおよび方法 | |
JP6262337B2 (ja) | ハイバンド時間的特性の改善された追跡のための利得形状推定 | |
CN107787510A (zh) | 高频带信号产生 | |
JP6469664B2 (ja) | ハイバンド励振信号を生成するための混合係数の推定 | |
JP2016541032A5 (zh) | ||
JP2019191597A (ja) | ノイズ変調とゲイン調整とを実行するシステムおよび方法 | |
CN107112027A (zh) | 增益形状电路的按比例缩放 | |
CN104956437A (zh) | 执行增益控制的系统及方法 | |
CN105593935B (zh) | 使用经缩放的高频带激励对音频信号进行带宽扩展的方法、设备、装置、计算机可读媒体 | |
CN107818791A (zh) | 使用多个子频带的高频带信号译码 | |
CN106133832A (zh) | 在装置处切换译码技术的设备及方法 | |
CN105765653A (zh) | 自适应高通后滤波器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1224795 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |