CN103109319A - 确定音调循环能量及按比例缩放激励信号 - Google Patents

确定音调循环能量及按比例缩放激励信号 Download PDF

Info

Publication number
CN103109319A
CN103109319A CN2011800445692A CN201180044569A CN103109319A CN 103109319 A CN103109319 A CN 103109319A CN 2011800445692 A CN2011800445692 A CN 2011800445692A CN 201180044569 A CN201180044569 A CN 201180044569A CN 103109319 A CN103109319 A CN 103109319A
Authority
CN
China
Prior art keywords
section
electronic installation
signal
synthetic
energy parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800445692A
Other languages
English (en)
Other versions
CN103109319B (zh
Inventor
文卡特什·克里希南
斯特凡那·皮埃尔·维莱特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Priority to CN201510028662.4A priority Critical patent/CN104637487B/zh
Publication of CN103109319A publication Critical patent/CN103109319A/zh
Application granted granted Critical
Publication of CN103109319B publication Critical patent/CN103109319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/097Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明描述一种用于确定音调循环能量参数集合的电子装置。所述电子装置包括处理器及存储于存储器中的可执行指令。所述电子装置获得帧,获得滤波器系数集合且基于所述帧及所述滤波器系数集合而获得残余信号。所述电子装置基于所述残余信号而确定峰值位置集合,且将所述残余信号分段,使得每一区段包括一个峰值。所述电子装置基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合,且将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域,以产生映射。所述电子装置基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合。

Description

确定音调循环能量及按比例缩放激励信号
相关申请案
本申请案涉及2010年9月17日申请的题为“按比例缩放激励信号(SCALING ANEXCITATION SIGNAL)”的第61/384,106号美国临时专利申请案并主张其优先权。
技术领域
本发明大体上涉及信号处理。更具体来说,本发明涉及确定音调循环能量及按比例缩放激励信号。
背景技术
在过去的几十年中,电子装置的使用已变得常见。明确地说,电子技术的进步已降低了越来越复杂且有用的电子装置的成本。成本降低及消费者需求已使电子装置的使用激增,使得其在现代社会中实际上为普遍存在的。随着电子装置的使用扩大,对于电子装置的新的且改进的特征的需求也扩大。更具体来说,常常寻找更快、更有效或以更高质量执行功能的电子装置。
一些电子装置(例如,蜂窝式电话、智能电话、计算机等)使用音频或语音信号。这些电子装置可编码语音信号以供存储或发射。举例来说,蜂窝式电话使用麦克风捕获用户的话音或语音。举例来说,蜂窝式电话使用麦克风将声学信号转换成电子信号。接着可将此电子信号进行格式化以供发射到另一装置(例如,蜂窝式电话、智能电话、计算机等)或供存储。
举例来说,就带宽及/或存储资源来说,发射或发送未经压缩的语音信号可为代价较高的。存在试图更有效率地(例如,使用较少数据)表示语音信号的一些方案。然而,这些方案可能不会很好地表示语音信号的一些部分,从而导致降级的性能。如从前述论述可理解,改进信号译码的系统及方法可为有益的。
发明内容
揭示一种用于确定音调循环能量参数集合的电子装置。所述电子装置包括处理器及存储于与所述处理器电子通信的存储器中的指令。所述电子装置获得帧。所述电子装置还获得滤波器系数集合。所述电子装置另外基于所述帧及所述滤波器系数集合而获得残余信号。所述电子装置进一步基于所述残余信号而确定峰值位置集合。所述电子装置还将所述残余信号分段,使得所述残余信号的每一区段包括一个峰值。此外,所述电子装置基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合。所述电子装置另外将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域,以产生映射。所述电子装置还基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合。获得所述残余信号可进一步基于经量化滤波器系数集合。所述电子装置可获得所述经合成的激励信号。所述电子装置可为无线通信装置。
所述电子装置可发送所述第二音调循环能量参数集合。所述电子装置可使用所述帧及在当前帧之前的信号执行线性预测分析以获得所述滤波器系数集合,且可基于所述滤波器系数集合而确定经量化滤波器系数集合。
确定峰值位置集合可包括基于所述残余信号的样本的绝对值及窗口信号而计算包络信号,以及基于所述包络信号与所述包络信号的时间移位版本之间的差而计算第一梯度信号。确定峰值位置集合还可包括基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差而计算第二梯度信号,以及选择第二梯度信号值降低到第一阈值以下的第一位置索引集合。确定峰值位置集合可进一步包括通过消除包络值相对于所述包络中的最大值降低到第二阈值以下的位置索引来从所述第一位置索引集合确定第二位置索引集合,以及通过消除相对于相邻位置索引不满足差阈值的位置索引来从所述第二位置索引集合确定第三位置索引集合。
还描述一种用于按比例缩放激励的电子装置。所述电子装置包括处理器及存储于与所述处理器电子通信的存储器中的指令。所述电子装置获得经合成的激励信号、音调循环能量参数集合及音调滞后。所述电子装置还将所述经合成的激励信号分段成多个区段。所述电子装置另外对每一区段进行滤波以获得经合成的区段。所述电子装置进一步基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子。所述电子装置还使用比例因子来按比例缩放所述区段以获得经按比例缩放的区段。所述电子装置可为无线通信装置。
所述电子装置还可基于经按比例缩放的区段而合成音频信号且更新存储器。所述经合成的激励信号可经分段,使得每一区段含有一个峰值。所述经合成的激励信号可经分段,使得每一区段具有等于所述音调滞后的长度。所述电子装置还可确定所述区段中的每一者内的峰值数目且确定所述区段中的一者内的峰值数目是等于一还是大于一。
所述比例因子可根据方程式
Figure BDA00002923238900031
来确定。Sk,m可为第k个区段的比例因子,Ek可为所述第k个区段的音调循环能量参数,Lk可为所述第k个区段的长度,且xm可为针对滤波器输出m的经合成的区段。
所述比例因子可针对区段根据方程式
Figure BDA00002923238900032
来确定。如果区段内的峰值数目等于一,则Sk,m可为第k个区段的比例因子,Ek可为所述第k个区段的音调循环能量参数,Lk可为所述第k个区段的长度且xm可为针对滤波器输出m的经合成的区段。如果区段内的峰值数目大于一,则所述比例因子可针对区段基于包括至多一个峰值的范围来确定。
所述比例因子可针对区段根据方程式来确定。Sk,m可为第k个区段的比例因子,Ek可为所述第k个区段的音调循环能量参数,Lk可为所述第k个区段的长度,xm可为针对滤波器输出m的经合成的区段,且j及n可为根据方程式n-j≤Lk而选择以在所述区段内包括至多一个峰值的索引。
还揭示一种用于在电子装置上确定音调循环能量参数集合的方法。所述方法包括获得帧。所述方法还包括获得滤波器系数集合。所述方法进一步包括基于所述帧及所述滤波器系数集合而获得残余信号。所述方法另外包括基于所述残余信号而确定峰值位置集合。此外,所述方法包括将所述残余信号分段,使得所述残余信号的每一区段包括一个峰值。所述方法还包括基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合。所述方法另外包括将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域,以产生映射。所述方法进一步包括基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合。
还揭示一种用于在电子装置上按比例缩放激励的方法。所述方法包括获得经合成的激励信号、音调循环能量参数集合及音调滞后。所述方法还包括将所述经合成的激励信号分段成多个区段。所述方法进一步包括对每一区段进行滤波以获得经合成的区段。所述方法另外包括基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子。所述方法还包括使用所述比例因子来按比例缩放所述区段以获得经按比例缩放的区段。
还揭示一种用于确定音调循环能量参数集合的计算机程序产品。所述计算机程序产品包括具有指令的非暂时性有形计算机可读媒体。所述指令包括用于致使电子装置获得帧的代码。所述指令还包括用于致使所述电子装置获得滤波器系数集合的代码。所述指令进一步包括用于致使所述电子装置基于所述帧及所述滤波器系数集合而获得残余信号的代码。所述指令另外包括用于致使所述电子装置基于所述残余信号而确定峰值位置集合的代码。此外,所述指令包括用于致使所述电子装置将所述残余信号分段使得所述残余信号的每一区段包括一个峰值的代码。所述指令还包括用于致使所述电子装置基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合的代码。另外,所述指令包括用于致使所述电子装置将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域以产生映射的代码。所述指令进一步包括用于致使所述电子装置基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合的代码。
还揭示一种用于按比例缩放激励的计算机程序产品。所述计算机程序产品包括具有指令的非暂时性有形计算机可读媒体。所述指令包括用于致使电子装置获得经合成的激励信号、音调循环能量参数集合及音调滞后的代码。所述指令还包括用于致使所述电子装置将所述经合成的激励信号分段成多个区段的代码。所述指令进一步包括用于致使所述电子装置对每一区段进行滤波以获得经合成的区段的代码。所述指令另外包括用于致使所述电子装置基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子的代码。所述指令还包括用于致使所述电子装置使用比例因子按比例缩放所述区段以获得经按比例缩放的区段的代码。
还揭示一种用于确定音调循环能量参数集合的设备。所述设备包括用于获得帧的装置。所述设备还包括用于获得滤波器系数集合的装置。所述设备进一步包括用于基于所述帧及所述滤波器系数集合而获得残余信号的装置。所述设备另外包括用于基于所述残余信号而确定峰值位置集合的装置。此外,所述设备包括用于将所述残余信号分段使得所述残余信号的每一区段包括一个峰值的装置。所述设备还包括用于基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合的装置。另外,所述设备包括用于将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域以产生映射的装置。所述设备进一步包括用于基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合的装置。
还揭示一种用于按比例缩放激励的设备。所述设备包括用于获得经合成的激励信号、音调循环能量参数集合及音调滞后的装置。所述设备还包括用于将所述经合成的激励信号分段成多个区段的装置。所述设备进一步包括用于对每一区段进行滤波以获得经合成的区段的装置。所述设备另外包括用于基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子的装置。此外,所述设备包括用于使用比例因子来按比例缩放所述区段以获得经按比例缩放的区段的装置。
附图说明
图1为说明其中可实施用于确定音调循环能量及/或按比例缩放激励信号的系统及方法的电子装置的一个配置的框图;
图2为说明用于确定音调循环能量的方法的一个配置的流程图;
图3为说明其中可实施用于确定音调循环能量的系统及方法的编码器的一个配置的框图;
图4为说明用于确定音调循环能量的方法的较特定配置的流程图;
图5为说明其中可实施用于按比例缩放激励信号的系统及方法的解码器的一个配置的框图;
图6为说明音调同步增益按比例缩放及LPC合成块/模块的一个配置的框图;
图7为说明用于按比例缩放激励信号的方法的一个配置的流程图;
图8为说明用于按比例缩放激励信号的方法的较特定配置的流程图;
图9为说明其中可实施用于确定音调循环能量的系统及方法的电子装置的一个实例的框图;
图10为说明其中可实施用于按比例缩放激励信号的系统及方法的电子装置的一个实例的框图;
图11为说明其中可实施用于确定音调循环能量及/或按比例缩放激励信号的系统及方法的无线通信装置的一个配置的框图;
图12说明可用于电子装置中的各种组件;以及
图13说明可包括于无线通信装置内的特定组件。
具体实施方式
本文中所揭示的系统及方法可应用于多种电子装置。电子装置的实例包括话音记录器、摄像机、音频播放器(例如,移动图片专家小组1(MPEG-1)或MPEG-2音频层3(MP3)播放器)、视频播放器、音频记录器、桌上型计算机/膝上型计算机、个人数字助理(PDA)、游戏系统等。一种电子装置为通信装置,其可与另一装置通信。通信装置的实例包括电话、膝上型计算机、桌上型计算机、蜂窝式电话、智能电话、无线或有线调制解调器、电子阅读器、平板装置、游戏系统、蜂窝式电话基站或节点、接入点、无线网关及无线路由器。
电子装置或通信装置可根据特定工业标准而操作,例如国际电信联盟(ITU)标准及/或电气及电子工程师学会(IEEE)标准(例如,无线保真或“Wi-Fi”标准,例如802.11a、802.11b、802.11g、802.11n及/或802.11ac)。通信装置可遵照的标准的其它实例包括IEEE802.16(例如,微波接入全球互通或“WiMAX”)、第三代合作伙伴计划(3GPP)、3GPP长期演进(LTE)、全球移动电信系统(GSM)及其它标准(其中通信装置可被称为(例如)用户设备(UE)、节点B、演进型节点B(eNB)、移动装置、移动台、订户台、远程台、接入终端、移动终端、终端、用户终端、订户单元等)。虽然本文中所揭示的系统及方法中的一些系统及方法可能依据一个或一个以上标准来描述,但这不应限制本发明的范围,因为所述系统及方法可适用于许多系统及/或标准。
应注意,一些通信装置可以无线方式通信且/或可使用有线连接或链路来通信。举例来说,一些通信装置可使用以太网协议与其它装置通信。本文中所揭示的系统及方法可应用于以无线方式通信及/或使用有线连接或链路来通信的通信装置。在一个配置中,本文中所揭示的系统及方法可应用于使用卫星与另一装置通信的通信装置。
本文中所揭示的系统及方法可应用于如下描述的通信系统的一个实例。在此实例中,本文中所揭示的系统及方法可提供低位速率(例如,2千位/秒(Kbps))语音编码用于地球移动卫星空中接口(GMSA)卫星通信。更具体来说,本文中所揭示的系统及方法可用于集成的卫星及移动通信网路中。这些网络可提供无缝、透明、可共同操作且普遍存在的无线覆盖范围。基于卫星的服务可用于陆地覆盖范围不可达到的远程位置中的通信。举例来说,此服务可用于人为灾害或自然灾害、广播及/或船队管理以及资产跟踪。可使用L及/或S频带(无线)频谱。
在一个配置中,前向链路可使用1x演进数据优化(EV-DO)版本A空中接口作为用于空中卫星链路的基础技术。反向链路可使用频分多路复用(FDM)。举例来说,反向链路频谱的1.25兆赫(MHz)块可划分成192个窄带频道,每一窄带频道具有6.4千赫(kHz)的带宽。可限制反向链路数据速率。这可提出对于低位速率编码的需要。在一些情况下,例如,信道可能仅能够支持2.4Kbps。然而,在较佳信道条件下,2个FDM信道可能为可用的,从而有可能提供4.8Kbps发射。
在反向链路上,例如,可使用低位速率语音编码器。这可允许2Kbps的固定速率用于反向链路上的单一FDM信道指派的活动语音。在一个配置中,反向链路使用1/4卷积译码器用于基本信道译码。
在一些配置中,本文中揭示的系统及方法可用于一个或一个以上译码模式中。举例来说,可结合使用原型音调周期波形内插法的四分之一速率浊音译码或替代使用原型音调周期波形内插法的四分之一速率浊音编码而使用本文中所揭示的系统及方法。在原型音调周期波形内插法(PPPWI)中,原型波形可用以产生可替代实际波形的内插波形,从而允许减少的数目个样本产生重构的信号。举例来说,PPPWI可在全速率或四分之一速率下可用,且/或可产生时间同步输出。此外,可在PPPWI中在频域中执行量化。QQQ可用于浊音编码模式(而非(例如)FQQ(有效二分之一速率))中。QQQ为使用四分之一速率原型音调周期波形内插法(QPPP-WI)以40位/帧(有效地,2千位/秒(kbps))来编码三个连续浊音帧的译码型式。FQQ为分别使用全速率原型音调周期(PPP)、四分之一速率原型音调周期(QPPP)及QPPP来编码三个连续浊音帧的译码型式。这可实现4kbps的平均速率。后者可不用于2kbps声码器中。应注意,可以修改的方式使用四分之一速率原型音调周期(QPPP),其中不进行频域中的原型表示的振幅的差量编码且进行13位线谱频率(LSF)量化。在一个配置中,QPPP可使用13个位用于LSF,12个位用于原型波形振幅,6个位用于原型波形功率,7个位用于音调滞后及2个位用于模式,从而产生总共40个位。
在一些配置中,本文中所揭示的系统及方法可用于瞬时编码模式(其可提供QPPP所需的种子)。此瞬时编码模式(例如,在2Kbps声码器中)可使用统一模型用于译码上升瞬时、下降瞬时及浊音瞬时。瞬时译码模式可应用于(例如)可位于一个语音类别与另一语音类别之间的边界上的瞬时帧。举例来说,语音信号可从清音(例如,f、s、sh、th等)转变成浊音(例如,a、e、i、o、u等)。一些瞬时类型包括上升瞬时(例如,当从语音信号的清音部分转变到浊音部分时)、爆破音、浊音瞬时(例如,线性预测译码(LPC)改变及音调滞后变化)及下降瞬时(例如,当从语音信号的浊音部分转变到清音或静音部分(例如,词结尾)时)。
本文中所揭示的系统及方法描述译码一个或一个以上音频或语音帧。在一个配置中,本文中所揭示的系统及方法可使用残余中的峰值的分析及经合成的激励的线性预测译码(LPC)滤波。
本文中所揭示的系统及方法同时描述按比例缩放激励信号及对所述激励信号进行LPC滤波以匹配语音信号的能量轮廓。换句话说,本文中所揭示的系统及方法可使得能够通过经LPC滤波的激励的音调同步按比例缩放而合成语音。
基于LPC的语音译码器在解码器处使用合成滤波器以从经合成的激励信号产生经解码的语音。可按比例缩放此经合成的信号的能量以匹配正被译码的语音信号的能量。本文中所揭示的系统及方法描述以音调同步方式按比例缩放经合成的激励信号及对所述信号进行滤波。经合成的激励的此按比例缩放及滤波可针对如由分段算法确定的经合成的激励的每个音调期(pitch epoch)或在可作为音调滞后的函数的固定时间间隔上执行。这实现基于音调同步的按比例缩放及合成,因此改进经解码的语音质量。
如本文中所使用,例如“同时”、“匹配”及“同步”等术语可意味着或可不意味着准确性。举例来说,“同时”可意指或可不意指两个事件准确地同时发生。举例来说,其可意指两个事件的发生在时间上重叠。“匹配”可意指或可不意指准确匹配。“同步”可意指或可不意指事件正以精确同步的方式发生。相同解释可应用于前述术语的其它变型。
现参看各图描述各种配置,其中相同参考数字可指示功能上相似的元件。如本文中各图中大体描述及说明的系统及方法可以广泛多种不同配置来布置及设计。因此,如各图中所表示的若干配置的以下较详细描述并不希望限制如所主张的范围,而是仅表示系统及方法。
图1为说明其中可实施用于确定音调循环能量及/或按比例缩放激励信号的系统及方法的电子装置102的一个配置的框图。电子装置A102可包括编码器104。编码器104的一个实例为线性预测译码(LPC)编码器。编码器104可由电子装置A102使用以编码语音(或音频)信号106。举例来说,编码器104通过估计或产生可用以合成或解码语音信号106的参数集合而将语音信号106的帧110编码成“经压缩”格式。在一个配置中,这些参数可表示可用以合成语音信号106的音调(例如,频率)、振幅及共振峰(例如,共振)的估计。
电子装置A102可获得语音信号106。在一个配置中,电子装置A102通过使用麦克风捕获声学信号及/或对所述声学信号取样而获得语音信号106。在另一配置中,电子装置A102从另一装置(例如,蓝牙头戴式耳机、通用串行总线(USB)驱动器、安全数字(SD)卡、网络接口、无线麦克风等)接收语音信号106。可将语音信号106提供到成帧块/模块108。如本文中所使用,术语“块/模块”可用以指示可以硬件、软件或两者的组合实施特定元件。
电子装置A102可使用成帧块/模块108将语音信号106格式化(例如,划分、分段等)成一个或一个以上帧110(例如,一序列帧110)。举例来说,帧110可包括特定数目个语音信号106样本且/或包括某一时间量(例如,10到20毫秒)的语音信号106。帧110中的语音信号106可依据能量而变化。本文中所揭示的系统及方法可用以估计“目标”音调循环能量参数且/或使用音调循环能量参数按比例缩放激励以匹配来自语音信号106的能量。
在一些配置中,可根据帧110含有的信号而将帧110分类。举例来说,可将帧110分类为浊音帧、清音帧、静音帧或瞬时帧。本文中所揭示的系统及方法可应用于这些种类的帧中的一者或一者以上。
编码器104可使用线性预测译码(LPC)分析块/模块118来对帧110执行线性预测分析(例如,LPC分析)。应注意,另外或替代地,LPC分析块/模块118可使用来自先前帧110的一个或一个以上样本。
LPC分析块/模块118可产生一个或一个以上LPC或滤波器系数116。LPC或滤波器系数116的实例包括线谱频率(LSF)及线谱对(LSP)。可将滤波器系数116提供到残余确定块/模块112,所述残余确定块/模块112可用以确定残余信号114。举例来说,残余信号114可包括已使共振峰(例如,系数)或共振峰的效应从语音信号106移除的语音信号106的帧110。可将残余信号114提供到峰值搜索块/模块120及/或分段块/模块128。
峰值搜索块/模块120可搜索残余信号114中的峰值。换句话说,编码器104可搜索残余信号114中的峰值(例如,高能量的区域)。可识别这些峰值以获得包括一个或一个以上峰值位置的峰值列表或集合122。举例来说,可依据样本数目及/或时间来指定峰值列表或集合122中的峰值位置。下文给出关于获得峰值列表或集合122的更多细节。
可将峰值集合122提供到音调滞后确定块/模块124、分段块/模块128、峰值映射块/模块146及/或能量估计块/模块B150。音调滞后确定块/模块124可使用峰值集合122来确定音调滞后126。“音调滞后”可为帧110中的两个连续音调尖峰之间的“距离”。举例来说,可以样本数目及/或时间量来指定音调滞后126。在一些配置中,音调滞后确定块/模块124可使用峰值集合122或音调滞后候选者(其可为峰值122之间的距离)的集合来确定音调滞后126。举例来说,音调滞后确定块/模块124可使用平均或平滑算法来从候选者集合确定音调滞后126。可使用其它方法。可将由音调滞后确定块/模块124确定的音调滞后126提供到激励合成块/模块140、原型波形产生块/模块136、能量估计块/模块B150,且/或可从编码器104输出由音调滞后确定块/模块124确定的音调滞后126。
激励合成块/模块140可基于音调滞后126及由原型波形产生块/模块136提供的原型波形138而产生或合成激励144。原型波形产生块/模块136可基于频谱形状及/或音调滞后126而产生原型波形138。
激励合成块/模块140可将一个或一个以上经合成的激励峰值位置142的集合提供到峰值映射块/模块146。还可将峰值集合122(其为来自残余信号114的峰值集合122且不应与经合成的激励峰值位置142混淆)提供到峰值映射块/模块146。峰值映射块/模块146可基于峰值集合122及经合成的激励峰值位置142而产生映射148。更具体来说,可将残余信号114中的峰值122之间的区域映射到经合成的激励信号中的峰值142之间的区域。可使用此项技术中已知的动态编程技术来实现峰值映射。可将映射148提供到能量估计块/模块B150。
列表(1)中说明使用动态编程的峰值映射的一个实例。可使用动态编程来映射经合成的激励信号中的峰值PE与经修改的残余信号中的峰值
Figure BDA00002923238900101
可将两个10×10维度的矩阵(表示为scoremat及tracemat)初始化为0。接着可根据列表(1)中的伪码来填充这些矩阵。为简明起见,将
Figure BDA00002923238900102
称为PT,且PE及PT中的峰值数目分别由NE及NT表示。
Figure BDA00002923238900103
Figure BDA00002923238900111
接着由以下伪码来确定映射矩阵mapped_pks[i]:
Figure BDA00002923238900112
列表(1)
分段块/模块128可将残余信号114分段以产生经分段的残余信号130。举例来说,分段块/模块128可使用峰值位置集合122以便将残余信号114分段,使得每一区段包括仅一个峰值。换句话说,经分段的残余信号130中的每一区段可包括仅一个峰值。可将经分段的残余信号130提供到能量估计块/模块A132。
能量估计块/模块A132可确定或估计第一音调循环能量参数集合134。举例来说,能量估计块/模块A132可基于帧110的在两个连续峰值位置之间的一个或一个以上区域来估计第一音调循环能量参数集合134。举例来说,能量估计块/模块A132可使用经分段的残余信号130来估计第一音调循环能量参数集合134。举例来说,如果分段指示第一音调循环是在样本S1与S2之间,则那个音调循环的能量可通过S1与S2之间的所有样本的平方和来计算。可针对如由分段算法确定的每一音调循环来执行此计算。可将第一音调循环能量参数集合134提供到能量估计块/模块B150。
可将激励144、映射148、音调滞后126、峰值集合122、第一音调循环能量参数集合134及/或滤波器系数116提供到能量估计块/模块B150。能量估计块/模块B150可基于激励144、映射148、音调滞后126、峰值集合122、第一音调循环能量参数集合134及/或滤波器系数116而确定(例如,估计、计算等)第二音调循环能量参数(例如,增益、比例因子等)集合152。在一些配置中,可将第二音调循环能量参数集合152提供到TX/RX块/模块160且/或提供到解码器162。
编码器104可发送、输出或提供音调滞后126、滤波器系数116及/或音调循环能量参数152。在一个配置中,可使用音调滞后126、滤波器系数116及/或音调循环能量参数152来解码经编码的帧以便产生经解码的语音信号。可将音调滞后126、滤波器系数116及/或音调循环能量参数152发射到另一装置,将其存储及/或解码。
在一个配置中,电子装置A102包括TX/RX块/模块160。在此配置中,可将若干参数提供到TX/RX块/模块160。举例来说,可将音调滞后126、滤波器系数116及/或音调循环能量参数152提供到TX/RX块/模块160。TX/RX块/模块160可将音调滞后126、滤波器系数116及/或音调循环能量参数152格式化成适于发射的格式。举例来说,TX/RX块/模块160可将音调滞后126、滤波器系数116及/或音调循环能量参数152编码(不应与由编码器104提供的帧编码混淆)、调制、按比例缩放(例如,放大)及/或以其它方式格式化为一个或一个以上消息166。TX/RX块/模块160可将所述一个或一个以上消息166发射到另一装置(例如,电子装置B168)。可使用无线及/或有线连接或链路来发射所述一个或一个以上消息166。在一些配置中,所述一个或一个以上消息166可通过卫星、基站、路由器、交换器及/或其它装置或媒体来中继传递到电子装置B168。
电子装置B168可使用TX/RX块/模块170接收由电子装置A102发射的所述一个或一个以上消息166。TX/RX块/模块170可解码(不应与语音信号解码混淆)、解调及/或以其它方式解格式化所述一个或一个以上所接收的消息166以产生语音信号信息172。语音信号信息172可包含(例如)音调滞后、滤波器系数及/或音调循环能量参数。可将语音信号信息172提供到解码器174(例如,LPC解码器),其可产生(例如,解码)经解码或经合成的语音信号176。解码器174可包括按比例缩放及LPC合成块/模块178。所述按比例缩放及LPC合成块/模块178可使用(所接收的)语音信号信息(例如,滤波器系数、音调循环能量参数及/或基于音调滞后合成的经合成的激励)来产生经合成的语音信号176。可使用换能器(例如,扬声器)将经合成的语音信号176转换成声学信号(例如,输出),可将所述经合成的语音信号176存储于存储器中及/或发射到另一装置(例如,蓝牙头戴式耳机)。
在另一配置中,可将音调滞后126、滤波器系数116及/或音调循环能量参数152提供到解码器162(在电子装置A102上)。解码器162可使用音调滞后126、滤波器系数116及/或音调循环能量参数152来产生经解码或经合成的语音信号164。更具体来说,解码器162可包括按比例缩放及LPC合成块/模块154。所述按比例缩放及LPC合成块/模块154可使用滤波器系数116、音调循环能量参数152及/或经合成的激励(其是基于音调滞后126而合成)来产生经合成的语音信号164。举例来说,可使用扬声器来输出所述经合成的语音信号164,可将所述经合成的语音信号164存储于存储器中及/或发射到另一装置。举例来说,电子装置A102可为编码语音信号106并将其存储于存储器中的数字话音记录器,语音信号106接着可经解码以产生经合成的语音信号164。接着可使用换能器(例如,扬声器)将经合成的语音信号164转换成声学信号(例如,输出)。电子装置A102上的解码器162及电子装置B168上的解码器174可执行类似功能。
应注意几点。取决于配置,可或可不包括及/或使用说明为包括于电子装置A102中的解码器162。此外,结合电子装置A102而可使用或可不使用电子装置B168。此外,尽管将若干参数或若干种信息126、116、152说明为提供到TX/RX块/模块160及/或提供到解码器162,但这些参数或这些种类的信息126、116、152在发送到TX/RX块/模块160及/或解码器162之前可存储于或可不存储于存储器中。
图2为说明用于确定音调循环能量的方法200的一个配置的流程图。举例来说,电子装置102可执行图2中所说明的方法200,以便估计音调循环能量参数集合。电子装置102可获得(202)帧110。在一个配置中,电子装置102可通过使用麦克风捕获声学语音信号而获得电子语音信号106。另外或替代地,电子装置102可从另一装置接收语音信号106。电子装置102接着可将语音信号106格式化(例如,划分、分段等)成一个或一个以上帧110。帧110的一个实例可包括语音信号106的特定数目个样本或给定时间量(例如,10到20毫秒)。
电子装置102可获得(204)滤波器(例如,LPC)系数集合116。举例来说,电子装置102可对帧110执行LPC分析,以便获得(204)滤波器系数集合116。滤波器系数集合116可为(例如)线谱频率(LSF)或线谱对(LSP)。在一个配置中,电子装置102可使用先行缓冲器及含有语音信号106的在当前帧110之前的至少一个样本的缓冲器来获得LPC或滤波器系数116。
电子装置102可基于帧110及滤波器系数116而获得(206)残余信号114。举例来说,电子装置102可从当前帧110移除LPC或滤波器系数116(例如,共振峰)的效应以获得(206)残余信号114。
电子装置102可基于残余信号114而确定(208)峰值位置集合122。举例来说,电子装置102可搜索LPC残余信号114以确定(208)峰值位置集合122。举例来说,可依据时间及/或样本数目来描述峰值位置。
电子装置102可将残余信号114分段(210),使得每一区段含有一个峰值。举例来说,电子装置102可使用峰值位置集合122,以便从残余信号114形成一个或一个以上样本群组,其中每一样本群组包括一个峰值位置。在一个配置中,例如,区段可恰好在第一峰值之前开始到恰好第二峰值之前的样本。这可确保仅选择一个峰值。因此,区段的开始及/或结束点可出现在峰值之前的固定数目个样本处或恰好在峰值之前的振幅的局域最小值处。因此,电子装置102可将残余信号114分段(210)以产生经分段的残余信号130。
电子装置102可确定(212)(例如,估计)第一音调循环能量参数集合134。可基于两个连续(例如,相邻)峰值位置之间的帧区域来确定第一音调循环能量参数集合134。举例来说,电子装置102可使用经分段的残余信号130来估计第一音调循环能量参数集合134。
电子装置102可将残余信号中的峰值122之间的区域映射(214)到经合成的激励信号中的峰值142之间的区域。举例来说,将残余信号峰值122之间的区域映射(214)到经合成的激励信号峰值142之间的区域可产生映射148。可由电子装置102基于原型波形138及/或音调滞后126而获得(例如,合成)经合成的激励信号。
电子装置102可基于第一音调循环能量参数集合134及映射148而确定(216)(例如,计算、估计等)第二音调循环能量参数集合152。举例来说,可如下确定(216)第二音调循环能量参数集合。令第一能量集合(例如,第一音调循环能量参数集合)为对应于残余中的峰值位置P1、P2、P3、...、PN的E1、E2、E3、...、EN-1。换句话说,
Figure BDA00002923238900151
其中r(j)为残余。令峰值位置P1、P2、P3、...、PN映射到激励信号中的P′1、P′2、P′3、...、P′N位置。第二目标能量集合(例如,第二音调循环能量参数集合152)E′1、E′2、E′3、...、E′N-1可通过
Figure BDA00002923238900152
而导出,其中1≤k≤N-1。
电子装置102可存储、发送(例如,发射、提供)且/或使用第二音调循环能量参数集合152。举例来说,电子装置102可将第二音调循环能量参数集合152存储于存储器中。另外或替代地,电子装置102可将第二音调循环能量参数集合152发射到另一电子装置。另外或替代地,例如,电子装置102可使用第二音调循环能量参数集合152来解码或合成语音信号。
图3为说明其中可实施用于确定音调循环能量的系统及方法的编码器304的一个配置的框图。编码器304的一个实例为线性预测译码(LPC)编码器。编码器304可由电子装置102使用以编码语音(或音频)信号106。举例来说,编码器304通过估计或产生可用以合成或解码语音信号106的参数集合而将语音信号106的帧310编码成“经压缩”格式。在一个配置中,这些参数可表示可用以合成语音信号106的音调(例如,频率)、振幅及共振峰(例如,共振)的估计。
可将语音信号106格式化(例如,划分、分段等)成一个或一个以上帧310(例如,一序列帧310)。举例来说,帧310可包括特定数目个语音信号106样本且/或包括某一时间量(例如,10到20毫秒)的语音信号106。帧310中的语音信号106可依据能量而变化。本文中所揭示的系统及方法可用以估计“目标”音调循环能量参数,其可用以按比例缩放激励信号以匹配来自语音信号106的能量。
编码器304可使用线性预测译码(LPC)分析块/模块318来对当前帧310a执行线性预测分析(例如,LPC分析)。LPC分析块/模块318还可使用来自(语音信号106的)先前帧310b的一个或一个以上样本。
LPC分析块/模块318可产生一个或一个以上LPC或滤波器系数316。LPC或滤波器系数316的实例包括线谱频率(LSF)及线谱对(LSP)。可将滤波器系数316提供到系数量化块/模块380及LPC合成块/模块384。
系数量化块/模块380可量化滤波器系数316以产生经量化的滤波器系数382。可将经量化的滤波器系数382提供到残余确定块/模块312及能量估计块/模块B350,且/或可从编码器304提供或发送经量化的滤波器系数382。
经量化的滤波器系数382及来自当前帧310a的一个或一个以上样本可由残余确定块/模块312使用以确定残余信号314。举例来说,残余信号314可包括已使共振峰(例如,系数)或共振峰的效应从语音信号106移除的语音信号106的当前帧310a。可将残余信号314提供到规则化块/模块388。
规则化块/模块388可使残余信号314规则化,从而产生经修改的(例如,经规则化的)残余信号390。在题为“增强型可变速率编解码器,用于宽带展频数字系统的语音服务选项3、68、70及73(Enhanced Variable Rate Codec,Speech Service Options3,68,70,and73for Wideband Spread Spectrum Digital Systems)”的3GPP2文献C.S0014D的章节4.11.6中详细描述规则化的一个实例。基本上,规则化可使当前帧中的音调脉冲来回移动以将其与平滑演进的音调轮廓对齐。可将经修改的残余信号390提供到峰值搜索块/模块320、分段块/模块328及/或LPC合成块/模块384。LPC合成块/模块384可产生(例如,合成)经修改的语音信号386,可将所述信号提供到能量估计块/模块B350。经修改的语音信号386可被称为“经修改的”,因为其为从经规则化的残余导出的语音信号且因此并非原始语音,而是其经修改的版本。
峰值搜索块/模块320可搜索经修改的残余信号390中的峰值。换句话说,瞬时编码器304可搜索经修改的残余信号390中的峰值(例如,高能量的区域)。可识别这些峰值以获得包括一个或一个以上峰值位置的峰值列表或集合322。举例来说,可依据样本数目及/或时间来指定峰值列表或集合322中的峰值位置。
可将峰值集合322提供到音调滞后确定块/模块324、峰值映射块/模块346、分段块/模块328及/或能量估计块/模块B350。音调滞后确定块/模块324可使用峰值集合322来确定音调滞后326。“音调滞后”可为当前帧310a中的两个连续音调尖峰之间的“距离”。举例来说,可以样本数目及/或时间量来指定音调滞后326。在一些配置中,音调滞后确定块/模块324可使用峰值集合322或音调滞后候选者(其可为峰值322之间的距离)的集合来确定音调滞后326。举例来说,音调滞后确定块/模块324可使用平均或平滑算法来从候选者集合确定音调滞后326。可使用其它方法。可将由音调滞后确定块/模块324确定的音调滞后326提供到激励合成块/模块340、提供到能量估计块/模块B350、提供到原型波形产生块/模块336,且/或可从编码器304提供或发送由音调滞后确定块/模块324确定的音调滞后326。
激励合成块/模块340可基于音调滞后326及/或由原型波形产生块/模块336提供的原型波形338而产生或合成激励344。原型波形产生块/模块336可基于频谱形状及/或音调滞后326而产生原型波形338。
激励合成块/模块340可将一个或一个以上经合成的激励峰值位置342的集合提供到峰值映射块/模块346。还可将峰值集合322(其为来自残余信号314的峰值集合322且不应与经合成的激励峰值位置342混淆)提供到峰值映射块/模块346。峰值映射块/模块346可基于峰值集合322及经合成的激励峰值位置342而产生映射348。更具体来说,可将残余信号中的峰值322之间的区域映射到经合成的激励信号中的峰值342之间的区域。可将映射348提供到能量估计块/模块B350。
分段块/模块328可将经修改的残余信号390分段以产生经分段的残余信号330。举例来说,分段块/模块328可使用峰值位置集合322以便将残余信号314分段,使得每一区段包括仅一个峰值。换句话说,经分段的残余信号330中的每一区段可包括仅一个峰值。可将经分段的残余信号330提供到能量估计块/模块A332。
能量估计块/模块A332可确定或估计第一音调循环能量参数集合334。举例来说,能量估计块/模块A332可基于当前帧310a的在两个连续峰值位置之间的一个或一个以上区域来估计第一音调循环能量参数集合334。举例来说,能量估计块/模块A332可使用经分段的残余信号330来估计第一音调循环能量参数集合334。可将第一音调循环能量参数集合334提供到能量估计块/模块B350。应注意,可在每一音调循环处确定音调循环能量参数(在第一集合334中)。
可将激励344、映射348、峰值集合322、音调滞后326、第一音调循环能量参数集合334、经量化的滤波器系数382及/或经修改的语音信号386提供到能量估计块/模块B350。能量估计块/模块B350可基于激励344、映射348、峰值集合322、音调滞后326、第一音调循环能量参数集合334、经量化的滤波器系数382及/或经修改的语音信号386而确定(例如,估计、计算等)第二音调循环能量参数(例如,增益、比例因子等)集合352。在一些配置中,可将第二音调循环能量参数集合352提供到量化块/模块356,其量化第二音调循环能量参数集合352以产生经量化音调循环能量参数集合358。应注意,可在每一音调循环处确定音调循环能量参数(在第二集合352中)。
编码器304可发送、输出或提供音调滞后326、经量化的滤波器系数382及/或经量化的音调循环能量参数358。在一个配置中,可使用音调滞后326、经量化的滤波器系数382及/或经量化的音调循环能量参数358来解码经编码的帧以便产生经解码的语音信号。可将音调滞后326、经量化的滤波器系数382及/或经量化的音调循环能量参数358发射到另一装置,将其存储及/或解码。
图4为说明用于确定音调循环能量的方法400的更特定配置的流程图。举例来说,电子装置可执行图4中所说明的方法400以便估计或计算音调循环能量参数集合。电子装置可获得(402)帧310。在一个配置中,电子装置可通过使用麦克风捕获声学语音信号而获得电子语音信号。另外或替代地,电子装置可从另一装置接收语音信号。电子装置接着可将语音信号格式化(例如,划分、分段等)成一个或一个以上帧310。帧310的一个实例可包括语音信号的特定数目个样本或给定时间量(例如,10到20毫秒)。
电子装置可使用(当前)帧310a及在(当前)帧310a之前的信号(例如,来自先前帧310b的一个或一个以上样本)执行(404)线性预测分析,以获得滤波器(例如,LPC)系数集合316。举例来说,电子装置可使用先行缓冲器及含有语音信号的来自先前帧310b的至少一个样本的缓冲器,以获得滤波器系数316。
电子装置可基于滤波器系数集合316而确定(406)经量化滤波器(例如,LPC)系数集合382。举例来说,电子装置可量化滤波器系数集合316以确定(406)经量化滤波器系数集合382。
电子装置可基于(当前)帧310a及经量化的滤波器系数382而获得(408)残余信号314。举例来说,电子装置可从当前帧310a移除滤波器系数316(或经量化的滤波器系数382)的效应以获得(408)残余信号314。
电子装置可基于残余信号314(或经修改的残余信号390)而确定(410)峰值位置集合322。举例来说,电子装置可搜索LPC残余信号314以确定峰值位置集合322。举例来说,可依据时间及/或样本数目来描述峰值位置。
在一个配置中,电子装置可如下确定(410)峰值位置集合。电子装置可基于(LPC)残余信号314(或经修改的残余信号390)的样本的绝对值及预定窗口信号而计算包络信号。电子装置接着可基于包络信号与包络信号的时间移位版本之间的差而计算第一梯度信号。电子装置可基于第一梯度信号与第一梯度信号的时间移位版本之间的差而计算第二梯度信号。电子装置接着可选择第二梯度信号值降低到预定负(第一)阈值以下的第一位置索引集合。电子装置还可通过消除包络值相对于包络中的最大值降低到预定(第二)阈值以下的位置索引而从第一位置索引集合确定第二位置索引集合。另外,电子装置可通过消除相对于相邻位置索引不满足预定差阈值的位置索引而从第二位置索引集合确定第三位置索引集合。位置索引(例如,第一集合、第二集合及/或第三集合)可对应于经确定的峰值集合322的位置。
电子装置可将残余信号314(或经修改的残余信号390)分段(412),使得每一区段包括一个峰值。举例来说,电子装置可使用峰值位置集合322,以便从残余信号314(或经修改的残余信号390)形成一个或一个以上样本群组,其中每一样本群组包括一个峰值位置。换句话说,电子装置可将残余信号314分段(412)以产生经分段的残余信号330。
电子装置可确定(414)(例如,估计)第一音调循环能量参数集合334。可基于两个连续峰值位置之间的帧区域来确定第一音调循环能量参数集合334。举例来说,电子装置可使用经分段的残余信号330来估计第一音调循环能量参数集合334。
电子装置可将残余信号中的峰值322之间的区域映射(416)到经合成的激励信号中的峰值342之间的区域。举例来说,将残余信号峰值322之间的区域映射(416)到经合成的激励信号峰值342之间的区域可产生映射348。
电子装置可基于第一音调循环能量参数集合334及映射348而确定(418)(例如,计算、估计等)第二音调循环能量参数集合352。在一些配置中,电子装置可量化第二音调循环能量参数集合352。
电子装置可发送(例如,发射、提供)(420)第二音调循环能量参数集合352(或经量化的音调循环能量参数358)。举例来说,电子装置可将第二音调循环能量参数集合352(或经量化的音调循环能量参数358)发射到另一电子装置。另外或替代地,例如,电子装置可将第二音调循环能量参数集合352(或经量化的音调循环能量参数358)发送到解码器以便解码或合成语音信号。在一些配置中,电子装置可另外或替代地将第二音调循环能量参数集合352存储于存储器中。在一些配置中,电子装置还可将音调滞后326及/或经量化的滤波器系数382发送到解码器(在相同或不同的电子装置上)且/或发送到存储装置。
图5为说明其中可实施用于按比例缩放激励信号的系统及方法的解码器592的一个配置的框图。解码器592可包括激励合成块/模块598、分段块/模块503及/或音调同步增益按比例缩放及LPC合成块/模块509。解码器592的一个实例为LPC解码器。举例来说,解码器592可为如图1中所说明的解码器162、174。
解码器592可获得一个或一个以上音调循环能量参数507、先前帧残余594(其可从先前经解码的帧导出)、音调滞后596及滤波器系数511。举例来说,编码器104可提供音调循环能量参数507、音调滞后596及/或滤波器系数511。在一个配置中,此信息507、596、511可源自在与解码器592相同的电子装置上的编码器104。举例来说,解码器592可直接从编码器104接收信息507、596、511或可从存储器检索信息507、596、511。在另一配置中,信息507、596、511可源自在与解码器592不同的电子装置上的编码器104。举例来说,解码器592可从已从另一电子装置102接收信息507、596、511的接收器170获得信息507、596、511。
在一些配置中,可将音调循环能量参数507、音调滞后596及/或滤波器系数511作为参数来接收。更具体来说,解码器592可接收表示音调循环能量参数507、音调滞后参数596及/或滤波器系数参数511的参数。举例来说,可使用若干位来表示此信息507、596、511的每一类型。在一个配置中,可在包中接收这些位。所述位可由电子装置及/或解码器592来解包、解译、解格式化及/或解码,使得解码器592可使用信息507、596、511。在一个配置中,可如表(1)中所阐述为信息507、596、511分配位。
参数 位数目
滤波器系数511(例如,LSP或LSF) 18
音调滞后596 7
音调循环能量参数507 8
表(1)
应注意,除其它参数或信息之外或替代其它参数或信息,可发送这些参数511、596、507。
激励合成块/模块598可基于音调滞后596及/或先前帧残余594而合成激励501。可将经合成的激励信号501提供到分段块/模块503。分段块/模块503可将激励501分段以产生经分段的激励505。在一些配置中,分段块/模块503可将激励501分段,使得每一区段(经分段的激励505的每一区段)含有仅一个峰值。在其它配置中,分段块/模块503可基于音调滞后596将激励501分段。当基于音调滞后596分段激励501时,区段(经分段的激励505的区段)中的每一者可包括一个或一个以上峰值。
可将经分段的激励505提供到音调同步增益按比例缩放及LPC合成块/模块509。音调同步增益按比例缩放及LPC合成块/模块509可使用经分段的激励505、音调循环能量参数507及/或滤波器系数511来产生经合成或经解码的语音信号513。下文结合图6描述音调同步增益按比例缩放及LPC合成块/模块509的一个实例。可将经合成的语音信号513存储于存储器中,可使用扬声器输出经合成的语音信号513,且/或可将经合成的语音信号513发射到另一电子装置。
图6为说明音调同步增益按比例缩放及LPC合成块/模块609的一个配置的框图。图6中所说明的音调同步增益按比例缩放及LPC合成块/模块609可为图5中所展示的音调同步增益按比例缩放及LPC合成块/模块509的一个实例。如图6中所说明,音调同步增益按比例缩放及LPC合成块/模块609可包括一个或一个以上LPC合成滤波器617a到617c、一个或一个以上比例因子确定块/模块623a到623b及/或一个或一个以上乘法器627a到627b。
音调同步增益按比例缩放及LPC合成块/模块609可用以按比例缩放激励信号且在解码器处(及/或在一些配置中在编码器处)合成语音。音调同步增益按比例缩放及LPC合成块/模块609可获得或接收激励区段(例如,激励信号区段)615a、音调循环能量参数625及一个或一个以上滤波器(例如,LPC)系数。在一个配置中,激励区段615a可为激励信号的包括单一音调循环的区段。音调同步增益按比例缩放及LPC合成块/模块609可按比例缩放激励区段615a且基于音调循环能量参数625及所述一个或一个以上滤波器系数而合成(例如,解码)语音。举例来说,LPC系数可为对合成滤波器的输入。这些系数可用于自回归合成滤波器中以产生经合成的语音。音调同步增益按比例缩放及LPC合成块/模块609可在合成激励区段615a的同时试图将激励区段615a按比例缩放到原始语音的水平。在一些配置中,还可在编码语音信号的相同电子装置上进行这些程序,以便在编码器处维持经合成的语音613的某一记忆或复本以供将来分析或合成。
本文中所描述的系统及方法可通过使经解码的信号匹配原始语音的能量水平而有益地应用。举例来说,当不使用波形重构时,将经解码语音能量水平与原始语音匹配可为有益的。举例来说,在基于模型的重构中,精细按比例缩放激励以匹配原始语音水平可为有益的。
如上文所描述,编码器可确定每个音调循环上的能量且将所述信息传递到解码器。对于稳定的话音区段,能量可维持大致恒定。换句话说,在循环间,对于稳定的话音区段,能量可维持相当恒定。然而,可存在能量可能不恒定的其它瞬时区段。因此,可将那个轮廓发射到解码器,且发射的能量可为固定同步,其可意指将每一音调循环的一个唯一能量值从编码器发送到解码器。每一能量值表示音调循环的原始语音的能量。举例来说,如果帧中存在p个音调循环的集合,则可发射p个能量值(每一帧)。
图6中所说明的框图说明可针对音调循环或区段(例如,第k个循环或区段,其中1≤k≤p)执行的按比例缩放及合成。可将激励区段615a(例如,激励信号的循环)输入到LPC合成滤波器A617a(例如,LPC合成滤波器A617a)中。最初,LPC合成滤波器A617a的存储器619可为零。举例来说,存储器619可被“归零”。LPC合成滤波器A617a可产生第一经合成的区段621(例如,在按比例缩放之前的“第一切割”语音信号估计,其可表示为x1(i),其中i为第k个经合成的区段内的样本或索引编号)。
除当前区段的(目标)音调循环能量625(例如,Ek)之外,比例因子确定块/模块A623a还可使用第一经合成的区段(例如,x1(i))621,以便估计第一比例因子(例如,Sk)635a。(经合成的)激励区段615a可乘以第一比例因子635a以产生第一经按比例缩放的激励区段615b。
在图6中所说明的配置中,将音调同步按比例缩放及LPC合成块/模块609展示为以两级来实施。在第二级中,可进行与第一级类似的程序。然而,在第二级中,替代将零存储器用于LPC合成,可使用来自过去(例如,先前循环或先前帧)的存储器629。举例来说,对于第一循环(在帧中),可使用在先前帧结束时更新的存储器;对于第二循环,可使用在第一循环结束时更新的存储器,等等。因此,比例因子确定块/模块B623b可产生第二比例因子(例如,Sk)635b,且将从第一级得到第一经按比例缩放的激励区段615b并将其按比例缩放以获得第二经按比例缩放的激励区段615c。
可接着由LPC滤波器C617c使用第二经按比例缩放的激励区段615c执行LPC合成以产生经合成的语音区段613。经合成的语音区段613具有LPC频谱属性以及适当按比例缩放(其大致匹配原始语音信号)。
比例因子确定块/模块623a到623b可根据配置而起作用。在一个配置中(例如,当根据音调滞后将激励信号分段时),一些激励区段615a可具有一个以上峰值。在那个配置中,可执行帧内的峰值搜索。可进行此搜索以确保在比例因子计算中,使用仅一个峰值(例如,并非两个峰值或多个峰值)。因此,比例因子(例如,如下文在方程式3中所说明的Sk)的确定可使用基于不包括多个峰值的范围(例如,从j到n的索引)的求和。举例来说,假定使用具有两个峰值的激励区段。可使用将指示两个峰值的峰值搜索。仅可使用包括一个峰值的区域或范围。
此项技术中的其它方法可不执行显式峰值搜索以确保对多个峰值及按比例缩放的保护。在很大程度上,其它方法不仅对音调滞后长度而且对较大区段应用按比例缩放(但在一些配置中,合成方法自身可保证一个峰值)。在一些配置中,一般合成方法不保证在每个循环中存在一个峰值,因为音调滞后可中断或音调滞后可在区段内改变。换句话说,本文中所揭示的系统及方法可考虑多个峰值的可能性。
本文中所揭示的系统及方法的一个特征在于,按比例缩放及滤波可基于音调循环同步而进行。举例来说,其它方法可简单地按比例缩放残余并滤波,但那种方法可能会不匹配原始语音的能量。然而,本文中所揭示的系统及方法可有助于在每个音调循环期间(例如,当发送到解码器时)匹配原始语音的能量。一些传统方法可发射比例因子。然而,本文中的系统及方法可能不发射比例因子。而是,可发送能量指示符(例如,音调循环能量参数)。也就是说,传统方法可发射直接应用于激励信号的增益或比例因子,因此在一个步骤中按比例缩放激励。然而,在那种方法中音调循环的能量可能会不匹配。相反,本文中所揭示的系统及方法可有助于针对每个音调循环确保经解码的语音信号匹配原始语音的能量。
为清楚起见,下文给出音调同步增益按比例缩放及LPC合成块/模块609的更详细解释。LPC合成滤波器A617a可获得或接收激励区段615a。举例来说,激励区段615a可为激励信号的具有单一音调循环的长度的区段。最初,LPC合成滤波器A617a可使用零存储器输入619。LPC合成滤波器A617a可产生第一经合成的区段621。举例来说,可将第一经合成的区段621表示为x1(i)。可将来自LPC合成滤波器A617a的第一经合成的区段621提供到比例因子确定块/模块A623a。比例因子确定块/模块A623a可使用第一经合成的区段621(例如,x1(i))及音调循环能量输入(例如,Ek)625来产生第一比例因子(例如,Sk)635a。可将第一比例因子(例如,Sk)635a提供到第一乘法器627a。第一乘法器627a将激励区段615a乘以第一比例因子(例如,Sk)635a以产生第一经按比例缩放的激励区段615b。将第一经按比例缩放的激励区段615b(例如,第一乘法器627a输出)提供到LPC合成滤波器B617b及第二乘法器627b。
LPC合成滤波器B617b使用第一经按比例缩放的激励区段615b以及存储器输入629(来自先前操作)来产生第二经合成的区段(例如,x2(i))633,所述第二经合成的区段(例如,x2(i))633被提供到比例因子确定块/模块B623b。举例来说,存储器输入629可来自在先前帧结束时的存储器及/或来自先前音调循环。除音调循环能量输入(例如,Ek)625之外,比例因子确定块/模块B623b还使用第二经合成的区段(例如,x2(i))633,以便产生第二比例因子(例如,Sk)635b,所述第二比例因子(例如,Sk)635b被提供到第二乘法器627b。第二乘法器627b将第一经按比例缩放的激励区段615b乘以第二比例因子(例如,Sk)635b以产生第二经按比例缩放的激励区段615c。将第二经按比例缩放的激励区段615c提供到LPC合成滤波器C617c。除存储器输入629之外,LPC合成滤波器C617c还使用第二经按比例缩放的激励区段615c来产生经合成的语音信号613及存储器631以用于另外操作。
图7为说明用于按比例缩放激励信号的方法700的一个配置的流程图。所说明的方法700可使用经合成的(LPC)激励信号、音调循环能量参数集合、音调滞后及/或(LPC)滤波器系数集合。电子装置可获得(702)经合成的激励信号501、音调循环能量参数集合507、音调滞后596及/或滤波器系数集合511。举例来说,电子装置可基于音调滞后596及/或先前帧残余信号594而产生经合成的激励信号501。电子装置可产生音调滞后596或可从另一装置接收音调滞后596。
在一个配置中,电子装置可如上文结合图2或图4描述而产生或确定音调循环能量参数集合507。举例来说,音调循环能量参数集合507可为如上文描述而确定的第二音调循环能量参数集合。在另一配置中,电子装置可接收从另一装置发送的音调循环能量参数集合507。在一个配置中,电子装置可产生滤波器系数511。在另一配置中,电子装置可从另一装置接收滤波器系数511。
电子装置可将经合成的激励信号501分段(704)成多个区段。在一个配置中,电子装置可基于音调滞后596而将激励501分段(704)。举例来说,电子装置可将激励501分段(704)成与音调滞后596相同长度的多个区段。在另一配置中,电子装置可将激励501分段(704),使得每一区段含有一个峰值。
电子装置可对每一区段进行滤波(706)以获得经合成的区段。举例来说,电子装置可使用LPC合成滤波器及存储器输入对每一区段(例如,未经按比例缩放及/或经按比例缩放的区段)进行滤波(706)。举例来说,LPC合成滤波器可使用零存储器输入及/或来自先前操作(例如,来自先前音调循环或先前帧合成)的存储器输入。
电子装置可基于经合成的区段(例如,LPC滤波器输出)及音调循环能量参数集合而确定(708)比例因子。在一个配置中,在每一区段仅含有一个峰值的情况下,可如方程式(1)所说明来确定比例因子(例如,Sk)。
S k , m = E k Σ i = 0 L k x m ( i ) - - - ( 1 )
在方程式(1)中,Sk,m为第k个区段及第m个滤波器输出或级的比例因子,Ek为音调循环能量参数,Lk为第k个区段的长度且xm为经合成的区段(例如,LPC滤波器输出),其中m表示滤波器输出。举例来说,x1为一系列LPC合成滤波器中的第一滤波器输出且x2为一系列LPC合成滤波器中的第二滤波器输出。应注意,方程式(1)仅说明可确定(708)比例因子的方式的一个实例。可(例如)在区段包括一个以上峰值时使用其它方法来确定(708)比例因子。
电子装置可使用比例因子来按比例缩放(710)区段(经合成的激励的区段)以获得经按比例缩放的区段。举例来说,电子装置可将激励区段(例如,未经按比例缩放及/或经按比例缩放的激励区段)乘以一个或一个以上比例因子。举例来说,电子装置可首先将未经按比例缩放的激励区段乘以第一比例因子以获得第一经按比例缩放的区段。电子装置可接着将第一经按比例缩放的区段乘以第二比例因子以获得第二经按比例缩放的区段。
应注意,对每一区段进行滤波(706)、确定(708)比例因子及按比例缩放(710)区段可以不同于图7中所说明的次序来重复及/或执行。举例来说,电子装置可对区段615a进行滤波(706)以获得第一经合成的区段621,基于第一经合成的区段621而确定(708)第一比例因子635a,且使用比例因子635a来按比例缩放(710)区段615a以获得第一经按比例缩放的区段615b。可接着重复步骤706、708、710。举例来说,电子装置可接着对第一经按比例缩放的区段615b进行滤波706以获得第二经合成的区段633,基于第二经合成的区段633而确定(708)第二比例因子635b,且按比例缩放(710)第一经按比例缩放的区段615b以获得第二经按比例缩放的区段615c。因此,例如,电子装置可对区段615a进行滤波(706)以获得第一经合成的区段621,且可对所述第一经按比例缩放的区段615b(其是基于区段615a及经合成的区段621而获得)进行滤波(706)以获得第二经合成的区段633。此外,电子装置可分别基于第一经合成的区段621及第二经合成的区段633(除音调循环能量参数625之外)而确定(708)第一比例因子635a及第二比例因子635b。另外,电子装置可按比例缩放(710)区段615a(以获得第一经按比例缩放的区段615b)及第一经按比例缩放的区段615b(以获得第二经按比例缩放的区段615c)。
电子装置可基于经按比例缩放的区段合成(712)音频(例如,语音)信号。举例来说,电子装置可对经按比例缩放的激励区段进行LPC滤波,以便产生经合成的语音信号513。在一个配置中,LPC滤波器可使用经按比例缩放的区段及来自先前操作的存储器输入(例如,来自先前帧及/或来自先前音调循环的存储器)来产生经合成的语音信号513。
电子装置可更新(714)存储器。举例来说,电子装置可存储对应于经合成的语音信号的信息以便更新(714)合成滤波器存储器。
图8为说明用于按比例缩放激励信号的方法800的更特定配置的流程图。所说明的方法800可使用经合成的(LPC)激励信号、音调循环能量参数集合、音调滞后及/或(LPC)滤波器系数集合。电子装置可获得(802)经合成的激励信号501、音调循环能量参数集合507、音调滞后596及/或滤波器系数集合511。举例来说,电子装置可基于音调滞后596及/或先前帧残余信号594而产生经合成的激励信号501。电子装置可产生音调滞后596或可从另一装置接收音调滞后596。
在一个配置中,电子装置可如上文结合图2或图4所描述产生或确定音调循环能量参数集合507。举例来说,音调循环能量参数集合507可为如上文所描述而确定的第二音调循环能量参数集合。在另一配置中,电子装置可接收从另一装置发送的音调循环能量参数集合507。在一个配置中,电子装置可产生滤波器系数511。在另一配置中,电子装置可从另一装置接收滤波器系数511。
电子装置可将经合成的激励信号501分段(804)成多个区段,使得每一区段具有等于音调滞后596的长度。举例来说,电子装置可获得以样本数目或时间周期计的音调滞后596。电子装置可接着将经合成的激励信号的帧的部分分段、划分及/或指定成长度等于音调滞后596的一个或一个以上区段。
电子装置可确定(806)所述区段中的每一者内的峰值数目。举例来说,电子装置可搜索每一区段以确定(806)多少峰值(例如,一个或一个以上)包括于所述区段中的每一者内。在一个配置中,电子装置可基于区段而获得残余信号且发现残余内的高能量的区域。举例来说,残余中的满足一个或一个以上阈值的一个或一个以上点可为峰值。
电子装置可确定(808)每一区段的峰值数目是等于一还是大于一(例如,大于或等于二)。如果区段的峰值数目等于一,则电子装置可对所述区段进行滤波(810)以获得经合成的区段。电子装置还可基于经合成的区段及音调循环能量参数而确定(812)比例因子。在一个配置中,可如方程式(2)所说明而确定比例因子。
S k , m = E k Σ i = 0 L k x m ( i ) - - - ( 2 )
在方程式(2)中,Sk,m为第k个区段的比例因子,Ek为第k个区段的音调循环能量参数,Lk为第k个区段的长度且xm为经合成的区段(例如,LPC滤波器输出),其中m表示滤波器输出(例如,编号或索引)。举例来说,x1为若干(例如,一系列)LPC合成滤波器中的第一滤波器输出且x2为若干(例如,一系列)LPC合成滤波器中的第二滤波器输出。如可观察到,在此情况(例如,当区段中存在仅一个峰值时的情况)下可在区段的整个长度上执行方程式(2)的分母中的求和。
如果区段的峰值数目大于一,则电子装置可对所述区段进行滤波(814)以获得经合成的区段。电子装置还可基于经合成的区段及音调循环能量参数来确定(816)比例因子,所述经合成的区段是基于包括至多一个峰值的范围。在一个配置中,可如方程式(3)所说明而确定比例因子。
S k , m = E k Σ i = j n x m ( i ) - - - ( 3 )
在方程式(3)中,Sk,m为比例因子,Ek为音调循环能量参数,k为区段编号或索引,xm为经合成的区段,其中m表示滤波器输出。举例来说,x1为若干(例如,一系列)LPC合成滤波器中的第一经合成的区段(例如,滤波器输出)且x2为若干(例如,一系列)LPC合成滤波器中的第二经合成的区段(例如,滤波器输出)。此外,j及n为经选择以在激励内包括至多一个峰值的索引,如方程式(4)中所说明。
|n-j|≤Lk(4)
电子装置可使用比例因子按比例缩放(818)每一区段(经合成的激励的每一区段)以获得经按比例缩放的区段。举例来说,电子装置可将激励区段(例如,未经按比例缩放及/或经按比例缩放的激励区段)乘以一个或一个以上比例因子。举例来说,电子装置可首先将未经按比例缩放的激励区段615a乘以第一比例因子635a以获得第一经按比例缩放的区段615b。电子装置可接着将第一经按比例缩放的区段615b乘以第二比例因子635b以获得第二经按比例缩放的区段615c。
电子装置可基于经按比例缩放的区段合成(820)语音信号。举例来说,电子装置可对经按比例缩放的激励区段进行LPC滤波,以便产生经合成的语音信号513。在一个配置中,LPC滤波器可使用经按比例缩放的区段及来自先前操作的存储器输入(例如,来自先前帧及/或来自先前音调循环的存储器)来产生经合成的语音信号513。
电子装置可更新(822)存储器。举例来说,电子装置可存储对应于经合成的语音信号的信息以便更新(714)合成滤波器存储器。
图9为说明其中可实施用于确定音调循环能量的系统及方法的电子装置902的一个实例的框图。在此实例中,电子装置902包括预处理及噪声抑制块/模块937、模型参数估计块/模块941、速率确定块/模块939、第一切换块/模块943、静音编码器945、噪声激励线性预测(NELP)编码器947、瞬时编码器949、四分之一速率原型音调周期(QPPP)编码器951、第二切换块/模块953及包格式化块/模块955。
预处理及噪声抑制块/模块937可获得或接收语音信号906。在一个配置中,预处理及噪声抑制块/模块937可抑制语音信号906中的噪声且/或对语音信号906执行其它处理(例如,滤波)。将所得输出信号提供到模型参数估计块/模块941。
模型参数估计块/模块941可经由线性预测分析来估计LPC系数,估计第一近似音调滞后且估计在第一近似音调滞后处的自相关。速率确定块/模块939可确定用于编码语音信号906的译码速率。可将译码速率提供到解码器以供在解码(经编码的)语音信号906中使用。
电子装置902可确定哪一编码器用于编码语音信号906。应注意,例如,有时语音信号906可能并不总是含有实际语音,而是可能含有静音及/或噪声。在一个配置中,电子装置902可基于模型参数估计941而确定使用哪一编码器。举例来说,如果电子装置902在语音信号906中检测到静音,则电子装置902可使用第一切换块/模块943来引导(静音)语音信号通过静音编码器945。第一切换块/模块943可类似地用以基于模型参数估计941而切换语音信号906以供由NELP编码器947、瞬时编码器949或QPPP编码器951来编码。
静音编码器945可用一个或一个以上信息片段来编码或表示静音。举例来说,静音编码器945可产生表示语音信号906中静音的长度的参数。
噪声激励线性预测(NELP)编码器947可用以译码被分类为清音语音的帧。NELP译码依据信号再生而有效地操作,其中语音信号906具有极少音调结构或不具有音调结构。更具体来说,NELP可用以编码特性上与噪声相似的语音,例如清音语音或背景噪声。NELP使用经滤波的伪随机噪声信号来对清音语音建模。可通过在解码器处产生随机信号且将适当增益应用于其而重构这些语音区段的与噪声相似的特性。NELP可将简单模型用于经译码的语音,进而实现较低位速率。
瞬时编码器949可用以编码语音信号906中的瞬时帧。更具体来说,当检测到瞬时帧时,电子装置902可使用瞬时编码器949来编码语音信号906。在一个配置中,上文结合图1及3描述的编码器104、304可为瞬时编码器949的实例。举例来说,瞬时编码器949可确定音调循环能量参数,使得解码器可能够匹配来自瞬时帧中的原始语音信号906的能量轮廓。尽管将瞬时编码器949给定为本文中所揭示的系统及方法的一个可能应用,但应注意,本文中所揭示的系统及方法可应用于其它类型的编码器(例如,静音编码器945、NELP编码器947及/或例如QPPP编码器951等原型音调周期(PPP)编码器等)。
四分之一速率原型音调周期(QPPP)编码器951可用以译码被分类为浊音语音的帧。浊音语音含有由QPPP编码器951采用的缓慢时变周期分量。QPPP编码器951译码每一帧内的音调周期的子集。通过在这些原型周期之间进行内插而重构语音信号906的剩余周期。通过采用浊音语音的周期性,QPPP编码器951能够以感知上准确的方式再现语音信号906。
QPPP编码器951可使用原型音调周期波形内插法(PPPWI),所述原型音调周期波形内插法(PPPWI)可用以编码本质上为周期性的语音数据。此语音通过类似于“原型”音调周期(PPP)的不同音调周期来特征化。此PPP可为QPPP编码器951用以编码的话音信息。解码器可使用此PPP来重构语音区段中的其它音调周期。
第二切换块/模块953可用以将来自用以译码当前帧的编码器945、947、949、951的(经编码的)语音信号引导到包格式化块/模块955。包格式化块/模块955可将(经编码的)语音信号906格式化成一个或一个以上包957(例如,用于发射)。举例来说,包格式化块/模块955可格式化瞬时帧的包957。在一个配置中,可将由包格式化块/模块955产生的所述一个或一个以上包957发射到另一装置。
图10为说明其中可实施用于按比例缩放激励信号的系统及方法的电子装置1000的一个实例的框图。在此实例中,电子装置1000包括帧/位错误检测器1061、解包化块/模块1063、第一切换块/模块1065、静音解码器1067、噪声激励线性预测(NELP)解码器1069、瞬时解码器1071、四分之一速率原型音调周期(QPPP)解码器1073、第二切换块/模块1075及后滤波器1077。
电子装置1000可接收包1059。可将包1059提供到帧/位错误检测器1061及解包化块/模块1063。解包化块/模块1063可“解包”来自包1059的信息。举例来说,除有效负载数据之外,包1059还可包括标头信息、错误校正信息、路由信息及/或其它信息。解包化块/模块1063可从包1059提取有效负载数据。可将有效负载数据提供到第一切换块/模块1065。
帧/位错误检测器1061可检测是否错误地接收包1059的部分或全部。举例来说,帧/位错误检测器1061可使用错误检测码(随包1059一起发送)来确定是否错误地接收包1059的任一部分。在一些配置中,电子装置1000可基于是否错误地接收包1059的一些或全部(其可通过帧/位错误检测器1061输出而指示)来控制第一切换块/模块1065及/或第二切换块/模块1075。
另外或替代地,包1059可包括指示应使用哪一类型的解码器来解码有效负载数据的信息。举例来说,编码电子装置902可发送指示编码模式的两个位。(解码)电子装置1000可使用此指示来控制第一切换块/模块1065及第二切换块/模块1075。
电子装置1000可因此使用静音解码器1067、NELP解码器1069、瞬时解码器1071及/或QPPP解码器1073来解码来自包1059的有效负载数据。可接着将经解码的数据提供到第二切换块/模块1075,所述第二切换块/模块1075可将经解码的数据路由到后滤波器1077。后滤波器1077可对经解码的数据执行某一滤波且输出经合成的语音信号1079。
在一个实例中,包1059可指示(使用译码模式指示符)静音编码器945用以编码有效负载数据。电子装置1000可控制第一切换块/模块1065以将有效负载数据路由到静音解码器1067。可接着将经解码的(静音)有效负载数据提供到第二切换块/模块1075,所述第二切换块/模块1075可将经解码的有效负载数据路由到后滤波器1077。在另一实例中,NELP解码器1069可用以解码由NELP编码器947编码的语音信号(例如,清音语音信号)。
在另一实例中,包1059可指示有效负载数据是使用瞬时编码器949来编码的(例如,使用译码模式指示符)。因此,电子装置1000可使用第一切换块/模块1065来将有效负载数据路由到瞬时解码器1071。瞬时解码器1071可为上文结合图5所描述的解码器592的一个实例。因此,瞬时解码器1071可如上文描述解码有效负载数据。然而,应注意,本文中所揭示的系统及方法可应用于其它解码器,例如静音解码器1067、NELP解码器1069及/或原型音调周期(PPP)解码器(例如,QPPP解码器1073)。QPPP解码器1073可用以解码由QPPP编码器951编码的语音信号(例如,浊音语音信号)。
可将经解码的数据提供到第二切换块/模块1075,所述第二切换块/模块1075可将经解码的数据路由到后滤波器1077。后滤波器1077可对信号执行某一滤波,所述信号可经输出为经合成的语音信号1079。可接着存储经合成的语音信号1079,输出经合成的语音信号1079(例如,使用扬声器),且/或将经合成的语音信号1079发射到另一装置(例如,蓝牙头戴式耳机)。
图11为说明其中可实施用于确定音调循环能量及/或按比例缩放激励信号的系统及方法的无线通信装置1102的一个配置的框图。无线通信装置1102可包括应用程序处理器1193。应用程序处理器1193大体上处理指令(例如,执行程序)以执行无线通信装置上的功能。应用程序处理器1193可耦合到音频编码器/解码器(编解码器)1187。
音频编解码器1187可为用于编码及/或解码音频信号的电子装置(例如,集成电路)。音频编解码器1187可耦合到一个或一个以上扬声器1181、耳机1183、输出插孔1185及/或一个或一个以上麦克风1119。扬声器1181可包括将电信号或电子信号转换成声学信号的一个或一个以上电声换能器。举例来说,扬声器1181可用以播放音乐或输出扬声器电话会话等。耳机1183可为可用以将声学信号(例如,语音信号)输出到用户的另一扬声器或电声换能器。举例来说,可使用耳机1183,使得仅用户可以可靠地听到声学信号。输出插孔1185可用于将其它装置(例如,头戴耳机)耦合到无线通信装置1102以用于输出音频。扬声器1181、耳机1183及/或输出插孔1185可大体上用于输出来自音频编解码器1187的音频信号。所述一个或一个以上麦克风1119可为将声学信号(例如,用户的话音)转换成提供到音频编解码器1187的电信号或电子信号的声电换能器。
音频编解码器1187可包括音调循环能量确定块/模块1189。在一个配置中,音调循环能量确定块/模块1189包括于编码器中,例如上文结合图1及3描述的编码器104、304。音调循环能量确定块/模块1189可用以执行上文结合图2及4描述的用于根据本文中所揭示的系统及方法来确定音调循环能量参数集合的方法200、400中的一者或一者以上。
另外或替代地,音频编解码器1187可包括激励按比例缩放块/模块1191。在一个配置中,激励按比例缩放块/模块1191包括于解码器中,例如上文结合图5描述的解码器592。激励按比例缩放块/模块1191可执行上文结合图7及8描述的方法700、800中的一者或一者以上。
应用程序处理器1193还可耦合到电力管理电路1195。电力管理电路的一个实例为电力管理集成电路(PMIC),所述电力管理集成电路(PMIC)可用以管理无线通信装置1102的电力消耗。电力管理电路1195可耦合到电池1197。电池1197可大体上将电力提供到无线通信装置1102。
应用程序处理器1193可耦合到一个或一个以上输入装置1199以用于接收输入。输入装置1199的实例包括红外线传感器、图像传感器、加速度计、触控式传感器、小键盘等。输入装置1199可允许用户与无线通信装置1102交互。应用程序处理器1193还可耦合到一个或一个以上输出装置1101。输出装置1101的实例包括打印机、投影仪、屏幕、触觉装置等。输出装置1101可允许无线通信装置1102产生可由用户体验的输出。
应用程序处理器1193可耦合到应用程序存储器1103。应用程序存储器1103可为能够存储电子信息的任何电子装置。应用程序存储器1103的实例包括双数据速率同步动态随机存取存储器(DDRAM)、同步动态随机存取存储器(SDRAM)、快闪存储器等。应用程序存储器1103可为应用程序处理器1193提供存储。举例来说,应用程序存储器1103可存储数据及/或指令以用于在应用程序处理器1193上执行的程序的运行。
应用程序处理器1193可耦合到显示器控制器1105,所述显示器控制器1105又可耦合到显示器1117。显示器控制器1105可为用以在显示器1117上产生图像的硬件块。举例来说,显示器控制器1105可将来自应用程序处理器1193的指令及/或数据转译成可呈现于显示器1117上的图像。显示器1117的实例包括液晶显示器(LCD)面板、发光二极管(LED)面板、阴极射线管(CRT)显示器、等离子显示器等。
应用程序处理器1193可耦合到基带处理器1107。基带处理器1107大体上处理通信信号。举例来说,基带处理器1107可解调且/或解码所接收的信号。另外或替代地,基带处理器1107可编码且/或调制信号以为发射作准备。
基带处理器1107可耦合到基带存储器1109。基带存储器1109可为能够存储电子信息的任何电子装置,例如SDRAM、DDRAM、快闪存储器等。基带处理器1107可从基带存储器1109读取信息(例如,指令及/或数据)且/或将信息写入到基带存储器1109。另外或替代地,基带处理器1107可使用存储于基带存储器1109中的指令及/或数据来执行通信操作。
基带处理器1107可耦合到射频(RF)收发器1111。RF收发器1111可耦合到功率放大器1113及一个或一个以上天线1115。RF收发器1111可发射且/或接收射频信号。举例来说,RF收发器1111可使用功率放大器1113及一个或一个以上天线1115发射RF信号。RF收发器1111还可使用所述一个或一个以上天线1115接收RF信号。无线通信装置1102可为如本文中所描述的电子装置102、168、902、1000、1202或无线通信装置1300的一个实例。
图12说明可用于电子装置1200中的各种组件。所说明的组件可位于同一物理结构内或单独外壳或结构中。先前所描述的电子装置102、168、902、1000中的一者或一者以上可类似于电子装置1200而配置。电子装置1200包括处理器1227。处理器1227可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1227可被称为中央处理单元(CPU)。尽管仅单一处理器1227展示于图12的电子装置1200中,但在替代配置中,可使用处理器的组合(例如,ARM与DSP)。
电子装置1200还包括与处理器1227电子通信的存储器1221。也就是说,处理器1227可从存储器1221读取信息且/或将信息写入到存储器1221。存储器1221可为能够存储电子信息的任何电子组件。存储器1221可为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器包括在一起的机载存储器、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除PROM(EEPROM)、寄存器等(包括其组合)。
数据1225a及指令1223a可存储于存储器1221中。指令1223a可包括一个或一个以上程序、例程、子例程、函数、过程等。指令1223a可包括单一计算机可读语句或许多计算机可读语句。指令1223a可为可由处理器1227执行以实施上文所描述的方法200、400、700、800中的一者或一者以上。执行指令1223a可涉及使用存储于存储器1221中的数据1225a。图12展示加载到处理器1227中的一些指令1223b及数据1225b(其可来自指令1223a及数据1225a)。
电子装置1200还可包括一个或一个以上通信接口1231以用于与其它电子装置通信。通信接口1231可基于有线通信技术、无线通信技术或两者。不同类型的通信接口1231的实例包括串行端口、并行端口、通用串行总线(USB)、以太网适配器、IEEE1394总线接口、小型计算机系统接口(SCSI)总线接口、红外线(IR)通信端口、蓝牙无线通信适配器等。
电子装置1200还可包括一个或一个以上输入装置1233及一个或一个以上输出装置1237。不同种类的输入装置1233的实例包括键盘、鼠标、麦克风、远程控制装置、按钮、操纵杆、轨迹球、触控板、光笔等。举例来说,电子装置1200可包括用于捕获声学信号的一个或一个以上麦克风1235。在一个配置中,麦克风1235可为将声学信号(例如,话音、语音)转换成电信号或电子信号的换能器。不同种类的输出装置1237的实例包括扬声器、打印机等。举例来说,电子装置1200可包括一个或一个以上扬声器1239。在一个配置中,扬声器1239可为将电信号或电子信号转换成声学信号的换能器。通常可包括于电子装置1200中的一个特定类型的输出装置为显示装置1241。供本文中所揭示的配置使用的显示装置1241可利用任何合适的图像投影技术,例如阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、气体等离子、电致发光或其类似者。还可提供显示器控制器1243以用于将存储于存储器1221中的数据转换成展示于显示装置1241上的文本、图形及/或移动图像(在适当时)。
电子装置1200的各种组件可通过一个或一个以上总线耦合在一起,所述一个或一个以上总线可包括电力总线、控制信号总线、状态信号总线、数据总线等。为简单起见,各种总线在图12中说明为总线系统1229。应注意,图12说明电子装置1200的仅一个可能配置。可利用各种其它架构及组件。
图13说明可包括于无线通信装置1300中的特定组件。上文所描述的电子装置102、168、902、1000、1200及/或无线通信装置1102中的一者或一者以上可类似于图13中展示的无线通信装置1300而配置。
无线通信装置1300包括处理器1363。处理器1363可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1363可被称为中央处理单元(CPU)。虽然在图13的无线通信装置1300中展示仅单一处理器1363,但在替代配置中,可使用处理器的组合(例如,ARM与DSP)。
无线通信装置1300还包括与处理器1363电子通信的存储器1345(即,处理器1363可从存储器1345读取信息且/或将信息写入到存储器1345)。存储器1345可为能够存储电子信息的任何电子组件。存储器1345可为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器包括在一起的机载存储器、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除PROM(EEPROM)、寄存器等(包括其组合)。
数据1347及指令1349可存储于存储器1345中。指令1349可包括一个或一个以上程序、例程、子例程、函数、过程、代码等。指令1349可包括单一计算机可读语句或许多计算机可读语句。指令1349可为可由处理器1363执行以实施上文所描述的方法200、400、700、800中的一者或一者以上。执行指令1349可涉及使用存储于存储器1345中的数据1347。图13展示加载到处理器1363中的一些指令1349a及数据1347a(其可来自指令1349及数据1347)。
无线通信装置1300还可包括发射器1359及接收器1361以允许信号在无线通信装置1300与远程位置(例如,另一电子装置、无线通信装置等)之间进行发射及接收。发射器1359及接收器1361可共同地被称为收发器1357。天线1365可电耦合到收发器1357。无线通信装置1300还可包括(未图示)多个发射器、多个接收器、多个收发器及/或多个天线。
在一些配置中,无线通信装置1300可包括用于捕获声学信号的一个或一个以上麦克风1351。在一个配置中,麦克风1351可为将声学信号(例如,话音、语音)转换成电信号或电子信号的换能器。另外或替代地,无线通信装置1300可包括一个或一个以上扬声器1353。在一个配置中,扬声器1353可为将电信号或电子信号转换成声学信号的换能器。
无线通信装置1300的各种组件可通过一个或一个以上总线耦合在一起,所述一个或一个以上总线可包括电力总线、控制信号总线、状态信号总线、数据总线等。为简单起见,各种总线在图13中说明为总线系统1355。
在上述描述中,有时结合各种术语使用参考数字。在结合参考数字使用术语的情况下,这可打算指代各图中的一者或一者以上中展示的特定元件。在使用术语而无参考数字的情况下,这可打算大体上指代不限于任何特定图的术语。
术语“确定”涵盖广泛多种动作且因此,“确定”可包括推算、计算、处理、导出、调查、查找(例如,在表、数据库或另一数据结构中查找)、查明及其类似动作。而且,“确定”可包括接收(例如,接收信息)、存取(例如,存取存储器中的数据)及其类似动作。而且,“确定”可包括解析、选择、挑选、建立及其类似动作。
除非另有明确指定,否则短语“基于”并不意指“仅基于”。换句话说,短语“基于”描述“仅基于”与“至少基于”两者。
本文中所描述的功能可作为一个或一个以上指令而存储于处理器可读或计算机可读媒体上。术语“计算机可读媒体”指代可由计算机或处理器存取的任何可用媒体。借助于实例而非限制,此媒体可包含RAM、ROM、EEPROM、快闪存储器、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及
Figure BDA00002923238900351
光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。应注意,计算机可读媒体可为有形的且非暂时性的。术语“计算机程序产品”指代结合代码或指令(例如,“程序”)的计算装置或处理器,所述代码或指令可由所述计算装置或处理器执行、处理或计算。如本文中所使用,术语“代码”可指代可由计算装置或处理器执行的软件、指令、代码或数据。
还可经由传输媒体传输软件或指令。举例来说,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术而从网站、服务器或其它远程源传输,则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包括于传输媒体的定义中。
本文中所揭示的方法包含用于实现所描述方法的一个或一个以上步骤或动作。所述方法步骤及/或动作可在不脱离权利要求书的范围的情况下彼此互换。换句话说,除非所描述的方法的适当操作需要步骤或动作的特定次序,否则可在不脱离权利要求书的范围的情况下修改特定步骤及/或动作的次序及/或使用。
应理解,权利要求书不限于上文所说明的精确配置及组件。在不脱离权利要求书的范围的情况下,可在本文中所描述的系统、方法及设备的布置、操作及细节方面作出各种修改、改变及变更。

Claims (48)

1.一种用于确定音调循环能量参数集合的电子装置,其包含:
处理器;
与所述处理器电子通信的存储器;
存储于所述存储器中的指令,所述指令可执行以:
获得帧;
获得滤波器系数集合;
基于所述帧及所述滤波器系数集合而获得残余信号;
基于所述残余信号而确定峰值位置集合;
将所述残余信号分段,使得所述残余信号的每一区段包括一个峰值;
基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合;
将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域,以产生映射;及
基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合。
2.根据权利要求1所述的电子装置,其中所述指令进一步可执行以发送所述第二音调循环能量参数集合。
3.根据权利要求1所述的电子装置,其中所述指令进一步可执行以:
使用所述帧及在当前帧之前的信号来执行线性预测分析以获得所述滤波器系数集合;及
基于所述滤波器系数集合而确定经量化滤波器系数集合。
4.根据权利要求3所述的电子装置,其中获得所述残余信号进一步基于所述经量化滤波器系数集合。
5.根据权利要求1所述的电子装置,其中所述指令进一步可执行以获得所述经合成的激励信号。
6.根据权利要求1所述的电子装置,其中确定峰值位置集合包含:
基于所述残余信号的样本的绝对值及窗口信号而计算包络信号;
基于所述包络信号与所述包络信号的时间移位版本之间的差而计算第一梯度信号;
基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差而计算第二梯度信号;
选择其中第二梯度信号值降低到第一阈值以下的第一位置索引集合;
通过消除其中包络值相对于包络中的最大值降低到第二阈值以下的位置索引而从所述第一位置索引集合确定第二位置索引集合;及
通过消除相对于相邻位置索引不满足差阈值的位置索引而从所述第二位置索引集合确定第三位置索引集合。
7.根据权利要求1所述的电子装置,其中所述电子装置为无线通信装置。
8.一种用于按比例缩放激励的电子装置,其包含:
处理器;
与所述处理器电子通信的存储器;
存储于所述存储器中的指令,所述指令可执行以:
获得经合成的激励信号、音调循环能量参数集合及音调滞后;
将所述经合成的激励信号分段成多个区段;
对每一区段进行滤波以获得经合成的区段;
基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子;及
使用所述比例因子来按比例缩放所述区段以获得经按比例缩放的区段。
9.根据权利要求8所述的电子装置,其中所述指令进一步可执行以:
基于所述经按比例缩放的区段而合成音频信号;及
更新存储器。
10.根据权利要求8所述的电子装置,其中所述经合成的激励信号被分段,使得每一区段含有一个峰值。
11.根据权利要求10所述的电子装置,其中所述比例因子是根据方程式
Figure FDA00002923238800031
来确定,其中Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,且xm为针对滤波器输出m的经合成的区段。
12.根据权利要求8所述的电子装置,其中所述经合成的激励信号被分段,使得每一区段具有等于所述音调滞后的长度。
13.根据权利要求12所述的电子装置,其中所述指令进一步可执行以:
确定所述区段中的每一者内的峰值数目;及
确定所述区段中的一者内的所述峰值数目是等于一还是大于一。
14.根据权利要求13所述的电子装置,其中所述比例因子是针对区段根据方程式
Figure FDA00002923238800032
来确定,其中如果所述区段内的所述峰值数目等于一,则Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,且xm为针对滤波器输出m的经合成的区段。
15.根据权利要求13所述的电子装置,其中如果所述区段内的所述峰值数目大于一,则所述比例因子是针对区段基于包括至多一个峰值的范围而确定。
16.根据权利要求15所述的电子装置,其中所述比例因子是针对区段根据方程式来确定,其中Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,xm为针对滤波器输出m的经合成的区段,且j及n为根据方程式|n-j|≤Lk而选择以在所述区段内包括至多一个峰值的索引。
17.根据权利要求8所述的电子装置,其中所述电子装置为无线通信装置。
18.一种用于在电子装置上确定音调循环能量参数集合的方法,其包含:
获得帧;
获得滤波器系数集合;
基于所述帧及所述滤波器系数集合而获得残余信号;
基于所述残余信号而确定峰值位置集合;
将所述残余信号分段,使得所述残余信号的每一区段包括一个峰值;
基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合;
将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域,以产生映射;及
基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合。
19.根据权利要求18所述的方法,其进一步包含发送所述第二音调循环能量参数集合。
20.根据权利要求18所述的方法,其进一步包含:
使用所述帧及在当前帧之前的信号来执行线性预测分析以获得所述滤波器系数集合;及
基于所述滤波器系数集合而确定经量化滤波器系数集合。
21.根据权利要求20所述的方法,其中获得所述残余信号进一步基于所述经量化滤波器系数集合。
22.根据权利要求18所述的方法,其进一步包含获得所述经合成的激励信号。
23.根据权利要求18所述的方法,其中确定峰值位置集合包含:
基于所述残余信号的样本的绝对值及窗口信号而计算包络信号;
基于所述包络信号与所述包络信号的时间移位版本之间的差而计算第一梯度信号;
基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差而计算第二梯度信号;
选择第二梯度信号值降低到第一阈值以下的第一位置索引集合;
通过消除包络值相对于包络中的最大值降低到第二阈值以下的位置索引而从所述第一位置索引集合确定第二位置索引集合;及
通过消除相对于相邻位置索引不满足差阈值的位置索引而从所述第二位置索引集合确定第三位置索引集合。
24.根据权利要求18所述的方法,其中所述电子装置为无线通信装置。
25.一种用于在电子装置上按比例缩放激励的方法,其包含:
获得经合成的激励信号、音调循环能量参数集合及音调滞后;
将所述经合成的激励信号分段成多个区段;
对每一区段进行滤波以获得经合成的区段;
基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子;及
使用所述比例因子来按比例缩放所述区段以获得经按比例缩放的区段。
26.根据权利要求25所述的方法,其进一步包含:
基于所述经按比例缩放的区段而合成音频信号;及
更新存储器。
27.根据权利要求25所述的方法,其中将所述经合成的激励信号分段,使得每一区段含有一个峰值。
28.根据权利要求27所述的方法,其中根据方程式
Figure FDA00002923238800051
来确定所述比例因子,其中Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,且xm为针对滤波器输出m的经合成的区段。
29.根据权利要求25所述的方法,其中将所述经合成的激励信号分段,使得每一区段具有等于所述音调滞后的长度。
30.根据权利要求29所述的方法,其进一步包含:
确定所述区段中的每一者内的峰值数目;及
确定所述区段中的一者内的所述峰值数目是等于一还是大于一。
31.根据权利要求30所述的方法,其中针对区段根据方程式
Figure FDA00002923238800061
来确定所述比例因子,其中如果所述区段内的所述峰值数目等于一,则Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,且xm为针对滤波器输出m的经合成的区段。
32.根据权利要求30所述的方法,其中如果所述区段内的所述峰值数目大于一,则针对区段基于包括至多一个峰值的范围而确定所述比例因子。
33.根据权利要求32所述的方法,其中针对区段根据方程式来确定所述比例因子,其中Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,xm为针对滤波器输出m的经合成的区段,且j及n为根据方程式n-j≤Lk而选择以在所述区段内包括至多一个峰值的索引。
34.根据权利要求25所述的方法,其中所述电子装置为无线通信装置。
35.一种用于确定音调循环能量参数集合的计算机程序产品,其包含上面具有指令的非暂时性有形计算机可读媒体,所述指令包含:
用于致使电子装置获得帧的代码;
用于致使所述电子装置获得滤波器系数集合的代码;
用于致使所述电子装置基于所述帧及所述滤波器系数集合而获得残余信号的代码;
用于致使所述电子装置基于所述残余信号而确定峰值位置集合的代码;
用于致使所述电子装置将所述残余信号分段使得所述残余信号的每一区段包括一个峰值的代码;
用于致使所述电子装置基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合的代码;
用于致使所述电子装置将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域以产生映射的代码;及
用于致使所述电子装置基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合的代码。
36.根据权利要求35所述的计算机程序产品,所述指令进一步包含用于致使所述电子装置发送所述第二音调循环能量参数集合的代码。
37.一种用于按比例缩放激励的计算机程序产品,其包含上面具有指令的非暂时性有形计算机可读媒体,所述指令包含:
用于致使电子装置获得经合成的激励信号、音调循环能量参数集合及音调滞后的代码;
用于致使所述电子装置将所述经合成的激励信号分段成多个区段的代码;
用于致使所述电子装置对每一区段进行滤波以获得经合成的区段的代码;
用于致使所述电子装置基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子的代码;及
用于致使所述电子装置使用所述比例因子来按比例缩放所述区段以获得经按比例缩放的区段的代码。
38.根据权利要求37所述的计算机程序产品,其中所述经合成的激励信号被分段,使得每一区段具有等于所述音调滞后的长度。
39.根据权利要求38所述的计算机程序产品,所述指令进一步包含:
用于致使所述电子装置确定所述区段中的每一者内的峰值数目的代码;及
用于致使所述电子装置确定所述区段中的一者内的所述峰值数目是等于一还是大于一的代码。
40.根据权利要求39所述的计算机程序产品,其中所述比例因子是针对区段根据方程式
Figure FDA00002923238800081
来确定,其中如果所述区段内的所述峰值数目等于一,则Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,且xm为针对滤波器输出m的经合成的区段。
41.根据权利要求39所述的计算机程序产品,其中如果所述区段内的所述峰值数目大于一,则所述比例因子是针对区段基于包括至多一个峰值的范围而确定。
42.一种用于确定音调循环能量参数集合的设备,其包含:
用于获得帧的装置;
用于获得滤波器系数集合的装置;
用于基于所述帧及所述滤波器系数集合而获得残余信号的装置;
用于基于所述残余信号而确定峰值位置集合的装置;
用于将所述残余信号分段使得所述残余信号的每一区段包括一个峰值的装置;
用于基于两个连续峰值位置之间的帧区域而确定第一音调循环能量参数集合的装置;
用于将所述残余信号中的峰值之间的区域映射到经合成的激励信号中的峰值之间的区域以产生映射的装置;及
用于基于所述第一音调循环能量参数集合及所述映射而确定第二音调循环能量参数集合的装置。
43.根据权利要求42所述的设备,其进一步包含用于发送所述第二音调循环能量参数集合的装置。
44.一种用于按比例缩放激励的设备,其包含:
用于获得经合成的激励信号、音调循环能量参数集合及音调滞后的装置;
用于将所述经合成的激励信号分段成多个区段的装置;
用于对每一区段进行滤波以获得经合成的区段的装置;
用于基于所述经合成的区段及所述音调循环能量参数集合而确定比例因子的装置;及
用于使用所述比例因子来按比例缩放所述区段以获得经按比例缩放的区段的装置。
45.根据权利要求44所述的设备,其中所述用于将所述经合成的激励信号分段的装置包含用于将所述经合成的激励信号分段使得每一区段具有等于所述音调滞后的长度的装置。
46.根据权利要求45所述的设备,其进一步包含:
用于确定所述区段中的每一者内的峰值数目的装置;及
用于确定所述区段中的一者内的所述峰值数目是等于一还是大于一的装置。
47.根据权利要求46所述的设备,其中所述用于确定所述比例因子的装置包含用于针对区段根据方程式来确定所述比例因子的装置,其中如果所述区段内的所述峰值数目等于一,则Sk,m为第k个区段的比例因子,Ek为所述第k个区段的音调循环能量参数,Lk为所述第k个区段的长度,且xm为针对滤波器输出m的经合成的区段。
48.根据权利要求46所述的设备,其中所述用于确定所述比例因子的装置包含用于在所述区段内的所述峰值数目大于一的情况下针对区段基于包括至多一个峰值的范围而确定所述比例因子的装置。
CN201180044569.2A 2010-09-17 2011-09-09 确定音调循环能量及按比例缩放激励信号 Active CN103109319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510028662.4A CN104637487B (zh) 2010-09-17 2011-09-09 确定音调循环能量及按比例缩放激励信号

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US38410610P 2010-09-17 2010-09-17
US61/384,106 2010-09-17
US13/228,046 US8862465B2 (en) 2010-09-17 2011-09-08 Determining pitch cycle energy and scaling an excitation signal
US13/228,046 2011-09-08
PCT/US2011/051051 WO2012036990A1 (en) 2010-09-17 2011-09-09 Determining pitch cycle energy and scaling an excitation signal

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510028662.4A Division CN104637487B (zh) 2010-09-17 2011-09-09 确定音调循环能量及按比例缩放激励信号

Publications (2)

Publication Number Publication Date
CN103109319A true CN103109319A (zh) 2013-05-15
CN103109319B CN103109319B (zh) 2015-02-25

Family

ID=44658869

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201510028662.4A Active CN104637487B (zh) 2010-09-17 2011-09-09 确定音调循环能量及按比例缩放激励信号
CN201180044569.2A Active CN103109319B (zh) 2010-09-17 2011-09-09 确定音调循环能量及按比例缩放激励信号

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510028662.4A Active CN104637487B (zh) 2010-09-17 2011-09-09 确定音调循环能量及按比例缩放激励信号

Country Status (6)

Country Link
US (1) US8862465B2 (zh)
EP (1) EP2617034B1 (zh)
JP (1) JP5639273B2 (zh)
CN (2) CN104637487B (zh)
TW (1) TW201218185A (zh)
WO (1) WO2012036990A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109313889A (zh) * 2016-06-20 2019-02-05 伯斯有限公司 缓解主动噪声控制系统中的不稳定状况

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9208775B2 (en) * 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US9997154B2 (en) * 2014-05-12 2018-06-12 At&T Intellectual Property I, L.P. System and method for prosodically modified unit selection databases
CN118338183B (zh) * 2024-06-12 2024-09-06 深圳市丰禾原电子科技有限公司 一种蓝牙耳机电量估算方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1369092A (zh) * 1999-08-09 2002-09-11 多尔拜实验特许公司 高质量音频的可缩放编码方法
GB2398983A (en) * 2003-02-27 2004-09-01 Motorola Inc Speech communication unit and method for synthesising speech therein
CN101335004A (zh) * 2007-11-02 2008-12-31 华为技术有限公司 一种多级量化的方法及装置
CN101572093A (zh) * 2008-04-30 2009-11-04 北京工业大学 一种转码方法和装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5331323B2 (zh) * 1972-11-13 1978-09-01
JPH0197294A (ja) 1987-10-06 1989-04-14 Piran Mirton 木材パルプ等の精製機
US4991213A (en) 1988-05-26 1991-02-05 Pacific Communication Sciences, Inc. Speech specific adaptive transform coder
IL95753A (en) 1989-10-17 1994-11-11 Motorola Inc Digits a digital speech
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JP4063911B2 (ja) 1996-02-21 2008-03-19 松下電器産業株式会社 音声符号化装置
AU3708597A (en) 1996-08-02 1998-02-25 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
EP1093230A4 (en) * 1998-06-30 2005-07-13 Nec Corp speech
JP3180786B2 (ja) * 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
WO2001059766A1 (en) * 2000-02-11 2001-08-16 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
JP2001318698A (ja) * 2000-05-10 2001-11-16 Nec Corp 音声符号化装置及び音声復号化装置
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
KR101019936B1 (ko) * 2005-12-02 2011-03-09 퀄컴 인코포레이티드 음성 파형의 정렬을 위한 시스템, 방법, 및 장치
US8195460B2 (en) * 2008-06-17 2012-06-05 Voicesense Ltd. Speaker characterization through speech analysis
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US9537460B2 (en) * 2011-07-22 2017-01-03 Continental Automotive Systems, Inc. Apparatus and method for automatic gain control

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1369092A (zh) * 1999-08-09 2002-09-11 多尔拜实验特许公司 高质量音频的可缩放编码方法
GB2398983A (en) * 2003-02-27 2004-09-01 Motorola Inc Speech communication unit and method for synthesising speech therein
CN101335004A (zh) * 2007-11-02 2008-12-31 华为技术有限公司 一种多级量化的方法及装置
CN101572093A (zh) * 2008-04-30 2009-11-04 北京工业大学 一种转码方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109313889A (zh) * 2016-06-20 2019-02-05 伯斯有限公司 缓解主动噪声控制系统中的不稳定状况
CN109313889B (zh) * 2016-06-20 2023-10-24 伯斯有限公司 缓解主动噪声控制系统中的不稳定状况

Also Published As

Publication number Publication date
TW201218185A (en) 2012-05-01
WO2012036990A1 (en) 2012-03-22
EP2617034B1 (en) 2019-12-25
JP5639273B2 (ja) 2014-12-10
CN104637487B (zh) 2018-04-27
US20120072208A1 (en) 2012-03-22
US8862465B2 (en) 2014-10-14
CN104637487A (zh) 2015-05-20
JP2013537325A (ja) 2013-09-30
CN103109319B (zh) 2015-02-25
EP2617034A1 (en) 2013-07-24

Similar Documents

Publication Publication Date Title
CN103109321B (zh) 估计音调滞后
CN103098127B (zh) 译码及解码瞬时帧
CN101496098B (zh) 用于以与音频信号相关联的帧修改窗口的系统及方法
CN103299366B (zh) 用于编码及检测带水印信号的装置
CN104054125B (zh) 用于冗余帧译码和解码的装置
CN103299365B (zh) 用于自适应地编码和解码带水印信号的装置
US11769515B2 (en) Audio coder window sizes and time-frequency transformations
CN106464683B (zh) 选择分组丢失隐藏过程
RU2668111C2 (ru) Классификация и кодирование аудиосигналов
CN103299364B (zh) 用于编码和解码带水印信号的装置
CN103109319B (zh) 确定音调循环能量及按比例缩放激励信号
JP2013076871A (ja) 音声符号化装置及びプログラム、音声復号装置及びプログラム、並びに、音声符号化システム
UA114233C2 (uk) Системи та способи для визначення набору коефіцієнтів інтерполяції

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant