CN1185624C - 具有自适应编码配置的语音编码系统 - Google Patents

具有自适应编码配置的语音编码系统 Download PDF

Info

Publication number
CN1185624C
CN1185624C CNB018156401A CN01815640A CN1185624C CN 1185624 C CN1185624 C CN 1185624C CN B018156401 A CNB018156401 A CN B018156401A CN 01815640 A CN01815640 A CN 01815640A CN 1185624 C CN1185624 C CN 1185624C
Authority
CN
China
Prior art keywords
encoding scheme
distributed
frame
codebook index
frame type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB018156401A
Other languages
English (en)
Other versions
CN1457485A (zh
Inventor
H-Y·苏
Y·高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mandus Bide Technology LLC
Mindspeed Technologies LLC
MACOM Technology Solutions Holdings Inc
Original Assignee
Conexant Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24660098&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1185624(C) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Conexant Systems LLC filed Critical Conexant Systems LLC
Publication of CN1457485A publication Critical patent/CN1457485A/zh
Application granted granted Critical
Publication of CN1185624C publication Critical patent/CN1185624C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

根据本发明的一个方面,基于是否在输入的语音信号间隔中检测到触发特性,来选择第一编码方案或第二编码方案。第一编码方案具有用于处理输入语音信号的音调预处理过程,以形成趋向于理想浊音和稳态特性的修改的语音信号。预处理过程使编码器充分利用了用于具有大量语音成分的输入语音的有效带宽、长期预测过程的优点。根据本发明的另一方面,第二编码方案将长期预测模式用于基于逐个子帧对音调编码。长期预测模式适合于一般语音的周期成分不是稳态的或小于完全周期并需要对自适应码本进行更大频率更新的场合,以便在长期预测过程下获得达到理想的感知质量的重构语音。

Description

具有自适应编码配置的语音编码系统
与相关申请的交叉参考
本申请是1998年11月18日提交的申请序号为09/154,660的申请的部分继续申请。以下共同未决并共同转让的美国专利申请已经在本申请同一天提交。所有这些申请涉及并进一步描述了本申请中公开的实施例的其它方面,在此一并结合以作为参考。
美国专利申请号_______,“可选择模式的语音编码系统”,代理人参考号:98RSS365CIP(10508.4),2000年9月15日提交,且现在是美国专利号_____。
美国专利申请号_______,“向用于低位速率CELP的脉冲激励注入高频噪声”,代理人参考号:00CXT0650N(10508.6),2000年9月1 5日提交,且现在是美国专利号______。
美国专利申请号______,“CELP语音编码中的短期增强”,代理人参考号:00CXT0666N(10508.6),2000年9月15日提交,且现在是美国专利号_____。
美国专利申请号______,“用于对语音编码中的脉冲样激励进行动态脉冲位置跟踪的系统”,代理人参考号:00CXT0537N(10508.7),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“带有时域噪声衰减的语音编码系统”,代理人参考号:00CXT0554N(10508.8),2000年9月15日提交,且现在是美国专利号_____。
美国专利申请号______,“用于语音编码的自适应激励模式系统”,代理人参考号:98RSS366(10508.9),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“使用具有不同分辨级别的自适应码本对语音信息进行编码的系统”,代理人参考号:00CXT0670N(10508.13),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“用于编码和解码的码本表”,代理人参考号:00CXT0669N(10508.14),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“用于传输编码的语音信号的比特流协议”,代理人参考号:00CXT0668N(10508.15),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“用于过滤语音编码信号的频谱内容的系统”,代理人参考号:00CXT0667N(10508.16),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“用于编码和解码语音信号的系统”,代理人参考号:00CXT0665N(10508.17),2000年9月15日提交,且现在是美国专利号______。
美国专利申请号______,“通过子码本改进使用音调增强的系统”,代理人参考号:00CXT0569N(10508.19),2000年9月15日提交,且现在是美国专利号______。
技术领域
本发明涉及用于对语音信号进行编码的具有自适应性编码配置的系统和方法。
背景技术
语音编码可用来增加无线系统的空中接口的通信量处理能力。无线服务供应商一般寻求对于分配的电磁波谱带宽,使由无线通信服务公司服务的有效用户数最大化,以便使用户收益最大化。无线服务供应商可向政府管理部门支付税费、许可证费及拍卖费,以获取或维持使用分配的频率带宽提供无线通信服务的权利。于是,无线服务供应商可以选择语音编码技术,以便由其在无线基础设施的投资中获得的最大回报。
一定的语音编码方案在编码站点存储了详细的数据库,并在解码站点复制了详细数据库。编码基础设施传输用于索引复制详细数据库保持空中接口可用带宽的基准数据。取代以在编码站点的整个语音序号调制载波信号,编码基础设施只是传输表示原始语音信号的较短的基准数据。解码基础设施使用较短的基准数据访问在解码站点的复制详细数据库,以便重构原始语音信号的复制品或表示。
如果在详细数据库中没有充分种类的激励向量来精确表示潜在原始语音信号下的语音,则语音信号的质量会受到影响。所支持的码标识符(例如二进制组合)的最大数是对可在详细数据库(例如码本)中表示的激励向量种类的一个限制。对于一定的语音信号成分,诸如短期预测成分,有限数目的可用激励向量可能无法使由激励向量表示的语音信号精确或清晰。于是,有时再生的语音可能是人造声音、失真的、不清晰的、或感知上令用户不愉快的。这样就需要提高再生语音的质量,同时遵循由在有限位数内传输基准或索引信息施加的带宽约束。
发明内容
一种编码器支持用于一个或多个语音信号帧的第一编码方案和第二编码方案。第一和第二编码方案定义了从编码器通过无线系统的空中接口传输的每帧的数据结构或每子帧的数据结构。对于无线系统的空中接口的一个信道来说,顺序的帧或帧组的数据结构可能影响语音信号的感知质量和整个编码速率。一种自适应编码配置涉及基于输入语音信号的分析或检验来选择编码方案,并根据选择的编码方案对输入的语音信号编码(例如音调预处理)。例如,该自适应编码配置涉及基于对输入语音信号的分析或检验,来选择和执行用于编码一帧或多帧语音信号的第一编码方案或第二编码方案。
检测器在一间隔期间检测语音信号是否具有触发特性(例如一般浊音或一般稳态成分)。选择器基于是否检测到触发特性来选择第一编码方案或第二编码方案,以便对与该间隔相关的帧编码。例如,如果在该间隔期间语音信号具有触发特性,则编码器可按照第一编码方案对与该间隔相关的帧中的语音信号编码。
第一编码方案具有音调预处理过程,用于处理输入的语音信号以形成趋向于理想浊音和稳态特性的修改的语音信号。音调预处理过程使编码器完全获得了用于具有大量语音成分的输入语音信号的有效带宽、长期预测过程的优点,否则这是不可能的。音调预处理过程从某些稳态和浊音输入语音成分形成修改的语音信号。修改的语音信号具有基本上稳态和基本上浊音质量,便于适用于基本上是浊音和稳态输入语音成分的长期预测编码过程的每帧有效位使用,同时保持语音的目标感知质量。
通过稍微偏好于用于输入的语音信号的较多的语音成分的自适应码本,音调预处理过程很好地适用于降低必须的最小带宽或通过空中接口传输信息的传输速率,而在语音信号的感知质量中没有造成明显的或实质的劣化。根据本发明的一个方面,与短期预测成分在固定码本中需要的激励向量的数目相比,基本上稳态和浊音输入的语音信号的长期预测成分,可以通过自适应码本中的较少数目的激励向量适当地表示。这样,编码器可使用由音调预处理过程和后继的编码节省的剩余位,提供帧中不同的位分配,以改进用于短期预测成分、残留语音成分或两者的固定码本的精确性或分辨率。
根据本发明的另一个方面,第二编码方案使长期预测模式逐个子帧地对音调编码。长期预测模式适合一般语音的周期成分不是稳态的或小于完全周期并需要从自适应码本中进行更大频率更新的场合,以便通过长期预测过程获得理想感知质量的再生语音。
结合以下附图和详细说明,本发明的其它系统、方法、特征和优点对于业内专业人员将是或将成为显而易见的。于是,所有这些附加的系统、方法、特征和优点都包括在本说明中,都在本发明的范围内,都受所附权利要求书的保护。
附图说明
参照以下附图能够更好地理解本发明。在所有不同的图示中相同的标号指示对应的部件或过程。
图1是表示编码器和解码器的示意性实施例的框图。
图2是用于对语音信号编码的方法的一个实施例的流程图。
图3是根据图2的音调预处理技术的流程图。
图4是另一编码方法的流程图。
图5是位分配过程的流程图。
图6和图7是分别用于示意性的较高速率编码方案和较低速率编码方案的位分配的图表。
具体实施方式
多速率编码器可以包括不同的编码方案,以便获得通过空中接口的不同的传输速率。每一不同的传输速率可使用一个或多个编码方案实现。最高的编码速率可称为全速率编码。较低的编码速率可称为半速率编码,其中半速率编码具有大约为全速率编码最大速率一半的最大传输速率。编码方案可包括通过合成分析的编码方案,其中原始的语音信号与合成语音信号比较,以便优化原始语音信号与合成语音信号之间的感知相似性或客观相似性。码激励线性预测编码方案(CELP)是通过合成分析编码方案的一例。
根据本发明,图1示出编码器11,它包括与分析部分12及自适应码本部分14连接的输入部分10。进而,自适应码本部分14连接到固定码本部分16。与自适应码本部分14和固定码本部分16两者相关的多路复用器60连接到发送器62。
发送器62和接收器66与通信协议一同表示无线相同的空中接口64。来自源或说话者的输入语音加到编码站点的编码器11。发送器62从编码站点向位于编码站点远处的解码站点的接收器66,发送电磁信号(例如射频或微波信号)。用表示输入语音信号的基准信息调制电磁信号。多路信号分离器68对基准信息进行多路信号分离,以便输入到解码器70。解码器70产生输入语音的复制或表示,称为在解码器70处的输出语音。
输入部分10具有输入端,用于接收输入的语音信号。输入端馈送给高通滤波器18,该滤波器衰减低于截止频率(例如80Hz)的输入语音信号,以便降低输入语音信号中的噪声。高通滤波器18馈送给感知加权滤波器20及线性预测编码(LPC)分析器30。感知加权滤波器20可馈送给音调预处理模块22和音调估计器32两者。进而,感知加权滤波器20可通过音调预处理模块22连接到第一累加器46的输入端。音调预处理模块22包括检测器24,用于检测触发语音特性。
在一实施例中,检测器24可涉及分类单元,该单元(1)标识噪声状清音语音及(2)在输入语音信号的间隔中在非稳态浊音与稳态浊音语音之间进行区分。检测器24可检测或便于检测输入语音信号的间隔中存在还是缺失触发特性(例如一般浊音和一般稳态语音成分)。在另一实施例中,检测器24可集成到音调预处理模块22和语音特性分类器26中,以便检测输入语音信号间隔中的触发特性。在另一实施例中,检测器24集成到语音特性分类器26中,而不是音调预处理模块22。其中检测器22是这样集成的,语音特性分类器26连接到选择器34上。
分析部分12包括LPC分析器30、音调估计器32、话音活动检测器28及语音特性分类器26。LPC分析器30连接到话音活动检测器28,用于检测输入语音信号中语音或寂静的存在。音调估计器32连接到模式选择器34,用于基于从检测器24接收的输入选择音调预处理过程或响应的长期预测过程。
自适应码本部分14包括连接到合成滤波器42(例如短期预测滤波器)的第一激励产生器40。进而,合成滤波器42馈送给感知加权滤波器20。加权滤波器20连接到第一累加器46的输入端,其中最小化器48连接到第一累加器46的输出端。最小化器48向第一激励产生器40提供反馈命令,以便使第一累加器46的输出端的误差信号最小化。自适应码本部分14连接到固定码本部分16,其中将第一累加器46的输出和误差信号一起馈送给第二累加器44的输入。
固定码本部分16包括连接到合成滤波器42(例如短期预测滤波器)的第二激励产生器58。进而,合成滤波器42馈送给感知加权滤波器20。加权滤波器20连接到第二累加器44的输入端,其中最小化器48连接到第二累加器44的输出端。残留信号出现在第二累加器44的输出端。最小化器48向第二激励产生器58提供反馈命令以便使残留信号最小化。
在另一实施例中,自适应码本部分14的合成滤波器42和感知加权滤波器20被组合为单个的滤波器。
在另一实施例中,固定码本部分16的合成滤波器42和感知加权滤波器20被组合为单个的滤波器。
在另一实施例中,编码器的三个感知加权滤波器20可由两个感知加权滤波器20代替,其中每一感知加权滤波器20与最小化器48之一的输入串联。于是,在以上的另一实施例中在输入部分10去掉了感知加权滤波器20。
根据图1,输入语音信号输入到输入部分10。输入部分10把语音分解为成分部分,这包括(1)输入语音信号的短期成分或包络,(2)输入语音信号的长期成分或音调滞后,以及(3)从输入语音信号去掉了短期成分和长期成分的残留成分。编码器11使用长期成分、短期成分和残留成分,以便搜索自适应码本36和固定码本50优选激励向量,把输入语音信号表示为基准信息以便通过空中接口64传输。
输入部分10的感知加权滤波器20具有第一时间对振幅的响应,它与输入语音信号的共振峰的第二时间对振幅的响应相反。共振峰表示关键振幅对语音信号的频率的响应,这刻画出与LPC分析器30的线性预测编码分析的一致的语音信号。调节感知加权滤波器20以补偿在基准语音信号(例如输入语音信号)与合成语音信号之间否则会出现的感知上引起的误差最小化中的缺陷。
将输入语音信号提供给线性预测编码(LPC)分析器30(例如LPC分析滤波器),以确定用于合成滤波器42(例如短期预测滤波器)的LPC系数。将输入语音信号输入到音调估计器32。音调估计器32对于输入语音的浊音段确定音调滞后值和音调增益系数。输入语音信号的浊音段一般涉及周期性波形。
音调估计器32可进行至少一次开环音调分析,以便估计音调滞后。音调滞后是指在语音信号的浊音语音或话音成分中明显的重复成分(例如一般周期性波形)的时间度量。例如,音调滞后可表示一般周期性语音信号的相邻振幅峰值之间的时间持续。如图1所示,可基于加权的语音信号估计音调滞后。另外,音调滞后可表示为频率域中的音调频率,其中音调频率表示语音信号的第一谐波。
音调估计器32使出现在不同子帧中的信号之间的相关性最大化,以便为估计的音调滞后确定候选项。音调估计器32最好对音调滞后不同范围的组内的候选项进行划分。在使候选项之中的延迟规一化之后,音调估计器32可基于以下一个或多个因素从候选项中选择代表性的音调滞后:(1)先前的帧相对于与候选的音调滞后相关的后继的帧是浊音还是清音;(2)先前的帧中的音调滞后是否在后继帧的候选音调滞后的规定的范围内,以及(3)先前的两个帧是否是浊音,以及两个先前的音调滞后是否在后继帧的后继候选音调滞后的规定的范围内。音调估计器32向自适应码本36提供估计的代表性音调滞后,以便于在自适应码本36中开始搜索最好的激励向量。自适应码本部分11后来加细估计的代表性音调滞后,以便从自适应码本36中选择优化的或最好的激励向量。
语音特性分类器26最好执行语音分类过程,其中逐帧或逐个子帧在应用间隔期间把语音划分为各种类别。语音分类可包括一个或多个以下范畴:(1)寂静/背景噪声,(2)噪声状清音语音,(3)清音语音,(4)语音的过渡启动,(5)爆破语音,(6)非稳态浊音,以及(7)稳态浊音。稳态浊音语音表示语音的周期性成分,其中音调(频率)或音调滞后在考虑的间隔期间变化不大于最大允差。非稳态浊音语音是指一种语音的周期性成分,其中在考虑的间隔期间音调(频率)或音调滞后变化大于最大允差。噪声状清音语音是指可模拟为噪声信号诸如高斯噪声的语音的非周期性成分。语音的过渡启动是指在说话者寂静之后或语音信号的低振幅偏移之后立即出现的语音。语音分类器可接受原始输入语音信号、音调滞后、音调相关性数据及话音活动检测器数据,以便对于相关的间隔诸如帧或子帧把原始语音信号分类为上述类别之一。以上的语音类别可规定出现在输入语音信号的间隔中的一个或多个触发特性。在间隔中一定的触发特性的出现或缺失可便于为与该间隔相关的帧或子帧选择适当的编码方案。
第一激励产生器40包括自适应码本36和第一增益调节器38(例如第一增益码本)。第二激励产生器58包括固定码本50、第二增益调节器52(例如第二增益码本)及与固定码本50和第二增益调节器52相连的控制器54。固定码本50和自适应码本36定义了激励向量。一旦PLC分析器30确定了合成滤波器42的滤波器参数,编码器11就搜索自适应码本36及固定码本50,以便选择适当的激励向量。第一增益调节器38可用来对自适应码本36的激励向量的振幅分度。第二增益调节器52可用来对固定码本50中的激励向量的振幅分度。控制器54使用来自语音特性分类器26的语音特性,帮助从固定码本50或其中的子码本中适当选择最好的激励向量。
自适应码本36可包括表示波形段或其它能量表示的激励向量。自适应码本36的激励向量可适应再生或模拟语音信号的长期变化。自适应码本36先前的合成激励向量可输入到自适应码本36以确定自适应码本36中当前的激励向量的参数。例如,编码器可响应由自适应码本36、固定码本50或两者输出的过去的激励向量的输入,改变其码本中当前激励向量。最好基于过去合成的激励逐帧或逐子帧更新自适应码本36,虽然其它更新间隔可产生可接受的结果并属于本发明的范围。
自适应码本36中的激励向量与对应的自适应码本指标相关。在一实施例中,自适应码本指标可与音调滞后值等价。音调估计器32最初在优先的音调滞后值或优先的自适应指标邻域中确定代表性的音调滞后。优先的音调滞后值,与码本所过程一致,把第一累加器46输出端的误差信号降低到最小。自适应码本指标或音调滞后的粒度一般限制在固定位数,用于通过空中接口64传输以节省谱带宽。谱带宽可表示允许用于通信系统的一个或多个信道(例如下行信道、上行信道或两者)电磁波谱的最大带宽。例如,为了遵循带宽限制,在一个信道上可能需要通过话音信息的半速率编码以7位或全速率编码以8位传输音调滞后信息。这样,为了传送用于从自适应码本36中选择对应的激励向量的音调滞后值,如果使用7位可有128个状态,而使用8位可有256个状态。
编码器11可在逐帧或逐子帧的基础上采用来自自适应码本36的不同的激励向量。类似地,可逐帧改变或更新一个或多个合成滤波器42的滤波器系数。然而,在自适应码本36或固定码本50的每一优选激励向量的搜索或选择期间,滤波器系数最好保持固定。实际上,帧可表示大约20毫秒的时间间隔,而子帧可表示从大约5到10毫秒范围内的时间间隔,虽然帧和子帧的其它持续时间也属于本发明的范围。
自适应码本36与用于对自适应码本36中的激励向量的增益分度的第一增益调节器38相关。增益可表示为对应于对应的激励向量的标量。在另一实施例中,增益可表示为增益向量,其中增益向量与固定编码50或自适应码本36的激励向量不同段相关联。
第一激励产生器40连接到合成滤波器42。第一激励向量产生器40通过访问自适应码本36的适当的激励向量,提供合成语音信号的长期预测成分。基于来自第一激励产生器40的第一激励信号的输入,合成滤波器42输出第一合成语音信号。在一实施例中,第一合成语音信号具有由自适应码本36贡献的长期预测成分,以及由合成滤波器42贡献的短期预测成分。
第一合成信号与加权的输入语音信号比较。加权的输入语音信号是指至少由感知加权滤波器20滤波或处理过的输入语音信号。如图1所示,将第一合成信号和加权的输入语音信号输入到第一累加器46以获得误差信号。最小化器48接受该误差信号,并通过调节(即搜索和施加)自适应码本36中的激励向量的优先选择,通过调节第一增益调节器38(例如第一增益码本)的优先选择,或通过调节以上两种选择使误差信号最小化。激励向量和增益标量(或增益向量)的优先选择施加到通过空中接口64传输给解码器70的子帧或整个帧。在调节或搜索每一不同优先激励向量和增益向量期间,合成滤波器42的滤波器系数保持固定。
第二激励产生器58可基于从固定码本50中选择的激励向量产生激励信号。固定码本50可包括基于能量脉冲、脉冲位能脉冲、高斯噪声信号或任何其它适当的波形建模的激励向量。可使固定码本50的激励向量适应于再生输入语音信号的短期变化或谱包络变化。进而,固定码本50的激励向量可贡献于噪声状信号、过渡、残留成分,或其它不足以表示为长期信号成分的表示。
固定码本50中的激励向量与对应的固定码本指标74相关联。固定码本指标74是指数据库中的地址、表中的地址,或者是对存储激励向量的其它数据结构的引用。例如,固定码本指标74可表示激励向量存储在编码器11的电子存储器中的存储器单元或寄存器单元。
固定码本50与用于对固定码本50中的激励向量的增益分度的第二增益调节器52相关联。增益可表示为对应于对应的激励向量的标量。在另一实施例中,增益可表示为增益向量,其中增益向量与固定码本50或自适应码本36的激励向量不同段相关联。
第二激励产生器58连接到合成滤波器42(例如短期预测滤波器),它可称为线性预测编码(LPC)滤波器。基于来自第二激励产生器58的的激励信号的输入,合成滤波器42输出第二合成语音信号。如图所示,将第二合成语音信号与从第一累加器46输出的差分误差信号进行比较。将第二合成信号和差分误差信号输入到第二累加器44,以便在第二累加器44的输出端获得残留信号。最小化器48接受残留信号,并通过调节(即搜索和施加)固定码本50中的激励向量的优先选择,通过调节第二增益调节器52(例如第二增益码本)的优先选择,或通过调节以上两种选择使残留信号最小化。激励向量和增益标量(或增益向量)的优先选择施加子帧或整个帧。在调节期间,合成滤波器42的滤波器系数保持固定。
LPC分析器30为合成滤波器42(例如短期预测滤波器)提供滤波器系数。例如,LPC分析器30可基于输入的基准激励信号(例如非激励信号)提供滤波器系数。虽然将差分误差信号施加到第二累加器44的输入端,但在另一实施例中,加权的输入语音信号可直接施加到第二累加器44的输入端,以达到与上述基本上相同的结果。
对固定码本50向量的优先选择最好使在对固定码本50的其它可能的向量选择中量化误差为最小。类似地,对自适应码本36激励向量的优先选择最好使在对自适应码本36的其它可能的向量选择中量化误差为最小。一旦根据图1作出优先的选择,多路复用器60多路复用固定码本指标74、自适应码本指标72、第一增益指示符(例如第一码本指标)、第二增益指示符(例如第二码本指标)以及与选择相关的滤波器系数,以便形成基准信息。滤波器系数可包括用于一个或多个以下滤波器的滤波器系数:合成滤波器42、感知加权滤波器20和其它可用的滤波器中的至少一个。
发送器62或收发器连接到多路复用器60。发送器62通过如图1所示的无线系统的电磁信号(例如射频或微波信号),从编码器11向接收器66发送基准信息。多路复用的基准信息可被发送,以便逐子帧、逐帧或者在与带宽限制及感知语音质量目标相符的其它适当的时间间隔对输入语音信号进行更新。
接收器66连接到用于对基准信息进行信号分离的信号分离器68。进而,信号分离器68连接到用于把基准信息解码为输出语音信号的解码器70。如图1所示,解码器70接受通过空中接口64从编码器11发送来的基准信息。解码器70使用接收的基准信息生成优先的激励信号。基准信息便于复制自适应码本及复制固定码本对编码器70处的码本的访问。解码器70的一个或多个激励产生器向复制合成滤波器施加优先激励信号。在编码器11和解码器70处对于滤波器系数使用相同的值或近似相同的值。由复制合成滤波器和复制自适应码本的贡献获得的输出语音信号是输入到编码器11的输入语音信号的复制品或表示。这样,基准数据通过空中接口64以有效带宽方式被发送,因为与输入到输入部分10的原始语音信号相比基准数据由较少的位、字、或字节组成。
在另一实施例中,一定的滤波器系数不是从编码器向解码器发送,其中滤波器系数是在语音信息通过空中接口64发送前建立的,或根据内部对称状态和编码器与解码器的算法来更新。
图2示出了根据本发明用于对输入语音信号编码的一种方法的流程图。图2的方法在步骤S10开始。一般来说,步骤S10和步骤S12处理输入语音信号触发特性的检测。触发特性可包括任何由语音特性分类器26、检测器24或两者处理或分类的特性。如图2所示,在步骤S10和S12,触发特性包括输入语音信号的一般浊音和一般稳态语音成分。
在步骤S10,检测器24或编码器11确定输入的语音信号间隔是否包含一般浊音语音成分。浊音语音成分是指语音信号的周期部分或准周期部分。准周期部分可表示某种程度偏离理想周期浊音语音成分的波形。输入语音信号的间隔可表示为帧、帧组、帧的一部分、相邻帧的重叠部分、或任何其它适用于评价输入语音信号成分特性的时间周期。如果间隔包括一般浊音语音成分,则该方法以步骤S12继续。如果不包含一般浊音语音成分,则该方法以步骤S18继续。
在步骤S12,检测器24或编码器11确定在间隔内浊音语音成分是否是一般稳态或某种程度稳态。一般浊音语音成分是一般稳态或某种程度稳态的,如果满足以下一个或多个条件:(1)浊音语音信号的主频或音调滞后在帧或间隔内的变化不大于最大范围(例如预定的百分比);(2)在帧或间隔内语音信号的谱内容一般保持不变或变化不大于最大范围;以及(3)在帧或间隔内语音信号的能量水平一般保持不变或变化不大于最大范围。然而,另一实施例中,在认为浊音语音成分一般是稳态之前最好满足以上至少两个条件。一般来说,最大范围或或多个范围可通过输入语音信号的感知语音编码测试或波形特性来确定,这足以支持输入语音信号的精确再生。在音调滞后的场合,最大范围可表示为相对于浊音语音成分的中心或主频率的频率范围,或表示为相对于浊音语音成分的中心或主音调滞后的时间范围。如果间隔内浊音语音成分一般是稳态的,则该方法以步骤S14继续。如果间隔内浊音语音成分一般不是稳态的,该方法以步骤S18继续。
在步骤S14,音调预处理模块22执行音调预处理过程,以调整输入的语音信号用于编码。调整是指人工最大化(例如数字信号处理)自然出现的一般稳态浊音语音成分的稳态性质。如果输入语音信号自然出现的一般稳态浊音成分不同于理想的稳态浊音成分,则使音调预处理适合于把自然出现的一般稳态浊音成分引向理想的稳态浊音成分。音调预处理可调整输入信号以便与另外情形相比使信号更趋于稳态浊音状态,以便降低表示和通过空中接口传输编码语音信号所必须的带宽。另外,音调预处理过程可便于使用不同的话音编码方案,这些方案特色是在固定码本指标74与自适应码本指标72之间进行存储单元的不同的分配。使用音调预处理,不同的帧类型和附带的位分配可有助于提高感知语音质量。
音调预处理过程包括音调跟踪方案,该方案可在一个或多个离散时间间隔内修改输入信号的音调滞后。离散时间间隔可指帧、帧的一部分、子帧、子帧组、采样、或采样组。音调跟踪过程试图在多个帧期间或基于整体从一相邻的帧到另一帧,把输入的语音信号音调滞后模拟为音调滞后对时间的一系列连续的段。于是,音调预处理过程可以按符合音调轨迹整体模式的方式降低一帧内局部波动。
音调预处理可根据几种可选用的技术来实现。根据第一技术,步骤S14可涉及以下过程:对输入的语音信号估计所估计的音调轨迹。估计的音调轨迹表示在超过一帧的时间周期上音调整体模式的估计。可将音调轨迹估计为对于音调轨迹符合最低累积通路误差,其中一部分音调轨迹与每一帧对累积通路误差的贡献相关联。通路误差提供了实际的音调轨迹(即被测量的)与估计的音调轨迹之间差别的度量。修改输入的语音信号以便比其它情形更好地遵循或匹配估计的音调轨迹。
将输入的语音信号模拟为音调滞后对时间的一系列段,其中每一段占据一离散时间间隔。如果暂时逼近其它段的主题段具有比暂时逼近段较短的滞后,则相对于其它段在时间上移动主题段,以便产生符合估计的音调轨迹的更一致的音调。使用时间上重叠的相邻的段可避免移动的段与主题段之间的不连续性。在一例子中,基于相邻段的重叠区域内插或平均可用来以连续的方式结合相邻段的边缘。
根据第二种技术,音调预处理进行作为语音输入信号的感知加权语音信号的连续时间扭曲。对于连续扭曲,从输入的语音信号或加权语音信号的至少一个过去的帧和当前帧中推导出输入音调轨迹。音调预处理模块22基于语音信号的多个帧确定输入音调轨迹,并改变与至少一个对应的采样相关联的音调滞后中的变量以便跟踪输入音调轨迹。
修改加权的语音信号以符合输入音调轨迹。对组成加权语音信号的采样逐个音调周期地进行修改。音调周期表示输入语音信号的音调的周期。如果一个音调周期先前的采样在时间接近落到后面的采样(例如相邻的音调周期的),则先前的和后来的采样持续时间可能重叠,并被配置为避免音调轨迹重构/修改的段之间的不连续性。时间扭曲可对符合最大合计延迟的加权语音信号的采样引入可变延迟。例如,最大合计延迟可以是加权语音信号的20个采样(2.5ms)。
在步骤S18,编码器11向由检测器24在步骤S10和S12确定的一般不是浊音或一般不是稳态的输入语音信号或加权语音信号,施以预测编码过程。例如,编码器11施加预测编码过程,该过程包括更新过程,用于对于子帧或其它小于帧持续时间的持续时间更新自适应码本36音调滞后指标。如这里所使用的,时间片在持续时间上小于帧的持续时间。步骤S18自适应码本指标的更新频率大于适合表示一般浊音和一般稳态语音所需更新频率。
步骤S14之后在步骤S16,编码器11向与间隔相关联的预处理语音成分施加预测编码(例如代码激励线性预测编码或其变种)。预测编码包括从自适应码本36和固定码本50确定适当的激励向量。
图3示出与图2的步骤S14相关或进一步对其定义的音调预处理方法。图3的方法以步骤S50开始。
在步骤S50,对每一音调周期,音调预处理模块22估计感知加权输入语音信号或其它输入语音信号的估计音调周期相当的时间段大小。后继段的段大小可跟踪音调周期中的变化。
在步骤S52,音调估计器32对与该时间段相关联的感知加权输入语音信号确定输入音调轨迹。输入音调轨迹包括一系列相继帧的每帧的音调滞后的估计。
在步骤S54,音调预处理模块22建立目标信号,用于修改(例如时间扭曲)加权输入语音信号。在一例子中,音调预处理模块22建立目标信号用于基于所确定的输入音调轨迹修改时间段。在另一例子中,目标信号基于在步骤S52所确定的输入音调轨迹和由先前执行图3的方法先前修改的语音信号。
在步骤S56,音调预处理模块22修改(例如扭曲)时间段以获得修改的段。为了给出修改的段,修改段的开始点固定在过去,并移动修改段的结束点以获得对音调周期的最佳代表适配。末端的移动延伸或压缩与段大小相关联的感知加权信号的时间。在一例子中,修改段开始处的采样几乎不移动,且最大移动出现在修改段的末端。
音调复合(主脉冲)一般表示音调周期感知上最重要的部分。音调周期的音调复合定位在朝向修改段的末端,以便允许扭曲对感知上最重要的部分有最大的贡献。
在一实施例中,通过内插符合音调轨迹的先前修改的加权语音的采样及适当的时间窗口(例如汉明加权Sinc窗口)从时间段获得修改的段。加权函数强调音调复合并减弱音调复合之间的噪声。加权是根据音调预处理分类通过增加对较高周期性段的音调复合的强调适配的。加权可根据音调预处理分类通过增加对较高周期性段的音调复合的强调而变化。
修改的段被映射到感知加权输入语音信号的采样上,以调节符合目标信号的感知加权输入语音信号,产生修改的语音信号。映射定义包括感知加权输入语音信号采样的扭曲函数和时间偏移函数。
根据图3的方法的一实施例,音调估计器32、预处理模块22、选择器34、语音特性分类器26和话音活动检测器28共同支持音调预处理加权语音信号。语音特性分类器26可获得音调预处理控制参数,用来控制图3的音调预处理方法一个或多个步骤。
音调预处理控制参数可分类为对应的类别成员。可以有几类控制参数。第一类用来重置音调预处理以防止在音调预处理期间引起累积的延迟超过最大合计的延迟。第二类、第三类、和第四类指示话音强度或振幅。第二类到第四类的话音强度彼此不同。
第一类可允许或暂停步骤S56的执行。如果帧的第一类或其它分类指示帧主要是背景噪声或低音调相关性的清音语音,则音调预处理模块22重置音调预处理过程,以防止累积的延迟超过最大延迟。于是,主题帧在步骤S56不变,且音调预处理的累积延迟被重置为零,使得下一个帧能够被适当改变。如果帧的第一类或其它分类主要是脉冲状清音语音,则在步骤S56累积的延迟被保持而没有任何信号的扭曲,且输出信号是符合输入信号累积延迟的简单的时间偏移。
对于音调预处理控制参数的其余的分类,执行音调预处理算法以便在步骤S56扭曲语音信号。其余的音调预处理控制参数可控制在步骤S56采用的扭曲程度。
在步骤S56修改语音之后,音调估计器32可估计音调增益和对于修改的语音信号的音调相关性。基于音调周期确定音调增益和音调相关性。估计音调增益以使目标信号和最终修改的信号之间的均方误差最小化。
图4包括根据本发明对语音信号编码的另一方法。图4的方法类似于图2的方法,所不同在于图4的方法在步骤S20参照强化的自适应码本,而不是标准自适应码本。强化的自适应码本与标准自适应码本相比,具有对应于更大数目的可能的激励向量的更大数目的量化间隔。在可能需要的场合,图1的自适应码本可看作是强化的自适应码本或标准自适应码本。图2和图4中相同的标号指示相同的元件。
已经结合图2对步骤S10、S12和S14进行了描述。以步骤S20开始,在步骤S10或步骤S12之后,编码器施加预测编码方案。步骤S20的预测编码方案包括强化的自适应码本,它比标准自适应码本具有较大的存储规格和较高的分辨率(即较低的量化误差)。于是,图4的方法通过更多选择来自强化的自适应码本的激励向量增进了输入语音再生的精确性。
在步骤S14之后的步骤S22,编码器11向与间隔相关的预处理语音成分施加预测编码方案。编码使用带有较小存储规格的标准的自适应码本。
图5示出根据本发明对语音信号编码的方法。该方法以步骤S11开始。
一般来说,步骤S11和步骤S13处理输入语音信号中的触发特性的检测。触发特性可包括通过语音特性分类器26、检测器24或两者处理或分类的任何特性。如图5所示,在步骤S11和步骤S13触发特性包括语音信号的一般浊音和一般稳态语音成分。
在步骤S11,解码器24或编码器11确定语音信号的帧是否包含一般浊音语音成分。一般浊音语音成分是指语音信号的周期性部分或准周期性部分。如果输入语音信号的帧包含一般浊音语音,则该方法以步骤S13继续。然而,如果语音信号帧不包含浊音语音成分,则该方法以步骤S24继续。
在步骤S13,检测器24或编码器11确定帧内浊音语音成分是否一般是稳态。如果在帧或间隔内浊音语音信号的主频或音调滞后变化不大于最大范围(例如预定的百分比),则浊音语音成分一般是稳态。最大范围可表示为相对于浊音语音成分中心或主频的频率范围,或表示为相对于浊音语音成分中心或主音调滞后的时间范围。最大范围可通过输入语音信号的感知语音编码测试或波形确定。如果浊音语音成分在帧内是稳态的,则该方法以步骤S26继续。否则,如果浊音语音成分在帧内一般不是稳态的,则该方法以步骤S24继续。
在步骤S24,编码器11指定帧作为具有第二数据结构的第二帧类型。第二帧类型的第二数据结构的示意性例子示于图6,这将在稍后更详细地说明。
在步骤S24的另一种步骤中,如果可使用较高的编码速率(例如全速率编码),则编码器11指定帧为第二帧类型,并如果可使用较小的编码速率(例如半速率编码),则编码器11指定帧为第四帧类型。编码速率的可用性可取决于无线通信系统上语音信号再生的目标质量模式。第四帧类型的一示意性的例子示于图7,这将在稍后更详细地描述。
在步骤S26,编码器指定帧为具有第一数据结构的第一帧类型。第一帧类型的一示意性例子示于图6,这将在稍后更详细地描述。
在步骤S26的另一种步骤中,如果可应用较高的编码速率(例如全速率编码),则编码器11指定帧为第一帧类型,并且如果可应用较小的编码速率(例如半速率编码),则编码器11指定帧为第三帧类型。编码速率的可应用性可取决于无线通信系统语音信号再生的目标质量模式。第三帧类型的一示意性例子示于图7,这将在稍后更详细地说明。
在步骤S28,与对于第二帧类型的自适应码本指标72相比,编码器11对于第一帧类型的自适应码本指标72,每帧分配较少数目的存储单元(例如位)。进而,与对第二帧类型固定码本指标74相比,编码器对第一帧类型固定码本指标74,分配较大数存储单元(例如位)。以上存储单元的分配可对第二帧类型强化长期预测编码,并对第一帧类型降低与固定码本相关联的量化误差。与第一帧类型的存储单元的第一分配相比,第二帧类型的每帧存储单元的第二分配,向自适应码本指标分配更大数目的存储单元,以便于基于逐个子帧而不是逐帧地进行长期预测编码。换言之,第二编码方案与第一编码方案相比,具有每帧较大数目的存储单元(例如位)的音调轨迹。与第二分配相比,每帧存储单元的第一分配对固定码本指标分配更大数目的存储单元,以降低与固定码本指标相关联的量化误差。
第一帧类型与第二帧类型之间每帧存储单元分配中的差可根据一分配比值来定义。如这里所使用的,分配比值(R)等于自适应码本指标的每帧存储单元数(A)除以自适应码本指标的每帧存储单元数(A)加上固定码本指标的每帧存储单元数(F)。分配比值在数学上表示为R=A/(A+F)。于是第二帧类型的分配比值大于第一帧类型的分配比值,以促使再生语音的强化的感知质量。
在自适应码本指标与固定码本指标之间第二帧类型具有不同于第一帧类型的平衡以便使再生语音信号的感知质量最大化。因为第一帧类型携带一般稳态浊音数据,故较少数目自适应码本指标的存储单元(例如位)即可提供符合目标感知标准的原始语音信号的真实再生。反之,需要较大数目的存储单元适当表示第二帧类型的残余语音特性,以便符号目标感知标准。因为语音信号的长期信息一般是均匀周期性的,因而对第二帧自适应码本指标需要较少数目的存储单元。这样,对于第一帧类型,语音信号的过去采样对未来语音信号的估计提供了可靠的基础。存储单元的总数与存储单元较少数目之间的差提供了位或字剩余,这可用于对第一帧类型强化固定码本50的性能,或降低空中接口所使用的带宽。通过改进对语音信号中噪声状语音成分和过渡的建模精度,固定码本能够提高语音的质量。
步骤S28之后在步骤S30中,编码器11通过无线通信系统的空中接口64,从编码器11向解码器70发送对于自适应码本指标72和过固定码本指标74每帧分配的存储单元(例如位)。编码器11可包括速率确定模块,用于确定自适应码本指标72和固定码本指标74通过空中接口64所需的传输速率。例如,速率确定模块可接收来自对每一对应的时间间隔语音分类的语音分类器26的输入,对于无线通信系统的特定用户台的语音质量模式选择,以及来自音调预处理模块22的分类输出。
图6和图7分别示出较高速率编码方案(例如全速率)和较低速率编码方案(例如半速率)。如图所示,较高速率编码方案提供了通过空中接口64每帧较高的传输速率。较高速率编码方案支持第一帧类型和第二帧类型。较低速率编码方案支持第三帧类型和第四帧类型。第一帧、第二帧、第三帧和第四帧表示通过无线系统的空中接口64从编码器11向解码器60所传输的数据结构。类型标识符71是区分帧类型的符号或位表示。例如,在图6中类型标识符用来区分第一帧类型与第二帧类型。
数据结构提供了用于表示代表语音信号的基准数据的格式。基准数据可包括滤波器系数指示器76(例如LSF)、自适应码本指标72、固定码本指标74、自适应码本增益指标80及固定码本增益指标78,或其它如前所述的基准数据。先前参照图1曾经说明过上述基准数据。
第一帧类型一般表示稳态浊音语音。一般稳态浊音语音的特征在于,语音信号的长期成分一般是周期性波形或准周期波形。第二帧类型用来对不同于一般稳态浊音语音的语音编码。按这里所使用的,不同于稳态浊音语音的语音是指残余的语音。残余的语音包括语音通特性其它类别之中的语音的噪声成分,爆破音,启动过渡,清音语音。第一帧类型和第二帧类型最好在帧内包括相等数目的子帧(例如4子帧)。第一帧和第二帧的每一个可大约为20毫秒长,虽然也可采用其它不同的帧持续时间实施本发明。第一帧和第二帧每一个包含大约相等的存储单元总数(例如170位)。
标有第一编码方案97的列定义了第一帧类型的位分配和数据结构。标有第二编码方案99的列定义了第二帧类型的位分配和数据结构。就分配给固定码本指标74和自适应码本指标72存储单元的平衡来说,第一帧的存储单元分配不同于第二帧中存储单元的分配。具体来说,第二帧类型比第一帧类型向自适应码本指标72分配较多的位。反之,第二帧类型比第一帧类型对固定码本指标74分配较少的位。在一个例子中,第二帧类型对自适应码本指标72分配每帧26位,而对固定码本指标74分配每帧88位。同时,第一帧类型向自适应码本指标72分配每帧8位,而只向固定码本指标74分配每帧120位。
滞后值对自适应码本36内的激励向量项提供基准。第二帧类型比第一帧类型适于传输每单位时间(例如帧)较大数目的滞后值。在一实施例中,第二帧类型逐个子帧传输滞后值,而第一帧类型逐帧传输滞后值。对于第二帧类型,自适应码本36指标或数据可根据以下的差分编码方案从编码器11和解码器70发送。第一滞后值作为八位代码字传输。第二滞后值作为五位代码字传输,其值表示第一滞后值与绝对第二滞后值之间的差。第三滞后值是作为表示滞后的绝对值的八位代码字传输。第四滞后值作为表示第三滞后值和绝对第四滞后值之间的差的五位代码字传输。于是,尽管传输的位的原始数目有波动,因为差分编码的优点,第一滞后值到第四滞后值的分辨率基本上是均匀的。
对于图7中所示较低速率编码方案,编码器11支持中间列所述的第三编码方案103,及最右侧列所述的第四编码方案101。第三编码方案103与第四帧类型相关联。第四编码方案101与第四帧类型相关联。
如图7中间列所示,第三帧类型是第二帧类型的变种。与第二帧类型相比,第四帧类型配置为通过空中接口64以较小速率进行传输。类似地,如图7最右列所示,第三帧类型是第一帧类型的变种。于是,在说明书中所公开的任何实施例中,在较低速率编码技术或较低感知质量足够情形下,第三编码方案103可代替第一编码方案99。类似地,在本说明书公开的任何实施例中,在较低速率编码技术或较低感知质量足够情形下,第四编码方案101可代替第二编码方案97。
与第二帧类型相比,第三帧类型配置为通过空中接口64以较小速率传输。对于图6的较低速率编码方案每帧的总位数,小于对于图7的较高速率编码方案的每帧总位数,以便于较低的传输速率。例如,对于较高速率编码方案的总位数可大约等于170位,而对于较低速率编码方案的位数可大约等于80位。第三帧类型最好每帧包括三个子帧。第四帧类型最好每帧包括两个子帧。
按可比较的方式,在第三帧类型与第四帧类型之间的位分配,不同于存储单元在第一帧类型和第二帧类型内分配的差别。与第三帧类型相比,第四帧类型对于自适应码本指标72每帧具有较大数目的存储单元。例如,第四帧类型对自适应码本指标72分配每帧14位,而第三帧类型每帧分配7位。对于第三帧类型每帧总位与每帧自适应码本36位之间的差别表示剩余。剩余可用来相对于第四帧类型改进第三帧类型固定码本50的分辨率。在一例子中,第四帧类型具有每帧30位的自适应码本36分辨率,而第三帧类型具有每帧39位的自适应码本36的分辨率。
实际上,编码器可使用不同于较高速率编码方案和较低速率编码方案的一个或多个附加的编码方案,以便通过空中接口64从编码器站点到解码器站点进行语音信号通信。例如,附加的编码方案可包括四分之一速率编码方案和八分之一速率编码方案。在一实施例中,附加的编码方案不使用自适应码本36数据或固定码本50的数据。而是附加的编码方案只从编码器向解码器传输滤波器系数数据和能量数据。
第二帧类型对第一帧类型的选择,以及第四帧类型对第三帧类型的选择与检测器24、语音特性分类器26、或两者相关。如果检测器24确定语音在间隔期间一般是稳态浊音,则第一帧类型和第三帧类型可用于编码。实际上,可基于质量模式选择和语音信号内容来选择第一帧类型和第三帧类型用于编码。质量模式可表示由无线服务的服务供应商确定的语音质量水平。
根据本发明的一种方式,用于对输入语音信号编码的语音编码系统,在自适应码本指标与固定码本指标之间,依据输入语音信号的触发特性分配帧的存储单元。存储单元不同的分配便于提高再生语音的感知质量,同时保持无线系统空中接口可用带宽。
描述本发明的进一步的技术细节在以下共同未决申请中阐述:美国申请序号09/154,660,1998年11月18日提交,标题为“SPEECH ENCODERADAPTIVELY APPLYING PITCH PREPROCESSING WITH CONTINUOUSWARPING”,该申请在此一并结合以资参考。
虽然已经描述了本发明的各种实施例,但对业内一般专业人员明显的是在本发明的范围内可能有更多的实施例和实现方式。于是,除了依据所附权利要求及其等价物之外本发明不受限制。

Claims (29)

1.一种语音编码系统包括:
检测器,用于检测输入语音信号在一间隔期间一般是否具有触发特性;
编码器,支持可用于与该间隔相关联的帧的语音信号的第一编码方案和第二编码方案至少之一,第一编码方案具有预处理过程,用于处理输入的语音信号以形成趋向于一般理想的浊音和稳态特性的修改的语音信号;以及
选择器,用于基于在输入语音信号的间隔期间是否检测到触发特性而选择第一编码方案和第二编码方案之一;
其中该第一编码方案使用用于以所选择的速率对输入语音信号进行编码的第一帧类型,且该第二编码方案使用用于以该相同的所选择速率对输入语音信号进行编码的第二帧类型,其中该第二帧类型不同于该第一帧类型。
2.根据权利要求1的语音编码系统,其中触发特性包括语音信号的一般浊音和一般稳态语音成分。
3.根据权利要求1的语音编码系统,其中如果所述检测器确定在帧期间语音信号一般是稳态且一般是周期性的,则选择器选择第一编码方案。
4.根据权利要求1的语音编码系统,其中如果检测器确定在帧期间语音信号一般是非稳态的,则选择器选择第二编码方案。
5.根据权利要求1的语音编码系统,还包括:
感知加权滤波器,用于对输入语音信号滤波;
音调-预处理模块,具有连接到该感知加权滤波器输出端的输入端,该音调-预处理模块确定一目标信号,用于使加权语音信号时间扭曲。
6.根据权利要求1的语音编码系统,还包括音调-预处理模块,用于基于语音信号的多个帧确定输入音调轨迹,并改变与采样相关联的音调滞后中的变化以跟踪输入音调轨迹。
7.根据权利要求1的语音编码系统,其中第一编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第一分配,第二编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第二分配,其中该第一分配不同于该第二分配。
8.根据权利要求7的语音编码系统,其中与存储单元的第一分配相比,每帧存储单元的第二分配向自适应码本指标分配较大数目的存储单元,以便于基于逐个子帧进行长期预测编码。
9.根据权利要求7的语音编码系统,其中与存储单元的第二分配相比,每帧存储单元的第一分配向固定码本指标分配较大数目的存储单元,以降低与固定码本指标相关联的量化误差。
10.根据权利要求7的语音编码系统,其中第二编码方案与第一编码方案相比具有较高的分配比值,分配比值由分配给自适应码本指标的存储单元数除以分配给自适应码本指标的存储单元数与分配给固定码本指标的存储单元数之和来确定。
11.根据权利要求7的语音编码系统,其中所选择用于对语音信号进行编码的速率是全速率,其中第一编码方案使用用于以全速率对语音信号进行编码的第一帧类型,而第二编码方案使用用于以全速率对语音信号进行编码的第二帧类型。
12.根据权利要求7的语音编码系统,其中如果所选择的速率为较高速率编码,则第一编码方案使用第一帧类型且第二编码方案使用第二帧类型,并如果所选择的速率为较低速率编码,则第一编码方案使用第三帧类型且第二编码方案使用第四帧类型。
13.根据权利要求1的语音编码系统,其中所述触发特性是要检测输入语音信号在所述间隔期间一般是否具有一般浊音和一般稳态特性,其中所述第二编码方案具有长期预测过程,用于基于逐个子帧处理输入的语音信号。
14.根据权利要求13的语音编码系统,其中如果所述检测器确定在帧期间语音信号一般不是周期性的,则所述选择器选择第二编码方案。
15.根据权利要求13的语音编码系统,其中如果所述检测器确定在帧期间语音信号一般是非稳态的,则所述选择器选择第二编码方案。
16.根据权利要求13的语音编码系统,其中第二编码方案与第一编码方案相比具有每帧较大位数的音调轨迹,以表示音调轨迹。
17.根据权利要求1的语音编码系统,其中所述第一帧类型为滤波器系数指示器分配25位,为类型指示器分配1位,为自适应码本指标分配8位,为固定码本指标分配120位,为自适应码本增益分配6位,以及为固定码本增益分配10位。
18.根据权利要求17的语音编码系统,其中所述第二帧类型为滤波器系数指示器分配27位,为类型指示器分配1位,为自适应码本指标分配26位,为固定码本指标分配88位,以及为自适应码本增益和固定码本增益分配28位。
19.根据权利要求1的语音编码系统,其中所述第二帧类型为滤波器系数指示器分配27位,为类型指示器分配1位,为自适应码本指标分配26位,为固定码本指标分配88位,以及为自适应码本增益和固定码本增益分配28位。
20.根据权利要求12的语音编码系统,其中所述第一帧类型为滤波器系数指示器分配25位,为类型指示器分配1位,为自适应码本指标分配8位,为固定码本指标分配120位,为自适应码本增益分配6位,以及为固定码本增益分配10位。
21.根据权利要求20的语音编码系统,其中所述第三帧类型为滤波器系数指示器分配21位,为类型指示器分配1位,为自适应码本指标分配7位,为固定码本指标分配39位,为自适应码本增益分配4位,以及为固定码本增益分配8位。
22.一种语音编码方法,包括以下步骤:
检测输入语音信号在一间隔期间是否具有触发特性;
基于所述触发特性的检测,选择第一编码方案和第二编码方案之一,应用于对于与该间隔相关的帧的输入语音信号;
如果在输入语音信号中检测到触发特性,根据第一编码方案处理该输入的语音信号,以形成趋向于一般理想的浊音和稳态特性的修改的语音信号;以及
其中该第一编码方案使用用于以所选择的速率对输入语音信号进行编码的第一帧类型,而该第二编码方案使用用于以该相同的所选择速率对输入语音信号进行编码的第二帧类型,其中该第二帧类型不同于该第一帧类型。
23.根据权利要求22的方法,其中所述检测步骤包括检测输入语音信号在所述间隔期间一般是否具有作为触发特性的一般浊音及一般稳态成分。
24.根据权利要求22的方法,还包括这样的步骤,即支持第一编码方案和第二编码方案,该第一方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第一分配,该第二编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第二分配,其中该第二分配不同于该第一分配。
25.根据权利要求22的方法,还包括这样的步骤,即如果在所述间隔期间没有检测到触发特性,则根据第二编码方案的长期预测过程,基于逐个子帧处理输入语音信号。
26.根据权利要求22的方法,其中所述检测步骤包括检测输入语音信号在所述间隔期间一般是否具有一般浊音及一般稳态特性,其中所述第二编码方案具有长期预测过程,用于基于逐个子帧处理输入的语音信号。
27.根据权利要求22的方法,其中所述第一帧类型为滤波器系数指示器分配25位,为类型指示器分配1位,为自适应码本指标分配8位,为固定码本指标分配120位,为自适应码本增益分配6位,以及为固定码本增益分配10位。
28.根据权利要求27的方法,其中所述第二帧类型为滤波器系数指示器分配27位,为类型指示器分配1位,为自适应码本指标分配26位,为固定码本指标分配88位,以及为自适应码本增益和固定码本增益分配28位。
29.根据权利要求22的方法,其中所述第二帧类型为滤波器系数指示器分配27位,为类型指示器分配1位,为自适应码本指标分配26位,为固定码本指标分配88位,以及为自适应码本增益和固定码本增益分配28位。
CNB018156401A 2000-09-15 2001-09-17 具有自适应编码配置的语音编码系统 Expired - Lifetime CN1185624C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/663,002 US7072832B1 (en) 1998-08-24 2000-09-15 System for speech encoding having an adaptive encoding arrangement
US09/663,002 2000-09-15

Publications (2)

Publication Number Publication Date
CN1457485A CN1457485A (zh) 2003-11-19
CN1185624C true CN1185624C (zh) 2005-01-19

Family

ID=24660098

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018156401A Expired - Lifetime CN1185624C (zh) 2000-09-15 2001-09-17 具有自适应编码配置的语音编码系统

Country Status (6)

Country Link
US (12) US7072832B1 (zh)
EP (1) EP1328924A1 (zh)
KR (1) KR20030046452A (zh)
CN (1) CN1185624C (zh)
AU (1) AU2001287972A1 (zh)
WO (1) WO2002023535A1 (zh)

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
EP1383113A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie capable de contrôler indépendamment les distorsions à court terme et à long terme
FR2850781B1 (fr) * 2003-01-30 2005-05-06 Jean Luc Crebouw Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage du bruit, la creation d'effets speciaux et dispositif pour la mise en oeuvre dudit procede
US20040167772A1 (en) * 2003-02-26 2004-08-26 Engin Erzin Speech coding and decoding in a voice communication system
US7044245B2 (en) * 2003-06-17 2006-05-16 Science Applications International Corporation Toroidal propulsion and steering system
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
EP3340511B1 (en) 2004-10-12 2022-11-30 TQ Delta, LLC Resource sharing in a telecommunications enviroment
US8093484B2 (en) * 2004-10-29 2012-01-10 Zenph Sound Innovations, Inc. Methods, systems and computer program products for regenerating audio performances
US7598447B2 (en) * 2004-10-29 2009-10-06 Zenph Studios, Inc. Methods, systems and computer program products for detecting musical notes in an audio signal
KR20070085982A (ko) * 2004-12-10 2007-08-27 마츠시타 덴끼 산교 가부시키가이샤 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
EP1997104B1 (en) * 2006-03-20 2010-07-21 Mindspeed Technologies, Inc. Open-loop pitch track smoothing
KR100735343B1 (ko) * 2006-04-11 2007-07-04 삼성전자주식회사 음성신호의 피치 정보 추출장치 및 방법
EP2005674B1 (en) 2006-04-12 2016-09-28 TQ Delta, LLC Packet retransmission and memory sharing
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8712766B2 (en) * 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
EP1860851B1 (en) * 2006-05-26 2011-11-09 Incard SA Method for implementing voice over IP through and electronic device connected to a packed switched network
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
PT2102619T (pt) * 2006-10-24 2017-05-25 Voiceage Corp Método e dispositivo para codificação de tramas de transição em sinais de voz
US7521622B1 (en) * 2007-02-16 2009-04-21 Hewlett-Packard Development Company, L.P. Noise-resistant detection of harmonic segments of audio signals
JP5596341B2 (ja) * 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法
JP4882899B2 (ja) * 2007-07-25 2012-02-22 ソニー株式会社 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US20100274556A1 (en) * 2008-01-16 2010-10-28 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US9378751B2 (en) * 2008-06-19 2016-06-28 Broadcom Corporation Method and system for digital gain processing in a hardware audio CODEC for audio transmission
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
PT2313887T (pt) * 2008-07-10 2017-11-14 Voiceage Corp Dispositivo e método de quantificação de filtro de lpc de taxa de bits variável e quantificação inversa
KR101250309B1 (ko) * 2008-07-11 2013-04-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 에일리어싱 스위치 기법을 이용하여 오디오 신호를 인코딩/디코딩하는 장치 및 방법
US20100057475A1 (en) * 2008-08-26 2010-03-04 Nelson Sollenberger Method and system for digital gain control in an audio codec
US20100057473A1 (en) * 2008-08-26 2010-03-04 Hongwei Kong Method and system for dual voice path processing in an audio codec
US8706479B2 (en) * 2008-11-14 2014-04-22 Broadcom Corporation Packet loss concealment for sub-band codecs
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
KR101797033B1 (ko) * 2008-12-05 2017-11-14 삼성전자주식회사 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
CN101615910B (zh) 2009-05-31 2010-12-22 华为技术有限公司 压缩编码的方法、装置和设备以及压缩解码方法
EP2444966B1 (en) * 2009-06-19 2019-07-10 Fujitsu Limited Audio signal processing device and audio signal processing method
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
EP2511904A4 (en) * 2009-12-10 2013-08-21 Lg Electronics Inc METHOD AND APPARATUS FOR ENCODING A SPEECH SIGNAL
CN101789240B (zh) * 2009-12-25 2012-04-25 华为技术有限公司 语音信号处理方法和装置以及通信系统
JP6073215B2 (ja) * 2010-04-14 2017-02-01 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
FR2961937A1 (fr) * 2010-06-29 2011-12-30 France Telecom Codage/decodage predictif lineaire adaptatif
CN102340741B (zh) * 2010-07-20 2014-02-19 华为技术有限公司 数据调制、解调方法及频谱管理方法、装置和系统
CN102385858B (zh) * 2010-08-31 2013-06-05 国际商业机器公司 情感语音合成方法和系统
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
AU2012218778B2 (en) * 2011-02-15 2016-10-20 Voiceage Evs Llc Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec
US9626982B2 (en) * 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
US20140114653A1 (en) * 2011-05-06 2014-04-24 Nokia Corporation Pitch estimator
NO2669468T3 (zh) * 2011-05-11 2018-06-02
PL2737479T3 (pl) * 2011-07-29 2017-07-31 Dts Llc Adaptacyjna poprawa zrozumiałości głosu
JP2013076871A (ja) * 2011-09-30 2013-04-25 Oki Electric Ind Co Ltd 音声符号化装置及びプログラム、音声復号装置及びプログラム、並びに、音声符号化システム
US9583108B2 (en) * 2011-12-08 2017-02-28 Forrest S. Baker III Trust Voice detection for automated communication system
CN107342094B (zh) 2011-12-21 2021-05-07 华为技术有限公司 非常短的基音周期检测和编码
CN104254886B (zh) * 2011-12-21 2018-08-14 华为技术有限公司 自适应编码浊音语音的基音周期
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9064497B2 (en) * 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
US8949118B2 (en) * 2012-03-19 2015-02-03 Vocalzoom Systems Ltd. System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9947331B2 (en) * 2012-05-23 2018-04-17 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program and recording medium
US9805738B2 (en) * 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
US10199043B2 (en) * 2012-09-07 2019-02-05 Dts, Inc. Scalable code excited linear prediction bitstream repacked from a higher to a lower bitrate by discarding insignificant frame data
RU2612581C2 (ru) 2012-11-15 2017-03-09 Нтт Докомо, Инк. Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
JP2014123011A (ja) * 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
KR101433712B1 (ko) * 2013-03-07 2014-08-27 순환엔지니어링 주식회사 리니어 모션 스테이지의 제어 장치
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
BR112015031824B1 (pt) 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para uma ocultação melhorada do livro do código adaptativo na ocultação tipo acelp utilizando uma estimativa melhorada de atraso de pitch
MX352092B (es) 2013-06-21 2017-11-08 Fraunhofer Ges Forschung Aparato y método para mejorar el ocultamiento del libro de códigos adaptativo en la ocultación similar a acelp empleando una resincronización de pulsos mejorada.
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN104299614B (zh) 2013-07-16 2017-12-29 华为技术有限公司 解码方法和解码装置
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US20150100318A1 (en) * 2013-10-04 2015-04-09 Qualcomm Incorporated Systems and methods for mitigating speech signal quality degradation
CN106030703B (zh) * 2013-12-17 2020-02-04 诺基亚技术有限公司 音频信号编码器
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
JP6542796B2 (ja) 2014-03-28 2019-07-10 サムスン エレクトロニクス カンパニー リミテッド 線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置
CN112927703A (zh) 2014-05-07 2021-06-08 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置
US10255903B2 (en) * 2014-05-28 2019-04-09 Interactive Intelligence Group, Inc. Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
US10014007B2 (en) * 2014-05-28 2018-07-03 Interactive Intelligence, Inc. Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
US9378755B2 (en) 2014-05-30 2016-06-28 Apple Inc. Detecting a user's voice activity using dynamic probabilistic models of speech features
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP3057097B1 (en) * 2015-02-11 2017-09-27 Nxp B.V. Time zero convergence single microphone noise reduction
WO2016160403A1 (en) 2015-03-27 2016-10-06 Dolby Laboratories Licensing Corporation Adaptive audio filtering
US10403269B2 (en) 2015-03-27 2019-09-03 Google Llc Processing audio waveforms
US10013883B2 (en) 2015-06-22 2018-07-03 Digital Ally, Inc. Tracking and analysis of drivers within a fleet of vehicles
US10339921B2 (en) 2015-09-24 2019-07-02 Google Llc Multichannel raw-waveform neural networks
US10229700B2 (en) 2015-09-24 2019-03-12 Google Llc Voice activity detection
US10283143B2 (en) * 2016-04-08 2019-05-07 Friday Harbor Llc Estimating pitch of harmonic signals
US10224058B2 (en) 2016-09-07 2019-03-05 Google Llc Enhanced multi-channel acoustic models
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
US10529320B2 (en) 2016-12-21 2020-01-07 Google Llc Complex evolution recurrent neural networks
US10140980B2 (en) 2016-12-21 2018-11-27 Google LCC Complex linear projection for acoustic modeling
JP6646001B2 (ja) * 2017-03-22 2020-02-14 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP2018159759A (ja) 2017-03-22 2018-10-11 株式会社東芝 音声処理装置、音声処理方法およびプログラム
CN111133510B (zh) * 2017-09-20 2023-08-22 沃伊斯亚吉公司 用于在celp编解码器中高效地分配比特预算的方法和设备
US11270719B2 (en) * 2017-12-01 2022-03-08 Nippon Telegraph And Telephone Corporation Pitch enhancement apparatus, pitch enhancement method, and program
JP6962269B2 (ja) * 2018-05-10 2021-11-05 日本電信電話株式会社 ピッチ強調装置、その方法、およびプログラム
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
JP7266689B2 (ja) * 2019-01-13 2023-04-28 華為技術有限公司 ハイレゾリューションオーディオ符号化
JP7128420B2 (ja) * 2019-02-28 2022-08-31 日本電信電話株式会社 信号処理方法、信号処理装置及び通信システム
CN112181248B (zh) * 2020-09-25 2022-04-12 广州南方卫星导航仪器有限公司 一种历史列表的操作方法和装置
CN115868940B (zh) * 2023-02-27 2023-05-26 安徽通灵仿生科技有限公司 一种基于iabp的生理信号质量评估方法及装置

Family Cites Families (170)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58140798A (ja) * 1982-02-15 1983-08-20 株式会社日立製作所 音声ピツチ抽出方法
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
JPH0817278B2 (ja) 1988-10-26 1996-02-21 北川工業株式会社 電磁波シールド用ガスケット
JPH0782360B2 (ja) 1989-10-02 1995-09-06 日本電信電話株式会社 音声分析合成方法
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
IL95753A (en) * 1989-10-17 1994-11-11 Motorola Inc Digits a digital speech
US4980916A (en) 1989-10-26 1990-12-25 General Electric Company Method for improving speech quality in code excited linear predictive speech coding
GB9013411D0 (en) * 1990-06-15 1990-08-08 Nat Power Plc Improvements in or relating to glass ph electrodes
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
JPH0451200A (ja) 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化方式
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
CA2051304C (en) * 1990-09-18 1996-03-05 Tomohiko Taniguchi Speech coding and decoding system
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
US5187591A (en) 1991-01-24 1993-02-16 Micom Communications Corp. System for transmitting and receiving aural information and modulated data
JPH04264597A (ja) 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
ES2225321T3 (es) 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
DE4127490A1 (de) * 1991-08-20 1993-02-25 Fritz Stahlecker Ringspinnmaschine
US5657418A (en) * 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
AU3457093A (en) 1992-01-31 1993-09-01 Gilad Copitch Information compaction system
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5239557A (en) 1992-04-10 1993-08-24 Ericsson/Ge Mobile Communications Discountinuous CDMA reception
JPH075898A (ja) 1992-04-28 1995-01-10 Technol Res Assoc Of Medical & Welfare Apparatus 音声信号処理装置と破裂性抽出装置
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US5313554A (en) * 1992-06-16 1994-05-17 At&T Bell Laboratories Backward gain adaptation method in code excited linear prediction coders
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
AU5550694A (en) * 1992-11-06 1994-06-08 Pericle Communications Company Adaptive data rate modem
JPH06186998A (ja) * 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式
US5854845A (en) 1992-12-31 1998-12-29 Intervoice Limited Partnership Method and circuit for voice automatic gain control
US5382949A (en) * 1993-02-01 1995-01-17 Motorola, Inc. Method for increasing battery life for selective call receivers
US5995539A (en) 1993-03-17 1999-11-30 Miller; William J. Method and apparatus for signal transmission and reception
US5367516A (en) * 1993-03-17 1994-11-22 Miller William J Method and apparatus for signal transmission and reception
US5491771A (en) * 1993-03-26 1996-02-13 Hughes Aircraft Company Real-time implementation of a 8Kbps CELP coder on a DSP pair
US5526464A (en) * 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
US5727122A (en) * 1993-06-10 1998-03-10 Oki Electric Industry Co., Ltd. Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
CA2124713C (en) * 1993-06-18 1998-09-22 Willem Bastiaan Kleijn Long term predictor
US5621852A (en) 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
CA2136891A1 (en) * 1993-12-20 1995-06-21 Kalyan Ganesan Removal of swirl artifacts from celp based speech coders
US5517595A (en) * 1994-02-08 1996-05-14 At&T Corp. Decomposition in noise and periodic signal waveforms in waveform interpolation
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
JP3090842B2 (ja) 1994-04-28 2000-09-25 沖電気工業株式会社 ビタビ復号法に適応した送信装置
TW271524B (zh) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
JP2964879B2 (ja) * 1994-08-22 1999-10-18 日本電気株式会社 ポストフィルタ
US5602913A (en) * 1994-09-22 1997-02-11 Hughes Electronics Robust double-talk detection
EP0704836B1 (en) * 1994-09-30 2002-03-27 Kabushiki Kaisha Toshiba Vector quantization apparatus
JP2638522B2 (ja) 1994-11-01 1997-08-06 日本電気株式会社 音声符号化装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
JP3328080B2 (ja) * 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JPH08179795A (ja) 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
SE9500858L (sv) 1995-03-10 1996-09-11 Ericsson Telefon Ab L M Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
JP3235703B2 (ja) 1995-03-10 2001-12-04 日本電信電話株式会社 ディジタルフィルタのフィルタ係数決定方法
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
JPH08292797A (ja) 1995-04-20 1996-11-05 Nec Corp 音声符号化装置
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5732389A (en) 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
GB9512284D0 (en) 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US5891118A (en) * 1995-09-05 1999-04-06 Kao Corporation Absorbent article
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
FR2739995B1 (fr) 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5867814A (en) * 1995-11-17 1999-02-02 National Semiconductor Corporation Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
US5692101A (en) 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques
JPH09187077A (ja) 1996-01-08 1997-07-15 Fujitsu Ltd 簡易型携帯電話装置の移動局の制御方式
US5689615A (en) 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
JP3840684B2 (ja) * 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
WO1997033402A1 (en) 1996-03-04 1997-09-12 Ericsson Inc. Digital communication system for adapting communications protocol based on a current communication channel condition
US6138001A (en) * 1996-03-12 2000-10-24 Ntt Mobile Communications Network, Inc. Scheme for intermittent reception of paging signals in mobile communication system
US6819661B2 (en) 1996-03-15 2004-11-16 Ntt Docomo, Inc. Method and apparatus of a mobile communication system which reduces power consumption by observing only the starting slot on a TDMA radio channel
US5774836A (en) * 1996-04-01 1998-06-30 Advanced Micro Devices, Inc. System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
SE9601606D0 (sv) 1996-04-26 1996-04-26 Ericsson Telefon Ab L M Sätt vid radiotelekommunikationssystem
KR100389895B1 (ko) * 1996-05-25 2003-11-28 삼성전자주식회사 음성 부호화 및 복호화방법 및 그 장치
JP3364825B2 (ja) 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
US5799271A (en) * 1996-06-24 1998-08-25 Electronics And Telecommunications Research Institute Method for reducing pitch search time for vocoder
JPH1020891A (ja) 1996-07-09 1998-01-23 Sony Corp 音声符号化方法及び装置
SE507370C2 (sv) 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
JPH10116097A (ja) 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
KR20030096444A (ko) * 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
US6269331B1 (en) 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JP3575967B2 (ja) * 1996-12-02 2004-10-13 沖電気工業株式会社 音声通信システムおよび音声通信方法
US5914949A (en) 1996-12-17 1999-06-22 Lucent Technologies Inc. Circuit and method for tracking finger off-set in a spread-spectrum rake receiver and wireless infrastructure employing the same
US5978366A (en) 1996-12-20 1999-11-02 Ericsson Inc. Methods and systems for reduced power operation of cellular mobile terminals
US6148282A (en) 1997-01-02 2000-11-14 Texas Instruments Incorporated Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure
US5924061A (en) * 1997-03-10 1999-07-13 Lucent Technologies Inc. Efficient decomposition in noise and periodic signal waveforms in waveform interpolation
US5903866A (en) * 1997-03-10 1999-05-11 Lucent Technologies Inc. Waveform interpolation speech coding using splines
US5893060A (en) * 1997-04-07 1999-04-06 Universite De Sherbrooke Method and device for eradicating instability due to periodic signals in analysis-by-synthesis speech codecs
US5828672A (en) * 1997-04-30 1998-10-27 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of radio channel bit error rate in a digital radio telecommunication network
FI113903B (fi) 1997-05-07 2004-06-30 Nokia Corp Puheen koodaus
US6111865A (en) * 1997-05-30 2000-08-29 Qualcomm Incorporated Dual channel slotted paging
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
US6073092A (en) 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US5991600A (en) 1997-07-09 1999-11-23 Ericsson Inc. Integration of mobile station channel measurement with paging channel displacement operation in a wireless communications system
DE19729494C2 (de) * 1997-07-10 1999-11-04 Grundig Ag Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte
US6347081B1 (en) * 1997-08-25 2002-02-12 Telefonaktiebolaget L M Ericsson (Publ) Method for power reduced transmission of speech inactivity
US6167031A (en) 1997-08-29 2000-12-26 Telefonaktiebolaget Lm Ericsson (Publ) Method for selecting a combination of modulation and channel coding schemes in a digital communication system
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
KR20000068922A (ko) * 1997-09-10 2000-11-25 요트.게.아. 롤페즈 통신 시스템 및 터미널
WO1999016050A1 (en) 1997-09-23 1999-04-01 Voxware, Inc. Scalable and embedded codec for speech and audio signals
US6044069A (en) * 1997-10-29 2000-03-28 Conexant Systems, Inc. Power management system for a mobile station
US6574211B2 (en) * 1997-11-03 2003-06-03 Qualcomm Incorporated Method and apparatus for high rate packet data transmission
GB2332598B (en) 1997-12-20 2002-12-04 Motorola Ltd Method and apparatus for discontinuous transmission
US6298139B1 (en) * 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
FI980132A (fi) 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
US6539205B1 (en) * 1998-03-23 2003-03-25 Skyworks Solutions, Inc. Traffic channel quality estimation from a digital control channel
US6470309B1 (en) 1998-05-08 2002-10-22 Texas Instruments Incorporated Subframe-based correlation
US6098037A (en) * 1998-05-19 2000-08-01 Texas Instruments Incorporated Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US6014618A (en) * 1998-08-06 2000-01-11 Dsp Software Engineering, Inc. LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation
JP4308345B2 (ja) 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6330533B2 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
FI105635B (fi) 1998-09-01 2000-09-15 Nokia Mobile Phones Ltd Menetelmä taustakohinainformaation lähettämiseksi tietokehysmuotoisessa tiedonsiirrossa
FI106906B (fi) * 1998-09-09 2001-04-30 Nokia Networks Oy Lähetysmenetelmä ja radiojärjestelmä
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
WO2000031996A2 (en) * 1998-11-24 2000-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems
US6256606B1 (en) 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
US6182030B1 (en) * 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
JP3905706B2 (ja) 1999-04-19 2007-04-18 富士通株式会社 音声符号化装置、音声処理装置及び音声処理方法
US6633841B1 (en) 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US6151571A (en) 1999-08-31 2000-11-21 Andersen Consulting System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
US6353810B1 (en) * 1999-08-31 2002-03-05 Accenture Llp System, method and article of manufacture for an emotion detection system improving emotion recognition
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6412540B2 (en) * 2000-05-24 2002-07-02 Hendee Enterprises, Inc. Structural protective windscreen
US6804218B2 (en) 2000-12-04 2004-10-12 Qualcomm Incorporated Method and apparatus for improved detection of rate errors in variable rate receivers
US6738739B2 (en) * 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US7103538B1 (en) * 2002-06-10 2006-09-05 Mindspeed Technologies, Inc. Fixed code book with embedded adaptive code book

Also Published As

Publication number Publication date
US9269365B2 (en) 2016-02-23
WO2002023535A1 (en) 2002-03-21
US20080288246A1 (en) 2008-11-20
US8650028B2 (en) 2014-02-11
US7266493B2 (en) 2007-09-04
KR20030046452A (ko) 2003-06-12
US20070255561A1 (en) 2007-11-01
US7072832B1 (en) 2006-07-04
US8620647B2 (en) 2013-12-31
US20090157395A1 (en) 2009-06-18
EP1328924A1 (en) 2003-07-23
US20090182558A1 (en) 2009-07-16
US20080319740A1 (en) 2008-12-25
US20090164210A1 (en) 2009-06-25
WO2002023535A8 (en) 2002-07-04
US8635063B2 (en) 2014-01-21
CN1457485A (zh) 2003-11-19
US20060089833A1 (en) 2006-04-27
US20160104500A1 (en) 2016-04-14
US9401156B2 (en) 2016-07-26
US20080147384A1 (en) 2008-06-19
US20090024386A1 (en) 2009-01-22
US20080294429A1 (en) 2008-11-27
US9190066B2 (en) 2015-11-17
US9747915B2 (en) 2017-08-29
AU2001287972A1 (en) 2002-03-26

Similar Documents

Publication Publication Date Title
CN1185624C (zh) 具有自适应编码配置的语音编码系统
US6760698B2 (en) System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
CN1123866C (zh) 一种语音编/解码方法和装置
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
CN1223989C (zh) 可变速率语音编码器中的帧擦除补偿法及用该方法的装置
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
CN103548081B (zh) 噪声稳健语音译码模式分类
CN1820306B (zh) 可变比特率宽带语音编码中增益量化的方法和装置
CN1154086C (zh) Celp转发
CN1379899A (zh) 语音可变速率编码方法与设备
US20070043560A1 (en) Excitation codebook search method in a speech coding system
CN1708907A (zh) 用于快速celp参数映射的方法和装置
CN1274456A (zh) 语音编码器
CN1468427A (zh) 一种码激励线性预测语音编码器的增益量化
CN1135527C (zh) 语音编码方法和装置,输入信号判别方法,语音解码方法和装置以及程序提供介质
AU2014320881A1 (en) Adaptive bandwidth extension and apparatus for the same
CN101061535A (zh) 用于人工扩展语音信号的带宽的方法和装置
CN1441949A (zh) 语音编码中的前向纠错
CN1035379A (zh) 具有改进的矢量激发源的数字语音编码器
CN104517612A (zh) 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
CN1297952C (zh) 声音增强方法和声音增强系统
CN1190773A (zh) 语音编码的波形增益估测方法
Gersho Linear prediction techniques in speech coding
Liang et al. A new 1.2 kb/s speech coding algorithm and its real-time implementation on TMS320LC548

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: California, USA

Patentee after: Mandus bide technology LLC

Address before: California, USA

Patentee before: Mindspeed Technologies, Inc.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20180403

Address after: Massachusetts, USA

Patentee after: MACOM technology solving holding Co.

Address before: California, USA

Patentee before: Mandus bide technology LLC

Effective date of registration: 20180403

Address after: California, USA

Patentee after: Mindspeed Technologies, Inc.

Address before: California, USA

Patentee before: Conexant Systems, Inc.

TR01 Transfer of patent right
CX01 Expiry of patent term

Granted publication date: 20050119

CX01 Expiry of patent term