CN109346093B - 一种低速率声码器子带清浊音参数提取与量化的融合方法 - Google Patents
一种低速率声码器子带清浊音参数提取与量化的融合方法 Download PDFInfo
- Publication number
- CN109346093B CN109346093B CN201811541115.6A CN201811541115A CN109346093B CN 109346093 B CN109346093 B CN 109346093B CN 201811541115 A CN201811541115 A CN 201811541115A CN 109346093 B CN109346093 B CN 109346093B
- Authority
- CN
- China
- Prior art keywords
- sub
- sonant
- band surd
- quantization
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 54
- 238000000605 extraction Methods 0.000 title claims abstract description 31
- 238000007500 overflow downdraw method Methods 0.000 title claims abstract description 22
- 239000013598 vector Substances 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims abstract description 56
- 238000005086 pumping Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 9
- 238000009432 framing Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000005284 excitation Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 17
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000155 melt Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本公开公开了一种低速率声码器子带清浊音参数提取与量化的融合方法,该方法充分考虑了子带清浊音参数的统计和量化特性,采用在提取过程中不断进行失真比较和候选矢量淘汰的方法,减少需要搜索的候选矢量,尽快锁定目标矢量,进而提前结束分析和搜索过程。可以有效用于2400bps以下的低速率、超低速率语音编码算法中,实现减少低速率声码器算法复杂度、降低系统功耗的目的。
Description
技术领域
本公开属于语音编码中低速率声码器的技术领域,涉及一种低速率声码器子带清浊音参数提取与量化的融合方法。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着计算机和通信技术的发展,低速率声码器在诸如卫星通信、保密通信、水声通信等领域的嵌入式产品中得到了广泛的应用。在这些应用场景中,为了增加通信容量,声码器的编码速率越来越低,算法越来越复杂,功耗也越来越高。
目前国内外的研究主要集中在2400bps以下速率高质量声码器上,低速率声码器中激励信号的合成非常重要,而多带激励信号合成是目前激励信号合成的重要手段,混合激励线性预测编码算法等均采用了多带激励模型。多带激励信号合成主要依靠于子带清浊音参数,目前低速率声码器中,如图1所示,子带清浊音参数的分析和量化过程如下:
(1)对输入语音信号样点按时间顺序分帧;
(2)每帧语音划分为5个子带,提取子带清浊音参数,表示为:bv1,bv2,bv3,bv4,bv5,其中bvi为BOOL值,1代表浊音,0代表清音;
(3)连续求取N个语音帧的子带清浊音参数,构成超级帧矢量:BV=[bv1,1,bv1,2,bv1,3,bv1,4,bv1,5;...;bvN,1,bvN,2,bvN,3,bvN,4,bvN,5];
(4)对超级帧子带清浊音矢量进行量化,将其量化索引值进行编码传输;
(5)解码端根据索引值搜索码本得到超级帧子带清浊音矢量
(6)根据超级帧子带清浊音矢量得到每个语音帧的子带清浊音参数送入激励信号合成端生成激励信号。
然而,现有的语音端点检测存在如下问题:
上述已有技术中,子带清浊音参数的分析和量化是串行完成的,即先求得所有帧的子带清浊音参数,组成超帧矢量后再进行量化。实际上,随着声码器速率的降低,用来量化各种参数的比特数越来越少,矢量量化的胞腔会越来越大,码本中矢量间的距离会越来越远,尤其是子带清浊音参数,其量化比特数通常是各参数中最少的。
如果能够在分析子带清浊音参数的同时进行量化搜索,并进行失真比较,往往可以提前定位目标矢量,进而提前结束分析和搜索过程。由于上述比较操作与参数的分析过程相比,运算量几乎可以忽略,因而会有效减少算法复杂度,降低系统功耗。而现有技术并未充分考虑或利用到这种子带清浊音参数分析和量化的融合方法,无法有效地减少算法的复杂度和降低系统功耗。
发明内容
针对现有技术中存在的不足,本公开的一个或多个实施例提供了一种低速率声码器子带清浊音参数提取与量化的融合方法,充分利用低速率声码器子带清浊音参数的统计和量化特性,融合其分析和量化过程,采用在分析过程中不断进行失真比较和候选矢量淘汰的方法,尽快锁定目标矢量,进而提前结束分析和搜索过程。有效实现减少低速率声码器算法复杂度、降低系统功耗的目的。
根据本公开的一个或多个实施例的一个方面,提供一种低速率声码器子带清浊音参数提取与量化的融合方法。
一种低速率声码器子带清浊音参数提取与量化的融合方法,该方法包括:
接收输入语音信号,并将其按时间顺序分帧;
将每个语音帧均划分为数量相同的若干子带,提取子带清浊音参数;
N个语音帧组成超级帧,令M为N加1的和除以2后向下取整的数,连续求取M个语音帧的子带清浊音参数,分别计算其与量化码本中候选矢量前M个子带清浊音参数间的失真值;令l=M+1;
提取第l帧的子带清浊音参数,计算其与量化码本中候选矢量第l个子带清浊音参数间的失真值,用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值,计算最小失真值,淘汰量化码本中与最小失真值距离大于预设值的其他失真值对应的候选矢量;
当量化码本中剩余候选矢量个数为1或是否已经提取到最后一帧时,将最小失真值对应的候选矢量的索引进行编码传输,否则令l=l+1,返回上一步继续淘汰候选矢量;
解码端根据索引值搜索量化码本得到超级帧子带清浊音矢量;
根据超级帧子带清浊音矢量,得到每个语音帧的子带清浊音参数,输入激励信号合成端生成激励信号。
进一步地,在该方法中,将输入语音信号按时间顺序分帧,具体步骤包括:
将输入语音信号按8kHz频率进行采样,经过高通滤波去除工频干扰的语音样点,每160个语音样点构成一帧。
进一步地,在该方法中,将每个语音帧均划分为5个子带。
进一步地,在该方法中,按2400b/s混合激励的线性预测语音编码算法提取子带清浊音参数。
进一步地,在该方法中,所述量化码本据训练矢量集得到。
进一步地,在该方法中,将提取第M+1帧的子带清浊音参数与量化码本中候选矢量第M+1个子带清浊音参数间的失真值与M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值求和,用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值。
进一步地,在该方法中,M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值的个数为量化码本中矢量的候选个数。
进一步地,在该方法中,所述量化码本中矢量的候选个数根据超级帧子带清浊音参数的量化比特数确定。
进一步地,在该方法中,淘汰码本矢量的预设值为子带清浊音参数计算量化失真时各个子带的加权系数之和与N-1的乘积。
进一步地,在该方法中,激励信号合成端生成激励信号的方法为:利用子带清浊音参数,结合基音周期参数、余量谱幅度参数进行激励信号合成。
本公开的有益效果:
本公开所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,对低速率声码器中子带清浊音参数的提取和量化过程进行了融合。原有的技术对子带清浊音参数的提取和量化环节是分别进行的,本公开充分利用子带清浊音参数的统计和量化特性,融合其分析和量化过程,采用在提取过程中不断进行失真比较和候选矢量淘汰的方法,减少需要搜索的候选矢量,尽快锁定目标矢量,进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。本方法可以有效减少低速率声码器算法的复杂度,降低其所嵌入系统的功耗。该方法最适合2400bps以下的低速率及超低速率的声码器算法。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是根据一个或多个实施例的传统的子带清浊音参数提取与量化流程图;
图2是根据一个或多个实施例的一种低速率声码器子带清浊音参数提取与量化的融合方法流程图。
具体实施方式:
下面将结合本公开的一个或多个实施例中的附图,对本公开的一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开的一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合,下面结合附图与实施例对本公开作进一步说明。
根据本公开的一个或多个实施例的一个方面,提供一种低速率声码器子带清浊音参数提取与量化的融合方法。
本公开的主要目的是充分利用低速率声码器子带清浊音参数的统计和量化特性,融合其分析和量化过程,采用在分析过程中不断进行失真比较和候选矢量淘汰的方法,尽快锁定目标矢量,进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。
下面详细介绍具体技术方案:
步骤(1):对输入语音信号样点按时间顺序分帧;
在本实施例中,对输入语音信号样点按时间顺序分帧的实施例是按8kHz频率采样、已经过高通滤波去除工频干扰的语音样点。每20ms,也就是160个语音样点构成一帧,但不限于此。
步骤(2):每帧语音划分为5个子带,提取子带清浊音参数,表示为:bv1,bv2,bv3,bv4,bv5;
在本实施例中,按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法提取子带清浊音参数。
步骤(3):N个语音帧组成超级帧,令其中wgti为子带清浊音参数计算量化失真时第i个子带的加权系数。
连续求取M个语音帧的子带清浊音参数,分别计算其与量化码本中候选矢量前M个子带清浊音参数间的失真值Dj,j=1...K,K为量化码本中矢量的个数。令l=M+1。
在本实施例中,若连续6个语音帧组成一个超级帧,加权系数的取值为wgt=[16,8,4,2,1],由此计算得到T=31。
根据训练集,按帧提取子带清浊音参数,连续N帧子带清浊音参数组成超级矢量,离线训练,得到量化码本。
步骤(4):提取第l帧的子带清浊音参数,计算其与量化码本中候选矢量第l个子带清浊音参数间的失真值Pj,更新Dj=Dj+Pj,其中j=1...K。求取K个失真值Dj中的最小值Dmin,比较其他失真值与Dmin间的距离Dj,min,若Dj,min>T·(N-l),则淘汰其对应的码本矢量Dj,在下一轮候选矢量计算中不再考虑该矢量;
在本实施例中,设超帧子带清浊音参数的量化比特数为4,则量化码本尺寸K=16,其中码本根据所有训练矢量集得到,根据训练矢量集得到码本的方法可以参考杨行峻等人著《语音信号数字处理》pp92-95中所述LBG方法。
步骤(5):判断码本中剩余候选矢量的个数v,若v=1或者l=N,则将Dmin所对应的候选矢量的索引进行编码传输,转至步骤(6);否则,令l=l+1,转至步骤(4);
在本实施例中,判断当前剩余的候选矢量个数是否为1,或者是否已经提取到最后一帧,若满足结束条件,将索引值进行编码传输,否则继续下一帧;
步骤(6):解码端根据索引值搜索码本得到超级帧子带清浊音矢量
在本实施例中,根据索引值,直接从所对应的码本中搜索得到其对应的超帧子带清浊音参数矢量;
步骤(7):根据超级帧子带清浊音矢量得到每个语音帧的子带清浊音参数送入激励信号合成端生成激励信号。
在本实施例中,按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法,利用子带清浊音参数,结合基音周期参数、余量谱幅度参数进行激励信号合成。
本公开充分利用子带清浊音参数的统计和量化特性,融合其分析和量化过程,采用在提取过程中不断进行失真比较和候选矢量淘汰的方法,减少需要搜索的候选矢量,尽快锁定目标矢量,进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。
本公开的有益效果:
本公开所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,对低速率声码器中子带清浊音参数的提取和量化过程进行了融合。原有的技术对子带清浊音参数的提取和量化环节是分别进行的,本公开充分利用子带清浊音参数的统计和量化特性,融合其分析和量化过程,采用在提取过程中不断进行失真比较和候选矢量淘汰的方法,减少需要搜索的候选矢量,尽快锁定目标矢量,进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。本方法可以有效减少低速率声码器算法的复杂度,降低其所嵌入系统的功耗。该方法最适合2400bps以下的低速率及超低速率的声码器算法。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。因此,本公开将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,该方法包括:
接收输入语音信号,并将其按时间顺序分帧;
将每个语音帧均划分为数量相同的若干子带,提取子带清浊音参数;
N个语音帧组成超级帧,令M为N加1的和除以2后向下取整的数,连续求取M个语音帧的子带清浊音参数,分别计算其与量化码本中候选矢量前M个子带清浊音参数间的失真值;令l=M+1;
提取第l帧的子带清浊音参数,计算其与量化码本中候选矢量第l个子带清浊音参数间的失真值,用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值,计算最小失真值,淘汰量化码本中与最小失真值距离大于预设值的其他失真值对应的候选矢量;
当量化码本中剩余候选矢量个数为1或是否已经提取到最后一帧时,将最小失真值对应的候选矢量的索引进行编码传输,否则令l=l+1,返回上一步继续淘汰候选矢量;
解码端根据索引值搜索量化码本得到超级帧子带清浊音矢量;
根据超级帧子带清浊音矢量,得到每个语音帧的子带清浊音参数,输入激励信号合成端生成激励信号。
2.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,将输入语音信号按时间顺序分帧,具体步骤包括:
将输入语音信号按8kHz频率进行采样,经过高通滤波去除工频干扰的语音样点,每160个语音样点构成一帧。
3.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,将每个语音帧均划分为5个子带。
4.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,按2400b/s混合激励的线性预测语音编码算法提取子带清浊音参数。
5.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,所述量化码本据训练矢量集得到。
6.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,将提取第M+1帧的子带清浊音参数与量化码本中候选矢量第M+1个子带清浊音参数间的失真值与M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值求和,用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值。
7.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值的个数为量化码本中矢量的候选个数。
8.如权利要求7所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,所述量化码本中矢量的候选个数根据超级帧子带清浊音参数的量化比特数确定。
9.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,淘汰码本矢量的预设值为子带清浊音参数计算量化失真时各个子带的加权系数之和与N-1的乘积。
10.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法,其特征在于,在该方法中,激励信号合成端生成激励信号的方法为:利用子带清浊音参数,结合基音周期参数、余量谱幅度参数进行激励信号合成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811541115.6A CN109346093B (zh) | 2018-12-17 | 2018-12-17 | 一种低速率声码器子带清浊音参数提取与量化的融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811541115.6A CN109346093B (zh) | 2018-12-17 | 2018-12-17 | 一种低速率声码器子带清浊音参数提取与量化的融合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109346093A CN109346093A (zh) | 2019-02-15 |
CN109346093B true CN109346093B (zh) | 2019-09-03 |
Family
ID=65304640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811541115.6A Active CN109346093B (zh) | 2018-12-17 | 2018-12-17 | 一种低速率声码器子带清浊音参数提取与量化的融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109346093B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270934B (zh) * | 2020-09-29 | 2023-03-28 | 天津联声软件开发有限公司 | 一种nvoc低速窄带声码器的语音数据处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103325375A (zh) * | 2013-06-05 | 2013-09-25 | 上海交通大学 | 一种极低码率语音编解码设备及编解码方法 |
CN106098072A (zh) * | 2016-06-02 | 2016-11-09 | 重庆邮电大学 | 一种基于混合激励线性预测的600bps甚低速率语音编解码方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3472279B2 (ja) * | 2001-06-04 | 2003-12-02 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ符号化方法及び装置 |
CN101030377B (zh) * | 2007-04-13 | 2010-12-15 | 清华大学 | 提高声码器基音周期参数量化精度的方法 |
CN102855878B (zh) * | 2012-09-21 | 2014-05-14 | 山东省计算中心 | 一种窄带语音子带清浊音度参数的量化方法 |
CN105118513B (zh) * | 2015-07-22 | 2018-12-28 | 重庆邮电大学 | 一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法 |
CN108461088B (zh) * | 2018-03-21 | 2019-11-19 | 山东省计算中心(国家超级计算济南中心) | 基于支持向量机在语音解码端重构子带清浊音度参数的方法 |
-
2018
- 2018-12-17 CN CN201811541115.6A patent/CN109346093B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103325375A (zh) * | 2013-06-05 | 2013-09-25 | 上海交通大学 | 一种极低码率语音编解码设备及编解码方法 |
CN106098072A (zh) * | 2016-06-02 | 2016-11-09 | 重庆邮电大学 | 一种基于混合激励线性预测的600bps甚低速率语音编解码方法 |
Non-Patent Citations (1)
Title |
---|
一种低复杂度2.4kb/s正弦激励线性预测声码器方案;穆军雷,崔慧娟,唐昆;《湘潭大学自然科学学报》;20101231;第32卷(第4期);全文 |
Also Published As
Publication number | Publication date |
---|---|
CN109346093A (zh) | 2019-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110648658B (zh) | 一种语音识别模型的生成方法、装置及电子设备 | |
Jax et al. | Wideband extension of telephone speech using a hidden Markov model | |
CN101577605B (zh) | 基于滤波器相似度的语音lpc隐藏和提取算法 | |
US20080091418A1 (en) | Pitch lag estimation | |
US20030004718A1 (en) | Signal modification based on continous time warping for low bit-rate celp coding | |
CN106409313A (zh) | 一种音频信号分类方法和装置 | |
CN104966517A (zh) | 一种音频信号增强方法和装置 | |
CN102855878B (zh) | 一种窄带语音子带清浊音度参数的量化方法 | |
CN103050122B (zh) | 一种基于melp的多帧联合量化低速率语音编解码方法 | |
JP2019204097A (ja) | 音声符号化方法および関連装置 | |
CN109346093B (zh) | 一种低速率声码器子带清浊音参数提取与量化的融合方法 | |
CN108806725A (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN109448739B (zh) | 基于分层聚类的声码器线谱频率参数量化方法 | |
CN108010533A (zh) | 音频数据码率的自动识别方法和装置 | |
Han et al. | VHF speech enhancement based on transformer | |
CN101009096B (zh) | 子带清浊音模糊判决的方法 | |
CN108461088B (zh) | 基于支持向量机在语音解码端重构子带清浊音度参数的方法 | |
CN105206259A (zh) | 一种语音转换方法 | |
Tanaka et al. | Low-bit-rate speech coding using a two-dimensional transform of residual signals and waveform interpolation | |
JPH0764600A (ja) | 音声のピッチ符号化装置 | |
CN106935243A (zh) | 一种基于melp的低比特数字语音矢量量化方法和系统 | |
Suman et al. | Speech enhancement and recognition of compressed speech signal in noisy reverberant conditions | |
CN110958417A (zh) | 一种基于语音线索的视频通话类视频去除压缩噪声的方法 | |
CN110580920A (zh) | 一种声码器子带清浊音判决的方法及系统 | |
KR960015861B1 (ko) | 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |