CN1954366A - 用于电信多速率语音编码器中的语音速率转换的方法和装置 - Google Patents
用于电信多速率语音编码器中的语音速率转换的方法和装置 Download PDFInfo
- Publication number
- CN1954366A CN1954366A CNA2005800151710A CN200580015171A CN1954366A CN 1954366 A CN1954366 A CN 1954366A CN A2005800151710 A CNA2005800151710 A CN A2005800151710A CN 200580015171 A CN200580015171 A CN 200580015171A CN 1954366 A CN1954366 A CN 1954366A
- Authority
- CN
- China
- Prior art keywords
- parameter
- rate
- codec
- code book
- excitation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 118
- 238000013507 mapping Methods 0.000 claims abstract description 88
- 230000006835 compression Effects 0.000 claims abstract description 41
- 238000007906 compression Methods 0.000 claims abstract description 41
- 230000005284 excitation Effects 0.000 claims description 111
- 230000007704 transition Effects 0.000 claims description 78
- 239000013598 vector Substances 0.000 claims description 51
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 238000001914 filtration Methods 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 31
- 238000013139 quantization Methods 0.000 claims description 28
- 230000009466 transformation Effects 0.000 claims description 15
- 230000006978 adaptation Effects 0.000 claims description 8
- 238000012856 packing Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 6
- 238000011002 quantification Methods 0.000 claims description 6
- 230000008676 import Effects 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000002360 preparation method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 25
- 239000002131 composite material Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000005086 pumping Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
用于通过多速率语音编码器对数据比特流进行速率转换的方法和装置,其将表示根据第一速率的第一语音压缩方法编码的数据帧的比特流转换成根据第二速率的第二语音压缩方法。速率转换对包括语音压缩参数映射模块。速率转换方法包括在输入点对经编码的分组进行比特拆包或去量化以获得根据第一速率语音压缩方法的速率信息和语音压缩参数。关于第一速率和所需输出速率(即第二速率类型)的信息以及外部控制命令随后被用于确定速率转换对的转换策略。接下来,第一速率的压缩参数中至少一些被直通,或者以与第二速率语音压缩方法兼容的方式被映射到第二速率的压缩参数。
Description
技术领域
本发明一般地涉及处理电信信号。更具体而言,本发明涉及用于从一个数据速率编码方法的第一语音压缩比特流到另一个不同的数据速率的第二语音压缩比特流的语音速率转换(trans-rating)的方法和装置。仅作为示例,本发明已被应用到了多速率或多模式的基于代码激励线性预测(CELP)的语音压缩编解码器中的语音速率转换中,但是将会意识到本发明也可包括其他应用。
背景技术
速率转换是用于衔接两个在不同速率下工作的终端之间的差距的数字信号处理技术。这一般发生在这样的情况下,即两个或更多个终端包括能够在活动话音模式和非活动话音的SID和DTX帧的8个不同速率下工作的多速率语音编解码器,例如GSM-AMR编解码器。当工作在12.2kbps的最高速率下的GSM-AMR终端试图与工作在另一个不同速率(4.95kbps或其他)下的另一个GSM-AMR终端通信时,就需要速率转换。
一种传统的速率转换方法通过将输入比特流解码为话音信号,然后根据另一速率语音压缩方法对话音信号重新编码,来执行速率转换。这一解码和重新编码的过程涉及大量计算,其中包括进行比特拆包(bit-unpacking)以获得压缩参数、重构激励信号、合成脉冲编码调制(PCM)格式的语音信号、对语音信号进行后滤波以及再次分析PCM话音信号以获得语音压缩参数并根据第二速率语音编码方法对诸如LSP、自适应码书参数、自适应码书增益、固定码书索引参数和固定码书增益之类的语音压缩参数进行重新编码。
传统的速率转换过程还有一个缺点是由于重编码过程中的预测而造成延迟至少会增大一个额外的帧算法延迟。
智能速率转换不是解码和重新编码的传统方式,更确切地说智能速率转换工作在完全不同的域。智能速率转换执行仅限于压缩参数域的比特流转换。在许多情况下,从原始比特流到目的比特流,对于不同速率的某种已定义的数学映射被应用到CELP参数索引。这些参数适用于LPC、自适应码书参数、自适应码书增益、固定码书索引参数和固定码书增益参数。
所需要的是一种克服传统速率转换的局限性并有效地应用智能速率转换原理的技术。
发明内容
因此,本发明针对多速率语音编码器比特流速率转换装置和用于将第一速率语音分组数据转换为第二速率语音分组数据的方法,其采用了输入比特流拆包器、一个或多个速率转换对、直通模块、配置模块和输出比特流打包器。每个速率转换对包括用于直接空间域映射、激励域映射中的分析和经滤波的激励域映射中的分析的模块中的至少一个语音压缩参数映射模块。最后,该装置包括用于混合部分直通和部分映射的模块。速率转换的方法包括在输入点对经编码的分组进行比特拆包或去量化以获得根据第一速率语音压缩方法的速率信息和语音压缩参数。关于第一速率和所需输出速率(即第二速率类型)的信息以及外部控制命令随后被用于确定速率转换对的转换策略。接下来,第一速率的压缩参数的一部分或全部被直通,或者以与第二速率语音压缩方法兼容的方式被映射到第二速率的压缩参数。
可以改变变换方法,并且可以基于第一速率压缩方法和第二速率压缩方法这一对的特性来进一步优化变换方法。最后,第二速率语音压缩参数被打包成与多速率语音编码器标准的第二速率相兼容的比特流。
根据本发明的装置例如包括:
·语音压缩代码参数拆包模块,其将根据第一速率语音编解码器压缩方法的输入第一速率语音分组提取为第一速率信息及其语音经压缩参数。在基于CELP的编解码器的情况下,这些参数可以是线频谱频率参数、自适应码书参数、自适应码书增益参数、固定码书增益参数和固定码书索引参数,以及其他参数;
·速率转换控制器模块,其取得输入比特流数据速率或模式、输入比特流帧差错标志、所需的输出比特流数据速率或模式以及外部控制命令,并且输出关于输出数据速率或模式的判决,以生成关于速率转换策略的判决;
·至少一个速率转换对模块,其将从源比特流拆包器生成的第一速率的输入话音参数转换为第二速率编解码器的经量化的话音参数;
·至少一个直通模块,其将输入的经编码的参数直接传递到输出的经编码的参数,如果输出第二速率编解码器与输入第一速率编解码器相同的话;以及
·语音压缩编解码器比特流打包器,用于将第二速率的经转换和经量化的话音参数归组成输出比特流分组。
本发明具有以下目的:
·在经压缩的语音参数域中在多速率语音编码器的不同语音编解码器速率比特流之间执行智能语音速率转换;
·通过在参数空间中映射参数来提高语音质量;
·通过速率转换过程降低延迟;
·降低速率转换过程的计算复杂度;
·降低速率转换过程所需的计算机存储量;
·在相同速率比特流转换或不同速率比特流转换(但具有可从输入比特流推断的输出速率的输出比特流)中支持直通特征;
·提供可适应于当前和未来的多速率语音编解码器的通用速率转换体系结构。
根据本发明的一个方面,速率转换模块装置还包括适合于基于多个策略选择CELP参数映射策略的判决模块,以及至少一个转换模块,所述至少一个转换模块包括:
·用于语音压缩参数直接空间映射的模块,其在没有任何迭代的情况下利用简单解析公式产生目的数据速率压缩参数;
·用于激励空间域映射中的分析的模块,其在激励空间域中执行搜索来产生目的数据速率压缩参数;
·用于经滤波的激励空间域映射中的分析的模块,其通过在激励空间中搜索闭环的自适应码书并在经滤波的激励空间中搜索固定码书来产生目的数据速率压缩参数;
·用于直通混合映射的模块,其混合部分经量化的参数直通,其中输入数据速率比特流的参数的一部分具有与输出数据速率比特流的参数相同的经量化的值。
特定速率转换对中选择的映射模块可以是预先选择的或者是通过判决动态选择的。
在本发明的另一个方面中,一种用于进行多速率语音编码器的第一速率比特流到第二速率比特流的速率转换的方法,包括以下步骤:
·处理输入第一速率语音编解码器比特流的头部,以识别输入编解码器比特流的第一速率或模式或错误分组;
·将第一速率编解码器的输入比特流拆包为至少一组语音压缩参数;
·配置速率转换对,以将第一速率输入比特流转换为所需的第二速率编解码器输出比特流;
·将一个或多个语音经编码参数的第一速率转换为第二组速率经编码压缩参数;
·如果输入第一速率编解码器的语音压缩参数的量化与输出第二速率编解码器相同,则将输入的一组或多组经编码的参数直接传递到输出;
·将一组或多组输出的第二速率的经编码的参数打包为输出第二速率编解码器比特流。
应当理解,以上概括描述和以下详细描述都是示例性和说明性的,并且想要提供对所要求保护的发明的进一步说明。
通过结合附图参考以下描述,可以最充分地理解本发明的组织和操作方式以及更多目的和优点。
附图说明
图1是用于示出多速率语音编码器的速率转换的现有技术过程的框图。
图2是示出用于通过解码和重新编码过程将比特流从一个编解码器速率比特流转换到另一速率比特流的一般速率转换连接的现有技术系统的框图。
图3是示出用于在没有完全的解码和重新编码的情况下将比特流从一个编解码器速率比特流转换到另一速率比特流的一般速率转换连接的框图。
图4是示出对于每个20ms帧的现有技术自适应多速率(AMR,也称为GSM-AMR)语音编码器多速率比特分配的表。
图5是示出本发明的代表性实施例的语音速率转换的框图。
图6是示出包括分组类型检测和参数去量化的输入比特流拆包的框图。
图7是进一步示出基于代码激励线性预测(CELP)的语音编解码器中的参数去量化的框图。
图8是示出速率转换模块的框图。
图9是示出通过直接CELP参数空间映射进行的速率转换过程的框图。
图10是示出通过CELP激励参数空间映射进行的速率转换过程的框图。
图11是示出激励向量校准的框图。
图12是示出通过CELP激励参数空间和经滤波的激励参数空间映射进行的速率转换过程的框图。
图13是示出参数直通和映射的混合模块的框图。
图14是示出从AMR中的速率5.15kbps到速率4.75kbps的利用参数直通和映射的混合的速率转换的示例的框图。
图15是示出从AMR中的速率4.75kbps到速率5.15kbps的利用参数直通和映射的混合的速率转换的示例的框图。
图16是示出从AMR中的速率12.2kbps到速率4.75kbps的利用经滤波的激励方法中的分析的速率转换的示例的框图。
图17是示出从AMR中的速率4.75kbps到速率12.2kbps的利用经滤波的激励方法中的分析的速率转换的示例的框图。
具体实施方式
在下面的描述中,出于说明目的,阐述了许多具体细节以便彻底理解本发明。多速率语音编码器GSM-AMR不同速率的速率转换的情形被用作示例以便进行说明。这里描述的方法一般地适用于任何一对多速率语音编解码器之间的速率转换。本领域的技术人员将会意识到,在不脱离本发明的精神和范围的情况下,可以使用其他步骤、配置和布置。
本发明包括用于在多速率语音编码器中的不同代码速率的两个编解码器之间执行智能速率转换的方法。本发明还包括速率转换直通的特殊情形,其中所需的输出比特流与输入比特流具有相同速率编解码器。下面的部分描述本发明的细节。
图5是示出根据本发明的第一实施例的多速率语音编码器速率转换装置10的框图。该设备包括输入比特流拆包模块12、智能插值引擎14和输出比特流打包模块30,该智能插值引擎14包括至少一个速率转换对模块16、18、20,至少一个直通模块22,以及控制路线选择切换装置26和28的速率转换控制命令模块24。装置10接收第一速率语音编解码器比特流,作为到输入比特流拆包模块12的输入,并将速率信息的结果传递到配置控制命令模块24。配置控制命令模块24取得输入速率信息、所需的输出速率信息和外部网络命令,以判决特定的速率转换对模块16或直通模块22,并控制从输入比特流拆包模块12到输出比特流打包模块30的数据流切换。速率转换对模块16将输入速率编解码器经压缩参数转换为输出速率编解码器经量化语音经压缩参数。直通模块22将输入速率编解码器经量化参数直接传递到输出速率编解码器经量化参数,或者甚至直接传递到输入比特流分组。输出比特流打包模块30将经转换且经量化的输出速率编解码器参数归组为输出比特流分组。
图6示出输入比特流拆包模块12的结构,其包括输入比特流检测模块32和CELP经压缩参数去量化模块34。比特流识别器模块32执行速率信息插值和差错检测。它输出比特流的数据速率信息,并将比特流的有效载荷传递到语音经压缩参数去量化模块(未示出)。如果在比特流中检测到差错,模块32则发出帧差错标志。
图7进一步示出输入比特流拆包模块12中的基于CELP的语音经压缩参数去量化模块34的框图。去量化模块34包括代码分离器单元36和不同的压缩参数去量化器单元,即LSP去量化器38、基音滞后代码去量化器40、自适应码书增益代码去量化器42、固定码书增益代码去量化器44、固定码书代码去量化器46、速率代码去量化器48、帧能量代码去量化器50和代码索引直通52。去量化器分别被应用来将每个帧的比特流有效载荷代码分离成LSP代码、基音滞后代码、自适应码书增益代码、固定码书增益代码、固定码书向量代码、速率代码和帧能量代码,每个选择都是基于源编解码器的编码方法的。实际可用的参数代码取决于编解码器本身、比特速率以及(如果适用的话)帧类型。这些代码被输入到适当的代码去量化器,这些去量化器分别输出LSP、基音滞后、自适应码书增益、固定码书增益、固定码书向量、速率和帧能量。通常,由于许多CELP代码器中使用的多子帧激励处理,在每个代码去量化的输出处有多于一个值可用。帧的CELP参数随后被输入到下一级。
速率转换控制模块接收输入比特流的分组类型和数据速率,以及第二编解码器速率的输出的外部控制命令,如图5所示。它基于输入比特流和输出速率要求控制切换模块选择速率转换对模块之一。如果所要求的输出速率与输入比特流速率相同,则可以选择直通模块。例如,如果输入比特流是静默描述帧类型,并且对于所要求的输出速率编解码器,静默描述的类型和格式相同,则在速率转换过程期间速率转换控制模块将会选择直通模块来执行静默描述帧。
图8示出执行特定速率转换的速率转换对模块16的结构。可以使用若干种映射方法,包括:利用输入速率编解码器经量化参数的混合直通部分来输出速率代码参数并且映射参数的其他部分的元件56;用于在没有任何进一步的分析或迭代的情况下将输入速率编解码器经去量化参数直接映射到相应的输出速率编解码器参数的元件58;用于激励域中的分析的元件60;以及用于经滤波的激励域中的分析或这些策略的组合的元件62,所述组合例如是搜索激励空间中的自适应码书(未示出)和经滤波的激励空间中的固定代码码书(未示出)。这四种类型的映射由模块16内被视为切换控制单元24的速率转换判决策略所控制。
速率转换控制命令模块24(图5)(也称为策略判决模块24(图8))确定要应用哪个映射策略。判决可以是基于特定输入速率和输出速率编解码器速率转换对之间的相似之处和不同之处的特性而预先定义的。如果输入速率编解码器的压缩参数的一部分具有与选中的输出速率编解码器类似的量化方法和量化表,则直通和映射的混合模式可能就是速率转换的合适选择。
判决可以基于可用计算资源或最低质量要求以动态方式改变。输入速率编解码器经压缩参数可以多种方式被映射,以给出质量越来越好的输出,其代价是计算复杂度。在最高质量下,代码转换算法的计算复杂度仍然低于强制串联方法的计算复杂度。由于这四种方法牺牲质量来换取计算负载的降低,因此在装置因大量同时存在的信道而过载的情况下它们可被用于提供适度的质量降低。从而,速率转换的性能可适应可用的资源。
图9、10、11和12详细示出四种不同的基于语音压缩参数的映射策略。从图9中最简单的情形开始,它们是以渐变的计算复杂度和输出质量的顺序给出的。此外,图13示出了部分直通和部分映射的方法。该方法被应用于共享相同的量化算法和量化表的输入速率编解码器和输出速率编解码器中的选中的压缩参数。本发明的一个关键特征是多速率语音编码器中的语音压缩参数可被直接映射,而无需重构话音信号。这意味着在闭环码书搜索期间大量计算得以节省,因为信号不需要像传统串联技术所要求的那样被短期冲击响应所滤波。这一映射能起作用,因为输入速率比特流机制先前已经确定了生成话音的最优经压缩参数。本发明利用这一事实来允许激励域而不是整个话音域中的迅速直通,或直接映射,或搜索。
具体参考图9,其中是直接空间映射102的框图。它接收输入速率编解码器比特流104的各种经量化的经压缩参数,并直接执行经压缩参数映射。在典型的CELP编解码器中,它映射LSP参数、自适应码书参数、自适应码书增益参数、固定码书参数和固定码书增益参数。在每种类型的参数映射之后,它根据输出速率编解码器重新量化这些参数,并发送到输出速率代码比特流打包的下一级。
除了直通或部分直通方法外,直接空间映射是最简单的速率转换方案。该映射是基于输入速率编解码器和输出速率编解码器参数之间的物理装置的相似性的,并且速率转换是在不进行任何迭代或广泛搜索的情况下利用解析公式直接执行的。此方案的优点是它不需要大量存储器并且消耗的MIPS几乎为零,但它仍生成清晰的(虽然质量有所降低)的声音。此方法是通用的,并且就不同的子帧大小或不同的经压缩参数表示形式而言适用于所有种类的多速率语音编解码器速率转换。
图10示出激励映射104中的分析的框图。它接收来自输入速率编解码器比特流的经去量化的LSP参数,并执行到输出速率编解码器格式的映射。除了在不进行任何搜索和迭代的情况下将自适应码书和固定码书参数从输入比特流拆包直接映射到输出速率编解码器格式的直接空间映射方法之外,激励信号被重构。激励的重构需要自适应码书、自适应码书增益、固定码书和固定码书增益的参数。
此方法比起直接空间映射方法102更为先进,因为搜索了自适应和固定码书,并且以输出速率编解码器所定义的通常方式估计了增益,只不过它们是在激励域而不是话音域完成的。首先通过用来自输入编解码器比特流的经去量化的自适应码书参数作为初始估计进行局部搜索,来确定自适应码书。该搜索是在初始估计的小间隔内以目的编解码器所要求的精度(整数或分数基音)进行的。随后为最佳码字向量确定自适应码书增益。一旦找到,就从激励和通过到残余的最优匹配所确定的固定码书中减去自适应码书向量贡献。比起传统串联方法来,优点在于开环自适应码书估计不需要从CELP标准所使用的自校正方法计算,而是可从输入比特流的经去量化的参数确定。此外,搜索是在激励域而不是话音域执行的,从而不需要自适应码书和固定码书搜索期间的冲击响应滤波。这节省了大量的计算,而不会对输出语音质量造成任何损害。
考虑输入速率编解码器和输出速率编解码器之间的LSP参数的差异,重构的激励可被校准,以补偿LSP参数的影响。图11示出了激励校准方法106。输入的经去量化的参数的重构的激励向量形式被输入速率编解码器的LPC系数合成以转换到话音域,然后被用输出速率编解码器的重新经量化的LPC参数滤波以形成映射中的目标信号。此校准是可选的,并且在输入和输出速率编解码器之间的LPC参数中存在显著差异的情况下可大大提高感知话音质量。
图12示出经滤波的激励空间直接空间映射分析方法108的框图。在此情况下,LPC参数仍被从输入速率编解码器直接映射到输出速率代码,并且经去量化的自适应码书参数被用作输出速率编解码器的初始估计。自适应码书搜索仍在激励域或经校准的激励域中执行。但是,固定码书搜索是在经滤波的激励空间域中执行的。可以应用各种滤波器,包括用于平滑任何不规则之处的低通滤波器,补偿输入和输出编解码器中的激励向量的特性之间的差异的滤波器,以及增益在感知上重要的信号特征的滤波器。一个优点在于滤波器的参数(阶数、频率加强/去加强、相位)是完全可调的。这与使用加权LP合成滤波器的标准编码中的目标信号计算相反。从而,此策略允许了进行调节以提高特定的输入和输出编解码器对之间的速率转换的质量,并且允许了提供质量和复杂度之间的折衷。
在某些特定的速率转换对中,输入和输出编解码器在某些压缩参数中具有相同的压缩算法和相同的量化表。上述映射方法可被简化为部分直通和部分映射过程。图13示出了组合的直通和映射组合方法110的框图。如果输出速率编解码器的某些经量化的参数具有与输入速率编解码器的某些经量化的参数相同的量化过程和量化表,则参数可通过直通单元112从输入比特流直接被映射,而无需任何搜索或量化过程。输出速率编解码器的其余经量化的参数可利用直接空间映射、激励空间映射中的分析和经滤波的激励空间映射中的分析的映射方法之一来映射。
注意,也可使用上述方法的任何组合。实现高质量和低复杂度两者的最佳方法将取决于输入速率和输出速率编解码器之间的平衡。
输出速率比特流打包模块通过配置控制命令模块24连接速率转换对模块或直通模块(图5)。打包模块根据输出速率编解码器将输出速率的经转换且经量化的参数归组为输出比特流分组。
第一实施例-AMR5.15KBPS->4.75KBPS速率转换
现在描述根据本发明的合适的系统的示例。多速率语音编码器(自适应多速率或AMR,也称为GSM-AMR)被作为示例以示出本发明的原理。AMR编解码器使用具有12.2、10.2、7.95、7.40、6.70、5.90、5.15和4.75kbps比特率的八个源编解码器。图4示出AMR编码算法中的8个比特率的比特分配。
编解码器基于代码激励线性预测(CELP)编码模型。使用了10阶线性预测(LP)或短期合成滤波器。利用所谓的自适应码书方法实现了长期或基音合成滤波器。
在CELP话音合成模型中,通过将来自自适应和固定(创新)码书的两个激励向量相加来构造短期线性预测(LP)合成滤波器的输入处的激励信号。通过将来自这些码书的两个适当选取的向量馈送经过短期合成滤波器来合成话音。利用综合分析搜索过程选取码书中的最优激励序列,在该过程中,根据经感知加权的失真度量来最小化原始话音和合成话音之间的误差。综合分析搜索技术中使用的感知加权滤波器使用经去量化的LP参数。
编码器以8,000样本每秒的采样频率在与160个样本相对应的20ms的话音帧上工作。在每160个话音样本处,话音信号被分析,以提取CELP模型的参数(LP滤波器系数、自适应和固定码书的索引和增益)。这些参数被编码和发送。在解码器处,对这些参数进行解码,并且通过经由LP合成滤波器对重构的激励信号进行滤波来合成话音。
GSM-AMR话音帧被划分为各为5ms(40个样本)的子帧。自适应和固定码书参数在每个子帧都被发送。根据子帧使用经量化和经去量化的LP参数或它们的经插值的版本。基于经感知加权的话音信号,每隔一个子帧(除了5.15和4.75kb/s模式外,其中每帧进行一次)估计开环基音滞后。
图14是基于从AMR5.15kbps比特流到AMR4.75kbps比特流的速率转换的部分直通和部分直接空间映射混合方法的框图。两个速率(5.15和4.75)共享相同的线性预测系数(LPC)量化表和相同的量化过程,因而两个速率的索引是相同的(一对一映射)。类似地,两个速率共享相同的自适应(或基音)和固定(或代数)码书索引。
在5.15和4.75之间的速率转换中,线性预测系数(LPC)、自适应码书参数和固定码书参数这三个参数可在没有任何计算复杂度的情况下被从原始比特流直接映射到目的比特流。
在自适应码书增益和固定码书增益的情况下,压缩方法和表是不同的,因此这些参数的表示形式对于5.15和4.75kbps是不同的。如图4所示,输入AMR5.15kbps编解码器在每个子帧间有6比特联合增益量化索引,而输出AMR4.75kbps编解码器在每两个子帧间有8比特联合增益量化索引。输出速率AMR4.75kbps需要映射以将自适应码书增益和固定码书增益的5.15kbps表示形式转换到输出比特流格式。
直接空间映射方法可被用来映射自适应码书增益和固定码书增益两者。输入速率联合自适应码书和固定码书最初被去量化。该方法对每个子帧获得经去量化的自适应码书增益和固定码书增益。然后这些增益分别被映射到每两个子帧。最后,根据4.75kbps编解码器的输出,每两个子帧重新量化自适应码书增益和固定码书增益。4.75kbps的联合增益索引的映射结果被与LSP、自适应码书参数和固定码书参数的直通结果归组在一起,以形成4.75kbps比特流的输出。
可以选择激励空间映射中的分析或经滤波的激励空间映射中的分析以搜索自适应码书和固定码书增益的经量化的联合增益。由于4.75kbps和5.15kbps两者具有相同的LPC索引表示形式,因此不必校准作为目标信号的来自输入编解码器的重构的激励向量。
第二实施例-AMR4.75KBPS->5.15KBPS速率转换
图15示出根据本发明第二实施例的从AMR4.75kbps比特流到AMR5.15kbps比特流速率转换的示例。该速率转换过程与第一实施例中描述的相反方向速率转换非常类似。输出编解码器5.15kbps在LPC系数、自适应码书参数和固定码书参数间具有相同的量化过程和表。可通过速率转换对中的直通单元直接获得这些输出的经去量化的参数。
可通过直接空间映射、激励空间映射中的分析或经滤波的激励空间映射的分析这些映射方法中的一种从5.15kbps的去量化自适应码书增益和固定码书增益获得4.75kbps的联合增益索引。图15示出了基于直接空间映射的方法。
第三实施例-AMR12.2KBPS->4.75KBPS速率转换
注意到以下这点是很重要的:对于AMR12.2kbps,每帧执行两次LP分析,而对于直到4.75kbps的其他模式只执行一次。对于12.2kbps模式,两组LP参数被转换成线频谱对(LSP),并被利用分离矩阵量化(SMQ)38比特联合量化。对于其他模式,单组LP参数被转换成线频谱对(LSP),并被利用分离向量量化(SVQ)(对于4.75kbps为23比特)向量量化。
图16示出根据本发明第三实施例的从12.2kbps到4.75kbps的速率转换的框图。速率转换对模块选择经滤波的激励空间映射中的分析的方法来执行速率转换。
首先,从传入的12.2kbps比特流中提取LSF参数的索引,然后通过查找表和先前的LSP残余向量获得经去量化的LSP参数。对经去量化的LSP参数进行插值并将其映射到每个子帧。根据AMR标准中指定的4.75kbps编解码器重新量化这些LSP参数,并将其转换为4.75kbps的LSP表示形式。
在重构的激励向量变为速率转换过程中的目标信号之前,可应用如图11所示的激励向量校准过程。该过程包括利用输入12.2kbps的LPC去量化参数的合成步骤和利用输出4.75kbps的LPC量化参数的滤波步骤。它校准由于12.2kbps和4.75kbps编解码器之间的LSP参数差异引起的假象。
经校准的激励向量随后被用作针对输出速率4.75kbps的激励空间映射中的分析的目标信号。12.2kbps的经去量化的自适应码书参数作为4.75kbps的闭环自适应码书搜索中的初始估计。该搜索获得经量化的自适应码书参数和自适应码书增益。由于4.75kbps编解码器使用联合增益索引来表示自适应码书和固定码书增益,因此4.75kbps的自适应码书增益的量化是在固定码书搜索之后执行的。
从经校准的激励中去除自适应码书向量贡献。利用滤波器对该结果滤波以产生固定码书搜索的目标信号。然后通过快速技术搜索由形成码字向量的两个脉冲构成的4.75kbps的固定码书向量。从而,获得4.75kbps的固定码书索引。
与12.2kbps编解码器不同,4.75kbps对自适应码书增益(
)和固定码书增益(
)两者都组合联合搜索。利用计算出的自适应码书向量v[n]以及固定码书向量c[n],执行基音增益和固定码书增益上的双重搜索,以使关系‖x-gpv-gcc‖达到最小,其中x是目标激励。在4.75kbps的第一和第三子帧中对自适应和固定码书的公共表索引进行编码。
如前所述,另两种方法,即直接空间映射或激励空间映射中的分析可被应用到从12.2kbps到4.75kbps的速率转换。这些不同的方法牺牲质量来换取计算负载的降低,在装置由于大量同时存在的信道而过载的情况下它们可被用来提供适度的质量降低。
第四实施例-AMR4.75KBPS->12.2KBPS速率转换
图17示出根据本发明第四实施例用于从4.75kbps到12.2kbps的速率转换的系统120的框图。速率转换选择经滤波的激励空间映射方法中的分析来将4.75kbps转换到12.2kbps。
首先,从传入的4.75kb/s比特流中提取LSF参数的索引,然后通过查找表和先前的LSP残余向量获得经去量化的LSP参数。对经去量化的LSP参数进行插值并将其映射到每个子帧。对每两个子帧根据AMR标准中指定的12.2kbps编解码器重新量化这些LSP参数,并将其转换为12.2kbps的LSP表示形式。
在重构的激励向量变为速率转换过程中的目标信号之前,可应用如图11所示的激励向量校准过程。该过程包括利用输入4.75kbps的LPC去量化参数的合成步骤和利用输出12.2kbps的LPC量化参数的滤波步骤。它校准由于4.75kbps和12.2kbps编解码器之间的LSP差异引起的假象。
经校准的激励向量随后被用作针对12.2kbps的输出速率的激励空间映射中的分析的目标信号。4.75kbps的经去量化的自适应码书参数作为12.2kbps的闭环自适应码书搜索中的初始估计。以12.2kbps编解码器所要求的1/6的精度在初始估计的小间隔内搜索自适应码书。然后针对最佳代码向量确定自适应码书增益,并从经校准的激励中去除自适应码书向量贡献。利用滤波器对该结果滤波以产生固定码书搜索的目标信号。
然后通过快速技术在经滤波的激励空间中搜索固定码书,以获得用于根据12.2kbps编解码器形成10脉冲码字向量的索引。并且经滤波的激励空间也被用于计算12.2kbps编解码器的固定码书增益。
从4.75kbps到12.2kbps的速率转换也可采用其他提到的映射方法。这允许了速率转换适应于实时应用中的可用计算资源。
其他CELP代码转换器
本文献中描述的自适应码书计算的发明通用于所有多速率语音编码器,并且适用于诸如G.723.1、G.728、AMR、EVRC、QCELP、MPEG-4CELP、SMV、AMR-WB、VMR之类的已知的多速率语音编解码器以及未来所有其他利用多速率编码的基于CELP的语音编解码器中的任何语音速率转换。
已经参考具体实施例说明了本发明,以使本领域的技术人员能够作出或使用本发明。各种修改对于本领域的技术人员来说都是显而易见的,并且这里定义的通用原理可被应用到其他实施例,而无需创造能力。从而,本发明并不想要被局限于这里示出的实施例,而是想要符合与权利要求所指示的这里公开的原理和新颖特征相一致的最宽范围。
Claims (42)
1.一种用于执行从表示根据一种语音压缩标准的基于第一速率的模式编码的数据帧的第一源比特流到表示根据第二语音压缩标准的基于第二速率的模式编码的数据帧的第二目的比特流的语音速率转换的装置,包括:
源比特流拆包器,用于将来自处于输入数据速率的所述第一比特流的语音代码分离成单独的表示话音参数的代码;
速率转换控制器模块,其可对所述第一比特流进行操作以输出所需的比特流数据速率模式,并且可对外部控制命令进行操作,以输出关于输出数据速率的判决;
多对速率转换模块,用于对输入比特流数据进行速率转换,所述速率转换模块可进行操作以接收从所述源比特流拆包器生成的输入数据速率的关于话音参数的输入,并且能够进行操作以输出输出数据速率的经量化的话音参数;
直通模块,其可进行操作以将输入的经编码的索引直接传递到输出;以及
目的比特流打包器,用于将处于所述输出数据速率的输出的经量化的话音参数归组成目的比特流分组。
2.如权利要求1所述装置,其中所述源比特流拆包器包括:
比特流数据速率识别器,其接收来自根据语音压缩标准以数据速率编码的数据的比特流帧的输入,并输出所述分组的数据速率;以及
源比特流有效载荷数据去量化器,其对话音压缩参数的代码进行解量化。
3.如权利要求1所述的装置,其中所述源比特流拆包器是多个并行模块。
4.如权利要求1所述的装置,其中所述速率转换控制器模块包括:
参数缓冲器,其可进行操作以存储在前帧的输入速率和输出速率、所述在前帧的差错标记以及多个在前帧的外部命令;以及
判决模块,其可进行操作以接受外部控制命令以输入数据速率在前帧输出数据速率,以便输出最终的速率转换判决。
5.如权利要求1所述的装置,其中所述速率转换控制器模块是多个模块。
6.如权利要求1所述的装置,其中所述速率转换模块之一包括:
判决模块,该判决模块适合于基于多个策略选择代码激励线性预测参数映射策略;
用于语音压缩参数直接空间映射的模块,其可进行操作以在没有迭代的情况下利用解析公式产生所述目的数据速率压缩参数;
用于激励空间域映射中的分析的模块,其可进行操作以通过搜索激励空间域来产生所述目的数据速率压缩参数;
用于经滤波的激励空间域映射中的分析的模块,其可进行操作以通过经由激励空间中的自适应闭环且经由经滤波的激励空间中的固定码书的搜索来产生所述目的数据速率压缩参数;
用于直通混合映射的模块,其混合部分经量化的参数直通,其中输入数据速率比特流的参数的一部分具有与所述输出数据速率比特流的参数相同的经量化的值。
7.如权利要求1所述的装置,其中所述多速率对速率转换模块是多个模块。
8.如权利要求1所述的装置,其中所述直通模块是单多个模块。
9.如权利要求1所述的装置,其中所述目的编解码器打包器包括多个帧打包元件,每个帧打包元件可进行操作以适应于来自多速率语音压缩编码器的预先选择的数据速率。
10.如权利要求1所述的装置,其中所述语音压缩标准是多速率/多模式编解码器,其在其比特流中包含关于数据速率、基音增益、固定码书增益和频谱形状参数的信息,所述频谱形状参数包括线频谱频率。
11.如权利要求2所述的装置,其中所述源比特流有效载荷数据去量化器包括:
代码分离器,该代码分离器可进行操作以接收来自根据语音压缩标准以数据速率编码的数据的比特流帧的输入,并分离表示话音压缩参数的索引;
至少一个解量化器模块,其可进行操作以对每个压缩参数的代码进行解量化;以及
代码索引直通模块,其可进行操作以将输入的经量化的参数索引传递到之后的级。
12.如权利要求6所述的装置,其中所述语音压缩参数直接空间映射模块包括:
LSP系数转换器,其可进行操作以对目的速率LSP系数进行编码;
自适应码书参数转换器,其可进行操作以对目的速率自适应码书参数进行编码;
自适应码书增益参数转换器,其可进行操作以对目的速率自适应码书增益参数进行编码;
固定码书参数转换器,其可进行操作以对目的速率固定码书参数进行编码;
固定码书增益参数转换器,其可进行操作以对目的速率固定码书增益参数进行编码。
13.如权利要求6所述的装置,其中所述激励空间域映射中分析模块包括:
LSP系数转换器,其可进行操作以对目的速率LSP系数进行编码;
激励向量模块,其可进行操作以从输入的经压缩的话音参数构造激励参数;
自适应码书参数转换器,其可进行操作以通过在激励空间中执行第一搜索来对目的速率自适应码书参数进行编码;
自适应码书增益参数转换器,其可进行操作以通过在激励空间中执行第二搜索来对目的速率自适应码书增益参数进行编码;
固定码书参数转换器,其可进行操作以通过在激励空间中执行第三搜索来对目的速率固定码书参数进行编码;
固定码书增益参数转换器,其可进行操作以通过在激励空间中执行第四搜索来对目的速率固定码书增益参数进行编码。
14.如权利要求6所述的装置,其中所述用于经滤波的激励空间域映射模块中的分析的模块包括:
LSP系数转换器,其可进行操作以对目的速率LSP系数进行编码;
经滤波的激励向量模块,其可进行操作以从输入的经压缩的话音参数构造激励参数;
自适应码书参数转换器,其可进行操作以通过在激励空间中执行搜索来对目的速率自适应码书参数进行编码;
自适应码书增益参数转换器,其可进行操作以通过在激励空间和经滤波的激励空间中的至少一个中执行搜索来对目的速率自适应码书增益参数进行编码;
固定码书参数转换器,其可进行操作以通过在经滤波的激励空间中执行搜索来对目的速率固定码书参数进行编码;
固定码书增益参数转换器,其可进行操作以通过在经滤波的激励空间中执行搜索来对目的速率固定码书参数进行编码。
15.如权利要求6所述的装置,其中所述直通混合映射模块包括:
参数直通模块,其可进行操作以将部分输入的经编码的经压缩的话音参数传递到目的速率的经编码的经压缩的话音参数;以及
参数转换器模块,其可进行操作以从输入的经压缩的话音参数编码出目的速率压缩话音参数。哈
16.如权利要求13所述的装置,其中所述激励向量模块还包括:
输入速率编解码器激励缓冲器,其可进行操作以基于至少用于一个代码激励线性预测参数的输入速率编解码器存储重构的激励向量;
激励向量校准单元,其可进行操作以通过利用输入速率编解码器经量化LPC系数和输出速率代码经编码LPC系数来校准输入激励向量;以及
经校准激励缓冲器,其可进行操作以存储用于所述输出速率编解码器编码过程中的目标的经校准的激励向量。
17.如权利要求15所述的装置,其中所述参数直通模块是多个模块。
18.如权利要求15所述的装置,其中所述参数转换器模块是多个模块。
19.如权利要求15所述的装置,其中所述参数转换器模块是所述语音压缩参数直接空间映射模块、所述激励空间域映射中分析模块和所述激励空间域映射中分析模块中的至少一个的一部分。
20.一种用于将语音压缩分组从表示在源编解码器中根据第一语音压缩标准的基于第一速率的模式编码的数据帧的第一源比特流转换到表示在输出速率编解码器中根据第二语音压缩标准的基于第二速率的模式编码的数据帧的第二目的比特流的方法,包括:
处理源编解码器输入比特流的头部,以识别数据流的特性,包括数据速率、模式以及输入比特流的分组类型中的至少一种;
处理源编解码器输入比特流以从所述输入比特流中拆包至少一个参数;
配置速率转换对,以转换处于识别出的输入速率的所述输入比特流,以输出处于所需的输出速率的所述目的比特流;
转换所述识别出的输入速率的至少一个经编码的参数的输入,以生成所述所需的输出速率的至少一个相应参数作为输出;
如果所述经编码的参数的量化与所述输出速率编解码器处采用的相同,则将至少一个编码参数直通到所述输出速率编解码器;以及
通过打包用于所述输出速率编解码器的至少一个参数来处理所述输出比特流。
21.如权利要求20所述的方法,其中所述源编解码器输入处理步骤包括:
将输入比特流帧转换成与至少一个代码激励线性预测参数相关联的信息;
将所述关联信息解码成至少一个输入比特流,所述输入比特流是代码激励线性预测比特流;以及
输出代码激励线性预测参数到插值器。
22.如权利要求21所述的方法,其中所述速率转换对配置步骤包括:
从所述输入代码激励线性预测比特流的头部提取关于输入速率和模式中的至少一个的源信息;
从所述输出比特流取出外部控制命令和所需速率中的至少一个,所述输出比特流是代码激励线性预测比特流;
检查先前的速率转换状态;以及
输出速率转换对选择判决。
23.如权利要求20所述的方法,其中所述转换步骤是从多种转换方法之一中选择出来的,所述多种转换方法包括:
直接代码激励线性预测参数空间映射;
激励空间域映射中的分析;
经滤波的激励空间映射中的分析;以及
部分直通和部分参数映射。
24.如权利要求20所述的方法,其中所述速率转换对配置步骤是用于在预备过程期间选择的预定应用的。
25.如权利要求20所述的方法,其中所述转换方法还包括插值步骤,如果在所述所需输出速率编解码器格式的子帧大小和所述输入速率编解码器格式的子帧大小之间存在差异的话。
26.如权利要求20所述的方法,其中所述直通步骤包括将来自比特流拆包器的输入速率编解码器的经编码的参数转达为输出速率编解码器的经编码的参数。
27.如权利要求21所述的方法,其中所述代码激励线性预测目的速率比特流处理步骤包括多个帧打包子处理步骤,每个子处理步骤能够适应于来自用于选中的目的速率编解码器的多个应用的预先选择的应用,所述选中的目的速率编解码器是多个多速率编解码器之一。
28.如权利要求23所述的方法,其中所述直接代码激励线性预测参数空间映射步骤包括以下步骤:
将来自所述输入速率编解码器的至少一个LSP系数转换为用于所述输出速率编解码器的至少一个LSP系数;
从所述输入速率编解码器自适应码书参数编码出自适应码书参数;
从所述输入速率编解码器自适应码书增益参数编码出所述自适应码书增益参数;
从所述输入速率编解码器固定码书参数编码出固定码书参数;以及
从所述输入速率编解码器固定码书增益参数编码出所述固定码书增益参数。
29.如权利要求23所述的方法,其中所述激励空间域映射分析步骤包括以下步骤:
将来自所述输入速率编解码器的至少一个LSP系数转换为用于所述输出速率编解码器的至少一个LSP系数;
如果校准选项被选中,则校准作为映射目标向量的输入速率编解码器激励向量;
从输入速率编解码器自适应码书参数选择自适应码书参数作为初始值;
在激励空间中的闭环中搜索所述自适应码书参数;
在激励空间中搜索自适应码书增益;
构造固定码书搜索的目标信号;
在经滤波的激励空间中搜索固定码书参数;
在经滤波的激励空间中搜索固定码书增益;并且随即
利用经更新的参数更新所述激励向量,作为输入速率编解码器重构激励向量。
30.如权利要求23所述的方法,其中所述经滤波的激励空间域映射分析步骤包括以下步骤:
将来自所述输入速率编解码器的至少一个LSP系数转换为用于所述输出速率编解码器的至少一个LSP系数;
如果校准选项被选中,则校准作为映射目标向量的所述输入速率编解码器激励向量;
从输入速率编解码器自适应码书参数选择自适应码书参数作为初始值;
在激励空间中的闭环中搜索自适应码书;
在激励空间中搜索自适应码书增益;
构造固定码书搜索的目标信号表示形式;
在经滤波的激励空间中搜索固定码书参数;
在经滤波的激励空间中搜索固定码书增益;并且
利用经更新的参数,更新所述激励向量。
31.如权利要求23所述的方法,其中所述部分直通步骤和部分参数映射步骤包括以下步骤:
将所述输入速率编解码器参数分类成直通类和映射类,所述输入速率编解码器参数在所述输入速率编解码器中具有共同的编码方法和索引,所述输出速率编解码器被分类为直通类,并且所有其他输入速率编解码器参数被分类为映射类;
将所述输入速率编解码器的直通类参数直通到所述输出速率编解码器的参数;以及
通过利用直接代码激励线性预测参数空间映射方法、激励空间域映射分析方法和经滤波的激励空间映射分析方法中的至少一种,将所述输入速率编解码器的映射类参数转换为所述输出速率编解码器的相应参数。
32.如权利要求23所述的方法,其中所述多种转换方法被组合为一种转换方法。
33.如权利要求23所述的方法,其中特定速率转换对中的转换方法是动态选择的。
34.如权利要求25所述的方法,其中所述插值步骤包括:
将来自所述输入速率编解码器的LSP系数中的至少一个插值到用于所述输出速率编解码器的相应LSP系数;
将除了来自所述输入速率编解码器的LSP系数之外的代码激励线性预测参数插值到用于所述输出速率编解码器的相应代码激励线性预测参数。
35.如权利要求29所述的方法,其中所述校准激励向量校准步骤还包括:
通过利用所述输入速率编解码器经编码LPC系数中的至少一个将所述输入速率编解码器重构激励向量转换为合成话音向量;
通过至少利用所述经量化的输出速率编解码器LPC系数将所述合成话音向量转换回经校准的激励向量;以及
传送用于激励空间映射分析和经滤波的激励空间映射分析的目标信号的所述经校准的激励向量。
36.如权利要求33所述的方法,其中所述控制信号是基于选中的速率转换映射策略的计算资源特性来提供的。
37.如权利要求33所述的方法,还包括:
在切换模块处接收所述控制信号,所述切换模块被耦合到可进行操作以执行所述映射策略的多个元件中的每一个。
38.如权利要求33所述的方法,其中所述多个映射策略中的至少一个是从存储器中的库提供的。
39.如权利要求34所述的方法,还包括利用线性变换过程转换所述LSP系数中的至少一个。
40.如权利要求1所述的装置,还包括用于改变所述速率转换策略以提供在有负载的情况下适应于可用计算资源并允许适度质量降低的机制的元件。
41.如权利要求1所述的装置,还包括静默帧代码转换单元,其可进行操作以执行从输入速率活动话音格式到输出静默帧的静默帧迅速转换和从输入静默帧到输出所需速率活动话音帧的静默帧迅速转换中的至少一个,其中包括舒适噪声参数的映射。
42.如权利要求1所述的装置,还包括用于激励映射的元件,其可操作以在不回到话音信号域的情况下被执行。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/843,844 | 2004-05-11 | ||
US10/843,844 US20050258983A1 (en) | 2004-05-11 | 2004-05-11 | Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1954366A true CN1954366A (zh) | 2007-04-25 |
Family
ID=34969461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800151710A Pending CN1954366A (zh) | 2004-05-11 | 2005-05-10 | 用于电信多速率语音编码器中的语音速率转换的方法和装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20050258983A1 (zh) |
EP (1) | EP1751743A1 (zh) |
JP (1) | JP2007537494A (zh) |
KR (1) | KR20070038041A (zh) |
CN (1) | CN1954366A (zh) |
WO (1) | WO2005112006A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102484560A (zh) * | 2009-09-14 | 2012-05-30 | 高通股份有限公司 | 基于有效载荷差组合判决度量以用于解码 |
CN107113283A (zh) * | 2014-10-02 | 2017-08-29 | Jacoti有限公司 | 在低延迟多媒体流式传输环境中处理有问题的模式的方法 |
CN109074813A (zh) * | 2015-09-25 | 2018-12-21 | 杜比实验室特许公司 | 处理高清晰度音频数据 |
WO2022179406A1 (zh) * | 2021-02-26 | 2022-09-01 | 腾讯科技(深圳)有限公司 | 音频转码方法、装置、音频转码器、设备以及存储介质 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
JP4793539B2 (ja) * | 2005-03-29 | 2011-10-12 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びにその記憶媒体 |
US8606949B2 (en) | 2005-04-20 | 2013-12-10 | Jupiter Systems | Interconnection mechanism for multiple data streams |
US8547997B2 (en) * | 2005-04-20 | 2013-10-01 | Jupiter Systems | Capture node for use in an audiovisual signal routing and distribution system |
US20060242669A1 (en) * | 2005-04-20 | 2006-10-26 | Jupiter Systems | Display node for use in an audiovisual signal routing and distribution system |
US20060262851A1 (en) * | 2005-05-19 | 2006-11-23 | Celtro Ltd. | Method and system for efficient transmission of communication traffic |
US20070177519A1 (en) * | 2006-01-30 | 2007-08-02 | Thomsen Jan H | Systems and methods for transcoding bit streams |
US8068541B2 (en) * | 2006-01-30 | 2011-11-29 | Jan Harding Thomsen | Systems and methods for transcoding bit streams |
WO2008039857A2 (en) * | 2006-09-26 | 2008-04-03 | Dilithium Networks Pty Ltd. | Method and apparatus for compressed video bitstream conversion with reduced-algorithmic-delay |
US20080192736A1 (en) * | 2007-02-09 | 2008-08-14 | Dilithium Holdings, Inc. | Method and apparatus for a multimedia value added service delivery system |
EP2127230A4 (en) * | 2007-02-09 | 2014-12-31 | Onmobile Global Ltd | METHOD AND APPARATUS FOR ADAPTING MULTIMEDIA CONTENT IN TELECOMMUNICATIONS NETWORKS |
KR20090085376A (ko) * | 2008-02-04 | 2009-08-07 | 삼성전자주식회사 | 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치 |
WO2010030569A2 (en) * | 2008-09-09 | 2010-03-18 | Dilithium Networks, Inc. | Method and apparatus for transmitting video |
US8838824B2 (en) * | 2009-03-16 | 2014-09-16 | Onmobile Global Limited | Method and apparatus for delivery of adapted media |
US8521520B2 (en) * | 2010-02-03 | 2013-08-27 | General Electric Company | Handoffs between different voice encoder systems |
US9185152B2 (en) | 2011-08-25 | 2015-11-10 | Ustream, Inc. | Bidirectional communication on live multimedia broadcasts |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5457685A (en) * | 1993-11-05 | 1995-10-10 | The United States Of America As Represented By The Secretary Of The Air Force | Multi-speaker conferencing over narrowband channels |
US5758256A (en) * | 1995-06-07 | 1998-05-26 | Hughes Electronics Corporation | Method of transporting speech information in a wireless cellular system |
US5995923A (en) * | 1997-06-26 | 1999-11-30 | Nortel Networks Corporation | Method and apparatus for improving the voice quality of tandemed vocoders |
JP3235654B2 (ja) * | 1997-11-18 | 2001-12-04 | 日本電気株式会社 | 無線電話装置 |
US6260009B1 (en) * | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
KR100434275B1 (ko) * | 2001-07-23 | 2004-06-05 | 엘지전자 주식회사 | 패킷 변환 장치 및 그를 이용한 패킷 변환 방법 |
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
KR100460109B1 (ko) * | 2001-09-19 | 2004-12-03 | 엘지전자 주식회사 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
WO2003058407A2 (en) * | 2002-01-08 | 2003-07-17 | Dilithium Networks Pty Limited | A transcoding scheme between celp-based speech codes |
JP2004222009A (ja) * | 2003-01-16 | 2004-08-05 | Nec Corp | 異種網接続ゲートウェイおよび異種網間通信課金システム |
US7469209B2 (en) * | 2003-08-14 | 2008-12-23 | Dilithium Networks Pty Ltd. | Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications |
-
2004
- 2004-05-11 US US10/843,844 patent/US20050258983A1/en not_active Abandoned
-
2005
- 2005-05-10 JP JP2007513321A patent/JP2007537494A/ja active Pending
- 2005-05-10 WO PCT/US2005/016522 patent/WO2005112006A1/en active Application Filing
- 2005-05-10 KR KR1020067026075A patent/KR20070038041A/ko not_active Application Discontinuation
- 2005-05-10 EP EP05747452A patent/EP1751743A1/en not_active Withdrawn
- 2005-05-10 CN CNA2005800151710A patent/CN1954366A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102484560A (zh) * | 2009-09-14 | 2012-05-30 | 高通股份有限公司 | 基于有效载荷差组合判决度量以用于解码 |
CN102484560B (zh) * | 2009-09-14 | 2014-10-01 | 高通股份有限公司 | 基于有效载荷差组合判决度量以用于解码 |
CN107113283A (zh) * | 2014-10-02 | 2017-08-29 | Jacoti有限公司 | 在低延迟多媒体流式传输环境中处理有问题的模式的方法 |
CN107113283B (zh) * | 2014-10-02 | 2020-06-09 | Jacoti有限公司 | 在低延迟多媒体流式传输环境中处理有问题的模式的方法 |
CN109074813A (zh) * | 2015-09-25 | 2018-12-21 | 杜比实验室特许公司 | 处理高清晰度音频数据 |
US10586553B2 (en) | 2015-09-25 | 2020-03-10 | Dolby Laboratories Licensing Corporation | Processing high-definition audio data |
CN109074813B (zh) * | 2015-09-25 | 2020-04-03 | 杜比实验室特许公司 | 处理高清晰度音频数据 |
WO2022179406A1 (zh) * | 2021-02-26 | 2022-09-01 | 腾讯科技(深圳)有限公司 | 音频转码方法、装置、音频转码器、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP1751743A1 (en) | 2007-02-14 |
WO2005112006A1 (en) | 2005-11-24 |
KR20070038041A (ko) | 2007-04-09 |
US20050258983A1 (en) | 2005-11-24 |
JP2007537494A (ja) | 2007-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1954366A (zh) | 用于电信多速率语音编码器中的语音速率转换的方法和装置 | |
CN1735927B (zh) | 用于高质量语音编码转换的方法和装置 | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
US7433815B2 (en) | Method and apparatus for voice transcoding between variable rate coders | |
US6829579B2 (en) | Transcoding method and system between CELP-based speech codes | |
AU2007305960B2 (en) | Pitch lag estimation | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
CA2972808C (en) | Multi-reference lpc filter quantization and inverse quantization device and method | |
CN100578617C (zh) | 代码转换方法及代码转换装置 | |
KR101303145B1 (ko) | 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더 | |
CN100527225C (zh) | 基于celp的语音代码之间的代码转换方案 | |
US7263480B2 (en) | Multi-channel signal encoding and decoding | |
JP2006525533A5 (zh) | ||
CA2940657C (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
CN102150205A (zh) | 用于编码和解码统合的语音与音频的设备 | |
JP2003501675A (ja) | 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
CN112614495A (zh) | 一种软件无线电多制式语音编解码器 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
US20060212289A1 (en) | Apparatus and method for converting voice packet rate | |
Erdmann et al. | Embedded speech coding based on pyramid CELP | |
Shevchuk et al. | Method of converting speech codec formats between GSM 06.20 and G. 729 | |
Grill et al. | Information Technology-Very Low Bitrate Audio-Visual Coding Part 3: Audio Subpart 1: Main Document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070425 |