WO2009132544A1 - 一种转码方法和装置 - Google Patents

一种转码方法和装置 Download PDF

Info

Publication number
WO2009132544A1
WO2009132544A1 PCT/CN2009/071133 CN2009071133W WO2009132544A1 WO 2009132544 A1 WO2009132544 A1 WO 2009132544A1 CN 2009071133 W CN2009071133 W CN 2009071133W WO 2009132544 A1 WO2009132544 A1 WO 2009132544A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
code table
quantization
transcoding
scaling factor
Prior art date
Application number
PCT/CN2009/071133
Other languages
English (en)
French (fr)
Inventor
鲍长春
徐昊
唐繁荣
胡翔宇
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2009132544A1 publication Critical patent/WO2009132544A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Definitions

  • the present invention relates to the field of codecs, and in particular, to a transcoding method and apparatus. Background technique
  • Speech coding based on CELP is one of the core technologies in today's VoIP (Voice over Internet Protocol) and mobile communication systems, in order to realize communication devices between different vendors. Compatible and interoperable, transcoding work between different CELP speech coding standards is required.
  • Transcoding implements transcoding of integer and fractional pitch delay parameters
  • a CELP Algorithm Code-Excited Linear Prediction
  • Gain gain transcoding realizes transcoding of gain parameters.
  • Decoder B obtains each parameter after transcoding, and after encoding, sends the encoded code stream to the opposite communication device B, thereby realizing different CELP speech coding standard transcoding work, and successfully achieving work in different CELP Communication between communication devices under the speech coding standard.
  • the target encoder realizes the conversion of the gain parameter by calculating and quantizing the gain parameter.
  • Code First, the adaptive codebook gain and the fixed codebook gain of the current subframe are obtained by using the formula, and then, according to the joint optimization process of the optimal excitation, the mean square error term ⁇ ' is used as the search criterion, and the search target is searched.
  • the gain quantization code table in the encoder so that the minimum sum is the final quantized gain value; finally, the index value of the optimal gain quantization value in the gain code table is written into the code stream of the target encoder, ie The transcoding operation of the gain parameter is completed.
  • an adaptive codebook gain and a digital book gain ⁇ directly transmitted from the source encoder can also be used.
  • v (i), e (i) are the adaptive codebook vector and the algebraic codebook vector respectively
  • g p '(L) is the target
  • the adaptive codebook gain value of the Lth codeword in the encoder g. '(L) is the algebraic code gain value of the Lth codeword in the target encoder.
  • the embodiment of the present invention provides a transcoding method and apparatus.
  • the technical solution is as follows:
  • a transcoding method comprising:
  • the " x Y ⁇ sum is quantized according to the quantization rule of the target end.
  • a transcoding device comprising:
  • An obtaining module configured to obtain a ratio factor of an adaptive codebook gain and a fixed codebook gain of a current subframe in the source code stream
  • Scaling module for scaling factor " the acquiring module acquires the ⁇ scaled to give a quantization module configured to mark the end of quantization rule 0, the" X? ⁇ And quantized.
  • FIG. 1 is a schematic diagram of a transcoding system between different CELP speech coding standards based on parameters provided by the prior art
  • FIG. 2 is a flowchart of a transcoding method provided by Embodiment 1 of the present invention
  • FIG. 3 is a flowchart of a method for determining a scaling factor according to Embodiment 1 of the present invention
  • Embodiment 4 is a block diagram of a gain parameter conversion provided by Embodiment 1 of the present invention.
  • FIG. 5 is a block diagram of a gain parameter transcoding provided by Embodiment 2 of the present invention.
  • FIG. 6 is a block diagram of another parameter transcoding according to Embodiment 2 of the present invention.
  • Figure 7 is a schematic diagram of a transcoding device according to Embodiment 3 of the present invention.
  • FIG 8 is another schematic diagram of a transcoding device according to Embodiment 3 of the present invention. detailed description
  • a transcoding method provided by an embodiment of the present invention is as follows: Obtain an adaptive codebook gain of a current subframe in a source code stream and a scaling factor of a fixed codebook gain according to a scaling factor, and perform scaling processing on the ⁇ Obtain ax r ⁇ c ; According to the quantization criterion of the target end, quantize " x ⁇ p to realize transcoding. After scaling the fixed codebook gain scale factor ⁇ by introducing a scaling factor, the new quantization criterion is used to re-search in the target encoder's gain code table, and the gain parameter is transcoded, thereby effectively reducing the gain parameter transcoding. The computational complexity increases the quality of transcoded speech.
  • the method for transcoding provided by the embodiment of the present invention is described in detail below. For details, refer to the following embodiments.
  • FIG. 2 an embodiment of the present invention provides a transcoding method.
  • the system block diagram provided in FIG. 1 is taken as an example for description. The details are as follows:
  • the source decoder receives and decodes the code stream sent by the communication device A, and decodes the gain index information from the source decoder code stream, and then uses the gain index information obtained by the decoding to search the gain quantization code table of the source encoder. Obtain the scaling factor of the adaptive codebook gain and the fixed codebook gain of the current subframe.
  • the quantization method of the adaptive codebook gain and the fixed codebook scale factor in the target encoder when the new quantization criterion is used to re-search in the target encoder's gain code table, since different speech coding standards are in the pair
  • the adaptive codebook gain and the fixed codebook scale factor are quantized, there are different quantization requirements.
  • the speech coding standard of the /s mode requires independent quantization and ⁇ , and accordingly, when performing quantization on the sum and ⁇ , the following method can be used:
  • the weighting factor (the size is selected according to the range of the sum value, usually takes a value of 1), and the above equation is the adaptive codebook gain and the fixed codebook of the current subframe obtained by the source decoder respectively.
  • the minimum value is obtained, that is, the first codeword sum closest to " ⁇ " is simultaneously satisfied, thereby realizing the quantization of the gain parameter.
  • is a scaling factor of the fixed codebook gain of the current subframe obtained by the source decoder
  • End of the coding target was fixed codebook vector quantization scale factor of the code words in the code table
  • 1 target encoder scale factors quantized fixed codebook code table size "i.e., scaling factor ⁇ ⁇ ; source
  • the codebook gain; S P is the " ⁇ th codeword” in the quantized adaptive codebook gain code table in the target encoder; the size of the quantized adaptive codebook gain code table in the target encoder.
  • the adaptive codebook gain and the fixed codebook scale factor are independently quantized, the following absolute quantization criteria can also be used according to the specific requirements of the transcoding system:
  • the data to be trained can be obtained by using large sample statistics or obtaining two methods for each sequence calculation (the difference is Then, each sequence is calculated, and the large sample statistic is used as a fixed value for each sequence.
  • the two method steps are the same. Referring to FIG. 3, the specific steps of determining the scaling factor provided by the embodiment of the present invention are as follows:
  • the average energy based on the average energy source speech coding standard and the fixed codebook of a destination end speech coding standard fixed code book scaling factor is determined "ideal objective value; e.g., calculated using the formula, oc L L- J Q0.05 (£2), El ⁇ E2, as mentioned above, the average energy of fixed codebooks corresponding to different CELP standards is not the same.
  • the selection may be performed according to system requirements, for example, when the value is 1.6, the value range may be selected as [1.5, 2], the value range is also [1, 2], and the embodiment of the present invention does not limit the specific manner and method used in determining the value range.
  • the preset selection rule is to obtain an element in the range of the scaling factor "al, a2" at intervals of 0.05, and perform a gain parameter transcoding training experiment on each of the acquired elements.
  • an embodiment of the present invention provides a block diagram of a gain parameter conversion, in which only a scale factor of an adaptive codebook gain and a fixed codebook is acquired, and a scaling factor "[ ⁇ ] obtained by performing transcoding training on ⁇ is performed. After the scaling process, only the processed pair " X? ⁇ and the quantization process are needed, thereby realizing the transcoding of the gain parameter, reducing the computational complexity of the gain parameter transcoding, and improving the quality of the transcoded speech.
  • the source end is a communication device A adopting the AMR 7.95 kbit/s mode in the CELP standard
  • the target end adopts the CELP standard.
  • the G.729a mode communication device B when the communication device A wants to communicate with the communication device B, since it works under different speech coding standards, in order to realize its communication, it is necessary to use AMR 7.95 kbit/s mode to G729a.
  • Mode transcoding which is typically done by intermediate device C located in the communication link of communication device A and communication device B:
  • is the LSP parameter vector of the AMR kth frame; is the LSP parameter vector of the AMR k-1 frame;
  • 4" is the LSP parameter vector of the 2k-1 frame of ⁇ 3 ⁇ 4729a; the LSP parameter vector of the 2kth frame of ⁇ 3 ⁇ 4729a.
  • the training data is selected from NTT (Nippon).
  • the subjective value range of the scaling factor is determined according to 0 ⁇ , because ⁇ 99526 :?. ,, so the scaling factor & [ ⁇ , 2].
  • W represents the number W After the decimal point, the second digit is rounded up to get a decimal value after the decimal point.
  • the joint quantitative reference formula is as follows:
  • the inventor adopts the transcoding method provided by the embodiment of the present invention, and through the objective test experiment of 480 corpora, the following results are obtained: the average MOS-LQO score of the synthesized speech obtained by using the DTE method when transcoding AMR7.95 to G729a
  • the average MOS-LQO score of the synthesized speech obtained by the transcoding method provided by the embodiment of the present invention is 3.31400625. It can be seen that the transcoding method provided by the embodiment of the present invention can not only reduce the computational complexity of the gain parameter transcoding. Degree, can also greatly improve the quality of transcoded voice.
  • the embodiment of the present invention provides a transcoding method, which uses a scaling factor to scale a fixed codebook gain scaling factor ⁇ and then transcodes according to the determined quantization error criterion, thereby greatly reducing the gain parameter conversion.
  • the computational complexity of the code can also greatly improve the quality of the transcoded speech.
  • the transcoding method provided by the embodiment of the present invention is applicable to the case of any codebook gain parameter transcoding between different CELP speech coding algorithms based on gain prediction vector quantization.
  • the embodiment of the present invention provides a transcoding method, which reduces the computational complexity of the gain parameter part by using a method of establishing a mapping code table, and further reduces the computational complexity of the gain parameter part.
  • the method content is as follows:
  • the gain quantized code table in the source encoder is mapped to the gain quantized code table in the target encoder according to the determined scaling factor "value and the selected quantization criterion.
  • Embodiment 1 in determining the scaling factor "value, the determining method provided in Embodiment 1 can be similarly used, and the embodiment is still described by using the default value of 1.
  • mapping method when the gain quantization code table in the source encoder is mapped with the gain quantization code table in the target encoder, the following mapping method may be adopted:
  • the gain index of the source encoder the inverse quantization processing of the source encoder gain; the scaling of the decoded gain information according to the determined scaling factor, according to the quantization in the selected target encoder
  • the criterion is re-quantized; the gain index value is requantized in the target encoder.
  • mapping code table is created and saved in the form of a table.
  • an embodiment of the present invention provides a block diagram of a gain parameter transcoding. After receiving the code stream of the source encoder, after decoding and obtaining the adaptive codebook gain and the scale factor, the method succeeds in finding a preset mapping code table. Transcoding of the gain parameters is implemented.
  • FIG. 6 another embodiment of the present invention provides a block diagram of the gain parameter transcoding.
  • the idea of introducing the mapping code table provided by the embodiment may also be determined according to the determined
  • the scaling factor value and the selected quantization criterion are used to map the gain code stream of the source encoder to the mapping code table corresponding to the bit stream of the target encoder, and then directly transmit to the source encoder when transcoding is performed.
  • the code stream is searched and mapped according to the mapping code table.
  • the transcoding method provided by the embodiment of the present invention omits the re-quantization operation in the gain parameter transcoding algorithm by searching the preset mapping code table, and further reduces the gain parameter transcoding under the premise of improving the quality of the transcoded speech.
  • an embodiment of the present invention provides a transcoding device, where the device includes:
  • An obtaining module configured to obtain a ratio factor of an adaptive codebook gain and a fixed codebook gain of a current subframe in the source codestream
  • the scaling module is configured to perform scaling processing on the ⁇ obtained by the obtaining module according to the scaling factor, to obtain a “ ⁇ ? quantization module, which is used to quantize “ ⁇ ⁇ according to the quantization criterion of the target end to implement transcoding.
  • the device further includes:
  • the foregoing scaling factor "acquisition module specifically includes:
  • a first obtaining unit configured to determine an objective ideal value of the scaling factor according to an average energy of the fixed code book of the source end and the target end;
  • a second obtaining unit configured to determine a value range of the scaling factor according to the first acquired by the first acquiring unit
  • a third acquiring unit configured to obtain the value range obtained by the second acquiring unit according to the preset selection rule Obtain test values for testing; at least one test value;
  • a fourth acquiring unit configured to obtain a scaling factor from the test value obtained by the third acquiring unit according to the preset testing rule.
  • the third obtaining unit is configured to sample the value in the range of values obtained by the second acquiring unit according to the preset interval, and obtain a test value for performing the test;
  • the fourth obtaining unit is specifically configured to obtain an objective speech quality average score of the synthesized speech of the test value, an average segmentation energy of the synthesized speech, and an average segmentation energy of the original speech; an average speech quality average score based on the synthesized speech, and an average of the synthesized speech.
  • the segmentation energy is equal to the average segmentation energy of the original speech, and the scaling factor is obtained from the test value.
  • the embodiment of the present invention provides a quantization module in the transcoding device, which may specifically be:
  • the embodiment of the present invention further provides:
  • a weighting factor obtaining module is configured to determine a weighting factor according to a scaling factor of the adaptive codebook gain and the fixed codebook gain.
  • the quantization module is specifically a quantization unit, configured to jointly quantize " X ⁇ P according to the gain vector code table of the acquisition target end, obtain the quantized codeword in the gain vector code table, and implement transcoding of the gain parameter, wherein, the joint is performed.
  • the quantization rule is:
  • the quantization module is specifically a quantization unit, which is used to fix the codebook scale factor code table and the adaptive codebook according to the target end a gain code table, respectively quantizing " X ⁇ P, obtaining a quantized fixed codeword in the quantized scale factor code table and a quantized adaptive codeword in the adaptive codebook gain code table, to implement transcoding of the gain parameter, wherein
  • the quantization rule is:
  • the above quantization module has an absolute quantization unit for fixing the codebook scale factor code table and the adaptive codebook gain code table according to the target end. And performing absolute quantization on the sum, obtaining the quantized fixed codeword in the quantized scale factor code table and the quantized adaptive codeword in the adaptive codebook gain code table, and implementing transcoding of the gain parameter, wherein the absolute quantization rule is:
  • the transcoding device provided by the embodiment of the present invention may further include:
  • mapping code table generating module configured to map the source gain quantization code table and the gain quantization code table in the target encoder according to the scaling factor and the weighting factor to obtain a mapping code table
  • a processing module configured to use an adaptive codebook gain and a fixed codebook increase according to the current subframe in the obtained source code stream
  • the scale factor of the benefit finds the mapping code table and implements transcoding.
  • the mapping code table generating module specifically includes:
  • a first processing unit according to a gain index of the source encoder, a gain index inverse quantization process on the source end encoder; a second processing unit, configured to perform a gain obtained by inverse quantization processing the first processing unit according to a scaling factor Scale
  • a third processing unit configured to quantize the scaled gain of the second processing unit according to the quantization rule of the target end; the fourth processing unit is configured to obtain the quantized gain index value of the third processing unit, and the quantized gain index value forms a mapping Code table.
  • the transcoding device provided by the embodiment of the present invention may further include:
  • mapping code table generating module configured to map a code stream of the source end encoder and a code stream of the target end encoder according to a scaling factor and a weighting factor ⁇ , and a quantization rule of the target end, to obtain a mapping code table
  • the processing module is configured to obtain a code stream at the source end, find a mapping code table, and implement transcoding.
  • the transcoding device provided by the embodiment of the present invention re-searches the gain code table of the target encoder by using a new quantization criterion by scaling the fixed codebook gain scale factor ⁇ .
  • the transcoding of the gain parameter is completed, thereby effectively reducing the computational complexity of the gain parameter transcoding and improving the quality of the transcoded speech.
  • Some of the steps in the embodiment of the present invention may be implemented by software, and the corresponding software program may be stored in a readable storage medium such as an optical disk or a hard disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

说 明 书
一种转码方法和装置 技术领域
本发明涉及编解码领域, 特别涉及一种转码方法和装置。 背景技术
基于 CELP (Code-Excited Linear Prediction, 码激励线性预测) 的语音编码是当今 VoIP (Voice over Internet Protocol, 网络电话) 和移动通信系统中的核心技术之一, 为了实现不 同供应商之间通信设备的兼容与互通, 需要进行不同 CELP语音编码标准间的转码工作。
目前,在进行不同 CELP语音编码标准间的转码时,广泛采用的是基于新型增益转换技 术的不同 CELP语音编码标准间的转码方法,该方法通过将码流中所传递的参数进行一定处 理后分别进行传递来实现不同编码标准之间的转码, 所涉及的参数有: 线谱频率, 整数及 分数基音延迟, 固定码书符号和位置参数以及增益参数, 参见图 1, 提供了该基于参数的不 同 CELP语音编码标准间的转码系统的示意图, 其中, 通信设备 A和 B工作在不同 CELP 语音编码标准下, 位于通信设备 A和通信设备 B之间的通信链路中的通信设备 C中的参数 解 /编码器 A接收到通信设备 A的码流后进行参数解码, 获取到相应的参数, 然后通过 LSP (Line Spectrum Pairs, 线性频谱参数)转码实现了对其中的线谱频率参数的转码、 Pitch (基 音) 转码实现了对整数及分数基音延迟参数的转码, ACELP(Algorithm Code-Excited Linear Prediction, 代数码本码激励线性预测)转码实现了对固定码书符号和位置参数的转码、 Gain (增益) 转码实现了对增益参数的转码, 参数编 /解码器 B获取经过转码后的各参数, 进行 编码后,将编码后的码流发送到对端通信设备 B, 从而实现了不同 CELP语音编码标准转码 工作, 成功实现了工作在不同 CELP语音编码标准下的通信设备之间的通信。
其中, 在对 Gain增益参数进行转码实现时, 可以采用直接转码 DTE (Decode Then Encode, 先解码后编码) 的方法, 目标编码器通过对增益参数的求取和量化操作实现对增 益参数转码:首先,利用求取公式获取到当前子帧的自适应码书增益 和固定码书增益 , 然后, 根据最佳激励的联合优化过程, 采用均方误差项^'做为搜索准则, 搜索目标编码器 中的增益量化码表, 使^最小的 和 即为最终量化后的增益值; 最后, 将最优增益量化 值在增益码表中的索引值写入目标编码器的码流中, 即完成了增益参数的转码操作。 但是, 采用该 DTE方法实现增益参数转码时, 由于在获取 和 ^。时,需要恢复出当前子帧的自适 应码书矢量和代数码书矢量, 并同时需要恢复出码书增益量, 然后进行二次量化, 这些操 作大大的增加了计算的复杂度, 另外由于两次增益量化, 造成转码语音质量的下降。
此外, 在对增益参数进行转码实现时, 还可以采用直接将源编码器传递过来的自适应 码书增益 和代数码书增益 ^。进行转码的方法, 该方法省略了目标编码器中对自适应码书 增益 和代数码书增益 的求取过稈, 在进行增益参数量化时, 采用下述的均方误差项做 为搜索准则: E(L)=[exl(i)-ex2(i,L)]2,(i=0, 1 , . . . , N) , 其中, N为子帧长度,
其中, exl为参考激励信号 exl(i,L)=gp (L)xv i)+g。(L)xC(i),(i=0, 1, . . . N), 其中, gp(L) 为从源编码器传递过来的自适应码书增益值, g。为从源编码器中传递过来的代数码书增益 值, v(i)、 e(i)分别为自适应码书矢量和代数码书矢量; ex2 为转码后合成的激励信号 ex2(i,L)=gp' (L) X v(i)+gc' (L) x c(i) ,(i=0, 1, . . . , N) , 其中, gp'(L)为目标编码器中第 L个码字 的自适应码书增益值, g。'(L)为目标编码器中第 L个码字的代数码书增益值。
通过对目标编码器中增益量化码表的搜索, 使上式中 E(L)最小的 gp'(L)和 g。'(L)即为最 终量化后的增益值, 将最优增益量化值在增益码表中的索引值写入目标编码器的码流中, 即完成了增益参数的转码操作。 但是, 采用该方法实现增益参数转码时, 需要保留增益预 测过程。 在进行增益参数量化时, 需要大量计算来保证信号传递能量守恒, 增加了计算的 复杂度, 而且由于不同 CELP标准增益量化码本的不同, 影响了转码语音的质量。 发明内容
为了在不同 CELP语音编码标准间的转码过程中, 降低增益参数转码的计算复杂度,提 高转码语音的质量, 本发明实施例提供了一种转码方法和装置。 所述技术方案如下:
一方面, 提供了一种转码方法, 所述方法包括:
获取源端码流中的当前子帧的自适应码书增益 和固定码书增益的比例因子 ^ 根据缩放因子", 对所述 ^ ^进行处理得到" X ?
根据目标端的量化规则, 对所述 "x Y^和 进行量化。
另一方面, 提供了一种转码装置, 所述装置包括:
获取模块, 用于获取源端码流中的当前子帧的自适应码书增益 和固定码书增益的比 例因子 ;
缩放模块, 用于根据缩放因子", 对所述获取模块获取到的 ^进行缩放处理, 得到 量化模块, 用于根据 0标端的量化规则, 对所述 "x ?^ 和 进行量化。
本发明实施例提供的技术方案的有益效果是:
通过引入缩放因子对固定码书增益比例因子^ ^进行缩放后, 采用新的量化准则在目标 编码器的增益码表中进行搜索, 完成增益参数的转码, 从而有效地降低增益参数转码的计 算复杂度, 提高转码语音的质量。 附图说明
图 1是现有技术提供的基于参数的不同 CELP语音编码标准间的转码系统的示意图; 图 2是本发明实施例 1提供的转码方法的流程图;
图 3是本发明实施例 1提供的确定缩放因子 "的方法流程图;
图 4是本发明实施例 1提供的增益参数转换框图;
图 5是本发明实施例 2提供的增益参数转码框图;
图 6是本发明实施例 2提供了另一参数转码框图;
图 7是本发明实施例 3提供的转码装置的示意图;
图 8是本发明实施例 3提供的转码装置的另一示意图。 具体实施方式
为使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发明实施方式作 进一步地详细描述。
本发明实施例提供的一种转码方法, 内容如下: 获取源端码流中的当前子帧的自适应 码书增益 和固定码书增益的比例因子 根据缩放因子", 对 ^进行缩放处理, 得到 ax r^c ; 根据目标端的量化准则, 对" x ^^p 进行量化, 实现转码。 通过引入缩放因子 对固定码书增益比例因子 ^ ^进行缩放后, 采用新的量化准则在目标编码器的增益码表中重 新进行搜索, 完成增益参数的转码, 从而有效地降低增益参数转码的计算复杂度, 提高转 码语音的质量。 下面针对本发明实施例提供的转码的方法进行详细说明, 详见下述各实施 例。
实施例 1
参见图 2, 本发明实施例提供了一种转码方法, 以图 1提供的系统框图为例进行说明, 详细内容如下:
101: 获取通信设备 A发送过来的码流中的当前子帧的自适应码书增益 和固定码书 增益的比例因子^^, 具体方法如下:
首先, 源解码器接收通信设备 A发送的码流并进行解码, 并从源解码器码流中对增益 索引信息进行解码, 再利用解码获取的增益索引信息查找源编码器的增益量化码表, 获取 到当前子帧的自适应码书增益 和固定码书增益的比例因子 ^。 其中, 在本步骤中涉及的固定码书增益的比例因子 = z , 其中, 为编码求得 的当前子帧固定码书增益值, 为预测得到的当前子帧固定码书增益值, 其中, gc = l oo Mn s-E]), 该式中 E(n 为通过预测算法得到的对当前子帧增益的预测项; /为 当前子帧固定码书总的能量项; 为当前子帧固定码书的平均能量项(其中, 不同的 CELP 语音编码标准对应的是不同的)。
102: 利用缩放因子", 对^ ^进行缩放处理, 得到" X ^。
其中, """^^为目标通信设备 B对应的固定码书增益的比例因子; 其中, X表示乘积。 上述, "为 e的缩放因子, 在将增益参数进行转码前, 将固定码书增益的比例因子 ^ ^采用 缩放因子"进行缩放的目的是为了弥补源端 (通信设备 A) 语音编码标准和目标端 (通信设 备 B)语音编码标准的不同(具体是因为各自的当前子帧固定码书的平均能量项不同), 而造 成的转码语音的幅度失真的影响。
103: 根据量化准则, 对" X ? ^和 进行量化处理, 实现对增益参数的转码。
其中, 根据目标编码器中对自适应码书增益 与固定码书比例因子 的量化方法, 采 用新的量化准则在目标编码器的增益码表中重新进行搜索时, 由于不同的语音编码标准在 对自适应码书增益 与固定码书比例因子 ^ ^进行量化时, 会存在不同的量化需求, 例如, 对于 G.729a模式的语音编码标准, 需要对 和 ^ ^进行联合量化, 而对于 AMR7.95kbit/s 模式的语音编码标准, 则需要对 和 ^ ^进行独立量化, 于是, 相应地, 在进行对 和^^ 的量化时, 可以采用如下方式:
(一) 当目标编码器中自适应码书增益 与固定码书比例因子^ ^为进行联合量化时, 采用如下联合量化准则:
E = arg min{("x ygc - gc )2 + β(§ρ - gp k f }
0≤k≤N ,
其中, 是 权重因子( 的大小根据 和 值的范围进行选择, 通常 取值为 1 ), 上式中 和^ ^分别为源端解码器得到的当前子帧的自适应码书增益和固定码书增益的比 例因子; 和 为目标端的编码器对增益进行矢量量化时码表内的第 个码字; N为目 标编码器中码表的大小, 通过查找目标编码器的增益码表, 获取满足上式使 取值最小的, 即同时满足最接近" Χ 、 的第 个码字 和 , 从而实现增益参数的量化。
(二) 当目标编码器中自适应码书增益 与固定码书比例因子^ ^为进行独立量化时, 釆用如下独立量化准则:
- ) 2
Figure imgf000006_0001
E2 = arg mm(g - g ' P
0<A:9 <N 其中, ε是源端解码器得到的当前子帧的固定码书增益的比例因子;
Figure imgf000007_0001
则为目标编 码端对固定码书比例因子进行矢量量化码表内的第 个码字; 1为目标编码器中量化固定 码书比例因子码表的大小; "即^ ^的缩放因子; 是源端解码器得到的当前子帧的自适应 k,
码书增益; S P则为目标编码器中量化自适应码书增益码表内的第" ^个码字; 为目标编 码器中量化自适应码书增益码表的大小。
进一步地, 当进行自适应码书增益 与固定码书比例因子 独立量化时, 还可以根据 转码系统的具体需求, 使用如下的绝对量化准则:
= argmin x y gscc - ' g^cc . E2 f = arg min P 其中, 上述公式的 o≤ - 0<A:9 <N
各参数的具体含义同前, 不再赘述。 综上, 通过上述步骤 101至 103成功实现了在对不同的语音标准进行的转码过程中的 增益参数的转码, 降低了增益参数转码的计算复杂度, 提高了转码语音的质量。
下面, 具体针对上述如何确定缩放因子"进行详细的描述, 通常在确定该缩放因子" 时, 进行训练的数据可以通过采用大样本统计获取或对每个序列计算获取的两种方式得到 (差别在于是每个序列都计算 , 而大样本统计 作为每个序列的固定 值), 两种方法步 骤相同, 参见图 3, 本发明实施例提供的确定缩放因子 "的具体步骤内容如下:
201, 根据源端语音编码标准的固定码书的平均能量 1和目标端语音编码标准的固定 码书的平均能量 , 确定缩放因子"的客观理想值 ; 例如, 采用计算公式, ocLL― J Q0.05 (£2), El ≠ E2 , 如前文所述, 不同的 CELP标准 对应的固定码书的平均能量是不相同的。
202, 根据 确定缩放因子 "的取值范围 [al,a2]; 其中, 在确定该取值范围时, 可以根 据系统需要进行选取, 例如, 当 取值为 1.6时, 可以选择该取值范围为 [1.5,2], 还可以选 择该取值范围为 [1, 2],本发明实施例不限制在确定该取值范围时所采用的具体方式和方法。
203 , 根据目标编码器中对增益参数的量化方法选择适当的量化准则, 按照所确定的量 化准则, 根据预设的选择规则获取到所确定的"的取值范围内的", 对获取的各"进行增 益参数转码训练实验, 测试得到各"的合成语音的 MOS-LQO ( (Mean Opinion Score - Listening Quality Objective, 客观语音质量平均评分;), 其中, 该分数代表了合成语音的质量, 分数越高相应的合成语音的质量越高; 并计算各"的合成语音的平均分段能量和原始语音 的平均分段能量;
例如, 预设的选择规则为以 0.05为间隔在缩放因子"的取值范围 [al, a2]获取元素, 对 获取到的各元素"进行增益参数转码训练实验。
204, 根据各"的合成语音的 MOS-LQO分以及合成语音的平均分段能量与原始语音的 平均分段能量的接近程度, 选择出最优的 "值, 并将选择出的该"值作为固定码书增益比 例因子? ^的缩放因子值。 其中, 不同的缩放因子"会产生不同的合成语音, 可以根据系统 的具体需要制定选择出最优的"值作为缩放因子"的规则, 本发明实施例不限制该具体规 则的制定方式和内容。
参见图 4, 本发明实施例提供了一种增益参数转换框图, 其中, 只需要获取自适应码书 增益 和固定码书的比例因子 , 采用对 ^进行转码训练获取的缩放因子"对 ^进行了 缩放处理后, 只需要对处理后的对 "X ?^和 进行量化处理, 从而实现了对增益参数的转 码, 降低了增益参数转码的计算复杂度, 提高了转码语音的质量。
为了进一步对本发明实施例提供的转码的方法进行说明, 下面以一具体示例进行阐述, 其中, 源端为采用 CELP标准中的 AMR 7.95kbit/s模式的通信设备 A, 目标端为采用 CELP 标准中的 G.729a模式的通信设备 B, 当通信设备 A欲和通信设备 B实现通信时, 由于其工 作在不同的语音编码标准下, 为了实现其通信, 需要由 AMR 7.95kbit/s模式向 G729a模式 的转码, 该转码过程通常由位于通信设备 A和通信设备 B的通信链路中的中间设备 C来完 成:
( 1 ) 在进行线性频谱 LSP参数转码时, 采用插值的方法, 如下式:
Figure imgf000008_0001
X 其中, ^ 为 AMR第 k帧的 LSP参数矢量; 为 AMR第 k-1帧的 LSP参数矢量;
4"为 <¾729a第 2k-l帧的 LSP参数矢量; 为 <¾729a第 2k帧的 LSP参数矢量。
(2)在进行整数及分数基音延迟参数转码时,直接将 AMR各子帧的整数基音值和分数 基音值传递给 G729a各子帧。 另需要判断 AMR偶数子帧的基音是否超过 G729a的基音范 围, 若超出, 则取 G729a的基音范围的上下边界。
(3 ) 在进行固定码书 (即代数码书) 符号、 位置参数转码时, 从 AMR将代数码书信 息进行解码后需先进行格雷码解码后再传递至 G729a各子帧, G729a将传递得到的脉冲位 置进行重新编码后写入码流。
(4)在进行增益参数转码时, 采用大样本统计的方式, 即训练数据选自 NTT (Nippon
Telegraph and Telephone Corporation, 日本电信电话株式会社;)数据库中的中文语音: 男女说 话人各 4人,每个说话人 12段长 8秒的语音,总共语音长度为 768秒。其中, AMR7.95kbit/s 模式下所用的固定码书的平均能量为 36dB, 在 G729a 中所用的固定码书的平均能量为 30dB。 权重因子 默认为 1。
首先, 确定缩放因子 "的客观理想值 如下:
Figure imgf000009_0001
r = = 1003 = 1.99526 其次, 根据0 ^确定缩放因子"的主观取值范围, 因为 ^99526 :?.。, 所以缩放因子 & [\ , 2]。 其中, 「W 表示将数字 W中的小数点后第二位向上取整以得到小数点后只有 一位的小数值。
再次, 根据缩放因子 "的主观取值范围, 按照预设规则选择该范围内的各", 对获取 的各"进行增益参数转码训练实验后, 获取最优"的取值, 例如, "=1.3。
最后, 由于 G729a模式是对自适应码书增益与固定码书比例因子进行联合量化, 选择 联合量化规则, 从而成功实现了增益参数转码。 其中, 联合量化参考公式如下:
E = arg min{ (ax ygc ~ gc)2 + {gp - gp k )2 }
o≤k≤m 其中, 和 是 AMR7.95kbit/s码流中解码得到的当前子帧的自适应码书增益和固定 码书增益的比例因子; 和 则为 G729a编码端对增益进行矢量量化时码表内的第 个 码字; 在 G729a编码中对于增益量化所用的码表大小为 128, 所以 N取 128, 通过查找目 标编码器的增益码表,获取满足上式使 取值最小的, 即同时满足最接近" X 、 的第 个码字的 和 , 从而实现了量化。
发明人采用本发明实施例提供的转码方法, 通过对 480个语料客观测试实验, 得到如 下结果:在 AMR7.95向 G729a进行转码时,使用 DTE方法得到的合成语音的平均 MOS-LQO 得分为 3.343035417, 而利用本发明实施例提供的转码方法获取的合成语音的平均 MOS-LQO得分为 3.51400625, 可以看出, 本发明实施例提供的转码方法不但能降低增益参 数转码的计算复杂度, 还能大大提高转码语音的质量。
综上所述, 本发明实施例提供了一种转码方法, 通过引入缩放因子对固定码书增益比 例因子^ ^进行缩放后按照所确定的量化误差准则进行转码, 从而大大降低增益参数转码的 计算复杂度, 还能大大提高转码语音的质量, 本发明实施例提供的转码方法适用于任何基 于增益预测矢量量化的不同 CELP语音编码算法间的码书增益参数转码的情况。 实施例 2
本发明实施例提供了一种转码方法, 利用建立映射码表的方式, 减少增益参数转码部 分的重新量化的操作, 进一步降低增益参数部分的计算复杂度, 方法内容如下:
首先, 按照确定的缩放因子"值和所选定的量化准则将源编码器中增益量化的码表与 目标编码器中增益量化的码表进行映射。
其中, 在确定缩放因子"值时, 可以类似的采用实施例 1 提供的确定方法, 本实施例 仍以 ^取值默认为 1进行说明。
其中, 源编码器中增益量化码表与目标编码器中增益量化码表进行映射时, 可以采用 如下映射方法:
Figure imgf000010_0001
其中, 上式中 为源编码器的增益索引; 为源编码器增益反量化处理; 为按照确 定的缩放因子 "将解码得到的增益信息进行缩放后, 按照所选定的目标编码器中的量化准 则重新进行量化处理; 为目标编码器中进行重新量化后的增益索引值。
然后, 将源编码器中所有的码字通过上述映射处理后得到的索引值进行保存, 例如, 建立映射码表, 以表格的形式进行保存。
最后, 在进行增益参数转码时, 通过直接查上述映射码表即可实现对增益参数的转码。 参见图 5, 本发明实施例提供了一种增益参数转码框图, 接收到源编码器的码流后, 解 码得出自适应码书增益和比例因子后, 通过查找预设的映射码表从而成功实现了对增益参 数的转码。
参见图 6, 本发明实施例提供增益参数转码的另一框图, 进一步地, 本领域技术人员还 可以获知, 采用本实施例提供的引入映射码表的思想, 还可以为, 首先根据确定的缩放因 子值和所选定的量化准则将源编码器的增益码流与目标编码器的增益码流设置比特流对应 的映射码表, 然后, 在进行转码时, 直接对源编码器发送的码流按照该映射码表进行查表 映射, 参见表 1, 提供了一种映射码表, 如表 1所示, 当源编码器的增益码流是 100101, 查该表可以得到在 α =1.4的情况下, 100101对应的目标编码器增益码流是 100011, 这样就 成功地实现了对增益参数的转码。 表 1
Figure imgf000011_0001
本发明实施例提供的转码方法, 通过查找预设映射码表, 省略了增益参数转码算法中 的重新量化操作, 在能够实现转码语音质量提高的前提下, 进一步地降低增益参数转码时 的计算复杂度。 实施例 3
参见图 7, 本发明实施例提供了一种转码装置, 该装置包括:
获取模块, 用于获取源端码流中的当前子帧的自适应码书增益 和固定码书增益的比 例因子
缩放模块, 用于根据缩放因子"对获取模块获取到的^ ^进行缩放处理, 得到" χ ? 量化模块, 用于根据目标端的量化准则, 对" Χ^ Ρ 进行量化, 实现转码。
其中, 为了确定上述缩放因子", 装置还包括:
缩放因子"获取模块, 用于获取缩放因子";
其中, 上述缩放因子"获取模块具体包括:
第一获取单元, 用于根据源端和目标端的固定码书的平均能量, 确定缩放因子 "的客 观理想值 ;
第二获取单元, 用于根据第一获取单元获取的 ^, 确定缩放因子"的取值范围; 第三获取单元, 用于根据预设的选择规则, 从第二获取单元获取的取值范围中获取用 于进行测试的测试数值; 测试数值至少为一个;
第四获取单元, 用于根据预设的测试规则, 从第三获取单元获取的测试数值中获取到 缩放因子"。
其中, 上述第三获取单元具体用于根据预设的间隔, 对第二获取单元获取的取值范围 内的数值进行抽样, 获取用于进行测试的测试数值;
第四获取单元具体用于获取测试数值的合成语音的客观语音质量平均评分、 合成语音 的平均分段能量和原始语音的平均分段能量; 根据合成语音的客观语音质量平均评分、 合 成语音的平均分段能量与原始语音的平均分段能量, 从测试数值中获取缩放因子"。
由于不同的 CELP语音编码标准中对自适应码书增益 和固定码书增益的比例因子 γ 进行量化时会采用不同的量化方法, 如联合量化、 独立量化等, 相应地, 本发明实施例提 供了转码装置中的量化模块, 具体可以为:
(一) 当目标端对自适应码书增益 和固定码书增益的比例因子 进行联合量化时; 本发明实施例提供了转码装置还包括:
权重因子 获取模块, 用于根据自适应码书增益 和固定码书增益的比例因子 确 定权重因子 。
相应地,
量化模块具体为量化单元, 用于根据获取目标端的增益矢量码表, 对" X ^^P 进行 联合量化, 获取增益矢量码表中的量化码字, 实现增益参数的转码, 其中, 进行联合量化 时, 量化规则为:
E = arg min{ (ax ygc ~ gc)2 + {gp - gp k )2 }
o≤k≤m
(二),当目标端对自适应码书增益 和固定码书增益的比例因子 进行独立量化时; 量化模块具体为量化单元, 用于根据目标端固定码书比例因子码表和自适应码书增益 码表, 分别对 "X ^ P 进行量化, 获取量化比例因子码表中的量化固定码字和自适应码 书增益码表中的量化自适应码字, 实现增益参数的转码, 其中, 量化规则为:
— ) 2
Figure imgf000012_0001
E2 = arg mm(g - g P
0<A:9 <N 进一步地, 还可以根据转码的具休需要, 上述量化模块具休为绝对量化单元, 用于根 据目标端固定码书比例因子码表和自适应码书增益码表,分别对 和 进行绝对量化, 获取量化比例因子码表中的量化固定码字和自适应码书增益码表中的量化自适应码字, 实 现增益参数的转码, 其中, 绝对量化规则为:
E[ = S r> S P
Figure imgf000012_0002
为了减少增益参数转码部分的重新量化的操作, 进一步降低增益参数部分的计算复杂 度, 参见图 8, 本发明实施例提供的转码装置, 还可以包括:
映射码表生成模块, 用于根据缩放因子"和权重因子 , 对源端增益量化码表与目标 编码器中增益量化码表进行映射得到映射码表;
处理模块, 用于根据获取的源端码流中的当前子帧的自适应码书增益 和固定码书增 益的比例因子 查找映射码表, 实现转码。
其中, 映射码表生成模块具体包括:
第一处理单元, 根据源端编码器的增益索引, 对源端编码器的增益索引反量化处理; 第二处理单元, 用于根据缩放因子", 将第一处理单元反量化处理后得到的增益进行 缩放;
第三处理单元, 用于根据目标端的量化规则, 量化第二处理单元缩放后的增益; 第四处理单元, 用于获取第三处理单元量化后的增益索引值, 量化后的增益索引值形 成映射码表。
本领域技术人员还可以获知, 同理采用上述本实施例提供的引入映射码表的思想, 本 发明实施例提供的转码装置, 还可以包括:
映射码表生成模块, 用于根据缩放因子"和权重因子 ^, 以及目标端的量化规则, 对 源端编码器的码流和目标端编码器的码流进行映射, 得到映射码表;
处理模块, 用于获取源端的码流, 查找映射码表, 实现转码。
综上所述, 本发明实施例提供的转码装置, 通过引入缩放因子对固定码书增益比例因 子^ ^进行缩放后, 采用新的量化准则在目标编码器的增益码表中重新进行搜索, 完成增益 参数的转码, 从而有效地降低增益参数转码的计算复杂度, 提高转码语音的质量。
本发明实施例中的部分步骤, 可以利用软件实现, 相应的软件程序可以存储在可读取 的存储介质中, 如光盘或硬盘等。
以上所述仅为本发明的具体实施例, 并不用以限制本发明, 对于本技术领域的普通技 术人员来说, 凡在不脱离本发明原理的前提下, 所作的任何修改、 等同替换、 改进等, 均 应包含在本发明的保护范围之内。

Claims

权 利 要 求 书
1、 一种转码方法, 其特征在于, 所述方法包括:
获取源端码流中的当前子帧的自适应码书增益 和固定码书增益的比例因子 ^ 根据缩放冈子", 对所述 进行处理得到" x ?
根据目标端的量化规则, 对所述 和 进行量化。
2、 如权利要求 1所述的转码方法, 其特征在于, 所述根据缩放因子", 对所述 ^ ^进行 处理得到" X ? ^之前, 还包括: 获取缩放因子", 具体为:
根据所述源端和目标端的固定码书的平均能量, 确定缩放因子 "的客观理想值 ; 根据所述 , 确定所述缩放因子"的取值范围;
根据预设的选择规则, 从所述取值范围中获取用于进行测试的测试数值; 所述测试数 值至少为一个; 根据预设的测试规则, 从所述测试数值中获取缩放因子"。
3、 如权利要求 2所述的转码方法, 其特征在于, 所述预设的选择规则, 具体为: 根据预设的间隔, 对所述取值范围内的数值进行抽样。
4、 如权利要求 2或 3所述的转码方法, 其特征在于, 所述根据预设的测试规则, 从所 述测试数值中获取到缩放因子", 具体为:
获取所述测试数值的合成语音的客观语音质量平均评分、 合成语音的平均分段能量和 原始语音的平均分段能量;
根据所述合成语音的客观语音质量平均评分、 所述合成语音的平均分段能量与原始语 音的平均分段能量, 从所述测试数值中获取缩放因子"。
5、 如权利要求 1所述的转码方法, 其特征在于, 所述对所述" X ? ^和 进行量化, 具 体为:
获取权重因子 ^,根据所述权重因子 ^和所述目标端的增益矢量码表,对所述 "X^ P 进行联合量化, 获取所述增益矢量码表中的量化码字。
6、 如权利要求 1所述的转码方法, 其特征在于, 所述对所述" X ? ^和 进行量化, 具 体为:
根据所述目标端固定码书比例因子码表和自适应码书增益码表, 分别对所述" 和 进行量化, 获取所述量化比例因子码表中的量化固定码字和自适应码书增益码表中的量 化自适应码字。
7、如权利要求 6所述的转码方法,其特征在于,所述分别对所述" Χ^ Ρ 进行量化, 还可以为: 分别对所述 "X 和 进行绝对量化。
8、 如权利要求 5所述的转码方法, 其特征在于, 所述获取权重因子 ^, 具体为: 根据所述自适应码书增益 和固定码书增益的比例因子 确定所述权重因子 ^。
9、 如权利要求 5所述的转码方法, 其特征在于, 所述方法还包括:
根据缩放因子 "和权重因子 ^, 对所述源端增益量化码表与目标编码器中增益量化码 表进行映射得到映射码表;
获取源端码流中的当前子帧的自适应码书增益 和固定码书增益的比例因子 ^ ^,查找 所述映射码表。
10、 如权利要求 9所述转码方法, 其特征在于, 所述对所述源端增益量化码表与目标 编码器中增益量化码表进行映射得到映射码表, 具体为:
根据所述源端编码器的增益索引, 对所述源端编码器的增益索引反量化处理; 根据所述缩放因子", 将反量化处理后得到的增益进行缩放;
根据目标端的量化规则, 量化所述缩放后的增益;
获取量化后的增益索引值, 所述量化后的增益索引值形成映射码表。
11、 如权利要求 5所述的转码方法, 其特征在于, 所述方法还包括:
根据所述缩放因子"和权重因子 ^, 以及目标端的量化规则, 对所述源端编码器的码 流和目标端编码器的码流进行映射, 得到映射码表;
获取所述源端的码流, 查找所述映射码表。
12、 一种转码装置, 其特征在于, 所述装置包括:
获取模块, 用于获取源端码流中的当前子帧的自适应码书增益 和固定码书增益的比 例因子 ;
缩放模块, 用于根据缩放因子", 对所述获取模块获取到的 ^进行缩放处理, 得到 量化模块, 用于根据目标端的量化规则, 对所述 "X ?^ 和 进行量化。
13、 如权利要求 12所述的转码装置, 其特征在于, 所述装置还包括:
缩放因子"获取模块, 用于获取所述缩放因子"。
14、如权利要求 13所述的转码装置, 其特征在于, 所述缩放因子"获取模块具体包括: 第一获取单元,用于根据所述源端和目标端的固定码书的平均能量,确定缩放因子 "的 客观理想值 ;
第二获取单元, 用于根据所述第一获取单元获取的所述 , 确定所述缩放因子"的取 值范围; 第三获取单元, 用于根据预设的选择规则, 从所述第二获取单元获取的取值范围中获 取用于进行测试的测试数值; 所述测试数值至少为一个;
第四获取单元, 用于根据预设的测试规则, 从所述第三获取单元获取的所述测试数值 中获取到缩放因子"。
15、 如权利要求 14所述的转码装置, 其特征在于, 所述第三获取单元具体用于根据预 设的间隔, 对所述第二获取单元获取的取值范围内的数值进行抽样, 获取用于进行测试的 测试数值;
所述第四获取单元具体用于获取所述测试数值的合成语音的客观语音质量平均评分、 合成语音的平均分段能量和原始语音的平均分段能量; 根据所述合成语音的客观语音质量 平均评分、 所述合成语音的平均分段能量与原始语音的平均分段能量, 从所述测试数值中 获取缩放因子"。
16、 如权利要求 12所述的转码装置, 其特征在于, 当所述目标端对自适应码书增益 和固定码书增益的比例因子 ^ ^进行联合量化时;
所述装置还包括;
权重因子 获取模块, 用于根据所述自适应码书增益 和固定码书增益的比例因子 确定所述权重因子 ;
相应地, 所述量化模块具体为量化单元, 用于根据所述目标端的增益矢量码表和所述 权重因子 ^获取模块获取的 ^, 对所述 "X ?^和 进行联合量化, 获取所述增益矢量码表 中的量化码字。
17、 如权利要求 12所述的转码装置, 其特征在于, 当所述目标端对自适应码书增益 和固定码书增益的比例因子 γ 进行独立量化时;
所述量化模块具体为量化单元, 用于根据所述目标端固定码书比例因子码表和自适应 码书增益码表, 分别对所述" Χ ? ^和 进行量化, 获取所述量化比例因子码表中的量化固 定码字和自适应码书增益码表中的量化自适应码字。
18、如权利要求 17所述的转码装置, 其特征在于, 所述量化模块具体为绝对量化单元, 用于根据所述目标端固定码书比例因子码表和自适应码书增益码表, 分别对所述" χ 和 进行绝对量化, 获取所述量化比例因子码表中的量化固定码字和自适应码书增益码表中 的量化自适应码字。
19、 如权利要求 12所述的转码装置, 其特征在于, 所述装置还包括:
映射码表生成模块, 用于根据所述缩放因子"和权重因子 ^, 对所述源端增益量化码 表与目标编码器中增益量化码表进行映射得到映射码表; 处理模块, 用于根据获取的源端码流中的当前子帧的自适应码书增益 和固定码书增 益的比例因子 , 查找所述映射码表。
20、 如权利要求 19所述的转码装置, 其特征在于, 所述映射码表生成模块具体包括: 第一处理单元, 根据所述源端编码器的增益索引, 对所述源端编码器的增益索引反量 化处理;
第二处理单元, 用于根据所述缩放因子", 将所述第一处理单元反量化处理后得到的 增益进行缩放;
第三处理单元, 用于根据目标端的量化规则, 量化所述第二处理单元缩放后的增益; 第四处理单元, 用于获取第三处理单元量化后的增益索引值, 所述量化后的增益索引 值形成映射码表。
21、 如权利要求 16所述的转码装置, 其特征在于, 所述装置还包括:
映射码表生成模块, 用于根据所述缩放因子"和权重因子 ^, 以及目标端的量化规则 对所述源端编码器的码流和目标端编码器的码流进行映射, 得到映射码表;
处理模块, 用于获取所述源端的码流, 查找所述映射码表。
PCT/CN2009/071133 2008-04-30 2009-04-01 一种转码方法和装置 WO2009132544A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200810105691.6 2008-04-30
CN 200810105691 CN101572093B (zh) 2008-04-30 2008-04-30 一种转码方法和装置

Publications (1)

Publication Number Publication Date
WO2009132544A1 true WO2009132544A1 (zh) 2009-11-05

Family

ID=41231426

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2009/071133 WO2009132544A1 (zh) 2008-04-30 2009-04-01 一种转码方法和装置

Country Status (2)

Country Link
CN (1) CN101572093B (zh)
WO (1) WO2009132544A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377653A (zh) * 2012-04-20 2013-10-30 展讯通信(上海)有限公司 语音编码中代数码表的搜索方法及装置,语音编码方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8862465B2 (en) * 2010-09-17 2014-10-14 Qualcomm Incorporated Determining pitch cycle energy and scaling an excitation signal
CN102968997A (zh) * 2012-11-05 2013-03-13 深圳广晟信源技术有限公司 用于宽带语音解码中噪声增强后处理的方法及装置
CN103236262B (zh) * 2013-05-13 2015-08-26 大连理工大学 一种语音编码器码流的转码方法
CN103886859B (zh) * 2014-02-14 2016-08-17 河海大学常州校区 基于一对多码书映射的语音转换方法
CN111612324B (zh) * 2020-05-15 2021-02-19 深圳看齐信息有限公司 一种基于英语口语考试的多维度评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1701353A (zh) * 2002-01-08 2005-11-23 迪里辛姆网络控股有限公司 基于celp的语音代码之间的代码转换方案
CN1735927A (zh) * 2003-01-09 2006-02-15 达丽星网络有限公司 用于高质量语音编码转换的方法和装置
WO2006063618A1 (en) * 2004-12-15 2006-06-22 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for encoding mode changing of encoded data streams
CN101010729A (zh) * 2004-08-31 2007-08-01 皇家飞利浦电子股份有限公司 用于转码的方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1701353A (zh) * 2002-01-08 2005-11-23 迪里辛姆网络控股有限公司 基于celp的语音代码之间的代码转换方案
CN1735927A (zh) * 2003-01-09 2006-02-15 达丽星网络有限公司 用于高质量语音编码转换的方法和装置
CN101010729A (zh) * 2004-08-31 2007-08-01 皇家飞利浦电子股份有限公司 用于转码的方法和设备
WO2006063618A1 (en) * 2004-12-15 2006-06-22 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for encoding mode changing of encoded data streams

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377653A (zh) * 2012-04-20 2013-10-30 展讯通信(上海)有限公司 语音编码中代数码表的搜索方法及装置,语音编码方法
CN103377653B (zh) * 2012-04-20 2016-03-16 展讯通信(上海)有限公司 语音编码中代数码表的搜索方法及装置,语音编码方法

Also Published As

Publication number Publication date
CN101572093A (zh) 2009-11-04
CN101572093B (zh) 2012-04-25

Similar Documents

Publication Publication Date Title
US8255206B2 (en) Voice mixing method and multipoint conference server and program using the same method
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
CA2993004C (en) High-band target signal control
Andersen et al. iLBC-a linear predictive coder with robustness to packet losses
CN1225723C (zh) 噪声抑制系统和方法以及网络噪声抑制器
CA2378435C (en) Method for improving the coding efficiency of an audio signal
US20070299669A1 (en) Audio Encoding Apparatus, Audio Decoding Apparatus, Communication Apparatus and Audio Encoding Method
WO2009132544A1 (zh) 一种转码方法和装置
KR101081781B1 (ko) 대역폭 적응 양자화
KR20050091082A (ko) 향상된 품질의 음성 변환부호화를 위한 방법 및 장치
JP2004501391A (ja) 可変レート音声符号器におけるフレーム消去補償方法
KR20040028750A (ko) 음성 코덱의 선스펙트럼 주파수 벡터 양자화 방법 및 시스템
KR100935174B1 (ko) 고속 코드-벡터 탐색 장치 및 방법
JP5436576B2 (ja) 信号を符号化する方法および信号を復号する方法
TWI630602B (zh) 在頻寬轉換週期期間之信號再使用
KR20070070189A (ko) 음성 부호화 장치 및 음성 부호화 방법
US20050143984A1 (en) Multirate speech codecs
KR100434275B1 (ko) 패킷 변환 장치 및 그를 이용한 패킷 변환 방법
US8380495B2 (en) Transcoding method, transcoding device and communication apparatus used between discontinuous transmission
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
WO2008092719A1 (en) Audio quantization
AU6533799A (en) Method for transmitting data in wireless speech channels
EP1187337A1 (en) Speech coder, speech processor, and speech processing method
JP2007072264A (ja) 音声量子化方法、音声量子化装置、プログラム
Tsai et al. GSM to G. 729 speech transcoder

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09737654

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09737654

Country of ref document: EP

Kind code of ref document: A1