CN111312265B - 对线性预测编码系数进行量化的加权函数确定装置和方法 - Google Patents
对线性预测编码系数进行量化的加权函数确定装置和方法 Download PDFInfo
- Publication number
- CN111312265B CN111312265B CN202010115361.6A CN202010115361A CN111312265B CN 111312265 B CN111312265 B CN 111312265B CN 202010115361 A CN202010115361 A CN 202010115361A CN 111312265 B CN111312265 B CN 111312265B
- Authority
- CN
- China
- Prior art keywords
- coefficients
- subframe
- weighting function
- lsf
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000003595 spectral effect Effects 0.000 claims abstract description 70
- 238000005070 sampling Methods 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 8
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000010183 spectrum analysis Methods 0.000 abstract description 21
- 230000006870 function Effects 0.000 description 242
- 238000001228 spectrum Methods 0.000 description 49
- 238000013139 quantization Methods 0.000 description 33
- 230000005284 excitation Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
一种对线性预测编码系数进行量化的加权函数确定装置和方法,所述方法可包括以下步骤:从输入信号的线性预测编码(LPC)系数获得线谱频率(LSF)系数和导抗谱频率(ISF)系数中的任何一个;并且通过将基于频谱分析信息的第一加权函数和基于LSF系数或ISF系数的位置信息的第二加权函数组合来确定加权函数。
Description
本申请是向中国知识产权局提交的申请日为2015年1月15日的标题为“用于对线性预测编码系数进行量化的加权函数确定装置和方法”的第201580014478.2号申请的分案申请。
技术领域
一个或更多个示例性实施例涉及一种加权函数确定设备和方法以及使用所述加权函数确定设备和方法的量化设备和方法,其中,通过所述加权函数确定设备和方法,线性预测编码(LPC)系数的重要性可被更精确地反映以对LPC系数进行量化。
背景技术
在相关技术领域,线性预测编码已经被应用于对语音信号和音频信号进行编码。码激励线性预测(CELP)编码技术已经被用于线性预测。CELP编码技术可使用针对输入信号的激励信号和线性预测编码(LPC)系数。当对输入信号进行编码时,LPC系数可被量化。然而,LPC的量化可具有窄动态范围并在验证稳定性时具有困难。
此外,用于重建输入信号的码本索引可在解码阶段被选择。当所有的LPC系数以相同的重要性被量化时,最终合成的输入信号的质量会发生恶化。即,由于所有的LPC系数具有不同的重要性,当重要的LPC系数的误差很小时,输入信号的质量可被增强。但是,当在不考虑LPC系数具有不同的重要性的情况下通过应用相同的重要性执行量化时,输入信号的质量会恶化。
因此,需要一种可有效地量化LPC系数并可在当使用解码器重建输入信号时提高合成信号的质量的方法。此外,期望一种在相似的复杂度前提下具有杰出的编码性能的技术。
发明内容
技术问题
一个或更多个示例性实施例包括加权函数确定设备和方法以及使用所述加权函数确定设备和方法的量化设备和方法,其中,所述加权函数确定设备和方法更精确地反映LPC系数的重要性以对LPC系数进行量化。
技术方案
根据一个或更多个实施例,一种方法包括:从输入信号的线性预测编码(LPC)系数获得线谱频率(LSF)系数或导抗谱频率(ISF)系数;以及将基于频谱分析信息的第一加权函数和基于LSF系数或ISF系数的位置信息的第二加权函数组合以确定加权函数。
确定加权函数的步骤可包括对ISF系数或LSF系数进行归一化。
第一加权函数可通过将幅度加权函数和频率加权函数组合而被获得。
幅度加权函数可与输入信号的频谱包络相关,并可通过使用输入信号的频谱幅度被确定。
幅度加权函数可通过使用与ISF系数或LSF系数的频率相应的一个或更多个频谱段的大小被确定。
频率加权函数可通过使用输入信号的频率信息被确定。
频率加权函数可通过使用从输入信号的感知特征和共振峰分布选择的至少一个被确定。
第一加权函数可基于从带宽、编码模式和内部采样频率选择的至少一个被确定。
第二加权函数可通过使用相邻的ISF系数或LSF系数的位置信息被确定。
根据一个或更多个示例性实施例,一种方法包括:从输入信号的线性预测编码(LPC)获得线谱频率(LSF)系数或导抗谱频率(ISF)系数;将基于频谱分析信息的第一加权函数和基于LSF系数或ISF系数的位置信息的第二加权函数组合以确定加权函数;基于确定的加权函数对LSF系数或ISF系数进行量化。
确定加权函数的步骤可被同样地应用于帧尾子帧和中间子帧。
量化步骤包括在对帧尾子帧中LSF系数或ISF系数进行直接量化期间应用确定的加权函数。
量化步骤可包括:通过使用确定的加权函数对中间子帧的未量化的ISF系数或LSF系数进行加权;并且基于中间子帧的加权后的ISF系数或LSF系数,对权重参数进行量化,其中,权重参数用于计算前一帧的帧尾子帧的量化后的ISF系数或LSF系数和当前帧的帧尾子帧的量化后的ISF系数或LSF系数之间的加权平均。
中间子帧的权重参数可在码本中被搜索。
有益效果
根据示例性实施例,能够通过将LPC系数转换为ISF系数或LSF系数并借此对ISF系数或LSF系数进行量化来提高LPC系数的量化效率。
根据示例性实施例,能够通过确定与LPC系数的重要性相关的加权函数,基于LPC系数的重要性来提高合成信号的质量。
根据示例性实施例,能够通过对用于获得当前帧的量化后的LPC系数和前一帧的量化后的LPC系数之间的加权平均的权重参数进行量化而不是直接对中间子帧的LPC系数进行量化,使用较少的比特来提高合成信号的质量。
根据示例性实施例,能够通过将幅度加权函数、频率加权函数和基于LSF系数或ISF系数的位置信息的加权函数组合,提高LPC系数的量化效率,并精确地推导出LPC系数的权重。幅度加权函数指示出ISF或LSF显著地影响输入信号的频谱包络。频率加权函数可使用频域中的感知特征和共振峰分布。
附图说明
通过以下结合附图的对本示例性实施例的描述,这些和/或其他方面会变得明显并更容易理解,其中:
图1示出根据示例性实施例的音频信号编码设备的配置。
图2示出根据示例性实施例的线性预测编码(LPC)系数量化器的配置。
图3示出根据示例性实施例的对LPC系数进行量化的处理。
图4示出根据示例性实施例的通过图2的加权函数确定单元确定加权函数的处理。
图5示出根据示例性实施例的基于输入信号的编码模式和带宽信息来确定加权函数的处理。
图6示出根据示例性实施例的通过对LPC系数进行转换而获得的导抗谱频率(ISF)。
图7示出根据示例性实施例的基于编码模式的加权函数。
图8示出根据另一示例性实施例的通过图2的加权函数确定单元确定加权函数的处理。
图9是用于描述根据示例性实施例的中间子帧的LPC编码方案的示图。
图10是示出根据示例性实施例的加权函数确定设备的配置的框图。
图11是示出根据示例性实施例的图10的第一加权函数产生器的详细配置的框图。
图12是示出根据示例性实施例的通过使用输入信号的编码模式和带宽信息确定加权函数的操作的示图。
具体实施方式
现在将详细参照示例性实施例,其示例在附图中示出,其中,相同的标号始终表示相同的元件。在这点上,本示例性实施例可具有不同的形式并不应该被解释为限于这里陈述的描述。因此,下面仅通过参照附图描述这些示例性实施例,以说明本描述的各个方面。相同的标号始终表示相同的元件。
图1示出根据示例性实施例的音频信号编码设备100的配置。
参照图1,音频信号编码设备100可包括预处理单元101、频谱分析器102、线性预测编码(LPC)系数提取和开环音高分析单元103、编码模式选择器104、LPC系数量化器105、编码器106和错误恢复单元107和比特流产生器108。音频信号编码设备100可应用于语音信号或语音主导内容。此外,在一些低比特率的配置的情况下,音频信号编码设备100可应用于一般音频。
预处理单元101可对输入信号进行预处理。通过预处理,用于编码的输入信号的预处理可被完成。具体地,预处理单元101可通过高通滤波、预加重和采样转换对输入信号进行预处理。
频谱分析器102可通过时间到频率映射处理对在频域内的输入信号的特征进行分析。频谱分析器102可通过语音活动检测处理确定输入信号是有源信号还是静音。频谱分析器102可去除输入信号中的背景噪声。
LPC系数提取和开环音高分析单元103可通过对输入信号进行线性预测分析来提取LPC系数。LPC系数可指示频谱包络。一般来说,每帧执行一次线性预测分析,但是,为了另外增强音质,每帧可执行至少两次线性预测分析。在这种情况下,可执行一次针对帧尾的线性预测(即,现有线性预测分析),并且可额外执行剩余次数的针对中间子帧的线性预测以用于音质增强。当前帧的帧尾指示构成当前帧的子帧之中的最后子帧,前一帧的帧尾指示构成上一帧的子帧之中的最后子帧。
中间子帧是指在作为前一帧的帧尾的最后子帧和作为当前帧的帧尾的最后子帧之间的子帧之中存在的至少一个子帧。因此,LPC系数提取和开环音高分析单元103可提取总共至少两组LPC系数。
LPC系数提取和开环音高分析单元103可通过开环来分析输入信号的音高。分析后的音高信息可被用于搜索自适应的码本。
编码模式选择器104可基于音高信息、频域内的分析信息等选择输入信号的编码模式。作为示例性实施例,可基于编码模式对输入信号进行编码,其中,编码模式被分类成一般模式(generic mode)、有声模式(voiced mode)、无声模式(unvoiced mode)或过渡模式(transition mode)。作为另一个示例性实施例,不同的激励编码可被用于对有声或无声语音帧、音频帧、无效帧(inactive frame)进行编码。
LPC系数量化器105可对由LPC系数提取和开环音高分析单元103提取的LPC系数进行量化。还将参照图2到图12进一步描述LPC系数量化器105。
编码器106可基于选择的编码模式对LPC系数的激励信号进行编码。用于对LPC系数的激励信号进行编码的参数可包括自适应码本索引、自适应码本增益、固定码本索引、固定码本增益等。编码器106可以以子帧为单位对LPC系数的激励信号进行编码。
当在输入信号中存在错误帧或丢失帧时,错误恢复单元107可产生边信息以重建或隐藏错误帧或丢失帧以增强总体音质。
比特流产生器108可使用编码后的信号产生比特流。这里情况下,比特流可被用于存储或传输。
图2示出根据示例性实施例的LPC系统量化器的配置。
参照图2,包括两种操作的量化处理可被执行。一个操作涉及针对当前帧或前一帧的帧尾执行线性预测。另一操作涉及针对中间子帧执行线性预测以增强音质。
关于当前帧或前一帧的帧尾的LPC系数量化器200可包括第一系数转换器202、加权函数确定单元203、量化器204和第二系数转换器205。
第一系数转换器202可对通过对输入信号的当前帧或前一帧的帧尾执行线性预测分析而提取的LPC系数进行转换。例如,第一系数转换器202可将关于当前帧或前一帧的帧尾的LPC系数转换为具有线谱频率(LSF)系数和导抗谱频率(ISF)系数之一的格式。ISF系数或LSF系数指示可更容易地对LPC系数进行量化的格式。
加权函数确定单元203可基于从LPC系数转换的ISF系数或LSF系数,确定与关于当前帧的帧尾和前一帧的帧尾的LPC系数的重要性有关的加权函数。作为示例性实施例,加权函数确定单元203可确定幅度加权函数和频率加权函数。此外,加权函数确定单元203可基于LSF系数或ISF系数的位置信息确定加权函数。加权函数确定单元203可基于带宽、编码模式和频谱分析信息中的至少一个确定加权函数。
作为示例性实施例,加权函数确定单元203可推导针对每种编码模式的最佳加权函数。加权函数确定单元203可基于输入信号的带宽推导最佳加权函数。加权函数确定单元203可基于输入信号的频率分析信息推导最佳加权函数。频率分析信息可包括频谱倾斜信息。
针对中间子帧,用于确定与中间子帧的ISF系数或LSF系数相关的加权函数的加权函数确定单元207可以以与加权函数确定单元203同样的方式进行操作。
将参照图4和图8进一步地描述加权函数确定单元203的操作。
量化器204可使用关于从当前帧的帧尾的LPC系数或前一帧的帧尾的LPC系数转换的ISF系数或LSF系数的加权函数,对转换后的ISF系数或LSF系数进行量化。作为量化结果,可推导关于当前帧的帧尾或前一帧的帧尾的量化后的ISF系数或LSF系数的索引。
第二转换器205可将量化后的ISF系数或量化后的LSF系数转换成量化后的LPC系数。使用第二系数转换器205推导的量化后的LPC系数可不仅指示的频谱信息还指示反射系数,并因此,可使用固定的权重。
参照图2,关于中间子帧的LPC系数量化器201可包括第一系数转换器206、加权函数确定单元207和量化器208。
第一系数转换器206可将中间子帧的LPC系数转换为ISF系数或LSF系数之一。
加权函数确定单元207可确定与使用转换后的ISF系数或LSF系数的中间子帧的LPC系数的重要性有关的加权函数。加权函数确定单元207可以以与加权函数确定单元203相同的方式进行操作。
加权函数确定单元207可通过使用与从中间子帧的LPC系数获得的ISF系数或LSF系数的频率相应的频谱幅度,确定ISF系数或LSF系数的加权函数。具体地,加权函数确定单元207可通过使用与从LPC系数获得的ISF系数或LSF系数的频率及其相邻频率相应的频谱幅度,确定ISF系数或LSF系数的加权函数。加权函数确定单元207可基于与从LPC系数获得的ISF系数或LSF系数的频率及其相邻频率相应的频谱幅度的最大值、平均值或中间值来确定加权函数。
可参照图8解释确定中间子帧的加权函数的处理并且可以以与图4中示出的帧尾子帧相同的方式确定中间子帧的加权函数。
加权函数确定单元207可基于中间子帧的带宽、编码模式和频谱分析信息中的至少一个确定加权函数。频率分析信息可包括频谱倾斜信息。
加权函数确定单元207可通过将基于频谱幅度确定的幅度加权函数与频率加权函数组合来确定最终的加权函数。频率加权函数可指示与从中间子帧的LPC系数获得的ISF系数或LSF系数的频率相应的加权函数并可通过bark尺度表示。
量化器208可使用针对从中间子帧的LPC系数转换的ISF系数或LSF系数的加权函数,对转换后的ISF系数或LSF系数进行量化。作为量化结果,可推导关于中间子帧的量化后的ISF系数或LSF系数的索引。
第二转换器209可将量化后的ISF系数或量化后的LSF系数转换为量化后的LPC系数。使用第二系数转换器209推导的量化后的LPC系数可不仅指示频谱信息还指示反射系数,因此可使用固定的权重。
作为另一示例性实施例,用于获得在当前帧的量化后的LPC系数和前一帧的量化后的LPC系数之间的加权平均的权重参数可被量化,而不是直接对中间子帧的LPC系数进行量化。权重参数可与能够使中间子帧的量化误差最小化的索引相应。在这种情况下,不需要第二转换器209。
加权函数确定单元203和加权函数确定单元207两者还可基于ISF系数或LSF系数的位置信息(例如,ISF系数之间的间隔信息或LSF系数之间的间隔信息)确定加权函数,随后将与幅度加权函数和频率加权函数中的至少一个组合。将参照图10描述确定加权函数的处理。
在下文中,LPC系数和加权函数之间的关系将被进一步的描述。
当对时域中的语音信号和音频信号进行编码时可用的技术之一可包括线性预测技术。线性预测技术指示短期预测。线性预测结果可通过时域中相邻的采样之间的相关性表示,并可通过频域中的频谱包络表示。
线性预测技术可包括码激励线性预测(CELP)技术。使用CELP技术的语音编码技术可包括G.729、自适应多速率(AMR)、AMR宽带(WB)、增强型可变速率编码(EVRC)等。为了使用CELP技术对语音信号和音频信号进行编码,LPC系数和激励信号可被使用。
LPC系数可指示相邻采样点之间的互相关性,并可通过频谱峰值表示。当LPC系数具有16阶时,可推导16个采样点的最大值之间的相关性。LPC系数的阶数可基于输入信号的带宽被确定,并通常可基于语音信号的特征被确定。输入信号的主要发声可基于共振峰的幅度和位置被确定。为了表示输入信号的共振峰,可针对作为窄带的300Hz到3400Hz的输入信号使用阶数为10的LPC系数。可针对作为宽带的50Hz到700Hz的输入信号使用阶数为16到20的LPC系数。
合成滤波器H(z)可通过等式1表示。这里,aj表示LPC系数,p表示LPC系数的阶数。
等式1
通过解码器合成的合成信号可通过等式2表示。
等式2
LPC系数可表示被表示为谱峰的频谱的共振峰信息,并可被用于对总频谱的包络进行编码。在此情况下,编码设备可将LPC系数转换为ISF系数或LSF系数以增加LPC系数的效率。
ISF系数可通过简单的稳定性验证避免由于量化而发生的发散。当发生稳定性问题时,该稳定性问题可通过调整量化后的ISF系数的间隔而被解决。除了LSF系数的最后一个系数是不同于ISF系数的反射系数之外,LSF系数可与ISF系数具有相同的特征。ISF或LSF是从LPC转换的系数,并因此可保持与LPC系数的频谱相同的共振峰信息。
特别地,可在将LPC系数转换为导抗谱对(ISP)或线性谱对(LSP)后对LPC系数执行量化,其中,导抗谱对(ISP)或线性谱对(LSP)可具有窄动态范围,容易验证稳定性,并容易执行插值。ISP或LSP可通过ISF系数或LSF系数表示。ISF系数和ISP之间的关系或LSF系数和LSP之间的关系可通过等式3表示。
等式3
qi=cos(ωi)n=0,K,N-1
这里,qi表示LSP或ISP,并且ωi表示LSF系数或ISF系数。为了量化效率,LSF系数可被矢量量化。LSF系数可被预测矢量量化以提高量化效率。当执行矢量量化时,并当维度增加时,比特率可被提高,然而码本大小可能增加,这降低了处理速率。因此,码本大小可通过多级矢量量化或分裂矢量量化而减少。
矢量量化指示这样的处理:将矢量中的所有实体视为具有相同的重要性,并且使用平方误差距离测量选择具有最小误差的码本索引。然而,在LPC系数的情况下,所有系数具有不同的重要性,因此可通过减少重要系数的误差来增强最终合成的信号的感知质量。当对LSF系数进行量化时,解码设备可通过将表示每个LPC系数的重要性的加权函数应用到平方误差距离测量来选择最佳码本索引。因此,可提高合成信号的性能。
根据示例性实施例,可基于ISF系数或LSF系数的实质频谱幅度和频率信息,针对赋予频谱包络的每个ISF系数或LSF系数的实质性影响来确定幅度加权函数。此外,可通过将频率加权函数和幅度加权函数组合来获得额外的量化效率。频率加权函数基于频域中的感知特征和共振峰分布。此外,可通过将考虑ISF系数或LSF系数的间隔信息或位置信息的加权函数与频率加权函数和幅度加权函数组合来获得更高的量化效率。另外,由于使用了频域中的实际幅度,因此所有频率的包络信息可被很好地使用,并且每个ISF系数或LSF系数的权重可被精确地推导。
根据示例性实施例,当从LPC系数转换的ISF系数或LSF系数被矢量量化时,并当每个系数的重要性不同时,可确定指示在矢量中的相对重要的条目的加权函数。可通过分析期望被编码的帧的频谱,并通过确定可将相对较大的权重给予具有大能量的部分的权重函数,提高编码的精确度。大的频谱能量可表示时域中的相关性高。
图3示出根据示例性实施例的对LPC系数进行量化的处理。
图3示出对LPC系数进行量化的两种类型的处理。当输入信号的可变性较大时可应用图3中的A,并且当输入信号的可变性较小时可应用图3中的B。图3中的A和B可依据输入信号的特征被切换并从而可被应用。图3中的C示出了对中间子帧的LPC系数进行量化的处理。
LPC系数量化器301可使用标量量化(SQ)、矢量量化(VQ)、分裂矢量量化(SVQ)和多级矢量量化(MSVQ)对ISF系数进行量化,其中,标量量化(SQ)、矢量量化(VQ)、分裂矢量量化(SVQ)和多级矢量量化(MSVQ)也同样可应用于LSF系数。
预测器302可执行自动回归(AR)预测或移动平均(MA)预测。这里,预测阶表示大于或等于1的整数。
可由等式4给出用于通过图3的A的量化后的ISF系数搜索码本索引的误差函数。可由等式5给出用于通过图3的B的量化后的ISF系数搜索码本索引的误差函数。码本索引表示误差函数的最小值。
可由等式6表示通过在图3的C的国际电信联盟电信标准化部(ITU-T)G.718中使用的中间子帧的量化而推导出的误差函数。参照式6,可使用针对当前帧的帧尾量化的ISF值和针对前一帧的帧尾量化的ISF值,推导设置使针对中间子帧的量化误差的误差最小化的插值权重设置的索引。
等式4
等式5
等式6
这里,w(n)表示加权函数,z(n)表示从ISF(n)去除平均值的矢量,如图3所示。c(n)表示码本,p表示ISF系数的阶数,并在窄带中使用10阶,在宽带中使用16到20阶。
根据示例性实施例,编码设备可通过将使用从LPC系数转换的ISF系数或LSF系数的频率所对应的频谱幅度的幅度加权函数与使用输入信号的感知特征和共振峰分布的频率加权函数组合,确定最佳加权函数。
图4示出根据示例性实施例的通过图2的加权函数确定单元203确定加权函数的处理。
图4示出频谱分析器102的详细配置。频谱分析器102可包括频率映射器401和幅度计算器402。
频率映射器401可将帧尾子帧的LPC系数映射到频域信号。作为示例性实施例,频率映射器401可通过使用快速傅里叶变换(FFT)或修正离散余弦变换(MDCT)将帧尾子帧的LPC系数变换为频域信号,并确定帧尾子帧的LPC频谱信息。如果频率映射器401应用64点FFT而不是256点FFT,则可在非常低复杂度的情况下执行到频域的转换。频率映射器401可基于LPC频谱信息确定帧尾子帧的频谱幅度。
幅度计算器402可基于帧尾子帧的频谱幅度计算频率谱段的幅度。频率谱段的数量可被确定为与由加权函数确定单元207设定的范围相应的频率谱段的数量相同,以对ISF系数或LSF系数进行归一化。
由幅度计算器402推导的作为频谱分析信息的频率谱段的幅度可在加权函数确定单元207确定幅度加权函数时被使用。
加权函数确定单元203可将从帧尾子帧的LPC系数转换的ISF系数或LSF系数归一化。在这个处理期间,ISF系数的最后系数是反射系数,因此可应用同一权重。上述方案不被应用于LSF系数。在ISF的p阶,当前处理可应用于0到p-2的范围。为了采用频谱分析信息,加权函数确定单元203可使用与由幅度计算器402推导的频率谱段的数量相同的数量K执行归一化。
加权函数确定单元203可基于经由幅度计算器402传送的频谱分析信息,确定影响关于帧尾子帧的频谱包络的ISF系数或LSF系数的按幅度的加权函数W1(n)。例如,加权函数确定单元203可基于ISF系数或LSF系数的频率信息和输入信号的实际频谱幅度确定幅度加权函数。可针对从LPC系数转换的ISF系数或LSF系数确定幅度加权函数。
加权函数确定单元203可基于与ISF系数或LSF系数的每个频率对应的频率谱段的幅度,确定幅度加权函数。
加权函数确定单元203可基于与ISF系数或LSF系数的每个频率对应的频谱段的幅度确定幅度加权函数,并可确定与频谱段相邻的至少一个相邻频谱段的幅度。在此情况下,加权函数确定单元203可通过提取频谱段的代表值和至少一个相邻频谱段来确定与频谱包络有关的幅度加权函数。例如,代表值可以是与ISF系数或LSF系数的每个频率相应的频谱段和与该频谱段相邻的至少一个相邻频谱段的最大值、平均值或中间值。
例如,加权函数确定单元203可基于ISF系数或LSF系数的频率信息确定频率加权函数W2(n)。特别地,加权函数确定单元203可基于输入信号的感知特征和共振峰分布确定频率加权函数。加权函数确定单元207可通过bark尺度提取输入信号的感知特征。加权函数确定单元207可基于共振峰分布的第一共振峰确定频率加权函数。
作为一个示例,频率加权函数可在极低的频率以及高频中显示相对低的权重,并在低频的预定频带(例如,与第一共振峰相应的频带)中显示同样的权重。
加权函数确定单元203可通过将幅度加权函数和频率加权函数组合来确定基于FFT的加权函数。加权函数确定单元207可通过将幅度加权函数和频率加权函数相乘或相加来确定基于FFT的加权函数。
作为另一示例,加权函数确定单元207可基于输入信号的编码模式和带宽信息确定幅度加权函数和频率加权函数,将参照图5进行详细的描述。
图5示出根据示例性实施例的基于输入信号的编码模式和带宽信息确定加权函数的处理。
在操作S501,加权函数确定单元207可检查输入信号的带宽。在操作S502,加权函数确定单元207可确定输入信号的带宽是否与宽带对应。当输入信号的带宽与宽带不对应时,在操作S511,加权函数确定单元207可确定输入信号的带宽是否与窄带对应。当输入信号的带宽与窄带不对应时,加权函数确定单元207可不确定加权函数。相反地,当输入信号的带宽与窄带对应时,在操作S512,加权函数确定单元207可使用通过操作S503到S510的处理对相应的子块(例如基于带宽的中间子帧)进行处理。
当输入信号的带宽与宽带对应时,在操作S503,加权函数确定单元207可确认输入信号的编码模式。在操作S504,加权函数确定单元207可确定输入信号的编码模式是否是无声模式。当输入信号的编码模式是无声模式时,在操作S505,加权函数确定单元207可确定针对无声模式的幅度加权函数,在操作S506,加权函数确定单元207可确定针对无声模式的频率加权函数,并在操作S507,加权函数确定单元207可将幅度加权函数和频率加权函数组合。
相反地,当输入信号的编码模式不是无声模式时,在操作S508,加权函数确定单元207可确定针对有声模式的幅度加权函数,在操作S509,加权函数确定单元207可确定针对有声模式的频率加权函数,并在操作S510,加权函数确定单元207可将幅度加权函数和频率加权函数组合。当输入信号的编码模式是通用模式或过渡模式时,加权函数确定单元207可通过与有声模式相同的处理来确定加权函数。
例如,当输入信号是根据FFT方案转换的频率时,使用FFT系数的频谱幅度的幅度加权函数可根据等式7被确定。
等式7
其中,
wf(n)=10log(max(Ebin(f(n),Ebin(f(n)+1),Ebin(f(n)-1))),
n=0,KM-2,1≤f(n)≤126
wf(n)=10log(Ebin(f(n))),
f(n)=0或127
f(n)=isf(n)/50,0≤isf(n)≤6350,且0≤f(n)≤127
图6示出根据示例性实施例的通过对LPC系数进行转换而获得的ISF。
具体地,图6示出当输入信号根据FFT被转换到频域的频谱结果、从频谱推导的LPC系数以及从LPC系数转换的ISF系数。当通过将FFT应用到输入信号而获得256个采样点时,并当执行16阶线性预测时,可推导出16个LPC系数,其中,这16个LPC系数可被转换为16个ISF系数。
图7示出根据示例性实施例的基于编码模式的加权函数。
具体地,图7示出基于图5的编码模式确定的频率加权函数。曲线701显示了有声模式下的频率加权函数,曲线702显示了无声模式下的频率加权函数。
例如,曲线701可根据等式8被确定,并且曲线702可根据等式9被确定。等式8和等式9中的常数可基于输入信号的特征而改变。
等式8
W2(n)=1.0,f(n)=[6,20]
等式9
如果LSF系数的数量在16KHz的内部采样频率中扩展到160,则在等式8和等式9中,[21,127]和[6,127]可分别地被改变到[21,159]和[6,159]。
通过将幅度加权函数和频率加权函数组合而最终推导的加权函数可根据等式10被确定。
等式10
W(n)=W1(n)·W2(n)n=0,K,M-2
W(M-1)=1.0
图8示出根据另一示例性实施例的通过图2中的加权函数确定单元207确定加权函数的处理。
图8示出频谱分析器102的详细的配置。频谱分析器102可包括频率映射器801和幅度计算器802。
频率映射器801可将中间子帧的LPC系数映射到频域信号。例如,频率映射器801可使用FFT、MDCT等对中间子帧的LPC系数进行频率转换,并可确定关于中间子帧的LPC频谱信息。在此情况下,当频谱映射器801使用64点FFT而不是使用256点FFT时,可执行具有相当小的复杂性的频率转换。频率映射器801可基于LPC频谱信息确定中间子帧的频率谱幅度。
幅度计算器802可基于中间子帧的频率谱幅度来计算频率谱段的幅度。频率谱段的数量可被确定为与通过加权函数确定单元207设定的范围所对应的频率谱段的数量相同,以对ISF系数或LSF系数进行归一化。
通过幅度计算器802推导的作为频谱分析信息的频率谱段的幅度可在加权函数确定单元207确定幅度加权函数时被使用。
通过加权函数确定单元207确定加权函数的处理参照图5在上文被描述,并因此,这里将省略详细的描述。
图9示出根据示例性实施例的中间子帧的LPC编码方案。
CELP编码技术被用于线性预测,激励信号和LPC系数被用于对输入信号进行编码。当输入信号被编码时,LPC系数可被量化。然而,在对LPC系数进行量化的情况下,动态范围是宽的,难以检查量化的稳定性。因此,可通过将LPC系数转换为线谱频率(LSF)系数(或LSP)或导抗谱频率(ISF)系数对LPC系数进行编码,线谱频率(LSF)系数(或LSP)或导抗谱频率(ISF)系数具有窄动态范围,并允许容易地检查其稳定性。
在这种情况下,被转换为ISF系数或LSF系数的LPC系数被矢量量化以提高量化效率。在这样的处理中,当所有的LPC系数以同样的重要性被量化时,最终合成的输入信号的质量会恶化。即,所有的LPC系数的重要性不同,并因此,当重要的LPC系数的误差较小时,合成的输入信号的质量得到提高。当在不考虑LPC系数的重要性的情况下通过应用同样的重要性执行量化时,输入信号的质量必然恶化。因此,需要用于确定重要性的加权函数。
通常,使用5毫秒的子帧和20毫秒的子帧来配置通信语音编码器。使用包括四个5毫秒的子帧的20毫秒的帧来配置AMR和AMR-WB,其中,AMR和AMR-WB是全球移动通信系统(GSM)的语音编码器和第三代合作伙伴计划的语音编码器。
如图9所示,可针对第四子帧(帧尾)执行一次LPC系数的量化,其中,第四子帧是配置前一帧和当前帧的子帧之中的最后一帧。用于当前帧的第一子帧、第二子帧或第三子帧的LPC系数不直接被量化,替代地,指示与针对前一帧的帧尾和当前帧的帧尾的量化后的LPC系数的加权和或加权平均值有关的比率的索引可被发送。
图10是示出根据示例性实施例的加权函数确定设备的配置的框图。
图10的加权函数确定设备可包括频谱分析器1001、LP分析器1002、和加权函数确定器1010。加权函数确定器1010可包括第一加权函数产生器1003、第二加权函数产生器1004和组合器1005。每个元件可被集成到至少一个处理器中。
参照图10,频谱分析器1001可通过时间到频率的映射操作来分析输入信号在频域中的特征。这里,输入信号可以是处理后的信号,并且时间到频率的映射操作可通过使用快速傅里叶变换(FFT)被执行。然而,示例性的实施例不限于此。频谱分析器1001可提供频谱分析信息,例如,作为FFT结果获得的频谱幅度。这里,频谱幅度可具有线性尺度。详细地,频谱分析器1001可执行128点的FFT以产生频谱幅度。在这种情况下,频谱幅度的带宽可相当于0Hz到6400Hz的范围。当内部采样频率为16KHz时,频谱幅度的数量可扩大到160。在这种情况下,可省略6400Hz到8000Hz的范围的频谱幅度,并且省略的频谱幅度可通过输入频谱被产生。详细地,可通过使用与4800Hz到6400Hz的带宽相应的最后32个频谱幅度来代替省略的6400Hz到8000Hz范围的频谱幅度。例如,可使用最后32个频谱幅度的平均值。
LP分析器1002可对输入信号执行LP分析以产生LPC系数。LP分析器1002可从LPC系数产生ISF系数或LSF系数。
加权函数确定器1010可从基于针对ISF系数或LSF系数的频谱分析信息产生的第一加权函数Wf(n)和基于ISF系数或LSF系数产生的第二加权函数Ws(n),确定用于对LSF系数进行量化的最终的加权函数。例如,在频谱分析信息(即,频谱幅度)归一化为与ISF带或LSF带相匹配之后,可通过使用与每个LSF系数或ISF系数相应的频率的幅度确定第一加权函数。可基于关于相邻ISF系数之间的间隔或相邻LSF系数之间的间隔或者相邻ISF系数或相邻LSF系数的位置的信息,确定第二加权函数。
第一加权函数产生器1003可获得幅度加权函数和频率加权函数,并将幅度加权函数和频率加权函数组合以产生第一加权函数。可基于FFT获得第一加权函数,并随着频谱幅度变得更大,可分配更大的权重值。
第二加权函数产生器1004可从与每个ISF系数或LSF系数相邻的两个ISF系数或LSF系数产生与频谱灵敏度相关的第二加权函数。通常地,ISF系数或LSF系数被布置在Z域的单位圆上,并当相邻的ISF系数之间的间隔或相邻的LSF系数之间的间隔比其外围更窄时,ISF系数或LSF系数表现为频谱峰。因此,第二加权函数可基于相邻的LSF系数的位置,逼近LSF系数的频谱敏感度。即,可通过测量相邻的LSF系数彼此有多接近来预测LSF系数的密度,并且信号频谱可在存在密集的LSF系数的频率周围具有峰值,通过此,大的权重值可被分配。这里,可在确定第二加权函数中额外地使用LSF系数的各种参数,以增加频谱灵敏度的近似的精确度。
根据上述的描述,ISF系数之间的间隔或LSF系数之间的间隔与加权函数可成反比。各种示例性实施例可通过使用所述间隔和加权函数之间的关系被实施。例如,所述间隔可被表示为负数或可被标记为分母。作为另一示例,为了进一步强调计算出的权重值,加权函数的每个元素可与一个常数相乘或者每个元素的平方可被计算。作为另一示例,可通过对首先计算出的加权函数本身执行额外的算术运算(例如,乘方或3次方)进一步地表示二次计算出的加权函数。
通过使用ISF系数之间的间隔或LSF系数之间的间隔计算加权函数的示例如下。
例如,第二加权函数Ws(n)可通过下面的等式11被计算。
等式11
其中,di=lsfi+1-lsfi-1
这里,Isfi-1和Isfi+1的每一项表示与当前ISF系数Isfi相邻的LSF系数。
例如,第二加权函数Ws(n)可通过下面的等式12被计算。
等式12
这里,Isfn表示当前的LSF系数,Isfn-1和Isfn+1的每一项表示相邻的LSF系数,M是LP模型的阶数16。例如,LSP系数的跨度在0到π之间,并因此,第一权重值和最后权重值可基于Isf0=0和IsfM=π被计算。
组合器1005可将第一加权函数和第二加权函数组合以确定用于对LSF系数进行量化的最终加权函数。在这种情况下,组合方案的示例可包括各种方案,诸如,将加权函数相乘的方案,将加权函数与适当的比率相乘然后执行相加的方案,通过使用查找表将每个权重值与特定值相乘然后执行相加的方案。
图11是示出根据示例性实施例的图10的第一加权函数产生器1003的详细配置的框图。
图11的第一加权函数产生器1003可包括归一化单元1101、幅度加权函数产生单元1102、频率加权函数产生单元1103和组合单元1104。这里,为了方便描述,LSF系数将作为第一加权函数产生器1003的输入信号的示例被描述。
参照图11,归一化单元1101可将LSF系数归一化到0到K-1的范围内。LSF系数可具有0到π的范围。在内部采样频率为12.8KHz的情况下,K为128。在内部采样频率为16.4KHz的情况下,K为160。
幅度加权函数产生单元1102可基于频谱分析信息,产生针对归一化的LSF系数的幅度加权函数W1(n)。根据示例性实施例,可基于归一化的LSF系数的频谱幅度确定幅度加权函数。
详细地,可通过使用与归一化后的LSF系数的频率相应的频谱段的幅度和相应频谱段的左侧和右侧的幅度(例如,被布置在前一位置或后一位置的两个相邻频谱段的幅度),确定幅度加权函数。可基于下面的等式13,通过从三个频谱段的幅度提取最大值来确定与频谱包络相关联的幅度加权函数W1(n)。
等式13
这里,Min表示Wf(n)的极小值,Wf(n)被定义为10log(Emax(n))(其中,n=0,……,M-1)。这里,M为16,Emax(n)表示针对每个LSF系数的三个频谱段的幅度的最大值。
频率加权函数产生单元1103可基于频率信息,产生用于归一化后的LSF系数的频率加权函数W2(n)。根据示例性实施例,可通过使用利用输入带宽和编码模式选择的权重曲线来确定频率加权函数。权重曲线的示例如图7所示。可基于输入信号的感知特征(诸如bark尺度)或共振峰分布获得权重曲线。可如针对有声模式和无声模式的等式8和等式9所示来确定频率加权函数W2(n)。
组合单元1104可将幅度加权函数W1(n)和频率加权函数W2(n)组合以确定基于FFT的加权函数Wf(n)。可基于下面的等式14计算用于对针对帧尾的LSF系数进行量化的基于FFT的加权函数Wf(n)。
等式14
Wf(n)=W1(n)·W2(n),n=0,K,M-1
图12是示出根据示例性实施例的通过使用输入信号的编码模式和带宽信息确定加权函数的操作的示图。与图5相比,还增加了检查内部采样频率的操作S1213。
参照图12,在操作S1213,加权函数确定设备可检查内部采样频率并根据内部采样频率对通过频谱分析而获得的频谱分析信息进行调整,或者产生信号。在操作S1213,加权函数确定设备可根据用于编码的内部采样频率确定频谱段的数量。例如,可如下面的表1所示来确定基于内部采样频率的频谱段的数量。
表1
详细地,可根据用于频谱分析的输入信号的频带为12.8KHz还是16KHz或实际编码的频带为12.8kHz还是16kHz,改变在幅度加权函数和频率加权函数中的归一化后的ISF系数或LSF系数中将被参考的信号。根据表1,当用于频谱分析的输入信号的采样频率为16kHz时,不会发生问题。因此,在操作S1213,执行映射以与用于编码的内部采样频率相匹配。在这种情况下,为了方便计算,可从128和160之中选择频谱段的数量。
当用于频谱分析的输入信号的采样频率为12.8kHz并且用于编码的内部采样频率为16kHz时,在12.8kHZ到16kHz不存在将被参考的分析后的信号,并因此,可通过使用已经获得的频谱分析信息产生信号。为此,在操作S1213,基于用于编码的内部采样频率确定频谱段的数量。随后,产生与从12.8kHz到16kHz的频带相应的信号。在这种情况下,可通过使用获得的频谱分析信息获得省略部分的信号。例如,可通过使用关于已经获得的频谱分析信息的特定部分的统计信息获得省略部分的信号。统计信息的示例可包括平均值和中间值,并且特定部分的示例可以是0kHz到12.8kHz的频带的特定部分的K条频谱信息。详细地,与计算出的频谱幅度的最后部分相应的32个平均值可被用在12.8kHz到16kHz。
关于子帧的量化,根据示例性实施例,在帧尾子帧中,ISF系数或LSF系数可被直接地量化,并且加权函数可被应用。在中间子帧中,在不直接对ISF系数或LSF系数进行量化的情况下,用于获得前一帧和当前帧的帧尾子帧的量化后的ISF系数或LSF系数的加权平均值的权重参数可被量化。详细地,中间子帧的未量化的ISF系数或LSF系数可通过使用加权函数被加权,并且可基于中间子帧的加权后的ISF系数或LSF系数,从码本获得用于获得前一帧和当前帧的帧尾子帧的量化后的ISF系数或LSF系数的加权平均值的权重参数。可以以闭环方式搜索码本,并且与权重参数相应的索引可在码本中被搜索以使中间子帧的量化后的ISF系数或LSF系数与中间子帧的加权后的ISF系数或LSF系数之间的误差最小化。在中间子帧中,码本的索引被发送,因此与帧尾子帧相比,使用更少得多的比特数量。
根据示例性实施例的方法可如在计算机可读介质中的计算机可读编码被实现。计算机可读记录介质可包括程序指令、本地数据文件、本地数据结构或它们的组合。计算机可读记录介质可以是特定的示例性实施例或对那些计算机软件的普通技术人员是公知的。计算机可读记录介质的示例包括磁介质(诸如硬盘、软盘和磁带)、光学介质(诸如CD-ROM和DVD)、磁光介质(诸如光磁盘)和专门被配置为存储和执行程序指令硬件存储器(诸如ROM、RAM和闪存)。此外,计算机可读记录介质可以是传输指定程序指令、数据结构等等的信号的传输介质。程序指令的示例包括机器语言和高级语言,其中,机器语言可通过编译器产生,高级语言可通过计算机使用注释器等被执行。
应该被理解的是,这里描述的实施例应被认为是仅具有描述性的意义,并不是出于限制的目的。对每个示例性实施例内的特征或方面的描述应代表性地被认为可用于其他示例性实施例中的其它相似的特征或方面。虽然一个或多个示例性实施例已经参照图表被描述的,但是本领域的普通技术人员应该理解,在不脱离由权利要求限定的精神和范围的情况下,可对其进行形式和细节上的各种改变。
Claims (10)
1.一种在电子装置中对线性预测编码LPC系数进行编码的方法,所述方法包括:
从音频信号中的LPC系数获得线谱频率LSF系数;
基于与LSF系数的频率相应的一个或更多个频谱段的幅度来获得子帧的第一权重参数;
基于LSF系数的频率信息获得所述子帧的第二权重参数;
基于相邻LSF系数之间的间隔来获得所述子帧的与频谱敏感度相关联的第三权重参数;
将所述子帧的第一权重参数与所述子帧的第二权重参数进行组合;
将所述组合的结果与所述子帧的第三权重参数进行组合来确定所述子帧的权重参数;以及
基于所述子帧的权重参数对LSF系数进行编码。
2.如权利要求1所述的方法,还包括:对LSF系数进行归一化,其中,在获得第一权重参数的步骤和获得第二权重参数的步骤中,归一化的LSF系数被使用。
3.如权利要求1所述的方法,其中,第一权重参数与音频信号的频谱包络相关。
4.如权利要求1所述的方法,其中,所述子帧的第二权重参数是通过使用从音频信号的感知特征和共振峰分布中选择的至少一个而确定的。
5.如权利要求1所述的方法,其中,第二权重参数是基于从带宽、编码模式和内部采样频率中选择的至少一个而确定的。
6.如权利要求5所述的方法,其中,所述编码模式包括有声模式和无声模式。
7.如权利要求1所述的方法,其中,对LSF系数进行编码的步骤:
通过使用所述子帧的权重参数对中间子帧的未量化的LSF系数进行加权;以及
基于所述中间子帧的加权后的LSF系数对所述中间子帧的权重参数进行量化,其中,所述中间子帧的权重参数用于获得前一帧的帧尾子帧的量化后的LSF系数和当前帧的帧尾子帧的量化后的LSF系数之间的加权平均。
8.如权利要求7所述的方法,其中,在码本中搜索所述中间子帧的权重参数。
9.一种在编码装置中对线谱频率LSF系数进行量化的设备,所述设备包括:
至少一个处理器,被配置为:
从音频信号中的子帧的线性预测编码LPC系数获得LSF系数;
基于与LSF系数的频率相应的一个或更多个频谱段的幅度来获得所述子帧的第一权重参数;
基于LSF系数的频率信息获得所述子帧的第二权重参数;
基于相邻LSF系数之间的间隔来获得所述子帧的与频谱敏感度相关联的第三权重参数;
将所述子帧的第一权重参数与所述子帧的第二权重参数进行组合;
将所述组合的结果与所述子帧的第三权重参数进行组合来确定所述子帧的权重参数;以及
基于所述子帧的权重参数对LSF系数进行编码。
10.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质存储用于执行权利要求1的方法的程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010115361.6A CN111312265B (zh) | 2014-01-15 | 2015-01-15 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2014-0005318 | 2014-01-15 | ||
KR20140005318 | 2014-01-15 | ||
PCT/KR2015/000453 WO2015108358A1 (ko) | 2014-01-15 | 2015-01-15 | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 |
CN201580014478.2A CN106104682B (zh) | 2014-01-15 | 2015-01-15 | 用于对线性预测编码系数进行量化的加权函数确定装置和方法 |
CN202010115361.6A CN111312265B (zh) | 2014-01-15 | 2015-01-15 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580014478.2A Division CN106104682B (zh) | 2014-01-15 | 2015-01-15 | 用于对线性预测编码系数进行量化的加权函数确定装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111312265A CN111312265A (zh) | 2020-06-19 |
CN111312265B true CN111312265B (zh) | 2023-04-28 |
Family
ID=53543180
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010115578.7A Active CN111105807B (zh) | 2014-01-15 | 2015-01-15 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
CN202010115361.6A Active CN111312265B (zh) | 2014-01-15 | 2015-01-15 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
CN201580014478.2A Active CN106104682B (zh) | 2014-01-15 | 2015-01-15 | 用于对线性预测编码系数进行量化的加权函数确定装置和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010115578.7A Active CN111105807B (zh) | 2014-01-15 | 2015-01-15 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580014478.2A Active CN106104682B (zh) | 2014-01-15 | 2015-01-15 | 用于对线性预测编码系数进行量化的加权函数确定装置和方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US10074375B2 (zh) |
EP (3) | EP4095854B1 (zh) |
KR (2) | KR102357291B1 (zh) |
CN (3) | CN111105807B (zh) |
ES (1) | ES2952973T3 (zh) |
SG (1) | SG11201606512TA (zh) |
WO (1) | WO2015108358A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
WO2015108358A1 (ko) * | 2014-01-15 | 2015-07-23 | 삼성전자 주식회사 | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 |
US11955138B2 (en) * | 2019-03-15 | 2024-04-09 | Advanced Micro Devices, Inc. | Detecting voice regions in a non-stationary noisy environment |
EP3984026A1 (en) * | 2019-06-13 | 2022-04-20 | Telefonaktiebolaget LM Ericsson (publ) | Time reversed audio subframe error concealment |
KR20220117019A (ko) | 2021-02-16 | 2022-08-23 | 한국전자통신연구원 | 학습 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 그 학습 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기 |
KR20220151953A (ko) | 2021-05-07 | 2022-11-15 | 한국전자통신연구원 | 부가 정보를 이용한 오디오 신호의 부호화 및 복호화 방법과 그 방법을 수행하는 부호화기 및 복호화기 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060027117A (ko) * | 2004-09-22 | 2006-03-27 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN101770777A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种线性预测编码频带扩展方法、装置和编解码系统 |
CN103262161A (zh) * | 2010-10-18 | 2013-08-21 | 三星电子株式会社 | 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3308764B2 (ja) * | 1995-05-31 | 2002-07-29 | 日本電気株式会社 | 音声符号化装置 |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
DE69828119D1 (de) * | 1997-08-28 | 2005-01-20 | Texas Instruments Inc | Quantisierung der linearen Prädiktionskoeffizienten |
FR2774827B1 (fr) * | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
KR100910282B1 (ko) * | 2000-11-30 | 2009-08-03 | 파나소닉 주식회사 | Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치 |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
KR100579797B1 (ko) * | 2004-05-31 | 2006-05-12 | 에스케이 텔레콤주식회사 | 음성 코드북 구축 시스템 및 방법 |
DE602007012116D1 (de) * | 2006-08-15 | 2011-03-03 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
EP2538406B1 (en) * | 2006-11-10 | 2015-03-11 | Panasonic Intellectual Property Corporation of America | Method and apparatus for decoding parameters of a CELP encoded speech signal |
KR100788706B1 (ko) * | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
JP4999757B2 (ja) | 2008-03-31 | 2012-08-15 | 日本電信電話株式会社 | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
CN102067211B (zh) | 2009-03-11 | 2013-04-17 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
EP2315358A1 (en) * | 2009-10-09 | 2011-04-27 | Thomson Licensing | Method and device for arithmetic encoding or arithmetic decoding |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
KR101660843B1 (ko) | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
KR101501576B1 (ko) | 2010-10-20 | 2015-03-11 | 한국생명공학연구원 | Hif-1 활성을 저해하는 아릴옥시페녹시아세틸계 화합물, 이의 제조방법 및 이를 유효성분으로 함유하는 약학적 조성물 |
US8977544B2 (en) * | 2011-04-21 | 2015-03-10 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
CN103137135B (zh) * | 2013-01-22 | 2015-05-06 | 深圳广晟信源技术有限公司 | Lpc系数量化方法和装置及多编码核音频编码方法和设备 |
CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
WO2015108358A1 (ko) * | 2014-01-15 | 2015-07-23 | 삼성전자 주식회사 | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 |
-
2015
- 2015-01-15 WO PCT/KR2015/000453 patent/WO2015108358A1/ko active Application Filing
- 2015-01-15 EP EP22185558.8A patent/EP4095854B1/en active Active
- 2015-01-15 US US15/112,006 patent/US10074375B2/en active Active
- 2015-01-15 SG SG11201606512TA patent/SG11201606512TA/en unknown
- 2015-01-15 CN CN202010115578.7A patent/CN111105807B/zh active Active
- 2015-01-15 EP EP15737834.0A patent/EP3091536B1/en active Active
- 2015-01-15 EP EP19204786.8A patent/EP3621074B1/en active Active
- 2015-01-15 ES ES19204786T patent/ES2952973T3/es active Active
- 2015-01-15 CN CN202010115361.6A patent/CN111312265B/zh active Active
- 2015-01-15 CN CN201580014478.2A patent/CN106104682B/zh active Active
- 2015-01-15 KR KR1020150007651A patent/KR102357291B1/ko active IP Right Grant
-
2018
- 2018-09-10 US US16/126,369 patent/US10249308B2/en active Active
-
2022
- 2022-01-25 KR KR1020220011051A patent/KR102461280B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060027117A (ko) * | 2004-09-22 | 2006-03-27 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN101770777A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种线性预测编码频带扩展方法、装置和编解码系统 |
CN103262161A (zh) * | 2010-10-18 | 2013-08-21 | 三星电子株式会社 | 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法 |
Non-Patent Citations (5)
Title |
---|
Carlos R. Ferreira 等.Modified Interpolation of LSFs Based on Optimization of Distortion Measures .《TELECOMMUNICATIONS SYMPOSUIM,2006 INTERNATIONAL IEEE》.2006,第777-782页. * |
Hai Le Vu 等.A NEW GENERAL DISTANCE MEASURE FOR QUANTIZATION OF LSF AND THEIR TRANSFORMED COEFFICIENTS:.《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS》.1998,第45-48页. * |
Kuldip K 等.Efficient Vector Quantization of LPC Parameters at 24 BitsFrame.《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》.1993,第1卷(第1期),第3-14页. * |
周高洪 等.一种增强的 LPC 参数多级矢量量化技术.《电子技术应用》.2005,(第6期),第49-51页. * |
肖 东 等.混合激励线性预测语音编码标准中线谱频率量化的研究.《应用声学》.2012,第31卷(第2期),第109-117页. * |
Also Published As
Publication number | Publication date |
---|---|
EP4095854C0 (en) | 2024-08-07 |
EP3091536A4 (en) | 2017-05-31 |
EP4095854A1 (en) | 2022-11-30 |
EP3091536B1 (en) | 2019-12-11 |
US10249308B2 (en) | 2019-04-02 |
US10074375B2 (en) | 2018-09-11 |
KR20150085489A (ko) | 2015-07-23 |
CN106104682B (zh) | 2020-03-24 |
WO2015108358A1 (ko) | 2015-07-23 |
EP3621074B1 (en) | 2023-07-12 |
US20190019524A1 (en) | 2019-01-17 |
CN111105807B (zh) | 2023-09-15 |
CN111312265A (zh) | 2020-06-19 |
SG11201606512TA (en) | 2016-09-29 |
KR20220019246A (ko) | 2022-02-16 |
EP3621074C0 (en) | 2023-07-12 |
EP4095854B1 (en) | 2024-08-07 |
KR102461280B1 (ko) | 2022-11-01 |
CN111105807A (zh) | 2020-05-05 |
CN106104682A (zh) | 2016-11-09 |
EP3621074A1 (en) | 2020-03-11 |
US20160336018A1 (en) | 2016-11-17 |
KR102357291B1 (ko) | 2022-02-03 |
EP3091536A1 (en) | 2016-11-09 |
ES2952973T3 (es) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6571827B2 (ja) | 加重値関数決定方法 | |
KR102461280B1 (ko) | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 | |
KR102626320B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
KR101660843B1 (ko) | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 | |
KR101761820B1 (ko) | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 | |
KR101857799B1 (ko) | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 | |
KR101867596B1 (ko) | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 | |
KR20180052583A (ko) | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |