CN105825861B - 确定加权函数的设备和方法以及量化设备和方法 - Google Patents
确定加权函数的设备和方法以及量化设备和方法 Download PDFInfo
- Publication number
- CN105825861B CN105825861B CN201610304743.7A CN201610304743A CN105825861B CN 105825861 B CN105825861 B CN 105825861B CN 201610304743 A CN201610304743 A CN 201610304743A CN 105825861 B CN105825861 B CN 105825861B
- Authority
- CN
- China
- Prior art keywords
- weighting function
- coefficients
- frequency
- signal
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013139 quantization Methods 0.000 title claims abstract description 41
- 230000003595 spectral effect Effects 0.000 claims abstract description 105
- 238000001228 spectrum Methods 0.000 claims description 30
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 7
- 238000010183 spectrum analysis Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 194
- 238000004458 analytical method Methods 0.000 description 16
- 239000013598 vector Substances 0.000 description 16
- 230000005284 excitation Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提出一种用于确定加权函数的设备和方法以及量化设备和方法。加权函数确定设备可将输入信号的中间子帧的LPC系数转换为导抗谱频率(ISF)系数和线谱频率(LSF)系数之一,并可基于转换后的ISF系数或LSF系数确定与ISF系数或LSF系数的重要性相关联的加权函数。
Description
本申请是申请日为2011年10月18日,申请号为“201180061021.9”,标题为“确定用于线性预测编码(LPC)系数量化的具有低复杂度的加权函数的设备和方法”的发明专利申请的分案申请。
技术领域
实施例涉及一种确定用于线性预测编码(LPC)系数量化的加权函数的设备和方法,更具体地讲,涉及一种用于确定具有低复杂度的加权函数以提高线性预测技术中的LPC系数的量化效率的设备和方法。
背景技术
在传统技术中,线性预测编码已应用于对语音信号和音频信号进行编码。码激励线性预测(CELP)编码技术已用于线性预测。CELP编码技术可使用激励信号和关于输入信号的线性预测编码(LPC)系数。当对输入信号进行编码时,可对LPC系数进行量化。然而,LPC的量化会具有窄的动态范围并且会难以确认稳定性。
另外,可在编码中选择用于恢复输入信号的码本索引。当使用相同的重要性对所有LPC系数进行量化时,在最终产生的输入信号的质量中会发生恶化。也就是说,由于所有LPC系数具有不同的重要性,因此当重要的LPC系数的误差小时,输入信号的质量会提高。然而,当通过应用相同的重要性而不考虑具有不同的重要性的LPC系数来执行量化时,输入信号的质量会恶化。
因此,存在对这样的方法的需求:当使用解码器恢复输入信号时,可有效地对LPC系数进行量化并可提高合成信号的质量。另外,存在对这样的技术的需求:可以以类似的复杂度具有良好的编码性能。
发明内容
技术方案
根据一个或多个实施例的一方面,提供一种用于提高线性预测编码中的量化效率的编码设备,所述设备包括:第一转换器,用于将输入信号的中间子帧的线性预测编码(LPC)系数转换为线谱频率(LSF)系数和导抗谱频率(ISF)系数之一;加权函数确定单元,用于使用转换后的ISF系数或LSF系数确定与中间子帧的LPC系数的重要性相关联的加权函数;量化单元,用于使用确定的加权函数对转换后的ISF系数或LSF系数进行量化;第二系数转换器,用于使用至少一个处理器将量化的ISF系数或LSF系数转换为量化的LPC系数,其中,量化的LPC系数被输出到编码设备的编码器。
加权函数确定单元可基于与从LPC系数转换的ISF系数或LSF系数的频率对应的插值的频谱幅度,确定关于ISF系数或LSF系数的加权函数。
加权函数确定单元可基于与从LPC系数转换的ISF系数或LSF系数的频率对应的LPC频谱幅度,确定关于ISF系数或LSF系数的加权函数。
根据一个或多个实施例的一方面,提供一种用于提高线性预测编码中的量化效率的编码方法,所述方法包括:将输入信号的中间子帧的线性预测编码(LPC)系数转换为线谱频率(LSF)系数和导抗谱频率(ISF)系数之一;使用转换后的ISF系数或LSF系数确定与中间子帧的LPC系数的重要性相关联的加权函数;使用确定的加权函数对转换后的ISF系数或LSF系数进行量化;使用至少一个处理器将量化的ISF系数或LSF系数转换为量化的LPC系数,其中,将量化的LPC系数输出到编码器。
所述确定的步骤可包括:基于与从LPC系数转换的ISF系数或LSF系数的频率对应的插值的频谱幅度,确定关于ISF系数或LSF系数的加权函数。
所述确定的步骤可包括:基于与从LPC系数转换的ISF系数或LSF系数的频率对应的LPC频谱幅度,确定关于ISF系数或LSF系数的加权函数。
根据一个或多个实施例,可通过将LPC系数转换为ISF系数或LSF系数从而对LPC系数进行量化,来提高LPC系数的量化效率。
根据一个或多个实施例,可通过确定与LPC系数的重要性相关联的加权函数来基于LPC系数的重要性提高合成信号的质量。
根据一个或多个实施例,可通过对用于对当前帧的LPC系数和先前帧的LPC系数进行量化以便对中间子帧的LPC系数进行量化的加权函数进行插值,来提高输入信号的质量。
根据一个或多个实施例,可通过将按照幅度的加权函数和按照频率的加权函数结合来提高LPC系数的量化效率并准确地导出LPC系数的权重。按照幅度的加权函数指示ISF或LSF实质上影响输入信号的频谱包络。按照频率的加权函数可使用频域的感知特性和共振峰分布。
根据一个或多个实施例的一方面,提供一种用于提高线性预测编码中的量化效率的编码设备,所述设备包括:加权函数确定单元,用于使用与线性预测编码(LPC)系数对应的导抗谱频率(ISF)系数或线谱频率(LSF)系数来确定与输入信号的中间子帧的LPC系数的重要性相关联的加权函数;量化单元,使用确定的加权函数对转换的ISF系数或LSF系数进行量化;第二系数转换器,用于将量化的ISF系数或LSF系数转换为量化的LPC系数,其中,量化的LPC系数被输出到编码设备的编码器。
根据一个或多个实施例的一方面,提供一种用于提高线性预测编码中的量化效率的编码方法,所述方法包括:使用与线性预测编码(LPC)系数对应的导抗谱频率(ISF)系数或线谱频率(LSF)系数,确定与输入信号的中间子帧的LPC系数的重要性相关联的加权函数;使用确定的加权函数对ISF系数或LSF系数进行量化;将量化的ISF系数或LSF系数转换为量化的LPC系数,其中,将量化的LPC系数输出到编码器。
根据一个或多个实施例的另一方面,提供至少一个存储用于实现一个或多个实施例的方法的计算机可读指令的非暂时性计算机可读介质。
附图说明
从下面结合附图的实施例的描述,这些和/或其它方面将变得更加清楚并更容易理解,其中:
图1示出根据一个或多个实施例的音频信号编码设备的配置;
图2示出根据一个或多个实施例的线性预测编码(LPC)系数量化器的配置;
图3a、图3b和图3c示出根据一个或多个实施例的对LPC系数进行量化的处理;
图4示出根据一个或多个实施例的通过图2的加权函数确定单元确定加权函数的处理;
图5示出根据一个或多个实施例的基于输入信号的编码模式和带宽信息确定加权函数的处理;
图6示出根据一个或多个实施例的通过转换LPC系数而获得的导抗谱频率(ISF);
图7a和图7b示出根据一个或多个实施例的基于编码模式的加权函数;
图8示出根据其它一个或多个实施例的通过图2的加权函数确定单元确定加权函数的处理;
图9示出根据一个或多个实施例的中间子帧(mid-subframe)的LPC编码方案。
具体实施方式
现将详细参照实施例,实施例的示例在附图中示出,其中,相同的标号始终表示相同的元素。下面通过参照附图描述实施例以解释本公开。
图1示出根据一个或多个实施例的音频信号编码设备100的配置。
参照图1,音频信号编码设备100可包括预处理单元101、频谱分析器102、线性预测编码(LPC)系数提取和开环基音分析单元103、编码模式选择器104、LPC系数量化器105、编码器106、误差恢复单元107和比特流产生器108。音频信号编码设备100可应用于语音信号。
预处理单元101可对输入信号进行预处理。通过预处理,可完成用于编码的输入信号的准备。具体地讲,预处理单元101可通过高通滤波、预加重(pre-emphasis)和采样转换来对输入信号进行预处理。
频谱分析器102可通过时频映射处理分析关于输入信号的频域的特性。频谱分析器102可通过语音活动检测处理确定输入信号是活跃的信号还是静音。频谱分析器102可去除输入信号中的背景噪声。
LPC系数提取和开环基音分析单元103可通过输入信号的线性预测分析来提取LPC系数。一般来说,每一帧执行一次线性预测分析,然而,为了额外的语音增强可执行至少两次线性预测分析。在这种情况下,可执行一次对于帧尾的线性预测(即,现有线性预测分析),可额外地执行剩余次数的用于声音质量提高的对于中间子帧的线性预测。当前帧的帧尾指示构成当前帧的子帧中的最后一个子帧,先前帧的帧尾指示构成上一帧的多个子帧中的最后一个子帧。
中间子帧指示在作为先前帧的帧尾的最后一个子帧与作为当前帧的帧尾的最后一个子帧之间的子帧中存在的至少一个子帧。因此,LPC系数提取和开环基音分析单元103总共可提取至少两个集合的LPC系数。
LPC系数提取和开环基音分析单元103可通过开环对输入信号的基音进行分析。分析的基音信息可用于搜索自适应码本。
编码模式选择器104可基于基音信息、频域的分析信息等来选择输入信号的编码模式。例如,可基于被分类为通用模式、有声模式、无声模式或过渡模式的编码模式对输入信号进行编码。
LPC系数量化器105可对由LPC系数提取和开环基音分析单元103提取的LPC系数进行量化。将参照图2至图9进一步描述LPC系数量化器105。
编码器106可基于选择的编码模块对LPC系数的激励信号进行编码。用于对LPC系数的激励信号进行编码的参数可包括自适应码本索引、自适应码本增益、固定码本索引、固定码本增益等。编码器106可基于子帧单位对LPC系数的激励信号进行编码。
当在输入信号的帧中发生误差时,误差恢复单元107可通过恢复或隐藏输入信号的帧来提取用于总体声音质量提高的边信息。
比特流产生器108可使用编码的信号产生比特流。在本实例中,比特流可用于存储或传输。
图2示出根据一个或多个实施例的LPC系数量化器的配置。
参照图2,可执行包括两个操作的量化处理。一个操作涉及对于当前帧或先前帧的帧尾的线性预测的执行。另一操作涉及用于声音质量提高的对于中间子帧的线性预测的执行。
关于当前帧或先前帧的帧尾的LPC系数量化器200可包括第一系数转换器202、加权函数确定单元203、量化器204和第二系数转换器205。
第一系数转换器202可对通过执行输入信号的当前帧或先前帧的帧尾的线性预测分析而提取的LPC系数进行转换。例如,第一系数转换器202可将关于当前帧或先前帧的帧尾的LPC系数转换为线谱频率(LSF)系数和导抗谱频率(ISF)系数之一的格式。ISF系数或LSF系数指示可更容易地量化LPC系数的格式。
加权函数确定单元203可基于从LPC系数转换的ISF系数或LSF系数确定加权函数,其中,所述加权函数与关于当前帧的帧尾和先前帧的帧尾的LPC系数的重要性相关联。例如,加权函数确定单元203可确定按照幅度的加权函数和按照频率的加权函数。加权函数确定单元203可基于频带、编码模式和频谱分析信息中的至少一个确定加权函数。
例如,加权函数确定单元203可导出针对每个编码模式的最佳加权函数。加权函数确定单元203可基于输入信号的频带导出最佳加权函数。加权函数确定单元203可基于输入信号的频率分析信息导出最佳加权函数。频率分析信息可包括频谱倾斜信息。
可将使用加权函数确定单元203导出的用于对当前帧的帧尾的LPC系数进行量化的加权函数以及用于对先前帧的帧尾的LPC系数进行量化的加权函数传送到加权函数确定单元207,以便确定用于对中间子帧的LPC系数进行量化的加权函数。
将参照图4至图8进一步描述加权函数确定单元203的操作。
量化器204可使用关于从当前帧的帧尾的LPC系数或先前帧的帧尾的LPC系数转换的ISF系数或LSF系数的加权函数,对转换后的ISF系数或LSF系数进行量化。作为量化的结果,可导出关于当前帧的帧尾或先前帧的帧尾的量化的ISF系数或LSF系数的索引。
第二系数转换器205可将量化的ISF系数或量化的LSF系数转换为量化的LPC系数。使用第二系数转换器205导出的量化的LPC系数可不指示简单的频谱信息而指示反射系数(reflection coefficient),因此可使用固定的权值。
参照图2,针对中间子帧的LPC系数量化器201可包括第一系数转换器206、加权函数确定单元207、量化器208和第二系数转换器209。
第一系数转换器206可将中间子帧的LPC系数转换为ISF系数或LSF系数之一。
加权函数确定单元207可使用转换后的ISF系数或LSF系数确定与中间子帧的LPC系数的重要性相关联的加权函数。
例如,加权函数确定单元207可通过对当前帧的参数和先前帧的参数进行插值来确定用于对中间子帧的LPC系数进行量化的加权函数。具体地讲,加权函数确定单元207可通过对第一加权函数和第二加权函数进行插值来确定用于对中间子帧的LPC系数进行量化的加权函数,其中,第一加权函数用于对先前帧的帧尾的LPC系数进行量化,第二加权函数用于对当前帧的帧尾的LPC系数进行量化。
加权函数确定单元207可使用线性插值和非线性插值中的至少一个来执行插值。例如,加权函数确定单元207可执行以下方案之一:将线性插值和非线性插值两者应用于所有阶(order)的矢量的方案、将线性插值和非线性插值不同地应用于每个子矢量的方案以及根据每个LPC系数不同地应用线性插值和非线性插值的方案。
加权函数确定单元207可使用关于当前帧的帧尾的第一加权函数和关于先前结束的帧尾的第二加权函数两者执行插值,并还可通过分析用于导出加权函数的等式并通过采用构成元素的部分来执行插值。例如,使用插值,加权函数确定单元207可获得用于确定按照幅度的加权函数的频谱信息。
作为一示例,加权函数确定单元207可基于插值的频谱幅度确定关于ISF系数或LSF系数的加权函数,其中,所述插值的频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率对应。插值的频谱幅度可与通过对当前帧的帧尾的频谱幅度以及先前帧的帧尾的频谱幅度进行插值而获得的结果对应。具体地讲,加权函数确定单元207可基于频谱幅度确定关于ISF系数或LSF系数的加权函数,其中,所述频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。加权函数确定单元207可基于频谱幅度的最大值、平均值或中值确定加权函数,所述频率幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。
将参照图5描述使用插值的频谱幅度确定加权函数的处理。
作为另一示例,加权函数确定单元207可基于LPC频谱幅度确定关于ISF系数或LSF系数的加权函数,其中,LPC频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率对应。可基于作为从中间子帧的LPC系数转换的频率的LPC频谱确定LPC频谱幅度。具体地讲,加权函数确定单元207可基于频谱幅度确定关于ISF系数或LSF系数的加权函数,其中,所述频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。加权函数确定单元207可基于频谱幅度的最大值、平均值或中值确定加权函数,其中,所述频率幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。
将参照图8进一步描述使用LPC频谱幅度确定关于中间子帧的加权函数的处理。
加权函数确定单元207可基于中间子帧的频带、编码模式信息和频率分析信息中的至少一个确定加权函数。频率分析信息可包括频谱倾斜信息。
加权函数确定单元207可通过将基于LPC频谱幅度和插值的频谱幅度中的至少一个确定的按照幅度的加权函数和按照频率的加权函数结合,来确定最终的加权函数。按照频率的加权函数可以是与从中间子帧的LPC系数转换的ISF系数或LSF系数的频率对应的加权函数。可通过bark尺度(bark scale)表示按照频率的加权函数。
量化器208可使用关于从中间子帧的LPC系数转换的ISF系数或LSF系数的加权函数,来对转换后的ISF系数或LSF系数进行量化。作为量化的结果,可导出关于中间子帧的量化的ISF系数或LSF系数的索引。
第二系数转换器209可将量化的ISF系数或量化的LSF系数转换为量化的LPC系数。使用第二系数转换器209导出的量化的LPC系数可不指示简单的频谱信息而指示反射系数,因此可使用固定的权值。
在下文中,将进一步描述LPC系数和加权函数之间的关系。
在时域上对语音信号和音频信号进行编码时可用的技术之一可包括线性预测技术。线性预测技术指示短期预测。可通过时域中的邻近采样点之间的相关性来表示线性预测结果,并可通过频域中的频谱包络来表示线性预测结果。
线性预测技术可包括码激励线性预测(CELP)技术。使用CELP技术的语音编码技术可包括G.729、自适应多速率(AMR)、AMR-宽带(WB)、增强型可变速率编解码器(EVRC)等。为了使用CELP技术对语音信号和音频信号进行编码,可使用LPC系数和激励信号。
LPC系数可指示邻近采样点之间的相关性,并可通过谱峰来表示LPC系数。当LPC系数具有16阶时,可最多导出16个采样点之间的相关性。可基于输入信号的带宽确定LPC系数的阶,并且通常可基于语音信号的特性确定LPC系数。可基于共振峰的幅度和位置确定输入信号的主要发声。为了表示输入信号的共振峰,可针对作为窄带的300Hz到3400Hz的输入信号使用10阶的LPC系数。可针对作为宽带的50Hz至7000Hz的输入信号使用16阶至20阶的LPC系数。
可由等式1来表示合成滤波器H(z)。
[等式1]
其中,aj表示LPC系数,p表示LPC系数的阶。
可由等式2来表示由解码器合成的合成信号。
[等式2]
LPC系数可表示被表示为谱峰的频谱的共振峰信息,并可用于对总频谱的包络进行编码。在此实例中,编码设备可将LPC系数转换为ISF系数或LSF系数,以便提高LPC系数的效率。
ISF系数可通过简单的稳定性确认来避免由量化引起的发散。当发生稳定性问题时,可通过调整量化的ISF系数的间隔来解决稳定性问题。LSF系数可具有与ISF系数相同的特性,LSF系数的最后一个系数是反射系数,与ISF系数不同。ISF或LSF是从LPC系数转换的系数,因此,可保持LPC系数的频谱的共振峰信息相同。
具体地讲,可在将LPC系数转换为导抗谱对(ISP)或线谱对(LSP)之后,执行LPC系数的量化,其中,ISP或LSP可具有窄动态范围,容易地确认稳定性,并容易地执行插值。可通过ISF系数或LSF系数来表示ISP或LSP。可通过等式3来表示ISF系数和ISP之间的关系或LSF系数和LSP之间的关系。
[等式3]
qi=cos(ωi)n=0,...,N-1
其中,qi表示LSP或ISP,ωi表示LSF系数或ISF系数。LSF系数可以是为量化效率而量化的矢量。LSF系数可以是为提高量效率而量化的预测矢量。当执行矢量量化时,并且当维数增加时,比特率会提高而码本大小会增加,从而降低处理速率。因此,可通过多级矢量量化或分裂式矢量量化减小码本大小。
矢量量化指示这样的处理:将矢量内的所有项看作具有相同的重要性的处理,并使用方差距离测量来选择具有最小误差的码本索引。然而,在LPC系数的情况下,所有系数具有不同的重要性,因此可通过减小重要系数的误差来提高最终的合成信号的感知质量。当对LSF系数进行量化时,解码设备可通过将表示每个LPC系数的重要性的加权函数应用于方差距离测量,来选择最佳码本索引。因此,可提高合成信号的性能。
根据一个或多个实施例,可基于ISF系数或LSF系数的实质频谱幅度和频率信息,针对对于频谱包络的每个ISF系数或lSF系数的实质影响确定按照幅度的加权函数。另外,可通过将按照频率的加权函数和按照幅度的加权函数结合来获得额外的量化效率。按照频率的加权函数基于共振峰分布和频域的感知特性。此外,由于使用实质频域幅度,因此可良好地使用所有频率的包络信息,并可准确地导出每个ISF系数或LSF系数的权值。
根据一个或多个实施例,当从LPC系数转换的ISF系数或LSF系数被矢量量化时,并且当每个系数的重要性不同时,可确定指示矢量内的相对重要项的加权函数。通过分析期望被编码的帧的频谱,并通过确定可将相对大的权重给予具有大的能量的部分的加权函数,可提高编码的准确性。大的频谱能量指示时域中的相关性高。
图3a、图3b和图3c示出根据一个或多个实施例的对LPC系数进行量化的处理。
图3a、图3b和图3c示出对LPC系数进行量化的两种类型的处理。当输入信号的可变性小时,图3a是可应用的。根据输入信号的特性,图3a和图3b可被切换,从而图3a和图3b是可应用的。图3示出对中间子帧的LPC系数进行量化的处理。
LPC系数量化器301可使用标量量化(SQ)、矢量量化(VQ)、分裂式矢量量化(SVQ)和多级矢量量化(MSVQ)对ISF系数进行量化,其中,它们同样可应用于LSF系数。
预测器302可执行自回归(AR)预测或移动平均(MA)预测。这里,预测阶表示大于或等于“1”的整数。
可通过等式4提供用于通过图3a的量化的ISF系数搜索码本索引的误差函数。可通过等式5表示用于通过图3b的量化的ISF系数搜索码本索引的误差函数。码本索引表示误差函数的最小值。
可通过等式6表示图3c的通过中间子帧的量化导出的在国际电信联盟电信标准化部(ITU-T)G.718中使用的误差函数。参照等式6,可使用ISF值和ISF值导出用于最小化关于中间子帧的量化误差的插值权重集的索引,其中,针对当前帧的帧尾对ISF值进行量化,针对先前帧的帧尾对ISF值进行量化。
[等式4]
[等式5]
[等式6]
这里,w(n)表示加权函数,z(n)表示从ISF(n)去除平均值的矢量,c(n)表示码本,p表示ISF系数的阶,并且在窄带中使用10,在宽带中使用16至20。
根据一个或多个实施例,编码设备可通过将按照幅度的加权函数和按照频率的加权函数结合来确定最佳加权函数,其中,按照幅度的加权函数使用与从LPC系数转换的ISF系数或LSF系数的频率对应的频谱幅度,按照频率的加权函数使用输入信号的感知特性和共振峰分布。
图4示出根据一个或多个实施例的通过图2的加权函数确定单元207确定加权函数的处理。
图4示出频谱分析器102的详细配置。频谱分析器102可包括插值器401和幅度计算器402。
插值器401可通过对作为频谱分析器102的执行结果的关于当前帧的帧尾的频谱幅度以及关于先前帧的帧尾的频谱幅度进行插值,来导出中间子帧的插值的频谱幅度。可通过线性插值或非线性插值导出中间子帧的插值的频谱幅度。
幅度计算器402可基于中间子帧的插值的频谱幅度计算频谱点(bin)的幅度。频谱点的数量可被确定为与和由加权函数确定单元207设置以便对ISF系数或LSF系数进行归一化的范围对应的频谱点的数量相同。
当加权函数确定单元207确定按照幅度的加权函数时,可使用作为由幅度计算器402导出的频谱分析信息的频谱点的幅度。
加权函数确定单元207可对从中间子帧的LPC系数转换的ISF系数或LSF系数进行归一化。在该处理期间,ISF系数的最后一个系数是反射系数,因此相同的权值可被应用。以上方案可不应用于LSF系数。在p阶ISF中,本处理可应用于0至p-2的范围。为了采用频谱分析信息,加权函数确定单元207可使用与由幅度计算器402导出的频谱点的数量相同的数量K来执行归一化。
加权函数确定单元207可基于经由幅度计算器402传输的频谱分析信息,确定影响关于中间子帧的频谱包络的ISF系数或LSF系数的按照幅度的加权函数W1(n)。例如,加权函数确定单元207可基于ISF系数或LSF系数的频率信息和输入信号的实际频谱幅度,确定按照幅度的加权函数。可针对从LPC系数转换的ISF系数或LSF系数确定按照幅度的加权函数。
加权函数确定单元207可基于与ISF系数或LSF系数中的每个频率对应的频谱点的幅度,确定按照幅度的加权函数。
加权函数确定单元207可基于与ISF系数或LSF系数的每个频率对应的频谱点的幅度以及与该频谱区邻近的至少一个邻近频谱点的幅度,确定按照幅度的加权函数。在本实例中,加权函数确定单元207可通过提取频谱点和至少一个邻近频谱点的代表值来确定与频谱包络相关联的按照幅度的加权函数。例如,代表值可以是与ISF系数或lSF系数的每个频率对应的频谱点以及与该频谱点邻近的至少一个邻近频谱点的最大值、平均值或中值。
例如,加权函数确定单元207可基于ISF系数或LSF系数的频率信息确定按照频率的加权函数W2(n)。具体地讲,加权函数确定单元207可基于输入信号的感知特性和共振峰分布确定按照频率的加权函数。加权函数确定单元207可按照bark尺度提取输入信号的感知特性。加权函数确定单元207可基于共振峰分布的第一共振峰确定按照频率的加权函数。
作为一个示例,按照频率的加权函数可在极低频率和较高频率中示出相对低的权重,并在低频率的预定频带(例如,与第一共振峰对应的频带)中示出相同的权重。
加权函数确定单元207可通过将按照幅度的加权函数和按照频率的加权函数进行组合来确定最终的加权函数。加权函数确定单元207可通过将按照幅度的加权函数和按照频率的加权函数相乘或相加来确定最终的加权函数。
作为另一示例,加权函数确定单元207可基于输入信号的编码模式和频带信息确定按照幅度的加权函数和按照频率的加权函数,这将参照图5进一步描述。
图5示出根据一个或多个实施例的基于输入信号的编码模式和带宽信息确定加权函数的处理。
在操作501,加权函数确定单元207可确认输入信号的带宽。在操作502,加权函数确定单元207可确定输入信号的带宽是否与宽带对应。当输入信号的带宽不与宽带对应时,在操作511,加权函数确定单元207可确定输入信号的带宽是否与窄带对应。当输入信号的带宽不与窄带对应时,加权函数确定单元207可不确定加权函数。相反,当输入信号的带宽与窄带对应时,在操作512,加权函数确定单元207可使用通过操作503至510的处理来基于带宽处理相应的子块(例如,中间子帧)。
当输入信号的带宽与宽带对应时,在操作503,加权函数确定单元207可确认输入信号的编码模式。在操作504,加权函数确定单元207可确定输入信号的编码模式是否是无声模式。当输入信号的编码模式是无声模式时,在操作505,加权函数确定单元207可确定关于无声模式的按照幅度的加权函数,在操作506,加权函数确定单元207可确定关于无声模式的按照频率的加权函数,并在操作507,加权函数确定单元207可将按照幅度的加权函数和按照频率的加权函数结合。
相反,当输入信号的编码模式不是无声模式时,在操作508,加权函数确定单元207可确定关于有声模式的按照幅度的加权函数,在操作509,加权函数确定单元207可确定关于有声模式的按照频率的加权函数,在操作510,加权函数确定单元207可将按照幅度的加权函数和按照频率的加权函数结合。当输入信号的编码模式是一般模式或过渡模式时,加权函数确定单元207可通过与有声模式相同的处理来确定加权函数。
例如,当输入信号是根据快速傅里叶变换(FFT)方案转换的频率时,可根据等式7确定使用FFT系数的频谱幅度的按照频率的加权函数。
[等式7]
其中,
当n=0,...,M-2,1≤norm_isf(n)≤126时,
Wj(n)=10log(max(Ebin(norm_isf(n)),Ebin(norm_isf(n)+1),Ebin(norm_isf(n)-1)))
当norm_isf(n)=0或127时,
Wf(n)=10log(Ebin(norm_isf(n)))
norm_isf(n)=isf(n)/50,随后,0≤isf(n)≤6350且0≤norm_isf(n)≤127
图6示出根据一个或多个实施例的通过转换LPC系数而获得的ISF。
具体地讲,图6示出在输入信号根据FFT被转换到频域时的频谱结果、从频谱导出的LPC系数以及从LPC系数转换的ISF系数。当通过将FFT应用到输入信号而获得256个采样点时,并且当执行16阶线性预测时,可导出16个LPC系数,可将16个LPC系数转换为16个ISF系数。
图7a和图7b示出根据一个或多个实施例的基于编码模式的加权函数。
具体地讲,图7a和图7b示出基于图5的编码模式确定的按照频率的加权函数。图7a示出显示有声模式下的按照频率的加权函数的曲线图701,图7b示出显示无声模式下的按照频率的加权函数的曲线图702。
例如,可根据等式8确定曲线图701,并可根据等式9确定曲线图702。等式8和等式9中的常数可基于输入信号的特性而改变。
[等式8]
当norm_isf(n)=[6,20]时,W2(n)=1.0
[等式9]
可根据等式10确定通过将按照幅度的加权函数和按照频率的加权函数结合而最终导出的加权函数。
[等式10]
当n=0,...,M-2时,W(n)=W1(n)·W2(n)
W(M-1)=1.0
图8示出根据一个或多个实施例的通过图2的加权函数确定单元102确定加权函数的处理。
图8示出频谱分析器102的详细配置。频谱分析器102可包括频率映射器801和幅度计算器802。
频率映射器801可将中间子帧的LPC系数映射到频域信号。例如,频率映射器801可使用FFT、改进的离散余弦变换(MDST)等来对中间子帧的LPC系数进行频率变换,并可确定关于中间子帧的LPC频谱信息。在本实例中,当频率映射器801使用64点FFT而不是256点FFT时,可以以很小的复杂度执行频率变换。频率映射器801可使用LPC频谱信息确定中间子帧的频谱幅度。
幅度计算器802可基于中间子帧的频谱幅度计算频谱点的幅度。频谱点的数量可被确定为和与由加权函数确定单元207设置以对ISF系数或LSF系数进行归一化的范围对应的频谱点的数量相同。
当加权函数确定单元207确定按照幅度的加权函数时,可使用作为由幅度计算器802导出的频谱分析信息的频谱点的幅度。
以上参照图5描述了通过加权函数确定单元207确定加权函数的处理,因此在此将省略进一步的详细描述。
图9示出根据一个或多个实施例的中间子帧的LPC编码方案。
CELP编码技术可使用关于输入信号的LPC系数以及激励信号。当输入信号被编码时,LPC系数可被量化。然而,在对LPC系数进行量化的情况下,动态范围可以是宽的,并且不可容易地确认稳定性。因此,可将LPC系数转换为动态范围是窄的且可容易地确认稳定性的LSF(或LSP)系数或ISF(或ISP)系数。
在本实例中,转换为ISF系数或LSF系数的LPC系数为了量化的效率可被矢量量化。当在以上处理期间通过针对所有LPC系数应用相同的重要性来执行量化时,最终合成的输入信号的质量会发生恶化。具体地讲,由于所有的LPC系数具有不同的重要性,因此,当重要的LPC系数的误差小时,可提高最终合成的输入信号的质量。当通过应用相同的重要性而不使用对应的LPC系数的重要性执行量化时,输入信号的质量会恶化。加权函数可用于确定重要性。
一般来说,用于通信的语音编码器可包括5ms的子帧和20ms的帧。作为全球移动通信系统(GSM)和第三代合伙伙伴项目(3GPP)的语音编码器的AMR和AMR-WB可包括由四个5ms的子帧构成的20ms的帧。
如在图9中所示,可基于每个作为构成先前帧和当前帧的子帧中的最后一个帧的第四子帧(帧尾)执行一次LPC系数量化。可通过对关于先前帧的帧尾和当前帧的帧尾的量化的LPC系数进行插值,来确定当前帧的第一子帧、第二子帧和第三子帧的LPC系数。
根据一个或多个实施例,可为了声音质量提高,对通过在第二子帧中执行线性预测分析而导出的LPC系数进行编码。加权函数确定单元207可使用关于先前帧的帧尾的LPC系数和关于当前帧的帧尾的LPC系数,针对作为中间子帧的当前帧的第二帧使用闭环搜索最佳插值权重。可导出并发送使关于16阶LPC系数的加权失真最小化的码本索引。
关于16阶LPC系数的加权函数可用于计算加权失真。可通过等式11表示将使用的加权函数。根据等式11,通过分析ISF系数之间的间隔,可将相对大的权重应用于ISF系数之间具有窄间隔的部分。
[等式11]
dj=fi+1-fi-1
如等式12所示,可额外应用低频加重(emphasis)。低频加重与包括线性函数的等式对应。
[等式12]
wmid(15)=2.0
根据一个或多个实施例,由于仅使用ISF系数或LSF系数之间的间隔导出加权函数,因此由于方案很简单使得复杂度较低。一般来说,在ISF系数之间的间隔窄的部分中频谱能量会高,因此对应分量是重要的概率会高。然而,当实质上执行频谱分析时,以上结果没有准确匹配的情况会频繁发生。
因此,提出了一种以类似的复杂度具有良好的性能的量化技术。第一个提出的方案可以是对先前帧信息和当前帧信息进行插值和量化的技术。第二个提出的方案可以是确定用于基于频谱信息对LPC系数进行量化的最佳加权函数的技术。
上述实施例可被记录在包括计算机可读指令(诸如,计算机程序)的非暂时性计算机可读介质,用于通过执行计算机可读指令来实现各种操作以控制作为通用计算机、计算装置、计算机系统或网络的部件的一个或多个处理器。所述介质还可在其上记录有单独的计算机可读指令、数据文件、数据结构等或它们的组合。记录在介质上的计算机可读指令可以是为实施例的目的而专门设计和构造的,或者它们可以是计算机软件领域的技术人员熟知和可用的。计算机可读介质还可被实现在至少一个专用集成电路(ASIC)或现场可编程门阵列(FPGA)中,ASIC和FPGA执行(像处理器一样处理)计算机可读指令。非暂时性计算机可读介质的示例包括:磁介质(诸如,硬盘、软盘和磁带);光介质(诸如,CD ROM盘和DVD);磁光介质(诸如,光盘);专门配置为存储和执行计算机指令的硬件装置(诸如,只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。计算机可读指令的示例包括机器代码(诸如,由编译器产生的)和包含可由计算机使用解释器执行的高级代码的文件两者。所述硬件装置可被配置为用作一个或多个软件模块,以便执行上述实施例的操作,反之亦然。所述介质的另一示例还可以是分布式网络,从而,计算机可读指令以分布的方式被存储和执行。
虽然已示出和描述了所述,但本领域的技术人员将理解,在不脱离本公开的原理和精神的情况下,可在这些实施例中进行改变,本公开的范围由权利要求及其等同物限定。
Claims (15)
1.一种量化设备,包括:
系数转换单元,被配置为从信号的线性预测编码LPC系数获得线谱频率LSF系数或导抗谱频率ISF系数,其中,所述信号包括语音信号和音频信号中的至少一个;
频谱分析单元,被配置为将所述信号转换为频谱,并基于所述频谱确定频谱点的数量和频谱点的幅度;
加权函数确定单元,被配置为:基于确定的频谱点的数量对LSF系数或ISF系数进行归一化,基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度来确定幅度加权函数,基于来自ISF系数或LSF系数的频率信息确定频率加权函数,并且至少基于幅度加权函数和频率加权函数来确定加权函数;
量化单元,被配置为基于确定的加权函数对ISF系数或LSF系数进行量化。
2.如权利要求1所述的设备,其中,幅度加权函数基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度和至少一个相邻频谱点的幅度之中的最大值。
3.如权利要求1所述的设备,其中,所述频率信息基于所述信号的感知模型、所述信号的编码模式以及所述信号的带宽中的至少一个。
4.如权利要求1所述的设备,其中,所述频率信息基于与所述信号的编码模式相应的共振峰分布,其中,所述编码模式是基于信号特性而确定的。
5.一种量化方法,包括:
从信号的线性预测编码LPC系数获得线谱频率LSF系数或导抗谱频率ISF系数,其中,所述信号包括语音信号和音频信号中的至少一个;
将所述信号转换为频谱,并基于所述频谱确定频谱点的数量和频谱点的幅度;
基于确定的频谱点的数量对LSF系数或ISF系数进行归一化;
基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度来确定幅度加权函数;
基于来自ISF系数或LSF系数的频率信息来确定频率加权函数;
至少基于幅度加权函数和频率加权函数来确定加权函数;
基于确定的加权函数对ISF系数或LSF系数进行量化。
6.如权利要求5所述的方法,其中,幅度加权函数基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度和至少一个相邻频谱点的幅度之中的最大值。
7.如权利要求5所述的方法,其中,所述频率信息基于所述信号的感知模型、所述信号的编码模式以及所述信号的带宽中的至少一个。
8.如权利要求5所述的方法,其中,所述频率信息基于与所述信号的编码模式相应的共振峰分布,其中,所述编码模式是基于信号特性而确定的。
9.一种用于确定在对信号进行量化时使用的加权函数的设备,其中,所述信号包括语音信号和音频信号中的至少一个,所述设备包括:
至少一个处理器,被配置为:
从信号的线性预测编码LPC系数获得线谱频率LSF系数或导抗谱频率ISF系数,其中,所述信号包括语音信号和音频信号中的至少一个;
将所述信号转换为频谱,并基于所述频谱确定频谱点的数量和频谱点的幅度;
基于确定的频谱点的数量对LSF系数或ISF系数进行归一化;
基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度来确定幅度加权函数;
基于来自ISF系数或LSF系数的频率信息确定频率加权函数;
至少基于幅度加权函数和频率加权函数来确定加权函数。
10.如权利要求9所述的设备,其中,幅度加权函数基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度和至少一个相邻频谱点的幅度之中的最大值。
11.如权利要求9所述的设备,其中,加权函数根据所述信号的带宽和编码模式中的至少一个而变化。
12.一种用于确定在对信号进行量化时使用的加权函数的方法,其中,所述信号包括语音信号和音频信号中的至少一个,所述方法包括:
从信号的线性预测编码LPC系数获得线谱频率LSF系数或导抗谱频率ISF系数,其中,所述信号包括语音信号和音频信号中的至少一个;
将所述信号转换为频谱,并基于所述频谱确定频谱点的数量和频谱点的幅度;
基于确定的频谱点的数量对LSF系数或ISF系数进行归一化;
基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度来确定幅度加权函数;
基于来自ISF系数或LSF系数的频率信息确定频率加权函数;
至少基于幅度加权函数和频率加权函数来确定加权函数。
13.如权利要求12所述的方法,其中,幅度加权函数基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度和至少一个相邻频谱点的幅度之中的最大值。
14.如权利要求12所述的方法,其中,加权函数根据所述信号的带宽和编码模式中的至少一个而变化。
15.如权利要求12所述的方法,其中,所述频率信息基于所述信号的感知模型、所述信号的编码模式以及所述信号的带宽中的至少一个。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100101305A KR101747917B1 (ko) | 2010-10-18 | 2010-10-18 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
KR10-2010-0101305 | 2010-10-18 | ||
CN2011800610219A CN103262161A (zh) | 2010-10-18 | 2011-10-18 | 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011800610219A Division CN103262161A (zh) | 2010-10-18 | 2011-10-18 | 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105825861A CN105825861A (zh) | 2016-08-03 |
CN105825861B true CN105825861B (zh) | 2020-04-10 |
Family
ID=45934871
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610304743.7A Active CN105825861B (zh) | 2010-10-18 | 2011-10-18 | 确定加权函数的设备和方法以及量化设备和方法 |
CN201610304298.4A Active CN105741846B (zh) | 2010-10-18 | 2011-10-18 | 确定加权函数的设备和方法以及量化设备和方法 |
CN201610304632.6A Active CN105825860B (zh) | 2010-10-18 | 2011-10-18 | 确定加权函数的设备和方法以及量化设备和方法 |
CN2011800610219A Pending CN103262161A (zh) | 2010-10-18 | 2011-10-18 | 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610304298.4A Active CN105741846B (zh) | 2010-10-18 | 2011-10-18 | 确定加权函数的设备和方法以及量化设备和方法 |
CN201610304632.6A Active CN105825860B (zh) | 2010-10-18 | 2011-10-18 | 确定加权函数的设备和方法以及量化设备和方法 |
CN2011800610219A Pending CN103262161A (zh) | 2010-10-18 | 2011-10-18 | 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法 |
Country Status (12)
Country | Link |
---|---|
US (3) | US9311926B2 (zh) |
EP (4) | EP3869508B1 (zh) |
JP (3) | JP5918249B2 (zh) |
KR (1) | KR101747917B1 (zh) |
CN (4) | CN105825861B (zh) |
CA (2) | CA2814944C (zh) |
ES (1) | ES2947874T3 (zh) |
MX (2) | MX342308B (zh) |
MY (3) | MY181446A (zh) |
PL (1) | PL3869508T3 (zh) |
SG (2) | SG10201401664XA (zh) |
WO (1) | WO2012053798A2 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
PL3069338T3 (pl) | 2013-11-13 | 2019-06-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder do kodowania sygnału audio, system przesyłania audio i sposób określania wartości korekcji |
EP3091536B1 (en) * | 2014-01-15 | 2019-12-11 | Samsung Electronics Co., Ltd. | Weight function determination for a quantizing linear prediction coding coefficient |
EP2916319A1 (en) | 2014-03-07 | 2015-09-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for encoding of information |
EP3869506A1 (en) * | 2014-03-28 | 2021-08-25 | Samsung Electronics Co., Ltd. | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
HRP20240674T1 (hr) | 2014-04-17 | 2024-08-16 | Voiceage Evs Llc | Postupci, koder i dekoder za linearno prediktivno kodiranje i dekodiranje zvučnih signala pri prijelazu između okvira koji imaju različitu brzinu uzorkovanja |
JP6270992B2 (ja) * | 2014-04-24 | 2018-01-31 | 日本電信電話株式会社 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体 |
CA3042070C (en) * | 2014-04-25 | 2021-03-02 | Ntt Docomo, Inc. | Linear prediction coefficient conversion device and linear prediction coefficient conversion method |
CN107452391B (zh) | 2014-04-29 | 2020-08-25 | 华为技术有限公司 | 音频编码方法及相关装置 |
CN112927702A (zh) * | 2014-05-07 | 2021-06-08 | 三星电子株式会社 | 对线性预测系数量化的方法和装置及解量化的方法和装置 |
FR3023036A1 (fr) * | 2014-06-27 | 2016-01-01 | Orange | Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard |
CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
CN104269176B (zh) * | 2014-09-30 | 2017-11-24 | 武汉大学深圳研究院 | 一种isf系数矢量量化的方法与装置 |
KR102298767B1 (ko) * | 2014-11-17 | 2021-09-06 | 삼성전자주식회사 | 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법 |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN111788628B (zh) * | 2018-03-02 | 2024-06-07 | 日本电信电话株式会社 | 声音信号的编码装置、声音信号的编码方法以及记录介质 |
CN110660402B (zh) * | 2018-06-29 | 2022-03-29 | 华为技术有限公司 | 立体声信号编码过程中确定加权系数的方法和装置 |
JP7130878B2 (ja) * | 2019-01-13 | 2022-09-05 | 華為技術有限公司 | 高分解能オーディオコーディング |
US11955138B2 (en) * | 2019-03-15 | 2024-04-09 | Advanced Micro Devices, Inc. | Detecting voice regions in a non-stationary noisy environment |
CN113554103B (zh) * | 2021-07-28 | 2022-05-27 | 大连海天兴业科技有限公司 | 一种列车走行部滚动轴承故障诊断算法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0899720A2 (en) * | 1997-08-28 | 1999-03-03 | Texas Instruments Inc. | Quantization of linear prediction coefficients |
US6131083A (en) * | 1997-12-24 | 2000-10-10 | Kabushiki Kaisha Toshiba | Method of encoding and decoding speech using modified logarithmic transformation with offset of line spectral frequency |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265190A (en) * | 1991-05-31 | 1993-11-23 | Motorola, Inc. | CELP vocoder with efficient adaptive codebook search |
US5448680A (en) * | 1992-02-12 | 1995-09-05 | The United States Of America As Represented By The Secretary Of The Navy | Voice communication processing system |
JP2746039B2 (ja) * | 1993-01-22 | 1998-04-28 | 日本電気株式会社 | 音声符号化方式 |
JP3153075B2 (ja) | 1994-08-02 | 2001-04-03 | 日本電気株式会社 | 音声符号化装置 |
CA2154911C (en) | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
JP3283152B2 (ja) | 1995-02-27 | 2002-05-20 | 松下電器産業株式会社 | 音声パラメータ量子化装置およびベクトル量子化装置 |
US5754733A (en) | 1995-08-01 | 1998-05-19 | Qualcomm Incorporated | Method and apparatus for generating and encoding line spectral square roots |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
JPH10276095A (ja) | 1997-03-28 | 1998-10-13 | Toshiba Corp | 符号化器及び復号化器 |
US6889185B1 (en) | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
TW408298B (en) | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
US5966688A (en) * | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
JP3365360B2 (ja) * | 1999-07-28 | 2003-01-08 | 日本電気株式会社 | 音声信号復号方法および音声信号符号化復号方法とその装置 |
US7389227B2 (en) * | 2000-01-14 | 2008-06-17 | C & S Technology Co., Ltd. | High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder |
US6778953B1 (en) * | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
JP2004502204A (ja) * | 2000-07-05 | 2004-01-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ラインスペクトル周波数をフィルタ係数に変換する方法 |
KR100383668B1 (ko) * | 2000-09-19 | 2003-05-14 | 한국전자통신연구원 | 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법 |
CA2429832C (en) * | 2000-11-30 | 2011-05-17 | Matsushita Electric Industrial Co., Ltd. | Lpc vector quantization apparatus |
KR20020075592A (ko) * | 2001-03-26 | 2002-10-05 | 한국전자통신연구원 | 광대역 음성 부호화기용 lsf 양자화기 |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
US7610198B2 (en) * | 2001-08-16 | 2009-10-27 | Broadcom Corporation | Robust quantization with efficient WMSE search of a sign-shape codebook using illegal space |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
WO2003089892A1 (en) | 2002-04-22 | 2003-10-30 | Nokia Corporation | Generating lsf vectors |
KR100474969B1 (ko) | 2002-06-04 | 2005-03-10 | 에스엘투 주식회사 | 음성신호 부호화를 위한 선 스펙트럼 계수의 벡터 양자화방법과 이를 위한 마스킹 임계치 산출 방법 |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
JP4413480B2 (ja) * | 2002-08-29 | 2010-02-10 | 富士通株式会社 | 音声処理装置及び移動通信端末装置 |
US20040083097A1 (en) * | 2002-10-29 | 2004-04-29 | Chu Wai Chung | Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard |
KR100499047B1 (ko) * | 2002-11-25 | 2005-07-04 | 한국전자통신연구원 | 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법 |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
US7199362B2 (en) * | 2003-04-09 | 2007-04-03 | Brigham Young University | Cross-flow ion mobility analyzer |
EP1513137A1 (en) | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
US20050065787A1 (en) | 2003-09-23 | 2005-03-24 | Jacek Stachurski | Hybrid speech coding and system |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
CN1677493A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
US7848925B2 (en) * | 2004-09-17 | 2010-12-07 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus |
KR100647290B1 (ko) | 2004-09-22 | 2006-11-23 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
KR20060067016A (ko) | 2004-12-14 | 2006-06-19 | 엘지전자 주식회사 | 음성 부호화 장치 및 방법 |
WO2007000988A1 (ja) * | 2005-06-29 | 2007-01-04 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号装置および消失データ補間方法 |
EP1989706B1 (fr) | 2006-02-14 | 2011-10-26 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
KR100902332B1 (ko) | 2006-09-11 | 2009-06-12 | 한국전자통신연구원 | 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법 |
KR100788706B1 (ko) * | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
US20080195381A1 (en) * | 2007-02-09 | 2008-08-14 | Microsoft Corporation | Line Spectrum pair density modeling for speech applications |
CA2972808C (en) * | 2008-07-10 | 2018-12-18 | Voiceage Corporation | Multi-reference lpc filter quantization and inverse quantization device and method |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
CN105244034B (zh) * | 2011-04-21 | 2019-08-13 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
MY185091A (en) * | 2011-04-21 | 2021-04-30 | Samsung Electronics Co Ltd | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
EP3091536B1 (en) * | 2014-01-15 | 2019-12-11 | Samsung Electronics Co., Ltd. | Weight function determination for a quantizing linear prediction coding coefficient |
-
2010
- 2010-10-18 KR KR1020100101305A patent/KR101747917B1/ko active IP Right Grant
-
2011
- 2011-05-26 US US13/067,366 patent/US9311926B2/en active Active
- 2011-10-18 CN CN201610304743.7A patent/CN105825861B/zh active Active
- 2011-10-18 JP JP2013534808A patent/JP5918249B2/ja active Active
- 2011-10-18 MX MX2015015371A patent/MX342308B/es unknown
- 2011-10-18 MX MX2013004342A patent/MX2013004342A/es active IP Right Grant
- 2011-10-18 CN CN201610304298.4A patent/CN105741846B/zh active Active
- 2011-10-18 CN CN201610304632.6A patent/CN105825860B/zh active Active
- 2011-10-18 EP EP21168286.9A patent/EP3869508B1/en active Active
- 2011-10-18 WO PCT/KR2011/007738 patent/WO2012053798A2/en active Application Filing
- 2011-10-18 EP EP11834598.2A patent/EP2630641A4/en not_active Withdrawn
- 2011-10-18 SG SG10201401664XA patent/SG10201401664XA/en unknown
- 2011-10-18 MY MYPI2017000126A patent/MY181446A/en unknown
- 2011-10-18 MY MYPI2013001378A patent/MY165854A/en unknown
- 2011-10-18 CA CA2814944A patent/CA2814944C/en active Active
- 2011-10-18 SG SG2013029277A patent/SG189452A1/en unknown
- 2011-10-18 ES ES21168286T patent/ES2947874T3/es active Active
- 2011-10-18 EP EP16150075.6A patent/EP3029670B1/en active Active
- 2011-10-18 CA CA2958164A patent/CA2958164C/en active Active
- 2011-10-18 CN CN2011800610219A patent/CN103262161A/zh active Pending
- 2011-10-18 EP EP23153888.5A patent/EP4195203A1/en active Pending
- 2011-10-18 PL PL21168286.9T patent/PL3869508T3/pl unknown
- 2011-10-18 MY MYPI2017000127A patent/MY183019A/en unknown
-
2016
- 2016-04-07 JP JP2016077549A patent/JP6317387B2/ja active Active
- 2016-04-11 US US15/095,601 patent/US9773507B2/en active Active
-
2017
- 2017-08-28 US US15/688,002 patent/US10580425B2/en active Active
-
2018
- 2018-03-29 JP JP2018065492A patent/JP6571827B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0899720A2 (en) * | 1997-08-28 | 1999-03-03 | Texas Instruments Inc. | Quantization of linear prediction coefficients |
US6131083A (en) * | 1997-12-24 | 2000-10-10 | Kabushiki Kaisha Toshiba | Method of encoding and decoding speech using modified logarithmic transformation with offset of line spectral frequency |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105825861B (zh) | 确定加权函数的设备和方法以及量化设备和方法 | |
KR102461280B1 (ko) | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 | |
US9747913B2 (en) | Apparatus and method determining weighting function for linear prediction coding coefficients quantization | |
KR101761820B1 (ko) | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 | |
KR101857799B1 (ko) | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 | |
KR101997897B1 (ko) | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 | |
KR101867596B1 (ko) | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |