CN107533847B - 音频编码器和音频解码器及对应的方法 - Google Patents
音频编码器和音频解码器及对应的方法 Download PDFInfo
- Publication number
- CN107533847B CN107533847B CN201680015022.2A CN201680015022A CN107533847B CN 107533847 B CN107533847 B CN 107533847B CN 201680015022 A CN201680015022 A CN 201680015022A CN 107533847 B CN107533847 B CN 107533847B
- Authority
- CN
- China
- Prior art keywords
- spectral coefficients
- encoder
- coefficients
- individual
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 57
- 230000003595 spectral effect Effects 0.000 claims abstract description 556
- 230000005236 sound signal Effects 0.000 claims abstract description 129
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/635—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种用于编码音频信号的编码器。该编码器用于在变换域或滤波器组域中编码音频信号,其中该编码器用于为当前帧及至少一个先前帧确定音频信号的频谱系数,其中编码器用于将预测编码选择性地应用于由至少一个频谱系数分隔开的多个个别频谱系数或频谱系数的群组。
Description
技术领域
实施例涉及音频编码,尤其涉及一种使用预测编码对音频信号进行编码的方法和装置以及涉及一种使用预测解码对经编码的音频信号进行解码的方法和装置。优选的实施例涉及用于音高-自适应性频谱预测的方法和装置。更优选的实施例涉及使用频域帧间预测工具借助于变换编码的音调音频信号的感知编码。
背景技术
为了改进特别是在低比特率下的经编码的音调信号的质量,现代音频变换编码器采用非常长的变换和/或长期预测或预滤波/后滤波。然而,长的变换意味着长的演算延迟,其对于低延迟通讯情景来说是不被期望的。因此,基于瞬时基本音高的具有非常低的延迟的预测器近来受到欢迎。IETF(因特网工程任务组)Opus编解码器在其频域CELT(受限能量重叠变换)编码路径中利用音高自适应性预滤波和后滤波[J.M.Valin,K.Vos,andT.Terriberry,“Definition of the Opus audio codec(Opus音频编解码器的定义)”2012,IETF RFC 6716.http://tools.ietf.org/html/rfc67161.],并且3GPP(第三代合作伙伴计划)EVS(增强语音服务)编解码器提供用于经变换解码的信号的感知改进的长期谐波后滤波器[3GPP TS 26.443,“Codec for Enhanced Voice Services(EVS),”Release12,Dec.2014.]。这两种方法在时域中对经完全解码的信号波形进行操作,使得频率选择性地应用它们是困难和/或运算上昂贵的(两种方案仅提供简单的低通滤波器用于一些频率选择性)。因此,通过如在MPEG-2AAC中受支持的频域预测(FDP),提供对时域长期预测(LTP)或预滤波/后滤波(PPF)的受欢迎的替代方案[ISO/IEC13818-7,“Informationtechnology–Part 7:Advanced Audio Coding(AAC)(信息技术-第7部分:高级音频编码)”2006.]。虽然促进频率选择性,此方法具有其本身缺点,如下文所述。
如上所介绍的FDP方法对其他工具有两个缺点。第一,该FDP方法要求高运算复杂度。详细地说,在所有比例因子带中的预测的最坏情况下,对于用于每个帧和通道的数百个频谱仓(spectral bins)应用至少二阶(即来自上两个帧的通道变换仓)的线性预测编码[ISO/IEC 13818-7,“Information technology–Part 7:Advanced Audio Coding(AAC),”2006.]。第二,FDP方法包括受限总体预测增益。更精确地,因为可预测谐波、音调频谱部分之间的噪声分量也受到预测,预测的效率被限制,并由于这些噪声部分通常是不可预测的而引入误差。
此高复杂度归因于预测器的后向自适应性。此代表针对每个仓的预测系数必须基于先前传送的仓(bin)而计算。因此,编码器与解码器之间的数值不准确可导致归因于发散预测系数的重建误差。为了克服此问题,必须保证比特完全相同适应。此外,即使预测器的群组在某些帧中被停用,为了保持预测系数是最新的,必须一直执行适应。
发明内容
因此,本发明的目的在于提供用于编码音频信号和/或解码经编码的音频信号的概念,其避免前述问题中的至少一个(例如,两者)并导致更有效且运算上低廉的实施。
通过独立权利要求实现此目的。
由从属权利要求提出有益的实施。
实施例提供一种用于编码音频信号的编码器。编码器用于在变换域或滤波器组域中编码音频信号,其中编码器用于为当前帧和至少一个先前帧确定音频信号的频谱系数,其中编码器用于将预测编码选择性地应用于多个个别频谱系数或频谱系数的群组,其中编码器用于确定间距值,其中编码器用于基于可作为旁侧信息连同经编码的音频信号被传送的间距值对应用预测编码的多个个别频谱系数或频谱系数的群组进行选择。
其他实施例提供一种用于对经编码的音频信号(例如,由上述的编码器编码的)进行解码的解码器。解码器用于在变换域或滤波器组域中对经编码的音频信号进行解码,其中解码器用于解析经编码的音频信号以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数,并且其中解码器用于将预测解码选择性地应用于多个个别经编码的频谱系数或经编码的频谱系数的群组,其中解码器可用于基于经传送的间距值对应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组进行选择。
根据本发明的概念,预测编码(仅)应用于所选频谱系数。可依据信号特性对应用预测编码的频谱系数进行选择。举例而言,通过不将预测编码应用于噪声信号分量,避免了前述由对不可预测的噪声信号分量进行预测所引入的误差。同时,运算复杂度可因为仅将预测编码应用于所选频谱分量而被减少。
举例而言,可利用导引/自适应性频谱域帧间预测方法借助于变换编码(例如,由编码器)执行音调音频信号的感知编码。通过将预测仅应用于(例如)位于基本频率或音高的整数倍(其可在适合的比特流中从编码器被信号发送至解码器(例如)作为间距值)处的谐波信号分量周围的频谱系数,可增加频域预测(FDP)的效率且可降低运算复杂度。本发明的实施例可优选地被实施或整合进MPEG-H 3D音频编解码器中,但也可应用于诸如,例如MPEG-2AAC的任何音频变换编码系统。
其他实施例提供一种用于在变换域或滤波器组域中编码音频信号的方法,该方法包括:
-为当前帧和至少一个先前帧确定音频信号的频谱系数;
-确定间距值;以及
-将预测编码选择性地应用于多个个别频谱系数或频谱系数的群组,其中基于间距值对应用预测编码的多个个别频谱系数或频谱系数的群组进行选择。
其他实施例提供一种用于在变换域或滤波器组域中对经编码的音频信号进行解码的方法,该方法包括:
-对经编码的音频信号进行解析以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数;
-获得间距值;以及
-将预测解码选择性地应用于多个个别经编码的频谱系数或经编码的频谱系数的群组,其中应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组是基于间距值而被选择的。
附图说明
在此,参照附图描述本发明的实施例,其中:
图1展示根据实施例的用于编码音频信号的编码器的示意性框图;
图2在图中展示根据实施例的针对当前帧关于频率绘制的音频信号的幅度和对应的应用预测编码的所选频谱系数;
图3在图中展示根据实施例的针对当前帧关于频率绘制的音频信号的幅度和对应的根据MPEG-2AAC受到预测的频谱系数;
图4展示根据实施例的用于对经编码的音频信号进行解码的解码器的示意性框图;
图5展示根据实施例的用于编码音频信号的方法的流程图;
图6展示根据实施例的用于对经编码的音频信号进行解码的方法的流程图。
具体实施方式
在下面的描述中,相等或等效的元件或是具有相等或等效功能的元件被标记有相等或等效的附图标记。
在下面的描述中,阐述多个细节以提供本发明的实施例的更详尽的解释。然而,对本领域技术人员显而易见的是,可在没有这些特定的细节的情况下实践本发明的实施例。在其他示例中,为了避免模糊本发明的实施例,公知的结构和设备是以框图形式而非详细地示出。此外,除非另外有特别注明,之后描述的不同的实施例的特征可互相组合。
图1展示根据实施例的用于编码音频信号102的编码器100的示意性框图。编码器100用于在变换域或滤波器组域104(例如,频域或频谱域)中编码音频信号102,其中编码器100用于为当前帧108_t0确定音频信号102的频谱系数106_t0_f1至106_t0_f6以及为至少一个先前帧108_t-1确定音频信号的频谱系数106_t-1_f1至106_t-1_f6。另外,编码器100用于将预测编码选择性地应用于多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组,其中编码器100用于确定间距值,其中编码器100用于基于间距值选择应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
换句话说,编码器100用于将预测编码选择性地应用于基于作为旁侧信息被传送的间距值所选择的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
间距值可对应于频率(例如,(音频信号102的)谐波音调的基本频率),该频率与其整数倍一起定义了应用预测的所有频谱系数的群组的中心:第一群组可以以此频率为中心、第二群组可以以此频率的两倍为中心、第三群组可以以此频率的三倍为中心,以此类推。对这些中心频率的了解能够实现用来预测对应的正弦信号分量(例如,谐波信号的基音与泛音)的预测系数的计算。因此,不再需要复杂且易出错的预测系数的后向自适应。
在实施例中,编码器100可用于每帧地确定一个间距值。
在实施例中,多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组可被至少一个频谱系数106_t0_f3分隔。
在实施例中,编码器100可用于将预测编码应用于由至少一个频谱系数分隔的多个个别频谱系数,如应用于由至少一个频谱系数分隔的两个个别频谱系数。另外,编码器100可用于将预测编码应用于由至少一个频谱系数分隔的频谱系数的多个群组(每个群组包括至少两个频谱系数),如应用于由至少一个频谱系数分隔的两组频谱系数。另外,编码器100可用于将预测编码应用于由至少一个频谱系数分隔的多个个别频谱系数和/或频谱系数的群组,如应用于由至少一个频谱系数分隔的至少一个个别频谱系数和至少一组频谱系数。
在图1展示的示例中,编码器100用于为当前帧108_t0确定六个频谱系数106_t0_f1至106_t0_f6以及为先前帧108_t-1确定六个频谱系数106_t-1_f1至106_t-1_f6。由此,编码器100用于将预测编码选择性地应用于当前帧的个别第二频谱系数106_t0_f2以及应用于由当前帧108_t0的第四和第五频谱系数106_t0_f4和106_t0_f5组成的频谱系数的群组。正如可见到的,个别第二频谱系数106_t0_f2及由第四和第五频谱系数106_t0_f4和106_t0_f5组成的频谱系数的群组由第三频谱系数106_t0_f3彼此分隔。
应注意的是,此处使用的术语“选择性”是指将预测编码(仅)应用于所选频谱系数。换句话说,预测编码不必应用于所有频谱系数,而是仅应用于所选择的个别频谱系数或频谱系数的群组,所选择的个别频谱系数和/或频谱系数的群组可由至少一个频谱系数互相分隔。换句话说,对于对所选择的多个个别频谱系数或频谱系数的群组进行分隔的至少一个频谱系数,可停用预测编码。
在实施例中,编码器100可用于基于先前帧108_t-1的至少多个对应的个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组将预测编码选择性地应用于当前帧108_t0的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
举例而言,编码器100可用于通过对当前帧108_t0的多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组与当前帧的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组(或其量化版本)之间的预测误差进行编码,对当前帧108_t0的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行预测编码。
在图1中,编码器100通过对当前帧108_t0的经预测的个别频谱系数110_t0_f2与当前帧108_t0的个别频谱系数106_t0_f2之间的预测误差以及当前帧的经预测的频谱系数110_t0_f4和110_t0_f5的群组与当前帧的频谱系数106_t0_f4和106_t0_f5的群组之间的预测误差进行编码,对个别频谱系数106_t0_f2及由频谱系数106_t0_f4与106_t0_f5组成的频谱系数的群组进行编码。
换句话说,第二频谱系数106_t0_f2是通过对经预测的第二频谱系数110_t0_f2与(实际的或确定的)第二频谱系数106_t0_f2之间的预测误差(或差异)进行编码而被编码的,其中第四频谱系数106_t0_f4是通过对经预测的第四频谱系数110_t0_f4与(实际的或确定的)第四频谱系数106_t0_f4之间的预测误差(或差异)进行编码而被编码的,且其中第五频谱系数106_t0_f5是通过对经预测的第五频谱系数110_t0_f5与(实际的或确定的)第五频谱系数106_t0_f5之间的预测误差(或差异)进行编码而被编码的。
在实施例中,编码器100可用于借助于先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组的对应实际版本,为当前帧108_t0确定多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
换句话说,在上述的确定过程中,编码器100可直接地使用先前帧108_t-1的多个实际个别频谱系数106_t-1_f2或实际频谱系数106_t-1_f4和106_t-1_f5的群组(其中106_t-1_f2、106_t-1_f4和106_t-1_f5分别代表原始的、尚未被量化的频谱系数或频谱系数的群组),因为它们被编码器100获得以使得所述编码器可在变换域或滤波器组域104中进行操作。
举例来说,编码器100可用于基于先前帧108_t-1的第二频谱系数106_t-1_f2的对应的尚未被量化的版本确定当前帧108_t0的第二经预测的频谱系数110_t0_f2、基于先前帧108_t-1的第四频谱系数106_t-1_f4的对应的尚未被量化的版本确定当前帧108_t0的经预测的第四频谱系数110_t0_f4,以及基于先前帧的第五频谱系数106_t-1_f5的对应的尚未被量化的版本确定当前帧108_t0的经预测的第五频谱系数110_t0_f5。
通过此方法,预测编码和解码方案可呈现一种量化噪声的谐波成形,因为对应的解码器(关于图4在下文中描述其实施例)在上述确定步骤中仅可以运用先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的多个群组的经传输的量化版本来用于预测解码。
虽然此谐波噪声成形,因为其是例如传统上在时域中由长期预测(LTP)所执行的而可主观地对预测编码有利,而在某些情况下其可能是不被期望的因为会导致不想要的、过量的音调被引入经解码的音频信号。由于此原因,下文描述与对应的解码完全同步、并同样地仅利用任何可能的预测增益但却不会导致量化噪声成形的替代预测编码方案。根据此替代编码实施例,编码器100可用于使用先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组的对应的量化版本,为当前帧108_t0确定多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
举例而言,编码器100可用于基于先前帧108_t-1的第二频谱系数106_t-1_f2的对应的量化版本确定当前帧108_t0的第二经预测的频谱系数110_t0_f2、基于先前帧108_t-1的第四频谱系数106_t-1_f4的对应的量化版本确定当前帧108_t0的经预测的第四频谱系数110_t0_f4,及基于先前帧108_t-1的第五频谱系数106_t-1_f5的对应的量化版本确定当前帧108_t0的经预测的第五频谱系数110_t0_f5。
另外,编码器100可用于从间距值得出预测系数112_f2、114_f2、112_f4、114_f4、112_f5及114_f5,并使用至少两个先前帧108_t-1和108_t-2的多个个别频谱系数106_t-1_f2和106_t-2_f2或频谱系数106_t-1_f4、106_t-2_f4、106_t-1_f5和106_t-2_f5的群组的对应的量化版本及使用得出的预测系数112_f2、114_f2、112_f4、114_f4、112_f5及114_f5,为当前帧108_t0计算多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
举例而言,编码器100可用于:为第二频谱系数106_t0_f2从间距值得出预测系数112_f2和114_f2、为第四频谱系数106_t0_f4从间距值得出预测系数112_f4和114_f4,以及为第五频谱系数106_t0_f5从间距值得出预测系数112_f5和114_f5。
举例而言,预测系数的得出可以以下述方式得出:若间距值或其经编码的版本对应于频率f0,则启用预测的第K组频谱系数的中心频率为fc=K*f0。若取样频率为fs且变换跃程大小(在连续帧间的移位)为N,则假设具有频率fc的正弦信号的理想预测器系数在第K组中为:
p1=2*cos(N*2*pi*fc/fs)且p2=-1。
若,例如,频谱系数106_t0_f4和106_t0_f5在此群组内,则预测系数为:
112_f4=112_f5=2*cos(N*2*pi*fc/fs)且114_f4=114_f5=-1
出于稳定性原因,可引入阻尼因数d以导致修改的预测系数:
112_f4’=112_f5’=d*2*cos(N*2*pi*fc/fs),114_f4’=114_f5’=d2。
由于间距值是在经编码的音频信号120中传输,解码器可得出完全相同的预测系数212_f4=212_f5=2*cos(N*2*pi*fc/fs)且114_f4=114_f5=-1。若使用阻尼因数,则系数可被相应地修改。
如同图1中所表示,编码器100可用于提供经编码的音频信号120。由此,编码器100可被配置为对于应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组将预测误差的量化版本包括于经编码的音频信号120中。另外,编码器100可被配置为不将预测系数112_f2至114_f5包括于经编码的音频信号120中。
因此,编码器100可仅使用预测系数112_f2至114_f5以计算多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组以及来自于其的当前帧的经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组与个别频谱系数106_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组之间的预测误差,但在经编码的音频信号120中将不会提供个别频谱系数106_t0_f4(或其量化版本)或频谱系数106_t0_f4和106_t0_f5的群组(或其量化版本)也不会提供预测系数112_f2至114_f5。因此,解码器(之后关于图4描述其实施例)可以从间距值得出用于为当前帧计算多个经预测的个别频谱系数或经预测的频谱系数的群组的预测系数112_f2至114_f5。
换句话说,编码器100可被配置为,为应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组提供包括预测误差的量化版本而不是多个个别频谱系数106_t0_f2的或频谱系数106_t0_f4和106_t0_f5的群组的量化版本的经编码的音频信号120。
另外,编码器100可用于提供包括对多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行分隔的频谱系数106_t0_f3的量化版本的经编码的音频信号120,使得存在频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组(对于其,预测误差的量化版本包括在经编码的音频信号120中)与频谱系数106_t0_f3或频谱系数的群组(对于其,不使用预测编码而提供量化版本)的交替。
在实施例中,编码器100还可用于对预测误差的量化版本以及将多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行分隔的频谱系数106_t0_f3的量化版本进行熵编码,以及将经熵编码的版本(而不是其未经熵编码的版本)包括于经编码的音频信号120中。
图2在图中展示针对当前帧108_t0关于频率绘制的音频信号102的幅度。另外,在图2中,表示了由编码器100为音频信号102的当前帧108_t0确定的变换域或滤波器组域中的频谱系数。
如图2中所示,编码器100可用于将预测编码选择性地应用于由至少一个频谱系数所分隔的频谱系数的多个群组116_1至116_6。详细地说,在图2所示的实施例中,编码器100将预测编码选择性地应用于频谱系数的六个群组116_1至116_6,其中频谱系数的前五个群组116_1至116_5的每个包括三个频谱系数(例如,第二群组116_2包括频谱系数106_t0_f8、106_t0_f9及106_t0_f10),其中频谱系数的第六个群组116_6包括两个频谱系数。因此,频谱系数的此六个群组116_1至116_6是由不应用预测编码的频谱系数的(五个)群组118_1至118_5所分隔。
换句话说,如图2中所表示,编码器100可用于将预测编码选择性地应用于频谱系数的群组116_1至116_6,使得存在应用预测编码的频谱系数的群组116_1至116_6与不应用预测编码的频谱系数的群组118_1至118_5的交替。
在实施例中,编码器100可用于确定间距值(由箭头122_1和122_2表示于图2中),其中编码器100可用于基于间距值选择应用预测编码的频谱系数的多个群组116_1至116_6(或多个个别频谱系数)。
该间距值可为,例如,音频信号102的两个特征频率如音频信号的尖峰124_1及124_2之间的间距(或距离)。另外,该间距值可为近似于音频信号的两个特征频率之间的间距的频谱系数的整数编号(或频谱系数的索引)。自然地,间距值还可以是描述音频信号的两个特征频率之间的间距的频谱系数的整数编号(integer number of)的实值或分数或倍数。
在实施例中,编码器100可用于确定音频信号(102)的瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。
举例而言,音频信号102的第一尖峰124_1可以是音频信号102的瞬时基本频率(或音高、或第一谐波)。因此,编码器100可用于确定音频信号102的瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。在此情况下,间距值可以是近似于音频信号102的瞬时基本频率124_1与第二谐波124_2之间的间距的频谱系数的整数编号(或其分数或倍数)。
自然地,音频信号102可包括两个以上的谐波。例如,展示于图2中的音频信号102包括频谱上分布的六个谐波124_1至124_6使得音频信号102在每个整数倍的瞬时基频上包括谐波。自然地,音频信号102还可能不包括所有但只包括一些谐波,如第一、第三和第五谐波。
在实施例中,编码器100可用于选择根据由间距值定义的谐波栅(harmonic grid)而频谱布置的频谱系数的群组116_1至116_6(或个别频谱系数)以用于预测编码。由此,由间距值定义的谐波栅描述音频信号102中的谐波的周期性频谱分布(等距间距)。换句话说,由间距值定义的谐波栅可以是描述音频信号的谐波的等距间距的间距值的序列。
另外,编码器100可用于选择频谱系数(例如,仅那些频谱系数),其频谱索引与基于间距值得出的多个频谱索引相等或位于基于间距值得出的多个频谱索引周围的范围(例如,预先确定或可变的)内,以用于预测编码。
代表音频信号102的谐波的频谱系数的索引(或编号)可从间距值得出。例如,假设第四频谱系数106_t0_f4代表音频信号102的瞬时基本频率且假设间距值为五,则基于间距值可得出具有索引九的频谱系数。如可在图2中见到的,所得出的具有索引九的频谱系数(即,第九个频谱系数106_t0_f9)代表第二个谐波。同样地,具有索引14、19、24及29的频谱系数可得出,代表第三至第六个谐波124_3至124_6。然而,不仅具有与基于间距值得出的多个频谱索引相等的索引的频谱系数可被预测编码,具有在基于间距值得出的多个频谱索引周围的给定范围内的索引的频谱系数也可被预测编码。举例来说,如图2中所示,该范围可为三,以使得不是多个个别频谱系数而是频谱系数的多个群组被选择用于预测编码。
另外,编码器100可用于选择应用预测编码的频谱系数的群组116_1至116_6(或多个个别频谱系数)使得在应用预测编码的频谱系数的群组116_1至116_6(或多个个别频谱系数)与分隔应用预测编码的频谱系数的群组(或多个个别频谱系数)的频谱系数之间存在周期性交替,其以+/-1频谱系数的容差为周期。当音频信号102的两个谐波之间的距离不等于整数间距值(关于频谱系数的索引或编号的整数)而是其分数或倍数时,可能需要+/-1频谱系数的容差。此也可于图2中所见,因为箭头122_1至122_6并不总是完全指向对应频谱系数的中心或中间。
换句话说,音频信号102可包括至少两个谐波信号分量124_1至124_6,其中编码器100可用于将预测编码选择性地应用于代表音频信号102的至少两个谐波信号分量124_1至124_6或至少两个谐波信号分量124_1至124_6周围的频谱环境的频谱系数的多个群组116_1至116_6(或个别频谱系数)。至少两个谐波信号分量124_1至124_6周围的频谱环境可为,例如,+/-1、2、3、4或5个频谱分量。
由此,编码器100可用于不将预测编码应用于不代表音频信号102的至少两个谐波信号分量124_1至124_6或至少两个谐波信号分量124_1至124_6的频谱环境的频谱系数的那些群组118_1至118_5(或多个个别频谱系数)。换句话说,编码器100可用于不将预测编码应用于属于信号谐波124_1至124_6之间的非音调背景噪声的频谱系数的多个群组118_1至118_5(或个别频谱系数)。
另外,编码器100可用于确定指示音频信号102的至少两个谐波信号分量124_1至124_6之间的频谱间距的谐波间距值,该谐波间距值指示代表音频信号102的至少两个谐波信号分量124_1至124_6的多个个别频谱系数或频谱系数的多个群组。
此外,编码器100可用于提供经编码的音频信号120使得经编码的音频信号120包括间距值(例如,每帧一个间距值)或(可选地)可直接得出间距值的参数。
本发明实施例通过将谐波间距值引入FDP过程解决了前述FDP方法的两个问题,该谐波间距值从编码器(发射器)100被信号发送至各个解码器(接收器)使得二者可以以完全同步的方式操作。所述谐波间距值可作为与待编码的帧相关联的一个或多个频谱的瞬时基本频率(或音高)的指示器,并识别哪些频谱仓(频谱系数)应被预测。更明确地,只有位于(关于其索引)基本音高的整数倍(如由谐波间距值定义)处的谐波信号分量周围的那些频谱系数应受到预测。图2和3借助于简单示例示出此音高自适应性预测方法,其中图3展示MPEG-2AAC中的当前技术水平的预测器的操作,其不只在谐波栅周围预测,还使低于一定停止频率的每个频谱仓受到预测,且其中图2绘示具有根据实施例的修改被整合以仅在最接近谐波间距栅的那些“音调”仓上执行预测的相同的预测器。
比较图2与图3揭示根据实施例的修改的两个优点,即:(1)非常少的频谱仓被包括于预测过程中,减少了复杂度(在所给的例子中由于仅预测五分之三的仓而减少大约40%),以及(2)属于谐波信号之间的非音调背景噪声的仓不受预测影响,其应该会增加预测的效率。
应注意的是,谐波间距值不一定需要对应于输入信号的实际瞬时音高,其也可代表真实音高的分数或倍数,只要可对预测过程的效率产生整体改进。此外,必须强调的是,谐波间距值不一定要反映仓索引或带宽单位的整数倍,而可包括所述单位的分数。
随后将描述MPEG式音频编码器的优选实施。
音高自适应性预测被优选地整合至MPEG-2AAC中[ISO/IEC 13818-7,“Information technology–Part 7:Advanced Audio Coding(AAC),”2006.]或,利用如在AAC中的相似预测器而被整合至MPEG-H 3D音频编解码器中[ISO/IEC 23008-3,“Information technology–High efficiency coding,part 3:3D audio(信息技术-高效率编码,第三部分:3D音频)”2015.]。特别地,针对非独立编码的每个帧和通道,一比特旗标可被写入至、且读取自各个比特流(对于独立帧通道,因为可停用预测以确保独立性,旗标可不被传输)。若将旗标设置为一,则其他8比特可被写入和读取。此8比特代表用于给定帧和通道的谐波间距值的量化版本(例如索引)。采用使用线性或非线性映射函数而从量化版本得出的谐波间距值,可以以根据图2所示的实施例的方式实现预测过程。优选地,只有位于谐波栅周围的1.5仓的最大距离内的仓受到预测。例如,若谐波距离值指示在仓索引47.11处的谐波线,则只有在索引46、47及48的仓会受到预测。然而,所述最大距离可被不同地指定,对于所有通道和帧为固定先验的或基于谐波间距值分别用于每个帧及通道。
图4展示用于对经编码的信号120进行解码的解码器200的示意性框图。解码器200用于在变换域或滤波器组域204中对经编码的音频信号120进行解码,其中解码器200用于对经编码的音频信号120进行解析以为当前帧208_t0获得音频信号的经编码的频谱系数206_t0_f1至206_t0_f6以及为至少一个先前帧208_t-1获得经编码的频谱系数206_t-1_f0至206_t-1_f6,及其中解码器200用于将预测解码选择性地应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数或经编码的频谱系数的群组。
在实施例中,解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数,如应用于由至少一个经编码的频谱系数分隔的两个个别经编码的频谱系数。另外,解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的经编码的频谱系数的多个群组(每个群组包括至少两个经编码的频谱系数),诸如应用于由至少一个经编码的频谱系数分隔的经编码的频谱系数的两个群组。另外,解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数和/或经编码的频谱系数的群组,诸如应用于由至少一个经编码的频谱系数分隔的至少一个个别经编码的频谱系数及经编码的频谱系数的至少一个群组。
在图4展示的示例中,解码器200可用于为当前帧208_t0确定六个经编码的频谱系数206_t0_f1至206_t0_f6以及为先前帧208_t-1确定六个经编码的频谱系数206_t-1_f1至206_t-1_f6。由此,解码器200用于将预测解码选择性地应用于当前帧的个别第二经编码的频谱系数206_t0_f2以及应用于由当前帧208_t0的第四及第五经编码的频谱系数206_t0_f4与206_t0_f5组成的经编码的频谱系数的群组。如可见,个别第二经编码的频谱系数206_t0_f2及由第四和第五经编码的频谱系数206_t0_f4与206_t0_f5组成的经编码的频谱系数的群组是通过第三经编码的频谱系数206_t0_f3而彼此分隔的。
应注意的是,此处使用的术语“选择性”是指将预测解码(仅)应用于所选择的经编码的频谱系数。换句话说,预测解码不必要应用于所有经编码的频谱系数,而是仅应用于所选择的个别经编码的频谱系数或经编码的频谱系数的群组,所选择的个别经编码的频谱系数和/或经编码的频谱系数的群组通过至少一个经编码的频谱系数而互相分隔。换句话说,预测解码不应用于分隔所选择的多个个别经编码的频谱系数或经编码的频谱系数的群组的至少一个经编码的频谱系数。
在实施例中,解码器200可用于不将预测解码应用于分隔个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组的至少一个经编码的频谱系数206_t0_f3。
解码器200可用于对经编码的频谱系数进行熵解码,以为待应用预测解码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5获得量化预测误差,及为将不应用预测解码的至少一个频谱系数获得量化频谱系数206_t0_f3。由此,解码器200可用于将量化预测误差应用于多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4及210_t0_f5的群组,以为当前帧208_t0获得与应用预测解码的经编码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5相关联的经解码的频谱系数。
举例而言,解码器200可用于为第二量化频谱系数206_t0_f2获得第二量化预测误差及将第二量化预测误差应用于经预测的第二频谱系数210_t0_f2,以获得与第二经编码的频谱系数206_t0_f2相关联的第二经解码的频谱系数,其中解码器200可用于为第四量化频谱系数206_t0_f4获得第四量化预测误差及将第四量化预测误差应用于经预测的第四频谱系数210_t0_f4,以获得与第四经编码的频谱系数206_t0_f4相关联的第四经解码的频谱系数,以及其中解码器200可用于为第五量化频谱系数206_t0_f5获得第五量化预测误差及将第五量化预测误差应用于经预测的第五频谱系数210_t0_f5,以获得与第五经编码的频谱系数206_t0_f5相关联的第五经解码的频谱系数。
另外,解码器200可用于基于先前帧208_t-1的对应的多个个别经编码的频谱系数206_t-1_f2(例如,使用与多个个别经编码的频谱系数206_t-1_f2相关联的多个先前解码的频谱系数)或经编码的频谱系数206_t-1_f4及206_t-1_f5的群组(例如,使用与经编码的频谱系数206_t-1_f4和206_t-1_f5的群组相关联的先前解码的频谱系数的群组),为当前帧208_t0确定多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4及210_t0_f5的群组。
举例而言,解码器200可用于使用与先前帧208_t-1的第二经编码的频谱系数206_t-1_f2相关联的先前解码(量化)的第二频谱系数确定当前帧208_t0的第二经预测的频谱系数210_t0_f2、使用与先前帧208_t-1的第四经编码的频谱系数206_t-1_f4相关联的先前解码(量化)的第四频谱系数确定当前帧208_t0的第四经预测的频谱系数210_t0_f4、及使用与先前帧208_t-1的第五经编码的频谱系数206_t-1_f5相关联的先前解码(量化)的第五频谱系数确定当前帧208_t0的第五经预测的频谱系数210_t0_f5。
此外,解码器200可用于从间距值得出预测系数,且其中解码器200可用于使用至少两个先前帧208_t-1及208_t-2的对应的多个先前解码的个别频谱系数或先前解码的频谱系数的群组及使用得出的预测系数,为当前帧208_t0计算多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4和210_t0_f5的群组。
举例而言,解码器200可用于:从间距值得出用于第二经编码的频谱系数206_t0_f2的预测系数212_f2及214_f2、从间距值得出用于第四经编码的频谱系数206_t0_f4的预测系数212_f4及214_f4,以及从间距值得出用于第五经编码的频谱系数206_t0_f5的预测系数212_f5及214_f5。
应注意的是,解码器200可用于解码经编码的音频信号120从而为应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组获得量化预测误差而不是多个个别量化频谱系数或量化频谱系数的群组。
另外,解码器200可用于对经编码的音频信号120进行解码从而获得分隔多个个别频谱系数或频谱系数的群组的量化频谱系数,使得存在经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组(为其获得了量化预测误差)以及经编码的频谱系数206_t0_f3或经编码的频谱系数的群组(为其获得了量化频谱系数)的交替。
解码器200可用于使用与应用预测解码的经编码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5相关联的经解码的频谱系数及使用与不应用预测解码的经编码的频谱系数206_t0_f1、206_t0_f3及206_t0_f6相关联的经熵解码的频谱系数提供经解码的音频信号220。
在实施例中,解码器200可用于获得间距值,其中解码器200可用于基于间距值选择应用预测解码的多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
如以上关于对应的编码器100的描述提及的,间距值可以是,例如,在音频信号的两个特征频率之间的间距(或距离)。另外,间距值可以是近似于音频信号的两个特征频率之间的间距的频谱系数的整数编号(或频谱系数的索引)。自然地,间距值还可以是描述音频信号的两个特征频率之间的间距的频谱系数的整数编号的分数或倍数。
解码器200可用于选择根据由间距值定义的谐波栅而频谱布置的个别频谱系数或频谱系数的群组以用于预测解码。由间距值定义的谐波栅可描述音频信号102中的谐波的周期性频谱分布(等距间距)。换句话说,由间距值定义的谐波栅可以是描述音频信号102的谐波的等距间距的间距值的序列。
另外,解码器200可用于选择频谱系数(例如,仅那些频谱系数),其频谱索引与基于间距值得出的多个频谱索引相等或位于基于间距值得出的多个频谱索引周围的范围(例如,预先确定或可变的范围)内,以用于预测解码。由此,解码器200可用于依据间距值而设定该范围的宽度。
在实施例中,经编码的音频信号可包括间距值或其经编码的版本(例如,可从其直接得出间距值的参数),其中解码器200可用于从经编码的音频信号提取间距值或其经编码的版本以获得间距值。
可选地,解码器200可用于由其自身确定间距值,即,经编码的音频信号不包括间距值。在此情况下,解码器200可用于确定(代表音频信号102的经编码的音频信号120的)瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。
在实施例中,解码器200可用于选择应用预测解码的多个个别频谱系数或频谱系数的群组使得在应用预测解码的多个个别频谱系数或频谱系数的群组与分隔应用预测解码的多个个别频谱系数或频谱系数的群组的频谱系数之间存在周期性交替,其以+/-1频谱系数的容差为周期。
在实施例中,由经编码的音频信号120代表的音频信号102包括至少两个谐波信号分量,其中解码器200用于将预测解码选择性地应用于代表音频信号102的至少两个谐波信号分量或至少两个谐波信号分量周围的频谱环境的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。至少两个谐波信号分量周围的频谱环境可为,例如,+/-1、2、3、4或5个频谱分量。
由此,解码器200可用于识别至少两个谐波信号分量,并将预测解码选择性地应用于与(例如,代表经识别的谐波信号分量或环绕经识别的谐波信号分量的)经识别的谐波信号分量相关联的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
可选地,经编码的音频信号120可包括识别至少两个谐波信号分量的信息(例如,间距值)。在此情况下,解码器200可用于将预测解码选择性地应用于与(例如,代表经识别的谐波信号分量或环绕经识别的谐波信号分量的)经识别的谐波信号分量相关联的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
在前述提及的替代方案中,解码器200可用于不将预测解码应用于不代表音频信号102的至少两个谐波信号分量或至少两个谐波信号分量的频谱环境的那些多个个别经编码的频谱系数206_t0_f3、206_t0_f1及206_t0_f6或经编码的频谱系数的群组。
换句话说,解码器200可用于不将预测解码应用于属于音频信号102的信号谐波之间的非音调背景噪声的那些多个个别经编码的频谱系数206_t0_f3、206_t0_f1、206_t0_f6或经编码的频谱系数的群组。
图5展示根据实施例的用于编码音频信号的方法300的流程图。方法300包括:为当前帧或至少一个先前帧确定音频信号的频谱系数的步骤302,以及将预测编码选择性地应用于由至少一个频谱系数分隔的多个个别频谱系数或频谱系数的群组的步骤304。
图6展示根据实施例的用于对经编码的音频信号进行解码的方法400的流程图。方法400包括:对经编码的音频信号进行解析以为当前帧及至少一个先前帧获得音频信号的经编码的频谱系数的步骤402,以及将预测解码选择性地应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数或经编码的频谱系数的群组的步骤404。
虽然已在装置的上下文中描述一些方面,显然,这些方面还代表对应方法的描述,其中区块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也代表对应装置的对应区块或条目或特征的叙述。可由(或使用)硬件装置(例如,微处理器、可编程计算机或电子电路)执行方法步骤的一些或全部。在一些实施例中,可由此类装置执行一个或多个最重要的方法步骤。
本发明的经编码的音频信号可储存于数字储存媒介上或可在如无线传输媒介的传输媒介或如因特网的有线传输媒介上被传输。
依据某些实施需求,可以以硬件或软件方式实施本发明的实施例。可使用具有储存于其上的电子可读控制信号的数字储存媒介(例如,软式磁盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)执行此实施,其与可编程计算机系统协作(或能够协作)以执行各自的方法。因此,数字储存媒介可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,其能够与可编程计算机系统协作,以执行本文所描述的方法的一个。
一般地,本发明的实施例可被实施为带有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可被操作为执行方法的一个。程序代码可例如储存于机器可读载体上。
其他实施例包括用于执行本文所描述的方法的一个的计算机程序,其储存于机器可读载体上。
换句话说,所发明方法的实施例因此是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,用于执行本文描述的方法的一个。
本发明方法的其他实施例因此是数据载体(或数字储存媒介或计算机可读媒介),其包括,记录于其上的用于执行本文所描述的方法的一个的计算机程序。数据载体、数字储存媒介或计算机可读媒介通常是有形和/或非瞬时的。
本发明方法的其他实施例因此是代表用于执行本文所描述的方法的一个的计算机程序的数据串流或信号序列。数据串流或信号序列可例如用于经由数据通讯连接(例如,经由因特网)而传输。
其他实施例包括运算构件,例如计算机、或可编程逻辑设备,用于或适用于执行本文所描述的方法的一个。
其他实施例包括用于执行本文所描述的方法的一个的计算机,该计算机具有安装于其上的计算机程序。
根据本发明的其他实施例包括用于将用于执行本文所描述的方法的一个的计算机程序传送(例如,电子或光学地)至接收器的装置或系统。该接收器,例如,可以是计算机、行动设备、内存设备或类似装置。该装置或系统可,例如,包括用于将计算机程序传送至接收器的文件服务器。
在一些实施例中,可编程逻辑设备(例如现场可编程门阵列)可用来执行本文所描述的方法的一些或所有功能。在一些实施例中,现场可编程门阵列可与微处理器协作从而执行本文所描述的方法的一个。一般地,优选地由任何硬件装置执行此方法。
可使用硬件装置、或使用计算机、或使用硬件装置及计算机的组合来实施本文所描述的装置。
可使用硬件装置、或使用计算机、或使用硬件装置及计算机的组合来执行本文所描述的方法。
以上描述的实施例仅用于说明本发明的原理。应理解的是,本文所描述的布置及细节的修改和变形对本领域技术人员是显而易见的。因此,此意图为仅由所附权利要求的范围而不是由本文的实施例的说明和描述的方式所呈现的具体细节限制。
Claims (24)
1.一种用于编码音频信号(102)的编码器(100),其中所述编码器(100)用于在变换域或滤波器组域(104)中编码所述音频信号(102),其中所述编码器用于为当前帧(108_t0)和至少一个先前帧(108_t-1)确定所述音频信号(102)的频谱系数(106_t0_f1:106_t0_f6;106_t-1_f1:106_t-1_f6),其中所述编码器(100)用于将预测编码选择性地应用于多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组,其中所述编码器(100)用于确定间距值,其中所述编码器(100)用于基于所述间距值选择应用预测编码的所述多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组;
其中所述间距值是描述谐波之间的间距的谐波间距值;
其中所述编码器(100)用于通过对所述当前帧的多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组与所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组之间的预测误差进行编码,对所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组进行预测编码;
其中所述编码器(100)用于使用先前帧(108_t-1)的多个个别频谱系数(106_t-1_f2)或频谱系数(106_t-1_f4,106_t-1_f5)的群组的对应的量化版本,为所述当前帧(108_t0)确定所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f4)的群组;
其中所述编码器(100)用于从所述间距值得出预测系数,且其中所述编码器(100)用于使用至少两个先前帧(108_t-2,108_t-1)的多个个别频谱系数(106_t-2_f2,106_t-1_f2)或频谱系数(106_t-2_f4,106_t-1_f4;106_t-2_f5,106_t-1_f5)的群组的对应的量化版本以及使用得出的预测系数,为所述当前帧(108_t0)计算所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组。
2.根据权利要求1所述的编码器(100),其中所述多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组由至少一个频谱系数(106_t0_f3)分隔。
3.根据权利要求2所述的编码器(100),其中预测编码不被应用于对所述多个个别频谱系数(106_t0_f2)或所述频谱系数(106_t0_f4,106_t0_f5)的群组进行分隔的所述至少一个频谱系数(106_t0_f3)。
4.根据权利要求1所述的编码器(100),其中所述编码器(100)用于从所述间距值得出预测系数,且其中所述编码器(100)用于使用至少两个先前帧(108_t-2,108_t-1)的对应的多个个别频谱系数(106_t-2_f2,106_t-1_f2)或对应的频谱系数(106_t-2_f4,106_t-1_f4;106_t-2_f5,106_t-1_f5)的群组以及使用得出的预测系数,为所述当前帧(108_t0)计算所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组。
5.根据权利要求4所述的编码器(100),其中所述编码器(100)用于提供经编码的音频信号(120),所述经编码的音频信号(120)不包括预测系数或所述预测系数的经编码的版本。
6.根据权利要求1所述的编码器(100),其中所述编码器(100)用于提供经编码的音频信号(120),所述经编码的音频信号(120)对于应用预测编码的多个个别频谱系数或频谱系数的群组包括预测误差的量化版本而不是所述多个个别频谱系数(106_t0_f2)或所述频谱系数(106_t0_f4,106_t0_f5)的群组的量化版本。
7.根据权利要求6所述的编码器(100),其中所述经编码的音频信号(120)包括不应用预测编码的频谱系数(106_t0_f3)的量化版本,使得存在其预测误差的量化版本被包括在所述经编码的音频信号(120)中的频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组与不使用预测编码而为其提供了量化版本的频谱系数(106_t0_f1,106_t0_f3,106_t0_f6)或频谱系数的群组的交替。
8.根据权利要求1所述的编码器(100),其中所述编码器(100)用于确定所述音频信号(102)的瞬时基本频率并从所述瞬时基本频率或所述瞬时基本频率的分数或倍数得出所述间距值。
9.根据权利要求1所述的编码器(100),其中所述编码器(100)用于选择用于预测编码的根据由所述间距值定义的谐波栅而频谱布置的个别频谱系数或频谱系数的群组(116_1:116_6)。
10.根据权利要求1所述的编码器(100),其中所述编码器(100)用于选择用于预测编码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
11.根据权利要求10所述的编码器(100),其中所述编码器(100)用于依据所述间距值设定所述范围的宽度。
12.根据权利要求1所述的编码器,其中所述编码器(100)用于选择应用预测编码的多个个别频谱系数或频谱系数的群组(116_1:116_6),以使得在应用预测编码的多个个别频谱系数或频谱系数的群组(116_1:116_6)与不应用预测编码的频谱系数或频谱系数的群组(118_1:118_5)之间存在以+/-1频谱系数的容差为周期的周期性交替。
13.根据权利要求1所述的编码器(100),其中所述音频信号(102)包括至少两个谐波信号分量(124_1:124_6),其中所述编码器(100)用于将预测编码选择性地应用于代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)或所述至少两个谐波信号分量(124_1:124_6)周围的频谱环境的多个个别频谱系数或频谱系数的群组(116_1:116_6)。
14.根据权利要求13所述的编码器(100),其中所述编码器(100)用于不将预测编码应用于不代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)或所述至少两个谐波信号分量(124_1:124_6)的频谱环境的多个个别频谱系数或频谱系数的群组(118_1:118_5)。
15.根据权利要求13所述的编码器(100),其中所述编码器(100)用于不将预测编码应用于属于信号谐波(124_1:124_6)之间的非音调背景噪声的多个个别频谱系数或频谱系数的群组(118_1:118_5)。
16.根据权利要求13所述的编码器(100),其中所述间距值是指示所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)之间的频谱间距的谐波间距值,所述谐波间距值指示代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)的多个个别频谱系数或频谱系数的群组(116_1:116_6)。
17.根据权利要求1所述的编码器(100),其中所述编码器(100)用于提供经编码的音频信号(120),其中所述编码器(100)用于将所述间距值或所述间距值的经编码的版本包括于所述经编码的音频信号(120)中。
18.根据权利要求1所述的编码器(100),其中所述频谱系数是频谱仓。
19.一种用于编码音频信号(102)的编码器(100),其中所述编码器(100)用于在变换域或滤波器组域(104)中编码所述音频信号(102),其中所述编码器用于为当前帧(108_t0)和至少一个先前帧(108_t-1)确定所述音频信号(102)的频谱系数(106_t0_f1:106_t0_f6;106_t-1_f1:106_t-1_f6),其中所述编码器(100)用于将预测编码选择性地应用于多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组,其中所述编码器(100)用于确定间距值,其中所述编码器(100)用于基于所述间距值选择应用预测编码的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组;
其中所述编码器(100)用于通过对所述当前帧的多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组与所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组之间的预测误差进行编码,对所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组进行预测编码;
其中所述编码器(100)用于使用先前帧(108_t-1)的多个个别频谱系数(106_t-1_f2)或频谱系数(106_t-1_f4,106_t-1_f5)的群组的对应的量化版本,为所述当前帧(108_t0)确定所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f4)的群组;
其中所述编码器(100)用于从所述间距值得出预测系数,且其中所述编码器(100)用于使用至少两个先前帧(108_t-2,108_t-1)的多个个别频谱系数(106_t-2_f2,106_t-1_f2)或频谱系数(106_t-2_f4,106_t-1_f4;106_t-2_f5,106_t-1_f5)的群组的对应的量化版本以及使用得出的预测系数,为所述当前帧(108_t0)计算所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组;以及
其中所述编码器(100)用于选择用于预测编码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
20.一种用于对经编码的音频信号(120)进行解码的解码器(200),其中所述解码器(200)用于在变换域或滤波器组域(204)中对所述经编码的音频信号(120)进行解码,其中所述解码器(200)用于对所述经编码的音频信号(120)进行解析以为当前帧(208_t0)和至少一个先前帧(208_t-1)获得所述音频信号(120)的经编码的频谱系数(206_t0_f1:206_t0_f6;206_t-1_f1:206_t-1_f6),以及其中所述解码器(200)用于将预测解码选择性地应用于多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组,其中所述解码器(200)用于获得间距值,其中所述解码器(200)用于基于所述间距值选择应用预测解码的所述多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组;
其中所述解码器(200)用于对经编码的频谱系数进行熵解码,以为待应用预测解码的频谱系数(206_t0_f2,206_t0_f4,206_t0_f5)获得量化预测误差,以及为将不应用预测解码的频谱系数(206_t0_f3)获得量化频谱系数;
其中所述解码器(200)用于将所述量化预测误差应用于多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组,以为所述当前帧(208_t0)获得与应用预测解码的经编码的频谱系数(206_t0_f2,206_t0_f4,206_t0_f5)相关联的经解码的频谱系数;
其中所述解码器(200)用于基于先前帧(208_t-1)的对应的多个个别经编码的频谱系数(206_t-1_f2)或经编码的频谱系数(206_t-1_f4,206_t-1_f5)的群组,为所述当前帧(208_t0)确定所述多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组;
其中所述解码器(200)用于从所述间距值得出预测系数,且其中所述解码器(200)用于使用至少两个先前帧的对应的多个先前解码的个别频谱系数或先前解码的频谱系数的群组以及使用得出的预测系数,为所述当前帧(208_t0)计算所述多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组;
其中所述解码器(200)用于选择用于预测解码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
21.一种用于在变换域或滤波器组域中编码音频信号的方法(300),所述方法包括:
为当前帧和至少一个先前帧确定(302)所述音频信号的频谱系数;
确定间距值;
将预测编码选择性地应用(304)于多个个别频谱系数或频谱系数的群组,其中应用预测编码的多个个别频谱系数或频谱系数的群组是基于所述间距值而选择的;
其中所述间距值是描述谐波之间的间距的谐波间距值;
通过对所述当前帧的多个经预测的个别频谱系数或经预测的频谱系数的群组与所述当前帧的多个个别频谱系数或频谱系数的群组之间的预测误差进行编码,对所述当前帧的多个个别频谱系数或频谱系数的群组进行预测编码;
使用先前帧的多个个别频谱系数或频谱系数的群组的对应的量化版本,为所述当前帧确定所述多个经预测的个别频谱系数或经预测的频谱系数的群组;
从所述间距值得出预测系数,且其中使用至少两个先前帧的多个个别频谱系数或频谱系数的群组的对应的量化版本以及使用得出的预测系数,为所述当前帧计算所述多个经预测的个别频谱系数或经预测的频谱系数的群组。
22.一种用于在变换域或滤波器组域中编码音频信号的方法(300),所述方法包括:
为当前帧和至少一个先前帧确定(302)所述音频信号的频谱系数;
确定间距值;
将预测编码选择性地应用(304)于多个个别频谱系数或频谱系数的群组,其中应用预测编码的多个个别频谱系数或频谱系数的群组是基于所述间距值而选择的;
通过对所述当前帧的多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组与所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组之间的预测误差进行编码,对所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组进行预测编码;
使用先前帧(108_t-1)的多个个别频谱系数(106_t-1_f2)或频谱系数(106_t-1_f4,106_t-1_f5)的群组的对应的量化版本,为所述当前帧(108_t0)确定所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f4)的群组;
从所述间距值得出预测系数;
使用至少两个先前帧(108_t-2,108_t-1)的多个个别频谱系数(106_t-2_f2,106_t-1_f2)或频谱系数(106_t-2_f4,106_t-1_f4;106_t-2_f5,106_t-1_f5)的群组的对应的量化版本以及使用得出的预测系数,为所述当前帧(108_t0)计算所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组;以及
选择用于预测编码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
23.一种用于在变换域或滤波器组域中对经编码的音频信号进行解码的方法(400),所述方法包括:
对所述经编码的音频信号进行解析(402)以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数;
获得间距值;以及
将预测解码选择性地应用(404)于多个个别经编码的频谱系数或经编码的频谱系数的群组,其中应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组是基于所述间距值而选择的;
对经编码的频谱系数进行熵解码,以为待应用预测解码的频谱系数(206_t0_f2,206_t0_f4,206_t0_f5)获得量化预测误差,以及为将不应用预测解码的频谱系数(206_t0_f3)获得量化频谱系数;
将所述量化预测误差应用于多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组,以为所述当前帧(208_t0)获得与应用预测解码的经编码的频谱系数(206_t0_f2,206_t0_f4,206_t0_f5)相关联的经解码的频谱系数;
基于先前帧(208_t-1)的对应的多个个别经编码的频谱系数(206_t-1_f2)或经编码的频谱系数(206_t-1_f4,206_t-1_f5)的群组,为所述当前帧(208_t0)确定所述多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组;
从所述间距值得出预测系数;
使用至少两个先前帧的对应的多个先前解码的个别频谱系数或先前解码的频谱系数的群组以及使用得出的预测系数,为所述当前帧(208_t0)计算所述多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组;
选择用于预测解码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
24.一种非暂时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时执行根据权利要求21至23中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110984953.6A CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984955.5A CN114067813A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158253 | 2015-03-09 | ||
EP15158253.3 | 2015-03-09 | ||
EPPCT/EP2015/063658 | 2015-06-17 | ||
PCT/EP2015/063658 WO2016142002A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
PCT/EP2016/054831 WO2016142357A1 (en) | 2015-03-09 | 2016-03-07 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110984955.5A Division CN114067813A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984953.6A Division CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107533847A CN107533847A (zh) | 2018-01-02 |
CN107533847B true CN107533847B (zh) | 2021-09-10 |
Family
ID=52692424
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110984955.5A Pending CN114067813A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984953.6A Pending CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN201680015022.2A Active CN107533847B (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110984955.5A Pending CN114067813A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984953.6A Pending CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Country Status (20)
Country | Link |
---|---|
US (2) | US10600428B2 (zh) |
EP (3) | EP4297027A3 (zh) |
JP (3) | JP6666356B2 (zh) |
KR (1) | KR102151728B1 (zh) |
CN (3) | CN114067813A (zh) |
AR (6) | AR103890A1 (zh) |
AU (4) | AU2016231220B2 (zh) |
BR (1) | BR112017019185B1 (zh) |
CA (1) | CA2978815C (zh) |
ES (1) | ES2821025T3 (zh) |
HK (1) | HK1244583A1 (zh) |
MX (1) | MX365267B (zh) |
MY (1) | MY181486A (zh) |
PL (2) | PL3373298T3 (zh) |
PT (1) | PT3268960T (zh) |
RU (1) | RU2707151C2 (zh) |
SG (1) | SG11201707349WA (zh) |
TW (1) | TWI613644B (zh) |
WO (1) | WO2016142002A1 (zh) |
ZA (6) | ZA201706604B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2020094263A1 (en) * | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
CN109473116B (zh) * | 2018-12-12 | 2021-07-20 | 思必驰科技股份有限公司 | 语音编码方法、语音解码方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
US20040153316A1 (en) * | 2003-01-30 | 2004-08-05 | Hardwick John C. | Voice transcoder |
US20050078754A1 (en) * | 2003-09-07 | 2005-04-14 | Microsoft Corporation | Scan patterns for interlaced video content |
WO2006113921A1 (en) * | 2005-04-20 | 2006-10-26 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
TW200638336A (en) * | 2005-03-11 | 2006-11-01 | Qualcomm Inc | Time warping frames inside the vocoder by modifying the residual |
US20070016415A1 (en) * | 2005-07-15 | 2007-01-18 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US20080312758A1 (en) * | 2007-06-15 | 2008-12-18 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
US20100063802A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive Frequency Prediction |
US20120029925A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
WO2014108393A1 (en) * | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
WO2014202770A1 (en) * | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH572650A5 (zh) * | 1972-12-21 | 1976-02-13 | Gretag Ag | |
JPS6031198A (ja) * | 1983-07-29 | 1985-02-16 | 松下電器産業株式会社 | 予測残差信号符号化方法 |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3680374B2 (ja) * | 1995-09-28 | 2005-08-10 | ソニー株式会社 | 音声合成方法 |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
JP2002162998A (ja) * | 2000-11-28 | 2002-06-07 | Fujitsu Ltd | パケット修復処理を伴なう音声符号化方法 |
EP1304885A3 (de) * | 2001-09-14 | 2005-04-20 | Siemens Aktiengesellschaft | Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen |
WO2003088314A2 (en) * | 2002-04-12 | 2003-10-23 | Arch Specialty Chemicals, Inc. | Remote monitoring system for chemical liquid delivery |
EP1475144A2 (de) * | 2003-05-09 | 2004-11-10 | Pfaudler Werke GmbH | Stromstörer für einen Rührkessel, aufweisend mindestens ein Stromstörelement |
EP1667109A4 (en) * | 2003-09-17 | 2007-10-03 | Beijing E World Technology Co | METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
TWI277013B (en) * | 2005-02-01 | 2007-03-21 | Ind Tech Res Inst | Method for reducing buffered-frame memory sizes and accesses in a video codec |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
KR101365445B1 (ko) * | 2007-01-03 | 2014-02-19 | 삼성전자주식회사 | 전역 및 국부 움직임 보상을 순차적으로 이용하는 움직임보상 방법, 복호화 방법, 장치, 인코더 및 디코더 |
DE102007018484B4 (de) * | 2007-03-20 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
CN101965612B (zh) | 2008-03-03 | 2012-08-29 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
EP3300076B1 (en) * | 2008-07-11 | 2019-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and audio decoder |
ES2642906T3 (es) * | 2008-07-11 | 2017-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador |
EP2311034B1 (en) * | 2008-07-11 | 2015-11-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
US8406307B2 (en) * | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
EP2192786A1 (en) * | 2008-11-27 | 2010-06-02 | Panasonic Corporation | Frequency domain filters for video coding |
EP2380363B1 (en) * | 2009-01-20 | 2015-09-30 | MED-EL Elektromedizinische Geräte GmbH | High accuracy tonotopic and periodic coding with enhanced harmonic resolution |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
BR112012007803B1 (pt) * | 2009-10-08 | 2022-03-15 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear |
EP4358082A1 (en) * | 2009-10-20 | 2024-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
KR101487687B1 (ko) * | 2010-01-14 | 2015-01-29 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
ES2458354T3 (es) * | 2010-03-10 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de señales de audio, codificador de señales de audio, métodos y programa de ordenador que utiliza tasa de muestreo dependiente de la codificación del contorno de distorsión en el tiempo |
CN101847413B (zh) * | 2010-04-09 | 2011-11-16 | 北京航空航天大学 | 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法 |
JP5387522B2 (ja) * | 2010-07-01 | 2014-01-15 | コニカミノルタ株式会社 | カラー画像形成装置 |
CA3067155C (en) * | 2010-09-16 | 2021-01-19 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
CA2813898C (en) * | 2010-10-07 | 2017-05-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for level estimation of coded audio frames in a bit stream domain |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
EP2684355B1 (en) * | 2011-03-10 | 2014-11-12 | Telefonaktiebolaget L M Ericsson (PUBL) | Decoding of transforms with curved basis functions |
EP2770503B1 (en) * | 2011-10-21 | 2019-05-29 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame errors and method and apparatus for audio decoding |
EP2795884A4 (en) * | 2011-12-20 | 2015-07-29 | Nokia Corp | AUDIOCONFERENCING |
CN109147827B (zh) | 2012-05-23 | 2023-02-17 | 日本电信电话株式会社 | 编码方法、编码装置以及记录介质 |
CN102798870B (zh) * | 2012-08-07 | 2013-09-25 | 中国空间技术研究院 | 一种卫星导航系统兼容性分析方法 |
WO2014054556A1 (ja) * | 2012-10-01 | 2014-04-10 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、および記録媒体 |
US9528371B2 (en) * | 2013-02-27 | 2016-12-27 | Evolution Engineering Inc. | Fluid pressure pulse generating apparatus and method of using same |
JP6013646B2 (ja) * | 2013-04-05 | 2016-10-25 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
PL3285256T3 (pl) * | 2013-10-31 | 2020-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału pobudzenia w dziedzinie czasu |
WO2015068225A1 (ja) | 2013-11-06 | 2015-05-14 | 株式会社日立製作所 | 信号伝送回路及びプリント基板 |
EP3040987B1 (en) * | 2013-12-02 | 2019-05-29 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
CN104934034B (zh) * | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
SG11201608787UA (en) * | 2014-03-28 | 2016-12-29 | Samsung Electronics Co Ltd | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
JP5723472B1 (ja) * | 2014-08-07 | 2015-05-27 | 廣幸 田中 | データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル |
US9536509B2 (en) * | 2014-09-25 | 2017-01-03 | Sunhouse Technologies, Inc. | Systems and methods for capturing and interpreting audio |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US20170022149A1 (en) * | 2015-07-25 | 2017-01-26 | Mark Quang Nguyen | Fumarate compounds, pharmaceutical compositions thereof, and methods of use |
-
2015
- 2015-06-17 WO PCT/EP2015/063658 patent/WO2016142002A1/en active Application Filing
-
2016
- 2016-03-07 ES ES16709331T patent/ES2821025T3/es active Active
- 2016-03-07 AU AU2016231220A patent/AU2016231220B2/en active Active
- 2016-03-07 MX MX2017011494A patent/MX365267B/es active IP Right Grant
- 2016-03-07 EP EP23209483.9A patent/EP4297027A3/en active Pending
- 2016-03-07 EP EP16709331.9A patent/EP3268960B1/en active Active
- 2016-03-07 CN CN202110984955.5A patent/CN114067813A/zh active Pending
- 2016-03-07 EP EP18170157.4A patent/EP3373298B1/en active Active
- 2016-03-07 KR KR1020177028551A patent/KR102151728B1/ko active IP Right Grant
- 2016-03-07 CN CN202110984953.6A patent/CN114067812A/zh active Pending
- 2016-03-07 PL PL18170157.4T patent/PL3373298T3/pl unknown
- 2016-03-07 CN CN201680015022.2A patent/CN107533847B/zh active Active
- 2016-03-07 SG SG11201707349WA patent/SG11201707349WA/en unknown
- 2016-03-07 PT PT167093319T patent/PT3268960T/pt unknown
- 2016-03-07 CA CA2978815A patent/CA2978815C/en active Active
- 2016-03-07 PL PL16709331T patent/PL3268960T3/pl unknown
- 2016-03-07 JP JP2017546946A patent/JP6666356B2/ja active Active
- 2016-03-07 RU RU2017134620A patent/RU2707151C2/ru active
- 2016-03-07 MY MYPI2017001298A patent/MY181486A/en unknown
- 2016-03-07 BR BR112017019185-7A patent/BR112017019185B1/pt active IP Right Grant
- 2016-03-08 TW TW105107024A patent/TWI613644B/zh active
- 2016-03-09 AR ARP160100621A patent/AR103890A1/es active IP Right Grant
-
2017
- 2017-09-06 US US15/697,042 patent/US10600428B2/en active Active
- 2017-10-02 ZA ZA2017/06604A patent/ZA201706604B/en unknown
-
2018
- 2018-03-06 HK HK18103159.1A patent/HK1244583A1/zh unknown
-
2019
- 2019-05-06 AU AU2019203173A patent/AU2019203173B2/en active Active
- 2019-11-01 JP JP2019200326A patent/JP7078592B2/ja active Active
-
2020
- 2020-02-26 US US16/802,397 patent/US20200227058A1/en active Pending
-
2021
- 2021-05-31 AR ARP210101476A patent/AR122219A2/es unknown
- 2021-05-31 AR ARP210101478A patent/AR122487A2/es unknown
- 2021-05-31 AR ARP210101480A patent/AR122489A2/es unknown
- 2021-05-31 AR ARP210101479A patent/AR122488A2/es unknown
- 2021-05-31 AR ARP210101477A patent/AR122486A2/es unknown
- 2021-08-13 AU AU2021215252A patent/AU2021215252B2/en active Active
-
2022
- 2022-04-29 ZA ZA2022/04766A patent/ZA202204766B/en unknown
- 2022-04-29 ZA ZA2022/04765A patent/ZA202204765B/en unknown
- 2022-04-29 ZA ZA2022/04768A patent/ZA202204768B/en unknown
- 2022-04-29 ZA ZA2022/04767A patent/ZA202204767B/en unknown
- 2022-04-29 ZA ZA2022/04764A patent/ZA202204764B/en unknown
- 2022-05-19 JP JP2022082087A patent/JP2022110116A/ja active Pending
-
2023
- 2023-10-05 AU AU2023241343A patent/AU2023241343A1/en active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
US20040153316A1 (en) * | 2003-01-30 | 2004-08-05 | Hardwick John C. | Voice transcoder |
US20050078754A1 (en) * | 2003-09-07 | 2005-04-14 | Microsoft Corporation | Scan patterns for interlaced video content |
TW200638336A (en) * | 2005-03-11 | 2006-11-01 | Qualcomm Inc | Time warping frames inside the vocoder by modifying the residual |
WO2006113921A1 (en) * | 2005-04-20 | 2006-10-26 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
US20070016415A1 (en) * | 2005-07-15 | 2007-01-18 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US20080312758A1 (en) * | 2007-06-15 | 2008-12-18 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
US20100063802A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive Frequency Prediction |
US20120029925A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
CN103038821A (zh) * | 2010-07-30 | 2013-04-10 | 高通股份有限公司 | 用于谐波信号的译码的系统、方法、设备和计算机可读媒体 |
WO2014108393A1 (en) * | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
WO2014202770A1 (en) * | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
Non-Patent Citations (3)
Title |
---|
"ISO/IEC MPEG-2 Advanced Audio Coding";Bosi M 等;《Journal of the Audio Engineering Society》;19901001;第45卷(第10期);第789-814页 * |
"Low bit rate high quality audio coding with combined harmonic and wavelet representations";K.N. Hamdy 等;《1996 IEEE International Conference on Acoustics, Speech, and Signal Processing Conference Proceedings》;20020806;第2卷;第1045-1048页 * |
"低速率语音编码算法研究";计哲;《CNKI中国博士学位论文全文数据库信息科技辑》;20121115;第I136-12页 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107533847B (zh) | 音频编码器和音频解码器及对应的方法 | |
JP7391930B2 (ja) | 独立したノイズ充填を用いた強化された信号を生成するための装置および方法 | |
JP6248194B2 (ja) | 多チャネルオーディオ符号化におけるノイズ充填 | |
JP2018205758A (ja) | オーディオ信号のスペクトルのスペクトル係数のコード化 | |
CN110739001B (zh) | 支持变换长度切换的频域音频编码器、解码器、编码和解码方法 | |
WO2016142357A1 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |