CN101305423B - 自适应的基于时间/频率的音频编码和解码设备和方法 - Google Patents
自适应的基于时间/频率的音频编码和解码设备和方法 Download PDFInfo
- Publication number
- CN101305423B CN101305423B CN2006800415925A CN200680041592A CN101305423B CN 101305423 B CN101305423 B CN 101305423B CN 2006800415925 A CN2006800415925 A CN 2006800415925A CN 200680041592 A CN200680041592 A CN 200680041592A CN 101305423 B CN101305423 B CN 101305423B
- Authority
- CN
- China
- Prior art keywords
- frequency
- coding
- signal
- time
- coding mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 30
- 230000005236 sound signal Effects 0.000 claims abstract description 22
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims description 60
- 239000004615 ingredient Substances 0.000 claims description 16
- 230000003595 spectral effect Effects 0.000 claims description 13
- 230000007774 longterm Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 2
- 238000007906 compression Methods 0.000 abstract description 20
- 230000006835 compression Effects 0.000 abstract description 20
- 238000012545 processing Methods 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 238000000691 measurement method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
自适应的基于时间/频率的音频编码和解码设备和方法。所述编码设备包括:变换与模式确定单元,将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;编码单元,以各个编码模式对每个频域信号进行编码;比特流输出单元,为每个编码的频域信号输出编码的数据、划分信息和编码模式信息。在所述设备和方法中,声学特性和语音模型被同时应用于作为音频压缩处理单位的帧。结果,可产生对音乐和语音均有效的压缩方法,并且该压缩方法可用于要求低比特率的音频压缩的移动终端。
Description
技术领域
本申请要求于2005年11月8日提交到韩国知识产权局的第10-2005-0106354号韩国专利申请的优先权,其公开完整地包含于此,以资参考。
本发明总体构思涉及音频编码和解码设备和方法,更具体地讲,涉及这样的自适应的基于时间/频率的音频编码和解码设备和方法,所述设备和方法可通过有效地利用两种编码方法的编码增益来获得高压缩效率,其中,对输入音频数据执行频域变换,从而,对适合于语音压缩的音频数据的频段执行基于时间的编码,并对音频数据的其余频段执行基于频率的编码。
背景技术
传统的语音/音乐压缩算法大致可分为音频编解码算法和语音编解码算法。音频编解码算法(如aacPlus)对频域信号进行压缩,并应用心理声学模型。假设音频编解码和语音编解码对具有相等数据量的语音信号进行压缩,则音频编解码算法输出具有比语音编解码算法明显低许多的质量的声音。具体地讲,从音频编解码算法输出的声音的质量更多地受到攻击信号的不利影响。
语音编解码算法(如,自适应多比率的宽带编解码(AMR-WB))对时域信号进行压缩,并应用语音模型。假设语音编解码和音频编解码对具有相等数据量的语音信号进行压缩,则语音编解码算法输出具有比音频编解码算法明显低许多的质量的声音。
发明内容
技术问题
AMR-WB plus算法考虑了传统的语音/音乐压缩算法的上述特点以有效地执行语音/音乐压缩。在AMR-WB plus算法中,代数码激励线性预测(ACELP)算法用作语音压缩算法,和Tex字符转换(TCX)算法用作音频压缩算法。具体地讲,AMR-WB plus算法确定是否将ACELP算法或TCX算法应用于每个处理单元(例如,时间轴上的每一帧),然后相应地执行编码。在这种情况下,AMR-WB plus算法在对与语音信号接近的信号进行压缩时是有效的。然而,当AMR-WB plus算法用于对与音频信号接近的信号进行压缩时,由于AMR-WB plus算法以处理单位执行编码,所以音质或压缩率便下降。
技术方案
本发明总体构思提供这样的自适应的基于时间/频率的音频编码和解码设备和方法,所述设备和方法可通过有效地利用两种编码方法的编码增益来获得高压缩效率,其中,对输入音频数据执行频域变换,从而,对适合于语音压缩的音频数据的频段执行基于时间的编码,并对音频数据的其余频段执行基于频率的编码。
本发明总体构思的另外方面将在下面的描述中部分地阐明,并且从描述中部分是清楚的,或者通过本发明的实施可以被理解。
通过提供一种自适应的基于时间/频率的音频编码设备来实现本发明总体构思的上述和/或另外方面以及效用。所述编码设备包括:变换与模式确定单元,将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;编码单元,以由变换与模式确定单元选择的各个编码模式对每个频域信号进行编码;比特流输出单元,为每个编码的频域信号输出编码的数据、划分信息和编码模式信息。
变换与模式确定单元可包括:频域变换单元,将输入音频信号变换为全频域信号;编码模式确定单元,根据预设标准将全频域信号划分成频域信号,并为每个频域信号确定基于时间的编码模式或基于频率的编码模式。
可基于频谱倾斜、每个频域的信号能量的大小、子帧之间的信号能量的变化、以及语音水平确定中的至少一个,将全频域信号划分成适合于基于时间的编码模式或基于频率的编码模式的频域信号,并相应地为每个频域信号确定各个编码模式。
所述编码单元可包括:基于时间的编码单元,对被确定为以基于时间的编码模式编码的第一频域信号执行逆频域变换,并对已被执行了逆频域变换的第一频域信号执行基于时间的编码;基于频率的编码单元,对被确定为以基于频率的编码模式编码的第二频域信号执行基于频率的编码。
所述基于时间的编码单元可基于线性编码增益、相邻帧的线性预测滤波器之间的频谱变化、预测的音高延迟、以及预测的长期预测增益中的至少一个,为第一输入频域信号选择编码模式,当基于时间的编码单元确定基于时间的编码模式是适合于所述第一频域信号时,基于时间的编码单元继续对所述第一频域信号执行基于时间的编码,当基于时间的编码单元确定基于频率的编码模式适合于所述第一频域信号时,则基于时间的编码单元停止对所述第一频域信号执行基于时间的编码并将模式转换控制信号发送到变换与模式确定单元,变换与模式确定单元可响应于模式转换控制信号将被提供给基于时间的编码单元的所述第一频域信号输出到基于频率的编码单元。
频域变换单元可使用变频调制重叠变换(MLT)执行频域变换。基于时间的编码单元可对从线性预测获得的残余信号进行量化,并根据重要性动态地将比特分配给量化的残余信号。基于时间的编码单元可将从线性预测获得的残余信号变换为频域信号,对所述频域信号进行量化,并根据重要性动态地将比特分配给量化的信号。可基于语音模型确定所述重要性。
所述基于频率的编码单元可根据心理声学模型确定输入频域信号的量化步长大小,并对频域信号进行量化。基于频率的编码单元可根据心理声学模型从输入频域信号中提取重要频率组成部分,对提取的重要频率组成部分进行编码,并使用噪声建模对其余信号进行编码。
可使用代码激励线性预测(CELP)算法获得所述残余信号。
还通过提供一种音频数据编码设备来实现本发明总体构思的上述和/或另外方面以及效用。所述音频数据编码设备包括:变换与模式确定单元,将一帧音频数据划分成第一音频数据和第二音频数据;编码单元,在时域中对第一音频数据进行编码,在频域中对第二音频数据进行编码。
还通过提供一种自适应的基于时间/频率的音频解码设备来实现本发明总体构思的上述和/或另外方面以及效用。所述解码设备包括:比特流分类单元,从输入比特流提取每个频段的编码的数据、划分信息、以及每个频段的编码模式信息;解码单元,基于划分信息和各个编码模式信息对每个频域的编码的数据进行解码;收集与逆变换单元,收集频域中的解码的数据,并对收集的数据执行逆频域变换。
所述解码单元可包括:基于时间的解码单元,基于划分信息和各个第一编码模式信息对第一编码的数据执行基于时间的解码;基于频率的解码单元,基于划分信息和各个第二编码模式信息对第二编码的数据执行基于频率的解码。
收集与逆变换单元可在频域中对解码的数据执行包络平滑,然后对解码的数据执行逆频域变换,从而解码的数据在频域中保持连续性。
还通过提供一种音频数据解码设备来实现本发明总体构思的上述和/或另外方面以及效用,所述解码设备包括:比特流分类单元,提取帧的编码的音频数据;解码单元,将帧的音频数据解码为时域中的第一音频数据和频域中的第二音频数据。
还通过提供一种自适应的基于时间/频率的音频编码方法来实现本发明总体构思的上述和/或另外方面以及效用,所述编码方法包括:将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;以各个编码模式对每个频域信号进行编码;输出每个频域信号的编码的数据、划分信息和编码模式信息。
还通过提供一种音频数据编码方法来实现本发明总体构思的上述和/或另外方面以及效用,所述编码方法包括:将一帧音频数据划分成第一音频数据和第二音频数据;在时域中对第一音频数据进行编码,在频域中对第二音频数据进行编码。
还通过提供一种自适应的基于时间/频率的音频解码方法来实现本发明总体构思的上述和/或另外方面以及效用,所述解码方法包括:从输入比特流提取每个频段的编码的数据、划分信息和每个频段的编码模式信息;基于划分信息和各个编码模式信息对每个频域的编码的数据进行解码;收集频域中的解码的数据,并对收集的数据执行逆频域变换。
附图说明
通过下面结合附图对实施例进行的描述,本发明总体构思的这些和/或其他方面将会变得清楚和更易于理解,其中:
图1是示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频编码设备的框图;
图2是示出根据本发明总体构思的实施例的使用图1的自适应的基于时间/频率的音频编码设备的变换与模式确定单元来对已执行频域变换的信号进行划分并确定编码模式的方法的概念图;
图3是示出图1的自适应的基于时间/频率的音频编码设备的变换与模式确定单元的详细框图;
图4是示出图1的自适应的基于时间/频率的音频编码设备的编码单元的详细框图;
图5是根据本发明总体构思的另一实施例的具有图4的基于时间的编码单元的具有对确定的编码模式进行确认的功能的自适应的基于时间/频率的音频编码设备的框图;
图6是示出作为根据本发明总体构思的实施例的频域变换方法的示例的变频调制重叠变换(MLT)的概念图;
图7A是示出根据本发明总体构思的实施例的图5的自适应的基于时间/频率的音频编码设备的基于时间的编码单元和基于频率的编码单元的详细操作的概念图;
图7B是示出根据本发明总体构思的另一实施例的图5的自适应的基于时间/频率的音频编码设备的基于时间的编码单元和基于频率的编码单元的详细操作的概念图;
图8是根据本发明总体构思的实施例的自适应的基于时间/频率的音频解码设备的框图;
图9是示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频编码方法的流程图;
图10示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频解码方法的流程图。
具体实施方式
现在将参照附图更全面地描述本发明总体构思,附图中示出了本发明总体构思的示例性实施例。然而,本发明总体构思可以以多种不同的形式来实施,而不应理解为限于这里阐述的实施例,相反,提供这些示例性实施例以使本公开是彻底的和完全的,并将本发明总体构思的多个方面和效用充分地传达给本领域技术人员。
本发明总体构思为输入音频信号的每个频段选择基于时间的编码方法或基于频率的编码方法,并使用选择的编码方法对输入音频信号的每个频段进行编码。当从线性预测获得的预测增益较大或当输入音频信号是高音(highpitched)信号(如语音信号)时,基于时间的编码方法更有效。当输入音频信号是正弦信号,当高频信号被包括在输入音频信号中,或者当信号之间的掩蔽效应较大时,基于频率的编码方法更有效。
在本发明总体构思中,基于时间的编码方法是指语音压缩算法(例如,代码激励线性预测(CELP)算法),该算法在时间轴上执行压缩。此外,基于频率的编码方法是指音频压缩算法(例如,Tex字符转换(TCX)算法和高级音频编码(AAC)算法),该算法在频率轴上执行压缩。
此外,本发明总体构思的实施例将通常作为处理(例如,编码、解码、压缩、解压缩、滤波、补偿等)音频数据的单位的一帧音频数据划分成帧中的子帧、频段或频域信号,从而帧的第一音频数据可在时域中被有效地编码为语音音频数据,而帧的第二音频数据可在频域中被有效地编码为非语音音频数据。
图1是示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频编码设备的框图。该设备包括:变换与模式确定单元100、编码单元110和比特流输出单元120。
变换与模式确定单元100将输入音频信号IN划分成多个频域信号,并为每个频域信号选择基于时间的编码模式或基于频率的编码模式。然后,变换与模式确定单元100输出:被确定为以基于时间的编码模式编码的频域信号S1,被确定为以基于频率的编码模式编码的频域信号S2,划分信息S3和用于每个频域信号的编码模式信息S4。当输入音频信号IN被一致地划分时,解码端可不需要划分信息S3。在这种情况下,可不必通过比特流输出单元120输出划分信息S3。
编码单元110对频域信号S1执行基于时间的编码,并对频域信号S2执行基于频率的编码。编码单元110输出:已被执行基于时间的编码的数据S5,和已被执行基于频率的编码的数据S6。
比特流输出单元120收集数据S5和数据S6以及每个频域信号的划分信息S3和编码模式信息S4,并输出比特流OUT。这里,比特流OUT可被执行数据压缩处理,如熵编码处理。
图2是示出根据本发明总体构思的实施例的使用图1的变换与模式确定单元100来对已执行频域变换的信号进行划分并确定编码模式的方法的概念图。
参照图2,输入音频信号(例如,输入音频信号IN)包括22,000Hz的频率组成部分,并被划分成5个频段(例如,对应于5个频域信号)。按从最低频段到最高频段的顺序为5个频段分别确定:基于时间的编码模式、基于频率的编码模式、基于时间的编码模式、基于频率的编码模式和基于频率的编码模式。输入音频信号是预定时间段(例如,20□)的音频帧。换句话说,图2是示出已被执行频域变换的音频帧的示图。音频帧被划分成5个分别对应于5个频域(即,频段)的子帧sf1、sf2、sf3、sf4和sf5。
为了将输入音频信号划分成5个频段并为图2所示每个频段确定相应的编码模式,可使用频谱测量方法、能量测量方法、长期预测估算方法和把有音声与无音声区分开的语音水平确定方法。频谱测量方法的示例包括:基于线性预测编码增益、相邻帧的线性预测滤波器之间的频谱变化和频谱倾斜来进行划分和确定。能量测量方法的示例包括:基于每个频段的信号能量的大小以及频段之间的信号能量的变化来进行划分和确定。此外,长期预测估算方法的示例包括基于预测的音高延迟和预测的长期预测增益来进行划分和确定。
图3是示出图1的变换与模式确定单元100的示例性实施例的详细框图。图3所示的变换与模式确定单元100包括频域变换单元300和编码模式确定单元310。
频域变换单元300将输入音频信号IN变换为具有图2所示的频谱的全频域信号S7。频域变换单元300可将调制重叠变换(MLT)用作频域变换方法。
编码模式确定单元310根据预设标准将全频域信号S7划分成多个频域信号,并基于预设标准和/或线性预测编码增益、相邻帧的线性预测滤波器之间的频谱变化、频谱倾斜、每个频段的信号能量的大小、频段之间的信号能量的变化、预测的音高延迟、或预测的长期预测增益,为每个频域信号选择基于时间的编码模式和基于频率的编码模式中的一种模式。即,可基于频域信号的频率特性的近似、预测和/或估计,为每个频域信号选择编码模式。这些频率特性的近似、预测和/或估计可估计哪些频域信号应当使用基于时间的编码模式来进行编码,从而其余频域信号可以以基于频率的编码模式进行编码。如下所述,随后可基于在编码处理的过程中产生的数据对选择的编码模式(例如,基于时间的编码模式)进行确认,从而可有效地执行编码处理。
然后,编码模式确定单元310输出:被确定为以基于时间的编码模式编码的频域信号S1,被确定为以基于频率的编码模式编码的频域信号S2,划分信息S3和用于每个频域信号的编码模式信息S4。预设标准可以是用于选择上述编码模式的标准中的那些在频域中可确定的标准。即,预设标准可以是频谱倾斜、每个频域的信号能量的大小、子帧之间的信号能量的变化、或语音水平确定。然而,本发明总体构思并不限于此。
图4是示出图1的编码单元110的示例性实施例的详细框图。图4所示的编码单元110包括基于时间的编码单元400和基于频率的编码单元410。
基于时间的编码单元400使用例如线性预测方法对频域信号S1执行基于时间的编码。这里,在进行基于时间的编码之前,对频域信号S 1执行逆频域变换,从而一旦频域信号S1被转换到时域就执行基于时间的编码。
基于频率的编码单元410对频域信号S2执行基于频率的编码。
由于基于时间的编码单元400使用先前帧的编码组成部分,因此基于时间的编码单元400包括存储先前帧的编码组成部分的缓冲器(未示出)。基于时间的编码单元400从基于频率的编码单元410接收当前帧的编码组成部分S8,并将当前帧的编码组成部分S8存储在缓冲器中,并使用存储的当前帧的编码组成部分S8来对下一帧进行编码。现在将参照图2对该处理进行详细的描述。
具体地讲,如果当前帧的第3子帧sf3将由基于时间的编码单元400执行编码并且已对先前帧的第3子帧sf3执行基于频率的编码,则先前帧的第3子帧sf3的线性预测编码(LPC)系数被用于对当前帧的第3子帧sf3执行基于时间的编码。LPC系数是被提供给基于时间的编码单元400并被存储在其中的当前帧的编码组成部分S8。
图5是示出根据本发明总体构思的另一实施例的包括基于时间的编码单元510(与图4的基于时间的编码单元400相似)的具有用于对确定的编码模式进行确认的功能的自适应的基于时间/频率的音频编码设备的框图。该设备包括:变换与模式确定单元500、基于时间的编码单元510、基于频率的编码单元520和比特流输出单元530。
基于频率的编码单元520和比特流输出单元530如上所述进行操作和运作。
基于时间的编码单元510如上所述执行基于时间的编码。此外,基于时间的编码单元510基于在进行基于时间的编码过程中获得的中间数据值,确定基于时间的编码模式是否适合于接收的频域信号S1。换句话说,基于时间的编码单元510对由变换与模式确定单元500为接收的频域信号S1确定的编码模式进行确认。即,基于时间的编码单元510基于中间数据值在基于时间的编码过程中确认基于时间的编码适合于接收的频域信号S1。
如果基于时间的编码单元510确定基于频率的编码模式适合于频域信号S1,则基于时间的编码单元510停止对频域信号S1执行基于时间的编码并将模式转换控制信号S9提供给变换与模式确定单元500。如果基于时间的编码单元510确定基于时间的编码模式适合于频域信号S1,则基于时间的编码单元510继续对频域信号S1执行基于时间的编码。基于时间的编码单元510基于线性编码增益、相邻帧的线性预测滤波器之间的频谱变化、预测的音高延迟、和预测的长期预测增益(所有这些都是从编码处理中获得的)中的至少一个,确定基于时间的编码模式或基于频率的编码模式是否适合于频域信号S1。
当模式转换控制信号S9被产生时,变换与模式确定单元500响应于模式转换控制信号S9对频域信号S1的当前编码模式进行转换。结果,对最初被确定为以基于时间的编码模式进行编码的频域信号S1执行基于频率的编码。因此,编码模式信息S4从基于时间的编码模式变为基于频率的编码模式。然后,改变的编码模式信息S4(即,指示基于频率的编码模式的信息)被发送到解码端。
图6是示出作为根据本发明总体构思的实施例的频域变换方法的示例的变频MLT(调制重叠变换)的概念图。
如上所述,根据本发明总体构思的频域变换方法使用MLT。具体地讲,频域变换方法应用了变频MLT,其中,对整个频段的一部分执行MLT。1995年10月的IEEE关于信号处理在音频和声学上的应用的研讨会上由M.Purat和P.Noll提出的“A New Orthonormal Wavelet Packet Decomposition for AudioCoding Using Frequency-Varying Modulated Lapped Transform”中对变频MLT进行了详细的描述,其完整地包含于此。
参照图6,输入信号x(n)被执行MLT,然后被表示为N个频率组成部分。在该N个频率组成部分中,M1个频率组成部分和M2个频率组成部分被执行逆MLT,然后被分别表示为时域信号y1(n)和y2(n)。其余频率组成部分被表示为信号y3(n)。对时域信号y1(n)和y2(n)执行基于时间的编码,对信号y3(n)执行基于频率的编码。反之,在解码端,对时域信号y1(n)和y2(n)执行基于时间的解码然后执行MLT,对信号y3(n)执行基于频率的解码。被执行MLT的信号y1(n)和y2(n)以及被执行基于频率的解码的信号y3(n)被执行逆MLT。因此,输入信号x(n)被恢复为信号x’(n)。在图6中,未示出编码和解码处理,只示出了变换处理。在由信号y1(n)、y2(n)和y3(n)指示的阶段执行编码和解码处理。信号y1(n)、y2(n)和y3(n)具有频段M1、M2和N-M1-M2的分辨率。
图7A是示出根据本发明总体构思的实施例的图5的基于时间的编码单元510和基于频率的编码单元520的详细操作的概念图。图7A示出这样一种情况,基于时间的编码单元510的残余信号(r’)在时域上被量化。
参照图7A,对从变换与模式确定单元500输出的频域信号S1执行逆基于频率的变换。使用从基于频率的编码单元410(如上所述)的操作接收的恢复的LPC系数(a’)来对已变换为时域的频域信号S1执行线性预测系数(LPC)分析。在线性预测系数(LPC)分析和LTF分析之后,进行开环选择。换句话说,确定基于时间的编码模式是否适合于频域信号S1。基于线性编码增益、相邻帧的线性预测滤波器之间的频谱变化、预测的音高延迟、和预测的长期预测增益(所有这些都是从基于时间的编码处理中获得的)中的至少一个来进行开环选择。
在基于时间的编码处理中执行开环选择。如果确定基于时间的编码模式适合于频域信号S1,则继续对频域信号S1执行基于时间的编码。结果,被执行基于时间的编码的数据被输出,所述数据包括长期滤波器系数、短期滤波器系数和激励信号“e”。如果确定基于频率的编码模式适合于频域信号S1,则模式转换控制信号S9被发送到变换与模式确定单元500。响应于模式转换控制信号S9,变换与模式确定单元500确定以基于频率的编码模式对频域信号S1进行编码,并输出被确定为以基于频率的编码模式编码的频域信号S2。然后,对频域信号S2执行频域编码。换句话说,变换与模式确定单元500再次将频域信号S1(如同S2)输出到基于频率的编码单元410,从而可以以基于频率的编码模式(而不是基于时间的编码模式)对频域信号进行编码。
从变换与模式确定单元500输出的频域信号S2在频域中被量化,并且量化的数据被输出为被执行了基于频率的编码的数据。
图7B是示出根据本发明总体构思的另一实施例的图5的基于时间的编码单元510和基于频率的编码单元520的详细操作的概念图。图7B示出这样一种情况,基于时间的编码单元510的残余信号在频域中被量化。
参照图7B,对从变换与模式确定单元500输出频域信号S1执行开环选择和基于时间的编码(如参照图7A所述的)。然而,在本实施例的基于时间的编码中,对残余信号进行频域变换,然后在频域上对其进行量化。
为了对当前帧执行基于时间的编码,使用了先前帧的恢复的LPC系数(a’)和残余信号(r’)。在这种情况下,恢复LPC系数a’的处理与图7A所示的处理相同。然而,恢复残余信号(r’)的处理是不同的。当对先前帧的相应频域执行基于频率的编码时,对在频域中被量化的数据执行逆频域变换,并将其添加到长期滤波器的输出。因此,残余信号r’被恢复。当对先前帧的频域执行基于时间的编码时,在频域中被量化的数据通过逆频域变换、LPC分析和短期滤波器。
图8是示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频解码设备的框图。参照图8,该设备包括:比特流分类单元800、解码单元810和收集与逆变换单元820。
对于输入比特流IN1的每个频段(即,域),比特流分类单元800提取编码的数据S10、划分信息S11和编码模式信息S12。
解码单元810基于提取的划分信息S11和编码模式信息S12对每个频段的编码的数据S10进行解码。解码单元810包括:基于时间的解码单元(未显示),基于划分信息S11和编码模式信息S12对编码的数据S10执行基于时间的解码;和基于频率的解码单元(未显示)。
收集与逆变换单元820在频域中收集解码的数据S13,对收集的数据S13执行逆频域变换,并输出音频数据OUT1。具体地讲,在被执行基于时间的解码的数据在频域中被收集之前,对该数据进行逆频域变换。当每个频段的解码数据S13在频域(类似于图2的频谱)中被收集时,可发生两个相邻频段(即,子帧)之间的包络不匹配(envelope mismatch)。为了防止频域中的包络不匹配,收集与逆变换单元820在收集解码的数据S13之前对其执行包络平滑。
图9是示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频编码方法的流程图。图9的方法可由图1和/或图5的自适应的基于时间/频率的音频编码设备来执行。因此,为说明的目的,下面参照图1至图7B对图9的方法进行描述。参照图1至图7B和图9,输入音频信号IN被频域变换单元300变换为全频域信号(操作900)。
编码模式确定单元310根据预设标准将全频域信号划分成多个频域信号(对应于频段),并确定适合于各个频域信号的编码模式(操作910)。如上所述,基于频谱倾斜、每个频域的信号能量的大小、子帧之间的信号能量的变化、和语音水平确定中的至少一个来将全频域信号划分成适合于基于时间的编码模式或基于频率的编码模式的频域信号。然后,根据预设标准和全频域信号的划分来确定适合于各个频域信号的编码模式。
编码单元110以确定的编码模式对每个频域信号进行编码(操作920)。换句话说,基于时间的编码单元400(和510)对被确定为以基于时间的编码模式编码的频域信号S1执行基于时间的编码,基于频率的编码单元410(和520)对被确定为以基于频率的编码模式编码的频域信号S2执行基于频率的编码。频域信号S2可以是与频域信号S1的频段不同的频段,或者,当基于时间的编码单元400(510)确定基于时间的编码不适合于对频域信号S1进行编码时,二者的频段可以相同。
基于时间的编码的数据S5、基于频率的编码的数据S6、划分信息S3和确定的编码模式信息S4被比特流输出单元120收集并被输出为比特流OUT(操作930)。
图10示出根据本发明总体构思的实施例的自适应的基于时间/频率的音频解码方法的流程图。图10的方法可由图8的自适应的基于时间/频率的音频解码设备来执行。因此,为说明的目的,下面参照图8对图10的方法进行描述。参照图10,比特流分类单元800从输入比特流IN1提取每个频段(即,域)的编码的数据S10、划分信息S11以及各个频段的编码模式信息S12(操作1000)。
解码单元810基于提取的划分信息S11和编码模式信息S12对编码的数据S10进行解码(操作1010)。
收集与逆变换单元820在频域中收集解码的数据S13(操作1020)。可另外对收集的数据S13执行包络平滑,以防止频域中的包络不匹配。
收集与逆变换单元820对收集的数据S13执行逆频域变换,该数据被输出为作为基于时间的信号的音频数据OUT1(操作1030)。
根据本发明总体构思的实施例,声学特性和语音模型被同时应用于作为音频压缩处理单位的帧。结果,可产生对音乐和语音均有效的压缩方法,并且该压缩方法可用于要求低比特率的音频压缩的移动终端。
本发明总体构思也可实现为计算机可读记录介质上的计算机可读代码。所述计算机可读记录介质为任何可存储其后能由计算机系统读取的数据的数据存储装置。所述计算机可读记录介质的例子包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置、和载波(例如,通过互联网的数据传输)。
所述计算机可读记录介质也可分布于网络连接的计算机系统上,以便所述计算机可读代码以分布方式被存储并被执行。此外,实现本发明总体构思的功能性程序、代码和代码段能够由本发明总体构思所属领域的程序员容易地推出。
虽然已显示和描述了本发明总体构思的一些实施例,但本领域技术人员应该理解,在不脱离本发明总体构思的原理和精神的情况下,可以对这些实施例进行修改,本发明总体构思的范围由权利要求及其等同物限定。
Claims (20)
1.一种自适应的基于时间/频率的音频编码设备,包括:
变换与模式确定单元,将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;
编码单元,以由变换与模式确定单元选择的各个编码模式对每个频域信号进行编码;
比特流输出单元,为每个编码的频域信号输出编码的数据、划分信息和编码模式信息,
其中,变换与模式确定单元包括:
频域变换单元,将输入音频信号变换为全频域信号;
编码模式确定单元,根据预设标准将全频域信号划分成频域信号,并为每个频域信号确定基于时间的编码模式或基于频率的编码模式。
2.如权利要求1所述的设备,其中,基于频谱倾斜、每个频域的信号能量的大小、子帧之间的信号能量的变化、以及语音水平确定中的至少一个,将全频域信号划分成适合于基于时间的编码模式或基于频率的编码模式的频域信号,并相应地为每个频域信号确定各个编码模式。
3.如权利要求1所述的设备,其中,所述编码单元包括:
基于时间的编码单元,对被确定为以基于时间的编码模式编码的第一频域信号执行逆频域变换,并对被执行了逆频域变换的第一频域信号执行基于时间的编码;
基于频率的编码单元,对被确定为以基于频率的编码模式编码的第二频域信号执行基于频率的编码。
4.如权利要求3所述的设备,其中,所述基于时间的编码单元基于线性编码增益、相邻帧的线性预测滤波器之间的频谱变化、预测的音高延迟、以及预测的长期预测增益中的至少一个,为第一输入频域信号选择编码模式,当基于时间的编码单元确定基于时间的编码模式是适合于所述第一频域信号时,基于时间的编码单元继续对所述第一频域信号执行基于时间的编码,当基于时间的编码单元确定基于频率的编码模式适合于所述第一频域信号时,则基于时间的编码单元停止对所述第一频域信号执行基于时间的编码并将模式转换控制信号发送到变换与模式确定单元,变换与模式确定单元响应于模式转换控制信号将被提供给基于时间的编码单元的所述第一频域信号再次输出到基于频率的编码单元。
5.如权利要求1所述的设备,其中,频域变换单元使用变频调制重叠变换执行频域变换。
6.如权利要求3所述的设备,其中,基于时间的编码单元对从线性预测获得的残余信号进行量化,并根据重要性动态地将比特分配给量化的残余信号。
7.如权利要求3所述的设备,其中,基于时间的编码单元将从线性预测获得的残余信号变换为频域信号,对所述频域信号进行量化,并根据重要性动态地将比特分配给量化的信号。
8.如权利要求6所述的设备,其中,基于语音模型确定所述重要性。
9.如权利要求7所述的设备,其中,基于语音模型确定所述重要性。
10.如权利要求3所述的设备,其中,所述基于频率的编码单元根据心理声学模型确定输入频域信号的量化步长大小,并对频域信号进行量化。
11.如权利要求3所述的设备,其中,基于频率的编码单元根据心理声学模型从输入频域信号中提取重要频率组成部分,对提取的重要频率组成部分进行编码,并使用噪声建模对其余信号进行编码。
12.如权利要求7所述的设备,其中,使用代码激励线性预测算法获得所述残余信号。
13.一种自适应的基于时间/频率的音频解码设备,包括:
比特流分类单元,从输入比特流提取每个频段的编码的数据、划分信息和每个频段的编码模式信息;
解码单元,基于划分信息和编码模式信息对每个频段的编码的数据进行解码;
收集与逆变换单元,收集解码的数据,并对收集的数据执行逆频域变换,其中,所述解码单元包括:
基于时间的解码单元,基于划分信息和编码模式信息对第一编码的数据执行基于时间的解码;
基于频率的解码单元,基于划分信息和编码模式信息对第二编码的数据执行基于频率的解码。
14.如权利要求13所述的设备,其中,基于时间的解码单元使用代码激励线性预测算法对第一编码的数据进行解码。
15.如权利要求13所述的设备,其中,收集与逆变换单元在频域中对解码的数据执行包络平滑,然后对解码的数据执行逆频域变换,从而解码的数据在频域中保持连续性。
16.如权利要求13所述的设备,其中,在频域中收集了解码的数据之后,使用变频调制重叠变换来产生最终音频信号。
17.一种自适应的基于时间/频率的音频编码方法,包括:
将输入音频信号变换为全频域信号;
根据预设标准将所述全频域信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;
以各个编码模式对每个频域信号进行编码;
输出每个频域信号的编码的数据、划分信息和编码模式信息。
18.如权利要求17所述的方法,其中,对全频域信号进行划分的步骤包括:
基于频谱倾斜、每个频域的信号能量的大小、子帧之间的信号能量的变化、以及语音水平确定中的至少一个,将全频域信号划分成适合于基于时间的编码模式或基于频率的编码模式的频域信号;
为每个频域信号选择编码模式。
19.如权利要求17所述的方法,其中,对每个频域信号进行编码的步骤包括:
对被确定为以基于时间的编码模式编码的第一频域信号执行基于时间的编码;
对被确定为以基于频率的编码模式编码的第二频域信号执行基于频率的编码。
20.一种自适应的基于时间/频率的音频解码方法,包括:
从输入比特流提取每个频段的编码的数据、划分信息和每个频段的编码模式信息;
基于划分信息和编码模式信息对每个频段的编码的数据进行解码;
收集解码的数据,并对收集的数据执行逆频域变换,
其中,所述基于划分信息和编码模式信息对所述每个频段的编码的数据进行解码的步骤包括:
基于划分信息和编码模式信息对第一编码的数据执行基于时间的解码;
基于划分信息和编码模式信息对第二编码的数据执行基于频率的解码。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310160718.2A CN103258541B (zh) | 2005-11-08 | 2006-11-08 | 音频解码方法 |
CN201310160888.0A CN103325377B (zh) | 2005-11-08 | 2006-11-08 | 音频编码方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050106354A KR100647336B1 (ko) | 2005-11-08 | 2005-11-08 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR10-2005-0106354 | 2005-11-08 | ||
PCT/KR2006/004655 WO2007055507A1 (en) | 2005-11-08 | 2006-11-08 | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310160888.0A Division CN103325377B (zh) | 2005-11-08 | 2006-11-08 | 音频编码方法 |
CN201310160718.2A Division CN103258541B (zh) | 2005-11-08 | 2006-11-08 | 音频解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101305423A CN101305423A (zh) | 2008-11-12 |
CN101305423B true CN101305423B (zh) | 2013-06-05 |
Family
ID=37712834
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310160888.0A Expired - Fee Related CN103325377B (zh) | 2005-11-08 | 2006-11-08 | 音频编码方法 |
CN201310160718.2A Expired - Fee Related CN103258541B (zh) | 2005-11-08 | 2006-11-08 | 音频解码方法 |
CN2006800415925A Expired - Fee Related CN101305423B (zh) | 2005-11-08 | 2006-11-08 | 自适应的基于时间/频率的音频编码和解码设备和方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310160888.0A Expired - Fee Related CN103325377B (zh) | 2005-11-08 | 2006-11-08 | 音频编码方法 |
CN201310160718.2A Expired - Fee Related CN103258541B (zh) | 2005-11-08 | 2006-11-08 | 音频解码方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US8548801B2 (zh) |
EP (1) | EP1952400A4 (zh) |
KR (1) | KR100647336B1 (zh) |
CN (3) | CN103325377B (zh) |
WO (1) | WO2007055507A1 (zh) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
ATE547898T1 (de) * | 2006-12-12 | 2012-03-15 | Fraunhofer Ges Forschung | Kodierer, dekodierer und verfahren zur kodierung und dekodierung von datensegmenten zur darstellung eines zeitdomänen-datenstroms |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
KR101149449B1 (ko) * | 2007-03-20 | 2012-05-25 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
KR101377667B1 (ko) | 2007-04-24 | 2014-03-26 | 삼성전자주식회사 | 오디오/스피치 신호의 시간 도메인에서의 부호화 방법 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
KR101393300B1 (ko) * | 2007-04-24 | 2014-05-12 | 삼성전자주식회사 | 오디오/스피치 신호 복호화 방법 및 장치 |
KR101403340B1 (ko) | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
EP2198426A4 (en) * | 2007-10-15 | 2012-01-18 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING A SIGNAL |
KR101455648B1 (ko) * | 2007-10-29 | 2014-10-30 | 삼성전자주식회사 | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 |
WO2009077950A1 (en) * | 2007-12-18 | 2009-06-25 | Koninklijke Philips Electronics N.V. | An adaptive time/frequency-based audio encoding method |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
BRPI0910511B1 (pt) * | 2008-07-11 | 2021-06-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para decodificar e codificar um sinal de áudio |
ES2461141T3 (es) * | 2008-07-11 | 2014-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para generar una señal de ancho de banda ampliado |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
JP5551694B2 (ja) * | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 多くのスペクトルエンベロープを計算するための装置および方法 |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
USRE47180E1 (en) | 2008-07-11 | 2018-12-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101261677B1 (ko) * | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
CA3160488C (en) | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
US8868432B2 (en) * | 2010-10-15 | 2014-10-21 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
TWI425502B (zh) * | 2011-03-15 | 2014-02-01 | Mstar Semiconductor Inc | 音訊的時間伸縮方法與相關裝置 |
PL3385950T3 (pl) * | 2012-05-23 | 2020-02-28 | Nippon Telegraph And Telephone Corporation | Sposoby dekodowania audio, dekodery audio oraz odpowiedni program i nośnik rejestrujący |
CN103915100B (zh) * | 2013-01-07 | 2019-02-15 | 中兴通讯股份有限公司 | 一种编码模式切换方法和装置、解码模式切换方法和装置 |
ES2626809T3 (es) * | 2013-01-29 | 2017-07-26 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Concepto para compensación de conmutación del modo de codificación |
MY197063A (en) | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
TWI615834B (zh) * | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
US9349196B2 (en) | 2013-08-09 | 2016-05-24 | Red Hat, Inc. | Merging and splitting data blocks |
KR101457897B1 (ko) * | 2013-09-16 | 2014-11-04 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
CN107452390B (zh) | 2014-04-29 | 2021-10-26 | 华为技术有限公司 | 音频编码方法及相关装置 |
US9666210B2 (en) * | 2014-05-15 | 2017-05-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Audio signal classification and coding |
US9685166B2 (en) * | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
CN106297812A (zh) * | 2016-09-13 | 2017-01-04 | 深圳市金立通信设备有限公司 | 一种数据处理方法及终端 |
EP3644313A1 (en) | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
CN110265043B (zh) * | 2019-06-03 | 2021-06-01 | 同响科技股份有限公司 | 自适应有损或无损的音频压缩和解压缩演算方法 |
CN111476137B (zh) * | 2020-04-01 | 2023-08-01 | 北京埃德尔黛威新技术有限公司 | 一种新型管道渗漏预警在线相关定位数据压缩方法和设备 |
CN111554322A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US5999897A (en) * | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
US6064955A (en) * | 1998-04-13 | 2000-05-16 | Motorola | Low complexity MBE synthesizer for very low bit rate voice messaging |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6496797B1 (en) * | 1999-04-01 | 2002-12-17 | Lg Electronics Inc. | Apparatus and method of speech coding and decoding using multiple frames |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
US6912496B1 (en) * | 1999-10-26 | 2005-06-28 | Silicon Automation Systems | Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
EP1259957B1 (en) * | 2000-02-29 | 2006-09-27 | QUALCOMM Incorporated | Closed-loop multimode mixed-domain speech coder |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
DE10102154C2 (de) * | 2001-01-18 | 2003-02-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6912495B2 (en) * | 2001-11-20 | 2005-06-28 | Digital Voice Systems, Inc. | Speech model and analysis, synthesis, and quantization methods |
DE60307252T2 (de) * | 2002-04-11 | 2007-07-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Einrichtungen, verfahren und programme zur kodierung und dekodierung |
US7133521B2 (en) * | 2002-10-25 | 2006-11-07 | Dilithium Networks Pty Ltd. | Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain |
FR2849727B1 (fr) | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
EP1723639B1 (en) | 2004-03-12 | 2007-11-14 | Nokia Corporation | Synthesizing a mono audio signal based on an encoded multichannel audio signal |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
CN101283249B (zh) * | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
-
2005
- 2005-11-08 KR KR1020050106354A patent/KR100647336B1/ko not_active IP Right Cessation
-
2006
- 2006-09-26 US US11/535,164 patent/US8548801B2/en not_active Expired - Fee Related
- 2006-11-08 EP EP06812491A patent/EP1952400A4/en not_active Withdrawn
- 2006-11-08 CN CN201310160888.0A patent/CN103325377B/zh not_active Expired - Fee Related
- 2006-11-08 CN CN201310160718.2A patent/CN103258541B/zh not_active Expired - Fee Related
- 2006-11-08 WO PCT/KR2006/004655 patent/WO2007055507A1/en active Application Filing
- 2006-11-08 CN CN2006800415925A patent/CN101305423B/zh not_active Expired - Fee Related
-
2013
- 2013-09-30 US US14/041,324 patent/US8862463B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2007055507A1 (en) | 2007-05-18 |
CN103258541B (zh) | 2017-04-12 |
KR100647336B1 (ko) | 2006-11-23 |
CN103325377B (zh) | 2016-01-20 |
EP1952400A1 (en) | 2008-08-06 |
CN101305423A (zh) | 2008-11-12 |
CN103325377A (zh) | 2013-09-25 |
US20070106502A1 (en) | 2007-05-10 |
US8862463B2 (en) | 2014-10-14 |
US8548801B2 (en) | 2013-10-01 |
CN103258541A (zh) | 2013-08-21 |
EP1952400A4 (en) | 2011-02-09 |
US20140032213A1 (en) | 2014-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101305423B (zh) | 自适应的基于时间/频率的音频编码和解码设备和方法 | |
CN1942928B (zh) | 用于处理音频信号的模块和方法 | |
CN1969319B (zh) | 在通信系统中对帧进行编码的方法和编码器 | |
EP1719119B1 (en) | Classification of audio signals | |
US7181404B2 (en) | Method and apparatus for audio compression | |
CN100454389C (zh) | 声音编码设备和声音编码方法 | |
CN101055720B (zh) | 对音频信号编码和解码的方法和设备 | |
CN101842832B (zh) | 编码装置和解码装置 | |
US20070174051A1 (en) | Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus | |
US20030215013A1 (en) | Audio encoder with adaptive short window grouping | |
CN102150202A (zh) | 对音频/语音信号进行编码和解码的方法和设备 | |
US20040002854A1 (en) | Audio coding method and apparatus using harmonic extraction | |
CN1918631B (zh) | 音频编码设备、方法和音频解码设备、方法 | |
Vaseghi | Finite state CELP for variable rate speech coding | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
CN110998722B (zh) | 低复杂性密集瞬态事件检测和译码 | |
WO2010067800A1 (ja) | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
KR100383589B1 (ko) | 보코더에서 피치 검색에 필요한 계산량을 감소하는 방법 | |
Bachu et al. | A Comparison of LBG and ADPCM Speech Compression Techniques | |
MXPA98010783A (en) | Audio signal encoder, audio signal decoder, and method for encoding and decoding audio signal | |
JPS6019520B2 (ja) | 音声処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130605 Termination date: 20201108 |
|
CF01 | Termination of patent right due to non-payment of annual fee |