CN102884573B - 使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器及方法 - Google Patents
使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器及方法 Download PDFInfo
- Publication number
- CN102884573B CN102884573B CN201180023298.2A CN201180023298A CN102884573B CN 102884573 B CN102884573 B CN 102884573B CN 201180023298 A CN201180023298 A CN 201180023298A CN 102884573 B CN102884573 B CN 102884573B
- Authority
- CN
- China
- Prior art keywords
- time
- audio signal
- time warp
- information
- sampling frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005070 sampling Methods 0.000 title claims abstract description 321
- 230000005236 sound signal Effects 0.000 title claims abstract description 245
- 238000000034 method Methods 0.000 title claims description 48
- 230000001419 dependent effect Effects 0.000 title description 5
- 238000013507 mapping Methods 0.000 claims abstract description 108
- 238000001228 spectrum Methods 0.000 claims abstract description 50
- 230000003595 spectral effect Effects 0.000 claims description 30
- 230000008859 change Effects 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 description 18
- 230000007704 transition Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 12
- 235000013350 formula milk Nutrition 0.000 description 12
- 238000013139 quantization Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000003213 activating effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003760 hair shine Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种经组配来基于包含取样频率信息的编码音频信号表示形态、编码时间扭曲信息及编码频谱表示形态而提供一解码音频信号表示形态的音频信号解码器,其包含一时间扭曲计算器及一扭曲解码器。该时间扭曲计算器经组配来依据该取样频率信息而调适一映射规则用以将编码时间扭曲信息的码字组映射至描述该解码时间扭曲信息的解码时间扭曲值。扭曲解码器经组配来基于编码频谱表示形态及依据该解码时间扭曲信息而提供该解码音频信号表示形态。
Description
技术领域
依据本发明的实施例有关于一种音频信号解码器。依据本发明的其它实施例有关于一种音频信号编码器。依据本发明的其它实施例有关于一种音频信号的解码方法、音频信号的编码方法及计算机程序。
依据本发明的若干实施例有关于一种取样频率依赖性的音高变化量化技术。
背景技术
后文中,将对时间扭曲音频编码领域作简短介绍,其构想可结合本发明的若干实施例应用。
近年来,业已发展出某些技术来将音频信号变换成频域表示形态,以及例如,通过考虑知觉遮蔽阈值,而有效地编码该频域表示形态。此种音频信号编码构想于用以发射一编码频谱系数集合的区块长度长时,及在只有比较少数频谱系数远高于通用遮蔽阈值,而大量频谱系数远接近或低于通用遮蔽阈值因而可被忽略(或以最小码长度编码)时特别有效。具有该种情况的一频谱称作为稀疏频谱。
举例言之,以余弦为基础或以正弦为基础的调制重迭变换由于其能量压缩性质,故常用于来源编码用途。换言之,对具有常数基频(音高)的谐波音调,其将信号能集中在较少数频谱成分(子带),结果导致有效信号表示形态。
一般而言,须了解信号的(基本)音高应为可与信号频谱区别的最低优势频率。于常见语音模型,音高乃通过人类喉咙所调制的激发信号频率。若只呈现单一个基频,则频谱极其简单,只包含基频及泛音(overtones)。此种频谱可高度有效地编码。但对具有可变音高的信号而言,相应于各个谐波成分的能量展开于数个变换系数,如此导致编码效率的减低。
为了克服编码效率的减低,欲编码的音频信号在非均匀时间网格上有效地重复取样。于随后的处理中,通过非均匀重复取样所得的样本位置经处理彷佛其表示在一均匀时间网格上的数值般。此项操作俗称“时间扭曲”。样本时间可优选地依据音高的时间变化而选用,使得音频信号的时间扭曲版本的音高变化小于该音频信号的原先版本(时间扭曲之前)的音高变化。于音频信号的时间扭曲之后,该音频信号的时间扭曲版本转换成频域。音高依赖性时间扭曲具有下述效果:时间扭曲音频信号的频域表示形态典型地具有能量压缩成比较原先(非时间扭曲音频信号)频域表示形态远更少数的频谱成分。
在解码器端,时间扭曲音频信号的频域表示形态转成时域,使得该时间扭曲音频信号的时域表示形态于解码器端可利用。但在解码器端重建的时间扭曲音频信号的时域表示形态中,未包括编码器端输入的音频信号的原先音高变化。据此,通过针对解码器端重建的时间扭曲音频信号的时域表示形态的重复取样而施加又另一次时间扭曲。
为了获得编码器端输入音频信号在解码器的良好重建,期望解码器端时间扭曲至少大致为相对于编码器端时间扭曲的反向操作。为了获得适当时间扭曲,期望具有在解码器可资利用的信息,其允许调整解码器端时间扭曲。
由于典型地要求将此种信息从音频信号编码器转移至音频信号解码器,期望将此一传送所要求的位率维持小位率,而仍然允许所要求的时间扭曲信息在解码器端可靠地重建。
有鉴于此,需要有一种构想其允许基于时间扭曲信息的有效编码表示形态而可靠地重建时间扭曲信息。
发明内容
发明概要
依据本发明的一实施例提出一种经组配来基于包含一取样频率信息的一编码音频信号表示形态、一编码时间扭曲信息及一编码频谱表示形态而提供一解码音频信号表示形态的音频信号解码器。该音频信号解码器包含一时间扭曲计算器(其例如可具有时间扭曲解码器功能)及一扭曲解码器。该时间扭曲计算器经组配来将该编码时间扭曲信息映射至一解码时间扭曲信息。该时间扭曲计算器经组配来依据该取样频率信息而调适用以将编码时间扭曲信息的码字组映射至描述该解码时间扭曲信息的解码时间扭曲值的一映射规则。该扭曲解码器经组配来基于该编码频谱表示形态及依据该解码时间扭曲信息而提供该解码音频信号表示形态。
依据本发明的此一实施例是基于发现:由于发现期望对较低取样频率样本比对较高取样频率表示每个样本更大的时间扭曲,故当用以将编码时间扭曲信息的码字组映射至描述该解码时间扭曲信息的解码时间扭曲值的映射规则调整适应于取样率时,可有效地编码时间扭曲(其例如通过时间扭曲轮廓描述)。较佳由编码时间扭曲信息的码字组集合所表示的每个时间单位的时间扭曲大致与取样频率独立无关,其转译成下述结果:假设每个音频样本(或每一音频帧)的时间扭曲码字组数目维持至少近似常数而与实际取样频率独立无关的情况下,通过一给定码字组集合所能表示的时间扭曲对较小取样频率而言须比对较高取样频率为较大。
总而言之,发现优选依据编码音频信号(以编码音频信号表示形态表示)的取样频率,而调适用以将编码时间扭曲信息的码字组(也简称为时间扭曲码字组)映射至解码时间扭曲值的一映射规则,原因在于如此允许针对较高取样频率的情况及针对较低取样频率的情况二者,使用小型(及结果位率有效)时间扭曲码字组集合来表示相关时间扭曲值。
通过调适映射规则,可能对较高取样频率使用较高分辨率来编码较小范围的时间扭曲值,而对较小取样频率使用较粗糙分辨率来编码较大范围的时间扭曲值,其又转而获致极佳位率效率。
于一较佳实施例中,编码时间扭曲信息的码字组描述一时间扭曲轮廓的时间演变。该时间扭曲计算器经组配来对由该编码音频信号表示形态所表示的编码音频信号的一音频帧,评估该编码时间扭曲信息的码字组的预定数目。该码字组的预定数目与该编码音频信号的取样频率独立无关。据此,可达成位流格式维持与取样频率实质上独立无关,同时仍然可能有效地编码时间扭曲。通过对编码音频信号的一音频帧使用预定数目的时间扭曲码字组,其中该预定数目较佳是与编码音频信号的取样频率独立无关,位流格式并未随取样频率而改变,及音频解码器的位流剖析器无需调整至取样频率。但通过用以将编码时间扭曲信息的码字组映射至解码时间扭曲值的映射规则的调适,仍可达成时间扭曲的有效编码,原因在于编码时间扭曲信息的码字组映射至解码时间扭曲值可调适至取样频率,使得时间扭曲值可表示的范围获致针对不同取样频率,分辨率与最大可编码时间扭曲间的良好折衷。
于一较佳实施例中,该时间扭曲计算器经组配来调适该映射规则,使得该编码时间扭曲信息的码字组的一给定集合的码字组映射于其上的一解码时间扭曲值范围对第一取样频率比对第二取样频率大,但限制条件为该第一取样频率小于该第二取样频率。据此,针对较高取样频率编码较小时间扭曲值范围的相同码字组,其针对较小取样频率则是编码较大时间扭曲值范围。如此,可确定针对高取样频率及低取样频率,皆可能对每一时间单位(例如以每秒八重元组定义,简单标示为“oct/s”),编码大致相等时间扭曲,即便对相对较高取样频率比相对较低取样频率,每个时间单位传送更多时间扭曲码字组亦如此。
于一较佳实施例中,解码时间扭曲值为表示时间扭曲轮廓值的时间扭曲轮廓值或表示时间扭曲轮廓值变化的时间扭曲轮廓变异值。
于一较佳实施例中,该时间扭曲计算器经组配来调适该映射规则,使得历经通过该编码音频信号表示形态所表示的一编码音频信号的一给定数目样本的最大音高变化,其对第一取样频率比对第二取样频率大,但限制条件为该第一取样频率小于该第二取样频率。据此,相同码字组集合系用以描述不同解码时间扭曲值的范围,其良好调适用于不同取样频率。
于一较佳实施例中,该时间扭曲计算器经组配来调适该映射规则,使得通过一第一取样频率的该编码时间扭曲信息的码字组的一给定集合所表示的历经一段给定时间周期的最大音高变化,与通过一第二取样频率的该编码时间扭曲信息的码字组的该给定集合所表示的历经一段给定时间周期的最大音高变化间的差异,对一第一取样频率与一第二取样频率间的差异达至少30%者不大于10%。如此,依据本发明通过映射规则的调适,可避免下述事实,一给定码字组集合现有地表示针对不同取样频率的每一时间单位显著不同的时间扭曲。如此,不同的码字组数目可维持合理地少数,结果导致良好编码效率,其中虽言如此,时间扭曲的编码效率调整配合取样频率。
于一较佳实施例中,该时间扭曲计算器经组配来依据该取样频率信息使用不同映射表用以将该编码时间扭曲信息的码字组映射至解码时间扭曲值。通过提供不同映射表,牺牲内存需求,可将解码机制维持极为简单。
于另一较佳实施例中,该时间扭曲计算器经组配来将对一参考取样频率描述与该编码时间扭曲信息的不同码字组相关联的解码时间扭曲值的(参考)映射规则,调整配合与该参考取样频率不同的一实际取样频率。据此,可维持小量内存需求,原因在于针对单一参考取样频率,只需储存与一不同码字组集合相关联的映射值(亦即解码时间扭曲值)。业已发现使用小量运算努力即可调适映射值配合不同取样频率。
于一较佳实施例中,该时间扭曲计算器经组配来依据该实际取样频率与该参考取样频率间之比,而定标(scale)一部分映射值,该部分描述一时间扭曲。业已发现此种部分映射值的线性定标组成用以针对不同取样频率获得映射值的特别有效的解决之道。
于一较佳实施例中,该解码时间扭曲值描述历经由该编码音频信号表示形态所表示的编码音频信号的预定数目样本的时间扭曲轮廓变化。此种情况下,该取样位置计算器较佳经组配来组合表示时间扭曲轮廓变化的多个解码时间扭曲值,而导算出一扭曲轮廓节点值,使得所导算出的扭曲轮廓节点值的偏离一参考扭曲节点值大于由该解码时间扭曲值中的单一者所表示的偏离。通过组合多个解码时间扭曲值,可能维持对一个别时间扭曲值所要求的范围为够小。如此提高时间扭曲值的编码效率。同时,通过调适映射规则,可能调整可表示的时间扭曲的范围。
于一较佳实施例中,该解码时间扭曲值描述历经由该编码音频信号表示形态所表示的编码音频信号的预定数目样本的时间扭曲轮廓的相对变化。此种情况下,该时间扭曲计算器经组配来从该解码时间扭曲值而导算出解码时间扭曲信息,使得解码时间扭曲信息描述该时间扭曲轮廓。使用描述历经预定数目编码音频信号样本的时间扭曲轮廓相对变化的时间扭曲值,与用以将编码时间扭曲信息的码字组映射至解码时间扭曲值的一映射规则的调适组合,获致高编码效率,原因在于可确保针对不同取样频率可编码实质上相同或至少相似的时间扭曲(以oct/s为单位表示)的范围,即便于取样频率改变的情况下,每个编码音频信号样本的时间扭曲码字组数目可仍维持常数亦如此。
于一较佳实施例中,该时间扭曲计算器经组配来基于解码时间扭曲值而运算一时间扭曲轮廓的支点。此种情况下,该时间扭曲计算器经组配来在支点间内插而获得时间扭曲轮廓作为解码时间扭曲信息。此种情况下,每个音频帧的解码时间扭曲值数目经预定决定且与取样频率独立无关。据此,支点间的内插方案保持不变,而其有助于将运算复杂度维持为低。
依据本发明的一实施例提出一种用以提供一音频信号的编码表示形态的音频信号编码器。该音频信号编码器包含一时间扭曲轮廓编码器,其是组配来将描述一时间扭曲轮廓的时间扭曲值映射至一编码时间扭曲信息。该时间扭曲轮廓编码器经组配来依据该音频信号的一取样频率而调适用以将描述该时间扭曲轮廓的该时间扭曲值映射至该编码时间扭曲信息的码字组的一映射规则。该音频信号编码器也包含一时间扭曲信号编码器,其是组配来考虑由该时间扭曲轮廓信息所描述的一时间扭曲而获得该音频信号的一频谱的一编码表示形态。此种情况下,该音频信号的编码表示形态包含该编码时间扭曲信息的码字组、该频谱的编码表示形态、及描述该取样频率的一取样频率信息。该音频编码器系极为适合用以提供用前文讨论的音频信号解码器所使用的编码音频信号表示形态。此外,该音频信号编码器获致前文有关音频信号解码器已经讨论且是基于相同考虑的相同优点。
依据本发明的另一实施例形成一种用以基于编码音频信号表示形态而提供解码音频信号表示形态的方法。
依据本发明的另一实施例形成一种用以提供音频信号的编码表示形态的方法。
依据本发明的另一实施例形成一种用以实现该方法中的一者或二者的计算机程序。
附图说明
图1显示依据本发明的一实施例,音频信号编码器的方块示意图;
图2显示依据本发明的一实施例,音频信号解码器的方块示意图;
图3a显示依据本发明的另一实施例,音频信号编码器的方块示意图;
图3b显示依据本发明的另一实施例,音频信号解码器的方块示意图;
图4a显示依据本发明的一实施例,用以将编码时间扭曲信息映射至解码时间扭曲值的一映射器的方块示意图;
图4b显示依据本发明的另一实施例,用以将编码时间扭曲信息映射至解码时间扭曲值的一映射器的方块示意图;
图4c显示现有量化体系的扭曲的一表格表示形态;
图4d显示依据本发明的一实施例,针对不同取样频率码字组指数映射至解码时间扭曲值的映射的一表格表示形态;
图4e显示依据本发明的另一实施例,针对不同取样频率码字组指数映射至解码时间扭曲值的映射的一表格表示形态;
图5a和图5b显示依据本发明的一实施例,抽取自音频信号解码器的方块示意图的细节;
图6a和图6b显示依据本发明的一实施例,抽取自用以提供解码音频信号表示形态的一映射器的流程图的细节;
图7a显示依据本发明的一实施例,用于音频解码器的数据元素及辅助元素的定义的图例;
图7b显示依据本发明的一实施例,用于音频解码器的常数的定义的图例;
图8显示码字组指数映射至相应的解码时间扭曲值的映射的一表格表示形态;
图9显示用以在相等间隔扭曲节点间线性内插的算法的假程序码表示形态;
图10a显示辅助函数“warp_time_inv”的假程序码表示形态;
图10b显示辅助函数“warp_inv_vec”的假程序码表示形态;
图11显示用以运算样本位置向量及过渡长度的算法的假程序码表示形态;
图12显示取决于窗序列及核心编码器帧长度的一合成窗长度N的值的一表格表示形态;
图13显示容许的窗序列的一矩阵表示形态;
图14显示用于“EIGHT_SHORT_SEQUENCE”型的窗序列的开窗及内部重迭-加法的算法的假程序码表示形态;
图15显示用于非属“EIGHT_SHORT_SEQUENCE”型的其中窗序列的开窗及内部重迭-及-加法的算法的假程序码表示形态;
图16显示用于重复取样的算法的假程序码表示形态;及
图17a至图17f显示依据本发明的一实施例,该音频流的语法元素的表示形态。
具体实施方式
较佳实施例的详细说明
1.依据图1的时间扭曲音频信号编码器
图1显示依据本发明的一实施例,一种时间扭曲音频信号编码器100的方块示意图。
音频信号编码器100经组配来接收一输入音频信号110,及基于此而提供该输入音频信号110的一编码表示形态112。该输入音频信号110的编码表示形态112例如包含一编码频谱表示形态、一编码时间扭曲信息(其可标示以例如“tw_data”及其可例如包含码字组tw_ratio[i])及一取样频率信息。
音频信号编码器选择性地可包含一时间扭曲分析器120,其可经组配来接收该输入音频信号110、分析该输入音频信号、及提供一时间扭曲轮廓信息122,使得该时间扭曲轮廓信息122例如描述该音频信号110的音高的时间演变。但音频信号编码器100另可接收由位在音频信号编码器外部的一时间扭曲分析器所提供的时间扭曲轮廓信息。
音频信号编码器100也包含一时间扭曲轮廓编码器130,其经组配来接收时间扭曲轮廓信息122,及基于此而提供编码时间扭曲信息132。举例言之,时间扭曲轮廓编码器130可接收描述该时间扭曲轮廓的时间扭曲值。该时间扭曲值例如可描述一已标准化或未经标准化的时间扭曲轮廓的绝对值、或已标准化或未经标准化的时间扭曲轮廓的随着时间的经过的相对变化。一般而言,时间扭曲轮廓编码器130经组配来将描述时间扭曲轮廓122的时间扭曲值映射至该编码时间扭曲信息132。
时间扭曲轮廓编码器130经组配来调适用以依据音频信号的取样频率而将描述该时间扭曲轮廓的时间扭曲值映射至该编码时间扭曲信息132的码字组的一映射规则。用于此项目的,时间扭曲轮廓编码器130可接收取样频率信息来通过此调适该映射关系134。
音频信号编码器100也包含一时间扭曲信号编码器140,其经组配来考虑由该时间扭曲轮廓信息122所描述的时间扭曲而获得该音频信号110的一频谱的编码表示形态142。
结果,例如可使用一位流提供器而提供编码音频信号表示形态112,使得该输入音频信号110的编码表示形态112包含该编码时间扭曲信息132的码字组、该频谱的编码表示形态142、及描述该取样频率的一取样频率信息152(例如,输入音频信号110的取样频率及/或于时域至频域变换上下文中由时间扭曲信号编码器140所使用的(平均)取样频率)。
有关音频信号编码器100的功能,可谓于一音频帧(其中以音频样本表示,一音频帧的长度可等于由该时间扭曲信号编码器所使用的时域至频域变换的一变换长度)期间改变其音高的一音频信号的频谱,该频谱可通过时间改变重复取样而压缩。据此,可依据时间扭曲轮廓信息122而通过该时间扭曲信号编码器140所执行的时间改变重复取样结果导致(经重复取样的音频信号的)一频谱,该频谱可以比较原先输入音频信号110的频谱更佳的位率效率而编码。
但于时间扭曲信号编码器140所施加的时间扭曲使用编码时间扭曲信息而发信号给依据图2的一音频信号解码器200。此外,可包含该时间扭曲值映射至码字组的时间扭曲信息的编码依据该取样频率信息而调适,使得该时间扭曲值映射至码字组的不同映射关系用于输入音频信号110的不同取样频率,或用于时间扭曲信号编码器140(或其时域至频域变换)所操作的不同取样频率。
如此,对各个可通过时间扭曲信号编码器140处理的可能的取样频率可选择最高位率效率的映射。此种调适合理,原因在于发现若描述时间扭曲轮廓的时间扭曲值映射至码字组的映射规则匹配目前频率,则编码时间扭曲信息可维持为小量(少数),即便于时间扭曲信号编码器140使用多个可能的取样频率时亦如此。据此,在较小取样频率及较大取样频率两种情况下,可确保不同码字组的一小集合即足以编码具有够精细分辨率及也具有够大动态范围的时间扭曲轮廓,即便每个音频帧的码字组数目于不同取样频率维持常数亦如此(其又转而提供一取样频率非依赖性(independent)位流,及因而协助编码音频信号表示形态112的产生、储存、剖析、及实时动态处理(on-the-fly-processing))。
有关映射134的调适的进一步细节将讨论如下。
2.依据图2的时间扭曲音频信号解码器
图2显示依据本发明的一实施例,一种时间扭曲音频信号解码器200的方块示意图。
音频信号解码器200经组配来基于编码音频信号表示形态210而提供一解码音频信号表示形态212。该编码音频信号表示形态210例如可包含一编码频谱表示形态214(其可等于由时间扭曲信号编码器140所提供的编码频谱表示形态142)、一编码时间扭曲信息216(其例如可等于由时间扭曲轮廓编码器130所提供的编码时间扭曲信息132)、及一取样频率信息218(其例如可等于取样频率信息152)。
音频信号解码器200包含一时间扭曲计算器230,其也可视为时间扭曲解码器。时间扭曲计算器230经组配来将编码时间扭曲信息216映射至一解码时间扭曲信息232。编码时间扭曲信息216例如可包含时间扭曲码字组“tw_ratio[i]”,而该解码时间扭曲信息例如可呈描述一时间扭曲轮廓的时间扭曲轮廓信息形式。时间扭曲计算器230经组配来调适用以依据取样频率信息218而将该编码时间扭曲信息216的(时间扭曲)码字组映射至描述该解码时间扭曲信息的解码时间扭曲值的一映射规则234。据此,针对由该取样频率信息所传讯的不同取样频率,可选择该编码时间扭曲信息216的码字组映射至描述该解码时间扭曲信息232的时间扭曲值的不同映射关系。
音频信号解码器200也包含一扭曲解码器240,其经组配来接收该频谱的编码表示形态214,及基于该编码频谱表示形态214且依据该解码时间扭曲信息232而提供解码音频信号表示形态212。
据此,针对较高取样频率及较低取样频率二者,音频信号解码器200允许编码时间扭曲信息的有效率解码,原因在于编码时间扭曲信息的码字组映射至解码时间扭曲值的映射关系取决于取样频率之故。如此,针对较高取样频率可能获得编码音频信号的高分辨率,而针对较小取样频率仍然涵盖每个时间单位够大的时间扭曲,及同时对较小取样频率及较高取样频率二者使用相同的码字组集合。如此,于较高取样频率及较小取样频率两种情况下,该位流格式实质上系与取样频率独立无关,而仍然可能以合宜准确度及动态范围来描述该时间扭曲。
有关映射234的调适的进一步细节将叙述如下。又,有关扭曲解码器240的进一步细节将描述如下。
3.依据图3a的时间扭曲音频信号编码器
图3a显示依据本发明的一实施例,时间扭曲音频信号编码器300的方块示意图。
依据图3的音频信号编码器300类似依据图1的音频信号编码器100,因而相同信号及装置标示以相同组件符号。但图3a显示有关时间扭曲信号编码器140的进一步细节。
因本发明有关时间扭曲音频编码及时间扭曲音频解码,将提出时间扭曲音频信号编码器140的细节的简短综述。时间扭曲音频信号编码器140经组配来接收一输入音频信号110,及对一系列帧提供该输入音频信号110的编码频谱表示形态142。时间扭曲音频信号编码器140包含一取样单元或重复取样单元140a,其调整适用于取样或重复取样输入音频信号110而导算出用作为频域变换的信号区块(取样表示形态)140d。取样单元/重复取样单元140a包含一取样位置计算器140b,其经组配来运算样本位置,该样本位置调整适用于通过时间扭曲轮廓信息122所描述的时间扭曲,因此若时间扭曲(或音高变异或基频变异)非为零,则其在时间上为非等距。取样单元或重复取样单元140a也包含一取样器或重复取样器140c,其经组配来使用通过取样位置计算器所得的时间上非等距样本位置而取样或重复取样输入音频信号110的一部分(例如一音频帧)。
时间扭曲音频信号编码器140进一步包含一变换窗计算器140e,其适用于针对由取样单元或重复取样单元140a所输出的取样或重复取样表示形态140d而导算定标窗。定标窗信息140f及取样/重复取样表示形态140d输入开窗器140g,其适用于将由定标窗信息140f所描述的定标窗适加至通过取样单元/重复取样单元140a所导算出的取样或重复取样表示形态140d。于其它实施例中,时间扭曲音频信号编码器140可额外地包含一频域变换器140i来导算出输入音频信号110的取样或重复取样表示形态140h的频域表示形态140j(例如呈变换系数或频谱系数形式)。频域表示形态140j例如可经过处理。此外,频域表示形态140j或其后处理版本可使用编码140k而编码来获得输入音频信号110的编码频谱表示形态142。
时间扭曲音频信号编码器140进一步使用输入音频信号110的音高轮廓,其中该音高轮廓可通过时间扭曲轮廓信息122描述。该时间扭曲轮廓信息122可提供给音频信号编码器300作为输入信息,或可通过音频信号编码器300而导算出。因此,音频信号编码器300可选择性地包含一时间扭曲分析器120,其可操作为一音高估算器,其用以导算出时间扭曲轮廓信息122,因而时间扭曲轮廓信息122构成一音高轮廓信息或描述音高轮廓或基频。
取样单元/重复取样单元140a可在输入音频信号110的连续表示形态上操作。但另外,取样单元/重复取样单元140a可在输入音频信号110的先前取样表示形态上操作。于前一情况下,单元140a可取样输入音频信号(及因而可视为取样单元);而于后一情况下,单元140a可重复取样该输入音频信号110的先前取样表示形态(及因而可视为重复取样单元)。取样单元140a例如可调整适用于时间扭曲邻近重迭音频区块,使得于取样或重复取样后,在各个输入区块内部,重迭部分具有常数音高或减低的音高变异。
变换窗计算器140e可选择性地依据通过取样器140a所执行的时间扭曲而导算针对音频区块(例如针对音频帧)的定标窗。为了达成此项目的,选择性的调整区块140l可存在来界定由取样器所使用的扭曲规则,然后该扭曲规则也可提供给变换窗计算器140e。
于另一实施例中,调整区块140l可被删除,而时间扭曲轮廓信息122所描述的音高轮廓可直接提供给变换窗计算器140e,其本身可进行适当计算。此外,取样单元/重复取样单元140a可进行通信而传送所施加的取样给变换窗计算器140e,来允许计算适当定标窗。
但于若干其它实施例中,开窗实质上系与时间扭曲细节独立无关。
由取样单元/重复取样单元140a所执行的时间扭曲使得通过单元140a所时间扭曲的及取样的(或重复取样的)经取样(或经重复取样)音频区块(或音频帧)的音高轮廓系比原先输入音频信号110的音高轮廓更加恒定。据此,因音高轮廓的时间变异所造成的频谱模糊不清可通过单元140a执行的取样或重复取样而减少。如此,取样或重复取样音频信号140d的频谱系比较输入音频信号110的频谱较少模糊不清(及典型地,显示更为明确的频谱峰及频谱谷)。据此,比较以相同准确度来编码输入音频信号110的频谱所要求的位率时,典型地可能使用较低位率而编码取样(或重复取样)音频信号140d的频谱。
此处须注意输入音频信号110典型地系逐一帧处理,其中该帧依据特定需求可重迭或非重迭。举例言之,输入音频信号的各个音频帧可通过单元140a而个别地取样或重复取样,来藉此获得由时域样本140d的个别集合所描述的一系列取样(或重复取样)帧。又,通过开窗区块140g,可个别地施加开窗至由时域样本140d的个别集合所表示的取样或重复取样帧。此外,由开窗及重复取样时域样本140h的个别集合所描述的开窗及重复取样帧可通过变换140i而个别地变换成频域。虽言如此,个别帧间可能有若干(时间)重迭。
此外,须注意音频信号110可以预定取样频率(亦称取样率)取样。在通过取样器或重复取样器140c所执行的重复取样中,可进行重复取样使得输入音频信号110的重复取样区块(或帧)可包含与该输入音频信号110的取样频率(或取样率)相同(或至少近似相同,例如在±5%公差以内)的平均取样频率(或取样率)。然而,音频信号编码器300另可经组配来以不同取样频率(或取样率)的输入音频信号操作。
据此,于若干实施例中,由时域样本140d所表示的重复取样区块或帧的平均取样频率(或取样率)可依据输入音频信号110的取样频率或取样率而变化。
但当然也可能由时域样本140d所表示的经取样或重复取样的音频信号的区块或帧的平均取样频率或取样率,与输入音频信号110的取样率不同,原因在于取样器140a可依据操作员的期望或需要而执行取样率变换及时间扭曲二者。
结果,可谓依据输入音频信号110的平均取样频率或取样率及/或使用者的期望,由时域样本140d所表示的经取样或重复取样的音频信号的区块或帧可以不同取样频率或取样率提供。
但于若干实施例中,就音频样本而言,由频谱值140d集合所表示的经取样或重复取样的音频信号的区块或帧可为常数,即便针对不同平均取样频率或取样率亦如此。然而,于若干实施例中,两种可能长度(以每区块或每帧的音频样本表示)间可进行切换,其中于第一(短区块)模式的区块长度或帧长度可与平均取样频率独立无关;及其中于第二(长区块)模式的区块长度或帧长度(就音频样本而言)也可与平均取样频率独立无关。
据此,通过开窗器140g所执行的开窗、通过变换器140i所执行的变换、及通过编码器140k所执行的编码实质上可与经取样或重复取样的音频信号140d的平均取样频率或取样率独立无关(但短区块模式与长区块模式间可能的切换除外,该项切换可与平均取样频率或取样率不相关地进行)。
总结而言,时间扭曲音频信号编码器140允许有效地编码输入音频信号110,原因在于于输入音频信号110包含时间音高变异的情况下,比较该输入音频信号110,通过取样器140a执行的取样或重复取样,结果导致经重复取样的音频信号140d具有较非模糊不清的频谱;而其又转而允许基于输入音频信号110的取样/重复取样及开窗版本140h,通过转换器140i提供频谱系数140j的位率有效率编码(通过编码器140k)。
通过时间扭曲轮廓编码器130以取样频率依赖性方式执行的时间扭曲轮廓编码,允许针对取样/重复取样音频信号140d的不同取样频率(或平均取样频率)进行时间扭曲轮廓信息122的位率有效率编码,使得包含该编码频谱表示形态142及编码时间扭曲信息132的一位流为位率有效率。
4.依据图3b的时间扭曲音频信号解码器
图3b显示依据本发明的一实施例,音频信号解码器350的方块示意图。
音频信号解码器350是类似依据图2的音频信号解码器200,因而相同信号及装置将标示以相同的组件符号而在此不再说明。
音频信号解码器350经组配来用以接收第一时间扭曲及取样音频帧的编码频谱表示形态,及也用以接收第二时间扭曲及取样音频帧的编码频谱表示形态。概略言之,音频信号解码器350经组配来用以接收经时间扭曲-重复取样的音频帧的一系列编码频谱表示形态,其中该编码频谱表示形态例如可由音频信号编码器300的时间扭曲音频信号编码器140提供。此外,音频信号解码器350接收边带信息,例如诸如编码时间扭曲信息216及取样频率信息218。
扭曲解码器240可包含一解码器240a,其经组配来接收频谱的编码表示形态214,来解码此一频谱的编码表示形态214与提供该频谱的一解码表示形态240b。扭曲解码器240也包含一反变换器240c,其经组配来接收该频谱的解码表示形态240b,及基于该频谱的解码表示形态240b而执行反变换,来藉此获得由该编码频谱表示形态214所描述的经时间扭曲-取样的音频信号的一区块或帧的时域表示形态240d。扭曲解码器240也包含一开窗器240e,其经组配来施加一开窗至一区块或帧的时域表示形态240d而藉此获得一区块或帧的开窗时域表示形态240f。扭曲解码器240也包含一重复取样器240g,其中该开窗时域表示形态240f依据取样位置信息240h而重复取样,来藉此获得针对一区块或帧的经开窗且经重复取样的时域表示形态240i。扭曲解码器240也包含一重迭器-加法器240j,其经组配来重迭及相加经开窗且经重复取样的时域表示形态的随后区块或帧,来藉此获得经开窗且经重复取样的时域表示形态240i的随后区块或帧间的平顺过渡,及因而由于重迭-及-加法操作结果而获得解码音频信号表示形态212。
扭曲解码器240包含一取样位置计算器240k,其自时间扭曲计算器(或时间扭曲解码器)230接取解码时间扭曲信息232,及基于此而提供取样位置信息240h。据此,解码时间扭曲信息232描述通过重复取样240g所执行的时间变化重复取样。
选择性地,扭曲解码器240可包含一窗形调整器240l,其可经组配来依据默求而调整由开窗器240e所使用的窗形状。举例言之,窗形调整器240l可选择性地接收解码时间扭曲信息232,及依据该解码时间扭曲信息232而调整窗。另外或此外,当扭曲解码器240可在此种长区块模式与短区块模式间切换时,窗形调整器240l可经组配来依据是否使用指示长区块模式与短区块模式的信息而调整由开窗器240e所使用的窗形状。另外或此外,当扭曲解码器240使用不同窗形状时,窗形调整器240l可经组配来依据窗序列信息而选择由开窗器240e所使用的窗形状。但须注意通过窗形调整器240l所执行的窗形调整须视为选择性,而对本发明而言并非特别相关。
此外,扭曲解码器240可选择性地包含取样率调整器240m,其可经组配来依据取样频率信息218而控制窗形调整器240l及/或取样位置计算器240k。但取样率调整器240m可视为选择性,而对本发明而言并非特别相关。
有关扭曲解码器240的功能,可谓例如针对多个音频帧(或甚至针对若干音频帧的多个频谱系数集合)的各者,可包含一变换系数(亦称频谱系数)集合的频谱的编码表示形态214系首先使用解码器240a解码,因而获得解码频谱表示形态240b。该解码音频信号的一区块或帧的解码频谱表示形态240b系变换成该音频内容的该区块或帧的时域表示形态(例如每一音频帧包含预定数目的时域样本)。典型地,但非必要,该频谱的解码表示形态240b包含显著峰及谷,原因在于此一频谱可有效编码故。结果,于单一区块或帧(其系相应于具有显著峰及谷的频谱)期间,时域表示形态240d包含较小音高变异。
开窗260e施加至音频信号的时域表示形态240d来允许重迭及加法操作。结果,已开窗的时域表示形态240f以时间变化方式重复取样,其中该重复取样于编码音频信号表示形态210中以编码形式所包括的时间扭曲信息进行。据此,假设编码时间扭曲信息描述一时间扭曲或相当地,描述一音高变异,经重复取样的音频信号表示形态240i典型地包含比较已开窗的时域表示形态240f显著更大的音高变异。如此,在重复取样器240g的输出端可提供包含历经单一音频帧的显著音高变异的一音频信号,即使反变换器240c的输出信号240d包含历经单一音频帧的显著较小音高变异亦如此。
但扭曲解码器240可经组配来处理使用不同取样频率所提供的编码频谱表示形态,及提供具有不同取样频率的解码音频信号表示形态212。但对多个不同取样频率,每一音频帧或音频区块的时域样本数目可相同。但另外,扭曲解码器240可在其中一音频区块包含较少数样本(例如256样本)的一短区块模式与其中一音频区块包含较大量样本(例如2048样本)的一长区块模式间切换。此种情况下,针对不同取样频率,短区块模式中的每一音频区块的样本数为相同;及针对不同取样频率,长区块模式中的每一音频区块(或音频帧)的样本数为相同。又,针对不同取样频率,每一音频帧的时间扭曲码字组数目典型地为相同。据此,可达成一致位流格式,其与取样频率实质上独立无关(至少就每一音频帧编码的时域样本数目而言,及就每一音频帧的时间扭曲码字组数目而言)。
但为了具有时间扭曲信息的位率有效率编码及时间扭曲信息的足够分辨率二者,时间扭曲信息的编码调适于在音频信号编码器300该端的取样频率(其提供编码音频信号表示形态210)。结果,包含时间扭曲码字组映射至解码时间扭曲值的编码时间扭曲信息216的解码调适于取样频率。后文将描述有关时间扭曲信息解码的此一调适细节。
5.时间扭曲编码与解码的调适
5.1.构想综论
后文中,将描述有关依据欲编码的音频信号或欲解码的音频信号的取样频率而做时间扭曲编码与解码的调适的细节。换言之,将描述取样频率依赖性音高变异量化。为了协助了解,首先将描述若干现有构想。
于使用时间扭曲的现有音频编码器及音频解码器,对音高变异或扭曲的量化表对全部取样频率为固定。举例言之,参考统一语音及音频编码的工作草稿6(“USAC的WD6”,ISO/IEC JTC1/SC29/WG11N11213,2010)。由于样本的更新距离(例如就音频样本而言,时间扭曲值从音频编码器传送至音频解码器的距离)也固定(于现有时间扭曲音频编码器/音频解码器及于依据本发明的时间扭曲音频编码器/音频解码器二者),故以较低位率施加此种编码方案,结果导致可涵盖的实际音高变化的范围减小(例如以每单位时间的音高变化表示)。于语音基频的典型最大变化低于约15oct/s(每秒15八重元组)。
图4c的表显示针对若干用在音频编码的取样频率,参考文献[3]所述编码方案无法映射期望的音高变异范围,因而结果导致次选择性编码增益。为了显示此项效应,图4c的表显示针对参考文献[3]所述音频解码器所使用的该表(例如用以将时间扭曲码字组映射至解码时间扭曲值的映射表)的不同取样频率的扭曲。获得该扭曲值(以oct/s表示)的公式为:
上式中w标示扭曲,prel标示相对音高变化因子,fs标示取样频率,np标示一个帧内的音高节点数目,及nf标示样本的帧长度。
据此,图4c的表显示用在参考文献[3]所述音频解码器所使用的该量化方案的扭曲,其中nf=1024及np=16。
依据本发明,发现优选地系依据取样频率而调适扭曲值指数(可视为时间扭曲码字组)映射至一相应时间扭曲值prel的映射关系。换言之,发现前述问题的解决之道对不同取样频率设计独特量化表,使得以oct/s(每秒八重元组)表示的所涵盖的音高变异或扭曲的绝对范围对全部取样频率皆为相同(或至少大致相同)。发现此点例如可通过提供数个明确量化表,其各自用于邻近取样频率的狭窄范围而达成;或通过针对所使用的取样频率立即时动态量化表的计算而达成。
依据本发明的一实施例,此点可通过提供扭曲值的表,与通过从上式变换公式而计算针对相对音高变化音数的量化表:
上式中,prel标示相对音高变化因子,nf标示样本的帧长度,w标示扭曲,fs标示取样频率,及np标示一个帧内的音高节点数目。使用该公式,可获得显示于图4d的表的相对音高变化因子prel。
参考图4d,第一栏480标示一指数,该指数可视为时间扭曲码字组,及该指数可包括于表示该编码音频信号表示形态210的位流。第二栏482描述最大可表示的时间扭曲(以oct/s为单位表示),其可以与第一栏及个别列所示指数相关联的np及相对音高变化因子prel标示。第三栏484描述针对2400赫兹(Hz)取样频率,于个别列的第一栏480所给定的指数相关联的相对音高变化因子。第四栏486描述针对12000赫兹取样频率,于个别列的第一栏480所示指数相关联的相对音高变化因子。如此可知,指数0、1及2系对应“负”音高变化(亦即针对音高减低)的相对音高变化因子prel;指数值3系对应1的相对音高变化因子,其表示常数音高;及指数4、5、6及7系对应“正”音高变化,亦即针对音高增高的相对音高变化因子prel。
但发现为了获得相对音高变化因子,可有不同构想。发现获得相对音高变化因子的另一方式设计针对相对音高变化因子及相对应参考取样率的一量化值表。对一给定取样频率的实际量化表可使用下式而简易地从所设计的表中导算出:
prel描述一目前取样频率fs的相对音高变化因子。此外,prel,ref描述一参考取样频率fs,ref的相对音高变化因子。与不同指数(时间扭曲码字组)相关联的参考音高变化因子prel,ref集合可储存在表中,其中参考(相对)音高变化因子相应的参考取样频率fs,ref为已知。
业已发现后式对通过上式所得结果给予合理的近似估计,同时属于运算上较不复杂。
图4e显示从参考相对音高变化因子prel,ref所得的相对音高变化因子prel的一表格表示形态,其中该表保有相对取样频率fs,ref=24000赫兹。
第一栏490描述可视为时间扭曲码字组的一指数。第二栏492描述第一栏490在个别列所显示的指数(或码字组)相关联的参考相对音高变化因子prel,ref。第三栏494及第四栏496描述针对24000赫兹(第三栏494)及12000赫兹(第四栏496)的取样频率fs,与第一栏490指数相关联的(相对)音高变化因子。如此可知,针对显示于第三栏494的24000赫兹的取样频率fs,相对音高变化因子prel与第二栏492所示参考相对音高变化因子相同,原因在于24000赫兹的取样频率fs系等于参考取样频率fs,ref。但第四栏496显示在12000赫兹的取样频率fs的相对音高变化因子prel,其依据如上方程序(3)而从第二栏492的参考相对音高变化因子而导算出。
当然,如前述,此等量化程序容易直接地施加至例如于频率或音高上改变的任何其它表示形态,及也施加至编码绝对音高或频率值但未编码其相对变化的方案。
5.2.依据图4a的实现
图4a显示可用于依据本发明的一实施例的一种调适性映射400的方块示意图。
调适性映射400可替代于音频信号解码器200的映射234或于音频信号解码器350的映射234。
调适性映射400经组配来接收编码时间扭曲信息,如同例如包含时间扭曲码字组“tw_ratio[i]”的所谓“tw_data”信息。据此,调适性映射400可提供解码时间扭曲值,例如解码比值,其偶尔标示为值“warp_value_tbl[tw_ratio]”,及其偶尔也标示为相对音高变化因子prel。调适性映射400也接收取样频率信息,其描述例如由反变换230c所提供的时域表示形态240d的取样频率fs,或由重复取样240g所提供的经开窗且经重复取样的音频信号表示形态240i的平均取样频率,或解码音频信号表示形态212的取样频率。
调适性映射包含一映射器420,其提供呈编码时间扭曲信息的时间扭曲码字组的函数变化的一解码时间扭曲值。映射规则选择器430依据取样频率信息406而从多个映射表432、434中选出一映射表用以由映射器420使用。举例言之,若目前取样频率等于24000赫兹,或若目前取样频率系于24000赫兹的预定环境范围内,则映射规则选择器430选择一映射表,其表示由图4d的表的第一栏480及图4d的表的第三栏484所定义的映射。相反地,若取样频率fs等于12000赫兹,或若取样频率fs系于12000赫兹的预定环境范围内,则映射规则选择器430选择一映射表,其表示由图4d的表的第一栏480及图4d的表的第四栏486所定义的映射。
据此,当取样频率系等于24000赫兹时,时间扭曲码字组(也标示为“指数”)0-7映射至图4d的表的第三栏484所示个别解码时间扭曲值(或相对音高变化因子);而当取样频率等于12000赫兹时,映射至图4d的表的第四栏486所示个别解码时间扭曲值(或相对音高变化因子)。
总而言之,依据取样频率,由映射规则选择器430可选择不同映射表,藉此将一时间扭曲码字组(例如包括于表示解码音频信号的位流的值“指数”)映射至一解码时间扭曲值(例如相对音高变化因子prel,或时间扭曲值“warp_value_tbl”)。
5.3.依据图4b的实现
图4b显示可用于依据本发明的一实施例的一种调适性映射450的方块示意图。调适性映射450可替代于音频信号解码器200的映射234或于音频信号解码器350的映射234。调适性映射450经组配来接收编码时间扭曲信息,其中适用前文有关调适性映射400的解说。
首先,调适性映射450经组配来提供解码时间扭曲值,其中也适用前文有关调适性映射400的解说。
调适性映射450包含一映射器470,其经组配来接收编码时间扭曲的码字组及提供解码时间扭曲值。调适性映射450也包含一映射值运算器或映射表运算器480。
于映射值运算器的情况下,解码时间扭曲值依据如上方程序(3)运算。用于此项目的,映射值运算器可包含一参考映射表482。该参考映射表482可例如描述由图4e的表的第一栏490及第二栏492所定义的映射信息。据此,映射值运算器480及映射器470可协力合作使得基于参考映射表而针对一给定时间扭曲码字组选择一相应的参考相对音高变化因子,及使得对应该给定时间扭曲码字组的相对音高变化因子prel依据方程式(3)使用有关目前取样频率fs的信息运算,及送返作为解码时间扭曲值。此种情况下,甚至无需储存调整适用于目前取样频率fs的一映射表的全部分录而牺牲针对各时间扭曲码字组的解码时间扭曲值(相对音高变化因子)的运算。
但另外,映射表运算器480可前置运算调适于目前取样频率fs的一映射表供映射器470使用。举例言之,映射表运算器可经组配来回应于发现选择12000赫兹的目前取样频率而运算图4e第四栏496的分录。针对12000赫兹的取样频率fs而运算相对音高变化因子prel可基于参考映射表(例如包含由图4e的表的第一栏490及第二栏492所定义的映射),且可使用方程式(3)执行。
据此,该经前置运算的映射表可用于将一时间扭曲码字组映射至一解码时间扭曲值。此外,每当重复取样率改变时,可更新前置取样映射表。
总而言之,针对时间扭曲码字组映射至解码时间扭曲值的映射的映射规则可基于参考映射表482评估或运算,其中可执行调适于目前取样频率的一映射表的前置运算,或解码时间扭曲值的实时动态运算。
6.时间扭曲控制信息的运算的细节描述
后文将叙述有关基于时间扭曲轮廓演变信息的时间扭曲控制信息的运算细节。
6.1.依据图5a及图5b的装置
图5a及图5b显示用以基于时间扭曲轮廓演变信息510,其可包含解码时间扭曲信息及其例如可包含由时间扭曲计算器230的映射234所提供的解码时间扭曲值,而提供时间扭曲控制信息512的装置500的方块示意图。装置500包含用以基于时间扭曲轮廓演变信息510而提供重建时间扭曲轮廓信息522的设备520,及用以基于重建时间扭曲轮廓信息522而提供时间扭曲控制信息512的一时间扭曲控制信息计算器530。
后文中,将叙述设备520的结构及功能。
设备520包含一时间扭曲轮廓计算器540,其经组配来接收时间扭曲轮廓演变信息510,及基于此而提供新的时间扭曲轮廓部分信息542。举例言之,针对欲重建的音频信号的各帧,时间扭曲轮廓演变信息的一集合(例如由映射234所提供的预定数目解码时间扭曲值集合)可传送至装置500。虽言如此,于某些情况下,与欲重建立一音频信号帧相关联的时间扭曲轮廓演变信息510集合可用于多个音频信号帧的重建。同理,多个时间扭曲轮廓演变信息集合可用于音频信号的单一帧的音频内容的重建,容后详述。总结而言,于某些情况下,时间扭曲轮廓演变信息可以与欲重建的音频信号变换域系数集合相等的速率更新(每一音频信号帧为1时间扭曲轮廓演变信息510集合,及/或每一音频信号帧为一个时间扭曲轮廓部分)。
时间扭曲轮廓计算器540包含一扭曲节点值计算器544,其经组配来基于多个时间扭曲轮廓比值(或时间序列)而运算多个扭曲轮廓节点值(或时间序列),其中该时间扭曲比值包含于时间扭曲轮廓演变信息510。换言之,由映射234所提供的解码时间扭曲值可组成时间扭曲比值(例如warp_value_tbl[tw_ratio[]])。为了达成此项目的,扭曲节点值计算器544经组配来于预定起始值(例如1)而开始提供时间扭曲轮廓节点值,及使用该时间扭曲比值而计算随后的时间扭曲轮廓节点值,容后详述。
又,扭曲节点值计算器544选择性地包含一内插器548,其经组配来在内插在随后时间扭曲轮廓节点值间。如此,获得新时间扭曲轮廓部分的描述542,其中该新时间扭曲轮廓部分典型地始于由扭曲节点计算器524所使用的预定起始值。此外,设备520经组配来将所谓“上一个时间扭曲轮廓部分”及所谓的“目前时间扭曲轮廓部分”储存在图5未显示的内存。
但设备520包含一重新定标器550,其经组配来重新定标“上一个时间扭曲轮廓部分”及“目前时间扭曲轮廓部分”而避免(或减少,或消除)整个时间扭曲轮廓区段的非连续,该整个区段基于“上一个时间扭曲轮廓部分”、“目前时间扭曲轮廓部分”及“新时间扭曲轮廓部分”。为了达成此项目的,重新定标器550经组配来接收“上一个时间扭曲轮廓部分”及“目前时间扭曲轮廓部分”的描述,及将“上一个时间扭曲轮廓部分”及“目前时间扭曲轮廓部分”一起重新定标来获得“上一个时间扭曲轮廓部分”及“目前时间扭曲轮廓部分”的重新定标版本。有关此一功能细节叙述如下。
此外,重新定标器550也可经组配来例如从图5未显示的一内存而接收在与“目前时间扭曲轮廓部分”相关联的另一和值内部的与“上一个时间扭曲轮廓部分”相关联的一和值。此等和值偶尔分别地标示为“last_warp_sum”及“cur_warp_sum”。重新定标器550经组配来使用相应的时间扭曲轮廓部分所用来重新定标的相同重新定标因子而重新定标与时间扭曲轮廓部分相关联的和值。据此获得经重新定标的和值。
于某些情况下,设备520可包含一更新器560,其经组配来重复地更新输入重新定标器550的时间扭曲轮廓部分,及亦重复地更新输入重新定标器550的和值。举例言之,更新器560可经组配来以该帧率更新该信息。例如,目前帧周期的“新时间扭曲轮廓部分”可用作为下一个帧周期的“目前时间扭曲轮廓部分”。同理,目前帧周期的“目前时间扭曲轮廓部分”可用作为下一个帧周期的“上一个时间扭曲轮廓部分”。据此,形成内存有效率实现,原因在于目前帧周期的“上一个时间扭曲轮廓部分”可在“目前帧周期”完成时被抛弃。
综上所述,设备520经组配来针对各个帧周期(除例如在帧序列的开始、或在帧序列的结束、或在时间扭曲停止的帧中一些特殊的帧周期之外),提供包含“新时间扭曲轮廓部分”、“重新定标目前时间扭曲轮廓部分”及“重新定标上一个时间扭曲轮廓部分”的描述的时间扭曲轮廓区段的描述。此外,设备520可针对各个帧周期(前述特殊帧周期除外),提供扭曲轮廓和值的一表示形态,例如包含“新时间扭曲轮廓部分”、“重新定标目前时间扭曲轮廓部分”及“重新定标上一个时间扭曲轮廓部分”。
时间扭曲控制信息计算器530经组配来基于由设备520所提供的重建时间扭曲轮廓信息542而计算时间扭曲控制信息512。举例言之,时间扭曲控制信息计算器530包含一时间轮廓计算器570,其经组配来基于重建时间扭曲轮廓信息而运算一时间轮廓572(例如时间扭曲轮廓的逐一样本表示形态)。此外,时间扭曲控制信息计算器530包含一样本位置计算器574,其设置来接收时间轮廓572,及基于此而提供例如呈样本位置向量576的样本位置信息。样本位置向量576描述例如由重复取样器240g所执行的时间扭曲。
时间扭曲控制信息计算器530也包含一过渡长度计算器,其经组配来从重建时间扭曲轮廓信息而导算过渡长度信息。过渡长度信息582例如可包含描述左过渡长度的信息及描述右过渡长度的信息。过渡长度例如可取决于由“上一个时间扭曲轮廓部分”、“目前时间扭曲轮廓部分”及“新时间扭曲轮廓部分”所描述的时间节段长度。举例言之,若由“上一个时间扭曲轮廓部分”所描述的时间节点的时间延长比由“目前时间扭曲轮廓部分”所描述的时间节点的时间延长短,或若由“新时间扭曲轮廓部分”所描述的时间节点的时间延长比由“目前时间扭曲轮廓部分”所描述的时间节点的时间延长短,则过渡长度可缩短(比较内设过渡长度)。
此外,时间扭曲控制信息计算器530可进一步包含一第一及最末位置计算器584,其经组配来基于左及右过渡长度而计算所谓的“第一位置”及“最末位置”。若在此等位置外侧区在开窗后系与零相同,且因而无需考虑时间扭曲,则“第一位置”及“最末位置”提高重复取样器效率。此处须注意样本位置向量576例如包含由重复取样器240g所执行的时间扭曲所使用的(或甚至要求的)信息。此外,左及右过渡长度582及“第一位置”及“最末位置”586组成例如由开窗器240e所使用的(或甚至要求的)信息。
据此,可谓设备520及时间扭曲控制信息计算器530可一起接管取样率调整器240m、窗形调整器240l及取样位置计算240k的功能。
6.2.依据图6a及图6b的功能描述
后文中,将参考图6a及图6b描述包含设备520及时间扭曲控制信息计算器530的一音频解码器的功能。
图6a及图6b显示依据本发明的一实施例,一种用以解码一音频信号的编码表示形态的流程图。该方法600包含提供重建时间扭曲轮廓信息,其中提供重建时间扭曲轮廓信息包含将编码时间扭曲信息的码字组映射604至解码时间扭曲值;计算610扭曲节点值;内插620在扭曲节点值间;及重新定标630一或多个先前计算的扭曲轮廓部分及一或多个先前计算的扭曲轮廓和值。方法600进一步包含使用在步骤610及620所得“新时间扭曲轮廓部分”、重新定标的先前计算得的时间扭曲轮廓部分(“目前时间扭曲轮廓部分”、“上一个时间扭曲轮廓部分”)及选择性地(也使用重新定标的计算得的扭曲轮廓和值来计算640时间扭曲控制信息。结果,于步骤640可获得时间轮廓信息、及/或样本位置信息、及/或过渡长度信息及/或第一位置及最末位置信息。
该方法600进一步包含使用于步骤640所获得的时间轮廓信息执行650时间扭曲信号重建。后文将叙述有关时间扭曲信号重建的细节。
方法600也包含更新内存的一步骤660,容后详述。
7.算法的细节描述
7.1.综论
后文中,将以细节描述依据本发明的一实施例,通过音频解码器所执行的若干算法。为了达成此项目的,将参考图5a、5b、6a、6b、7a、7b、8、9、10a、10b、11、12、13、14、15及16做说明。
首先,参考图7a,显示数据元素的定义的图例及辅助元素的定义的图例。此外,参考图7b,显示常数的定义的图例。
概略言之,可谓此处所述方法可用于依据时间扭曲而修改离散余弦变换而编码的音频流的解码。如此,当针对一音频流允许TW-MDCT激活(可以旗标例如称作为“twMDCT”旗标指示,其可包含于特定组态信息)时,时间扭曲滤波器组及区块切换可置换音频解码器的标准滤波器组及区块切换。除了修改离散余弦反变换(IMDCT)的外,时间扭曲滤波器组及区块切换含有自任意间隔时间网格映射至正常规则间隔或线性间隔时间网格的时域至时域映射,及相应的窗形调适。
此处须注意基于频谱的细码表示形态214及也基于编码时间扭曲信息232,此处所述解码算法例如可通过扭曲解码器240进行。
7.2.定义:
至于数据元素、辅助元素及常数的定义,请参考图7a及图7b。
7.3.解码处理-扭曲轮廓
扭曲轮廓节点的码簿指数系针对个别节点,如后文说明而解码成扭曲值:
但时间扭曲码字组“tw_ratio[k]”的映射至解码时间扭曲值,此处标示为“warp_value_tbl[tw_ratio[k]]”,于依据本发明的实施例取决于取样频率。据此,于依据本发明的实施例并非单一映射表,反而对不同取样频率有个别映射表。
举例言之,通过映射表存取与目前取样频率相应的映射表所送返的结果值“warp_value_tbl[tw_ratio[k]]”可被视为解码时间扭曲值,且可基于包括于组成(或表示)编码音频信号表示形态210的一位流中的时间扭曲码字组“tw_ratio[k]”,而通过映射234、通过调适性映射400或通过调适性映射450提供。
为了获得逐一样本(n_long samples)新扭曲轮廓数据“new_warp_contour[]”,现在使用一种算法,其假程序码表示形态显示于图9,扭曲节点值“warp_node_values[]”现在在等间隔(interp_dist apart)节点内插。
在获得此一帧(例如目前帧)的全扭曲轮廓前,来自于过去的缓冲值可被重新定标,使得过去扭曲轮廓“past_warp_contour[]”的最末扭曲值=1。
past_warp_contour[i]=past_warp_contour[i]·norm_fac对于0≤i<2·n_long
last_warp_sum=last_warp_sum·norm_fac
cur_warp_sum=cur_warp_sum·norm_fac
通过串接(concatenating)过去扭曲轮廓“past_warp_contour”及新扭曲轮廓“new_warp_contour”,获得全扭曲轮廓“warp_contour[]”,及新扭曲和“new_warp_sum”计算为全部新扭曲轮廓值“new_warp_contour[]”的和。
7.4.解码处理-样本位置及窗长度调整
自扭曲轮廓“warp_contour[]”,运算在线性时间标度上扭曲样本的样本位置向量。对此依据如下方程序而产生时间扭曲轮廓:
其中
运用辅助功能“warp_inv_vec()”及“warp_time_vec()”,其假程序码表示形态分别显示于图10a及图10b,依据一个算法,其假程序码表示形态分别显示于图11,而运算样本位置向量及过渡长度。
7.5.解码处理-修改离散余弦反变换(IMDCT)
后文中,将简短描述修改离散余弦反变换。
修改离散余弦反变换的分析表示法如下:
此处:
n=样本指数
i=窗指数
k=频谱系数指数
N=基于window_sequence的窗长度
n0=(N/2+1)/2
反变换的合成窗长度为语法元素“window_sequence”(其可包括于位流)及算法上下文的函数。合成窗长度例如依据图12的表定义。
有意义的区块过渡列举在图13的表。于一给定窗体元的打钩记号指示列举在此一特定列的窗序列可接着为此一特定行所列举的一窗序列。
有关容许的窗序列,须注意音频解码器例如可在不同长度窗间切换。但窗长度的切换与本发明并非特别相关。反而基于假设:有一型“only_long_sequence”窗序列及核心编码器帧长度等于1024,可了解本发明。
此外,须注意音频信号解码器可在频域编码模式与时域编码模式间切换。但此一可能性并非与本发明特别相关。反而,本发明适用于只能处理频域编码模式的音频信号编码器,例如参考图1、2、3a及3b讨论。
7.6.解码处理-开窗及区块切换
后文将描述可通过扭曲解码器240及特别通过其开窗器240e而执行的开窗及区块切换。
依据“window_shape”元素(其可包括于表示音频信号的位流),使用不同的过取样变换窗原型,及过取样窗长度为
NOS=2·n_long·OS_FACTOR_WIN
针对window_shape==1,通过凯舍-贝索导出(KBD)窗而给定窗系数如下:
其中:
W’,凯舍-贝索核心函数定义如下:
α=核心窗α因子,α=4
否则,针对window_shape==0,采用正弦窗如下:
针对全部各种窗序列,左窗部分所使用的原型由前一区块的窗形决定。下式表示此项事实:
同理,右窗形的原型通过下式决定:
因已经决定过渡窗长度,只须在“EIGHT_SHORT_SEQUENCE”型窗序列与全部其它窗序列间区别。
于目前帧属于“EIGHT_SHORT_SEQUENCE”型的情况下,执行开窗及内部(帧内部)重迭及加法。图14的C码状部分描述具有窗型“EIGHT_SHORT_SEQUENCE”的帧的开窗及内部重迭及加法。
针对任何其它类型帧,可使用算法,其假程序代码型系显示于图15。
7.7.解码处理-时间变异重复取样
后文中,将描述时间变异重复取样,其可通过扭曲解码器240,特别通过重复取样器240g执行。
开窗区块z[]使用如下脉冲响应,依据样本位置(其通过取样位置计算240k基于由映射234所提供的解码时间扭曲值而提供)重复取样:
在重复取样前,已开窗区块在两端以零填补:
重复取样本身描述在图16所示的假程序代码章节。
7.8.解码处理-利用先前窗序列重迭及相加
通过扭曲解码器240的重迭器/加法器240j执行的重迭及相加对全部序列皆相同且以数学式描述如下:
7.9.解码处理-内存更新
后文中将说明内存更新。即便图3d并未显示特定手段,但须注意内存更新可通过扭曲解码器240执行。
解码下一个帧所需内存缓冲器更新如下:
past_warp_contour[n]=warp_contour[n+n_long],对于0≤n<2·n_long
cur_warp_sum=new_warp_sum
last_warp_sum=cur_warp_sum
第一帧解码前或末帧以光学LPC域编码器编码时,内存状态设定如下:
past_warp_contour[n]=1,对于0≤n<2·n_long
cur_warp_sum=n_long
last_warp_sum=n_long
7.10.解码处理-结论
综上所述,已经描述解码处理程序,其可通过扭曲解码器240执行。如此可知,时域表示形态如对2048时域样本的一音频帧提供,及随后音频帧例如可重迭约50%,使得确保随后音频帧的时域表示形态间的平顺过渡。
例如NUM_TW_NODES=16解码时间扭曲值的一集合例如可关联各个音频帧(设该音频帧的时间扭曲为致动),而与音频帧的时域样本的实际取样频率独立无关。
8.依据图17a至图17f的音频流
后文中,将描述音频流,其包含一或多个音频信号信道及一或多个时间扭曲轮廓的编码表示形态。后文中描述的音频流例如携载编码音频信号表示形态112或编码音频信号表示形态210。
图17a显示所谓的“USAC_raw_data_block”数据流元素的线图表示形态,其可包含一信号频道元素(SCE)、一成对频道元素(CPE)、及一或多个信号频道元素及/或一或多个成对频道元素的组合。
“USAC_raw_data_block”典型地可包含一编码音频数据区块,而额外时间扭曲轮廓信息可于一分开数据流元素提供。虽言如此,当然可能将部分时间扭曲轮廓值编码成“USAC_raw_data_block”。
如由图17b可知,单一频道元素典型地包含频域频道流(“fd_channel_stream”),容后参考图17d详加说明。
如由图17c可知,成对频道元素(“channel_pair_element”)典型地包含多个频域频道流。又,成对频道元素可包含时间扭曲信息,例如时间扭曲致动旗标(“tw_MDCT”),其可于组态数据流元素中或在“USAC_raw_data_block”中传送,及其判定时间扭曲信息是否包括于成对频道元素。举例言之,“tw_MDCT”旗标指示时间扭曲为激活时,成对频道元素可包含一旗标(“common_tw”),其指示成对频道元素的音频频道是否具有一共通时间扭曲。若该旗标(“common_tw”)指示多个音频频道具有一共通时间扭曲,则一共通时间扭曲信息(“tw_data”」)包括在成对频道元素,例如与频域频道流分开。
现在参考图17d,描述频域频道流。如由图17d可知,频域频道流例如包含通用增益信息。又,若时间扭曲为激活(旗标“tw_MDCT”为激活)且若对多个音频信号频道无共享时间扭曲信息(旗标“common_tw”为非激活),则频域频道流包含时间扭曲数据。
又,频域频道流也包含定标因子数据(“scale_factor_data”)及编码频谱数据(例如算术编码频谱数据“ac_spectral_data”)。
现在参考图17e,简短讨论时间扭曲数据的语法。时间扭曲数据例如可选择性地包含一旗标(例如“tw_data_present”或“active_pitch_data”指示是否存在有时间扭曲数据。若存在有时间扭曲数据(亦即时间扭曲轮廓非为平坦),则时间扭曲数据可包含多个编码时间扭曲比值序列(例如“tw_ratio[i]”或“pitchIdx[i]”),其例如可依据取样率依赖性码簿表编码,如前文已述。
如此,时间扭曲数据可包含一旗标,指示当时间扭曲轮廓为常数(时间扭曲比约等于1.000)时,并无可通过音频信号编码器设定的时间扭曲数据可资利用。相反地,当时间扭曲轮廓为可变时,随后时间扭曲轮廓节点间之比可使用组成“tw_ratio”信息的码簿指数编码。
图17f显示算术编码频谱数据“ac_spectral_data()”的语法的线图表示形态。算术编码频谱数据依据非相关性旗标(此处:“indepFlag”)状态而编码,该旗标若为激活,则指示算术编码数据系与前一帧的算术编码数据独立无关。若非相关性旗标“indepFlag”为激活,则算术重置旗标“arith_reset_flag”设定为激活。否则,算术重置旗标的值取决于算术编码频谱数据的一位。
此外,算术编码频谱数据区块“ac_spectral_data()”包含一或多个算术编码数据单元,其中算术编码数据“arith_data()”单元数目取决于目前帧的区块(或窗)数目。于一长区块模式中,每个音频帧只有一个窗。但于一短区块模式中,每个音频帧例如可有八个窗。算术编码频谱数据“arith_data”的各个单元包含一频谱系数集合,其可用作为频域至时域变换的输入信号,该项变换例如可通过反变换240c执行。
每单元算术编码数据“arith_data”的频谱系数数目例如可与取样频率独立无关,但可取决于区块长度模式(短区块模式“EIGHT_SHORT_SEQUENCE”或长区块模式“ONLY_LONG_SEQUENCE”)。
9.结论
综上所述,业已描述时间扭曲修改离散余弦变换(TW-MDCT)的改良。前述发明是关于时间扭曲MDCT变换编码器上下文,及形成用以改良时间扭曲MDCT变换编码器的效能的方法。有关时间扭曲修改离散余弦变换细节,请注意参考文献[1]及[2]。
此种时间扭曲MDCT变换编码器的一项具体实现在正在进行中的MPEG USAC音频编码标准化工作(例如参考参考文献[3])。所使用的时间扭曲MDCT实现细节请参照参考文献[4]。
此外,须注意此处描述的音频信号编码器及音频信号解码器包含国际专利申请WO/2010/003583、WO/2010/003618、WO/1010/003581及WO/2010/003582所述特征结构。四件国际专利申请案的教示明确地以引用方式并入此处。该四件国际专利申请案所揭示的特征结构及特性可并入依据本发明的实施例。
10.实现替代的方式
虽然已经就装置上下文描述若干方面,但显然此等方面也表示相应方法的描述,此处一区块或一装置系对应一方法步骤或一方法步骤的特征结构。同理,于一方法步骤上下文所描述的方面也表示对应装置的对应区块或项目或特数的描述。部分或全部方法步骤可通过(或使用)硬件装置例如,微处理器、可程序计算机或电子电路执行。于若干实施例中,最主要方法步骤中的某一个或某些个可通过此种装置执行。
本发明的编码音频信号可储存在一数字储存媒体或可在传输媒体诸如无线传输媒体或有线传输媒体诸如因特网上传输。
依据某些实现要求,本发明的实施例可在硬件或软件实现。该项实现可使用数字储存媒体执行,该媒体例如为软盘、DVD、CD、ROM、PROM、EPROM、EEPROM、或闪存(FLASH),其上储存有可电子式读取控制信号,该信号与可编程计算机系统协力合作(或可协力合作)来执行个别方法。因此该数字储存媒体可为计算机读取。
依据本发明的若干实施例包含一种具有可电子式读取控制信号的数据载体,其可与可编程计算机系统协力合作因而执行此处所述方法中的一者。
一般而言,本发明的实施例可实现为具有程序代码的一种计算机程序产品,该程序代码可操作来当该计算机程序产品在一计算机上运行时执行该方法中的一者。该程序代码例如可储存在机器可读取载体上。
其它实施例包含储存在机器可读取载体上用以执行此处所述方法中的一者的该计算机程序。
换言之,因此本发明方法的一实施例为一种具有一程序代码的计算机程序,当该计算机程序在一计算机上运行时该程序代码用以执行此处所述方法中的一者。
因此本发明方法的又一实施例为一种数据载体(或数字储存媒体,或计算机可读取媒体)包含记录于其上的用以执行此处所述方法中的一者的计算机程序。
因此本发明方法的又一实施例为一种表现用以执行此处所述方法中的一者的计算机程序的数据流或一系列信号。该数据流或一系列信号例如可经组配来透过数据通信连结,例如透过因特网传输。
又一实施例包含一种组配来或适用于执行此处所述方法中的一者的处理装置,例如计算机或可编程逻辑装置。
又一实施例包含一种计算机,其上安装有用以执行此处所述方法中的一者的计算机程序。
依据本发明的又一实施例包含组配来传输(例如电子式或光学式)用以执行此处所述方法中的一者的计算机程序给一接收器的一种装置或系统。该接收器例如可为计算机、行动装置、内存组件等。该装置或系统例如可包含一种用来将计算机程序传输至接收器的档案服务器。
于若干实施例中,可使用可编程逻辑装置(例如场可编程门阵列)来执行此处所述方法中的部分或全部功能。于若干实施例中,场可编程门阵列可与微处理器协力合作来执行此处所述方法中的一者。一般而言,该方法较佳通过任一种硬件装置执行。
前述实施例仅供举例说明本发明的原理。须了解此处所述配置及细节的修改及变异为本领域技术人员显然易知。因此,本发明意图仅受随附的申请权利要求的范围所限,而非受此处通过实施例的描述及解说所呈现的特定细节所限。
参考文献
[1]Bernd Edler et.al.,“Time Warped MDCT”,US61/042,314,Provisional application for patent,
[2]L.Villemoes,“Time Warped Transform Coding of AudioSignals”,
PCT/EP2006/010246,International.patent application,November2005.
[3]“WD6of USAC”,ISO/IEC JTC1/SC29/WG11N11213,2010
[4]Bernd Edler et.al.,“A Time-Warped MDCT Approach toSpeech Transform Coding”,126th AES Convention,Munich,May2009,preprint7710
[5]Nikolaus Meine,“Vektorquantisierung undarithmetischeCodierung für MPEG-4AAC”,VDI,Hannover,2007
Claims (15)
1.一种经组配来基于包含一取样频率信息(218)的一编码音频信号表示形态(112,210)、一编码时间扭曲信息(216)及一编码频谱表示形态(214)而提供一解码音频信号表示形态(212)的音频信号解码器(200,350),该音频信号解码器包含:
一时间扭曲计算器(230,604),其经组配来将该编码时间扭曲信息(216)映射至一解码时间扭曲信息(232),
其中,该时间扭曲计算器经组配来依据该取样频率信息(218)而调适用以将编码时间扭曲信息(216)的码字组映射至描述该解码时间扭曲信息(232)的解码时间扭曲值的一映射规则;及
一扭曲解码器(240),其经组配来基于该编码频谱表示形态(214)及依据该解码时间扭曲信息(232)而提供该解码音频信号表示形态(212)。
2.根据权利要求1所述的音频信号解码器,其中,该编码时间扭曲信息(216)的码字组描述一时间扭曲轮廓的时间演变,及
其中,该时间扭曲计算器(230,604)经组配来对由该编码音频信号表示形态(214)所表示的编码音频信号的一音频帧,评估该编码时间扭曲信息(216)的码字组的预定数目,其中该码字组的预定数目与该编码音频信号的取样频率独立无关。
3.根据权利要求1所述的音频信号解码器,其中,该时间扭曲计算器(230)经组配来调适该映射规则,使得该编码时间扭曲信息(216)的码字组的一给定集合的码字组映射于其上的一解码时间扭曲值范围对第一取样频率比对第二取样频率大,但限制条件为该第一取样频率小于该第二取样频率。
4.根据权利要求3所述的音频信号解码器,其中,该解码时间扭曲值为表示时间扭曲轮廓值的时间扭曲轮廓值或表示时间扭曲轮廓值的绝对变化或相对变化的时间扭曲轮廓值。
5.根据权利要求1所述的音频信号解码器,其中,该时间扭曲计算器(230)经组配来调适该映射规则,使得历经通过该编码音频信号表示形态(112,210)所表示的一编码音频信号的一给定数目样本的最大音高变化,其可以该编码时间扭曲信息(216)的码字组的一给定集合表示者对第一取样频率比对第二取样频率大,但限制条件为该第一取样频率小于该第二取样频率。
6.根据权利要求1所述的音频信号解码器,其中,该时间扭曲计算器(230)经组配来调适该映射规则,使得通过一第一取样频率的该编码时间扭曲信息(216)的码字组的一给定集合所表示的历经一段给定时间周期的最大音高变化,与通过一第二取样频率的该编码时间扭曲信息的码字组的该给定集合所表示的历经一段给定时间周期的最大音高变化间的差异,对一第一取样频率与一第二取样频率间的差异达至少30%者不大于10%。
7.根据权利要求1所述的音频信号解码器,其中,该时间扭曲计算器(230)经组配来依据该取样频率信息(218)使用不同映射表(480,484,480,486)用以将该编码时间扭曲信息(216)的码字组映射至解码时间扭曲值。
8.根据权利要求1所述的音频信号解码器,其中,该时间扭曲计算器经组配来将对一参考取样频率描述与该编码时间扭曲信息(216)的不同码字组(490)相关联的解码时间扭曲值的参考映射值(494),调整配合与该参考取样频率不同的一实际取样频率,而获得适应性映射值(496)。
9.根据权利要求8所述的音频信号解码器,其中,该时间扭曲计算器经组配来依据该实际取样频率与该参考取样频率间之比而定标描述一时间扭曲的部分参考映射值(494)。
10.根据权利要求1所述的音频信号解码器,其中,该解码时间扭曲值描述历经由该编码音频信号表示形态(210)所表示的编码音频信号的预定数目样本的时间扭曲轮廓变化,及
其中,该音频信号解码器包含一取样位置计算器,其中该取样位置计算器经组配来组合表示时间扭曲轮廓变化的多个解码时间扭曲值,而导算出一扭曲轮廓节点值,使得所导算出的扭曲轮廓节点值的偏离一参考扭曲节点值大于由该解码时间扭曲值中的单一者所表示的偏离。
11.根据权利要求1所述的音频信号解码器,其中,该解码时间扭曲值描述历经由该编码音频信号表示形态(210)所表示的编码音频信号的预定数目样本的时间扭曲轮廓的相对变化,及
其中,该音频信号解码器包含一取样位置计算器,其中该取样位置计算器经组配来从该解码时间扭曲值而导算出一时间扭曲轮廓信息。
12.根据权利要求1所述的音频信号解码器,其中,该音频信号解码器包含一取样位置计算器,其中该取样位置计算器(240k)经组配来基于该解码时间扭曲值而运算一时间扭曲轮廓的支点,及
其中,该取样位置计算器经组配来在该支点间内插而获得该时间扭曲轮廓,及
其中,每个音频帧的多个解码时间扭曲值与该取样频率独立无关。
13.一种用以提供一音频信号(110)的编码表示形态(112)的音频信号编码器(100;300),该音频信号编码器包含:
一时间扭曲轮廓编码器(130),其经组配来将描述一时间扭曲轮廓的时间扭曲值映射至一编码时间扭曲信息(132),
其中,该时间扭曲轮廓编码器(130)经组配来依据该音频信号(110)的一取样频率而调适用以将描述该时间扭曲轮廓的该时间扭曲值映射至该编码时间扭曲信息(132)的码字组的一映射规则(134);及
一时间扭曲信号编码器(140),其经组配来考虑由该时间扭曲轮廓信息(122)所描述的一时间扭曲而获得该音频信号的一频谱的一编码表示形态(142),
其中,该音频信号(110)的编码表示形态(112)包含该编码时间扭曲信息(132)的码字组、该频谱的编码表示(142)形态、及描述该取样频率的一取样频率信息(152)。
14.一种用以基于包含一取样频率信息的一编码音频信号表示形态、一编码时间扭曲信息及一编码频谱表示形态而提供一解码音频信号表示形态的方法,该方法包含:
将该编码时间扭曲信息映射至一解码时间扭曲信息,其中用以将编码时间扭曲信息的码字组映射至描述该解码时间扭曲信息的解码时间扭曲值的一映射规则依据该取样频率信息而调适;及
基于该编码频谱表示形态及依据该解码时间扭曲信息而提供该解码音频信号表示形态。
15.一种用以提供一音频信号的编码表示形态的方法,该方法包含:
将描述一时间扭曲轮廓的时间扭曲值映射至一编码时间扭曲信息,
其中,用以将描述该时间扭曲轮廓的该时间扭曲值映射至该编码时间扭曲信息的码字组的一映射规则依据该音频信号的一取样频率而调适;
考虑由该时间扭曲轮廓信息所描述的一时间扭曲而获得该音频信号的一频谱的一编码表示形态,
其中,该音频信号的编码表示形态包含该编码时间扭曲信息的码字组、该频谱的编码表示形态、及描述该取样频率的一取样频率信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31250310P | 2010-03-10 | 2010-03-10 | |
US61/312,503 | 2010-03-10 | ||
PCT/EP2011/053538 WO2011110591A1 (en) | 2010-03-10 | 2011-03-09 | Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102884573A CN102884573A (zh) | 2013-01-16 |
CN102884573B true CN102884573B (zh) | 2014-09-10 |
Family
ID=43829343
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180021269.2A Active CN102884572B (zh) | 2010-03-10 | 2011-03-09 | 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法 |
CN201180023298.2A Active CN102884573B (zh) | 2010-03-10 | 2011-03-09 | 使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器及方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180021269.2A Active CN102884572B (zh) | 2010-03-10 | 2011-03-09 | 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法 |
Country Status (16)
Country | Link |
---|---|
US (2) | US9129597B2 (zh) |
EP (2) | EP2539893B1 (zh) |
JP (2) | JP5625076B2 (zh) |
KR (2) | KR101445296B1 (zh) |
CN (2) | CN102884572B (zh) |
AR (2) | AR084465A1 (zh) |
AU (2) | AU2011226143B9 (zh) |
BR (2) | BR112012022741B1 (zh) |
CA (2) | CA2792504C (zh) |
ES (2) | ES2461183T3 (zh) |
HK (2) | HK1179743A1 (zh) |
MX (2) | MX2012010439A (zh) |
PL (2) | PL2532001T3 (zh) |
RU (2) | RU2607264C2 (zh) |
TW (2) | TWI455113B (zh) |
WO (2) | WO2011110591A1 (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2083418A1 (en) * | 2008-01-24 | 2009-07-29 | Deutsche Thomson OHG | Method and Apparatus for determining and using the sampling frequency for decoding watermark information embedded in a received signal sampled with an original sampling frequency at encoder side |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN103035249B (zh) * | 2012-11-14 | 2015-04-08 | 北京理工大学 | 一种基于时频平面上下文的音频算术编码方法 |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
SG11201510459YA (en) | 2013-06-21 | 2016-01-28 | Fraunhofer Ges Forschung | Jitter buffer control, audio decoder, method and computer program |
EP3321935B1 (en) | 2013-06-21 | 2019-05-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time scaler, audio decoder, method and a computer program using a quality control |
CA2925734C (en) * | 2013-10-18 | 2018-07-10 | Guillaume Fuchs | Coding of spectral coefficients of a spectrum of an audio signal |
US9997165B2 (en) * | 2013-10-18 | 2018-06-12 | Telefonaktiebolaget L M Ericsson (Publ) | Coding and decoding of spectral peak positions |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
CN110808056B (zh) * | 2014-03-14 | 2023-10-17 | 瑞典爱立信有限公司 | 音频编码方法和装置 |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN105070292B (zh) * | 2015-07-10 | 2018-11-16 | 珠海市杰理科技股份有限公司 | 音频文件数据重排序的方法和系统 |
KR102083200B1 (ko) * | 2016-01-22 | 2020-04-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 |
EP3306609A1 (en) * | 2016-10-04 | 2018-04-11 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for determining a pitch information |
RU2744485C1 (ru) * | 2017-10-27 | 2021-03-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Ослабление шума в декодере |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US20210192681A1 (en) * | 2019-12-18 | 2021-06-24 | Ati Technologies Ulc | Frame reprojection for virtual reality and augmented reality |
US11776562B2 (en) * | 2020-05-29 | 2023-10-03 | Qualcomm Incorporated | Context-aware hardware-based voice activity detection |
AU2021359779A1 (en) * | 2020-10-13 | 2023-06-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects |
CN114488105B (zh) * | 2022-04-15 | 2022-08-23 | 四川锐明智通科技有限公司 | 一种基于运动特征及方向模板滤波的雷达目标检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101171626A (zh) * | 2005-03-11 | 2008-04-30 | 高通股份有限公司 | 通过修改残余对声码器内的帧进行时间扭曲 |
CN101351840A (zh) * | 2005-11-03 | 2009-01-21 | 科丁技术公司 | 对音频信号的时间伸缩改进变换编码 |
CN101375330A (zh) * | 2006-08-15 | 2009-02-25 | 美国博通公司 | 丢包后解码音频信号的时间扭曲 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP4196235B2 (ja) * | 1999-01-19 | 2008-12-17 | ソニー株式会社 | オーディオデータ処理装置 |
WO2000074039A1 (en) * | 1999-05-26 | 2000-12-07 | Koninklijke Philips Electronics N.V. | Audio signal transmission system |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
JP4364544B2 (ja) * | 2003-04-09 | 2009-11-18 | 株式会社神戸製鋼所 | 音声信号処理装置及びその方法 |
NZ562182A (en) * | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
WO2008022184A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Constrained and controlled decoding after packet loss |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
DK3573056T3 (da) * | 2008-07-11 | 2022-10-03 | Fraunhofer Ges Forschung | Audiokoder og audioafkoder |
PL2311033T3 (pl) | 2008-07-11 | 2012-05-31 | Fraunhofer Ges Forschung | Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
-
2011
- 2011-03-09 ES ES11707415T patent/ES2461183T3/es active Active
- 2011-03-09 WO PCT/EP2011/053538 patent/WO2011110591A1/en active Application Filing
- 2011-03-09 CA CA2792504A patent/CA2792504C/en active Active
- 2011-03-09 RU RU2012143323A patent/RU2607264C2/ru not_active Application Discontinuation
- 2011-03-09 BR BR112012022741-6A patent/BR112012022741B1/pt active IP Right Grant
- 2011-03-09 WO PCT/EP2011/053541 patent/WO2011110594A1/en active Application Filing
- 2011-03-09 AU AU2011226143A patent/AU2011226143B9/en active Active
- 2011-03-09 CN CN201180021269.2A patent/CN102884572B/zh active Active
- 2011-03-09 CA CA2792500A patent/CA2792500C/en active Active
- 2011-03-09 CN CN201180023298.2A patent/CN102884573B/zh active Active
- 2011-03-09 PL PL11707665T patent/PL2532001T3/pl unknown
- 2011-03-09 JP JP2012556506A patent/JP5625076B2/ja active Active
- 2011-03-09 EP EP20110707415 patent/EP2539893B1/en active Active
- 2011-03-09 TW TW100107904A patent/TWI455113B/zh active
- 2011-03-09 MX MX2012010439A patent/MX2012010439A/es active IP Right Grant
- 2011-03-09 RU RU2012143340/08A patent/RU2586848C2/ru active
- 2011-03-09 ES ES11707665T patent/ES2458354T3/es active Active
- 2011-03-09 MX MX2012010469A patent/MX2012010469A/es active IP Right Grant
- 2011-03-09 EP EP20110707665 patent/EP2532001B1/en active Active
- 2011-03-09 AU AU2011226140A patent/AU2011226140B2/en active Active
- 2011-03-09 JP JP2012556505A patent/JP5456914B2/ja active Active
- 2011-03-09 KR KR1020127026462A patent/KR101445296B1/ko active IP Right Grant
- 2011-03-09 BR BR112012022744-0A patent/BR112012022744B1/pt active IP Right Grant
- 2011-03-09 TW TW100107905A patent/TWI441170B/zh active
- 2011-03-09 KR KR1020127026461A patent/KR101445294B1/ko active IP Right Grant
- 2011-03-09 PL PL11707415T patent/PL2539893T3/pl unknown
- 2011-03-10 AR ARP110100748 patent/AR084465A1/es active IP Right Grant
- 2011-03-10 AR ARP110100746 patent/AR080396A1/es active IP Right Grant
-
2012
- 2012-09-06 US US13/604,869 patent/US9129597B2/en active Active
- 2012-09-10 US US13/608,980 patent/US9524726B2/en active Active
-
2013
- 2013-06-08 HK HK13106813.7A patent/HK1179743A1/zh unknown
- 2013-06-26 HK HK13107466.5A patent/HK1181540A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101171626A (zh) * | 2005-03-11 | 2008-04-30 | 高通股份有限公司 | 通过修改残余对声码器内的帧进行时间扭曲 |
CN101351840A (zh) * | 2005-11-03 | 2009-01-21 | 科丁技术公司 | 对音频信号的时间伸缩改进变换编码 |
CN101375330A (zh) * | 2006-08-15 | 2009-02-25 | 美国博通公司 | 丢包后解码音频信号的时间扭曲 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102884573B (zh) | 使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器及方法 | |
KR101664434B1 (ko) | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 | |
CN101878504B (zh) | 使用时间分辨率能选择的低复杂性频谱分析/合成 | |
CN102637434B (zh) | 用于带宽扩展编码和解码的方法、设备和介质 | |
RU2557455C2 (ru) | Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала | |
JP5707410B2 (ja) | 前に復号されたスペクトル値のグループの検出を使用した、オーディオ符号器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および、コンピュータプログラム | |
CN100454389C (zh) | 声音编码设备和声音编码方法 | |
EP3058566B1 (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
CN102859588B (zh) | 音频信号编码器、音频信号译码器、用以提供音频内容的编码表示型态的方法、用以提供音频内容的译码表示型态的方法 | |
KR101238239B1 (ko) | 인코더 | |
KR101161866B1 (ko) | 오디오 코딩 장치 및 그 방법 | |
KR20100007738A (ko) | 음성/오디오 통합 신호의 부호화/복호화 장치 | |
KR20100114450A (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
Hilpert et al. | Real-Time Implementation of the MPEG-4 Low-Delay Advanced Audio Coding Algorithm (AAC-LD) on Motorola's DSP56300 | |
CN103489450A (zh) | 基于时域混叠消除的无线音频压缩、解压缩方法及其设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Patentee after: Dolby Int AB Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Patentee before: Dolby Int AB |