CN108701467A - 处理经编码音频信号的装置及方法 - Google Patents
处理经编码音频信号的装置及方法 Download PDFInfo
- Publication number
- CN108701467A CN108701467A CN201680081799.9A CN201680081799A CN108701467A CN 108701467 A CN108701467 A CN 108701467A CN 201680081799 A CN201680081799 A CN 201680081799A CN 108701467 A CN108701467 A CN 108701467A
- Authority
- CN
- China
- Prior art keywords
- frequency spectrum
- parameter
- signal
- spectrum
- access unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000001228 spectrum Methods 0.000 claims abstract description 208
- 238000005070 sampling Methods 0.000 claims abstract description 132
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000009466 transformation Effects 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims 1
- 238000013507 mapping Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000017105 transposition Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 101710178035 Chorismate synthase 2 Proteins 0.000 description 1
- 101710152694 Cysteine synthase 2 Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/69—Spread spectrum techniques
Abstract
本发明涉及处理经编码音频信号(100)的装置。音频信号(100)包括存取单元(100’)的序列,每个存取单元包括具有第一谱宽的核心信号(101)以及描述第一谱宽之上的频谱的参数。装置包括:解多工器(1),用于从经编码音频信号(100)的存取单元(100’)产生核心信号(101)以及一组参数(102);上取样器(2),用于上取样存取单元(100’)的核心信号(101)并输出第一经上取样频谱(103)与时间上连续的第二经上取样频谱(103’),第一经上取样频谱(103)与第二经上取样频谱(103’)均具有与核心信号(101)相同的内容并具有大于核心频谱(101)的第一谱宽的第二谱宽;参数转换器(3),用于转换存取单元(100’)的一组参数(102)的参数以获得经转换参数(104,104’);以及频谱间隙填充处理器(4),用于使用经转换参数(104)处理第一经上取样频谱(103)与第二经上取样频谱(103’)。本发明还涉及相对应的方法。
Description
技术领域
本发明涉及处理经编码音频信号的装置及相对应的方法。
背景技术
感知音频编码是以感知适应的方式实现声音的数字表现以达到有效率的储存、处理、传输与再现的技术。进一步减少位消耗的重要工具为半参数方法,称为谱宽扩展(BWE)。该技术通过增加缺少的高频频带(HF)的参数控制估计而扩展被带限于低频频带(LF)的经感知编码的信号。通常,这通过LF频谱的换位(transposition)与后续的能量包络调整而实现。通常,少许的感知相关参数一起被调整(例如噪声电平、音调等等)。
频带复制(SBR)与智能间隙填充(IGF)为提供谱宽扩展功能性的当代技术。IGF(与WO 2015/010948 A1相比较)提供高编码效率并在与SBR(与WO 98/57436A2相比较)可比较的感知质量上同时达到低计算复杂度。
分别使用正交镜像滤波器(QMF)与复数调制重叠变换(MCLT)的滤波器组执行SBR和IGF中的高频频带中的频谱包络的估计。
这使得将现有的经SBR编码的音频材料更新至基于IFG的表现成为有吸引力的任务。一种直接但难处理的方法为串联编码(tandem coding),包括将基于SBR的内容解码为脉冲编码调制(PCM)时域信号并且接着将该信号再编码为基于IGF的格式。
发明内容
因此,本发明的目的在于处理经编码音频信号以获得直接转码(transcoded)音频信号,其为使用与原有编码不同的编码的经编码音频信号。并且,本发明的目的在于处理经编码音频信号以通过使用不同解码方法的优点而解码经编码音频信号而得到音频信号。
这些目的通过依据权利要求1的处理经编码音频信号的装置以及依据权利要求22的对应方法而达到。
将经由本发明装置或本发明方法所处理的经编码音频信号系包含存取单元(access units)的序列。每个存取单元包含具有第一谱宽的核心信号以及描述第一谱宽之上的频谱的参数。
本发明的处理这种经编码音频信号的装置包含:
●解多工器,用于从经编码音频信号的存取单元产生核心信号与一组参数。换言之,解多工器从经编码音频信号的存取单元提取出核心信号与参数,这允许重现在与核心信号对应的频谱之上的缺失频谱。
●上取样器,用于上取样存取单元的核心信号并输出第一经上取样频谱以及在时间上连续的第二经上取样频谱。第一经上取样频谱与第二经上取样频谱二者皆具有与核心信号相同的内容并具有大于核心频谱的第一谱宽的第二谱宽。换言之,上取样器上取样核心信号并输出至少两个经上取样频谱。经上取样频谱在时间上连续,覆盖与核心信号相同的信息并且具有大于核心信号的谱宽的谱宽。
●参数转换器,用于转换存取单元的一组参数的参数以得到经转换参数。换言之,经编码音频信号内的参数被转换为可应用于经上取样频谱的参数。
●频谱间隙填充处理器,用于使用经转换参数而处理第一经上取样频谱与第二经上取样频谱。换言之,频谱间隙填充处理器将经上取样频谱与经转换参数组合。依据实施例,结果可以是经转码音频信号,其作为经编码音频信号但是用一种与原有或输入的经编码音频信号不同的技术,或者结果可以是音频信号。
在一个实施例中,上取样器被配置为使用零点来填充核心信号的频谱的上部,并且从核心信号的经填充频谱得到第一经上取样频谱与第二经上取样频谱。
在实施例中,上取样是基于经编码音频信号的至少两个存取单元而进行的。在此实施例中,上取样器被配置用于通过额外使用紧接在所述存取单元之前的存取单元的核心信号而上取样所述存取单元的核心信号。因此,需要两个存取单元的信息并使用两个存取单元的信息以获得经上取样频谱。
在另一实施例中,上取样器被配置用于收集第一数量的时间连续的存取单元的核心信号,并且以非整数上取样率而从这些核心信号处理第二数量的经上取样频谱,其中第一数量为上取样率的分母,第二数量为上取样率的分子。
依据实施例,参数转换器被配置用于转换与在时间上连续的时隙的第一部分有关的该组参数的第一子组参数,并且用于转换与所述时隙的第二部分有关的该组参数的第二子组参数,所述时隙的第二部分在时间上与第一部分连续。此外,频谱间隙填充处理器被配置为使用第一经上取样频谱来处理第一子组经转换参数并使用第二经上取样频谱来处理第二子组经转换参数。在此实施例中,经编码音频信号的参数与时隙有关,优选地属于帧。
在实施例中,转换器被配置用于通过使用给定缩放因子缩放这些参数值而将与该组参数的能量值有关的参数转换为频谱间隙填充处理器可使用的能量值。
在一个实施例中,缩放因子具有定值。
在一个实施例中,缩放因子适应于给定经编码音频信号的需求。因此,转换器被配置用于提取与存取单元相关联的窗函数有关的信息。此外,转换器被配置为依据窗函数而调整缩放因子。
对于同步性,在一个实施例中,转换器被配置用于通过插入延迟补偿而偏移该组参数的参数。
对于MCLT与QMF变换的示例,延迟失配可如下考虑。这是基于使用长块(LB)窗而定义MCLT能量的假设。为比较变换之间的能量,窗必需被同步地放置在数据上以便各原型窗的重心(CG)对齐。在CG处,权重系数为一(unity)。
用于QMF分析的原型窗可为低通FIR滤波器。窗的系数被优化以达到最好的边带抑制,优选地导致对称窗,其在窗边缘具有平滑滚降(roll-off)以期望足够的边带衰减。窗的长度可为640并且窗跨距(window stride)的跳距(hop size)为64取样长。
对于MCLT的实现,可使用对称正弦窗。窗例如具有对于长块为2048个取样的长度,而短块具有256个取样的长度。其为长块尺寸的1/8。窗跨距的跳距对于长块与短块分别为1024与128个取样,这等于变换的频率分辨率。
举例来说,用于IGF的MCLT原型窗跨越2N=2048个取样的长度并具有50%的重叠。在短块的中间处的短窗具有N/4的长度以及任一边的448个取样的偏移。如此,其N个取样的跳距捕获第一输入取样,同时延迟τ1由1024个取样所组成。
QMF原型窗可跨越10M=640个取样的长度并具有M个取样的跳距,称为子取样。跳距还对应QMF子取样中的子带的数量,M。延迟补偿τ2可被计算为(窗长度–窗跳距=640–64个取样)并为576个取样。
依据实施例,上取样器被配置用于通过内插核心信号的值而上取样所述核心信号。
在实施例中,上取样器被如下配置:
●上取样器被配置为使用零点而填充先前存取单元的核心信号的频谱。
●上取样器被配置为使用零点而填充存取单元的核心信号的频谱。
●上取样器被配置为执行存取单元的经填充频谱与先前存取单元的经填充频谱的逆变换。
●最后,上取样器被配置为对先前存取单元的经填充频谱的时域信号以及存取单元的经填充频谱的时域信号执行重叠相加,以得到中间时间信号。
基于前述实施例,依据实施例,上取样器被配置为使用中间时间信号的第一部分而执行正变换以获得第一经上取样频谱。上取样器被配置为使用中间时间信号的第二部分而执行正变换以获得第二经上取样频谱。这是在第一部分与第二部分重叠的限制条件下完成的。
依据实施例,上取样器被配置为用于上取样核心信号以获得经上取样核心信号,上取样器被配置为用于对所述经上取样核心信号执行逆变换以获得时域信号,并且上取样器被配置用于通过应用变换而处理时域信号以获得第一经上取样频谱以及在时间上连续的第二经上取样频谱。其中,逆变换为变换的逆变换。
在关于前述实施例的一个实施例中,逆变换为逆改进离散余弦变换并且变换为改进离散余弦变换。
在一个实施例中,频谱间隙填充处理器被配置为使用经转换参数而处理第一经上取样频谱与第二经上取样频谱以获得时域输出信号。
在以下的实施例中,频谱间隙填充处理器被配置为将经转换参数的第一部分应用于第一经上取样频谱以获得第一经处理频谱,并且将经转换参数的第二部分应用于第二经上取样频谱以获得第二经处理频谱。
依据实施例,频谱间隙填充处理器被配置为包含用于将第一经处理频谱与第二经处理频谱转换至时域的频谱转换器,并且频谱间隙填充处理器被配置为包含用于重叠相加至少两个输出时间信号以获得音频信号的音频加法器。
在实施例中,频谱间隙填充处理器被配置用于产生具有第一存取单元与第二存取单元的经频谱间隙填充编码的信号,第一存取单元包含第一经上取样频谱的经变换版本与经转换参数的第一部分,并且第二存取单元包含第二经上取样频谱的经变换版本与经转换参数的第二部分。
依据实施例,频谱间隙填充处理器被配置用于产生具有第一存取单元与第二存取单元的输出数据流。该数据流例如为经IGF编码音频信号,作为经转码音频信号。
在一个实施例中,频谱间隙填充处理器被配置用于使用经转换参数处理第一经上取样频谱与第二经上取样频谱以获得两个经转码存取单元,并且频谱间隙填充处理器被配置用于相加所述两个经转码存取单元以获得经转码音频信号。
在装置作为转码器并因此输出经转码音频信号的情况下,依据实施例,经转码音频信号为经IGF编码音频信号。
依据实施例,经编码音频信号为经SBR编码音频信号。
本发明还关于处理经编码音频信号的方法。经编码音频信号包含存取单元的序列,每个存取单元包含具有第一谱宽的核心信号以及描述第一谱宽之上的频谱的参数。
本发明的方法包含至少下面步骤:
●从经编码音频信号的存取单元产生核心信号与一组参数,此存取单元可称为当前存取单元。
●上取样该存取单元的核心信号并输出第一经上取样频谱与在时间上连续的第二经上取样频谱。第一经上取样频谱与第二经上取样频谱二者皆具有与核心信号相同的内容并具有比核心频谱的第一谱宽大的第二谱宽。
●转换该存取单元的该组参数的参数以获得经转换参数。
●使用经转换参数而处理第一经上取样频谱与第二经上取样频谱。
上述的装置的实施例也可通过方法的步骤与方法的对应实施例而被执行。
在一个实施例中,经编码音频信号的处理关于经编码音频信号的解码以产生音频信号。在不同实施例中,经编码音频信号的处理是将经编码音频信号直接转码成不同的经编码或经转码音频信号。转码器因此从以第一编码方法编码的第一经编码音频信号产生基于第二种不同的编码的第二经编码音频信号。
经编码音频信号包含核心信号以及描述核心信号的上的原有音频信号的遗失部分的参数。参数例如包含帧中给定的频谱包络,具有给定数量的时隙以及对应的能量值或能量。对于参数,不同的滤波器组可被使用。
本发明的优点是参数映射的高精度、额外转码伪影(transcoding artefact)的最小化以及减少的计算复杂度。
下面将关于附图中描述的实施例说明本发明。
附图说明
本发明的优选实施例关于附图被稍后描述,其中:
图1示出经编码音频信号的核心信号,
图2示出在应用本发明的期间所产生的频谱,
图3示出使用正交镜像滤波器(QMF,上行)与复数调制重叠变换(MCLT,下行)的音频信号的两个变换的比较,
图4示出通过MCLT来实行时间连续QMF数值的加窗,
图5分别示出MCLT与QMF的对数能量值以及平均偏移,
图6示出停止-开始窗序列,
图7示出依据现有技术的解码器,
图8示出用于转码经编码音频信号的装置的实施例的框图,
图9示出用于解码经编码音频信号的装置的实施例的框图,
图10示出例如分别用于图8及图9中所示的实施例的上取样器的实施例,
图11示出图10中所示的上取样器的参数转换器的工作,
图12示出具有3:8的比率的核心信号的上取样,
图13示出应用到存取单元的重叠-相加序列,
图14示出本发明的装置的框图,以及
图15使用流程图示出本发明的方法。
具体实施方式
在下面,经编码音频信号为经SBR编码音频信号的示例,但本发明并非限制于此种经编码音频信号。本发明还适用于其中经SBR编码音频信号被转码的类型的经编码音频信号,或是在任何中间步骤中处理的对应信号或频谱。在此,经IGF编码音频信号为多种可能性的示例。
为将SBR数据转码为IGF表现,需要作到至少一些下列步骤:
●将SBR复制内容(copy-up content)置换为IGF相容复制材料。
●插入关于MDCT的QMF的延迟补偿以达到数据同步。
●将通过SBR所得到(经由基于QMF的能量测量)的频谱高带包络映射至MCLT表现。
●将底层SBR时间-频率网格映射至IGF上:映射函数依据不同类型的加窗技术而被调整,以从QMF能量得到MCLT能量。
●优选地,应用能量校正因子以消除任何偏差并最小化残余误差。
●优选地,将剩余SBR边信息(例如本底噪声、音调(又称为逆滤波水平)等等)转化为合适的IGF参数:例如,SBR中的逆滤波水平被映射成IGF中适合的白化水平以提供最佳的感知质量。
图1示出经编码音频信号的存取单元的核心信号101,其具有受限的第一谱宽,在此从零到频率fxo。经编码音频信号的参数描述在此达到频率2*fxo的核心信号101之上的频谱。
这必需和图2所示的频谱进行比较。在此,经上取样频谱1包含与图1的核心信号相同的信息内容并且在为在此核心信号之上的频率承载零值。第二谱宽在此示例中从零达到频率2*fxo。
为将SBR数据转码至IGF表现,必需将QMF能量映射成MCLT能量值。
这在下面详细描述,开始于QMF与MCLT变换的比较。
令x为由取样率SR所取样的离散音频信号。假如QMF变换被应用至信号x,得到:
其中,t为变换的开始取样,l为时隙索引,并且k=0,1,…,m–1为直到m的频率线,即Nyquist频率线。
假如加窗MCLT变换被应用至信号x,则结果为:
其中,b为变换的开始块,并且i=0,1,…,N–1为直到Nyquist频率线N的多个频率线。
示例性的参数也被用于下面讨论:
在QMF变换下,640个取样的原型长度连同64个取样的跳距被使用。这导致对于Nyquist频率线而言,m=64。
举例来说,假如为了MCLT,2048的长窗尺寸连同50%重叠被使用,则跳距为1024,并且因此对于Nyquist频率线而言,N=1024。重叠加窗通常消除块伪影。
在这样一个示例性配置的分析中,需要32QMF时隙来覆盖与MCLT变换相同量的取样,如图3。图3还显示数据同步,其中QMF的子取样与MCLT的较长窗对齐。
为准备用于映射的经SBR编码音频信号的QMF能量,窗w被应用到时间连续QMF值,就如时域取样在MCLT中被加窗。此QMF加窗示于图4。
为将QMF能量合适地映射至MCLT能量,两种变换需要被延迟对准。
然后,为达到QMF与MCLT能量的转换,以下公式适用:
其中,x0为SBR交越(cross-over)频率。
下一步骤为将各能量值从QMF变换转换为MCLT变换。
SBR帧通过使用时间/频谱包络的粒度(granularity)而有助于定义信号特征。频谱包络的映射已作为部分的映射技术定义被研究。由自适应SBR网格的时间分辨率所透露的信息被转化为IGF中的时间适应的技术。
由QMF滤波器组所分析的时域信号具有子取样的时间分辨率。SBR能量的最高时间分辨率在时隙上,亦即两个子取样。时间与频率分辨率之间的权衡可从时隙的组合以及子频带分组的选择而被实现。不同类型的帧允许帧内的不同数量的时间/频率区段。如此,信号特征被以网格量化的包络所保存。
IGF中的时间/频率的自适应分辨率可通过使用不同类型的MCLT窗而被实现。就如实验所显示的,一个QMF子频带的能量可依据相比之下的MCLT块而被收集。这激发在能量映射期间的块切换的合并。如此被收集到子频带内的能量可在MCLT频率仓(frequency bins)上被内插。然后,IGF边信息可被得到用于源频谱换位(spectrum transposition)期间的包络成形。
基于实验,QMF块能量可在长块中的32个重叠子取样上被计算。为减少映射至MCLT块能量的误差,QMF需要MCLT原型窗的权重系数的应用。可以期望的是,合适的MCLT窗的选择有助于保存由QMF的时间包络所定义的信号特征。
这些计算优选地离线执行并且在使用装置或方法之前被执行。
图5显示示例测量的结果,其中比较EQMF与EMDCT的对数能量(E’(QMF)与E’(MCLT))。这允许在对数域的计算:
这证明通过使用为了线性域中的线性映射的恒定缩放因子s的能量值的转换:
s EQMF[b]≈EMCLT[b],b=1,2,...,B
其中,缩放因子s被给定为:
并且,B为被测量的块的总数量。平均偏移在一个实施例中对于所有块将所有的离群值(outliers)修剪(clip)至10%置信区间。
该置信区间允许使用距平均值的过度偏差修剪数据取样。
示例性测量已显示无偏差且精确的能量匹配,其大约1dB的峰值误差。通过使用此映射,可以将在包含经SBR编码音频信号的比特流中传送的SBR能量值转换为对应的IGF能量值。所显示示例中的恒定缩放因子在对数域中小于20并且大约为18。这些可被直接馈送至IGF解码器,或者,可选地,可被汇编至IGF输出比特流内。
实验已显示,对数域中的平均偏移具有低于20的值。已经发现平均偏移落在16与17之间或者在一个例子中具有大约为7的值。因此,平均偏移具有7与17之间的值。
另外的实验已显示,平均偏移依赖所使用的窗的类型。所得到的值显示于下表:
图6显示停止-开始窗序列以描述缩放因子对所使用的窗序列的依赖性。在所显示的示例中,经SBR编码音频信号的帧f包含QMF的32个子取样。序列的第一窗类型ws(f,0)跨越整个帧数据,即th个子取样的块。接下来的窗ws(f,1)与ws(f,0)重叠且跨越f的th/2个子取样与接下来的帧f+1的th/2个子取样。SBR网格的帧可用作为QMF能量网格的块,在此示出的实施例中,关系为:一个帧产生两块的QMF子取样。
以下,用于解码经SBR编码音频信号的IGF解码器使用一个实施例来说明。
一种典型2:1的SBR解码器例如描述于M.Neuendorf et al.,“The ISO/MPEGUnified Speech and Audio Coding Standard–Consistent High Quality for AllContent Types and at All Bit Rates”,J.Audio Eng.Soc.,卷61,号12,页956–977,2013年12月,并显示于图7。
本发明的转码器的实施例以框图的方式显示于图8。
包含存取单元100’的经SBR编码音频信号100被馈送至解多工器1,解多工器1提取核心信号101与一组参数192,以允许重现音频信号的缺失部分。核心信号101被馈送至上取样器2,上取样器2在此通过MDCT分割器(MDCT splitter)而实施,并且该组参数102被馈送至参数转换器,其在此描述中被显示为包含分开的元件。
在此示例中,该组参数102特别关于由经SBR编码音频信号所提供的频谱包络。在此示例中,经SBR编码音频信号的帧的时隙0-15被传送至上参数转换器元件,并且时隙16-31被传送至下参数转换器组件。时隙的数量仍然关于使用于从QMF到MCLT的参数转换的讨论的示例性参数。
在参数转换器3的每个子部中,至少关于频谱包络的参数被转换,其经由上述的QMF数据到MCLT数据的转换所完成。结果产生的经转换参数104、104’合适于智能间隙填充的使用并且被馈送至包含两个多任务器的频谱间隙填充处理器4,以便与由上取样器2从核心信号101得到的对应经上取样频谱103、103’合并。
结果包含两个存取单元1.AU’与2.AU’作为频谱间隙填充处理器4的多任务器的输出。两个存取单元1.AU’与2.AU’被馈送至加法器5,其中第二存取单元2.AU’通过延迟元件6被延迟。加法器5的结果为经转码音频信号200,其在所示的实施例中特别是具有两个存取单元1.AU和2.AU的经IGF编码音频信号。
上取样器2通过使用图10中所示的示例性实施例而被说明,其中上取样器2被标示为MDCT分割器。
上取样器2包含用于上取样原有经SBR编码音频信号的核心信号101(例如具有1024条线)的频谱的频谱上取样器20。经上取样频谱110(假如上取样例如通过因子2而完成,所产生的信号具有2048条线)经过由IMDCT转换器21所执行的逆改进离散余弦变换而作为逆变换的示例。如此而得到的时域信号111(由时域取样所组成)经过重叠-相加(由OA所设计)并且因而被分割为两个信号。两个信号皆具有例如1024条线,并且图中所示较低的信号被对应于1024条线的重叠-相加的延迟24所影响。然后,两个信号经过由两个MDCT转换器23所执行的改进离散余弦变换,导致两个经上取样频谱103作为上取样器2的输出。
两个MDCT转换器23的作用显示于图11。在此图中,1.MDCT指的是图3所示的上MDCT转换器23,而2.MDCT指的是下MDCT转换器23。IMDCT的输出指的是经逆改进离散余弦变换的经上取样核心信号111。另外,重叠相加OA被提供给IMDCT转换器21,其例如具有2048个取样。
对于MDCT的细节,请例如参照WO 2014/128197A1,特别是第14-16页。
可选地,不是执行MDCT变换与IMDCT变换,而是执行快速傅立叶变换与逆快速傅立叶变换。
图9所示的装置允许将经SBR(频带复制)编码音频信号100解码为音频信号300,作为这种经编码音频信号100的处理的示例。
为此目的,该装置包含解多工器1,其从经SBR编码音频信号100的存取单元100’产生核心信号101与一组参数102。该组参数102描述核心信号之上的频谱,即描述缺失部分。
核心信号101被传送至上取样器2,其在此实施为MDCT分割器,用于上取样核心信号101。这是由于经SBR编码音频信号的核心信号具有相较于经IGF编码音频信号的核心信号减少的取样率的事实。上取样器2的实施例的细节关于图10来说明。
该组参数102被传送至参数转换器3,其在此通过两个转换器元件或单元来实施。存取单元100’至少包含覆盖多个时间连续的时隙的帧。在此,其为32个时隙。覆盖时隙0-15的第一时隙的参数被馈送至上参数转换器单元,覆盖时隙16-31的第二时隙的参数被馈送至下参数转换器单元,以被转换。经编码音频信号的参数与经转换参数分别关于不同的滤波器组,例如正交镜像滤波器(QMF)与复数调制重叠变换(MCLT)。因此,参数转换器单元将延迟补偿插入至经SBR编码音频信号的参数中以为了同步。另外,参数转换器单元通过使用加窗而映射时间-频率网格,时间-频率网格为经SBR编码音频信号的时隙的基础,加窗优选地通过使用应用于时间信号的窗并通过使用MCLT滤波器组而被预先执行于参数上。
所产生的经转换参数104、104’被馈送至频谱间隙填充处理器4的两个组件(1.IGF与2.IGF)以将经上取样频谱103、103’及对应的经转换参数104、104’合并。对应暗示在本实施例中,从第一组时隙得到的经转换参数104与由图10所示的MDCT 1所提供的经上取样频谱合并,并且从第二组时隙得到的经转换参数104’与由MDCT 2所提供的经延迟且经上取样频谱合并。
这些合并的结果被两个IMDCT转换器7通过使用逆改进离散余弦变换而变换为时间信号并且被(延迟8与加法器9)重叠-相加成所要的音频信号300。
图12显示以3:8比率上取样核心信号的示例。在此情况下,上取样器存储三个时间连续存取单元100’(这是上面讨论的且因此“当前”存取单元)以及两个前面的存取单元100”、100”’的核心信号。这三个核心信号被相加并且然后被分成8个经上取样频谱。
在核心信号以3:4比率被上取样的未图示的情况中,上取样器也存储三个时间连续存取单元的核心信号。这些核心信号也被相加但被分成四个经上取样频谱。
相似的,假如期望某一重叠,则一个经上取样频谱需要来自两个存取单元的两个核心信号。
图13示意地示出重叠相加。依由上往下的各行进行相关说明。
给定三个存取单元:AU 0、AU 1、AU 2,各自具有带1024个数据点的核心信号。核心信号的对应频谱通过在核心信号的频谱之后的零点而被相加。经上填充(upfilled)频谱具有2048个数据点。这些频谱被变换至时域,该时域的信号具有2*2048=4096个数据点。
对于这些时间信号,信号的重叠部分被相加,重叠关于时间信号的第一半部分与另一时间信号的第二半部分。
所产生的总时间信号具有2048个数据,其中从每个前面的时间信号,只有一半被使用。
因此,从三个存取单元AU 0、AU 1、AU 2得到三个时间信号。源自AU 0的时间信号的第二半部分与从AU 1所得到的时间信号的第一半部分相加。从AU 1所得到的时间信号的第二半部分与从AU 2所得到的时间信号的第一半部分相加。基于此,三个存取单元在50%重叠的示例中提供两个重叠相加的时间信号,均具有2048个数据点。
然后,这两个重叠相加的时间信号被变换至频率域(例如通过使用快速傅立叶变换或任何其他合适的变换),产生第一、第二经上取样频谱,均具有1024个数据点。
在图14中,再一次显示本发明的装置。
在此示出的实施例中,经编码音频信号100包含多个存取单元,其中显示三个:AU0、AU 1、AU 2。这些存取单元被馈送至解多工器1,解多工器1提取各自的核心信号CS0、CS1、CS 2以及用于描述音频信号的缺失部分的各自的参数P0、P1、P2。
核心信号CS0、CS1、CS2被传送至上取样器2,上取样器2上取样核心信号并对于每个核心信号产生对应的经上取样频谱,对应CS0的经上取样频谱US1、US2,对应CS1的经上取样频谱US3、US4,以及对应CS2的经上取样频谱US5、US6。
另一方面,参数被馈送至参数转换器3,产生经转换参数cP0、cP1、cP2。
频谱间隙填充处理器4通过使用对应的经转换参数cP0、cP1、cP2而处理经上取样频谱US1、US2、US3、US4、US5、US6。
举例而言,第一存取单元AU 0的第一经上取样频谱US1使用转换参数cP0的第一子组而被处理,第一存取单元AU 0的第二经上取样频谱US2使用经转换参数cP0的第二子组而被处理。频谱间隙填充处理器4的输出例如为音频信号或经转码音频信号。
图15显示用于处理经编码音频信号100的本发明方法的主要步骤。
在步骤1000中,从经编码音频信号100,或更精确的说,从经编码音频信号100的一存取单元,产生或提取核心信号与一组参数。
下面的步骤可以以任意给定的顺序地执行或并行执行。
核心信号在步骤1001中被上取样,产生两个时间连续的经上取样频谱。参数在步骤1002中被转换为可应用于经上取样频谱的经转换参数。
最后,经上取样频谱与经转换参数(额外还有从经编码音频信号的存取单元得到的其他参数)在步骤1003中进行处理。该处理的输出例如为作为时间信号的音频信号或经不同编码的且因此经转码的音频信号。
通常来说,经编码音频信号还包含另外的参数以描述原有音频信号并且以在经编码音频信号的解码期间重现缺失部分。
本发明的处理技术例如有助于SBR边信息到IGF的转换,用于高频(HF)合成期间的包络成形。额外的控制参数指示HF频谱,其中不管包络成形,噪声音调比不匹配输入信号。此音频的性质在如木管乐器的信号中或具有混响的房间中被观察到。在这些情形中,较高的频率不是和谐的或高音调的,并且与较低频率相比,可被感知为噪音。
信号中的共振峰通过使用编码器处的逆预测误差滤波器而被估计。逆滤波的水平依据匹配输入信号特征而被决定。该水平通过SBR而信号化。由于HF频谱中的包络成形完全不有助于消减频谱的音调,具有不同水平的频率相依啁啾因子(chirp factor)的预白化滤波器可被应用于线性预测误差滤波器以用于共振峰平坦化。
这些异常信号特征由SBR使用逆滤波工具而被处理,而IGF使用白化工具。预白化的程度被映射至技术中的各别等级。
虽然一些方面已在装置的上下文中被描述,但清楚的是,这些方面也代表对应方法的说明,其中块或装置对应方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也代表对应装置的对应方块、项目或特征的说明。一些或全部的方法步骤可通过(或使用)硬件装置来实行,例如微处理器、可编程计算机或电子电路。在一些实施例中,一个或数个最重要的方法步骤可通过这样的装置来实行。
此外,用于转码经SBR编码音频信号的装置的多个方面可有效于用于解码经SBR编码音频信号的装置,反之亦然。同样的原则适用于对应方法。
Claims (22)
1.一种处理经编码音频信号(100)的装置,
所述经编码音频信号(100)包括存取单元(100’)的序列,每个存取单元包括具有第一谱宽的核心信号(101)以及描述所述第一谱宽之上的频谱的参数,
所述装置包括:
解多工器(1),用于从所述经编码音频信号(100)的存取单元(100’)产生所述核心信号(101)以及一组所述参数(102);
上取样器(2),用于上取样所述存取单元(100’)的所述核心信号(101)并输出第一经上取样频谱(103)与时间上连续的第二经上取样频谱(103’),所述第一经上取样频谱(103)与所述第二经上取样频谱(103’)二者均具有与所述核心信号(101)相同的内容并具有第二谱宽,所述第二谱宽大于所述核心频谱(101)的所述第一谱宽;
参数转换器(3),用于转换所述存取单元(100’)的所述一组参数(102)的参数以获得经转换参数(104,104’);以及
频谱间隙填充处理器(4),用于使用所述经转换参数(104)处理所述第一经上取样频谱(103)与所述第二经上取样频谱(103’)。
2.如权利要求1所述的装置,
其中所述上取样器(2)被配置为用零点填充所述核心信号(101)的频谱的上部并且从所述核心信号(101)的经填充频谱(110)得到所述第一经上取样频谱(103’)与所述第二经上取样频谱(103’)。
3.如权利要求1或2所述的装置,
其中所述上取样器(2)被配置用于额外使用紧接在所述存取单元(100’)之前的存取单元(100”)的核心信号而上取样所述存取单元(100’)的所述核心信号(101)。
4.如权利要求1至3中任一项所述的装置,
其中所述上取样器(2)被配置用于收集第一数量的时间连续的存取单元(100’,100”,100”’)的核心信号(101),并且以非整数的上取样率而从这些核心信号(101)处理第二数量的经上取样频谱(103),其中所述第一数量为所述上取样率的分母且所述第二数量为所述上取样率的分子。
5.如权利要求1至4中任一项所述的装置,
其中所述参数转换器(3)被配置用于转换所述一组参数(102)的关于时间连续的时隙的第一部分的第一子组参数,并且转换所述一组参数(102)的关于所述时隙的第二部分的第二子组参数,所述时隙的第二部分与所述时隙的第一部分时间上连续;以及
其中所述频谱间隙填充处理器(4)被配置为以所述第一经上取样频谱(103)处理第一子组经转换参数(104),并以所述第二经上取样频谱(103’)处理第二子组经转换参数(104’)。
6.如权利要求1至5中任一项所述的装置,
其中所述转换器(3)被配置用于通过使用给定缩放因子来缩放这些参数值而将与所述一组参数(102)的能量值有关的参数转换为所述频谱间隙填充处理器(4)可使用的能量值。
7.如权利要求6所述的装置,
其中所述转换器(3)被配置用于提取与所述存取单元(100’)相关联的窗函数有关的信息,以及
其中所述转换器(3)被配置用于根据所述窗函数调整所述缩放因子。
8.如权利要求1至7中任一项所述的装置,
其中所述转换器(3)被配置用于通过插入延迟补偿而偏移所述一组参数(102)的参数。
9.如权利要求1至8中任一项所述的装置,
其中所述上取样器(2)被配置用于通过内插所述核心信号(101)的值而上取样(20)所述核心信号(101)。
10.如权利要求1至9中任一项所述的装置,
其中所述上取样器(2)被配置为使用零点来填充先前存取单元(100”)的核心信号的频谱,
其中所述上取样器(2)被配置为使用零点来填充所述存取单元(100’)的核心信号的频谱,
其中所述上取样器(2)被配置为执行所述存取单元(100’)的经填充频谱与所述先前存取单元(100”)的经填充频谱的逆变换(21),以及
其中所述上取样器(2)被配置为执行所述先前存取单元(100”)的经填充频谱的时域信号以及所述存取单元(100’)的经填充频谱的时域信号的重叠相加,以获得中间时间信号(111)。
11.如权利要求10所述的装置,
其中所述上取样器(2)被配置为使用所述中间时间信号(111)的第一部分执行正变换以获得所述第一经上取样频谱(103),以及
其中所述上取样器(2)被配置为使用所述中间时间信号(111)的第二部分执行正变换以获得所述第二经上取样频谱(103’),
其中所述第一部分与所述第二部分重叠。
12.如权利要求1至11中任一项所述的装置,
其中所述上取样器(2)被配置用于上取样(20)所述核心信号(101)以获得经上取样核心信号(110),
其中所述上取样器(2)被配置用于对所述经上取样核心信号(110)执行逆变换(21)以获得时域信号(111),以及
其中所述上取样器(2)被配置用于通过应用变换(22,23)而处理所述时域信号(111)以获得所述第一经上取样频谱(103)以及时间上连续的所述第二经上取样频谱(103’),
其中所述逆变换(21)为所述变换的逆变换。
13.如权利要求12所述的装置,
其中所述逆变换为逆改进离散余弦变换以及其中所述变换为改进离散余弦变换。
14.如权利要求1至13中任一项所述的装置,
其中所述频谱间隙填充处理器(4)被配置为使用所述经转换参数(104,104’)解码所述第一经上取样频谱(103)与所述第二经上取样频谱(103’)以获得时域输出信号(300)。
15.如权利要求14所述的装置,
其中所述频谱间隙填充处理器(4)被配置为将所述经转换参数的第一部分(104)应用于所述第一经上取样频谱(103)以获得第一经处理频谱,并且将所述经转换参数的第二部分(104’)应用于所述第二经上取样频谱(103’)以获得第二经处理频谱。
16.如权利要求1至13中任一项所述的装置,
其中所述频谱间隙填充处理器(4)被配置为包括用于将所述第一经处理频谱与所述第二经处理频谱转换至时域的频谱转换器(7),以及
其中所述频谱间隙填充处理器(4)被配置为包括用于对至少两个输出时间信号重叠相加以获得音频信号(300)的音频加法器(9)。
17.如权利要求1至16中任一项所述的装置,
其中所述频谱间隙填充处理器(4)被配置用于产生具有第一存取单元与第二存取单元的经频谱间隙填充编码的信号,其中所述第一存取单元包括所述第一经上取样频谱的经变换版本与所述经转换参数的第一部分,并且所述第二存取单元包括所述第二经上取样频谱的经变换版本与所述经转换参数的第二部分。
18.如权利要求1至13中任一项所述的装置,
其中所述频谱间隙填充处理器(4)被配置用于产生具有第一存取单元与第二存取单元的输出数据流。
19.如权利要求1至18中任一项所述的装置,
其中所述频谱间隙填充处理器(4)被配置用于使用所述经转换参数(104,104’)处理所述第一经上取样频谱(103)与所述第二经上取样频谱(103’)以获得两个经转码存取单元,以及
其中所述频谱间隙填充处理器(4)被配置用于相加(5)所述两个经转码存取单元以获得经转码音频信号(200)。
20.如权利要求1至19中任一项所述的装置,
其中所述经转码音频信号(200)为经IGF编码的音频信号(200)。
21.如权利要求1至20中任一项所述的装置,
其中所述经编码音频信号(100)为经SBR编码的音频信号(100)。
22.一种处理经编码音频信号(100)的方法,
所述经编码音频信号(100)包括存取单元(100’)的序列,每个存取单元包括具有第一谱宽的核心信号以及描述所述第一谱宽之上的频谱的参数,
所述方法包括:
从所述经编码音频信号(100)的存取单元(100’)产生所述核心信号(101)与一组所述参数(102);
上取样所述存取单元(100’)的所述核心信号(101)并输出第一经上取样频谱(103)与时间上连续的第二经上取样频谱(103’),所述第一经上取样频谱(103)与所述第二经上取样频谱(103’)二者均具有与所述核心信号(101)相同的内容并具有第二谱宽,所述第二谱宽大于所述核心频谱(101)的所述第一谱宽;
转换所述存取单元(100’)的所述一组参数(102)的参数以获得经转换参数(104);以及
使用所述经转换参数(104)处理所述第一经上取样频谱(103)与所述第二经上取样频谱(103’)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15199851.5A EP3182411A1 (en) | 2015-12-14 | 2015-12-14 | Apparatus and method for processing an encoded audio signal |
EP15199851.5 | 2015-12-14 | ||
PCT/EP2016/080331 WO2017102560A1 (en) | 2015-12-14 | 2016-12-08 | Apparatus and method for processing an encoded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108701467A true CN108701467A (zh) | 2018-10-23 |
CN108701467B CN108701467B (zh) | 2023-12-08 |
Family
ID=55024778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680081799.9A Active CN108701467B (zh) | 2015-12-14 | 2016-12-08 | 处理经编码音频信号的装置及方法 |
Country Status (17)
Country | Link |
---|---|
US (2) | US11100939B2 (zh) |
EP (2) | EP3182411A1 (zh) |
JP (1) | JP6663996B2 (zh) |
KR (2) | KR20180095863A (zh) |
CN (1) | CN108701467B (zh) |
AR (1) | AR106970A1 (zh) |
AU (1) | AU2016373990B2 (zh) |
BR (1) | BR112018012007B1 (zh) |
CA (1) | CA3008388C (zh) |
ES (1) | ES2960963T3 (zh) |
MX (1) | MX2018007197A (zh) |
MY (1) | MY191239A (zh) |
RU (1) | RU2687872C1 (zh) |
SG (1) | SG11201805008YA (zh) |
TW (1) | TWI625722B (zh) |
WO (1) | WO2017102560A1 (zh) |
ZA (1) | ZA201804512B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10418957B1 (en) * | 2018-06-29 | 2019-09-17 | Amazon Technologies, Inc. | Audio event detection |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020077812A1 (en) * | 2000-10-30 | 2002-06-20 | Masanao Suzuki | Voice code conversion apparatus |
US20030231714A1 (en) * | 2002-03-29 | 2003-12-18 | Kjeldsen Erik H. | System and method for orthogonally multiplexed signal transmission and reception |
US20050207502A1 (en) * | 2002-10-31 | 2005-09-22 | Nec Corporation | Transcoder and code conversion method |
CN1918634A (zh) * | 2004-02-16 | 2007-02-21 | 皇家飞利浦电子股份有限公司 | 代码转换器以及用于其的代码转换方法 |
WO2007037361A1 (ja) * | 2005-09-30 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
CN101069233A (zh) * | 2004-09-16 | 2007-11-07 | 法国电信公司 | 通过不同子带域之间通道进行数据处理的方法 |
CN101086845A (zh) * | 2006-06-08 | 2007-12-12 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
US20100063808A1 (en) * | 2008-09-06 | 2010-03-11 | Yang Gao | Spectral Envelope Coding of Energy Attack Signal |
CN101933087A (zh) * | 2008-01-31 | 2010-12-29 | 弗劳恩霍夫应用研究促进协会 | 用于音频信号带宽扩展的设备和方法 |
US20110002266A1 (en) * | 2009-05-05 | 2011-01-06 | GH Innovation, Inc. | System and Method for Frequency Domain Audio Post-processing Based on Perceptual Masking |
CN102246231A (zh) * | 2008-12-15 | 2011-11-16 | 弗兰霍菲尔运输应用研究公司 | 音频编码器和带宽扩展解码器 |
CN102598121A (zh) * | 2009-08-31 | 2012-07-18 | 苹果公司 | 增强型音频解码器 |
CN103366750A (zh) * | 2012-03-28 | 2013-10-23 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103403799A (zh) * | 2010-10-06 | 2013-11-20 | 弗兰霍菲尔运输应用研究公司 | 用于针对合成统一语音和音频编解码器(usac)处理音频信号和提供较高时间粒度的设备和方法 |
US20140365231A1 (en) * | 2011-11-11 | 2014-12-11 | Dolby International Ab | Upsampling using oversampled sbr |
WO2014199632A1 (ja) * | 2013-06-11 | 2014-12-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響信号の帯域幅拡張を行う装置及び方法 |
WO2014207362A1 (fr) * | 2013-06-25 | 2014-12-31 | Orange | Extension améliorée de bande de fréquence dans un décodeur de signaux audiofréquences |
CN104769671A (zh) * | 2013-07-22 | 2015-07-08 | 弗兰霍菲尔运输应用研究公司 | 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CA2236649A1 (en) * | 1998-05-05 | 1999-11-05 | Tet Hin Yeap | Method and apparatus for encoding of digital signals for transmission and/or storage, and decoding such encoded signals following such transmission and/or storage |
US6778953B1 (en) | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
JP3870193B2 (ja) * | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
TWI317933B (en) * | 2005-04-22 | 2009-12-01 | Qualcomm Inc | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same |
CA2698031C (en) * | 2007-08-27 | 2016-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for noise filling |
BRPI0908929A2 (pt) * | 2008-03-14 | 2016-09-13 | Panasonic Corp | dispositivo de codificação, dispositivo de decodificação, e método dos mesmos |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
JP5555707B2 (ja) * | 2008-10-08 | 2014-07-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチ分解能切替型のオーディオ符号化及び復号化スキーム |
CN102714041B (zh) * | 2009-11-19 | 2014-04-16 | 瑞典爱立信有限公司 | 改进的激励信号带宽扩展 |
JP5588025B2 (ja) * | 2010-03-09 | 2014-09-10 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | パッチ境界整合を用いてオーディオ信号を処理するための装置および方法 |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
US9478127B2 (en) * | 2011-12-28 | 2016-10-25 | Mitsubishi Electric Corporation | Center-side system and vehicle-side system |
EP2950308B1 (en) * | 2013-01-22 | 2020-02-19 | Panasonic Corporation | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method |
CA2900437C (en) | 2013-02-20 | 2020-07-21 | Christian Helmrich | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
-
2015
- 2015-12-14 EP EP15199851.5A patent/EP3182411A1/en not_active Withdrawn
-
2016
- 2016-12-08 AU AU2016373990A patent/AU2016373990B2/en active Active
- 2016-12-08 MX MX2018007197A patent/MX2018007197A/es unknown
- 2016-12-08 MY MYPI2018000895A patent/MY191239A/en unknown
- 2016-12-08 CA CA3008388A patent/CA3008388C/en active Active
- 2016-12-08 KR KR1020187020092A patent/KR20180095863A/ko active Application Filing
- 2016-12-08 JP JP2018531150A patent/JP6663996B2/ja active Active
- 2016-12-08 ES ES16809784T patent/ES2960963T3/es active Active
- 2016-12-08 RU RU2018125879A patent/RU2687872C1/ru active
- 2016-12-08 EP EP16809784.8A patent/EP3391373B1/en active Active
- 2016-12-08 WO PCT/EP2016/080331 patent/WO2017102560A1/en active Application Filing
- 2016-12-08 SG SG11201805008YA patent/SG11201805008YA/en unknown
- 2016-12-08 CN CN201680081799.9A patent/CN108701467B/zh active Active
- 2016-12-08 BR BR112018012007-3A patent/BR112018012007B1/pt active IP Right Grant
- 2016-12-08 KR KR1020217013427A patent/KR102625047B1/ko active IP Right Grant
- 2016-12-09 TW TW105140923A patent/TWI625722B/zh active
- 2016-12-13 AR ARP160103811A patent/AR106970A1/es active IP Right Grant
-
2018
- 2018-06-14 US US16/008,323 patent/US11100939B2/en active Active
- 2018-07-06 ZA ZA2018/04512A patent/ZA201804512B/en unknown
-
2021
- 2021-08-19 US US17/407,008 patent/US11862184B2/en active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020077812A1 (en) * | 2000-10-30 | 2002-06-20 | Masanao Suzuki | Voice code conversion apparatus |
US20030231714A1 (en) * | 2002-03-29 | 2003-12-18 | Kjeldsen Erik H. | System and method for orthogonally multiplexed signal transmission and reception |
US20050207502A1 (en) * | 2002-10-31 | 2005-09-22 | Nec Corporation | Transcoder and code conversion method |
CN1918634A (zh) * | 2004-02-16 | 2007-02-21 | 皇家飞利浦电子股份有限公司 | 代码转换器以及用于其的代码转换方法 |
US20080260048A1 (en) * | 2004-02-16 | 2008-10-23 | Koninklijke Philips Electronics, N.V. | Transcoder and Method of Transcoding Therefore |
CN101069233A (zh) * | 2004-09-16 | 2007-11-07 | 法国电信公司 | 通过不同子带域之间通道进行数据处理的方法 |
WO2007037361A1 (ja) * | 2005-09-30 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
CN101086845A (zh) * | 2006-06-08 | 2007-12-12 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
CN101933087A (zh) * | 2008-01-31 | 2010-12-29 | 弗劳恩霍夫应用研究促进协会 | 用于音频信号带宽扩展的设备和方法 |
US20100063808A1 (en) * | 2008-09-06 | 2010-03-11 | Yang Gao | Spectral Envelope Coding of Energy Attack Signal |
CN102246231A (zh) * | 2008-12-15 | 2011-11-16 | 弗兰霍菲尔运输应用研究公司 | 音频编码器和带宽扩展解码器 |
US20110002266A1 (en) * | 2009-05-05 | 2011-01-06 | GH Innovation, Inc. | System and Method for Frequency Domain Audio Post-processing Based on Perceptual Masking |
CN102598121A (zh) * | 2009-08-31 | 2012-07-18 | 苹果公司 | 增强型音频解码器 |
CN103403799A (zh) * | 2010-10-06 | 2013-11-20 | 弗兰霍菲尔运输应用研究公司 | 用于针对合成统一语音和音频编解码器(usac)处理音频信号和提供较高时间粒度的设备和方法 |
US20140365231A1 (en) * | 2011-11-11 | 2014-12-11 | Dolby International Ab | Upsampling using oversampled sbr |
CN103366750A (zh) * | 2012-03-28 | 2013-10-23 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
WO2014199632A1 (ja) * | 2013-06-11 | 2014-12-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響信号の帯域幅拡張を行う装置及び方法 |
WO2014207362A1 (fr) * | 2013-06-25 | 2014-12-31 | Orange | Extension améliorée de bande de fréquence dans un décodeur de signaux audiofréquences |
CN104769671A (zh) * | 2013-07-22 | 2015-07-08 | 弗兰霍菲尔运输应用研究公司 | 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法 |
Non-Patent Citations (2)
Title |
---|
CHRISTIAN R. HELMRICH 等: "Low-complexity semi-parametric joint-stereo audio transform coding", 《2015 23RD EUROPEAN SIGNAL PROCESSING CONFERENCE》 * |
焦慧颖等: "数字广播音频编码中的频带复制技术(SBR)", 《中国有线电视》 * |
Also Published As
Publication number | Publication date |
---|---|
SG11201805008YA (en) | 2018-07-30 |
BR112018012007A2 (pt) | 2018-12-04 |
BR112018012007B1 (pt) | 2023-12-05 |
KR20210054052A (ko) | 2021-05-12 |
EP3391373C0 (en) | 2023-09-27 |
EP3182411A1 (en) | 2017-06-21 |
CA3008388C (en) | 2020-09-08 |
AR106970A1 (es) | 2018-03-07 |
MX2018007197A (es) | 2018-11-09 |
ZA201804512B (en) | 2019-05-29 |
RU2687872C1 (ru) | 2019-05-16 |
WO2017102560A1 (en) | 2017-06-22 |
EP3391373A1 (en) | 2018-10-24 |
US20180293994A1 (en) | 2018-10-11 |
US11100939B2 (en) | 2021-08-24 |
ES2960963T3 (es) | 2024-03-07 |
TWI625722B (zh) | 2018-06-01 |
TW201730876A (zh) | 2017-09-01 |
KR102625047B1 (ko) | 2024-01-16 |
AU2016373990A1 (en) | 2018-07-05 |
AU2016373990B2 (en) | 2019-08-29 |
US20210383818A1 (en) | 2021-12-09 |
CA3008388A1 (en) | 2017-06-22 |
JP6663996B2 (ja) | 2020-03-13 |
JP2019502948A (ja) | 2019-01-31 |
CN108701467B (zh) | 2023-12-08 |
MY191239A (en) | 2022-06-10 |
KR20180095863A (ko) | 2018-08-28 |
US11862184B2 (en) | 2024-01-02 |
EP3391373B1 (en) | 2023-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11741973B2 (en) | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal | |
US20230154476A1 (en) | Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor | |
RU2668397C2 (ru) | Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации | |
WO2010086461A1 (en) | Improved harmonic transposition | |
KR101517446B1 (ko) | 직각 대칭 필터 기반 오디오 코덱들의 출력 신호들의 리샘플링 | |
CN110265047B (zh) | 音频信号的解码方法和解码器、介质以及编码方法 | |
KR102474146B1 (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
KR20110134395A (ko) | 개선된 고조파 전위 | |
IL305626B1 (en) | Harmonic-inverse harmonic exchanger combination for high-frequency reproduction of audio signals | |
CA3210604A1 (en) | Improved harmonic transposition | |
CN108701467A (zh) | 处理经编码音频信号的装置及方法 | |
AU2021204779B2 (en) | Improved Harmonic Transposition | |
AU2023282303B2 (en) | Improved Harmonic Transposition | |
RU2809586C2 (ru) | Аудиокодер и декодер для кодирования по форме волны с перемежением |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |