CN104282313A - 基于模式转换来处理窗口序列的语音/音频统合编解码器 - Google Patents

基于模式转换来处理窗口序列的语音/音频统合编解码器 Download PDF

Info

Publication number
CN104282313A
CN104282313A CN201410524905.9A CN201410524905A CN104282313A CN 104282313 A CN104282313 A CN 104282313A CN 201410524905 A CN201410524905 A CN 201410524905A CN 104282313 A CN104282313 A CN 104282313A
Authority
CN
China
Prior art keywords
lpd
pattern
windows
series
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410524905.9A
Other languages
English (en)
Other versions
CN104282313B (zh
Inventor
白承权
李泰辰
金珉第
姜京玉
张大永
徐廷一
洪镇佑
安致得
朴浩综
朴荣喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Industry Academic Collaboration Foundation of Kwangwoon University
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Industry Academic Collaboration Foundation of Kwangwoon University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI, Industry Academic Collaboration Foundation of Kwangwoon University filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN104282313A publication Critical patent/CN104282313A/zh
Application granted granted Critical
Publication of CN104282313B publication Critical patent/CN104282313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出了一种以模式转换为基础来处理窗口序列的语音/音频统合编解码器。当语音/音频统合编解码器发生模式转换时,可以折点为基准执行帧之间的重叠来编码或解码。语音/音频统合编解码器为执行编码或解码,根据情况处理不同的窗口序列,从而可提高译码的性能。

Description

基于模式转换来处理窗口序列的语音/音频统合编解码器
本专利申请是下列专利申请的分案申请:
申请号:200980155342.8
申请日:2009年11月26日
发明名称:基于模式转换来处理窗口序列的语音/音频统合编解码器
技术领域
本发明涉及一种在基于修正离散余弦变换MDCT的语音/音频统合编解码器USAC中发生模式转换时,处理用于执行编码或解码的窗口序列的方法。
本发明是通过作为韩国知识经济部的IT原始技术开发项目的一环而执行的研究推导出的。(课题管理号:2008-F-011-01课题名:升级换代DTV核心技术开发(标准化连接)-无需眼镜的个人类型的3D演播技术的开发)。
背景技术
语音/音频编统合解码器,在根据输入信号的特性改变编码或解码方法时,可提高译码的性能。在这种情况下,语音/音频统合编解码器可将输入信号中与语音相类似的信号在语音编码/解码器中进行编码/解码,并可将与音频相类似的信号在音频编码/解码器中进行编码/解码。
此类语音/音频统合编解码器,可根据线性预测域LPD模式之间的模式转换来处理输入信号。此外,语音/音频统合编解码器可根据LPD模式和FD模式之间的模式转换来处理输入信号。语音/音频统合编解码器根据模式转换,将窗口序列应用于输入信号的帧中处理了信号。但是需要一种与现有的语音/音频编解码器相比,可提高译码效率的窗口序列处理方法。
发明内容
技术课题
根据本发明的一个实施例,提供一种语音/音频统合统合编解码器,其在LPD模式之间发生模式转换时,应用帧之间重叠相加的区域被扩大的序列,来编码或解码。
根据本发明的一个实施例,提供一种语音/音频统合编解码器,其在LPD模式与FD模式之间发生模式转换时,应用帧之间重叠相加的区域被扩大的序列,来编码或解码。
技术方案
根据本发明的一个实施例的语音/音频统合编码器(USAC),可包括模式转换单元和编码单元。模式转换单元,对构成输入信号的帧的子帧,在LPD模式之间进行转换;编码单元,将基于被转换的LPD模式的窗口应用于所述子帧中要编码的当前子帧,来将所述输入信号编码,其中,所述编码单元,将根据上一个子帧的LPD模式和下一个子帧的LPD模式被改变的窗口应用于当前子帧,可将所述输入信号编码。
根据本发明的一个实施例的语音/音频统合编码器(USAC),可包括模式转换单元和编码单元。模式转换单元,对输入信号的帧,从FD模式转换至LPD模式;编码单元,将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来编码。
根据本发明的一个实施例的语音/音频统合编码器(USAC),可包括模式转换单元和编码单元。模式转换单元,对输入信号的帧,从LPD模式转换至FD模式;编码单元,将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来编码。
根据本发明的一个实施例的语音/音频统合解码器(USAC),可包括模式转换单元和解码单元。模式转换单元,其对构成输入信号的帧的子帧,在LPD模式之间进行转换;解码单元,其将基于被转换的LPD模式的窗口应用于所述子帧中要解码的当前子帧中,来将所述输入信号解码,其中,所述解码单元,将根据上一个子帧的LPD模式和下一个子帧的LPD模式改变的窗口应用于当前子帧,可将所述输入信号解码。
根据本发明的一个实施例的语音/音频统合解码器(USAC),可包括模式转换单元和解码单元。模式转换单元,对输入信号的帧,从FD模式转换至LPD模式;解码单元,将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来解码。
根据本发明的一个实施例的语音/音频统合解码器(USAC),可包括模式转换单元和解码单元。模式转换单元,对输入信号的帧,从LPD模式转换至FD模式;解码单元,将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来解码。
技术效果
根据本发明的一个实施例的语音/音频统合编解码器(USAC),比起在现有的语音/音频统合编解码器中处理的窗口序列,对区块效应(block artifact)的影响较小,且充分活用MDCT的TDAC条件,可获得更多的译码增益。
附图说明
图1是示出执行语音/音频统合译码的编码器的整体结构的示图。
图2是用于说明基于MDCT的TDAC的示图。
图3是示出现有的RM中被定义的窗口序列的示图。
图4是示出窗口序列(情况1:ONLY_LONG_SEQUENCE至LPD_START_SEQUENCE)的示图。
图5是示出窗口序列(情况2:ONLY_LONG_SEQUENCE至LPD_START_SEQUENCE)的示图。
图6是示出从FD模式转换至LPD模式时,窗口序列(情况3:LPD_START_SEQUENCE至LPD_SEQUENCE)的示图。
图7是示出从LPD模式转换至FD模式时,窗口序列(情况4:LPD_START_SEQUENCE至LPD_SEQUENCE),和从LPD模式转换至FD模式时,窗口序列(情况4:LPD_SEQUENCE to STOP_1152_SEQUENCE或STOP_START_1152_SEQUENCE)的示图。
图8是示出各种类型LPD_SEQUENCE的窗口形态的示图。
图9是示出(a)当LPD模式为{1,1,1,1}时,(b)当LPD模式为{2,2,2,2}时,(c)当LPD模式为{3,3,3,3}时的LPD_SEQUENCE的示图。
图10是示出当LPD模式为{0,1,1,1}时的LPD_SEQUENCE的示图。
图11是示出当LPD模式为{1,0,2,2}时的LPD_SEQUENCE的示图。
图12是示出当上一个子帧的结束子帧的LPD模式为{0}时,LPD模式为{3,3,3,3}的LPD_SEQUENCE的示图。
图13是示出关于现有的情况3窗口序列的处理方法的示图。
图14是示出根据本发明的一个实施例的关于情况3的窗口序列的处理方法的示图(第1例)。
图15是示出根据本发明的一个实施例的关于情况3的窗口序列的处理方法的示图(第2例)。
图16是示出根据本发明的一个实施例的关于情况3的窗口序列的处理方法的示图(第3例)。
图17是示出根据本发明的一个实施例,关于当前子帧LPD_SEQUENCE的lpd_mode为3且关于下一个子帧的LPD_SEQUENCE的lpd_mode为3时的窗口的示图。
图18是示出根据本发明的一个实施例,关于当前子帧的LPD_SEQUENCE的lpd_mode为2且关于下一个子帧的LPD_SEQUENCE的lpd_mode为2时的窗口的示图。
图19是示出根据本发明的一个实施例,关于当前子帧的LPD_SEQUENCE的lpd_mode为1且关于下一个子帧的LPD_SEQUENCE的lpd_mode为1时的窗口的示图。
图20是示出关于现有的情况4的窗口序列的处理方法的示图。
图21是示出根据本发明的一个实施例,关于情况4的窗口序列的处理方法的示图(第1例)。
图22是示出根据本发明的一个实施例,关于情况4的窗口序列的处理方法的示图(第2例)。
图23是示出本发明的一个实施例得关于情况4的窗口序列的处理方法的示图(第3例)。
图24是示出根据本发明的一个实施例的反映图22的窗口序列的STOP_1024_SEQUENCE的示图。
图25是示出根据本发明的一个实施例的图16及图24的窗口序列被应用的结果的示图。
图26是示出根据本发明的一个实施例从ACELP变换至FD时窗口形态的示图。
图27是示出根据本发明的一个实施例,根据当前帧的LPD模式与下一个帧的LPD模式的窗口序列和LPC提取位置的示图。
图28是现有的LPC提取位置和根据本发明的一个实施例的LPC提取位置相比较的示图。
图29是示出LPD模式中lpd_mode={1,0,1,1}时根据本发明的实施例的窗口序列的示图。
图30是示出LPD模式中lpd_mode={1,0,2,2}时,根据本发明的一个实施例的窗口序列的示图。
图31是示出当前帧的lpd_mode={3,3,3,3}且上一个帧的lpd_mode={x,x,x,0}时,根据本发明的一个实施例的窗口的序列的示图。
图32是示出根据本发明的一个实施例,当前子帧的(a)lpd_mode=1(TCX256)、(b)lpd_mode=2(TCX512)或(c)lpd_mode=3(TCX1024)时,根据上一个子帧及下一个子帧的lpd_mode=0(ACELP)的窗口序列的示图。
图33是示出当前子帧的lpd_mode为1(TCX256)且上一个子帧的lpd_mode为0时,根据本发明的一个实施例的窗口序列的示图。
图34是示出当前子帧的lpd_mode为2(TCX512)且上一个子帧的lpd_mode为0时,根据本发明的一个实施例的窗口序列的示图。
图35是示出当前子帧的lpd_mode为3(TCX1024)且上一个子帧的lpd_mode为0时,根据本发明的一个实施例的窗口序列的示图。
图36是示出将图33至图35的窗口序列结合的结果的示图。
图37是示出根据本发明的一个实施例的模式转换时窗口序列的示图。
图38是示出根据本发明的一个实施例,图3的LPD_START_SEQUENCE及STOP_1152_SEQUENCE被变形的结果的示图。
图39是示出根据现有的方法模式转换时窗口序列的示图。
具体实施方式
以下,将参照附图中记载的内容对本发明的实施例进行详细说明。但是,本发明并不受实施例的限制或限定。各附图中出示的相同的参考符号表示相同的结构。
图1是示出执行语音/音频统合译码的编码器的整体结构的示图。
图1示出的语音/音频统合编码器,根据输入信号的特征不同地执行编码方法,从而可将编码的性能和音质最大化。例如,语音/音频统合编码器,可对输入信号中与语音(Speech)相类似的信号根据代码激励线性预测CELP方式(Code Excitation Linear Prediction)编码,从而可提高译码的效率。此外,语音/音频统合编码器,可对输入信号中与音频(Audio)相类似的信号根据变换(transform)方式编码,从而可提高译码的效率。
图1中的MPEGS用于将立体声信号译码,可进行MPEG环绕(MPEG Surround)的一对二OTT(One-TO-Two)。此外,增强的频带复制eSBR,可分析高频成分来对输入信号扩大带宽。模式开关-1(Mode Switch-1)对应信号分类器(Signal classifier),可判断输入信号的当前帧是语音信号还是音频信号。此时,信号分类器,可判断输入信号是类似于语音还是类似于音频,来根据信号的特性来选择编码器。假定根据本发明的一个实施例的语音/音频统合编码器包含一种理想操作的信号分析机。
如果,输入信号的当前帧被判断为与音频相似时,模式开关-1将当前帧转换至频域FD模式(Frequency Domain Mode)的高级音频编码模式AAC-MODE(Advanced Audio Coding MODE),输入信号的当前帧可根据AAC-MODE被编码。在AAC-MODE中,输入信号基本地可根据听觉心理音响模型被编码。此外,块转换-1(Block switching-1),可对当前帧根据输入信号的特性将窗口(window)不同地应用。在这种情况下,窗口形态可根据上一个帧或下一个帧的译码模式来决定。此后过滤器组(filterbank)可对应用了窗口的当前帧执行时间到频率T/F(Time to Frequency)变换。过滤器组为提高编码的效率,可基本地应用修正离散余弦变换MDCT(Modified Discrete Cosine Transform)来执行编码。
相反,当输入信号的当前帧被判断为与语音相类似时,模式开关-1将当前帧转换至线性预测域模式LPD-MODE(Linear Prediction Domain Mode),输入信号的当前帧可根据线性预测编码LPC(Linear Prediction Coding)来编码。模式转换-2(Mode Switch-2),在LPD模式之间发生模式转换时,可对每一个子帧应用根据LPD模式的窗口。与在AMR-WB+或USAC中相同,基本上,输入信号的当前帧可在LPD模式中以4个子帧(sub-frame)构成。在此,输入信号的当前帧可被定义为超帧(super-frame)。在本发明中定义的窗口序列,可定义为将被应用于构成超帧的子帧的至少一个的窗口组合的形态。
例如,将超帧(super-frame)处理为1个子帧时,超帧的lpd_mode可被决定为{3,3,3,3}。在此情况下,窗口序列以1个窗口构成。此外,将超帧处理为2个子帧时,超帧的lpd_mode可被决定为{2,2,2,2}。在此情况下,窗口序列以2个窗口构成。此外,将超帧处理为4个子帧时,超帧的lpd_mode可被决定为{1,1,1,1}。在此情况下,窗口序列以4个窗口构成。
在此,当lpd_mode=0时,一个的子帧根据代数码激励线性预测ACELP(Algebraic code excited linear prediction)被编码。在这种情况下,当ACELP被应用时,T/F变换及窗口不被应用。即,根据基于LPC的LPD,模式编码的过程,可通过基于时域译码的ACELP块和基于过滤器组的变换码激励TCX(Transform Code eXcitation)块被执行。过滤器组方法包括MDCT和离散傅立叶变换DFT(Discrete Fourier Transform)方法,本发明使用基于MDCT的TCX。本发明对在模式转换-1和模式转换-2中处理窗口序列的方法进行了说明。
图2是用于说明基于MDCT的TDAC的示图。
MDCT(Modified Discrete Cosine Transform),作为在音频编码器中被广泛使用的T/F变换方式,具有即使执行帧之间的重叠相加(overlap add)也不会增加比特率的优点。相反,MDCT作为在时域中制造混淆(aliasing)的变换方式,MDCT是,在将输入信号从频域到时域逆变换后,必须和与当前帧相邻的帧对窗口执行50%的重叠相加,才可使原来的输入信号被复原的一种变换方式(TDAC transform:Time-Domain Aliasing Cancellation transform)。
参照图2的话,输入信号在窗口处理后执行MDCT。MDCT的执行在时域中制造混淆。图2中,Rk表示对输入信号应用的窗口的右侧部分。对输入信号执行MDCT的话,以Rk/2为基准折叠窗口,可能会发生时域混叠TDA(Time-Domain Aliasing)。此后,对输入信号执行IMDCT的话,窗口虽然被展开(unfolding)成Rk,但是在TDA发生后被展开的窗口显示与原来的窗口不同的形态。
但是,与当前帧相同,下一个帧被开窗口与MDCT与IMDCT与开窗口(Windowing→MDCT→IMDCT→windowing)后,应用了窗口的下一个帧的左侧信号与应用了窗口的当前帧的右侧信号被互相执行重叠相加的话,可提取出清除了TDA的原有输入信号。此过程是在TDA条件下用于清除混淆的重叠相加的方法。为了应用上面所述的重叠原理(overlap-add and TDAC),应用了窗口的帧被重叠相加的点,就是窗口的折点,在这种情况下,折点位置为Rk/2。
图3是示出现有的RM中被定义的窗口序列的示图。
图3示出可应用于图1的块转换-1(Block switching-1)的窗口。在这种情况下,图3中索引2的情况,因为由8个SHORT_WINDOW构成一套,当其被以窗口序列表示出时,在别的转换模式中,可由1个窗口构成1个窗口序列。如图3中所见,示出窗口序列假定为三角窗口。当前帧的长度N被设定为2048时,虚线的间隔表示128。但是STOP_START_1152_SEQUENCE的情况,当前帧的长度设定为2304。
图4是示出窗口序列(情况1:ONLY_LONG_SEQUENCE至LPD_START_SEQUENCE)的示图。
依据USAC的RM,定义为ONLY_LONG_SEQUENCE401下一个可显示LPD_START_SEQENCE404,405LPD_START_SEQENCE下一个显示LPD_SEQUENCE。LPD_SEQUENCE可显示在区域405中。
LPD_SEQUENCE表示应用了LPD模式的窗口序列,在此,线402与线403之间的区域,表示当解码器中输入信号被复原时相邻的两个的窗口序列被重叠相加的区域。
图5是示出窗口序列(情况2:ONLY_LONG_SEQUENCE至LPD_START_SEQUENCE)的示图。
依据USAC的RM,定义为ONLY_LONG_SEQUENCE501下一个显示LPD_START_SEQENCE504,LPD_START_SEQENCE504下一个显示LPD_SEQUENCE。LPD_SEQUENCE可显示在区域505中。
与图4相同,LPD_SEQUENCE表示在LPD模式中生成的窗口序列,在此,线502与线503之间的区域,表示当解码器中输入信号被复原时相邻的两个窗口被重叠相加的区域。
图6是示出从FD模式转换至LPD模式时,窗口序列(情况3:LPD_START_SEQUENCE至LPD_SEQUENCE)的示图。
依据USAC的RM,定义为ONLY_LONG_SEQUENCE601下一个显示LPD_START_SEQENCE604。LPD_START_SEQENCE601表示当模式开关-1中发生从FD模式'AAC MODE'中至LPD模式'LPC MODE'的转换时应用AAC模式的最后的窗口序列。LPD_SEQUENCE可显示在区域604中。
与图4相同,LPD_SEQUENCE表示应用LPD模式的窗口序列,在此,线602与线603之间的区域,表示当解码器中输入信号被复原时,相邻的两个窗口序列被重叠相加的区域。在这种情况下,窗口序列被重叠相加的区域的间隔为64点(64-point)。
图7是示出从LPD模式转换至FD模式时,窗口序列(情况4:LPD_START_SEQUENCE至LPD_SEQUENCE),和从LPD模式转换至FD模式时,窗口序列(情况4:LPD_SEQUENCE to STOP_1152_SEQUENCE或STOP_START_1152_SEQUENCE)的示图。
依据USAC的RM,定义为,区域701中显示应用了LPD模式的LPD_SEQUENCE,之后区域704中显示应用了LPD模式的LPD_SEQUENCE。图7中,LPD__SEQENCE和LPD__SEQENCE重叠相加的区域为线702和线703之间的区域,被重叠相加的区域的间隔为128点(128-point)。
此外,如图7中所见,区域701中显示应用了LPD模式的LPD_SEQUENCE,且之后可显示应用了ACC模式的STOP_1152_SEQUENCE705。此外,区域701中显示应用了LPD模式的LPD_SEQUENCE,且之后可显示应用了ACC模式的STOP_1152_SEQUENCE706。
根据本发明的一个实施例,提出了在情况3、情况4中处理窗口序列的方法及处理LPD_SEQUENCE的方法。情况3作为从LPD模式向FD模式转换的情况,在图13至图16中进行说明,情况4作为从LPD模式向FD模式转换的情况,在图20至图24中进行说明。LPD_SEQUENCE在图8至图12中进行说明。情况3及情况4,表示在FD模式与LPD模式间进行模式转换时处理窗口序列的方法,由图1的块转换-1处理窗口序列。此外,LPD_SEQUENCE表示在LPD模式之间进行模式转换时窗口序列的处理方法,由图1的块转换-2(Blocking Switching-2)处理窗口序列。
关于LPD之间的模式转换,语音/音频统合编码器(USAC)可包括模式转换单元和编码单元。模式转换单元,对构成输入信号的帧的子帧在LPD模式之间进行转换;编码单元,将基于被转换的LPD模式的窗口应用于子帧中要编码的当前子帧,来将输入信号编码。
在这种情况下,模式转换单元与图1的模式开关-2对应,编码单元与图1的块转换-2对应。编码单元根据上一个子帧的LPD模式和下一个子帧的LPD模式,将变形的窗口应用于当前子帧来将输入信号编码。此外,编码单元,可以以存在于子帧的边界的折点为中心,执行帧之间的重叠相加。
例如,当当前子帧的LPD模式为1,且上一个子帧或下一个子帧的LPD模式不为0时,语音/音频统合编码器(USAC)的编码单元,可利用对与上一个子帧或所述下一个子帧重叠相加(overlap-add)的区域间隔为256的所述当前子帧所应用的窗口来编码。
此外,当当前子帧的LPD模式为2,且上一个子帧或下一个子帧的LPD模式不为0时,语音/音频统合编码器(USAC)的编码单元,可利用对与上一个子帧或所述下一个子帧重叠相加(overlap-add)的区域间隔为512的所述当前子帧所应用的窗口来编码。
此外,当当前子帧的LPD模式为3,且上一个子帧或下一个子帧的LPD模式不为0时,语音/音频统合编码器(USAC)的编码单元,可利用对与上一个子帧或所述下一个子帧重叠相加(overlap-add)的区域间隔为1024的所述当前子帧所应用的窗口来编码。
如果,当上一个子帧的LPD模式为0时,编码单元可将被应用于当前子帧的窗口的左侧部分处理成值为1的直角形态。此外,当下一个子帧的LPD模式为0时,编码单元可将被应用于当前子帧的窗口的右侧部分处理成值为1的直角形态。
在这种情况下,编码单元可以以存在于子帧的边界的折点为中心,执行子帧之间的重叠相加。
关于从FD模式至LPD模式的模式转换,语音/音频统合编码器(USAC)可包括模式转换单元和编码单元。模式转换单元,对构成输入信号的帧的子帧,从FD模式转换至LPD模式;编码单元,将FD模式的窗口序列与LPD模式的窗口序列以折点为基准重叠相加来编码。在这种情况下,FD模式可以是ACC模式。
在这种情况下,当LPD模式的窗口序列中开始子帧的LPD模式为0时,编码单元可将与开始子帧相对应的窗口替换为LPD模式对应1的窗口。
此外,编码单元可将LPD模式的窗口序列转移,使其能以折点为基准与FD模式的窗口序列重叠相加。
此外,编码单元可根据LPD模式的窗口序列将FD模式的窗口序列的形态变形。
此外,编码单元,可以以位于构成输入信号的帧的子帧的边界的折点为基准在窗口序列之间执行重叠相加,并将所述折点设定为开始点,根据子帧单位来提取出线性预测系数LPC(Linear Prediction Coefficient)。
关于从LPD模式到FD模式的模式转换,语音/音频统合编码器(USAC)可包括模式转换单元和编码单元。模式转换单元,对构成输入信号的帧,从LPD模式转换至FD模式;编码单元,将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来编码。
此外,编码单元可根据LPD模式将FD模式的窗口序列的形态变形。
此外,编码单元可将LPD模式的窗口序列和FD模式的窗口序列重叠256点,在此,当LPD模式的窗口序列中结束子帧的LPD模式为0时,结束子帧所对应的窗口可被替换为LPD模式对应1的窗口。
对此,语音/音频统合解码器(USAC),可与之前说明的有关LPD模式之间的模式转换、从FD模式至LPD模式的模式转换、或从LPD模式至FP模式的模式转换的语音/音频统合编码器相同地处理窗口序列。以下,将对依据本发明的语音/音频统合编码器(USAC)和语音/音频统合解码器(USAC)中处理的窗口序列进行详细说明。
图8是示出各种类型LPD_SEQUENCE的窗口形态的示图。
图8表示图4至图7中所说明的LPD_SEQUENCE的窗口形态,图8中图示的LPD_SEQUENCE可根据下表1被定义。
[表1]
表1定义出根据上一个子帧的lpd_mode(last_lpd_mode)变更的当前子帧的有关LPD_SEQUENCE的窗口形态。表1中,ZL是指LPD_SEQUENCE中窗口左侧所插入的zero block对应的区间的长度,ZR是LPD_SEQUENCE中窗口右侧所插入的zero block对应的区间的长度。此外M是LPD_SEQUENCE中值为1的窗口的区间的长度,此外,L和R各自表示在LPD_SEQUENCE中以窗口的中心点为基准,各自与左侧和右侧相邻的窗口重叠相加的区间的长度。如表1中所见,对一个帧,可发生1024或是1152个光谱系数(spectral coefficients)。
当lpd_mode=0时,与上一个子帧的lpd_mode无关,当前子帧的LPD_SEQUENCE表示图8的类型6的窗口。在此,与图8的类型6对应的窗口为没有zero block的直角形态的窗口。即,当lpd_mode=0时,输入信号根据ACELP被编码,将输入信号复原时,因不发生混淆,所以不应用用来执行重叠相加的窗口。因此,图1的ACELP块与TCX块不同,不执行块转换(Block-switching)。
依据图8,对一个超帧(super-frame)可生成为LPD_SEQUENCE的组合共26种。图9至图12示出可生成的26种LPD_SEQUENCE中的一部分。
图9是示出(a)当LPD模式为{1,1,1,1}时,(b)当LPD模式为{2,2,2,2}时,(c)当LPD模式为{3,3,3,3}时的LPD_SEQUENCE的示图。
图9(a)示出当超帧内各子帧的lpd_mode都为1时的LPD_SEQUENCE,在这种情况下,图9(a)的LPD_SEQUNECE可由与图8中的类型3对应的4个窗口901构成。图9(a)的LPD_SEQUENCE的lpd_mode为{1,1,1,1}。
图9(b)示出当超帧(super-frame)内各子帧的lpd_mode都为2时的LPD_SEQUENCE,在这种情况下,图9(b)的LPD_SEQUNECE可由与图8中的类型4对应的2个窗口902构成。图9(b)的LPD_SEQUNECE的lpd_mode为{2,2,2,2}。
图9(c)示出当超帧(super-frame)内各子帧的lpd_mode都为3时的LPD_SEQUENCE,在这种情况下,图9(c)的LPD_SEQUNECE可由与图8中的类型5对应的1个窗口903构成。图9(c)的LPD_SEQUNECE的lpd_mode为{3、3、3、3}。
图10是示出当LPD模式为{0,1,1,1}时的LPD_SEQUENCE的示图
图11是示出当LPD模式为{1,0,2,2}时的LPD_SEQUENCE的示图
图12是示出当上一个子帧的结束子帧的LPD模式为{0}时,LPD模式为{3,3,3,3}的LPD_SEQUENCE的示图。
图13是示出关于现有的情况3窗口序列的处理方法的示图。
如图6中所述,情况3表示从LPD_START_SEQUENCE1301到LPD_SEQUENCE 1302至1305窗口序列处理的情况。在这种情况下,当模式开关-1中发生从FD模式‘AAC模式'至LPD模式'LPC模式'的模式转换时,LPD_START_SEQUENCE1301表示AAC模式中最后被应用的窗口序列。
图13中,LPD_SEQUENCE1302表示lpd_mode={3,3,3,3}的情况,且LPD_SEQUENCE1303表示lpd_mode={2,2,2,2}的情况。此外LPD_SEQUENCE 1304在表示lpd_mode={1,1,1,1}的情况,且LPD_SEQUENCE1303表示lpd_mode={0,0,0,0}的情况。图13中LPD_SEQUENCE1302、1303、1304、1305在被修改为虚线后,可在64点(64-point)的区域1306中以折点为中心与LPD_START_SEQUENCE 1301重叠相加。
图14是示出根据本发明的一个实施例的关于情况3的窗口序列的处理方法的示图(第1例)。
参照图14,LPD_START_SEQUENCE 1401不考虑TDAC,与LPD_SEQUENCE 1402、1403、1404、1405在区域1406中重叠相加。因此,LPD_SEQUENCE 1402、1403、1404、1405各自被修改为虚线后,与LPD_START_SEQUENCE 1401在区域1406中以折点为中心被重叠相加。在这种情况下,区域1406的间隔表示64点(64-point)。
折点表示执行MDCT和IMDCT后发生TDA窗口被折叠的位置。即,根据本发明的一个实施例,LPD_START_SEQUENCE1401的右侧窗口,在MDCT和IMDCT被执行后,不发生TDA,与相邻的帧开窗口后被重叠相加来连接。
图15是示出根据本发明的一个实施例的关于情况3的窗口序列的处理方法的示图(第2例)。
图15中示出的LPD_SEQUENCE1502、1503、1504、1505比图14中示出的LPD_SEQUENCE1402、1403、1404、1405向右侧移动(shift)了128点。即,图15中中示出的LPD_SEQUENCE1502、1503、1504、1505与LPD_SEQUENCE1402、1403、1404、1405不同,不修改也可与LPD_START_SEQUENCE1501以折点为中心重叠相加。此外,重叠相加的区域1506的间隔为128点,比区域1406增加了64点。此外,图15中示出的LPD_SEQUENCE 1502、1503、1504、1505,比图13中示出的LPD_SEQUENCE 1302、1303、1304、1305向右侧移动(shift)了64点。在这种情况下,当LPD_SEQUENCE 1505的lpd_mode为{0,0,0,0}时,LPD_SEQUENCE 1505的开始子帧的lpd_mode可被变更为1。
根据图15,模式转换-1从FP模式的AAC模式转换至LPD模式时,AAC模式的窗口序列LPD_START_SEQUENCE 1501和LPD模式的窗口序列LPD_SEQUENCE 1502、1503、1504、1505,以MDCT折点(MDCT folding point)为基准互相连接。即,图15的LPD_SEQUENCE1502、1503、1504、1505以TDA为中心,与LPD_START_SEQUENCE 1501在区域1506中重叠相加,由此发生在时域中的混淆可被清除。
因此,图15中的LPD_SEQUENCE 1502至1505,可比图13中的LPD_SEQUENCE1302、1303、1304、1305向右侧移动64点来被重叠相加。此外,图15的LPD_SEQUENCE 1502、1503、1504、1505,可比图14中示出的LPD_SEQUENCE1402、1403、1404、1405向右侧移动128点来被重叠相加。即,图15中的应用窗口序列的方法,与图1的模式开关-1在每一次从FP模式至LPD模式的转换时应用图13的窗口序列的方法作比较,可获64点的编码增益,此外与应用图14的窗口序列的方法作比较,可获128点的译码增益(coding gain)。
1、FD模式的窗口序列(LPD_START_SEQUENCE)和LPD模式的窗口序列(LPD_SEQUENCE)可以MDCT折点(MDCT folding point)为中心被重叠相加。
2、LPD_START_SEQUENCE中与LPD_SEQUENCE相连接的区域所对应的窗口应被变形为超过折点(folding point)。
3、LPD_SEQUENCE开始位置应与图13和图14相比被各自向右侧移动64点和128点来与MDCT折点匹配。
4、作为例外,以ACELP子帧开始的LPD_SEQUENCE,ACELP子帧可被替换为TCX20(lpd_mode={1})。
图16是示出根据本发明的一个实施例的关于情况3的窗口序列的处理方法的示图(第3例)。
图16表示,根据下一个帧的LPD_SEQUENCE的lpd_mode,在LPD_START_SEQUENCE中与LPD_SEQUENCE重叠相加的区域的窗口被变形。即,LPD_START_SEQUENCE的右侧窗口可根据LPD_SEQUENCE的lpd_mode被变形。图16中,当LPD_START_SEQUENCE的右侧窗口为线1601时,图16的LPD_START_SEQUENCE表示与LPD_START_SEQUENCE 1501相同的形态。
如果,下一个帧所对应的LPD_SEQUENCE的lpd_mode={3,3,3,3}时,当前帧所对应的LPD_START_SEQUENCE的右侧窗口可被变形为线1604。此外,对应被变形的LPD_START_SEQUENCE的右侧窗口,lpd_mode={3,3,3,3}的LPD_SEQUENCE的左侧窗口可从线1605变形至线1606。这样的话,LPD_START_SEQUENCE可与LPD_SEQUENCE重叠相加1024点。
如果,下一个帧所对应的LPD_SEQUENCE的lpd_mode={2,2,x,x}时,当前帧所对应的LPD_START_SEQUENCE的右侧窗口可被变形为线1603。此外对应被变形的LPD_START_SEQUENCE的右侧窗口,lpd_mode={2,2,x,x}的LPD_SEQUENCE的左侧窗口可从线1607变形至线1608。这样的话,LPD_START_SEQUENCE可与LPD_SEQUENCE重叠相加512点。
如果,下一个帧所对应的LPD_SEQUENCE的lpd_mode={1,x,x,x}时,当前帧所对应的LPD_START_SEQUENCE的右侧窗口可被变形至线1602。此外对应被变形的LPD_START_SEQUENCE的右侧窗口,lpd_mode={1,x,x,x}的LPD_SEQUENCE的左侧窗口可从线1609变形至线1610。这样的话,LPD_START_SEQUENCE可与LPD_SEQUENCE重叠相加1024点。
如果,下一个帧所对应的LPD_SEQUENCE的lpd_mode={0,x,x,x}时,LPD_SEQUENCE开始子帧的lpd_mode可被替换为1。这样的话,当前帧所对应的LPD_START_SEQUENCE的右侧窗口,与LPD_SEQUENCE的lpd_mode={1,x,x,x}的情况相同,可被变形至线1602。此外,对于变形的LPD_START_SEQUENCE的右侧窗口,lpd_mode={0,x,x,x}的LPD_SEQUENCE的左侧窗口可从线1611变形至线1612。这样的话,LPD_START_SEQUENCE可与LPD_SEQUENCE重叠相加512点。
图17是示出根据本发明的一个实施例,关于当前子帧LPD_SEQUENCE的lpd_mode为3且关于下一个子帧的LPD_SEQUENCE的lpd_mode为3时的窗口的示图。
依据图17,关于下一个帧,当LPD_SEQUENCE的lpd_mode为3时,当前帧LPD_SEQUENCE的右侧窗口从线1701变形至线1703。这样的话,下一个子帧所对应的LPD_SEQUENCE的左侧窗口从线1702被变形至线1704。结果,依据图17,以折点为中心在窗口序列间的重叠相加的区域1705扩大至区域1706。
图18是示出根据本发明的一个实施例,关于当前子帧的LPD_SEQUENCE的lpd_mode为2且关于下一个子帧的LPD_SEQUENCE的lpd_mode为2时的窗口的示图。
依据图18,关于下一个帧的LPD_SEQUENCE的lpd_mode为2时,关于当前子帧的LPD_SEQUENCE的右侧窗口从线1801变形至线1803。这样的话,下一个子帧所对应的LPD_SEQUENCE的左侧窗口从线1802变形至线1804。结果,依据图18,以折点为中心在窗口序列之间重叠相加的区域1805扩大至区域1806。
图19是示出根据本发明的一个实施例,关于当前子帧的LPD_SEQUENCE的lpd_mode为1且关于下一个子帧的LPD_SEQUENCE的lpd_mode为1时的窗口的示图。
依据图19,关于下一个子帧的LPD_SEQUENCE的lpd_mode为1时,关于当前子帧LPD_SEQUENCE的右侧窗口从线1901变形至线1903。这样的话,下一个子帧所对应的LPD_SEQUENCE的左侧窗口从线1902变形至线1904。结果,依据图19,以折点为中心在窗口序列之间重叠相加的区域1905扩大至区域1906。
图20是示出关于现有的情况4的窗口序列的处理方法的示图。
参照图20,LPD_SEQUENCE2001、2002、2003、2004,对不发生TDA的区间,对FD模式的AAC模式的窗口序列2005与区域2006进行重叠,且人为的TDA在LPD_SEQUENCE2001、2002、2003、2004的区域2006中被生成,LPD_SEQUENCE2001、2002、2003、2004可与窗口序列2005相加。
图21是示出根据本发明的一个实施例,关于情况4的窗口序列的处理方法的示图(第1例)。
图21示出如情况4图1的模式开关-1从LPD模式转换至FD模式时,在块转换-1中处理的窗口序列。如图21中所见,块转换-1在TDA发生的区域2106中,以折点为中心,执行LPD模式所对应的LPD_SEQUENCE2101、2102、2103与FD模式所对应的窗口序列2104的重叠相加,从而可清除(cancellation)混淆。
图22是示出根据本发明的一个实施例,关于情况4的窗口序列的处理方法的示图(第2例)。
参照图22,当前帧所对应的STOP_1024_SEQUENCE的左侧窗口,根据上一个帧的LPD_SEQUENCE的lpd_mode进行变形。例如,当上一个帧的LPD_SEQUENCE的lpd_mode={3,3,3,3}时,当前帧所对应的STOP_1024_SEQUENCE的左侧窗口被变形至线2207。此外,当上一个帧的LPD_SEQUENCE的lpd_mode={2,2,2,2}时,当前帧所对应的STOP_1024_SEQUENCE的左侧窗口被变形至线2208。此外,当上一个帧LPD_SEQUENCE的lpd_mode={1,1,1,1}时,当前帧所对应的STOP_1024_SEQUENCE的左侧窗口被变形至线2209。线2210表示图21的STOP_1024_SEQUENCE的左侧窗口。
之后,对应变形的STOP_1024_SEQUENCE的左侧窗口,LPD_SEQUENCE的右侧窗口也变形。即,当STOP_1024_SEQUENCE的左侧窗口变形至线2207时,LPD_SEQUENCE的右侧窗口从线2201变形至线2202。此外,当STOP_1024_SEQUENCE的左侧窗口变形至线2208时,LPD_SEQUENCE的右侧窗口从线2203变形至线2204。此外当STOP_1024_SEQUENCE的左侧窗口变形至线2209时,LPD_SEQUENCE的右侧窗口从线2205变形至线2206。
这样的话,被变形的LPD_SEQUENCE和被变形的STOP_1024_LPD_SEQUENCE,可以折点为中心被重叠相加。
图23是示出本发明的一个实施例得关于情况4的窗口序列的处理方法的示图(第3例)。
在图23中,FD模式所对应的窗口序列为STOP_1024_SEQUENCE 2305。参考图23,LPD_SEQUENCE2301、2302、2303、2304的右侧窗口被变形为线2307、2308、2309、2310。这样的话,图1的模式转换-1,可在相当于256点的区域2306中,执行LPD_SEQUENCE2301、2302、2303、2304和STOP_1024_SEQUENCE2305间的重叠相加。此外,与LPD_SEQUENCE2304相同,当最后子帧的lpd_mode=0时,LPD_SEQUENCE 2304的最后子帧可被变更为lpd_mode=1。
如图23所见,LPD_SEQUENCE 2301、2302、2303、2304和STOP_1024_SEQUENCE2305以折点为中心被重叠相加。此外,用于处理FD模式所对应的STOP_1024_SEQUENCE2305的块尺寸,不是2304而是2048。
依据图22和图23,与LPD_SEQUENCE相连接的FD模式的窗口序列,块尺寸可被变更地可执行2048-MDCT。因此,与图20相同,与LPD_SEQUENCE相连接的FD模式的窗口序列没有必要执行2048-MDCT。也就是说,根据本发明的一个实施例,即使从LPD模式变更为FD模式,也不像图3中所示的“STOP_1152_SEQUENCE”和“STOP_START_WINDOW_1152”一样需要块尺寸为2304的FD模式的窗口序列。因此,模式转换时,不要求块尺寸不同的窗口序列,可提高编码效率。
因此,关于情况4,根据本发明的一个实施例的窗口序列处理方法如下:
1、FD模式的窗口序列和LPD模式的窗口序列(LPD_SEQUENCE)可以MDCT折点(MDCT folding point)为中心被重叠相加。
2、与LPD_SEQUENCE相连接的FD模式的窗口序列可根据LPD_SEQUENCE的最后窗口的lpd_mode被变形。
3、关于与LPD_SEQUENCE相连接的FD模式的窗口序列的块尺寸,即MDCT transform尺寸,都为2048,因此不要求像2304那样的块。
根据本发明的一个实施例,解码器,可同样地将在编码器中应用的窗口序列重叠相加,获得清除了混淆的输出信号。
图24是示出根据本发明的一个实施例的反映图22的窗口序列的STOP_1024_SEQUENCE的示图。
参照图24,上一个帧的ACC模式的窗口序列的左侧窗口,根据LPD模式各自变形至线2401、2402、2403。线2404表示ACC模式的窗口序列2105的情况。
根据本发明的一个实施例,因为MDCT系数为1024,图24的窗口序列被定义为‘STOP_1024_SEQUENCE'。相反,图3的RM中定义的窗口序列,由于块尺寸为2304(MDCT系数为1152),因此图3的窗口序列被定义为‘STOP_1152_SEQUENCE'。
图25是示出根据本发明的一个实施例的图16及图24的窗口序列被应用的结果的示图。
参照图25,根据本发明的一个实施例,LPD_START_SEQUENCE、LPD_SEQUENCE和STOP_1024_SEQUENCE被示出。即,图25中被示出的窗口序列,表示在从模式开关-1转换至FD MODE->LPD MODE->FD MODE模式时,被处理的窗口序列的意思。
参照图25,LPD_START_SEQUENCE的右侧窗口和STOP_1024_SEQUENCE的左侧窗口,根据LPD_SEQUENCE被变形。此外,根据LPD_SEQUENCE对LPD_START_SEQUENCE和STOP_1024_SEQUENCE各自重叠相加的区域的间隔不同。
图26是示出根据本发明的一个实施例从ACELP变换至FD时窗口形态的示图。
上一个帧所对应的LPD_SEQUENCE的lpd_mode={x,x,x,0}时,即,上一个帧的结束子帧为ACELP时,与图26相同,LPD_SEQUENCE的结束子帧的窗口从线2601变形至2602。这样的话,图26中所示出的上一个帧所对应的LPD_SEQUENCE与当前帧的窗口序列,在重叠相加后被交叉折叠(crossfolding)。在此,lpd_mode={x,x,x,0}的窗口序列只可被解码器处理。因为,此时ACELP信号为没有TDA的时域(time-domain)信号。
图27是示出根据本发明的一个实施例,根据当前帧的LPD模式与下一个帧的LPD模式的窗口序列和LPC提取位置的示图。
根据下一个帧的LPD_SEQUENCE2702、2703、2704的lpd_mode,当前帧的LPD_SEQUENCE的右侧窗口被变形。图27中,当前帧的LPD_SEQUENCE的lpd_mode为{3,3,3,3}。
如图27中所见,下一个帧中连接了lpd_mode为{3,3,3,3}的LPD_SEQUENCE2704时,当前帧中LPD_SEQUENCE的右侧窗口被变形为线2703。此外,当下一个帧中lpd_mode为{2,2,2,2}的LPD_SEQUENCE 2705被连接时,当前帧中LPD_SEQUENCE的右侧窗口被变形为线2702。此外,下一个帧中连接了lpd_mode为{1,1,1,1}的LPD_SEQUENCE 2705时,当前帧中LPD_SEQUENCE的右侧窗口被变形为线2701。
即,根据本发明的一个实施例,从LPD模式变更至LPD模式时,当前帧的LPD_SEQUENCE可根据下一个帧的LPD_SEQUENCE的lpd_mode被变形。这样的话,当前帧中被变形的LPD_SEQUENCE可与下一个帧的LPD_SEQUENCE重叠相加。
图27中,线性预测系数LPC(Linear Prediction Coefficient)以256点的子帧为单位被提取出。根据本发明的一个实施例,窗口序列之间的被重叠相加的折点位于子帧的边界。这样的话,LPC将折点设定为开始点,来以256点的子帧为单位被提取出。有关当前帧的LPD_SEQUENCE的LPC的提取位置,涉及子帧2707、2708、2709、2710。即,根据本发明的一个实施例,LPC可以以折点为开始点,与子帧的边界匹配提取。LPC(n)2707和LPC(n+3)2710,可以除了有关子帧以外,连在整个子帧中剩余的区域中都可提取LPC。
图28是现有的LPC提取位置和根据本发明的一个实施例的LPC提取位置相比较的示图。
图28(a)表示现有的LPC提取位置,图28(b)表示根据本发明的实施例的LPC提取位置。依据图28(a),LPC与折点无关,在距离子帧的边界64点远的位置的LPC提取位置2803、2804、2805、2806中被提取出。此外,参照图28(a),可知窗口之间被重叠相加的区域为128点。
依据图28(b),LPC以位于子帧的边界的折点为开始点,在子帧所对应的LPC提取位置2803、2804、2805、2806中被提取出。此外,参照28(b),可知窗口之间被重叠相加的区域为256点。因此,依据本发明,不要求用于提取LPC的追加的相当于64点的信息。
图29是示出LPD模式中lpd_mode={1,0,1,1}时根据本发明的实施例的窗口序列的示图。
参照图29,第一个子帧中为ACELP模式时,第一个子帧所对应的窗口2901与第二个子帧所对应的窗口2902互相不重叠。但是,窗口2902的右侧,可根据第三个子帧所对应的窗口2903的lpd_mode来决定。
此外,当在最后一个子帧之后出现的窗口的lpd_mode为ACELP(lpd_mode=0)时,窗口2904将在图3的RM中所定义的窗口应用。相反,当在最后一个子帧之后出现的窗口的lpd_mode不为ACELP模式(lpd_mode=0)时,窗口2904的右侧可被变形来重叠256。
图30是示出LPD模式中lpd_mode={1,0,2,2}时,根据本发明的一个实施例的窗口序列的示图。
lpd_mode=0的ACELP在上一个帧或下一个帧中发生时,lpd_mode=1、lpd_mode=2或lpd_mode=3的当前帧所对应的窗口3002的连接部分的形态与图1相同。
此外,当上一个子帧所对应的窗口3001的lpd_mode=0(ACELP)且下一个子帧的lpd_mode=1、lpd_mode=2或lpd_mode=3时,当前子帧所对应的窗口3002的右侧可根据下一个子帧的lpd_mode被变形。此外,窗口3002的左侧成为直角形态,与上一个子帧所对应的窗口3001不重叠。
图31是示出当前帧的lpd_mode={3,3,3,3}且上一个帧的lpd_mode={x,x,x,0}时,根据本发明的一个实施例的窗口的序列的示图。
图31与图29及图30相同,示出上一个帧所对应对窗口3102的lpd_mode=0时,当前帧所对应的窗口3101的形态。在此,当前帧所对应的窗口3101的lpd_mode={3,3,3,3}。窗口3101的右侧,可根据关于下一个桢的窗口的lpd_mode被变形。图31中,TCX1024表示当下一个帧所对应的窗口的lpd_mode=3的情况,且TCX512表示下一个帧所对应的窗口的lpd_mode=2的情况。此外,ACELP表示下一个帧所对应的窗口的lpd_mode=0的情况。
图32是示出根据本发明的一个实施例,当前子帧的(a)lpd_mode=1(TCX256)、(b)lpd_mode=2(TCX512)或(c)lpd_mode=3(TCX1024)时,根据上一个子帧及下一个子帧的lpd_mode=0(ACELP)的窗口序列的示图。
参考图32(a),当当前帧的lpd_mode=1(TCX256)且下一个帧所对应的窗口为ACELP时,当前帧所对应的窗口的右侧为线3203。如果,上一个帧的lpd_mode=1且下一个帧所对应的窗口为lpd_mode=1时,当前子帧所对应的窗口的左侧为线3202,右侧为线3201。但是,上一个帧的lpd_mode=0(ACELP)时,当前帧所对应的窗口表示图29的窗口2902的形态。
在这种情况下,如图29中所见,下一个窗口lpd_mode=1时,窗口2902的右侧被处理为实线,下一个窗口lpd_mode=0时,窗口2902的右侧可被处理为虚线。
参考图32(b),当前帧的lpd_mode=2(TCX512)且下一个帧所对应的窗口为ACELP时,当前帧所对应的窗口的右侧为线3204。如果,上一个帧的lpd_mode=1时,当前帧所对应的窗口的左侧为线3207。此外,下一个帧的lpd_mode=1时,当前帧所对应的窗口的右侧为线3205。
如果,上一个帧的lpd_mode=2时,当前帧所对应的窗口的左侧为线3208。此外,下一个帧的lpd_mode=2时,当前帧所对应的窗口的右侧为线3206。
但是,上一个帧的lpd_mode=0(ACELP)时,当前帧所对应的窗口表示图30的窗口3002的形态。在这种情况下,如图30中所见,可知窗口3002的右侧根据下一个窗口的lpd_mode被变更形态。
此外,当前帧的lpd_mode为1或2时,下一个帧的lpd_mode比当前帧的lpd_mode大的话,当前帧所对应的窗口变形以匹配下一个帧的lpd_mode。
例如,当前帧的lpd_mode为1且下一个帧的lpd_mode为ACELP时,图32中,当前帧所对应的窗口的右侧为线3201。此外,当前帧的lpd_mode为2且下一个帧的lpd_mode为3时,图32中,当前帧所对应的窗口的右侧为线3204。
参考图32(c),当前帧的lpd_mode=3(TCX 1024)且下一个帧所对应的窗口为ACELP时,当前帧所对应的窗口的右侧为线3209。如果,上一个帧的lpd_mode=1时,当前帧所对应的窗口的左侧为线3213。此外,下一个帧的lpd_mode=1时,当前帧所对应的窗口的右侧为线3210。
如果,上一个帧的lpd_mode=2时,当前帧所对应的窗口的左侧为线3214。此外,下一个帧的lpd_mode=2时,当前帧所对应的窗口的右侧为线3211。
如果,上一个帧的lpd_mode=3时,当前帧所对应的窗口的左侧为线3215。此外,下一个帧的lpd_mode=3时,当前帧所对应的窗口的右侧为线3212。
如果,上一个帧的lpd_mode=0(ACELP)时,当前帧所对应的窗口表示图31的窗口3101的形态。在这种情况下,如图31中所见,可知窗口3101的右侧根据下一个帧的lpd_mode变更形态。
总而言之,图32中所示的当前帧所对应对的窗口,以中心线为基准,左侧可根据上一个帧的lpd_mode被变更,且右侧可根据下一个帧的lpd_mode被变更。
图33是示出当前子帧的lpd_mode为1(TCX256)且上一个子帧的lpd_mode为0时,根据本发明的一个实施例的窗口序列的示图。
依据图33,即使ACELP模式显示出当前帧的上一个帧和下一个帧,关于当前帧的窗口也可只是形状不一样。例如,当前帧的lpd_mode=1(TCX256)且上一个帧为ACELP模式时,当前帧所对应的窗口3301的左侧可为直角形态。此外,当前帧所对应的窗口3301的右侧可根据下一个帧的lpd_modeTCX256、TCX512、TCX1024被变形。
图34是示出当前子帧的lpd_mode为2(TCX512)且上一个子帧的lpd_mode为0时,根据本发明的一个实施例的窗口序列的示图。
依据图34,即使ACELP模式显示出当前帧的上一个帧和下一个帧,关于当前帧的窗口也可只是形状不一样。例如,当前帧的lpd_mode=2(TCX512)且上一个帧为ACELP模式时,当前帧所对应的窗口3401的左侧可为直角形态。此外,当前帧所对应的窗口3401的右侧可根据下一个帧的lpd_mode TCX512、TCX1024被变形。
图35是示出当前子帧的lpd_mode为3(TCX1024)且上一个子帧的lpd_mode为0时,根据本发明的一个实施例的窗口序列的示图。
依据图35,即使ACELP模式显示出当前帧的上一个帧和下一个帧,关于当前帧的窗口也可只是形状不一样。例如,当前帧的lpd_mode=3(TCX1024)且上一个帧为ACELP模式时,当前帧所对应的窗口3501的左侧可为直角形态。此外,当前帧所对应的窗口3501的右侧可根据下一个帧的lpd_mode TCX 256、TCX512、TCX1024被变形。
图36是示出将图33至图35的窗口序列结合的结果的示图。
图36(a)表示当前帧的lpd_mode为1的情况,图36(b)表示当前帧的lpd_mode为2的情况,图36(c)表示当前帧的lpd_mode为3的情况。在这种情况下,图36是示出当前帧所对应的窗口的左侧根据上一个帧的lpd_mode被决定的情况和当前帧所对应的窗口的右侧根据下一个帧的lpd_mode被决定的情况的示图。
图37是示出根据本发明的一个实施例的模式转换时窗口序列的示图。
图1的模式开关-1,可根据输入信号的帧,(a)在FD与FD之间,(b)从LPD至FD;(c)从FD至LPD将模式转换。此外,图2的模式开关-2,可根据输入信号的子帧进行LPD模式和LPD模式之间的模式转换。在这种情况下,LPD模式为0时,LPD模式是ACELP,且LPD模式不为0时,LPD模式是wLPT或TCX。
图37示出当模式开关-1和模式开关-2中发生模式转换时,块转换-1和块转换-2中处理的窗口序列。根据图37,可知折点位于子帧的边界位置,桢的大小为1024。图37的情况,本简要整理本发明的原理,窗口间被重叠相加的区域的间隔,只表述128点。
图38是示出根据本发明的一个实施例,图3的LPD_START_SEQUENCE及STOP_1152_SEQUENCE被变形的结果的示图。
图38(a)作为图3的LPD_START_SEQUENCE被变形的形态,MDCT转换尺寸为1024。38(a)中,LPD_START_SEQUENCE与图16相同,根据下一个出现的LPD_SEQUENCE的lpd_mode,LPD_START_SEQUENCE的右侧变形至线3802、3803、3804。线3801表示与LPD_SEQUENCE重叠相加的区域的间隔为128点,其与图37的FD至wLPT(或TCX)的情况的窗口序列相同。
图38(b)作为图3中的STOP_1024_SEQUENCE被变形的形态,MDCT转换尺寸为1024。作为参考,图3中,MDCT的大小为1152,由此窗口序列也被定义为‘STOP_1152_SEQUENCE’。图38(b)中,STOP_1024_SEQUENCE与图24相同,根据下一个出现的LPD_SEQUENCE的lpd_mode,LPD_START_SEQUENCE的右侧变形至线3805、3806、3807。线3808表示与LPD_SEQUENCE重叠相加的区域的间隔为128点,其与图37的wLPT(或TCX)至FD的情况的窗口序列相同。
图39是示出根据现有的方法模式转换时窗口序列的示图。
与图37相比较时,从FD模式转换至LPD模式时,由于相当于64点的时域重叠(time-domain overlap-add),整体上帧的准线(alignment)错位了。此外,在wLPC(TCX)至FD的转换时,FD模式的窗口尺寸(window size)为2304(译码系数为1152),可确认出,其比本发明中建议的窗口尺寸2048(译码系数为1024)要低相当于64点的译码效率。
以上所述的本发明整理如下:
本发明涉及一种在具备不同的编码/解码模式的语音/音频统合编码/解码器中,处理帧或子帧所对应的窗口形态及其连接形态的窗口序列的方法。根据本发明的一个实施例,可期待如下所示的译码增益。
<FD→LPD>
(1)现有的方法
FD子帧与LPD子帧的连接方法,使用64点时域重叠(64 point time domain overlap),因此需要64点的备用信息。
(2)本发明的方法
FD帧与LPD帧的连接方法,以折点为基准,以相同的窗口形态的补充(complement)形态来进行重叠相加。因此,可比起现有的方法在模式转换时获64点的译码增益。
<LPD→FD>
(1)现有的方法
FD帧与LPD帧的连接方法,使用在LPD帧中将不发生TDA的区间人为地使之发生TDA,与128点FD TDA区域相重叠的方法。此外,匹配FD→LPD中损失的64点数据率,使用STOP_1152_Window。即,MDCT转换尺寸为2304。这种MDCT不是第二命令,不容易创建。
(2)本发明的方法
是将在LPD帧中发生的TDA区域与FD的TDA区域连接重叠的方法。
FD帧的窗口可被命名为STOP_1024_window,MDCT转换尺寸为2048。即,可减小转换尺寸,匹配为第2命令尺寸(2th order size)。其与现有的方法相比,可减少译码的复杂度,还可减少被定为目标(targeting)的译码系数(coding coefficient)的个数,提高译码效率(1152→1024)。
如上所示,本发明虽然已参照有限的实施例和附图进行了说明,但是是是本发明并不局限于所述实施例,在本发明所属领域中具备通常知识的人均可以从此记载中进行各种修改和变形。因此,本发明的范围不受说明的实施例的局限或定义,而是由后附的权利要求范围以及权利要求范围等同内容定义。

Claims (10)

1.一种语音/音频统合编码器USAC,包括:
模式转换单元,其对输入信号的帧,从频域FD模式转换至线性预测域LPD模式;和
编码单元,其将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来编码。
2.如权利要求1所述的语音/音频统合编码器,其中,所述编码单元,当所述LPD模式的窗口序列中开始子帧的LPD模式为0时,将与所述开始子帧相对应的窗口替换为LPD模式对应1的窗口。
3.如权利要求1所述的语音/音频统合编码器,其中,所述编码单元,将所述LPD模式的窗口序列转移,使其能以折点为基准与所述FD模式的窗口序列重叠相加,其中,所述LPD模式的窗口序列和所述FD模式的窗口序列形态如下图所示。
4.如权利要求1所述的语音/音频统合编码器,其中,所述编码单元,根据所述LPD模式的窗口序列将所述FD模式的窗口序列的形态变形,其中,所述FD模式的窗口序列和所述LPD模式的窗口序列形态如下图所示。
5.如权利要求1所述的语音/音频统合编码器,其中,所述编码单元,以位于构成输入信号的帧的子帧的边界的折点为基准,在窗口序列之间执行重叠相加,且将所述折点设定为出发点,根据子帧单位来提取出线性预测系数LPC。
6.一种语音/音频统合编码器,包括:
模式转换单元,其对输入信号的帧,从LPD模式转换至FD模式;和
编码单元,其将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来编码。
7.如权利要求6所述的语音/音频统合编码器,其中,所述编码单元,根据LPD模式将FD模式的窗口序列的形态变形,其中,所述LPD模式的窗口序列和所述FD模式的窗口序列形态如下图所示。
8.如权利要求6所述的语音/音频统合编码器,其中,所述编码单元,将LPD模式的窗口序列和FD模式的窗口序列重叠256点,且当所述LPD模式的窗口序列中结束子帧的LPD模块为0时,所述结束子帧所对应的窗口被替换为与LPD模块对应1的窗口,其中,所述LPD模式的窗口序列和所述FD模式的窗口序列形态如下图所示。
9.一种语音/音频统合解码器,其包括:
模式转换单元,其对输入信号的帧,从FD模式转换至LPD模式;和
解码单元,其将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来解码。
10.一种语音/音频统合解码器,包括:
模式转换单元,其对输入信号的帧,从LPD模式转换至FD模式;和
解码单元,其将所述FD模式的窗口序列与所述LPD模式的窗口序列以折点为基准重叠相加来解码。
CN201410524905.9A 2008-11-26 2009-11-26 基于模式转换来处理窗口序列的语音/音频统合编解码器 Active CN104282313B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
KR20080118230 2008-11-26
KR10-2008-0118230 2008-11-26
KR20080133007 2008-12-24
KR10-2008-0133007 2008-12-24
KR20090004243 2009-01-19
KR10-2009-0004243 2009-01-19
KR10-2009-0008590 2009-02-03
KR20090008590 2009-02-03
KR1020090114783A KR101315617B1 (ko) 2008-11-26 2009-11-25 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
KR10-2009-0114783 2009-11-25
CN200980155342.8A CN102388607B (zh) 2008-11-26 2009-11-26 基于模式转换来处理窗口序列的语音/音频统合编解码器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980155342.8A Division CN102388607B (zh) 2008-11-26 2009-11-26 基于模式转换来处理窗口序列的语音/音频统合编解码器

Publications (2)

Publication Number Publication Date
CN104282313A true CN104282313A (zh) 2015-01-14
CN104282313B CN104282313B (zh) 2018-09-21

Family

ID=42360949

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410524905.9A Active CN104282313B (zh) 2008-11-26 2009-11-26 基于模式转换来处理窗口序列的语音/音频统合编解码器
CN200980155342.8A Active CN102388607B (zh) 2008-11-26 2009-11-26 基于模式转换来处理窗口序列的语音/音频统合编解码器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200980155342.8A Active CN102388607B (zh) 2008-11-26 2009-11-26 基于模式转换来处理窗口序列的语音/音频统合编解码器

Country Status (5)

Country Link
US (1) US8954321B1 (zh)
EP (2) EP3151241A1 (zh)
KR (2) KR101315617B1 (zh)
CN (2) CN104282313B (zh)
WO (1) WO2010062123A2 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2657393T3 (es) 2008-07-11 2018-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y descodificador de audio para codificar y descodificar muestras de audio
EP3002751A1 (en) * 2008-07-11 2016-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
EP3373297B1 (en) * 2008-09-18 2023-12-06 Electronics and Telecommunications Research Institute Decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder
US9384748B2 (en) * 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP3474279A1 (en) 2009-07-27 2019-04-24 Unified Sound Systems, Inc. Methods and apparatus for processing an audio signal
WO2011034377A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
ES2710554T3 (es) * 2010-07-08 2019-04-25 Fraunhofer Ges Forschung Codificador que utiliza cancelación del efecto de solapamiento hacia delante
KR20120038358A (ko) * 2010-10-06 2012-04-23 한국전자통신연구원 통합 음성/오디오 부호화/복호화 장치 및 방법
MY159444A (en) * 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
ES2458436T3 (es) 2011-02-14 2014-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Representación de señal de información utilizando transformada superpuesta
RU2630390C2 (ru) 2011-02-14 2017-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
EP2676264B1 (en) 2011-02-14 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder estimating background noise during active phases
EP2676267B1 (en) 2011-02-14 2017-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
TWI480860B (zh) 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術
CN110047498B (zh) 2013-02-20 2023-10-31 弗劳恩霍夫应用研究促进协会 用于对音频信号进行译码的译码器和方法
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
CN107452391B (zh) * 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060195314A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Optimized fidelity and reduced signaling in multi-channel audio encoding
CN101025918A (zh) * 2007-01-19 2007-08-29 清华大学 一种语音/音乐双模编解码无缝切换方法
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CN101231850A (zh) * 2007-01-23 2008-07-30 华为技术有限公司 编解码方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351338A (en) * 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding
US5664053A (en) * 1995-04-03 1997-09-02 Universite De Sherbrooke Predictive split-matrix quantization of spectral parameters for efficient coding of speech
RU2325046C2 (ru) 2002-07-16 2008-05-20 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US7325023B2 (en) 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
CN103923510A (zh) * 2006-08-11 2014-07-16 鲍吉肥料公司 磷酸铝或多聚磷酸铝颗粒的制备
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060195314A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Optimized fidelity and reduced signaling in multi-channel audio encoding
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CN101025918A (zh) * 2007-01-19 2007-08-29 清华大学 一种语音/音乐双模编解码无缝切换方法
CN101231850A (zh) * 2007-01-23 2008-07-30 华为技术有限公司 编解码方法及装置

Also Published As

Publication number Publication date
CN102388607B (zh) 2014-11-05
US8954321B1 (en) 2015-02-10
CN102388607A (zh) 2012-03-21
WO2010062123A2 (ko) 2010-06-03
WO2010062123A3 (ko) 2013-02-28
EP2373014A4 (en) 2013-12-11
KR20100059726A (ko) 2010-06-04
KR20130054976A (ko) 2013-05-27
EP2373014A2 (en) 2011-10-05
KR101315617B1 (ko) 2013-10-08
KR101478438B1 (ko) 2014-12-31
EP3151241A1 (en) 2017-04-05
CN104282313B (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
CN102388607B (zh) 基于模式转换来处理窗口序列的语音/音频统合编解码器
JP5551814B2 (ja) 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
JP6067601B2 (ja) 音声/音楽統合信号の符号化/復号化装置
US11922962B2 (en) Unified speech/audio codec (USAC) processing windows sequence based mode switching
CN101231850B (zh) 编解码方法及装置
KR20230148130A (ko) Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101137652B1 (ko) 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
EP2469510B1 (en) Method for restoring multi-channel audio signal using HE-AAC decoder and MPEG surround decoder
CN105378835A (zh) 使用依赖瞬态位置的重叠对音频信号编码或译码的设备及方法
CN104919524B (zh) 用于确定编码模式的方法和设备、用于对音频信号进行编码的方法和设备以及用于对音频信号进行解码的方法和设备
CN106663442A (zh) 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序
CN105280189B (zh) 带宽扩展编码和解码中高频生成的方法和装置
JP6654236B2 (ja) オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法
KR102629566B1 (ko) 통합 음성/오디오 부호화/복호화 장치 및 방법
EP3002751A1 (en) Audio encoder and decoder for encoding and decoding audio samples
KR101380003B1 (ko) Mdct 프레임과 이종의 프레임 연결을 위한 윈도우 처리 방법 및 장치, 이를 이용한 부호화/복호화 장치 및 방법
KR20090043352A (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant