CN109716431A - 样本串变形装置、信号编码装置、信号解码装置、样本串变形方法、信号编码方法、信号解码方法以及程序 - Google Patents

样本串变形装置、信号编码装置、信号解码装置、样本串变形方法、信号编码方法、信号解码方法以及程序 Download PDF

Info

Publication number
CN109716431A
CN109716431A CN201780056241.XA CN201780056241A CN109716431A CN 109716431 A CN109716431 A CN 109716431A CN 201780056241 A CN201780056241 A CN 201780056241A CN 109716431 A CN109716431 A CN 109716431A
Authority
CN
China
Prior art keywords
signal
sample
frequency
unit
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780056241.XA
Other languages
English (en)
Other versions
CN109716431B (zh
Inventor
杉浦亮介
守谷健弘
原田登
川西隆仁
镰本优
古角康一
中岛淳一
中山丈二
野口贤一
长谷川馨亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN109716431A publication Critical patent/CN109716431A/zh
Application granted granted Critical
Publication of CN109716431B publication Critical patent/CN109716431B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提高声音信号的编码处理以及解码处理的性能。代表值计算单元(110)对于每个规定时间区间,从与输入音响信号对应的频域信号的样本串计算该频率区间的代表值,对于比该频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值。信号压伸单元(120)对于每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值相应的权重、和与频域样本串中的该代表值对应的各样本相乘后的频域样本串,作为加权频域信号的样本串。

Description

样本串变形装置、信号编码装置、信号解码装置、样本串变形 方法、信号编码方法、信号解码方法以及程序
技术领域
本发明涉及在声音信号的编码技术等信号处理技术中,将来自于声音信号的样本串根据其近旁的样本值变形为压缩或者伸长后的样本串的技术。
背景技术
一般的,如图1所示,在不可逆压缩编码中,在量化单元17量化了输入信号后,可逆编码单元18根据量化信号通过熵编码等可逆编码提供码,复用单元19将与量化信号对应的码和与量化幅度对应的码组合后输出。如图2所示,在解码时,复用分离单元21取出信号码和与量化幅度对应的码,可逆解码单元22将信号码可逆解码后,逆量化单元2将解码后的量化信号逆量化而得到原来的信号。
特别是,已知在语音或音乐等声音信号的不可逆压缩编码中,如图3所示,图1的量化处理之前增加基于分析单元15的信号的分析和基于滤波器单元16的滤波处理,通过与信号匹配而赋予适于听觉特性的权重,在听觉上减小在量化中产生的误差的方法(参照非专利文献1)。在该以往方法中,除了与量化信号对应的码和与量化中使用的量化幅度对应的编码,与滤波中使用的滤波器系数对应的码也作为辅助信息发送到解码装置,如图4所示,作为图2的逆量化处理的后处理,解码装置的逆滤波器单元24通过将解码后的加权信号施加到逆滤波器得到原来的信号。
【现有技术文献】
【非专利文献】
【非专利文献1】Gerald D.T.Schuller,Bin Yu,Dawei Huang,and Bernd Edler,“Perceptual Audio Coding Using Adaptive Pre-and Post-Filters and LosslessCompression,”IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING,VOL.10,NO.6,SEPTEMBER 2002.
发明内容
发明要解决的课题
在非专利文献1中记载的以往技术中,与图1~2所示那样的单纯的不可逆压缩编码相比,需要的信息量增加相当于滤波器系数的部分。但是,听觉性的加权,只要满足以下两个性质即可,不需要严密的信息的情况较多。1.在帧内,信号的值或者信号的频谱的值对于较大的值施加相对较小的权重,对于较小的值施加相对较大的权重。2.在帧内,在信号或者信号的频谱的峰值近旁施加相对较小的权重,以与峰值相同。
本发明的目的是,同时具有所述两个性质,并且,通过不需要用于后处理的辅助信息的前处理以及后处理将样本串变形,从而提高声音信号的编码处理以及解码处理的听觉品质。
用于解决课题的手段
为了解决所述课题,本发明的第一方式的样本串变形装置,得到用于输入到对将与输入音响信号对应的频域信号变形而得到的加权频域信号进行编码的编码装置的加权频域信号,或者与加权时域信号对应的加权频域信号,其中所述加权时域信号用于输入到编码将与输入音响信号对应的频域信号变形而得到的加权频域信号所对应的加权时域信号的编码装置,所述样本串变形装置包括:代表值计算单元,对每个规定时间区间,从与输入音响信号对应的频域信号的样本串计算该频率区间的代表值,对比该频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值;以及信号压伸单元,对于每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值相应的权重、和与频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为加权频域信号的样本串。
本发明的第二方式的样本串变形装置,从解码装置得到的加权频域信号、或者解码装置得到的与加权时域信号对应的加权频域信号,得到与解码音响信号对应的频域信号,样本串变形装置包括:压伸代表值计算单元,对每个规定时间区间,从加权频域信号的样本串计算该频率区间的代表值,对于比该加权频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值;以及信号逆压伸单元,对于每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值相应的权重、和与加权频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为与解码音响信号对应的频域信号的样本串。
本发明的第三方式的样本串变形装置,得到用于输入到编码将输入音响信号变形而得到的加权音响信号的编码装置的加权音响信号,或者,与加权频域信号对应的加权音响信号,其中加权频域信号用于输入到编码与将输入音响信号变形而得到的加权音响信号对应的加权频域信号的编码装置,样本串变形装置包括:代表值计算单元,对于每个规定时间区间,从时域的输入音响信号的样本串计算该时间区间的代表值,对于比该输入音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值;以及信号压伸单元,对于每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值相应的权重、和与输入音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为加权音响信号的样本串。
本发明的第四方式的样本串变形装置,从解码装置得到的时域的加权音响信号,或者解码装置得到的与频域的加权音响信号对应的时域的加权音响信号,得到解码音响信号,压伸代表值计算单元,对于每个规定时间区间,从时域的加权音响信号的样本串计算该时间区间的代表值,对于比该加权音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值;以及信号逆压伸单元,对每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值相应的权重、和与加权音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为解码音响信号的样本串。
发明效果
按照本发明,通过同时具有听觉性的加权所需要的两个性质,并且,通过不需要用于后处理的辅助信息的前处理以及后处理将样本串变形,能够提高声音信号的编码处理以及解码处理的听觉品质。
附图说明
图1是例示以往的编码装置的功能结构的图。
图2是例示以往的解码装置的功能结构的图。
图3是例示以往的编码装置的功能结构的图。
图4是例示以往的解码装置的功能结构的图。
图5是例示第一实施方式以及第二实施方式的编码装置的功能结构的图。
图6是例示第一实施方式以及第二实施方式的解码装置的功能结构的图。
图7是例示第一实施方式的信号前处理单元的功能结构的图。
图8是例示第一实施方式的信号后处理单元的功能结构的图。
图9是例示第一实施方式的准瞬时压伸单元的功能结构的图。
图10是例示第一实施方式的准瞬时逆压伸单元的功能结构的图。
图11是例示实施方式的编码方法的处理步骤的图。
图12是例示准瞬时压伸前的音响信号的图。
图13是例示准瞬时压伸前的样本区间的图。
图14是例示准瞬时压伸后的样本区间的图。
图15是例示准瞬时压伸后的加权信号的图。
图16是例示实施方式的解码方法的处理步骤的图。
图17是例示准瞬时逆压伸前的解码加权信号的图。
图18是例示准瞬时逆压伸前的样本区间的图。
图19是例示准瞬时逆压伸后的样本区间的图。
图20是例示准瞬时逆压伸后的输出信号的图。
图21是例示第二实施方式的信号前处理单元的功能结构的图。
图22是例示第二实施方式的信号后处理单元的功能结构的图。
图23是例示第二实施方式的准瞬时压伸单元的功能结构的图。
图24是例示第二实施方式的准瞬时逆压伸单元的功能结构的图。
图25是例示第三实施方式以及第四实施方式的编码装置的功能结构的图。
图26是例示第三实施方式以及第四实施方式的解码装置的功能结构的图。
图27是例示第三实施方式的信号前处理单元的功能结构的图。
图28是例示第三实施方式的信号后处理单元的功能结构的图。
图29是例示第四实施方式的信号前处理单元的功能结构的图。
图30是例示第四实施方式的信号后处理单元的功能结构的图。
图31是例示第五实施方式的准瞬时压伸前后的频谱的图。
图32是例示第六实施方式的准瞬时压伸单元的功能结构的图。
图33是例示第六实施方式的准瞬时逆压伸单元的功能结构的图。
图34是例示第六实施方式的准瞬时压伸前后的频谱的图。
图35是例示第七实施方式的样本串变形装置的功能结构的图。
图36是例示第七实施方式的样本串变形装置的功能结构的图。
图37是例示第八实施方式的编码装置的功能结构的图。
图38是例示第八实施方式的解码装置的功能结构的图。
图39是例示第八实施方式的编码方法的处理步骤的图。
图40是例示第八实施方式的解码方法的处理步骤的图。
图41是例示第九实施方式的编码装置的功能结构的图。
图42是例示第九实施方式的编码方法的处理步骤的图。
图43是例示第九实施方式的变形例的编码装置的功能结构的图。
图44是例示第九实施方式的变形例的编码方法的处理步骤的图。
图45是例示第九实施方式的解码装置的功能结构的图。
图46是例示第九实施方式的解码方法的处理步骤的图。
图47是例示第十实施方式的信号编码装置的功能结构的图。
图48是例示第十实施方式的信号解码装置的功能结构的图。
图49是用于说明听觉品质提高的构造的图。
具体实施方式
以下,详细地说明本发明的实施方式。而且,对附图中具有相同的功能的结构单元附加相同的标号,省略重复说明。
在文中使用的记号“~”“^”“-”等,虽然是本来应记载在紧后边的字符的正上方的记号,但是由于文本记法的限制,记述在该字符的紧前方。在数式中,这些记号记载在本来的位置,即字符的正上方。
<第一实施方式>
本发明的第一实施方式,由编码装置1以及解码装置2构成。编码装置1将以帧为单位输入的语音或音乐等声音信号(音响信号)编码后得到码并输出。编码装置1输出的码被输入到解码装置2。解码装置2将输入的码解码而输出帧单位的音响信号。
如图5所示,第一实施方式的编码装置1包括:信号前处理单元10、量化单元17、可逆编码单元18、以及复用单元19。即,是对于图1所示的以往的编码装置91追加了信号前处理单元10的装置。如图6所示,第一实施方式的解码装置2包括:复用分离单元21、可逆解码单元22、逆量化单元23、以及信号后处理单元25。即,是对图2所示的以往的解码装置92追加了信号后处理单元25的装置。
编码装置1以及解码装置2是,例如在具有中央运算处理装置(CentralProcessing Unit,CPU)、主存储装置(Random Access Memory,RAM)等的公知或者专用的计算机中读入特别的程序而构成的特别的装置。编码装置1以及解码装置2例如在中央运算处理装置的控制下执行各处理。输入到编码装置1以及解码装置2的数据或在各处理中得到的数据例如被存储在主存储装置中,主存储装置中存储的数据根据需要被读出,利用于其它的处理。而且,编码装置1以及解码装置2的各处理单元的至少一部分也可以通过集成电路等硬件构成。
编码装置1的信号前处理单元10以及解码装置2的信号后处理单元25进行“准瞬时压伸”的处理。所谓准瞬时压伸是指,将规定区间内的样本值归并在一起,根据该代表值将这些样本值压缩或者伸长的变换。如图7所示,信号前处理单元10包含准瞬时压伸单元100。如图8所示,信号后处理单元25包含准瞬时逆压伸单元250。如图9所示,准瞬时压伸单元100包含代表值计算单元110以及信号压伸单元120。如图10所示,准瞬时逆压伸单元250包含压伸代表值计算单元260以及信号逆压伸单元270。
编码装置1使用不需要辅助信息的准瞬时压伸作为前处理,对输入信号适应地加权而得到加权信号,对该加权信号进行与以往技术同样的量化以及可逆编码。解码装置2将码作为输入,进行与以往技术同样的可逆解码以及逆量化,使用不需要辅助信息的准瞬时压伸作为后处理,对加权信号施加与编码装置1的准瞬时压伸相反的加权。第一实施方式的编码装置1以及解码装置2通过这些处理,在听觉上降低量化失真。
《编码装置1》
参照图11,说明第一实施方式的编码装置1执行的编码方法的处理步骤。
在步骤S11中,语音和音乐等时域的音响信号Xk(k=0,…,N-1,N(>0)是规定的帧内的样本数,k是帧内的样本号)以帧为单位输入到编码装置1。输入到编码装置1的音响信号Xk被输入到信号前处理单元10。
[信号前处理单元10]
信号前处理单元10对每帧接受被输入到编码装置1的音响信号Xk(k=0,…,N-1),进行准瞬时压伸单元100中的处理,将加权信号Yk(k=0,…,N-1)输出到量化单元17。
[准瞬时压伸单元100]
准瞬时压伸单元100对每帧接受被输入到编码装置1的音响信号Xk(k=0,…,N-1),进行代表值计算单元110以及信号压伸单元120中的处理,将加权信号Yk(k=0,…,N-1)输出到量化单元17。
[代表值计算单元110]
在步骤S12中,代表值计算单元110对每帧接受被输入到准瞬时压伸单元100的音响信号Xk(k=0,…,N-1),对基于规定的M(≦N)样本的每个区间计算代表值Xm(m=1,…,N/M),输出到信号压伸单元120。作为代表值Xm,使用在解码装置2中也能够估计的特征量。
例如,将绝对值平均
或者,二次方平均的平方根
或者,p次方平均的p次根(p>0)
或者,绝对值的最大值
或者,绝对值的最小值
等中的预先确定的一个特征量作为代表值计算、输出。
为了削减运算量,代表值的计算可以使用基于M样本的区间内的一部分的M'(<M)样本,例如以下那样进行。
其中,M'是代表值计算中使用的样本数,Gm是预先决定的代表值计算中使用的样本的编号。
[信号压伸单元120]
在步骤S13中,信号压伸单元120对每帧接受代表值计算单元110输出的代表值Xm(m=1,…,N/M)、和从准瞬时压伸单元100输入的每帧的音响信号Xk(k=0,…,N-1),如以下那样生成加权信号Yk(k=0,…,N-1),输出到量化单元17。
首先,使用预先确定的压伸函数f(x)变换代表值Xm。压伸函数f(x)是能够定义逆函数f-1(y)的任意的函数。作为压伸函数f(x),例如可以使用以下所示的一般化对数函数等。
其中,γ以及μ是规定的正数。
接着,使用基于压伸函数f(x)的变换后的代表值f(Xm)以及原来的代表值Xm,对基于M样本的每个区间,将音响信号的样本值Xk如以下那样变形为加权信号Yk
这里,示出首先使用压伸函数f(x)变换代表值Xm,通过将与该函数值对应的权重f(Xm)/Xm和样本值Xk相乘而变形为加权信号Yk的、二级的运算的例子。但是,本发明不限于这样的计算方法,只要是得到加权信号Yk的运算则进行任何计算方法都可以。例如可以进行一级地进行式(9)的运算的计算。
能够定义逆函数的压伸函数不限于式(7)那样对于单独的样本值的运算,例如既可以是以多个样本作为参数,输出对于各样本的运算结果的函数,也可以是包含进一步进行对于可定义逆函数的函数能够进行逆运算的运算的运算而定义作为压伸函数。例如,既可以将式(9)中的
捕捉为压伸函数,或者例如也可以将式(9)中的
捕捉为压伸函数。
准瞬时压伸对于每个区间来看,以仅依赖于代表值的单纯的常数倍来表现。由此,只要使用在代表值计算单元110的说明中举出的特征量,即使是解码装置2也可以从加权信号Yk估计代表值Xm,能够无辅助信息地进行逆压伸。
[量化单元17]
在步骤S14中,量化单元17接受信号前处理单元10输出的每帧的加权信号Yk(k=0,…,N-1),将加权信号Yk标量化以适于目标的码长度,输出量化信号。量化单元17例如与以往技术同样地,将加权信号Yk除以与量化幅度对应的值,得到整数值作为量化信号。量化单元17分别将量化信号输出到可逆编码单元18,将量化中使用的量化幅度输出到复用单元19。量化幅度例如可以使用规定的幅度,也可以以可逆编码单元18的压缩结果的码长度为基础,在码长度相对于目标的码长度过长的情况下加大量化幅度,在码长度相对于目标的码长度过短的情况下减小量化幅度来探索。量化单元17可以对与信号前处理单元10相同的样本数N的每帧进行操作,也可以对与信号前处理单元10不同的每样本数,例如每样本数2N,进行操作。
[可逆编码单元18]
在步骤S15中,可逆编码单元18接受量化单元17输出的量化信号,通过可逆编码分配与量化信号对应的码,输出信号码。可逆编码单元18将信号码输出到复用单元19。可逆编码既可以使用例如一般的熵编码,也可以使用MPEG-ALS(参照参考文献1)或G.711.0(参照参考文献2)那样已知的可逆编码方式。可逆编码单元18既可以对与信号前处理单元10相同的样本数N的每帧进行操作,也可以对与信号前处理单元10不同的每样本数,例如每样本数2N,进行操作。
〔参考文献1〕T.Liebechen,T.Moriya,N.Harada,Y.Kamamoto,and Y.A.Reznik,“The MPEG-4 Audio Lossless Coding(ALS)standard-technology and applications,”in Proc.AES 119th Convention,Paper#6589,Oct.,2005.
〔参考文献2〕ITU-T G.711.0,“Lossless compression of G.711 pulse codemodulation,”2009.
[复用单元19]
在步骤S16中,复用单元19接受量化单元17输出的量化幅度和可逆编码单元18输出的信号码,将与量化幅度对应的的码即量化幅度码和信号码合并作为输出码输出。量化幅度码通过编码量化幅度的值而得到。作为编码量化幅度的值的方法,使用公知的编码方法即可。复用单元19可以对与信号前处理单元10相同的样本数N的每帧进行操作,也可以对与信号前处理单元10不同的每样本数,例如每样本数2N,进行操作。
图12~15示出通过第一实施方式的编码方法的前处理,将输入的音响信号变形的过程的具体例子。图12是时域的音响信号Xk的信号波形。横轴表示时间,纵轴表示振幅。图12的例子中示出从0秒至2秒的音响信号Xk。图13是为了计算代表值,在以图12中的虚线区分的位置截出的基于M样本的区间的音响信号的信号波形。从图13中表示的1.28秒~1.36秒的区间中包含的M样本计算代表值。图14是根据压伸函数的代表值的函数值而加权后的基于M样本的区间的加权信号的信号波形。与图13比较可知,振幅的值被变换而波形的形状不变。图15是最终从信号前处理单元输出的加权信号Yk的信号波形。与图12比较可知,作为整体被压伸。
《解码装置2》
参照图16,说明第一实施方式的解码装置2执行的解码方法的处理步骤。
[复用分离单元21]
在步骤S21中,复用分离单元21接受输入到解码装置2的编码,分别将信号码输出到可逆解码单元22,将与量化幅度码对应的量化幅度输出到逆量化单元23。与量化幅度码对应的量化幅度通过将量化幅度码解码得到。作为将量化幅度码解码的方法,使用与编码量化幅度的公知的编码方法对应的解码方法即可。信号后处理单元25如以下说明的那样对样本数N的每帧进行操作,但是复用分离单元21既可以对与信号后处理单元25相同的样本数N的每帧进行操作,也可以对与信号后处理单元25不同的每样本数,例如每样本数2N,进行操作。
[可逆解码单元22]
在步骤S22中,可逆解码单元22接受复用分离单元21输出的信号码,进行与可逆编码单元18的处理对应的可逆解码,将与信号码对应的信号作为解码量化信号输出到逆量化单元23。可逆解码单元22可以对与信号后处理单元25相同的样本数N的每帧进行操作,也可以对与信号后处理单元25不同的每样本数,例如每样本数2N,进行操作。
[逆量化单元23]
在步骤S23中,逆量化单元23接受可逆解码单元22输出的解码量化信号和复用分离单元21输出的量化幅度,例如与以往技术同样,将与量化幅度对应的值和解码量化信号的各样本值对每个样本相乘,得到逆量化的信号。逆量化单元23将逆量化的信号作为样本数N的每帧的解码加权信号^Yk(k=0,…,N-1)输出到信号后处理单元25。逆量化单元23既可以对与信号后处理单元25相同的样本数N的每帧进行操作,也可以对与信号后处理单元25不同的每样本数,例如每样本数2N,进行操作。
[信号后处理单元25]
信号后处理单元25对每帧,接受逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1),进行准瞬时逆压伸单元250中的处理,将输出信号^Xk(k=0,…,N-1)输出。
[准瞬时逆压伸单元250]
准瞬时逆压伸单元250对每帧,接受从逆量化单元23输入的解码加权信号^Yk(k=0,…,N-1),进行压伸代表值计算单元260以及信号逆压伸单元270中的处理,将输出信号^Xk(k=0,…,N-1)输出。
[压伸代表值计算单元260]
在步骤S24中,压伸代表值计算单元260对每帧,接受逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1),与对应于解码装置2的编码装置1的代表值计算单元110同样,对基于M样本的每区间计算代表值Ym(m=1,…,N/M),作为压伸代表值Ym输出到信号逆压伸单元270。压伸代表值Ym的计算方法使用与对应于解码装置2的编码装置1的代表值计算单元110相同的方法。
例如,若为绝对值平均,则设为
在以所述的代表值计算单元110中列举的特征量计算代表值的情况下,在此(压伸代表值计算单元260)计算的压伸代表值,与在没有编码装置1中的量化造成的失真的情况下将由编码装置1的代表值计算单元110算出的代表值通过压伸函数进行变换而得到的值相等,即使假设存在编码装置1中的量化失真,也与将编码装置1的代表值计算单元110中算出的代表值通过压伸函数进行变换而得到的值为大致相同的值。因此,通过在后级的信号逆压伸单元270使用压伸函数的逆函数将压伸代表值逆变换,可以估计原来的代表值,可以在没有辅助信息的情况下进行逆压伸。
[信号逆压伸单元270]
在步骤S25中,信号逆压伸单元270对每帧,接受压伸代表值计算单元260输出的压伸代表值Ym(m=1,…,N/M)、和逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1),如以下那样生成输出信号^Xk(k=0,…,N-1),并输出。
首先,使用预先确定的压伸函数f(x)的逆函数f-1(y)变换压伸代表值Ym。例如,若在对应的编码装置1的信号压伸单元120中使用了一般对数函数作为压伸函数f(x),则逆函数f-1(y)使用以下的函数。
接着,使用基于逆函数f-1(y)的变换后的压伸代表值f-1(Ym)以及原来的压伸代表值Ym,对基于M样本的每区间,将解码加权信号的样本值^Yk如以下那样变形为输出信号^Xk
这里,示出了进行最初使用逆函数f-1(y)变换压伸代表值Ym,通过将与该函数值对应的权重f-1(Ym)/Ym和样本值^Yk相乘而变形为输出信号^Xk的二级的运算的例子。但是,本发明不限于这样的计算方法,也可以与信号压伸单元120同样,进行任意的计算方法。例如也可以进行以一级来进行式(15)的运算那样的计算。
在图17~20中,示出通过第一实施方式的解码方法的后处理,将解码加权信号变形的过程的具体例子。图17是解码加权信号^Yk的信号波形。横轴表示时间,纵轴表示振幅。在图17的例子中,表示从0秒至2秒的解码加权信号^Yk。图18是为了计算压伸代表值,在以图17中的虚线区分的位置截出的基于M样本的区间的解码加权信号的信号波形。从图18中表示的1.28秒~1.36秒的区间中包含的M样本计算压伸代表值。图19是根据压伸函数的逆函数的压伸代表值的函数值进行了加权后的基于M样本的区间的输出信号的信号波形。与图18比较可知,振幅的值被变换而波形的形状不变。图20是最终从信号后处理单元输出的输出信号^Xk的信号波形。与图17比较可知,作为整体被逆压伸。
<第二实施方式>
第一实施方式的信号前处理单元10以及信号后处理单元25在时域的信号中进行了准瞬时压伸的处理,但是在频域中进行基于准瞬时压伸的信号的加权也可以降低听觉上的量化失真。在第二实施方式的编码装置3以及解码装置4中,在频域进行信号前处理单元以及信号后处理单元的处理。
如图5所示,第二实施方式的编码装置3包含:信号前处理单元11、量化单元17、可逆编码单元18、以及复用单元19。即,与第一实施方式的编码装置1比较,信号前处理单元的处理不同。第二实施方式的解码装置4包含:复用分离单元21、可逆解码单元22、逆量化单元23、以及信号后处理单元26。即,与第一实施方式的解码装置2比较,信号后处理单元的处理不同。
如图21所示,信号前处理单元11包含:频率变换单元130、准瞬时压伸单元101、以及频率逆变换单元140。如图22所示,信号后处理单元26包含:频率变换单元280、准瞬时逆压伸单元251、以及频率逆变换单元290。如图23所示,准瞬时压伸单元101包含代表值计算单元111以及信号压伸单元121。如图24所示,准瞬时逆压伸单元251包含压伸代表值计算单元261以及信号逆压伸单元271。准瞬时压伸单元101以及准瞬时逆压伸单元251在输入输出为频谱这一点,为与第一实施方式的准瞬时压伸单元100以及准瞬时逆压伸单元250不同的点。
《编码装置3》
语音或音乐等时域的音响信号xn(n=0,…,N-1,N(>0)是规定的帧内的样本数,n是帧内的样本号)以帧为单位输入到编码装置3。输入到编码装置3的音响信号xn被输入到信号前处理单元11。
[信号前处理单元11]
信号前处理单元11对每帧接受输入到编码装置3的音响信号xn(n=0,…,N-1),进行频率变换单元130、准瞬时压伸单元101、以及频率逆变换单元140中的处理,将加权信号yn(n=0,…,N-1)输出到量化单元17。
[频率变换单元130]
频率变换单元130对每帧接受被输入到信号前处理单元11的音响信号xn(n=0,…,N-1),例如以下那样实施离散余弦变换而变换为频谱Xk(k=0,…,N-1),将该频谱Xk输出到准瞬时压伸单元101。
其中,xn(n=0,…,N-1)表示音响信号的样本值,Xk(k=0,…,N-1)表示频谱的样本值。
[准瞬时压伸单元101]
准瞬时压伸单元101对每帧接受频率变换单元130输出的频谱Xk(k=0,…,N-1),进行代表值计算单元111以及信号压伸单元121中的处理,将加权频谱Yk(k=0,…,N-1)输出到频率逆变换单元140。代表值计算单元111以及信号压伸单元121的处理使用频谱Xk(k=0,…,N-1),取代第一实施方式的音响信号Xk(k=0,…,N-1),得到加权频谱Yk(k=0,…,N-1),取代第一实施方式的加权信号Yk(k=0,…,N-1),此外与第一实施方式的代表值计算单元110以及信号压伸单元120相同。
[频率逆变换单元140]
频率逆变换单元140对每帧接受准瞬时压伸单元101输出的加权频谱Yk(k=0,…,N-1),例如以下那样实施逆离散余弦变换而变换为加权信号yn(n=0,…,N-1),将该加权信号yn输出到量化单元17。
其中,yn(n=0,…,N-1)表示加权信号的样本值。
第二实施方式的加权信号yn(n=0,…,N-1)是记述与第一实施方式的加权信号Yk(k=0,…,N-1)不同,但是与第一实施方式同样为时域的加权信号。因此,第二实施方式的量化单元17以后进行与第一实施方式相同的操作,所以省略说明。
《解码装置4》
[信号后处理单元26]
信号后处理单元26对每帧接受逆量化单元23输出的解码加权信号^yn(n=0,…,N-1),进行频率变换单元280、准瞬时逆压伸单元251、以及频率逆变换单元290中的处理,将输出信号^xn(n=0,…,N-1)输出。虽然记述不同,但是第二实施方式的解码加权信号^yn(n=0,…,N-1)与第一实施方式的解码加权信号^Yk(k=0,…,N-1)同样,是逆量化单元23输出的时域的解码加权信号。
[频率变换单元280]
频率变换单元280对每帧接受从逆量化单元23输入的解码加权信号^yn(n=0,…,N-1),与频率变换单元130同样处理,变换为解码加权频谱^Yk(k=0,…,N-1),将该解码加权频谱^Yk输出到准瞬时逆压伸单元251。
[准瞬时逆压伸单元251]
准瞬时逆压伸单元251对每帧接受频率变换单元280输出的解码加权频谱^Yk(k=0,…,N-1),进行压伸代表值计算单元261以及信号逆压伸单元271中的处理,将解码频谱^Xk(k=0,…,N-1)输出到频率逆变换单元290。压伸代表值计算单元261以及信号逆压伸单元271的处理使用解码加权频谱^Yk(k=0,…,N-1),取代第一实施方式的解码加权信号^Yk(k=0,…,N-1),得到解码频谱^Xk(k=0,…,N-1)取代第一实施方式的输出信号^Xk(k=0,…,N-1),除此之外与第一实施方式的压伸代表值计算单元260以及信号逆压伸单元270相同。
[频率逆变换单元290]
频率逆变换单元290对每帧接受准瞬时逆压伸单元251输出的解码频谱^Xk(k=0,…,N-1),与频率逆变换单元140同样处理,变换为输出信号^xn(n=0,…,N-1),将该输出信号^xn输出。
<第三实施方式>
第二实施方式的信号前处理单元11以及信号后处理单元26在频域进行了准瞬时压伸后,返回时域进行了编码以及解码的处理。在第三实施方式中,不返回时域而仍在频域进行编码以及解码的处理。
如图25所示,第三实施方式的编码装置5包括:信号前处理单元12、量化单元17、可逆编码单元18、以及复用单元19。即,与第二实施方式的编码装置3比较,信号前处理单元的处理不同。如图26所示,第三实施方式的解码装置6包括:复用分离单元21、可逆解码单元22、逆量化单元23以及信号后处理单元27。即,与第二实施方式的解码装置4比较,信号后处理单元的处理不同。
如图27所示,信号前处理单元12包括频率变换单元130以及准瞬时压伸单元101。即,与第二实施方式的信号前处理单元11比较,在不包含频率逆变换单元140,输出加权频谱这一点有所不同。如图28所示,信号后处理单元27包含准瞬时逆压伸单元251以及频率逆变换单元290。即,与第二实施方式的信号后处理单元26比较,在不包含频率变换单元280,输入解码加权频谱这一点有所不同。量化单元17、可逆编码单元18、可逆解码单元22以及逆量化单元23进行与第二实施方式的量化单元17、可逆编码单元18、可逆解码单元22以及逆量化单元23同样的处理,但是在取代时域的信号而处理频谱这一点与第二实施方式不同。
《编码装置5》
[信号前处理单元12]
信号前处理单元12对每帧接受被输入到编码装置5的音响信号xn(n=0,…,N-1),进行频率变换单元130以及准瞬时压伸单元101中的处理,将加权频谱Yk(k=0,…,N-1)输出到量化单元17。频率变换单元130以及准瞬时压伸单元101的处理与所述的第二实施方式相同。
第三实施方式的加权频谱Yk(k=0,…,N-1)是频域的信号,第二实施方式的加权信号Yk(k=0,…,N-1)是时域的信号,但是在量化单元17以后,信号无论是时域还是频域都进行同样的操作,所以省略说明。
《解码装置6》
[可逆解码单元22]
可逆解码单元22接受复用分离单元21输出的信号码,进行与可逆编码单元18的处理对应的可逆解码,将与信号码对应的频谱作为解码量化频谱输出到逆量化单元23。
[逆量化单元23]
逆量化单元23接受可逆解码单元22输出的解码量化频谱和复用分离单元21输出的量化幅度,例如与以往技术同样,对于每个样本将与量化幅度对应的值和解码量化频谱的各样本值相乘,得到逆量化的信号。逆量化单元23将逆量化的信号作为样本数N的每帧的解码加权频谱^Yk(k=0,…,N-1)输出到信号后处理单元27。
[信号后处理单元27]
信号后处理单元27对每帧接受逆量化单元23输出的解码加权频谱^Yk(k=0,…,N-1),进行准瞬时逆压伸单元251以及频率逆变换单元290中的处理,将输出信号^xn(n=0,…,N-1)输出。准瞬时逆压伸单元251以及频率逆变换单元290的处理与所述的第二实施方式相同。
<第四实施方式>
第一实施方式的信号前处理单元10以及信号后处理单元25在时域的信号中进行了准瞬时压伸的处理后,仍在时域进行了编码以及解码的处理。在第四实施方式中,在时域的信号中进行了准瞬时压伸的处理后,变换为频域进行编码以及解码的处理。
如图25所示,第四实施方式的编码装置7包括:信号前处理单元13、量化单元17、可逆编码单元18、以及复用单元19。即,与第一实施方式的编码装置1比较,信号前处理单元的处理不同。如图26所示,第四实施方式的解码装置8包括:复用分离单元21、可逆解码单元22、逆量化单元23、以及信号后处理单元28。即,与第一实施方式的解码装置2比较,信号后处理单元的处理不同。
如图29所示,信号前处理单元13包括准瞬时压伸单元100以及频率变换单元130。即,与第一实施方式的信号前处理单元10比较,在将频率变换单元130连接到准瞬时压伸单元100的后级,输出加权频谱这一点有所不同。如图30所示,信号后处理单元28包括频率逆变换单元290以及准瞬时逆压伸单元250。即,与第一实施方式的信号后处理单元25比较,在将频率逆变换单元290连接到准瞬时逆压伸单元250的前级,输入解码加权频谱这一点有所不同。量化单元17、可逆编码单元18、可逆解码单元22以及逆量化单元23进行与第一实施方式的量化单元17、可逆编码单元18、可逆解码单元22以及逆量化单元23同样的处理,但是在取代时域的信号而处理频谱这一点与第一实施方式不同。
《编码装置7》
语音或音乐等时域的音响信号xn(n=0,…,N-1,N(>0)是规定的帧内的样本数,n是帧内的样本号)以帧为单位输入到编码装置7。输入到编码装置7的音响信号xn被输入到信号前处理单元13。
[信号前处理单元13]
信号前处理单元13对每帧接受不输入到编码装置7的音响信号xn(n=0,…,N-1),进行准瞬时压伸单元100以及频率变换单元130中的处理,将加权频谱Yk(k=0,…,N-1)输出到量化单元17。
[准瞬时压伸单元100]
准瞬时压伸单元100对每帧接受被输入到编码装置7的音响信号xn(n=0,…,N-1),进行代表值计算单元110以及信号压伸单元120中的处理,将加权信号yn(n=0,…,N-1)输出到频率变换单元130。除了音响信号xn(n=0,…,N-1)在所述的第一实施方式中记述为音响信号Xk(k=0,…,N-1),加权信号yn(n=0,…,N-1)在所述的第一实施方式中记述为加权信号Yk(k=0,…,N-1)以外,准瞬时压伸单元100的处理与所述的第一实施方式相同。
[频率变换单元130]
频率变换单元130对每帧接受从准瞬时压伸单元100输入的加权信号yn(n=0,…,N-1),变换为频域的频谱,得到加权频谱Yk(k=0,…,N-1),输出到量化单元17。频率变换单元130的处理与所述的第二实施方式相同。
第四实施方式的加权频谱Yk(k=0,…,N-1)是频域的信号,第一实施方式的加权信号Yk(k=0,…,N-1)是时域的信号,但是在量化单元17以后,信号无论是时域还是频域都进行同样的操作,所以省略说明。
《解码装置8》
[可逆解码单元22]
可逆解码单元22接受复用分离单元21输出的信号码,进行与可逆编码单元18的处理对应的可逆解码,将与信号码对应的频谱作为解码量化频谱输出到逆量化单元23。
[逆量化单元23]
逆量化单元23接受可逆解码单元22输出的解码量化频谱和复用分离单元21输出的量化幅度,例如与以往技术同样,对每个样本将与量化幅度对应值和解码量化频谱的各样本值相乘,得到逆量化的信号。逆量化单元23将逆量化的信号作为解码加权频谱^Yk(k=0,…,N-1)输出到信号后处理单元28。
[信号后处理单元28]
信号后处理单元28对每帧接受逆量化单元23输出的解码加权频谱^Yk(k=0,…,N-1),进行频率逆变换单元290以及准瞬时逆压伸单元250中的处理,将输出信号^xn(n=0,…,N-1)输出。
[频率逆变换单元290]
频率逆变换单元290对每帧接受逆量化单元23输出的解码加权频谱^Yk(k=0,…,N-1),变换为时域的信号,得到解码加权信号^yn(n=0,…,N-1),输出到准瞬时逆压伸单元250。频率逆变换单元290的处理与所述的第二实施方式相同。
[准瞬时逆压伸单元250]
准瞬时逆压伸单元250对每帧接受被输入的解码加权信号^yn(n=0,…,N-1),进行压伸代表值计算单元260以及信号逆压伸单元270中的处理,将输出信号^xn(n=0,…,N-1)输出。准瞬时逆压伸单元250的处理除了解码加权信号^yn(n=0,…,N-1)在所述的第一实施方式中被记述为解码加权信号^Yk(k=0,…,N-1),输出信号^xn(n=0,…,N-1)在所述的第一实施方式中被记述为输出信号^Xk(k=0,…,N-1)以外,与所述的第一实施方式相同。
<从第一实施方式至第四实施方式的要点>
在第一实施方式中说明了在时域进行前处理以及后处理,在时域进行编码处理以及解码处理的结构。在第二实施方式中说明了在频域进行前处理以及后处理,在时域进行编码处理以及解码处理的结构。在第三实施方式中说明了在频域进行前处理以及后处理,在频域进行编码处理以及解码处理的结构。在第四实施方式中说明了在时域进行前处理以及后处理,在频域进行编码处理以及解码处理的结构。即,在本发明中,前处理以及后处理、和编码处理以及解码处理可以通过频域和时域的任意的组合来实施。换言之,本发明的前处理以及后处理对于频域的编码处理以及解码处理和时域的编码处理以及解码处理任意一个都能够适用。
<第五实施方式>
进行准瞬时压伸的处理的多个样本的区间只要是预先决定的长度则无论如何确定都可以不使用辅助信息而进行逆变换。但是,若考虑听觉品质,则可以更适当地确定进行准瞬时压伸的处理的多个样本的区间。
因为人类听觉以对数方式感知每个频率的振幅,从该观点来看,最好对每个样本进行单独加权。但是,峰值周边的频率被峰值的值影响而权重应变小,从该观点看,将多个样本统一加权较好。另一方面,已知人类的听觉的频率分辨率在低频率中较高,在高频率中较低。因此,在第五实施方式中,通过精细地设定低频率中的处理区间,粗略地设定高频率中的处理区间,在考虑了听觉品质的情况下实现更高效的加权。
《编码装置》
第五实施方式的编码装置如下那样将第二实施方式的编码装置3或者第三实施方式的编码装置5中代表值计算单元111以及信号压伸单元121的处理进行了变更。
[代表值计算单元111]
代表值计算单元111对每帧接受频率变换单元130输出的频谱Xk(k=0,…,N-1),将各帧的频谱Xk(k=0,…,N-1)分割为包含预先确定的个数的样本的L个区间(频率区间),对每个该区间计算代表值Xm(m=1,…,L),输出到信号压伸单元121。这时,各区间中包含的样本数可以任意地确定。例如,将K0,…,KL(0=K0<…<KL=N-1)设为表示帧内的样本的编号,将L个区间定义为[K0K1],[K1K2],…,[KL-1KL]那样。[Km-1Km]表示,将从帧内的第(Km-1+1)样本至第Km样本定义作为第m区间。这时,代表值Xm(m=1,…,L)例如使用绝对值平均,计算作为
在将L个区间各自中包含样本数设为Mm(m=1,…,L,其中M1≦M2≦…≦ML)时,例如通过定义[Km-1Km]使得成为M1<…<ML,可以越低频率越精细地设定处理区间,越高频率越粗略地设定处理区间。而且,在M1=M2=…=ML的情况下,成为与所述第一~第四实施方式相等的结构。
[信号压伸单元121]
信号压伸单元121对每帧接受代表值计算单元111输出的代表值Xm(m=1,…,L)和频率变换单元130输出的频谱Xk(k=0,…,N-1),如以下那样生成加权频谱Yk(k=0,…,N-1),输出到频率逆变换单元140。
使用通过压伸函数f(x)变换后的代表值f(Xm)以及原来的代表值Xm,对于包含预先确定的个数的样本的L个区间的每一个,如以下那样将频谱的样本值Xk变形为加权频谱Yk
《解码装置》
第五实施方式的解码装置是如以下那样变更第二实施方式的解码装置4中压伸代表值计算单元261以及信号逆压伸单元271的处理的装置。
[压伸代表值计算单元261]
压伸代表值计算单元261对每帧接受频率变换单元280输出的解码加权频谱^Yk(k=0,…,N-1),与代表值计算单元111同样,将各帧的解码加权频谱^Yk(k=0,…,N-1)分割为包含预先确定的个数的样本的L个区间(频率区间),对每一个该区间计算代表值Ym(m=1,…,L),作为压伸代表值Ym输出到信号逆压伸单元271。压伸代表值Ym的计算方法使用与代表值计算单元111相同的方法。
压伸代表值Ym(m=1,…,L)例如,若为绝对值平均,则作为
计算。
[信号逆压伸单元271]
信号逆压伸单元271对每帧接受压伸代表值计算单元261输出的压伸代表值Ym(m=1,…,M')和频率变换单元280输出的解码加权频谱^Yk(k=0,…,N-1),如以下那样生成解码频谱^Xk(k=0,…,N-1),输出到频率逆变换单元290。
使用压伸函数f(x)的逆函数f-1(y)进行变换后的压伸代表值f-1(Ym)以及原来的压伸代表值Ym,对规定的M样本的每个区间,将解码加权频谱的样本值^Yk如以下那样变形为解码频谱^Xk的样本值。
在图31中示出通过第五实施方式的编码方法的前处理,越是低频率进行越精细的区间划分,越是高频率进行越粗略的区间划分而进行了信号压伸时的频谱的具体例子。在图31的例子中,例如0~2000Hz的频带被划分为5个区间,例如在5000Hz~8000Hz的频带中全部被包含在1个区间中,可知设定处理区间,使得越是低频率变得越精细,越是高频率变得越粗略。
<第六实施方式>
对于在帧内频谱中没有起伏,均匀表示大的值的信号,在精细地区分区间而进行了准瞬时压伸的情况下,将帧内的频谱的值均匀地缩小,存在对量化的性能产生不良影响的情况。在第六实施方式中,作为其对策,分级地使用准瞬时压伸的处理。例如,首先在帧内的粗略的区间中进行准瞬时压伸,对于能量高的区间例如使用压伸函数的逆函数提高值。之后,在更细的区间中进行准瞬时压伸。在逆变换中,通过首先在精细的区间中进行准瞬时逆压伸,之后,在粗略的区间中准瞬时逆压伸,求出原来的频谱。
《编码装置》
第六实施方式的编码装置是如以下那样变更第二实施方式的编码装置3中准瞬时压伸单元101的处理的装置。但是,可适用第六实施方式的结构的不限于第二实施方式,可以对从第一实施方式至第五实施方式的全部实施方式适用。如图32所示,第六实施方式的准瞬时压伸单元102包括代表值计算单元112以及信号压伸单元122,信号压伸单元122的输出被输入到代表值计算单元112。
[准瞬时压伸单元102]
准瞬时压伸单元102对每帧接受频率变换单元130输出的频谱Xk(k=0,…,N-1),在将代表值计算单元112以及信号压伸单元122中的处理反复进行了规定的次数后,将加权频谱Yk(k=0,…,N-1)输出到频率逆变换单元140。
[代表值计算单元112]
代表值计算单元112对每帧接受成为处理对象的频谱~Xk(k=0,…,N-1),对M样本的每个区间计算代表值Xm(m=1,…,N/M),输出到信号压伸单元122。代表值计算单元112在第一次的执行时,接受被输入到准瞬时压伸单元102的频谱Xk(k=0,…,N-1)作为处理对象的频谱~Xk(k=0,…,N-1),在第二次以后的执行时,接受信号压伸单元122输出的加权频谱Yk(k=0,…,N-1)作为处理对象的频谱~Xk(k=0,…,N-1)。
代表值Xm(m=1,…,M),例如若为绝对值平均,则作为
计算。
代表值计算单元112求出代表值的区间的样本数M也可以构成为,在每次反复时使用每次都不同的样本数。例如,在第一次中如M=N/2那样使得处理区间变得粗略,在第二次中如M=N/8那样使得处理区间变得精细。
[信号压伸单元122]
信号压伸单元122对每帧接受代表值计算单元112输出的代表值Xm(m=1,…,N/M)和成为处理对象的频谱~Xk(k=0,…,N-1),如以下那样生成加权频谱Yk(k=0,…,N-1),输出到频率逆变换单元140。信号压伸单元122在第一次的执行时,接受被输入到准瞬时压伸单元102的频谱Xk(k=0,…,N-1)作为处理对象的频谱~Xk(k=0,…,N-1),第二次以后的执行时,保存前次的执行时输出的加权频谱Yk(k=0,…,N-1),利用作为处理对象的频谱~Xk(k=0,…,N-1)。
使用压伸函数f(x)进行的变换后的代表值f(Xm)以及原来的代表值Xm,对M样本的每个区间,将频谱的样本值~Xk如以下那样变形为加权频谱Yk
信号压伸单元122使用的压伸函数f(x)可以构成为,在每次反复时使用每次不同的函数。例如,在第一次使用压伸函数f(x)的逆函数f-1(x),在第二次使用压伸函数f(x)。
《解码装置》
第六实施方式的解码装置是如以下那样变更第二实施方式的解码装置4中准瞬时逆压伸单元251的处理的方式。但是,可适用第六实施方式的结构不限于第二实施方式,可以对从第一实施方式至第五实施方式的全部实施方式适用。如图33所示,第六实施方式的准瞬时逆压伸单元252包括压伸代表值计算单元262以及信号逆压伸单元272,信号逆压伸单元272的输出被输入到压伸代表值计算单元262。
[准瞬时逆压伸单元252]
准瞬时逆压伸单元252对每帧接受频率变换单元280输出的解码加权频谱^Yk(k=0,…,N-1),将压伸代表值计算单元262以及信号逆压伸单元272中的处理反复进行规定的次数,将解码频谱^Xk(k=0,…,N-1)输出到频率逆变换单元290。
[压伸代表值计算单元262]
压伸代表值计算单元262对每帧接受成为处理对象的频谱~Yk(k=0,…,N-1),与解码装置对应的编码装置的代表值计算单元112同样,对M样本每个区间计算代表值Ym(m=1,…,N/M),作为压伸代表值Ym输出到信号逆压伸单元272。压伸代表值Ym的计算方法使用与解码装置对应的编码装置的代表值计算单元112相同的方法。压伸代表值计算单元262在第一次的执行时,接受被输入到准瞬时逆压伸单元252的解码加权频谱^Yk(k=0,…,N-1)作为处理对象的频谱~Yk(k=0,…,N-1),在第二次以后的执行时,接受信号逆压伸单元272输出的解码频谱^Xk(k=0,…,N-1)作为处理对象的频谱~Yk(k=0,…,N-1)。
压伸代表值Ym(m=1,…,N/M)例如若为绝对值平均,则作为
计算。
压伸代表值计算单元262求压伸代表值的区间的样本数M,在每次反复时使用与对应于解码装置的编码装置的代表值计算单元112使用的样本数M对应的样本数。例如,在第一次如M=N/8那样使得处理区间变得精细,在第二次如M=N/2的那样使得处理区间变得粗略。
[信号逆压伸单元272]
信号逆压伸单元272对每帧接受压伸代表值计算单元262输出的压伸代表值Ym(m=1,…,N/M)和成为处理对象的频谱~Yk(k=0,…,N-1),如以下那样生成解码频谱^Xk(k=0,…,N-1),输出到频率逆变换单元290。信号逆压伸单元272在第一次的执行时,接受被输入到准瞬时逆压伸单元252的解码加权频谱^Yk(k=0,…,N-1)作为处理对象的频谱~Yk(k=0,…,N-1),在第二次以后的执行时,保存前次执行时输出的解码频谱^Xk(k=0,…,N-1),作为处理对象的频谱~Yk(k=0,…,N-1)进行利用。
使用通过压伸函数f(x)的逆函数f-1(y)变换的压伸代表值f-1(Ym)以及原来的压伸代表值Ym,对规定的M样本的每个区间将解码加权频谱的样本值^Yk如以下那样变形为解码频谱^Xk的样本值。
信号逆压伸单元272使用的压伸函数f(x)的逆函数f-1(y)在每次反复时使用与信号压伸单元122使用的压伸函数f(x)对应的逆函数。例如,在第一次作为对于压伸函数f(x)的逆函数f-1(x)的逆函数使用压伸函数f(x),第二次作为对于压伸函数f(x)的逆函数使用压伸函数f(x)的逆函数f-1(x)。
在图34中表示通过第六实施方式的编码方法的前处理,多次反复代表值计算和信号压伸的处理时的频谱的具体例子。在图34的例子中,在每次反复时使得各区间中包含的样本数M不同。具体地说,在第一次的处理中1帧被分为2个区间那样设定为M=N/2,在第二次的处理中1帧被分为8个区间那样设定为M=N/8。
<第七实施方式>
在所述的各实施方式中说明的编码装置1、7具有的准瞬时压伸单元100、编码装置3、5具有的准瞬时压伸单元101、解码装置2、8具有的准瞬时逆压伸单元250、以及解码装置4、6具有的准瞬时逆压伸单元251能够作为独立的样本串变形装置构成。
在将准瞬时压伸单元101设为独立的样本串变形装置的情况下,如以下那样构成。该样本串变形装置33是得到用于输入到对将与输入音响信号对应的频域信号变形而得到的加权频域信号进行编码的编码装置的加权频域信号,或者,将与输入音响信号对应的频域信号变形而得到加权频域信号时,对应于用于输入到对与该加权频域信号对应的加权时域信号码的编码装置的加权时域信号的加权频域信号的样本串变形装置,例如,如图35所示,包括代表值计算单元111和信号压伸单元121。代表值计算单元111对每个规定时间区间,从对应于输入音响信号的频域信号的样本串计算该频率区间的代表值,对于比该频域样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值。信号压伸单元121对于每个规定时间区间,得到将可定义逆函数的压伸函数的代表值的函数值所对应的权重与对应于频域样本串中的该代表值的各样本相乘后的频域样本串,作为加权频域信号的样本串。
在将准瞬时逆压伸单元251设为独立的样本串变形装置的情况下,如以下那样构成。该样本串变形装置34是从通过解码得到与对应于解码音响信号的频域信号对应的加权频域信号的解码装置所获得的加权频域信号、或者通过解码得到与对应于解码音响信号的频域信号对应的加权时域信号的解码装置获得的加权时域信号所对应的加权频域信号,得到与解码音响信号对应的频域信号的样本串变形装置,例如,如图36所示,包含压伸代表值计算单元261和信号逆压伸单元271。压伸代表值计算单元261对于每个规定时间区间,从加权频域信号的样本串计算该频率区间的代表值,对于比该加权频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值。信号逆压伸单元271对每个规定时间区间,得到与可定义逆函数的压伸函数的代表值的函数值对应的权重、和加权频域信号的样本串中与该代表值对应的各样本相乘后的频域样本串,作为与解码音响信号对应的频域信号的样本串。
在将准瞬时压伸单元100设为独立的样本串变形装置的情况下,如以下那样构成。该样本串变形装置31是得到:用于输入到编码将输入音响信号变形而得到的加权音响信号的编码装置的加权音响信号,或者,对应于用于输入到编码将输入音响信号变形而得到的加权音响信号所对应的加权频域信号的编码装置的加权频域信号的加权音响信号的样本串变形装置。例如,如图35所示,该样本串变形装置31包括代表值计算单元110和信号压伸单元120。代表值计算单元110对每个规定时间区间,从时域的输入音响信号的样本串计算该时间区间的代表值,对于比该输入音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值。信号压伸单元120对于每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值对应的权重、和与输入音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为加权音响信号的样本串。
在将准瞬时逆压伸单元250设为独立的样本串变形装置的情况下,如以下那样构成。该样本串变形装置32是,从通过解码得到与解码音响信号对应的时域的加权音响信号的解码装置所获得的时域的加权音响信号、或者,对应于通过解码得到与解码音响信号对应的频域的加权音响信号的解码装置所获得的频域的加权音响信号的时域的加权音响信号,得到解码音响信号的样本串变形装置,例如,如图36所示,包括压伸代表值计算单元260和信号逆压伸单元270。压伸代表值计算单元260对每个规定时间区间,从时域的加权音响信号的样本串计算该时间区间的代表值,对于比该加权音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值。信号逆压伸单元270对每个规定时间区间,得到将与可定义逆函数的压伸函数的代表值的函数值对应的权重、和与加权频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为与解码音响信号对应的频域信号的样本串。
样本串变形装置33、34可以作为样本串变形装置35构成,样本串变形装置35进行设定,使得基于多个样本的区间,越是与低频率对应的区间包含的样本数越少,越是与高频率对应的区间包含的样本数越多。
样本串变形装置31~35可以作为样本串变形装置36构成,样本串变形装置36将对输入音响信号的多个样本的每个区间计算代表值、和将对应于算出的代表值的函数值的权重与样本串的各样本相乘,反复执行规定的次数。
<第八实施方式>
若每帧的码长度的上限一定,则压缩效率依赖于输入的信号的每帧的统计的性质等而变动,出现量化幅度可以很小的帧,或不得不使用大的量化幅度的帧。其中,在压缩效率高且量化幅度可以很小的帧中,即使不进行前处理以及后处理量化误差在听觉上也足够小的情况较多。基于准瞬时压伸的前处理以及基于准瞬时逆压伸的后处理具有降低听觉上的失真的性质,而不是增大解码信号的波形的平方误差那样的数值的误差。因此,对于输入音响信号和与输入音响信号对应的频域信号的量化幅度小的帧,与要使用信号的前处理以及后处理来降低听觉上的失真相比,以不使用前处理以及后处理而降低单纯的解码信号的波形的数值的误差为目标,在再次压缩解码信号或者加工时很方便。
因此,在第八实施方式中,根据与输入音响信号或输入音响信号对应的频域信号的量化幅度的值对每帧选择是否进行准瞬时压伸以及基于准瞬时逆压伸的信号的前处理以及后处理。
而且,第八实施方式可以适用于第一实施方式、第二实施方式、第五实施方式、适用于这些实施方式的第六实施方式。
按照第八实施方式的编码装置以及解码装置,通过在编码装置中根据输入音响信号或与输入音响信号对应的频域信号的量化幅度的值选择有无信号的前处理,并且在解码装置中根据由解码得到的量化幅度选择有无后处理,可以仅对在编码装置中进行了前处理的帧,实施与编码装置进行的前处理对应的后处理。即,解码装置能够进行与编码装置进行的编码处理对应的解码处理。
《编码装置41》
作为第八实施方式的编码装置的一例,说明变更了第一实施方式的编码装置1的例子。如图37所示,第八实施方式的编码装置41包括:信号前处理单元51、量化单元52、可逆编码单元18、以及复用单元19。第八实施方式的编码装置41因为量化单元52进行的处理复杂,所以参照图39,说明第八实施方式的编码装置41执行的编码方法的处理步骤。
在步骤S11中,语音或音乐等时域的音响信号Xk(k=0,…,N-1)以帧为单位输入到编码装置41。输入到编码装置41的音响信号Xk首先被输入到量化单元52。
[量化单元52:步骤S51和S52]
在步骤S51中,量化单元52接受每帧的音响信号Xk(k=0,…,N-1),将音响信号Xk标量化以适合目标的码长度,得到量化信号。在步骤S51中,量化单元52例如与以往技术一样,将音响信号Xk除以与量化幅度对应的值,得到整数值作为量化信号。量化幅度例如根据可逆编码单元18的压缩结果的码长度进行探索,使得在码长度相对于目标的码长度过长的情况下增大量化幅度,在码长度相对于目标的码长度过短的情况下减小量化幅度。即,量化幅度是通过探索得到的值,是推测为最合适的值。
在步骤S52中,量化单元52对于在步骤S51中在量化中使用的量化幅度小于了规定的阈值、或者为规定的阈值以下的帧,分别将量化信号输出到可逆编码单元18,将量化中使用的量化幅度输出到复用单元19,对于除此以外的帧,将用于使该帧的信号前处理单元操作的信息输出到信号前处理单元51。
[信号前处理单元51]
信号前处理单元51限于在从量化单元52输入了用于使该帧的信号前处理单元操作的信息的情况,即,该帧的音响信号的量化幅度为规定的阈值以上或者超过规定的阈值的情况下,接受被输入到编码装置41的音响信号Xk,进行与第一实施方式的信号前处理单元11同样的处理,将每帧的加权信号Yk(k=0,…,N-1)输出到量化单元52。(步骤S12,S13)
[量化单元52:步骤S14]
在步骤S14中,对于信号前处理单元51输出了加权信号Yk(k=0,…,N-1)的帧,即,该帧的音响信号的量化幅度为规定的阈值以上或者超过了规定的阈值的帧,量化单元52接受信号前处理单元51输出的该帧的加权信号Yk(k=0,…,N-1),将加权信号Yk标量化,以适合目标的码长度,输出量化信号。在步骤S14中,量化单元52例如与以往技术一样,将加权信号Yk除以与量化幅度对应的值,得到整数值作为量化信号。量化幅度例如根据可逆编码单元18的压缩结果的码长度进行探索,使得码长度相对于目标的码长度过长的情况下增大量化幅度,码长度对于目标的码长度过短的情况下减小量化幅度。即,量化幅度是通过探索得到的值,是被推测为最合适的值。
通过步骤S14的探索求出的量化幅度,在大多数情况下,成为比通过步骤S51的探索求出的量化幅度大的值,并成为比步骤S52中的阈值大的值。而且,为了不使通过步骤S14的探索求出的量化幅度成为小于步骤S52中的阈值的值或者阈值以下的值,只要将通过步骤S14的探索求出的量化幅度的下限值设为步骤S52中的阈值以上的值或者大于阈值的值即可。
量化单元52分别将量化信号输出到可逆编码单元18,将量化中使用的量化幅度输出到复用单元19。
[可逆编码单元18,复用单元19]
可逆编码单元18进行的步骤S15、复用单元19进行的步骤S16与第一实施方式相同。
《解码装置42》
作为第八实施方式的解码装置的一例,说明变更了第一实施方式的解码装置2的例子。如图38所示,第八实施方式的解码装置42包括:复用分离单元61、可逆解码单元22、逆量化单元23、判定单元62、以及信号后处理单元63。以下,参照图40,说明第八实施方式的解码装置42执行的解码方法的处理步骤。
[复用分离单元61]
在步骤S21中,复用分离单元61接受被输入到解码装置42的码,分别将信号码输出到可逆解码单元22,将与量化幅度码对应的量化幅度输出到逆量化单元23以及判定单元62。通过解码得到量化幅度的处理与复用分离单元21相同。
[可逆解码单元22,逆量化单元23]
可逆解码单元22进行的步骤S22以及逆量化单元23进行的步骤S23与第一实施方式相同。
[判定单元62]
在步骤S61中,判定单元62对每帧接受逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1)以及复用分离单元61输出的量化幅度,对于量化幅度小于规定的阈值或者为规定的阈值以下的帧,将逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1)原样作为输出信号^Xk(k=0,…,N-1)输出,对于除此以外的帧,将用于使该帧的信号后处理单元操作的信息和逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1)输出到信号后处理单元63。
[信号后处理单元63]
信号后处理单元63在从判定单元62输入了用于使该帧的信号后处理单元操作的信息的情况,即,对于量化幅度超过规定的阈值或者为规定的阈值以上的帧,接受逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1),进行与第一实施方式的信号后处理单元25同样的处理,得到并输出输出信号^Xk(k=0,…,N-1)。(步骤S24,S25)
<第九实施方式>
在第一实施方式的编码装置中使用的式(7)中,指定准瞬时压伸的程度的参数γ,可以从指定对数的准瞬时压伸的γ=0向指定无准瞬时压伸的γ=1连续地调节。信号的前处理以及后处理存在在输入音响信号或与输入音响信号对应的频域信号的量化的精度越粗略的地方越需要,在量化的精度越精细的地方越不需要的倾向,所以通过对每帧使准瞬时压伸的程度适应性地变化,能够实施更切合信号的加权。
因此,第九实施方式的编码装置根据输入音响信号或与输入音响信号对应的频域信号的量化幅度的值对每帧选择信号的前处理中的准瞬时压伸的程度,将指定选择的准瞬时压伸的程度的系数发送到解码装置。第九实施方式的解码装置根据从编码装置发送的指定准瞬时压伸的程度的系数,对每帧选择信号的后处理中的准瞬时逆压伸的程度。通过这些处理,在解码装置中也可以根据指定准瞬时压伸的程度的系数,判断编码装置中信号的前处理中使用的准瞬时压伸的程度,实施与编码装置进行的前处理对应的后处理。即,解码装置能够进行与编码装置进行的编码处理对应的解码处理。以下,作为一例,说明将式(7)中的γ设为指定准瞬时压伸的程度的系数的例子。以下,也将指定准瞬时压伸的程度的系数即γ称为压伸系数。
而且,第九实施方式可以适用于从第一实施方式至第六实施方式的全部实施方式。
《编码装置43》
作为第九实施方式的编码装置的一例,说明变更了第一实施方式的编码装置1的例子。如图41所示,第九实施方式的编码装置43包括:量化幅度计算单元53、压伸系数选择单元54、信号前处理单元55、量化单元17、可逆编码单元18、以及复用单元56。以下,参照图42,说明第九实施方式的编码装置43执行的编码方法的处理步骤。
在步骤S11中,将语音或音乐等时域的音响信号Xk(k=0,…,N-1)以帧为单位输入到编码装置43。输入到编码装置43的音响信号Xk首先被输入到量化幅度计算单元53。
[量化幅度计算单元53]
在步骤S53中,量化幅度计算单元53接受每帧的音响信号Xk(k=0,…,N-1),得到用于将音响信号Xk标量化以适合目标的码长度的量化幅度。量化幅度计算单元53将得到的量化幅度输出到压伸系数选择单元54。
在步骤S53中,量化幅度计算单元53例如根据可逆编码的压缩结果的码长度探索量化幅度,使得在码长度相对于目标的码长度过长的情况下增大量化幅度,在码长度相对于目标的码长度过短的情况下减小量化幅度。即,量化幅度是通过探索得到的值,是推测为最合适的值。
而且,例如,在步骤S53中,量化幅度计算单元53也可以由每帧的音响信号Xk(k=0,…,N-1)的熵和目标码长度计算量化幅度的估计值,将算出的量化幅度的估计值作为量化幅度输出到压伸系数选择单元54。
[压伸系数选择单元54]
在步骤S54中,压伸系数选择单元54对每帧接受量化幅度计算单元53输出的量化幅度,从压伸系数选择单元54中预先存储的多个压伸系数γ的候选值中选择与量化幅度的值对应的一个候选值作为压伸系数γ。γ的选择例如通过在0≦γ≦1的范围中选择与量化幅度的值成反比例的值作为γ等,在量化幅度大的帧中选择接近γ=0的值,在量化幅度小的帧中选择接近γ=1的值。即,如下选择压伸函数,分别在音响信号的量化精度低的帧中,选择进一步压伸后的加权音响信号、或者与输入音响信号对应的加权频域信号的样本串的功率变得更平坦的压伸函数,在音响信号的量化精度高的帧中,选择压伸前后的输入音响信号和加权音响信号,或者与输入音响信号对应的频域信号的样本串和加权频域信号的样本串间的不同变得更小的压伸函数。压伸系数选择单元54将通过选择得到的压伸系数γ输出到信号前处理单元55以及复用单元56。
[信号前处理单元55]
信号前处理单元55对每帧接受被输入到编码装置43的音响信号Xk(k=0,…,N-1)和压伸系数选择单元54输出的压伸系数γ,对于音响信号Xk使用输入的压伸系数γ进行与第一实施方式的信号前处理单元11同样的处理,将每帧的加权信号Yk(k=0,…,N-1)输出到量化单元17。(步骤S12,S13)
[量化单元17,可逆编码单元18]
量化单元17进行的步骤S14、可逆编码单元18进行的步骤S15与第一实施方式相同。
[复用单元56]
在步骤S55中,复用单元56接受量化单元17输出的量化幅度、可逆编码单元18输出的信号码、压伸系数选择单元54输出的压伸系数,将与量化幅度对应的码即量化幅度码、与压伸系数对应的码即压伸系数码、和信号码合并作为输出码输出。量化幅度码通过将量化幅度的值编码而得到。作为将量化幅度的值编码的方法,使用公知的编码方法即可。压伸系数码通过将压伸系数的值编码而得到。作为将压伸系数的值编码的方法,使用公知的编码方法即可。复用单元56既可以对与信号前处理单元55相同的样本数N的每帧进行操作,也可以对与信号前处理单元55不同的每样本数,例如每样本数2N进行操作。
《编码装置43的变形例》
作为第九实施方式的编码装置43的变形例,说明取代量化幅度计算单元53而具有输入信号量化单元57的例子。如图43所示,第九实施方式的变形例的编码装置45包括:输入信号量化单元57、压伸系数选择单元54、信号前处理单元55、量化单元17、可逆编码单元18、以及复用单元56。以下,参照图44,说明第九实施方式的变形例的编码装置45执行的编码方法的处理步骤。
在步骤S11中,语音或音乐等时域的音响信号Xk(k=0,…,N-1)以帧为单位输入到编码装置45。输入到编码装置45的音响信号Xk首先不输入到输入信号量化单元57。
[输入信号量化单元57]
在步骤S57中,输入信号量化单元57接受每帧的音响信号Xk(k=0,…,N-1),得到用于将音响信号Xk标量化以适合目标的码长度的量化幅度、以量化幅度将音响信号Xk标量化的量化信号。在步骤S57中,输入信号量化单元57例如与以往技术一样,将音响信号Xk除以与量化幅度对应的值,得到整数值作为量化信号。得到量化幅度的方法与第九实施方式的编码装置43的量化幅度计算单元53相同。输入信号量化单元57将得到的量化幅度分别输出到压伸系数选择单元54以及复用单元56,将量化信号输出到可逆编码单元18。但是,其中量化幅度向复用单元56的输出和量化信号向可逆编码单元18的输出按照压伸系数选择单元54的控制进行。
[压伸系数选择单元54]
压伸系数选择单元54进行的步骤S54与第九实施方式的编码装置43相同。
压伸系数选择单元54在步骤S56中进行控制,使得在压伸系数γ不为1的情况下,将通过选择得到的压伸系数γ输出到信号前处理单元55,在压伸系数γ为1的情况下,将输入信号量化单元57得到的量化信号输入到可逆编码单元18,将输入信号量化单元57得到的量化幅度输入到复用单元56。而且,压伸系数选择单元54将压伸系数γ输出到复用单元56。
[信号前处理单元55]
在信号前处理单元55中,输入压伸系数选择单元54输出的压伸系数γ。信号前处理单元55仅在压伸系数γ不为1的情况,即指定无准瞬时压伸以外的情况下,对每帧接受被输入到编码装置4的音响信号Xk(k=0,…,N-1),对音响信号xn使用输入的压伸系数γ进行与第一实施方式的信号前处理单元11相同的处理,将每帧的加权信号Yk(k=0,…,N-1)输出到量化单元17。(步骤S12,S13)
[量化单元17]
量化单元17进行的步骤S14与第九实施方式的编码装置43相同。但是,步骤S14仅在压伸系数γ不为1的情况,即指定无准瞬时压伸以外的情况下进行。
[可逆编码单元18,复用单元56]
可逆编码单元18进行的步骤S15,复用单元56进行的步骤S55与第九实施方式的编码装置43相同。
《解码装置44》
作为第九实施方式的解码装置的一例,说明变更了第一实施方式的解码装置2的例子。如图45所示,第九实施方式的解码装置44包括:复用分离单元64、可逆解码单元22、逆量化单元23、以及信号后处理单元65。以下,参照图46,说明第九实施方式的解码装置44执行的解码方法的处理步骤。
[复用分离单元64]
在步骤S62中,复用分离单元64接受被输入到解码装置44的码,分别将信号码输出到可逆解码单元22,将与压伸系数码对应的压伸系数γ输出到信号后处理单元65,将与量化幅度码对应的量化幅度输出到逆量化单元23。
[可逆解码单元22,逆量化单元23]
可逆解码单元22进行的步骤S22以及逆量化单元23进行的步骤S23与第一实施方式相同。
[信号后处理单元65]
信号后处理单元65对每帧接受逆量化单元23输出的解码加权信号^Yk(k=0,…,N-1)以及复用分离单元64输出的压伸系数γ,对解码加权信号^Yk使用压伸系数γ进行与第一实施方式的信号后处理单元65相同的处理,得到输出信号^Xk(k=0,…,N-1)并输出。(步骤S24,S25)
而且,在压伸系数γ为1的情况下,解码加权信号^Yk和输出信号^Xk相同。因此,仅在压伸系数γ不为1的情况,即指定无准瞬时压伸以外的情况下,对解码加权信号^Yk,使用压伸系数γ进行与第一实施方式的信号后处理单元25相同的处理,得到输出信号^Xk(k=0,…,N-1)并输出,在除此以外的情况,即,压伸系数γ为1的情况下,将解码加权信号^Yk(k=0,…,N-1)原样作为输出信号^Xk(k=0,…,N-1)输出。
<第十实施方式>
能够使用第七实施方式中说明的样本串变形装置,将第八实施方式的编码装置以及解码装置作为信号编码装置以及信号解码装置来构成。
使用了第七实施方式的样本串变形装置的信号编码装置如以下那样构成。例如,如图47所示,该信号编码装置71包括:第七实施方式的样本串变形装置31或者33、将编码对象信号编码而得到信号码的编码装置50。编码装置50例如进行与第八实施方式的编码装置41的信号前处理单元51以外对应的处理,样本串变形装置31或者33例如进行与第八实施方式的编码装置41的信号前处理单元51对应的处理。信号编码装置71对于每个规定时间区间,在编码装置50得到用于以目标码长度编码输入音响信号或者与输入音响信号对应的频域信号的量化幅度,对于得到的量化幅度小于规定的阈值或者为规定的阈值以下的时间区间,将输入音响信号或者与输入音响信号对应的频域信号作为编码对象信号在编码装置50中编码,对于除此以外的时间区间,将输入音响信号或者与输入音响信号对应的频域信号输入到样本串变形装置31或者33,将样本串变形装置31或者33得到的加权音响信号或者加权频域信号的样本串作为编码对象信号在编码装置50中编码。
使用了第七实施方式的样本串变形装置的信号解码装置,如以下那样构成。例如,如图48所示,该信号解码装置72包括:第七实施方式的样本串变形装置32或者34、将信号码解码而得到解码信号的解码装置60。解码装置60例如进行与第八实施方式的解码装置42的信号后处理单元63以外对应的处理,样本串变形装置32或者34例如进行与第八实施方式的解码装置42的信号后处理单元63对应的处理。信号解码装置72对每个规定时间区间,将量化幅度码解码,在解码装置60中得到量化幅度,对于得到的量化幅度小于规定的阈值、或者为规定的阈值以下的时间区间,得到在解码装置60中解码信号码而得到的信号作为解码音响信号,或者与解码音响信号对应的频域信号,对于除此以外的时间区间,将解码装置60得到的信号输入到样本串变形装置32或者34,得到解码音响信号、或者与解码音响信号对应的频域信号。
<第十一实施方式>
可以将第九实施方式的考虑方式适用于第七实施方式中说明的样本串变形装置31或者33,构成为样本串变形装置37。该样本串变形装置37如下构成,即在样本串变形装置31或者33中,进一步包含第九实施方式中说明的量化幅度计算单元、进行选择与压伸系数选择单元54选择的压伸系数对应的压伸函数的处理的压伸函数选择单元。量化幅度计算单元对每个规定时间区间,得到用于以目标码长度对输入音响信号或者与输入音响信号对应的频域信号进行编码的量化幅度。压伸函数选择单元对每个规定时间区间,作为压伸函数,选择以下那样的压伸函数,即量化幅度越小,输入音响信号和加权音响信号,或者,与输入音响信号对应的频域信号的样本串和加权频域信号的样本串越近,或者/以及,量化幅度越大,加权音响信号或者加权频域信号的样本串的功率越平坦。
<发明的要点>
准瞬时压伸可以不追加辅助的信息而进行具有以下两个性质的变换。1.在帧内,信号的值或者信号的频谱的值,对较大者施加相对较小的权重,对较小者施加相对较大的权重。2.在帧内,在信号或者信号的频谱的峰值近旁施加相对较小的权重,使得与峰值相同。以下,说明通过所述的结构,实现这些的理由。
首先,使用图49,说明由原信号和量化误差的关系,通过进行准瞬时压伸,听觉品质提高。图49(A)是将原信号原样在时域中等间隔量化的情况的量化误差的频谱。在该情况下,产生平坦的频谱的量化误差,因为刺耳所以听觉品质降低。图49(B)是将压伸了原信号的压伸原信号在时域中等间隔量化的情况的量化误差的频谱。可知压伸原信号和量化误差成为同样的平坦的频谱。图49(C)是将图49(B)逆压伸后的情况的量化误差的频谱。在该情况下,因为成为沿着原信号的频谱的倾斜的量化误差,所以难以听到噪声,听觉品质提高。
在准瞬时压伸中,对规定区间内的每个样本求出代表值,以该代表值为基础,如
那样,对区间内中音响信号或者频谱Xk进行常数倍。这里,若将压伸函数f(x)例如设为对数函数,将代表值决定方式设为二次方平均的平方根,则该变换在能量高的区间中相当于小的值的常数倍,在能量低的区间中相当于大的值的常数倍。因此,大的样本值越多,该区间通过变换越被压缩,小的样本值越多,该区间通过变换越被伸长。而且,由同样的理由,与小的样本值的近旁的样本值相比,大的样本值的近旁的样本值也通过变换被压缩。
因为仅对解码装置传递在所述变换中生成的加权信号或者加权频谱Yk的值,所以通过一般的决定方式不能求代表值-Xm的值,不能进行逆变换。但是,决定代表值的函数
g({xi}i=0,...M-1) (>0)
若如绝对值平均那样满足1次的正齐次性,(即,若
即函数g对于任意的α(>0)满足
),则从Yk的值相同地求代表值时,得到
那样被压伸的代表值。通过用逆函数将该压伸代表值变形,如
那样,在解码装置中也求出原来的代表值。通过根据该值如
那样进行逆变换,可以不使用辅助信息而得到原来的样本值。
当然,若进行了压伸的Yk在中途被量化,产生误差,则不能正确地求原来的代表值,但是通过对量化后的Yk进行与所述同样的处理,可以计算代表值-Xm的估计值,可以根据该值进行逆变换。
<发明的效果>
通过所述那样构成,按照本发明,可以不追加辅助的信息,与语音音响信号匹配而施加适合听觉特性的加权,提高不可逆压缩编码的效率。而且,按照第五实施方式的结构,通过将准瞬时压伸中使用的区间在低频率中精细地设定,在高频率中粗略地设定,可以进一步实现适于听觉特性的加权。而且,按照第六实施方式的结构,通过多次使用不同的准瞬时压伸,可以实现更复杂的压伸,提高加权的效率。
以上,说明了本发明的实施方式,但是具体的结构不限于这些实施方式,在不脱离本发明的宗旨的范围内若有适当设计的变更等,当然也包含在本发明中。
[程序,记录介质]
在通过计算机实现所述实施方式中说明的各装置的各种处理功能的情况下,通过程序记述各装置应具有的功能的处理内容。然后,通过在计算机中执行该程序,在计算机上实现所述各装置中的各种的处理功能。
记述该处理内容的程序可以记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如可以是磁记录装置、光盘、光磁记录介质、半导体存储器等那样的介质。
而且,该程序的流通例如通过销售转让、租借等记录了该程序的DVD,CD-ROM等可拆装型记录介质来进行。进而,也可以将该程序存储在服务器计算机的存储装置中,通过经由网络,从服务器计算机向其它计算机转发该程序,使该程序流通。
执行这样的程序的计算机,例如,首先将可拆装型记录介质中记录的程序或者从服务器计算机转发的程序暂时存储在自己的存储装置中。然后,在执行处理时,该计算机读取自己的记录介质中存储的程序,执行按照读取的程序的处理。而且,作为该程序的其它执行方式,既可以计算机从可拆装型记录介质直接读取程序,执行按照该程序的处理,进而,也可以在每次从服务器计算机对该计算机转发程序时,逐次执行按照接受的程序的处理。而且,也可以设为通过不从服务器计算机向该计算机进行程序的转发,而仅通过该执行指令和结果取得来实现处理功能的所谓ASP(Application Service Provider,服务提供商)型的服务,执行所述处理的结构。而且,设在本方式中的程序中,包含作为供电子计算机的处理用的信息的、按照程序的数据(虽然不是对于计算机的直接的指令,但是具有规定计算机的处理的性质的数据等)。
而且,在该方式中,设为通过在计算机上执行规定的程序构成本装置,但是也可以硬件地实现这些处理内容的至少一部分。

Claims (17)

1.一种样本串变形装置,得到用于输入到对将与输入音响信号对应的频域信号变形而得到的加权频域信号进行编码的编码装置的所述加权频域信号,或者,得到与加权时域信号对应的加权频域信号,其中所述加权时域信号用于输入到对将与输入音响信号对应的频域信号变形而得到的加权频域信号所对应的所述加权时域信号进行编码的编码装置,
所述样本串变形装置包括:
代表值计算单元,对每个规定时间区间,从与输入音响信号对应的频域信号的样本串计算该频率区间的代表值,对比该频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值;以及
信号压伸单元,对于每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为所述加权频域信号的样本串。
2.一种样本串变形装置,从解码装置得到的加权频域信号、或者解码装置得到的与加权时域信号对应的加权频域信号,得到与解码音响信号对应的频域信号,
所述样本串变形装置包括:
压伸代表值计算单元,对每个规定时间区间,从所述加权频域信号的样本串计算该频率区间的代表值,对于比该加权频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值;以及
信号逆压伸单元,对于每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述加权频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为与所述解码音响信号对应的频域信号的样本串。
3.一种样本串变形装置,得到用于输入对到将输入音响信号变形而得到的加权音响信号进行编码的编码装置的所述加权音响信号,或者,得到与加权频域信号对应的加权音响信号,其中所述加权频域信号用于输入到对与将输入音响信号变形而得到的加权音响信号对应的所述加权频域信号进行编码的编码装置,
所述样本串变形装置包括:
代表值计算单元,对于每个规定时间区间,从时域的输入音响信号的样本串计算该时间区间的代表值,对于比该输入音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值;以及
信号压伸单元,对于每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述输入音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为所述加权音响信号的样本串。
4.一种样本串变形装置,从解码装置得到的时域的加权音响信号,或者,从与解码装置得到的频域的加权音响信号对应的时域的加权音响信号,得到解码音响信号,
所述样本串变形装置包括:
压伸代表值计算单元,对于每个规定时间区间,从所述时域的加权音响信号的样本串计算该时间区间的代表值,对于比该加权音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值;以及
信号逆压伸单元,对每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述加权音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为所述解码音响信号的样本串。
5.如权利要求1或者2所述的样本串变形装置,
设定所述多个样本的频率区间,使得越是对应于低频率的频率区间,包含的样本数越少,越是对应于高频率的频率区间,包含的样本数越多。
6.如权利要求1至5的任意一项所述的样本串变形装置,
将对所述多个样本的每个区间计算所述代表值的处理、和将与所述算出的代表值的函数值相应的权重和所述样本串的各样本相乘的处理,反复执行规定的次数。
7.如权利要求1或者3所述的样本串变形装置,还包括:
量化幅度计算单元,对于每个所述规定时间区间,得到用于以目标码长度编码输入音响信号或者与输入音响信号对应的频域信号的量化幅度;以及
压伸函数选择单元,对于每个所述规定时间区间,选择以下压伸函数作为所述压伸函数,即
所述量化幅度越小,所述输入音响信号和所述加权音响信号,或者与所述输入音响信号对应的频域信号的样本串和所述加权频域信号的样本串越接近,或者/以及,所述量化幅度越大,所述加权音响信号或者所述加权频域信号的样本串的功率越平坦。
8.一种信号编码装置,包括权利要求1或者3所述的样本串变形装置、和将编码对象信号编码而得到信号码的编码装置,
所述信号编码装置对于每个所述规定时间区间,得到用于将输入音响信号或者与输入音响信号对应的频域信号以目标码长度编码的量化幅度,
对于得到的量化幅度小于规定的阈值或者为规定的阈值以下的时间区间,将所述输入音响信号或者与所述输入音响信号对应的频域信号作为所述编码对象信号在所述编码装置中编码,
对于除此以外的时间区间,将所述输入音响信号或者与所述输入音响信号对应的频域信号输入到所述样本串变形装置,将所述样本串变形装置得到的所述加权音响信号或者所述加权频域信号的样本串作为所述编码对象信号在所述编码装置中编码。
9.一种信号解码装置,包括:权利要求2或者4所述的样本串变形装置、和解码信号码而得到解码信号的解码装置,
所述信号解码装置对于每个所述规定时间区间,解码量化幅度码而得到量化幅度,
对于得到的量化幅度小于规定的阈值或者为规定的阈值以下的时间区间,得到将所述信号码在所述解码装置中解码而得到的信号,作为所述解码音响信号或者与所述解码音响信号对应的频域信号,
对于除此以外的时间区间,将所述解码装置得到的信号输入到所述样本串变形装置,得到所述解码音响信号或者与所述解码音响信号对应的频域信号。
10.一种样本串变形方法,得到在对将与输入音响信号对应的频域信号变形而得到加权频域信号进行编码的编码方法中用于输入的所述加权频域信号,或者得到与加权时域信号对应的加权频域信号,其中所述加权时域信号在对将与输入音响信号对应的频域信号变形而得到的加权频域信号所对应的所述加权时域信号进行编码的编码方法中用于输入,
所述样本串变形方法包括:
代表值计算步骤,对每个规定时间区间,从与输入音响信号对应的频域信号的样本串计算该频率区间的代表值,对比该频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值;以及
信号压伸步骤,对于每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为所述加权频域信号的样本串。
11.一种样本串变形方法,从通过解码得到的加权频域信号、或者与通过解码得到的加权时域信号对应的加权频域信号,得到与解码音响信号对应的频域信号,所述样本串变形方法包括:
压伸代表值计算步骤,对每个规定时间区间,从所述加权频域信号的样本串计算该频率区间的代表值,对于比该加权频域信号的样本串的频率样本数少的多个样本的每个频率区间,从该频率区间中包含的样本的样本值计算该频率区间的代表值;以及
信号逆压伸步骤,对于每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述加权频域信号的样本串中的该代表值对应的各样本相乘后的频域样本串,作为与所述解码音响信号对应的频域信号的样本串。
12.一种样本串变形方法,得到在对将输入音响信号变形而得到的加权音响信号进行编码的编码方法中用于输入的所述加权音响信号,或者,得到与加权频域信号对应的加权音响信号,其中所述加权频域信号在对与将输入音响信号变形而得到的加权音响信号对应的加权频域信号进行编码的编码方法中用于输入,
所述样本串变形方法包括:
代表值计算步骤,对于每个规定时间区间,从时域的输入音响信号的样本串计算该时间区间的代表值,对于比该输入音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值;以及
信号压伸步骤,对于每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述输入音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为所述加权音响信号的样本串。
13.一种样本串变形方法,从通过解码得到的时域的加权音响信号,或者,从通过解码得到的与频域的加权音响信号对应的时域的加权音响信号,得到解码音响信号,
所述样本串变形方法包括:
压伸代表值计算步骤,对于每个规定时间区间,从所述时域的加权音响信号的样本串计算该时间区间的代表值,对于比该加权音响信号的样本串的样本数少的多个样本的每个时间区间,从该时间区间中包含的样本的样本值计算该时间区间的代表值;以及
信号逆压伸步骤,对每个所述规定时间区间,得到将与可定义逆函数的压伸函数的所述代表值的函数值相应的权重、和与所述加权音响信号的样本串中的该代表值对应的各样本相乘后的时域样本串,作为所述解码音响信号的样本串。
14.如权利要求10或者12所述的样本串变形方法,还包括:
量化幅度计算步骤,对于每个所述规定时间区间,得到用于以目标码长度编码输入音响信号或者与输入音响信号对应的频域信号的量化幅度;以及
压伸函数选择步骤,对于每个所述规定时间区间,作为所述压伸函数,选择以下压伸函数,即
所述量化幅度越小,所述输入音响信号和所述加权音响信号,或者与所述输入音响信号对应的频域信号的样本串和所述加权频域信号的样本串越接近,或者/以及,所述量化幅度越大,所述加权音响信号或者所述加权频域信号的样本串的功率越平坦。
15.一种信号编码方法,包括权利要求10或者12所述的样本串变形方法、和将编码对象信号编码而得到信号码的编码方法,
所述信号编码方法对于每个所述规定时间区间,得到用于以目标码长度编码输入音响信号或者与输入音响信号对应的频域信号的量化幅度,
对于得到的量化幅度小于规定的阈值或者为规定的阈值以下的时间区间,将所述输入音响信号或者与所述输入音响信号对应的频域信号作为所述编码对象信号在所述编码方法中编码,
对于除此以外的时间区间,将所述输入音响信号或者与所述输入音响信号对应的频域信号输入到所述样本串变形方法,将所述样本串变形方法得到的所述加权音响信号或者所述加权频域信号的样本串作为所述编码对象信号在所述编码方法中编码。
16.一种信号解码方法,包括权利要求11或者13所述的样本串变形方法、和将信号码解码而得到解码信号的解码方法,
所述信号解码方法对于每个所述规定时间区间,将量化幅度码解码而得到量化幅度,
对于得到的量化幅度小于规定的阈值或者为规定的阈值以下的时间区间,得到将所述信号码在所述解码装置中解码所得到的信号,作为所述解码音响信号或者与所述解码音响信号对应的频域信号,
对于除此以外的时间区间,在所述样本串变形方法中输入所述解码装置得到的信号,得到所述解码音响信号或者与所述解码音响信号对应的频域信号。
17.一种程序,使计算机具有作为权利要求1至7的任意一项所述的样本串变形装置或者权利要求8所述的信号编码装置或者权利要求9所述的信号解码装置的功能。
CN201780056241.XA 2016-09-15 2017-09-13 样本串变形装置、样本串变形方法、记录介质 Active CN109716431B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2016-180196 2016-09-15
JP2016180196 2016-09-15
JP2017-001966 2017-01-10
JP2017001966 2017-01-10
PCT/JP2017/032991 WO2018052004A1 (ja) 2016-09-15 2017-09-13 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム

Publications (2)

Publication Number Publication Date
CN109716431A true CN109716431A (zh) 2019-05-03
CN109716431B CN109716431B (zh) 2022-11-01

Family

ID=61618807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780056241.XA Active CN109716431B (zh) 2016-09-15 2017-09-13 样本串变形装置、样本串变形方法、记录介质

Country Status (5)

Country Link
US (1) US11468905B2 (zh)
EP (1) EP3514791B1 (zh)
JP (1) JP6712643B2 (zh)
CN (1) CN109716431B (zh)
WO (1) WO2018052004A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002353820A (ja) * 2001-05-22 2002-12-06 Sony Corp 正規化装置、方法、プログラムおよび該プログラムを記録した記録媒体ならびに通信端末装置
US20070063877A1 (en) * 2005-06-17 2007-03-22 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP2012128022A (ja) * 2010-12-13 2012-07-05 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
CN103460287A (zh) * 2011-04-05 2013-12-18 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序、记录介质
CN104321814A (zh) * 2012-05-23 2015-01-28 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序以及记录介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05158495A (ja) * 1991-05-07 1993-06-25 Fujitsu Ltd 音声符号化伝送装置
WO1999030315A1 (fr) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore
JP3590342B2 (ja) * 2000-10-18 2004-11-17 日本電信電話株式会社 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002353820A (ja) * 2001-05-22 2002-12-06 Sony Corp 正規化装置、方法、プログラムおよび該プログラムを記録した記録媒体ならびに通信端末装置
US20070063877A1 (en) * 2005-06-17 2007-03-22 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP2012128022A (ja) * 2010-12-13 2012-07-05 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
CN103460287A (zh) * 2011-04-05 2013-12-18 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序、记录介质
CN104321814A (zh) * 2012-05-23 2015-01-28 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序以及记录介质

Also Published As

Publication number Publication date
CN109716431B (zh) 2022-11-01
JPWO2018052004A1 (ja) 2019-07-04
EP3514791A1 (en) 2019-07-24
EP3514791B1 (en) 2021-07-28
US11468905B2 (en) 2022-10-11
WO2018052004A1 (ja) 2018-03-22
JP6712643B2 (ja) 2020-06-24
US20210335372A1 (en) 2021-10-28
EP3514791A4 (en) 2020-04-29

Similar Documents

Publication Publication Date Title
CN103620675B (zh) 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置
CN103620676B (zh) 对线性预测编码系数进行量化的方法、声音编码方法、对线性预测编码系数进行反量化的方法、声音解码方法以及记录介质
US20130290003A1 (en) Method and apparatus for encoding and decoding high frequency for bandwidth extension
JP6867528B2 (ja) 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
JPH09181611A (ja) 信号符号化装置及び方法
JP6423065B2 (ja) 線形予測分析装置、方法、プログラム及び記録媒体
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
JP6595687B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
CN107004422A (zh) 编码装置、解码装置、它们的方法及程序
JP2004029708A (ja) 音声信号に対するベクトル量子化及びデコーディング装置とその方法
CN108701462A (zh) 加权矩阵系数的自适应量化
CN109716431A (zh) 样本串变形装置、信号编码装置、信号解码装置、样本串变形方法、信号编码方法、信号解码方法以及程序
CN107430869A (zh) 参数决定装置、方法、程序及记录介质
CN107210042A (zh) 编码装置、解码装置、它们的方法、程序以及记录介质
WO2011087333A2 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant