CN112820304A - 解码装置、解码方法、解码程序、记录介质 - Google Patents

解码装置、解码方法、解码程序、记录介质 Download PDF

Info

Publication number
CN112820304A
CN112820304A CN202110081890.3A CN202110081890A CN112820304A CN 112820304 A CN112820304 A CN 112820304A CN 202110081890 A CN202110081890 A CN 202110081890A CN 112820304 A CN112820304 A CN 112820304A
Authority
CN
China
Prior art keywords
sequence
decoding
periodic
code
variable length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110081890.3A
Other languages
English (en)
Other versions
CN112820304B (zh
Inventor
守谷健弘
镰本优
原田登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to CN202110081890.3A priority Critical patent/CN112820304B/zh
Publication of CN112820304A publication Critical patent/CN112820304A/zh
Application granted granted Critical
Publication of CN112820304B publication Critical patent/CN112820304B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供一种能够将在由音响信号的基音周期引起的峰值附近的近似精度高的频域的包络序列以较少的码量再现的解码装置、解码方法、解码程序、记录介质。本发明的解码装置具有周期性综合包络生成部和可变长度解码部。周期性综合包络生成部生成频域的序列的周期性综合包络序列,所述周期性综合包络序列基于与线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期。可变长度解码部对可变长度码进行解码而获得频域的序列。

Description

解码装置、解码方法、解码程序、记录介质
本发明是以下专利申请的分案申请:申请号:201580022887.7,申请日:2015年02月20日,发明名称:编码装置、解码装置、编码方法、解码方法、记录介质。
技术领域
本发明涉及利用音响信号的谱包络对音响信号进行编码、解码的编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、以及记录介质。
背景技术
作为低比特(例如,10kbit/s~20kbit/s左右)的语音信号或音响信号的编码方法,已知DFT(离散傅里叶变换)或MDCT(改进离散余弦变换)等对于正交变换系数的自适应编码。例如在非专利文献1中利用的TCX(transform coded excitation:变换编码激励)编码方法中,求从作为被输入的音响信号在频域的表现的系数串X[1],…,X[N]去除了振幅谱包络的影响的序列(归一化序列串XN[1],…,XN[N]),并对其进行可变长度编码。其中,[]内的N是正整数。
振幅谱包络通过以下的步骤算出。
(步骤1)以作为规定的时间区间的帧为单位,进行对于被输入的时域的音响数字信号(以下,输入音响信号)的线性预测分析而求线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,在时刻t中的输入音响信号x(t)根据追溯至P时刻为止的过去的自身的值x(t-1),…,x(t-P)与预测残差e(t)以及线性预测系数α1,…,αp,通过式(1)来表示。
x(t)=α1x(t-1)+…+αp x(t-P)+e(t) (1)
(步骤2)对线性预测系数α1,…,αP进行量化,并求已量化线性预测系数^α1,…,^αP。利用已量化线性预测系数^α1,…,^αP求N点输入音响信号的振幅谱包络序列W[1],…,W[N]。例如,能够通过式(2)求振幅谱包络序列的各值W[n]。其中,n是1≦n≦N的整数,exp(·)是以纳皮尔数作为底数的指数函数,j是虚数单位,σ是预测残差信号的振幅。
Figure BDA0002909659800000021
另外,在本说明书中,在右上角没有方括号而标记的标号表示幂运算。也就是说,σ2表示σ的2次方。此外,在文中使用的标记“~”、“^”等本来应记载在其后的字符的正上方,但由于文本记载方法的限制,记载在了该字符的正前方。在公式中这些记号记载在本来的位置即字符的正上方。
现有技术文献
非专利文献
非专利文献1:Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.
发明内容
发明要解决的课题
在音响信号的编码中,为了在解码侧也获得谱包络的信息,需要将与谱包络对应的码送到解码侧。在如非专利文献1那样根据线性预测系数求谱包络的情况下,向解码侧送出的“与谱包络对应的码”是“与线性预测系数对应的码”,具有仅需较少的码量的优点。另一方面,通过线性预测系数求得的谱包络的信息,有时由于输入音响信号的基音周期而导致峰值附近的近似精度变差,这种情况下有时导致对归一化系数串进行可变长度编码时的编码效率的低下。
鉴于这样的问题,在本发明中,提供能够以较少的码量再现由音响信号的基音周期引起的峰值附件的近似精度高的频域的包络序列的编码装置、解码装置。
用于解决课题的手段
本发明的编码装置具有周期性综合包络生成部以及可变长度编码部。周期性综合包络生成部生成作为频域的序列的周期性综合包络序列,所述周期性综合包络序列基于与根据规定时间区间的输入音响信号而求出的线性预测系数码对应的频域的序列即谱包络序列、以及与根据输入音响信号而求出的周期码对应的频域的周期。可变长度编码部以周期性综合包络序列的值越是大的频率,输入音响信号的振幅越大作为前提,对源于输入音响信号的频域的序列进行编码。本发明的解码装置具有周期性综合包络生成部以及可变长度解码部。周期性综合包络生成部生成作为频域的序列的周期性综合包络序列,所述周期性综合包络序列基于与线性预测系数码对应的频域的序列即谱包络序列、以及与周期码对应的频域的周期。可变长度解码部以越是周期性综合包络序列的值大的频率,音响信号的振幅越大作为前提,可变长度码进行解码而获得频域的序列。
本发明的其他方式的解码装置,具有:周期性综合包络生成部,对与线性预测系数码对应的频域的序列即谱包络序列,进行基于与周期码对应的频域的周期的样本值的变更,从而生成作为频域的序列的周期性综合包络序列;指标解码部,对被输入的指标码进行解码而获得表示周期性的程度的指标;可变长度编码参数计算部,从所述周期性综合包络序列,计算依赖于振幅值的可变长度编码参数;第二可变长度编码参数计算部,根据所述谱包络序列,计算依赖于振幅值的可变长度编码参数;以及可变长度解码部,利用可变长度编码参数,进行解码,在所述指标处于预先决定的表示周期性的程度大的范围内的情况下,所述可变长度解码部利用由所述可变长度编码参数计算部计算的可变长度编码参数进行解码,在所述指标不处于所述表示周期性的程度大的范围内的情况下,所述可变长度解码部利用由所述第二可变长度编码参数计算部计算的可变长度编码参数进行解码。
发明效果
根据本发明的编码装置和解码装置,进行能够以较少的码量再现由输入音响信号的基音周期引起的峰值附近的近似精度号的频域的包络序列的编码、解码,因此音响信号的编码效率高。
附图说明
图1是表示实施例1的周期性综合包络序列生成装置(periodic-combined-envelope-sequence generation device)的功能结构例的图。
图2是表示实施例1的周期性综合包络序列生成装置的处理流程的图。
图3是表示周期性包络序列P[1],…,P[N]的例子的图。
图4A是表示用于说明对相同音响信号生成的序列的不同点的例子的图,是表示对数串X[1],…,X[N]进行了插补的曲线的形状的图。
图4B是表示用于说明对相同音响信号生成的序列的不同点的例子的图,是表示对周期性包络序列P[1],…,P[N]进行了插补的曲线的形状的图。
图4C是表示用于说明对相同音响信号生成的序列的不同点的例子的图,是表示对平滑化振幅谱包络序列W[1],…,W[N]进行了插补的曲线的形状的图。
图4D是表示用于说明对相同音响信号生成的序列的不同点的例子的图,是表示对周期性综合包络序列WM[1],…,WM[N]进行了插补的曲线的形状的图。
图5是表示实施例2的编码装置的功能结构例的图。
图6是表示实施例2的编码装置的处理流程的图。
图7是表示实施例2的解码装置的功能结构例的图。
图8是表示实施例2的解码装置的处理流程的图。
图9是表示实施例3的编码装置的功能结构例的图。
图10是表示实施例3的编码装置的处理流程的图。
图11是表示实施例3的解码装置的功能结构例的图。
图12是表示实施例3的解码装置的处理流程的图。
具体实施方式
以下,详细说明本发明的实施方式。另外,对具有相同功能的结构部分赋予相同标号,并省略重复说明。
【实施例1】
图1表示本发明的周期性综合包络序列生成装置的功能结构例,图2表示本发明的周期性综合包络序列生成装置的处理流程。周期性综合包络序列生成装置100具有谱包络序列计算部120、频域变换部110、周期性分析部130、周期性包络序列生成部140、以及周期性综合包络生成部150,将被输入的时域的音响数字信号设为输入音响信号x(t),基于系数串的频率分量而生成变换了振幅谱包络序列的周期性综合包络序列。
<谱包络序列计算部120>
谱包络序列计算部120基于输入音响信号x(t)的时域线性预测,计算输入音响信号的振幅谱包络序列W[1],…,W[N](S120)。其中,N是正整数。谱包络序列计算部120与现有技术相同,按照以下的顺序计算即可。
(步骤1)以作为规定的时间区间的帧为单位,进行对于输入音响信号的线性预测分析而求线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,时刻t时的输入音响信号x(t)根据追溯到P时刻为止的过去的自身的值x(t-1),…,x(t-P)和预测残差e(t)以及线性预测系数α1,…,αp通过式(1)来表示。
(步骤2)利用线性预测系数α1,…,αP求N点的输入音响信号的振幅谱包络序列W[1],…,W[N]。例如,振幅普包络序列的各值W[n]能够利用与线性预测系数α1,…,αP对应的已量化线性预测系数^α1,…,^αP通过式(2)来求。此外,振幅谱包络序列的各值W[n]能够利用线性预测系数α1,…,αP通过将式(2)的^αp置换为αp的式来求。
<频域变换部110>
频域变换部110以规定的时间区间的帧为单位,将被输入的时域的输入音响信号变换为频域的N点的系数串X[1],…,X[N]而输出(S110)。向频域的变换通过MDCT(改进离散余弦变化)或DFT(离散傅里叶变换)等方法来进行即可。
<周期性分析部130>
周期性分析部130将系数串X[1],…,X[N]作为输入,求该系数串X[1],…,X[N]的周期T,输出周期T(S130)。
周期T是与源于输入音响信号的频域的系数串、例如系数串X[1],…,X[N]的具有周期性的分量的间隔(系数串周期性地成为较大的值的间隔)对应的信息。以下,有时还将周期T表现为间隔T,但仅仅是表现上的不同,是相同的信息。T是正值,可以是整数,也可以是小数(例如,5.0、5.25、5.5、5.75)。
此外,周期性分析部130根据需要,也可以将系数串X[1],…,X[N]作为输入,还求表示周期性的程度的指标S而输出。此时,例如,基于系数串X[1],…,X[N]的具有周期性的分量的部分的能量与除此之外的部分的能量之比,求表示周期性的程度的指标S。此时,指标S成为表示频域的样本串的周期性的程度的指标。另外,具有周期性的分量的大小越大,即,周期T的整数倍的样本或处于其附近的样本的振幅(样本值的绝对值)越大,频域的样本串的“周期性的程度”越大。
另外,周期性分析部130也可以从时域的输入音响信号求时域的周期,通过将求得的时域的周期变换为频域的周期,求周期T。此外,也可以求将时域的周期变换为频域的周期的常数倍或其附近的值作为周期T。同样地,周期性分析部130也可以根据时域的输入音响信号,基于例如时间偏移了与时域的周期对应的量的信号串之间的相关的大小等,求表示周期性的程度的指标S。
总之,根据时域的输入音响信号或来源于此的频域系数串求周期T或指标S的方法,从以往开始存在各种方法,因此也可以选择其中任一种方法而利用。
<周期性包络序列生成部140>
周期性包络序列生成部140将间隔T作为输入,输出周期性包络序列P[1],…,P[N](S140)。周期性包络序列P[1],…,P[N]是以由基音周期引起的周期持有峰值的频域的离散序列,即,是与谐波模式对应的离散序列。图3表示周期性包络序列P[1],…,P[N]的例子。周期性包络序列P[1],…,P[N]是如图3所示的波形那样,只有间隔T的整数倍的附近的作为整数值的索引、以及与其前后规定数目的索引对应周期性包络的值持正值,除此之外是0的序列。间隔T的整数倍的附近的作为整数值的索引周期性地取最大值(峰值),与其前后规定数目的索引对应的P[n]的值处于随着其索引n从与峰值对应的索引远离而单调递减的关系。图3的横轴的1,2,…,表示离散样本点的索引(以下,记为“频率索引”)。
例如,将n设为表示频率索引的变量,将τ设为与极大值(峰值)对应的频率索引,从而通过以下的函数Q(n)表示峰值的形状。其中,设间隔T的小数点以下的位数为L位,将间隔T’设为T’=T×2L
Figure BDA0002909659800000061
h=2.8·(1.125-exp(-0.07·T′/2L)),
PD=0.5·(2.6-exp(-0.05·T′/2L))
h表示峰值的高度,间隔T越大峰值的高度越高。此外,PD表示峰值部分的宽度,间隔T越大宽度越宽。
若将U设为表示1至峰值的数为止的正整数(例如,图3的情况下为1~10),将v设为1以上的整数(例如,1至3左右),将floor(·)设为舍弃小数点以下而返回整数值的函数,则周期性包络序列P[n]例如如下计算即可。
Figure BDA0002909659800000071
其中,(U×T’)/2L-v≦n≦(U×T’)/2L+v。例如,在L=2的情况下,若T=20.00则T’=80,若T=20.25则T’=81,若T=20.50则T’=82,若T=20.75则T’=83。另外,周期性包络序列P[n]利用将小数点第一位四舍五入而返回整数值的函数Round(·)如下求即可。
Figure BDA0002909659800000072
<周期性综合包络生成部150>
周期性综合包络生成部150至少将周期性包络序列P[1],…,P[N]、以及振幅谱包络序列W[1],…,W[N]作为输入,求周期性综合包络序列WM[1],…,WM[N](S150)。具体来说,如下式那样求周期性综合包络WM[n]。
WM[n]=W[n]·(1+δ·P[n]) (6)
另外,δ是被决定为使得周期性综合包络WM[n]与系数X[n]的绝对值系数的形状接近的值、或者是预先决定的值。
在周期性综合包络生成部150中决定δ使得周期性综合包络WM[n]与系数X[n]的绝对值序列的形状接近的情况下,周期性综合包络生成部150只要将系数串X[1],…,X[N]也作为输入,并输出所决定的δ和那时的周期性综合包络序列WM[1],…,WM[N]即可。例如,δ被决定为从几个δ的候选中,例如,0.4和0.8这两个δ的候选中,通过以下的式定义的E最小的δ即可。换言之,只要将δ决定为周期性综合包络WM[n]与系数X[n]的绝对值序列的形状接近即可。
Figure BDA0002909659800000081
Figure BDA0002909659800000082
Figure BDA0002909659800000083
δ是决定在周期性综合包络WM[n]中将周期性包络P[n]考虑到何种程度的值。换言之,δ可以称为用于决定频率综合包络WM[n]中的振幅谱包络W[n]与周期性包络P[n]混合比例的值。此外,式(9)的G是系数串X[1],…,X[N]的各系数X[n]的绝对值的序列与周期性综合包络序列的倒数的序列的内积。式(8)的WM[n]是通过G将周期性综合包络的各值WM[n]进行归一化后的归一化周期性综合包络。在式(7)中,计算系数串X[1],…,X[N]与归一化周期性综合包络序列WM[1],…,WM[N]的内积的四次方的目的在于,强调绝对值特别大的系数X[n]而减少取内积的值(距离)。也就是说,意味着将δ决定为使得系数串X[1],…,X[N]中绝对值特别大的系数X[n]与周期性综合包络WM[n]接近。
此外,在周期性综合包络生成部150中根据周期性的程度而决定δ的候选数的情况下,周期性综合包络生成部150也可以将表示周期性的程度的指标S也作为输入,在指标S表示是与周期性高的情况对应的帧的情况下从多个候选数的δ的候选中选择在式(7)中定义的E最小的δ,在指标S表示是与周期性低的情况对应的帧的情况下将δ设为预先决定的值。即,在周期性综合包络生成部150中根据周期性的程度而决定δ的候选数的情况下,只要周期性越高δ的候选的数目越多即可。
<实施例1的发明效果>
图4A~4D表示用于说明对相同的音响信号生成的序列的差异的例子。图4A表示对系数串X[1],…,X[N]进行了插补的曲线的形状,图4B表示对周期性包络序列P[1],…,P[N]进行了插补的曲线的形状,图4C表示对平滑化振幅谱包络序列W[1],…,W[N]进行了插补的曲线的形状,图4D表示对周期性综合包络序列WM[1],…,WM[N]进行了插补的曲线的形状。如图4A~4D所示,周期性综合包络序列WM[1],…,WM[N]与平滑化振幅谱包络序列W[1],…,W[N]相比,成为包含了系数串X[1],…,X[N]中表现的周期性的峰值的形状。此外,周期性综合包络序列WM[1],…,WM[N],只要除了作为表示谱包络的信息的线性预测系数或已量化线性预测系数之外,还有间隔T、或间隔T与值δ的信息就能够生成。从而,对表示输入音响信号的谱包络的信息追加较少的信息量,就能够根据由线性预测系数求出的谱包络高精度地表现由于输入音响信号的基音周期引起的振幅的峰值。即,能够通过线性预测系数或已量化线性预测系数、间隔T或间隔T和值δ的较少的信息量高精度估计输入音响信号的振幅。另外,平滑化振幅谱包络W[n]是可通过下式表现的包络,γ是用于钝化(平滑化)振幅谱系数的1以下的正常数。
Figure BDA0002909659800000091
此外,在编码装置与解码装置中利用本发明的周期性综合包络序列生成装置的情况下,用于确定在编码装置中包含的周期性综合包络序列生成装置以外的处理部中获得的已量化线性预测系数^αp的码(线性预测系数码CL)与用于确定周期T与时域的周期的码(周期码CT)被输入到解码装置,因此,只要从本发明的周期性综合包络序列生成装置输出表示δ的信息的码,在解码侧的周期性综合包络序列生成装置也能够生成与在编码侧的周期性综合包络序列生成装置中生成的周期性综合包络序列相同的周期性综合包络序列。从而,从编码装置向解码发送码时增加的码量较少。
<实施例1的发明点>
在实施例1的周期性综合包络序列生成装置100中,周期性综合包络生成部150基于系数串X[1],…,X[N]的周期性分量,对振幅谱包络序列W[1],…,W[N]进行变形,并设为周期性综合包络序列WM[1],…,WM[N],这一点是最重要的点。尤其只要系数串X[1],…,X[N]的周期性的程度越大,即,具有周期性的分量的大小越大,将振幅谱包络序列W[1],…,W[N]中间隔T(周期)的整数倍以及它们的附近的样本的值变更地越大,就容易获得上述的效果。“附近的样本”是指由作为间隔T的整数的附近的整数值的索引表示的样本。此外,“附近”可以设为例如通过式(3)~(5)等预先决定的方法来决定的范围。
此外,系数串X[1],…,X[N]的具有周期性的分量的间隔T越宽,由式(4)以及(5)表示的周期性包络序列P[1],…,P[N]持较大的值,以较宽的幅度,即以间隔T(周期)的整数倍以及它们的附近的较多的样本,持0以外的值。也就是说,系数串的具有周期性的分量的间隔T越宽,周期性综合包络生成部150将振幅谱包络序列中的间隔T(周期)的整数倍以及它们的附近的样本的值变更为较大。此外,系数串的具有的周期性的分量的间隔T越宽,周期性综合包络生成部150将振幅谱包络序列以较宽的幅度,即以间隔T(周期)的整数倍以及它们的附近的较多的样本,变更样本值。“以附近的较多的样本”是指增加在符合“附近”的范围(通过预先决定的方法决定的范围)内存在的样本。也就是说,若周期性综合包络生成部150如此变更振幅谱包络序列,则容易获得上述的效果。
另外,作为有效地利用周期性综合包络序列具有的“能够高精度地表现由输入音响信号的基音周期引起的振幅的峰值”的特征的例子,有编码装置和解码装置,通过实施例2、3来表示该装置的例子。其中,周期性综合包络序列的特征的利用例除了编码装置和解码装置以外,还可以有噪音去除装置或后置滤波器等。从而,在实施例1中说明周期性综合包络序列生成装置。
[变形例1](通过归一化系数串进行周期性分析的例子)
图1还表示变形例1的周期性综合包络序列生成装置。此外,图2还表示变形例1的周期性综合包络序列生成装置的处理流程。周期性综合包络序列生成装置101与周期性综合包络序列生成装置100的不同点在于,还具有频域序列归一化部111,且谱包络序列计算部121、周期性分析部131不同,其他结构相同。以下仅说明不同点。
<谱包络序列计算部121>
谱包络序列计算部121不仅求振幅谱包络序列W[1],…,W[N],还求平滑化振幅谱包络序列W[1],…,W[N]。
具体来说,谱包络序列计算部121除了在谱包络序列计算部120中示出的(步骤1)、(步骤2)之外,还进行以下步骤的处理。
(步骤3)对已量化线性预测系数^αp的各系数乘以γp,求已量化平滑化线性预测系数^α1γ,^α2γ2,…,^αPγP。γ是用于进行平滑化的1以下的正常数。然后通过式(10),求平滑化振幅谱包络序列W[1],…,W[N](S121)。当然,与谱包络序列计算部120同样地,也可以代替已量化线性预测系数^αp而利用线性预测系数αp
<频域序列归一化部111>
频域序列归一化部111将序列串X[1],…,X[N]的各系数除以平滑化振幅谱包络序列W[1],…,W[N]的各系数而获得归一化系数串XN[1],…,XN[N]。即,对n=1,…,N,进行
XN[n]=X[n]/W[n] (11)的计算,并求出归一化序列串XN[1],…,XN[N](S111)。
<周期性分析部131>
周期性分析部131将归一化序列串XN[1],…,XN[N]作为输入,求该归一化系数串XN[1],…,XN[N]的周期T,并输出周期T(S131)。即,在本变形例中,求源于输入音响信号的作为频域的系数串的归一化系数串XN[1],…,XN[N]的具有周期性的分量的间隔作为周期T。此外,周期性分析部131也可以根据需要,将系数串X[1],…,X[N]作为输入,还求表示周期性的程度的指标S并输出。
除此之外的处理与周期性综合包络序列生成装置100相同。从而,获得与实施例1同样的效果。另外,周期性综合包络序列生成装置101的情况下,也可以代替振幅谱包络序列W[1],…,W[N]而利用平滑化振幅谱包络序列W[1],…,W[N]。此时,代替式(6)而成为下式的计算。
Figure BDA0002909659800000111
[变形例2](从外部输入信息的例子)
在编码装置和解码装置在其内部具有本发明的周期性综合包络序列生成装置的情况下,在编码装置和解码装置中包含的周期性综合包络序列生成装置以外的处理部中,有时会求系数串X[1],…,X[N]、归一化系数串XN[1],…,XN[N]、已量化线性预测系数^αp、已量化平滑化线性预测系数^αpγp、振幅谱包络W[1],…,W[N]、平滑化振幅谱包络序列W[1],…,W[N]、周期T、指标S等。这样的情况下,也可以设为在周期性综合包络序列生成装置中不包含频域变换部、频域归一化部、谱包络序列计算部、周期性分析部的至少任意个的结构。此时,从编码装置内的周期性综合包络序列生成装置以外的处理部输出用于确定已量化线性预测系数^αp的码(线性预测系数码CL)、用于确定周期T或时域的周期的码(周期码CT)、用于确定指标S的码等,并输入到解码装置。因此,这种情况下,从编码装置内的周期性综合包络序列生成装置不需要输出用于确定已量化线性预测系数^αp的码(线性预测系数码CL)、用于确定周期T或时域的周期的码(周期码CT)、用于确定指标S的码等。
此外,在编码装置和解码装置中利用本发明的周期性综合包络序列生成装置的情况下,需要在编码装置和解码装置中获得相同的周期性综合包络序列。因此,需要利用可根据由编码装置输出并被输入到解码装置中的码而确定的信息,获得周期性综合包络序列。例如,需要在编码装置中利用的周期性综合包络序列生成装置的谱包络序列计算部中,利用与线性预测系数码CL对应的已量化线性预测系数来求振幅谱包络序列,在解码装置中利用的周期性综合包络序列生成装置的谱包络序列计算部中,利用与从编码装置输出而被输入到解码装置中的线性预测系数码CL对应的解码线性预测系数来求振幅谱包络序列。
另外,在编码装置和解码装置中利用周期性综合包络序列的情况下,并非如上述那样在内部具有周期性综合包络序列生成装置,而是在编码装置和解码装置中具有周期性综合包络序列生成装置内所需的处理部即可。在实施例2中说明这样的编码装置和解码装置。
【实施例2】
《编码装置》
图5表示实施例2的编码装置的功能结构例子,图6表示实施例2的编码装置的处理流程。编码装置200具有谱包络序列计算部221、频域变换部110、频域序列归一化部111、周期性分析部230、周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、可变长度编码部270。编码装置200将被输入的时域的音响数字信号作为输入音响信号x(t),至少输出表示已量化线性预测系数^α1,…,^αP的码CL、表示归一化系数串XN[1],…,XN[N]的周期的间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行可变长度编码后的可变长度码CX。频域序列归一化部111与实施例1变形例1相同。频域变换部110与周期性包络序列生成部140和实施例1相同。以下说明不同的结构部。
<谱包络序列计算部221>
谱包络序列计算部221基于输入音响信号x(t)的时域的线性预测,计算输入音响信号的振幅谱包络序列W[1],…,W[N]与平滑化振幅谱包络序列W[1],…,W[N],且还求表示在计算的过程中获得的已量化线性预测系数数^α1,…,^αP的码CL(S221)。其中,N是正整数。谱包络序列计算部221按照以下的步骤进行处理即可。
(步骤1)以作为规定的时间区间的帧为单位,进行对于输入音响信号的线性预测分析而求线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全级点模型的P阶自回归过程,根据追溯到P时刻为止的过去的自身的值x(t-1),…,x(t-P)与预测残差e(t)以及线性预测系数α1,…,αp,通过式(1)表示时刻t值的输入音响信号x(t)。
(步骤2)对线性预测系数α1,…,αP进行编码而获得码CL并输出,并求与码CL对应的已量化线性预测系数^α1,…,^αP。此外,利用已量化线性预测系数^α1,…,^αP,求N点的输入音响信号的振幅谱包络序列W[1],…,W[N]。例如,振幅谱包络序列的各值W[n]能够通过式(2)来求。另外,对线性预测系数α1,…,αP进行编码而获得码CL的方法可以利用如下的方法:将预测系数变换为LSP参数从而对LSP参数进行编码而获得码CL等将可变换为线性预测系数的系数的任一个进行编码而获得码CL的任意方法。
(步骤3)对已量化线性预测系数^αp的各个乘以γp,求已量化平滑化线性预测系数^α1γ,^α2γ2,…,^αPγP。γ是预先决定的用于平滑化的1以下的正常数。然后,通过式(10),求平滑化振幅谱包络序列W[1],…,W[N]。
<周期性分析部230>
周期性分析部230将归一化系数串XN[1],…,XN[N]作为输入,求该归一化系数串XN[1],…,XN[N]的间隔T(周期性地成为较大的值的间隔),输出间隔T与表示间隔T的码CT(S230)。此外,周期性分析部230根据需要还求表示周期性的程度的指标S(即,表示频域的样本串的周期性的程度的指标)并输出。此外,周期性分析部230根据需要还获得表示指标S的码CS并输出。另外,指标S与间隔T本身与实施例1变形例1的周期性分析部131相同。
<周期性综合包络生成部250>
周期性综合包络生成部250至少将周期性包络序列P[1],…,P[N]、振幅谱包络序列W[1],…,W[N]作为输入,求周期性综合包络序列WM[1],…,WM[N]而输出周期性综合包络WM[n]。此外,周期性综合包络生成部250在作为值δ,不是选择预先决定的一个值而是从预先决定的多个候选值之中的任一个的情况下,还将系数串X[1],…,X[N]作为输入,并作为值δ而求出预先决定的多个候选值中周期性综合包络WM[n]与系数X[n]的绝对值序列的形状接近的候选值,且还输出表示值δ的码Cδ(S250)。
周期性综合包络WM[n]与值δ与实施例1相同,周期性综合包络WM[n]如式(6),……,(9)那样来求即可。在周期性综合包络生成部250中根据周期性的程度而决定δ的候选数的情况下,周期性综合包络生成部250将表示周期性的程度的指标S也作为输入,在指标S是与周期性高的情况对应的帧的情况下,从较多的候选数的δ的候选中选择通过式(7)定义的E成为最小的δ,在指标S是与周期性低的情况对应的帧的情况下,也可以将δ设为一个预先决定的值。另外,当将δ设为预先决定的值的情况下,不需要输出表示值δ的码Cδ
<可变长度编码参数计算部260>
可变长度编码参数计算部260将周期性综合包络序列WM[1],…,WM[N]、平滑化振幅谱包络序列W[1],…,W[N]、以及归一化系数串XN[1],…,XN[N]作为输入,求可变长度编码参数rn(S260)。可变长度编码参数计算部260的特征在于,依据从周期性综合包络序列WM[1],…,WM[N]求得的振幅值,计算可变长度编码参数rn
可变长度编码参数是用于确定编码对象的信号即归一化系数串XN[1],…,XN[N]的各系数的振幅可采用的范围的参数。例如,在赖斯编码的情况下,赖斯参数相当于可变长度编码参数,在算术编码的情况下,相当于编码对象的信号的振幅可采用的范围的可变长度编码参数。
在对每个样本进行可变长度编码的情况下,对归一化系数串的各系数XN[n]计算可变长度编码参数。在对每个由多个样本组成的样本群(例如每2个样本)汇总而进行可变长度编码的情况下,对每个样本群计算可变长度编码参数。也就是说,可变长度编码参数计算部260按照作为归一化系数串的一部分的归一化部分系数串,计算可变长度编码参数rn。在此,设归一化部分系数串有多个,且在多个归一化部分系数串帧中不重复地包含归一化系数串的系数。以下,以对每一个样本进行赖斯编码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)作为成为基准的赖斯参数sb(成为基准的可变长度编码参数),如下式那样算出归一化系数串XN[1],…,XN[N]的各系数的振幅的平均的对数。
Figure BDA0002909659800000151
Sb对每个帧被编码一次,作为与成为基准的赖斯参数(成为基准的可变长度编码参数)对应的码Csb而被传送到解码装置400。或者在根据被传送到解码装置400的其他的信息能够估计归一化系数串XN[1],…,XN[N]的振幅的平均值的情况下,编码装置200与解码装置400帧也可以共同地预先决定根据振幅的平均值的估计值来近似地决定sb的方法。例如,在单独使用表示包络的倾斜的参数、表示每个区分频带的平均包络的大小的参数的编码的情况下,根据被传送到解码装置400的其他信息能够估计振幅的平均值。此时,也可以不对sb进行编码并将与成为基准的赖斯参数对应的码Csb输出到解码装置400。
(步骤2)根据以下式算出阈值θ。
Figure BDA0002909659800000152
θ是将周期性综合包络序列的各值WM[n]除以平滑化振幅谱包络序列的各值W[n]后的值的振幅的平均的对数。
(步骤3)|WM[n]/W[n]|比θ越大,将用于对归一化系数XN[n]进行赖斯编码的赖斯参数rn决定为比sb越大的值。|WM[n]/W[n]|比θ越小,将用于对归一化系数XN[n]进行赖斯编码的赖斯参数rn决定为比sb越小的值。
(步骤4)对所有的n=1,2,…,N反复进行步骤3的处理,从而求对各XN[n]的赖斯参数rn
<可变长度编码部270>
可变长度编码部270利用在可变长度编码参数计算部260中求得的可变长度编码参数rn,对归一化系数串XN[1],…,XN[N]进行可变长度编码,输出可变长度码CX(S270)。例如,可变长度编码部270利用在可变长度编码参数计算部260中的求得的赖斯参数rn,对归一化系数串XN[1],…,XN[N]进行赖斯编码,将获得的码作为可变长度码CX输出。在可变长度编码参数计算部260中求得的赖斯参数rn是依赖于周期性综合包络序列的振幅值的可变长度编码参数,越是周期性综合包络序列的值大的频率,越成为大的值。赖斯编码是依赖于振幅值的可变长度编码的公知技术之一,其利用赖斯参数进行依赖于振幅值的可变长度编码。此外,在周期性综合包络生成部250中生成的周期性综合包络序列高精度地表现输入音响信号的谱包络。即,可变长度编码部270以越是周期性综合包络序列的值大的频率,所述输入音响信号的频域的系数串即X[1],…,X[N]的振幅越大作为前提,对归一化系数串XN[1],…,XN[N]进行可变长度编码,换言之,利用可变长度编码参数,通过依赖于振幅值的可变长度编码,对归一化系数串XN[1],…,XN[N]进行编码。这里所称的振幅值是编码对象的系数串的平均振幅值、系数串中包含的各系数的振幅的估计值、系数串的振幅的包络的估计值等。
编码装置200输出表示通过这样的处理获得的已量化线性预测系数^α1,…,^αP的码CL、表示间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX。此外,根据需要还输出表示值δ的码Cδ、表示成为基准的可变长度编码参数sb的码Csb。从编码装置200输出的码被输入到解码装置400。
[编码装置的变形例1](从外部输入信息的例子)
另外,作为编码装置,还可以仅具有周期性包络序列生成部140和周期性综合包络生成部250、可变长度编码参数计算部260、以及可变长度编码部270,将在编码装置的外部生成的平滑化振幅谱包络序列W[1],…,W[N]、归一化系数串XN[1],…,XN[N]、间隔T作为输入,根据需要还将振幅谱包络序列W[1],…,W[N]与指标S作为输入,输出可变长度码CX
[编码装置的变形例2](根据系数串X[n]求间隔T的例子)
在上述的周期性分析部230中将归一化系数串XN[1],…,XN[N]作为输入来求间隔T,但在周期性分析部230中也可以将由频域变换部110输出的系数串X[1],…,X[N]作为输入来求间隔T。此时,通过与实施例1的周期性分析部130相同的方法求间隔T。
《解码装置》
图7表示实施例2的解码装置的功能结构例子,图8表示实施例2的解码装置的处理流程。解码装置400具有谱包络序列计算部421、周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、可变长度解码部470、频域序列逆归一化部411、以及频域逆变换部410。解码装置400接受表示已量化线性预测系数^α1,…,^αP的码CL、表示间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX,输出音响信号。另外,根据需要还接受表示值δ的码Cδ、表示成为基准的可变长度编码参数sb的码Csb、以及表示指标S的码CS。以下,表示各结构部的细节。
<谱包络序列计算部421>
谱包络序列计算部421将码CL作为输入,计算振幅谱包络序列W[1],…,W[N]、平滑化振幅谱包络序列W[1],…,W[N]。(S421)。更具体来说,按照以下的步骤进行处理即可。
(步骤1)对码CL进行解码,获得解码线性预测系数^α1,…,^αP
(步骤2)利用解码线性预测系数^α1,…,^αP,求N点的振幅谱包络序列W[1],…,W[N]。例如,振幅谱包络序列的各值W[n]能够通过式(2)来求。
(步骤3)对解码线性预测系数^αp的每一个乘以γp,求解码平滑化线性预测系数^α1γ,^α2γ2,…,^αPγP。γ是预先决定的用于平滑化的1以下的正常数。然后,通过式(10),求平滑化振幅谱包络序列W[1],…,W[N]。
<周期性包络序列生成部440>
周期性包络序列生成部440将表示间隔T的码CT作为输入,对码CT进行解码,获得间隔T。然后,通过与编码装置200的周期性包络序列生成部140相同的方法求周期性包络序列P[1],…,P[N]而输出(S440)。
<周期性综合包络生成部450>
对周期性综合包络生成部450输入周期性包络序列P[1],…,P[N]、振幅谱包络序列W[1],…,W[N]、符号Cδ、码CS。其中,符号Cδ、码CS有时还不被输入。周期性综合包络生成部450对码Cδ进行解码,取得值δ。其中,在码Cδ不被输入的情况下,不进行码Cδ的解码,而取得在周期性综合包络生成部450中预先存储的值δ。另外,周期性综合包络生成部450在被输入了码CS的情况下,对码CS进行解码而取得指标S,在所取得的指标S是与周期性高的情况对应的帧的情况下对码Cδ进行解码而取得值δ,在所取得的指标S是与周期性低的情况对应的帧的情况下不进行码Cδ的解码,而取得在周期性综合包络生成部450中预先存储了的值δ。然后,周期性综合包络生成部450通过式(6),求周期性综合包络序列WM[1],…,WM[N]。(S450)
<可变长度编码参数计算部460>
可变长度编码参数计算部460将周期性综合包络序列WM[1],…,WM[N]、平滑化振幅谱包络序列W[1],…,W[N]、以及码Csb作为输入,取得可变长度编码参数rn(S460)。其中,在能够根据被传送到解码装置400的其他的信息估计振幅的平均值的情况下,也可以预先决定根据从其他的信息估计的振幅的平均值的估计值来近似地决定sb的方法。此时,码Csb不被输入。以下,以对每个样本进行赖斯解码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)对码Csb进行解码,获得成为基准的赖斯参数sb(成为基准的可变长度编码参数)。另外,在编码装置200与解码装置400中共同地决定了根据振幅的平均值的估计值近似地决定sb的方法的情况下,通过该方法来求。
(步骤2)通过式(14)来算出阈值θ。
(步骤3)|WM[n]/W[n]|比θ越大,将赖斯参数rn设为比sb越大的值,从而通过与编码装置200的可变长度编码参数计算部260相同的方法来决定。|WM[n]/W[n]|比θ越小,将赖斯参数rn设为比sb越小的值,从而通过与编码装置200的可变长度编码参数计算部260相同的方法来决定。
(步骤4)对所有的n=1,2,…,N反复进行步骤3的处理,从而求对各XN[n]的赖斯参数rn
<可变长度解码部470>
可变长度解码部470利用在可变长度编码参数计算部460中求得的可变长度编码参数rn,对可变长度码CX进行解码,从而获得解码归一化系数串^XN[1],…,^XN[N](S470)。例如,可变长度解码部470利用在可变长度编码参数计算部460中求得的赖斯参数rn,对可变长度码CX进行解码,从而获得解码归一化系数串^XN[1],…,^XN[N]。可变长度解码部470的解码方法对应于可变长度编码部270的编码方法。
<频域序列逆归一化部411>
频域序列逆归一化部411将解码归一化系数串^XN[1],…,^XN[N]以及平滑化振幅谱包络序列W[1],…,W[N]作为输入,如
^X[n]=^XN[n]·W[n] (15)
那样,求解码系数串^X[1],…,^X[N]并输出(S411)。
<频域逆变换部410>
频域逆变换部410将解码系数串^X[1],…,^X[N]作为输入,将解码系数串^X[1],…,^X[N]变换为作为规定的时间区间的帧为单位的音响信号(时域)(S410)。
[解码装置的变形例1](从外部输入信息的例子)
另外,作为解码装置,还可以仅具有周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、以及可变长度解码部470,对解码装置除了将根据需要而输入的码Cδ与码Csb作为输入之外,还将在解码装置的外部获得的平滑化振幅谱包络序列W[1],…,W[N]、振幅谱包络序列W[1],…,W[N]、间隔T、以及根据需要还将指标S作为输入,并输出归一化系数串XN[1],…,XN[N],并在外部乘以平滑化振幅谱包络序列而变换为时域的音响信号。
<实施例2的发明效果>
可变长度编码是与编码对象的输入值的振幅可采用的范围匹配而自适应地决定码,从而提高编码效率的编码方法。在实施例2中,将作为频域的系数串的归一化系数串XN[1],…,XN[N]作为编码对象,但若利用更准确地利用在编码对象的系数串中包含的各系数的振幅的信息而求出的可变长度编码参数进行可变长度编码,则编码装置进行的可变长度编码本身的编码效率提高。但是,解码装置为了求可变长度编码参数,需要从编码装置对解码装置更准确地送出在编码对象的系数串中包含的各系数的振幅的信息,将相应地导致从编码装置向解码装置发送的码量增大。
为了抑制码量增大,需要从较少的码量的码获得在编码对象的系数串中包含的各系数的振幅的估计值的方法。由于实施例2的周期性综合包络序列WM[1],…,WM[N]高精度地近似于系数串X[1],…,X[N],因此|WM[1]/W[1]|,…,|WM[N]/W[N]|能够高精度地近似于作为可变长度编码对象的系数的XN[1],XN[2],…,XN[N]的振幅包络。也就是说,|WM[1]/W[1]|,…,|WM[N]/W[N]|成为与编码对象的各系数的振幅具有正相关的序列。
此外,用于在解码装置侧恢复|WM[1]/W[1]|,|WM[2]/W[2]|,…,|WM[N]/W[N]|所需的信息是如下的信息。
·已量化线性预测系数^α1,…,^αP的信息(码CL)
·表示间隔T的信息(码CT)
·表示值δ的信息(码Cδ)
即,根据实施例2的编码装置与解码装置,在解码装置中仅根据码CL、码CT、码Cδ的较少的信息量,就能够再现包含由于被输入到编码装置的输入音响信号的基音周期而引起的振幅的峰值的包络。
另外,实施例2的编码装置与解码装置多数情况下与进行伴随线性预测和基音预测的编码以及解码的编码装置以及解码装置一并被利用。此时,码CL和码CT是从处于编码装置200外的进行伴随线性预测和基音预测的编码的编码装置向解码装置400外的进行伴随线性预测和基音预测的解码的解码装置的码。从而,为了在解码装置侧恢复包含由于被输入到编码装置侧的输入音响信号的基音周期而引起的振幅的峰值的包络,需要从编码装置200向解码装置400发送的是码Cδ。码Cδ的码量少(分别充其量是3比特左右,即使只是1比特也能够获得效果),比与按照在编码对象的归一化序列串中包含的每个部分序列的可变长度编码参数对应的码的总码量还少。
从而,根据实施例2的编码装置、解码装置,通过较少的码量增加,就能够提高编码效率。
<实施例2的发明点>
以获得上述的效果的点考虑实施例2的编码装置、解码装置,只要其特征在于,
编码装置200具有:
周期性综合包络生成部250,生成作为频域的序列的周期性综合包络序列,该频域的序列基于作为与根据规定时间区间的输入音响信号而求出的线性预测系数码对应的频域的序列的谱包络序列、以及与根据输入音响信号求得的周期码对应的频域的周期;以及
可变长度编码部270,以越是周期性综合包络序列的值大的频域,输入音响信号的振幅越大作为前提,对源于输入音响信号的频域的序列进行编码,
解码装置400具有:
周期性综合包络生成部450,生成作为频域的序列的周期性综合包络序列,该频域的序列基于作为与线性预测系数码对应的频域的序列的谱包络序列、以及与周期码对应的频域的周期;
可变长度解码部470,以周期性综合包络序列的值越是较大的频域,音响信号的振幅越大作为前提,对可变长度码进行解码而获得频域的序列。另外,“以周期性综合包络序列的值越是较大的频域,输入音响信号的振幅越大作为前提”以及“以周期性综合包络序列的值越是较大的频域,音响信号的振幅越大作为前提”是指周期性综合包络序列在输入音响信号或音响信号的振幅的较大的频率下成为较大的值。此外,“源于输入音响信号”意味着根据输入音响信号来求或与输入音响信号对应。例如,系数串X[1],…,X[N]和归一化系数串XN[1],…,XN[N]是源于输入音响信号的频域的序列。
【实施例3】
《编码装置》
图9表示实施例3的编码装置的功能结构例子,图10表示实施例3的编码装置的处理流程。编码装置300具有谱包络序列计算部221、频域变换部110、频域序列归一化部111、周期性分析部330、周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、第二可变长度码参数计算部380、以及可变长度编码部370。编码装置300将被输入的时域的音响数字信号作为输入音响信号x(t),至少输出表示已量化线性预测系数^α1,…,^αP的码CL、表示归一化系数串XN[1],…,XN[N]的周期的间隔T的码CT、表示系数串X[1],…,X[N]或归一化系数串XN[1],…,XN[N]的周期性的程度的规定的指标S以及表示指标S的码CS、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX。频域序列归一化部111与实施例1变形例1相同。频域变换部110和周期性包络序列生成部140与实施例1相同。振幅谱包络序列计算部221、周期性综合包络生成部250、可变长度编码参数计算部260与实施例2相同。以下,说明不同的结构部分。
<周期性分析部330>
周期性分析部330将归一化系数串XN[1],…,XN[N]作为输入,求表示该归一化系数串XN[1],…,XN[N]的周期性的程度的指标S与间隔T(周期性地成为较大的值的间隔),输出指标S和表示指标S的码CS、间隔T和表示间隔T的码CT(S330)。另外,指标S与间隔T本身与实施例1变形例1的周期性分析部131相同。
然后,在编码装置300中,当指标S处于预先决定的表示周期性的程度大的范围内的情况下,可变长度编码参数计算部260计算可变长度编码参数rn,在指标S不处于预先决定的表示周期性的程度大的范围内的情况下,第二可变长度编码参数计算部380计算可变长度编码参数rn(S390)。“预先决定的表示周期性的程度大的范围”例如设为指标S是规定的阈值以上时即可。
<第二可变长度编码参数计算部380>
第二可变长度编码参数计算部380将振幅谱包络序列W[1],…,W[N]、平滑化振幅谱包络序列W[1],…,W[N]、以及归一化系数串XN[1],…,XN[N]作为输入,求出可变长度编码参数rn(S380)。可变长度编码参数计算部260的特征在于,依赖于根据周期性综合包络序列WM[1],…,WM[N]而求得的振幅值,计算可变长度编码参数rn,相对于此,第二可变长度编码参数计算部380的特征在于,依赖于从振幅谱包络序列求得的振幅值计算可变长度编码参数。以下,以对每一个样本进行赖斯编码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)如式(13)那样,作为成为基准的赖斯参数sb(成为基准的可变长度编码参数)而算出归一化系数串XN[1],…,XN[N]的各系数的振幅的平均的对数。该处理与可变长度编码参数计算部260相同。
(步骤2)通过以下式算出阈值θ。
Figure BDA0002909659800000221
θ是将振幅谱包络序列的各值W[n]除以平滑化振幅谱包络序列的各值W[n]的值的振幅的平均的对数。
(步骤3)|W[n]/W[n]|比θ越大,将用于对归一化系数XN[n]进行赖斯编码的赖斯参数rn决定为比sb越大的值。|W[n]/W[n]|比θ越小,将用于对归一化系数XN[n]进行赖斯编码的赖斯参数rn决定为比sb越小的值。
(步骤4)对所有的n=1,2,…,N反复进行步骤3的处理,从而求对各XN[n]的赖斯参数rn
<可变长度编码部370>
可变长度编码部370利用可变长度编码参数rn,对归一化系数串XN[1],…,XN[N]进行可变长度编码,输出可变长度码CX(S370)。其中,当指标S处于预先决定的表示周期性的程度大的范围内的情况下,可变长度编码参数rn是由可变长度编码参数计算部260算出的可变长度编码参数rn,在指标S不处于预先决定的表示周期性的程度大的范围内的情况下,可变长度编码参数rn是由第二可变长度编码参数计算部380算出的可变长度编码参数rn
编码装置300输出表示通过这样的处理而获得的已量化线性预测系数^α1,…,^αP的码CL、表示用于表示周期性的程度的指标S的码CS、表示间隔T的码CT、以及对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX,并发送给解码侧。此外,根据需要还输出表示值δ的码Cδ以及表示成为基准的可变长度编码参数sb的码Csb,并发送给解码侧。
[编码装置的变形例1](从外部被输入信息的例子)
另外,作为编码装置,也可以仅具有周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、第二可变长度编码参数计算部380、以及可变长度编码部370,将在编码装置的外部生成的平滑化振幅谱包络序列W[1],…,W[N]、归一化系数串XN[1],…,XN[N]、间隔T作为输入,根据需要还将振幅谱包络序列W[1],…,W[N]、指标S作为输入,并输出可变长度码CX
[编码装置的变形例2](根据系数串X[n]求出间隔T的例子)
在上述的周期性分析部330中将归一化系数串XN[1],…,XN[N]作为输入来求间隔T,但在周期性分析部330也可以将频域变换部110输出的系数串X[1],…,X[N]作为输入而求间隔T。此时,通过与实施例1的周期性分析部130相同的方法来求间隔T。
《解码装置》
图11表示实施例3的解码装置的功能结构例子,图12表示实施例3的解码装置的处理流程。解码装置500具有谱包络序列计算部421、指标解码部530、周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、第二可变长度编码参数计算部580、可变长度解码部570、频域序列逆归一化部411、以及频域逆变换部410。解码装置500接受表示已量化线性预测系数^α1,…,^αP的码CL、表示指标S的码CS、表示间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX,输出音响信号。另外,根据需要还接受表示值δ的码Cδ、以及表示成为基准的可变长度编码参数sb的码Csb。谱包络序列计算部421、周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、频域序列逆归一化部411、频域逆变换部410与实施例2相同。以下,说明不同的结构部。
<指标解码部530>
指标解码部530对码CS进行解码,获得指标S。在解码装置500中,当指标S处于预先决定的表示周期性的程度大的范围内的情况下,可变长度编码参数计算部460计算可变长度编码参数rn,在指标S不处于预先决定的表示周期性的程度大的范围内的情况下,第二可变长度编码参数计算部580计算可变长度编码参数rn(S590)。“预先决定的表示周期性的程度大的范围”是例与编码装置300相同的范围。
<第二可变长度编码参数计算部580>
第二可变长度编码参数计算部580将振幅谱包络序列W[1],…,W[N]、平滑化振幅谱包络序列W[1],…,W[N]以及码Csb作为输入,求可变长度编码参数rn(S580)。其中,在能够根据被传送到解码装置500的其他的信息而估计振幅的平均值的情况下,也可以预先决定基于根据其他的信息估计的振幅的平均值的估计值,近似地决定sb的方法。此时,码Csb不被输入。以下,以对每一个样本进行赖斯解码的情况为例,说明可变编码参数的计算方法。
(步骤1)对码Csb进行解码,获得成为基准的赖斯参数sb(成为基准的可变长度编码参数)。另外,在编码装置300与解码装置500中共同地决定了根据振幅的估计值近似地决定sb的方法的情况下,通过该方法来求出。
(步骤2)通过式(16)算出阈值θ。
(步骤3)|WM[n]/W[n]|比θ越大,将赖斯参数rn设为比sb越大的值,从而通过与编码装置300的第二可变长度编码参数计算部380相同的方法来决定。|WM[n]/W[n]|越是比θ小,将赖斯参数rn设为越比sb小的值,从而通过与编码装置300的第二可变长度编码参数计算部380相同的方法来决定。
(步骤4)对所有的n=1,2,…,N反复进行步骤3的处理,从而求对各XN[n]的赖斯参数rn
<可变长度解码部570>
可变长度解码部570利用可变长度编码参数rn,对可变长度码CX进行解码而求解码归一化系数串^XN[1],…,^XN[N](S570)。其中,在指标S处于预先决定的表示周期性的程度大的范围内的情况下,可变长度编码参数rn是由可变长度编码参数计算部460算出的可变长度编码参数rn,在指标S不处于预先决定的表示周期性的程度大的范围内的情况下,,可变长度编码参数rn是由第二可变长度编码参数计算部580算出的可变长度编码参数rn
[解码装置的变形例1](从外部被输入信息的例子)
另外,作为解码装置,也可以仅具有周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、第二可变长度编码参数计算部580、以及可变长度解码部570,对解码装置除了根据需要而将码Cδ和码Csb作为输入之外,还将在解码装置的外部获得的平滑化振幅谱包络序列W[1],…,W[N]、振幅谱包络序列W[1],…,W[N]、间隔T、指标S作为输入,输出归一化系数串XN[1],…,XN[N],并在外部乘以平滑化振幅谱包络序列而变换为时域的音响信号。
<实施例3的发明效果>
在输入音响信号的周期性的程度小的情况下,由输入音响信号的基音周期引起的振幅的峰值小。因此,实施例3的编码装置、解码装置在成为编码的对象的音响信号的周期性的程度大的情况下,利用周期性综合包络序列求可变长度编码参数,在成为编码的对象的音响信号的周期性的程度不大的情况下,利用振幅谱包络序列求可变长度编码参数,因此有能够利用更适当的可变长度编码参数进行可变长度编码,能够提高编码精度的效果。
在上述的实施例1~3中,说明了关于振幅谱包络序列、平滑化振幅谱包络序列、周期性综合包络序列等,利用振幅的序列的例子,但也可以代替振幅的序列而利用功率的序列,即利用功率谱包络序列、平滑化功率谱包络序列、作为功率的序列的周期性综合包络序列作为W[n]、W[n]、WM[n]。
[程序、记录介质]
上述的各种处理不仅根据记载时序地执行,也可以根据执行处理的装置的处理能力或需要,并列地或者单独执行。此外,在不脱离本发明的宗旨的范围内当然可以进行适当变更。
此外,在通过计算机来实现上述的结构的情况下,通过程序来记述各装置应有的功能的处理内容。然后,通过由计算机执行该程序,从而在计算机上实现上述处理功能。
记述了该处理内容的程序能够预先记录在计算机中可读取的记录介质中。作为计算机中可读取的记录介质,例如可以是磁记录介质、光盘、光磁记录介质、半导体存储器等任意介质。
此外,该程序的流通通过例如将记录了该程序的DVD、CD-ROM等可移动型记录介质进行销售、转让、出租等而进行。进而,也可以设为如下的结构:通过将该程序预先存储于服务器计算机的存储装置中,并经由网络从服务器计算机向其他计算机转发该程序,从而使该程序流通。
执行这样的程序的计算机例如首先将记录在可移动型记录介质中的程序或从服务器计算机转发的程序暂时存储在自己的存储装置中。然后,在执行处理时,该计算机读取在自己的记录介质中存储的程序,执行按照所读取的程序的处理。此外,作为该程序的其他的执行方式,也可以设为由计算机从可移动型记录介质直接读取程序,并执行按照该程序的处理,进而,也可以设为在每次该程序从服务器计算机被转发到该计算机时,依次执行按照接受到的程序的处理。此外,也可以设为如下的结构:不进行程序从服务器计算机向该计算机的转发,而是仅通过其执行指示与结果取得来实现处理功能的、所谓的ASP(应用服务提供商(Application Service Provider))型的服务,执行上述的处理。另外,设本方式中的程序中包含用于电子计算机进行的处理且基于程序的信息(不是对计算机的直接的指令但具有规定计算机的处理的性质的数据等)。
此外,在该方式中,设为通过在计算机上执行规定的程序,从而构成本装置,但也可以设为通过硬件来实现这些处理内容的至少一部分。
标号说明
100、101 周期性综合包络序列生成装置
110 频域变换部
111 频域序列归一化部
120、121、22、421 谱包络序列计算部
130、131、230、330 周期性分析部
140、441 周期性包络序列生成部
150、250、450 周期性综合包络生成部
200、300 编码装置
260、360、460 可变长度编码参数计算部
270、370 可变长度编码部
380、580 第二可变长度编码参数计算部
400、500 解码装置
410 频域逆变换部
411 频域序列逆归一化部
470、570 可变长度解码部
530 指标解码部

Claims (10)

1.一种解码装置,具有:
周期性综合包络生成部,对与线性预测系数码对应的频域的序列即谱包络序列,进行基于与周期码对应的频域的周期的样本值的变更,从而生成作为频域的序列的周期性综合包络序列;
指标解码部,对被输入的指标码进行解码而获得表示周期性的程度的指标;
可变长度编码参数计算部,从所述周期性综合包络序列,计算依赖于振幅值的可变长度编码参数;
第二可变长度编码参数计算部,根据所述谱包络序列,计算依赖于振幅值的可变长度编码参数;以及
可变长度解码部,利用可变长度编码参数,进行解码,
在所述指标处于预先决定的表示周期性的程度大的范围内的情况下,所述可变长度解码部利用由所述可变长度编码参数计算部计算的可变长度编码参数进行解码,
在所述指标不处于所述表示周期性的程度大的范围内的情况下,所述可变长度解码部利用由所述第二可变长度编码参数计算部计算的可变长度编码参数进行解码。
2.一种解码装置,具有:
周期性综合包络生成部,对与线性预测系数码对应的频域的序列即谱包络序列,进行基于与周期码对应的频域的周期的样本值的变更,从而生成作为频域的序列的周期性综合包络序列;
指标解码部,对被输入的指标码进行解码而获得表示周期性的程度的指标;以及
可变长度解码部,对可变长度码进行解码而获得频域的序列,
在所述指标处于预先决定的表示周期性的程度大的范围内的情况下,所述可变长度解码部以越是所述周期性综合包络序列的值大的频率,音响信号的振幅越大作为前提,对所述可变长度码进行解码而获得频域的序列,
在所述指标不处于预先决定的表示周期性的程度大的范围内的情况下,所述可变长度解码部以所述谱包络序列的值越是大的频率,音响信号的振幅越大作为前提,对所述可变长度码进行解码而获得频域的序列。
3.如权利要求1或2的任一项所述的解码装置,其特征在于,
所述周期性综合包络生成部将与周期码对应的频域的所述周期越大,将所述谱包络序列中的至少样本的索引处在与周期码对应的频域的所述周期的整数倍以及周期的整数倍的附近的样本的值变更为越大从而所获得的序列,设为周期性综合包络序列。
4.如权利要求1或2所述的解码装置,其特征在于,
所述周期性综合包络生成部将与周期码对应的频域的所述周期越大,将所述谱包络序列中的样本的索引处在与周期码对应的频域的所述周期的整数倍的附近的越多的样本的值进行变更从而所获得的序列,设为周期性综合包络序列。
5.一种解码方法,具有以下的步骤:
周期性综合包络生成步骤,对与线性预测系数码对应的频域的序列即谱包络序列,进行基于与周期码对应的频域的周期的样本值的变更,从而生成作为频域的序列的周期性综合包络序列;
指标解码步骤,对被输入的指标码进行解码而获得表示周期性的程度的指标;
可变长度编码参数计算步骤,根据所述周期性综合包络序列,计算依赖于振幅值的可变长度编码参数;
第二可变长度编码参数计算步骤,根据所述谱包络序列,计算依赖于振幅值的可变长度编码参数;以及
可变长度解码步骤,利用可变长度编码参数,进行解码,
在可变长度解码步骤中,
在所述指标处于预先决定的表示周期性的程度大的范围内的情况下,利用在所述可变长度编码参数计算步骤中计算的可变长度编码参数进行解码,
在所述指标不处于所述表示周期性的程度大的范围内的情况下,利用在所述第二可变长度编码参数计算步骤中计算的可变长度编码参数进行解码。
6.一种解码方法,具有以下的步骤:
周期性综合包络生成步骤,对与线性预测系数码对应的频域的序列即谱包络序列,进行基于与周期码对应的频域的周期的样本值的变更,从而生成作为频域的序列的周期性综合包络序列;
指标解码步骤,对被输入的指标码进行解码而获得表示周期性的程度的指标;以及
可变长度解码步骤,对可变长度码进行解码而获得频域的序列,
在可变长度解码步骤中,
在所述指标处于预先决定的表示周期性的程度大的范围内的情况下,以越是所述周期性综合包络序列的值大的频率,音响信号的振幅越大作为前提,对所述可变长度码进行解码而获得频域的序列,
在所述指标不处于预先决定的表示周期性的程度大的范围内的情况下,以越是所述谱包络序列的值大的频率,音响信号的振幅越大作为前提,对所述可变长度码进行解码而获得频域的序列。
7.如权利要求5或6所述的解码方法,其特征在于,
所述周期性综合包络生成步骤将与周期码对应的频域的所述周期越大,将所述谱包络序列中的至少样本的索引处在与周期码对应的频域的所述周期的整数倍以及周期的整数倍的附近的样本的值变更为越大从而所获得的序列设为周期性综合包络序列。
8.如权利要求5或6所述的解码方法,其特征在于,
所述周期性综合包络生成步骤将与周期码对应的频域的所述周期越大,将所述谱包络序列中的样本的索引处在与周期码对应的频域的所述周期的整数倍的附近的越多的样本的值进行变更从而所获得的序列设为周期性综合包络序列。
9.一种解码程序,使计算机起到权利要求1或2所述的解码装置的作用。
10.一种计算机可读取的记录介质,记录了用于使计算机起到权利要求1或2所述的解码装置的作用的解码程序。
CN202110081890.3A 2014-05-01 2015-02-20 解码装置、解码方法、解码程序、记录介质 Active CN112820304B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110081890.3A CN112820304B (zh) 2014-05-01 2015-02-20 解码装置、解码方法、解码程序、记录介质

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014-094881 2014-05-01
JP2014094881 2014-05-01
CN201580022887.7A CN106663437B (zh) 2014-05-01 2015-02-20 编码装置、解码装置、编码方法、解码方法、记录介质
PCT/JP2015/054717 WO2015166693A1 (ja) 2014-05-01 2015-02-20 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
CN202110081890.3A CN112820304B (zh) 2014-05-01 2015-02-20 解码装置、解码方法、解码程序、记录介质

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580022887.7A Division CN106663437B (zh) 2014-05-01 2015-02-20 编码装置、解码装置、编码方法、解码方法、记录介质

Publications (2)

Publication Number Publication Date
CN112820304A true CN112820304A (zh) 2021-05-18
CN112820304B CN112820304B (zh) 2024-09-13

Family

ID=54358434

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202110083487.4A Active CN112820305B (zh) 2014-05-01 2015-02-20 编码装置、编码方法、编码程序、记录介质
CN202110081890.3A Active CN112820304B (zh) 2014-05-01 2015-02-20 解码装置、解码方法、解码程序、记录介质
CN201580022887.7A Active CN106663437B (zh) 2014-05-01 2015-02-20 编码装置、解码装置、编码方法、解码方法、记录介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202110083487.4A Active CN112820305B (zh) 2014-05-01 2015-02-20 编码装置、编码方法、编码程序、记录介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580022887.7A Active CN106663437B (zh) 2014-05-01 2015-02-20 编码装置、解码装置、编码方法、解码方法、记录介质

Country Status (9)

Country Link
US (4) US10199046B2 (zh)
EP (4) EP3509063B1 (zh)
JP (4) JP6276845B2 (zh)
KR (3) KR101861781B1 (zh)
CN (3) CN112820305B (zh)
ES (4) ES2732859T3 (zh)
PL (4) PL3696812T3 (zh)
TR (1) TR201909906T4 (zh)
WO (1) WO2015166693A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9911427B2 (en) 2014-03-24 2018-03-06 Nippon Telegraph And Telephone Corporation Gain adjustment coding for audio encoder by periodicity-based and non-periodicity-based encoding methods
KR102529747B1 (ko) * 2016-05-23 2023-05-08 삼성에스디아이 주식회사 무선 충전 장치 및 방법
CN110771045B (zh) * 2017-06-22 2024-03-29 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、以及记录介质
CN111279645B (zh) * 2017-08-11 2022-09-27 联想(北京)有限公司 对参考信号接收功率进行编码

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01314300A (ja) * 1988-06-14 1989-12-19 Nec Corp 音声符号化復号化方法とその装置
US5933803A (en) * 1996-12-12 1999-08-03 Nokia Mobile Phones Limited Speech encoding at variable bit rate
WO2009011438A1 (ja) * 2007-07-18 2009-01-22 Wakayama University 周期信号処理方法、周期信号変換方法、周期信号処理装置および周期信号の分析方法
CN101552007A (zh) * 2004-03-01 2009-10-07 杜比实验室特许公司 多信道音频编码
JP2012128022A (ja) * 2010-12-13 2012-07-05 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US20130311192A1 (en) * 2011-01-25 2013-11-21 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168094A (ja) * 1982-03-29 1983-10-04 藤崎 博也 音声分析処理方式
JPS5994795A (ja) * 1982-11-22 1984-05-31 藤崎 博也 音声分析処理方式
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
IT1277194B1 (it) * 1995-06-28 1997-11-05 Alcatel Italia Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato
US6345145B1 (en) * 1995-08-25 2002-02-05 Sony Corporation Signal recording/reproducing method and apparatus, signal record medium and signal transmission/reception method and apparatus
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
DE69932786T2 (de) * 1998-05-11 2007-08-16 Koninklijke Philips Electronics N.V. Tonhöhenerkennung
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
US8396717B2 (en) * 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
US7761900B2 (en) * 2006-08-02 2010-07-20 Clarendon Foundation, Inc. Distribution of content and advertisement
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
CN101192408A (zh) * 2006-11-24 2008-06-04 华为技术有限公司 选择导谱频率系数矢量量化的方法及装置
KR100868763B1 (ko) * 2006-12-04 2008-11-13 삼성전자주식회사 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
US8688437B2 (en) * 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
CN102341844B (zh) * 2009-03-10 2013-10-16 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置
JP5223786B2 (ja) * 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US9269366B2 (en) * 2009-08-03 2016-02-23 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
CN102194458B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 频带复制方法、装置及音频解码方法、系统
RU2559709C2 (ru) * 2011-02-16 2015-08-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
RU2571561C2 (ru) * 2011-04-05 2015-12-20 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
PL3252762T3 (pl) * 2012-10-01 2019-07-31 Nippon Telegraph And Telephone Corporation Sposób kodowania, koder, program i nośnik zapisu

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01314300A (ja) * 1988-06-14 1989-12-19 Nec Corp 音声符号化復号化方法とその装置
US5933803A (en) * 1996-12-12 1999-08-03 Nokia Mobile Phones Limited Speech encoding at variable bit rate
CN101552007A (zh) * 2004-03-01 2009-10-07 杜比实验室特许公司 多信道音频编码
WO2009011438A1 (ja) * 2007-07-18 2009-01-22 Wakayama University 周期信号処理方法、周期信号変換方法、周期信号処理装置および周期信号の分析方法
JP2012128022A (ja) * 2010-12-13 2012-07-05 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
US20130311192A1 (en) * 2011-01-25 2013-11-21 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding

Also Published As

Publication number Publication date
JPWO2015166693A1 (ja) 2017-04-20
CN106663437A (zh) 2017-05-10
KR101839016B1 (ko) 2018-03-16
US10607616B2 (en) 2020-03-31
US20190096414A1 (en) 2019-03-28
JP6412993B2 (ja) 2018-10-24
JP6744471B2 (ja) 2020-08-19
WO2015166693A1 (ja) 2015-11-05
EP3139380A4 (en) 2017-11-01
US11164589B2 (en) 2021-11-02
EP3509063B1 (en) 2020-04-22
JP6595684B2 (ja) 2019-10-23
KR101861787B1 (ko) 2018-05-28
EP3139380B1 (en) 2019-04-10
US20200202876A1 (en) 2020-06-25
CN112820305A (zh) 2021-05-18
US20190096413A1 (en) 2019-03-28
EP3696812A1 (en) 2020-08-19
JP2019215587A (ja) 2019-12-19
JP2018013795A (ja) 2018-01-25
KR20180030240A (ko) 2018-03-21
PL3703051T3 (pl) 2021-11-22
EP3703051B1 (en) 2021-06-09
PL3509063T3 (pl) 2020-08-24
CN112820305B (zh) 2023-12-15
CN112820304B (zh) 2024-09-13
EP3139380A1 (en) 2017-03-08
PL3139380T3 (pl) 2019-09-30
EP3509063A2 (en) 2019-07-10
JP6276845B2 (ja) 2018-02-07
KR20160137615A (ko) 2016-11-30
TR201909906T4 (tr) 2019-07-22
KR20180030243A (ko) 2018-03-21
ES2884626T3 (es) 2021-12-10
US10199046B2 (en) 2019-02-05
KR101861781B1 (ko) 2018-05-28
EP3509063A3 (en) 2019-08-07
CN106663437B (zh) 2021-02-02
ES2790278T3 (es) 2020-10-27
PL3696812T3 (pl) 2021-09-27
JP2019003219A (ja) 2019-01-10
US10629214B2 (en) 2020-04-21
ES2883848T3 (es) 2021-12-09
ES2732859T3 (es) 2019-11-26
EP3696812B1 (en) 2021-06-09
EP3703051A1 (en) 2020-09-02
US20170040023A1 (en) 2017-02-09

Similar Documents

Publication Publication Date Title
JP6674992B2 (ja) 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant