CN110875047A - 编码装置、及其方法、记录介质、程序 - Google Patents

编码装置、及其方法、记录介质、程序 Download PDF

Info

Publication number
CN110875047A
CN110875047A CN201911086118.XA CN201911086118A CN110875047A CN 110875047 A CN110875047 A CN 110875047A CN 201911086118 A CN201911086118 A CN 201911086118A CN 110875047 A CN110875047 A CN 110875047A
Authority
CN
China
Prior art keywords
index
decoding
vector
decoded value
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911086118.XA
Other languages
English (en)
Other versions
CN110875047B (zh
Inventor
守谷健弘
镰本优
原田登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to CN201911086118.XA priority Critical patent/CN110875047B/zh
Publication of CN110875047A publication Critical patent/CN110875047A/zh
Application granted granted Critical
Publication of CN110875047B publication Critical patent/CN110875047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

解码装置包括:第一解码单元,得到与可变换为多阶的线性预测系数的系数对应的第一解码值;指标计算单元,使用全阶或者低阶的第一解码值,计算与频谱包络的大峰谷对应的指标(Q)和/或与频谱包络的小峰谷对应的指标;第二解码单元,对第二码进行解码,得到多阶的第二解码值;加法单元,在指标(Q)为规定的阈值(Th1)以上的情况和/或指标(Q’)为规定的阈值Th1’)以下的情况下,将各阶的第一解码值和第二解码值相加,得到与可变换为多阶的线性预测系数的系数对应的第三解码值,第二解码值的阶数与第一解码值的阶数相比为低阶,加法单元对于与第二解码值的阶数相比的高阶,将各阶的第一解码值原样设为第三解码值。

Description

编码装置、及其方法、记录介质、程序
本申请为以下专利申请的分案申请:申请日为2015年03月16日,申请号为201580023537.2,发明名称为“编码装置、及其方法、记录介质”。
技术领域
本发明涉及线性预测系数和可变换为线性预测系数的系数的编码技术以及解码技术。
背景技术
在语音和音乐等音响信号的编码中,使用对输入音响信号进行线性预测分析而得到的线性预测系数进行编码的方法被广泛使用。
编码装置将线性预测系数编码,将对应于线性预测系数的码发送到解码装置,以便可以在解码装置侧解码在编码处理中使用的线性预测系数的信息。在非专利文献1中,编码装置将线性预测系数变换为与线性预测系数等效的频域的参数即LSP(Line SpectrumPair,线谱对)参数的列,将编码LSP参数的列得到的LSP码送到解码装置。
说明具有以往的线性预测系数的编码装置以及解码装置的音响信号的编码装置60以及解码装置70的概要。
<以往的编码装置60>
图1表示以往的编码装置60的结构。
编码装置60包括:线性预测分析单元61、LSP计算单元62、LSP编码单元63、系数变换单元64、线性预测分析滤波器单元65、残差编码单元66。其中,接受LSP参数,编码LSP参数,输出LSP码的LSP编码单元63为线性预测系数的编码装置。
在编码装置60中,连续输入作为规定的时间区间的帧单位的输入音响信号,对每个帧进行以下的处理。以下,作为当前的处理对象的输入音响信号是第f帧,说明各部分的具体处理。将第f帧的输入音响信号设为Xf
<线性预测分析单元61>
线性预测分析单元61接受输入音响信号Xf,对输入音响信号Xf进行线性预测分析,求线性预测系数af[1],af[2],…,af[p](p为预测阶数)并输出。这里,af[i]表示对第f帧的输入音响信号Xf进行线性预测分析得到的i阶的线性预测系数。
<LSP计算单元62>
LSP计算单元62接受线性预测系数af[1],af[2],…,af[p],由线性预测系数af[1],af[2],…,af[p]求LSP(Line Spectrum Pairs)参数θf[1],θf[2],…,θf[p]并输出。这里,θf[i]是与第f帧的输入音响信号Xf对应的i阶的LSP参数。
<LSP编码单元63>
LSP编码单元63接受LSP参数θf[1],θf[2],…,θf[p],编码LSP参数θf[1],θf[2],…,θf[p],得到LSP码CLf、和与LSP码对应的量化LSP参数^θf[1],^θf[2],…,^θf[p]并输出。而且,量化LSP参数是将LSP参数量化的结果。在非专利文献1中,通过求来自LSP参数θf[1],θf[2],…,θf[p]的过去的帧的加权差分向量,将加权差分向量分为低阶侧和高阶侧两个子向量,各子向量成为来自两个码本的子向量之和那样进行编码的方法来编码,但是在编码方法中存在各种各样以往技术。因此,在LSP参数的编码中,采用非专利文献1中记载的方法、以多级方式进行向量量化的方法、标量量化的方法、将它们组合的方法等各种公知的编码方法。
<系数变换单元64>
系数变换单元64接受量化LSP参数^θf[1],^θf[2],…,^θf[p],从量化LSP参数^θf[1],^θf[2],…,^θf[p]求线性预测系数并输出。而且,因为输出的线性预测系数是与已量化的LSP参数对应的系数,所以称为量化线性预测系数。这里,将量化线性预测系数设为^af[1],^af[2],…,^af[p]。
<线性预测分析滤波器单元65>
线性预测分析滤波器单元65接受输入音响信号Xf和量化线性预测系数^af[1],^af[2],…,^af[p],得到作为基于输入音响信号Xf的量化线性预测系数^af[1],^af[2],…,^af[p]的线性预测残差的线性预测残差信号。
<残差编码单元66>
残差编码单元66接受线性预测残差信号,编码线性预测残差信号,得到残差码CRf并输出。
<以往的解码装置70>
图2表示以往的解码装置70的结构。在解码装置70中,输入帧单位的LSP码CLf和残差码CRf,以帧单位进行解码处理,得到解码音响信号^Xf
解码装置70包含残差解码单元71、LSP解码单元72、系数变换单元73、以及线性预测合成滤波器单元74。其中,接受LSP码、解码LSP码、得到并输出解码LSP参数的LSP解码单元72是线性预测系数的解码装置。
以下,设为当前的解码处理对象的LSP码和残差码各自为与第f帧对应的LSP码CLf和残差码CRf,说明各部分的具体处理。
<残差解码单元71>
残差解码单元71接受残差码CRf,解码残差码CRf,得到解码线性预测残差信号并输出。
<LSP解码单元72>
LSP解码单元72接受LSP码CLf,解码LSP码CLf,得到解码LSP参数^θf[1],^θf[2],…,^θf[p]并输出。如果编码装置60输出的LSP码CLf无错误地被输入到解码装置70,则在LSP解码单元72中得到的解码LSP参数与在编码装置60的LSP编码单元63中得到的量化LSP参数相同。
<系数变换单元73>
系数变换单元73接受解码LSP参数^θf[1],^θf[2],…,^θf[p],将解码LSP参数^θf[1],^θf[2],…,^θf[p]变换为线性预测系数并输出。因为输出的线性预测系数是与通过解码得到的LSP参数对应的系数,所以表示为称为解码线性预测系数的^af[1],^af[2],…,^af[p]。
<线性预测合成滤波器单元74>
线性预测合成滤波器单元74接受解码线性预测系数^af[1],^af[2],…,^af[p]和解码线性预测残差信号,对解码线性预测残差信号进行基于解码线性预测系数^af[1],^af[2],…,^af[p]的线性预测合成,生成解码音响信号^Xf并输出。
现有技术文献
非专利文献
非专利文献1:"ITU-T Recommendation G.729",ITU,1996
发明内容
发明要解决的课题
在以往技术中,在全部帧中以相同的编码方法编码LSP参数。因此,存在在频谱变动大的情况下,不能如频谱变动小的情况那样进行高精度地编码的问题。
本发明的目的是提供抑制作为整体码量的增大,并且对于频谱的变动大的帧也可以对可变换为线性预测系数的系数进行高精度地编码以及解码的技术。
用于解决课题的手段
为了解决上述的课题,按照本发明的一个方式,解码装置,包括:
第一解码单元,对第一码进行解码,得到与可变换为多阶的线性预测系数的系数对应的第一解码值;指标计算单元,使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;第二解码单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;以及加法单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到与可变换为多阶的线性预测系数的系数对应的第三解码值,所述第二解码值的阶数与所述第一解码值的阶数相比为低阶,所述加法单元对于与所述第二解码值的阶数相比的高阶,将各阶的所述第一解码值原样设为第三解码值。
为了解决上述的课题,按照本发明的另一个方式,解码装置,包括:
第一解码单元,对第一码进行解码,得到与可变换为多阶的线性预测系数的系数对应的第一解码值;指标计算单元,使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;第二解码单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;以及加法单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到与可变换为多阶的线性预测系数的系数对应的第三解码值,所述第二解码单元对所述指标Q越大,以及/或者,所述指标Q’越小,具有越多的比特数的所述第二码进行解码,从越多的解码值的候选得到所述第二解码值。
为了解决上述的课题,按照本发明的另一个方式,解码方法,包括:
第一解码步骤,第一解码单元对第一码进行解码,得到对应于可变换为多阶的线性预测系数的系数的第一解码值;指标计算步骤,所述指标计算单元使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;第二解码步骤,第二解码单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;加法步骤,加法单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到对应于可变换为多阶的线性预测系数的系数的第三解码值,所述第二解码值的阶数与所述第一解码值的阶数相比为低阶,所述加法步骤对于与所述第二解码值的阶数相比的高阶,将各阶的所述第一解码值原样设为第三解码值。
为了解决上述的课题,按照本发明的另一个方式,解码方法,包括:
第一解码步骤,第一解码单元对第一码进行解码,得到对应于可变换为多阶的线性预测系数的系数的第一解码值;指标计算步骤,所述指标计算单元使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;
第二解码步骤,第二解码单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;加法步骤,加法单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到对应于可变换为多阶的线性预测系数的系数的第三解码值,所述第二解码步骤对所述指标Q越大,以及/或者,所述指标Q’越小,具有越多的比特数的所述第二码进行解码,从越多的解码值的候选得到所述第二解码值。
发明的效果
按照本发明,具有可以抑制作为整体码量的增大,并且对于频谱的变动大的帧也可以对可变换为线性预测系数的系数进行高精度地编码以及解码的效果。
附图说明
图1是表示以往的编码装置的结构的图。
图2是表示以往的解码装置的结构的图。
图3是第一实施方式的编码装置的功能方框图。
图4是表示第一实施方式的编码装置的处理流程的例子的图。
图5是第一实施方式的解码装置的功能方框图。
图6是表示第一实施方式的解码装置的处理流程的例子的图。
图7是第二实施方式的线性预测系数编码装置的功能方框图。
图8是表示第二、第三实施方式的线性预测系数编码装置的处理流程的例子的图。
图9是第二实施方式的线性预测系数编码装置的预测对应编码单元的功能方框图。
图10是第二实施方式的线性预测系数解码装置的功能方框图。
图11是表示第二、第三实施方式的线性预测系数解码装置的处理流程的例子的图。
图12是第二实施方式的线性预测系数解码装置的预测对应解码单元的功能方框图。
图13是第三实施方式的线性预测系数编码装置的功能方框图。
图14是第三实施方式的线性预测系数解码装置的功能方框图。
具体实施方式
以下,说明本发明的实施方式。而且,在以下的说明中使用的附图中,对具有相同的功能的结构单元或进行相同的处理的步骤记为相同的标号,省略重复说明。在以下的说明中,在文本中使用的记号「^」,「~」,「」等,本来是应记载在紧后的文字的正上方的记号,但是由于文本记法的限制,记载在紧接该文字的之前。在式中,这些记号记述在本来的位置。而且,以向量和矩阵的各元素单位进行的处理,只要没有特别指明,设为对该向量或该矩阵的全部元素适用。
<第一实施方式>
以下,以与以往不同的点为中心进行说明。
<第一实施方式的编码装置100>
图3表示具有第一实施方式的线性预测系数的编码装置100的音响信号的编码装置的功能方框图,图4表示该处理流程的例子。
编码装置100包括:线性预测分析单元61、LSP计算单元62、LSP编码单元63、系数变换单元64、线性预测分析滤波器单元65和残差编码单元66,进而包括:指标计算单元107、校正编码单元108和加法单元109。其中,接受LSP参数,编码LSP参数,输出LSP码CLf和校正LSP码CL2f的部分,即,包含LSP编码单元63、指标计算单元107和校正编码单元108的部分是线性预测系数的编码装置150。
线性预测分析单元61、LSP计算单元62、LSP编码单元63、系数变换单元64、线性预测分析滤波器单元65和残差编码单元66中的处理,与在以往技术中说明的内容相同的,分别对应于图4的s61~s66。
编码装置100接受音响信号Xf,得到LSP码CLf、校正码CL2f以及残差码CRf
<指标计算单元107>
指标计算单元107接受量化LSP参数^θf[1],^θf[2],…,^θf[p],使用量化LSP参数^θf[1],^θf[2],…,^θf[p],计算与频谱的变动大小的大变动对应的指标Q,即,频谱包络的峰谷越大则变得越大的指标Q,以及/或者,与频谱的变动大小的小变动对应的指标Q’,即,频谱包络的峰谷越大则变得越小的指标Q’,(s107)。指标计算单元107根据指标Q以及/或者Q’的大小输出控制信号C,使得在校正编码单元108中执行编码处理,或者,以规定的比特数执行编码处理。而且,指标计算单元107根据指标Q以及/或者Q’的大小输出控制信号C,使得在加法单元109执行加法处理。
在本实施方式中,利用由量化LSP参数^θf[1],^θf[2],…,^θf[p]算出的频谱的变动的大小决定是否编码LSP编码单元63的量化误差,即,基于LSP参数θf[1],θf[2],…,θf[p]和量化LSP参数^θf[1],^θf[2],…,^θf[p]的对应的每个阶数的差分值的列。“频谱的变动的大小”也可以改称为“频谱包络的峰谷的大小”,或者,“功率频谱包络的振幅的凹凸的变化的大小”。
以下,说明控制信号C的生成方法。
一般地,LSP参数是与输入音响信号的功率频谱包络存在相关性的频域的参数列,LSP参数的各值与输入音响信号的功率频谱包络的极值的频率位置相关。在将LSP参数设为θ[1],θ[2],…,θ[p]时,在θ[i]和θ[i+1]之间的频率位置存在功率频谱包络的极值,该极值的周围的接线的倾斜度越陡峭,θ[i]和θ[i+1]的间隔(即,(θ[i+1]-θ[i])的值)越小。即,功率频谱包络的振幅的凹凸越陡峭,对于各i,θ[i]和θ[i+1]的间隔越不均匀,即,LSP参数的间隔的方差越大。相反,在基本没有功率频谱包络的凹凸的情况下,对于各i,θ[i]和θ[i+1]的间隔接近均等间隔。
由此,与LSP参数的间隔的方差对应的指标大,意味着功率频谱包络的振幅的凹凸的变化大。而且,与LSP参数的间隔的最小值对应的指标小,意味着功率频谱包络的振幅的凹凸的变化大。
量化LSP参数^θf[1],^θf[2],…,^θf[p]是将LSP参数θf[1],θf[2],…,θf[p]量化而得到的结果,若LSP码从编码装置无错误地被输入到解码装置,则解码LSP参数^θf[1],^θf[2],…,^θf[p]与量化LSP参数^θf[1],^θf[2],…,^θf[p]相同,所以对于量化LSP参数^θf[1],^θf[2],…,^θf[p]或解码LSP参数^θf[1],^θf[2],…,^θf[p],与LSP参数θf[1],θf[2],…,θf[p]同样的性质成立。
因此,可以分别使用与量化LSP参数^θf[1],^θf[2],…,^θf[p]的间隔的方差对应的值作为频谱包络的峰谷越大则变得越大的指标Q,使用量化LSP参数^θf[1],^θf[2],…,^θf[p]的阶数相邻的(相邻)量化LSP参数的差分(^θf[i+1]-^θf[i])的最小值作为频谱包络的峰谷越大则变得越小的指标Q’。
频谱包络的峰谷越大,其越大的指标Q,例如通过表示规定的阶数T(T≦p)以下的量化LSP参数^θf[1],^θf[2],…,^θf[p]的间隔的方差的指标Q,即,
Figure BDA0002265454330000081
Figure BDA0002265454330000082
来计算。
而且,频谱包络的峰谷越大则变得越小的指标Q’,例如通过表示规定的阶数T(T≦p)以下的量化LSP参数^θf[1],^θf[2],…,^θf[p]的阶数相邻的量化LSP参数的间隔的最小值的指标Q’,即,
Figure BDA0002265454330000091
或者,表示量化LSP参数^θf[1],^θf[2],…,^θf[p]的阶数相邻的量化LSP参数的间隔、以及最低阶的量化LSP参数的值中的最小值的指标Q’,即,通过
Figure BDA0002265454330000092
来计算。LSP参数是从0至π之间阶数顺序存在的参数,所以该式的最低阶的量化LSP参数^θf[1]意味着^θf[1]和0的间隔(^θf[1]-0)。
指标计算单元107在频谱包络的峰谷大于规定的基准的情况,即,在上述的例子中(A-1)指标Q为规定的阈值Th1以上的情况,以及/或者,(B-1)指标Q’为规定的阈值Th1’以下的情况下,输出表示在校正编码单元108以及加法单元109中执行校正编码处理的控制信号C,在除此以外的情况下,输出表示在校正编码单元108以及加法单元109中不执行校正编码处理的控制信号C。这里,“(A-1)的情况,以及/或者,(B-1)的情况”是包含三个情况的表现,即,仅求指标Q,视为(A-1)的条件的情况;仅求指标Q’,满足(B-1)的条件的情况;以及求指标Q和指标Q’两方,满足(A-1)和(B-1)两方的条件的情况。当然,即使是判断是否满足(A-1)的条件的情况下,也可以求指标Q’,即使是判定是否满足(B-1)的条件的情况,也可以求指标Q。以下的记载中的“以及/或者”也同样。
而且,指标计算单元107也可以构成为在(A-1)以及/或者(B-1)的情况下,输出表示规定的比特数的正的整数(或者表示正的整数的码)作为控制信号C,在除此以外的情况下,输出0作为控制信号C。
而且,在加法单元109设为在接受到控制信号C时执行加法处理,在校正编码单元108中接受了控制信号C时执行编码处理的结构的情况下,指标计算单元107也可以设为在(A-1)以及/或者(B-1)以外的情况下,不输出控制信号C的结构。
<校正编码单元108>
校正编码单元108接受控制信号C、LSP参数θf[1],θf[2],…,θf[p]、和量化LSP参数^θf[1],^θf[2],…,^θf[p]。校正编码单元108在接受了表示执行校正编码处理的控制信号C、或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况下,总之,频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,编码LSP编码单元63的量化误差,即,作为LSP参数θf[1],θf[2],…,θf[p]和量化LSP参数^θf[1],^θf[2],…,^θf[p]的各阶的差分的θf[1]-^θf[1],θf[2]-^θf[2],…,θf[p]-^θf[p],得到校正LSP码CL2f(s108)并输出。而且,校正编码单元108得到与校正LSP码对应的量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]并输出。作为进行编码的方法,例如使用公知的向量量化即可。
例如,校正编码单元108在未图示的校正向量码本中存储的多个候选校正向量的中,搜索最接近差分θf[1]-^θf[1],θf[2]-^θf[2],…,θf[p]-^θf[p]的候选校正向量,将与该候选校正向量对应的校正向量码作为校正LSP码CL2f,将该候选校正向量作为量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]。而且,未图示的校正向量码本预先存储在编码装置内,在校正向量码本中,预先存储各候选校正向量和与该各候选校正向量对应的校正向量码。
在接受了表示不执行校正编码处理的控制信号C或0作为控制信号C的情况下,总之,在频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,校正编码单元108不进行θf[1]-^θf[1],θf[2]-^θf[2],…,θf[p]-^θf[p]的编码,不输出校正LSP码CL2f、量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]。
<加法单元109>
加法单元109接受控制信号C和量化LSP参数^θf[1],^θf[2],…,^θf[p]。进而,在接受了表示执行校正编码处理的控制信号C,或接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,在频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,还接受量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]。
加法单元109在接受了表示执行校正编码处理的控制信号C或接受了正的整数(或者表示正的整数的码)作为控制信号C的情况下,总之,在频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,将量化LSP参数^θf[1],^θf[2],…,^θf[p]和量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]相加(s109)而得到的^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[p]+^θdifff[p]输出作为在系数变换单元64中的量化LSP参数^θf[1],^θf[2],…,^θf[p]。
加法单元109在接受了表示不执行校正编码处理的控制信号C或者0作为控制信号C的情况,总之,在频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,将接受的量化LSP参数^θf[1],^θf[2],…,^θf[p]原样输出到系数变换单元64。因此,LSP编码单元63输出的各阶的量化LSP参数^θf[1],^θf[2],…,^θf[p]原样成为在系数变换单元64中使用的量化LSP参数。
<第一实施方式的解码装置200>
以下,以与以往不同的点为中心进行说明。
图5是具有第一实施方式的线性预测系数的解码装置200的音响信号的解码装置的功能方框图,图6表示该处理流程的例子。
解码装置200包括:残差解码单元71、LSP解码单元72、系数变换单元73以及线性预测合成滤波器单元74,进而包括:指标计算单元205、校正解码单元206以及加法单元207。其中,接受LSP码CLf和校正LSP码CL2f,将LSP码CLf和校正LSP码CL2f解码,得到解码LSP参数并输出的部分,即,包含LSP解码单元72、指标计算单元205、校正解码单元206以及加法单元207的部分是线性预测系数的解码装置250。
解码装置200接受LSP码CLf、校正LSP码CL2f和残差码CRf,生成解码音响信号^Xf并输出。
<指标计算单元205>
指标计算单元205接受解码LSP参数^θf[1],^θf[2],…,^θf[p],使用解码LSP参数^θf[1],^θf[2],…,^θf[p],计算对应于解码LSP参数^θf[1],^θf[2],…,^θf[p]的频谱的变动的大变动所对应的指标Q,即,频谱包络的峰谷越大则变得越大的指标Q,以及/或者,频谱的变动的小所对应的指标Q’,即,频谱包络的峰谷越大则变得越小的指标Q’(s205)。指标计算单元205输出控制信号C,以便根据指标Q以及/或者Q’的大小,在校正解码单元206中执行解码处理,或者,以规定的比特数执行解码处理。而且,指标计算单元205输出控制信号C,以便根据指标Q以及/或者Q’的大小,在加法单元207中执行加法处理。指标Q以及Q’与在指标计算单元107中说明的指标是相同的,也可以使用解码LSP参数^θf[1],^θf[2],…,^θf[p]取代量化LSP参数^θf[1],^θf[2],…,^θf[p],用同样的方法进行计算。
指标计算单元205在频谱包络的峰谷大于规定的基准的情况,即,在上述的例子中(A-1)指标Q为规定的阈值Th1以上的情况,以及/或者,(B-1)指标Q’为规定的阈值Th1’以下的情况下,输出表示在校正解码单元206以及加法单元207中执行校正解码处理的控制信号C,在除此以外的情况下,输出表示在校正解码单元206以及加法单元207中不执行校正解码处理的控制信号C。
而且,指标计算单元205也可以构成为在(A-1)以及/或者(B-1)的情况下,输出表示规定的比特数的正的整数(或者表示正的整数的码)作为控制信号C,在除此以外的情况下,输出0作为控制信号C。
而且,也可以在设为在加法单元207中接受了控制信号C时执行加法处理,在校正解码单元206中接受了控制信号C时执行解码处理的结构的情况下,指标计算单元205设为在(A-1)以及/或者(B-1)以外的情况下,不输出控制信号C的结构。
<校正解码单元206>
校正解码单元206接受校正LSP码CL2f和控制信号C。校正解码单元206在接受了表示执行校正解码处理的控制信号C、或者正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,在频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,将校正LSP码CL2f解码,得到解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p](s206)并输出。作为进行解码的方法,使用与在编码装置100的校正编码单元108中的编码方法对应的解码方法。
例如,校正解码单元206从未图示的校正向量码本中存储的多个校正向量码中,搜索与被输入到解码装置200的校正LSP码CL2f对应的校正向量码,将与搜索到的校正向量码对应的候选校正向量作为解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]输出。而且,未图示的校正向量码本被存储在解码装置内,在校正向量码本中,存储各候选校正向量和与该各候选校正向量对应的校正向量码。
在接受了表示不执行校正解码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,在频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,校正解码单元206不进行校正LSP码CL2f的解码,不输出解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]。
<加法单元207>
加法单元207接受控制信号C和解码LSP参数^θf[1],^θf[2],…,^θf[p]。进而,在接受了表示执行校正解码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,在由解码LSP参数^θf[1],^θf[2],…,^θf[p]求得的频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,还接受解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]。
加法单元207在接受了表示执行校正解码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,在由解码LSP参数^θf[1],^θf[2],…,^θf[p]求得的频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,将解码LSP参数^θf[1],^θf[2],…,^θf[p]和解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]相加(s207)得到的^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[p]+^θdifff[p]作为在系数变换单元73中使用的解码LSP参数^θf[1],^θf[2],…,^θf[p]输出。
加法单元207在接受了表示不执行校正解码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,由解码LSP参数^θf[1],^θf[2],…,^θf[p]求得的频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,将接受的解码LSP参数^θf[1],^θf[2],…,^θf[p]原样输出到系数变换单元73。因此,LSP解码单元72输出的各阶的解码LSP参数^θf[1],^θf[2],…,^θf[p]原样成为在系数变换单元73中使用的解码LSP参数。
<第一实施方式的效果>
通过这样的结构,抑制作为整体码量的增大,并且对于频谱的变动大的帧,也可以对可变换为线性预测系数的系数进行高精度地编码以及解码。
<第一实施方式的变形例1>
在本实施方式中,对LSP参数进行了记载,但是只要是可变换为线性预测系数的系数,也可以使用其它的系数。可以将PARCOR系数、LSP参数或者将PARCOR系数变形后的系数,甚至线性预测系数本身作为对象。这些全部的系数在语音编码的技术领域中可相互变换,使用任何系数都可以得到第一实施方式的效果。而且,也将与LSP码CLf或者LSP码CLf对应的码称为第一码,将LSP编码单元称为第一编码单元。同样,将校正LSP码CL2f或者与校正LSP码CL2f对应的码称为第二码,将校正编码单元称为第二编码单元。而且,将解码LSP参数^θf[1],^θf[2],…,^θf[p]称为第一解码值,将LSP解码单元称为第一解码单元。而且,将解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[p]称为第二解码值,将校正解码单元称为第二解码单。
如前所述,只要是可变换为线性预测系数的系数,也可以使用其它的系数取代LSP参数。以下,对使用了PARCOR系数kf[1],kf[2],…,kf[p]的情况进行说明。
已知与LSP参数θ[1],θ[2],…,θ[p]对应的频谱包络的峰谷的大小越大,通过PARCOR系数求得的
Figure BDA0002265454330000141
的值越小。由此,在使用PARCOR系数的情况下,指标计算单元107接受量化后的PARCOR系数^kf[1],^kf[2],…,^kf[p],通过
Figure BDA0002265454330000142
计算与频谱包络的峰谷小所对应的指标Q’(s107)。指标计算单元107根据指标Q’的大小,输出表示在校正编码单元108以及加法单元109中执行/不执行校正编码处理的控制信号C,或者,输出作为表示规定的比特数的正的整数或者0的控制信号C。与指标计算单元205相同,根据指标Q’的大小,输出表示在校正解码单元206以及加法单元207中执行/不执行校正解码处理的控制信号C,或者,输出作为表示规定的比特数的正的整数或者0的控制信号C。
<第一实施方式的变形例2>
指标计算单元107以及指标计算单元205也可以设为输出指标Q以及/或者指标Q’取代控制信号C的结构。在该情况下,根据指标Q以及/或者指标Q’的大小,判断在校正编码单元108以及校正解码单元206中是否分别进行编码以及解码即可。而且,同样,根据指标Q以及/或者指标Q’的大小,判断在加法单元109以及加法单元207中是否分别执行加法处理即可。校正编码单元108、校正解码单元206、加法单元109以及加法单元207中的判断是与上述的指标计算单元107以及指标计算单元205中说明的判断相同的判断。
<第二实施方式>
以下,以与第一实施方式的不同点为中心进行说明。
<第二实施方式的线性预测系数编码装置300>
图7是第二实施方式的线性预测系数编码装置300的功能方框图,图8表示该处理流程的例子。
线性预测系数编码装置300包括:线性预测分析单元301、LSP计算单元302、预测对应编码单元320和非预测对应编码单元310。
线性预测系数编码装置300接受音响信号Xf,得到LSP码Cf以及校正LSP码Df并输出。
而且,源于音响信号Xf的LSP参数θf[1],θf[2],…,θf[p]由其它的装置生成,在线性预测系数编码装置300的输入为LSP参数θf[1],θf[2],…,θf[p]的情况下,线性预测系数编码装置300也可以不包含线性预测分析单元301和LSP计算单元302。
<线性预测分析单元301>
线性预测分析单元301接受输入音响信号Xf,对输入音响信号Xf进行线性预测分析,求线性预测系数af[1],af[2],…,af[p](s301)并输出。这里,af[i]表示对第f帧的输入音响信号Xf进行线性预测分析得到的i阶的线性预测系数。
<LSP计算单元302>
LSP计算单元302接受线性预测系数af[1],af[2],…,af[p],从线性预测系数af[1],af[2],…,af[p]求LSP(Line Spectrum Pairs)参数θf[1],θf[2],…,θf[p](s302),输出将LSP参数排列的向量即LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T。这里,θf[i]是与第f帧的输入音响信号Xf对应的i阶的LSP参数。
<预测对应编码单元320>
图9表示预测对应编码单元320的功能方框图。
预测对应编码单元320包括:预测对应减法单元303、向量编码单元304、向量码本306和延迟输入单元307。
预测对应编码单元320接受LSP参数向量Θf=θf[1],θf[2],…,θf[p],对由LSP参数向量Θf和至少包含来自过去的帧的预测的预测向量的差分所构成的差分向量Sf进行编码,得到与LSP码Cf和LSP码Cf对应的量化差分向量^Sf(s320)并输出。进而,预测对应编码单元320得到表示在预测向量中包含来自过去的帧的预测部分的向量并输出。而且,与LSP码Cf对应的量化差分向量^Sf是由与差分向量Sf的各元素值对应的量化值构成的向量。
这里,所谓至少包含来自过去的帧的预测的预测向量,例如是将预定的预测对应平均向量V、和对前一帧的量化差分向量(前帧量化差分向量)^Sf-1的各元素乘以预定的α得到的向量相加而得到的向量V+α×^Sf-1。在该例中,表示在预测向量中包含的来自过去的帧的预测部分的向量是前帧量化差分向量^Sf-1的α倍即α×^Sf-1
而且,预测对应编码单元320除了LSP参数向量Θf以外,不需要来自外部的输入,所以也可以说将LSP参数向量Θf进行编码而得到LSP码Cf
对预测对应编码单元320内的各单元的处理进行说明。
<预测对应减法单元303>
预测对应减法单元303例如包括:存储了规定的系数α的存储单元303c、存储了预测对应平均向量V的存储单元303d、乘法单元308、减法单元303a以及303b而构成。
预测对应减法单元303接受LSP参数向量Θf、前帧量化差分向量^Sf-1
预测对应减法单元303生成从LSP参数向量Θf减去预测对应平均向量V和向量α×^Sf-1后的向量,即差分向量Sf=Θf-V-α×^Sf-1(s303)并输出。
而且,预测对应平均向量V=(v[1],v[2],…,v[p])T是存储在存储单元303d中的预定的向量,例如,由预先学习用的音响信号求出即可。例如,在线性预测系数编码装置300中,使用成为编码的对象的音响信号、和在相同的环境(例如,说话者、收音装置、场所)中收音的音响信号作为学习用的输入音响信号,求多个帧的LSP参数向量,将其平均设为预测对应平均向量。
乘法单元308将存储单元303c中存储的规定的系数α乘以前帧量化差分向量^Sf-1,得到向量α×^Sf-1
而且,在图9中,使用两个减法单元303a以及303b,首先,在减法单元303a中,从LSP参数向量Θf减去存储单元303d中存储的预测对应平均向量V后,在减法单元303b中,减去向量α×^Sf-1,但是该顺序也可以相反。或者,也可以通过从LSP参数向量Θf减去将预测对应平均向量V和向量α×^Sf-1相加后的向量V+α×^Sf-1,生成差分向量Sf
当前的帧的差分向量Sf也可以称为从可变换为当前的帧的多阶的线性预测系数的系数(LSP参数向量Θf),至少减去包含来自过去的帧的预测的向量而得到的向量。
<向量编码单元304>
向量编码单元304接受差分向量Sf,将差分向量Sf编码,得到LSP码Cf和与LSP码Cf对应的量化差分向量^Sf并输出。在差分向量Sf的编码中,可以使用将差分向量Sf进行向量量化的方法、将差分向量Sf分为多个子向量,将子向量分别进行向量量化的方法、将差分向量Sf或者子向量进行多级向量量化的方法、将向量的元素进行标量量化的方法、将它们组合的方法等公知的任何编码方法。
这里,说明使用将差分向量Sf进行向量量化的方法的情况的例子。
从在向量码本306中存储的多个候选差分向量中,搜索最接近差分向量Sf的候选差分向量作为量化差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T输出,将与量化差分向量^Sf对应的差分向量码作为LSP码Cf输出(s304)。而且,量化差分向量^Sf与如后所述的解码差分向量对应。
<向量码本306>
在向量码本306中,预先存储各候选差分向量和与该各候选差分向量对应的差分向量码。
<延迟输入单元307>
延迟输入单元307接受量化差分向量^Sf,保持量化差分向量^Sf,使其延迟相当于1帧,作为前帧量化差分向量^Sf-1输出(s307)。即,在预测对应减法单元303对第f帧的量化差分向量^Sf进行处理时,输出对于第f-1帧的量化差分向量^Sf-1
而且,输入在预测对应编码单元320中不生成,但可说是将预测对应编码单元320中的LSP参数向量Θf的各元素量化而得到的预测对应量化LSP参数向量^Θf是对量化差分向量^Sf加上预测向量V+α×^Sf-1后的结果。即,预测对应量化LSP参数向量是^Θf=^Sf+V+α×^Sf-1。而且,预测对应编码单元320中的量化误差向量是Θf-^Θf=Θf-(^Sf+V+α×^Sf-1)。
<非预测对应编码单元310>
非预测对应编码单元310包括:非预测对应减法单元311、校正向量编码单元312、校正向量码本313、预测对应加法单元314、以及指标计算单元315。根据指标计算单元315的计算结果,决定在非预测对应减法单元311中是否执行减法处理,以及,在校正向量编码单元312中是否执行处理。指标计算单元315与第一实施方式的指标计算单元107对应。
非预测对应编码单元310接受LSP参数向量Θf、量化差分向量^Sf以及向量α×^Sf-1。非预测对应编码单元310对LSP参数向量Θf和量化差分向量^Sf的差分即校正向量进行编码,得到校正LSP码Df(s310)并输出。
这里,校正向量是Θf-^Sf,预测对应编码单元320的量化误差向量是Θf-^Θf=Θf-(^Sf+V+α×^Sf-1),所以校正向量Θf-^Sf是预测对应编码单元320的量化误差向量Θf-^Θf、预测对应平均向量V、和乘以了α倍的前帧量化差分向量α×^Sf-1相加的结果(Θf-^Sf=Θf-^Θf+V+α×^Sf-1)。即,也可说是非预测对应编码单元310对将量化误差向量Θf-^Θf和预测向量V+α×^Sf-1相加后的结果进行编码,得到校正LSP码Df,也可说至少将预测对应编码单元320的量化误差向量Θf-^Θf进行编码,得到校正LSP码Df
虽然在校正向量Θf-^Sf的编码中使用任何公知的编码方法都可以,但是在以下的说明,说明将从校正向量Θf-^Sf减去非预测对应平均向量Y后的结向量进行向量量化的方法。而且,在以下的说明中,将作为从校正向量Θf-^Sf减去非预测对应平均向量Y得到的向量即Uf=Θf-Y-^Sf,方便地称为校正向量。
以下,对各单元的处理进行说明。
<预测对应加法单元314>
预测对应加法单元314例如包含存储了预测对应平均向量V的存储单元314c、加法单元314a以及314b而构成。在存储单元314c中存储的预测对应平均向量V与在预测对应编码单元320内的存储单元303d中存储的预测对应平均向量V相同。
预测对应加法单元314接受当前的帧的量化差分向量^Sf、对前帧量化差分向量^Sf-1乘以了规定的系数α的向量α×^Sf-1
预测对应加法单元314生成将量化差分向量^Sf、预测对应平均向量V、向量α×^Sf-1相加后的向量即预测对应量化LSP参数向量^Θf(=^Sf+V+α^Sf-1)=(^θf[1],^θf[2],…,^θf[p])T(s314)并输出。
在图7中,使用两个加法单元314a以及314b,首先,在加法单元314b中,在当前的帧的量化差分向量^Sf中加上向量α×^Sf-1后,在加法单元314a中加上预测对应平均向量V,但是该顺序也可以相反。或者,也可以通过将向量α×^Sf-1和预测对应平均向量V相加后的向量,与量化差分向量^Sf相加而生成预测对应量化LSP参数向量^Θf
而且,被输入到预测对应加法单元314的当前的帧的量化差分向量^Sf、对前帧量化差分向量^Sf-1乘以了规定的系数α的向量α×^Sf-1都是在预测对应编码单元320中生成的,预测对应加法单元314内的存储单元314c中存储的预测对应平均向量V与预测对应编码单元320内的存储单元303d中存储的预测对应平均向量V是相同的,所以也可以是预测对应编码单元320进行预测对应加法单元314进行的处理,生成预测对应量化LSP参数向量^Θf输出到非预测对应编码单元310,非预测对应编码单元310不具有预测对应加法单元314的结构。
<指标计算单元315>
指标计算单元315接受预测对应量化LSP参数向量^Θf,计算对应于预测对应量化LSP参数向量^Θf的、与频谱包络的峰谷大小的大峰谷对应的指标Q,即,频谱包络的峰谷越大则变得越大的指标Q,以及/或者,与频谱包络的小峰谷对应的指标Q’,即,频谱包络的峰谷越大则变得越小的指标Q’(s315)。指标计算单元315根据指标Q以及/或者Q’的大小输出控制信号C,以便在校正向量编码单元312中执行编码处理,或者,以规定的比特数执行编码处理。而且,指标计算单元315根据指标Q以及/或者Q’的大小输出控制信号C,以便在非预测对应减法单元311中执行减法处理。指标Q以及Q’与在指标计算单元107中说明的指标是相同的,也可以使用作为预测对应量化LSP参数向量^Θf的各元素的预测对应量化LSP参数^θf[1],^θf[2],…,^θf[p],取代量化LSP参数^θf[1],^θf[2],…,^θf[p],以同样的方法进行计算。
在频谱包络的峰谷大于规定的基准的情况,即,在上述的例子中(A-1)指标Q为规定的阈值Th1以上的情况,以及/或者,(B-1)指标Q’为规定的阈值Th1’以下的情况下,指标计算单元315输出表示在非预测对应减法单元311以及校正向量编码单元312中执行校正编码处理的控制信号C,在除此以外的情况下,输出表示在非预测对应减法单元311以及校正向量编码单元312中不执行校正编码处理的控制信号C。
而且,也可以设为在(A-1)以及/或者(B-1)的情况下,指标计算单元315输出表示规定的比特数的正的整数(或者表示正的整数的码)作为控制信号C,在除此以外的情况下,输出0作为控制信号C的结构。
而且,在设为非预测对应减法单元311中接受了控制信号C时执行减法处理,在校正向量编码单元312中接受了控制信号C时执行编码处理的结构的情况下,也可以设为(A-1)以及/或者(B-1)以外的情况下,指标计算单元315不输出控制信号C的结构。
<非预测对应减法单元311>
非预测对应减法单元311例如包含存储了非预测对应平均向量Y=(y[1],y[2],…,y[p])T的存储单元311c、减法单元311a以及311b而构成。
非预测对应减法单元311接受控制信号C、LSP参数向量Θf和量化差分向量^Sf
非预测对应减法单元311在接受了表示执行校正编码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,生成从LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T减去量化差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T和非预测对应平均向量Y=(y[1],y[2],…,y[p])T而得到的向量即校正向量Uf=Θf-Y-^Sf=(uf[1],uf[2],…,uf[p])(s311)并输出。
而且,在图7中,使用两个减法单元311a以及311b,首先,在减法单元311a中从LSP参数向量Θf减去存储单元311c中存储的非预测对应平均向量Y后,在减法单元311b中减去量化差分向量^Sf,但是这些减法的顺序也可以相反。或者,也可以通过将非预测对应平均向量Y和量化差分向量^Sf相加后的向量,从LSP参数向量Θf中减去来生成校正向量Uf
而且,非预测对应平均向量Y是预定的向量,例如从预先学习用的音响信号求出即可。例如,在线性预测系数编码装置300中,使用成为编码的对象的音响信号、在相同的环境(例如,说话者、收音装置、场所)中收音的音响信号作为学习用的输入音响信号,求出多个帧的、LSP参数向量和对于该LSP参数向量的量化差分向量的差分,将该差分的平均设为非预测对应平均向量。
而且,校正向量Uf如以下那样表示。
Uf=Θf-Y-^Sf
=(Θf-^Θf)-Y+α×^Sf-1+V
由此,校正向量Uf至少包含预测对应编码单元320的编码的量化误差(Θf-^Θf)。
在非预测对应减法单元311接受了表示不执行校正编码处理的控制信号C、或者0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,也可以不生成校正向量Uf
<校正向量码本313>
在校正向量码本313中,存储各候选校正向量和与该各候选校正向量对应的校正向量码。
<校正向量编码单元312>
校正向量编码单元312接受控制信号C和校正向量Uf。在接受了表示执行校正编码处理的控制信号C、或者正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,在频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,校正向量编码单元312将校正向量Uf编码而得到校正LSP码Df(s312)并输出。例如,校正向量编码单元312从校正向量码本313中存储的多个候选校正向量中搜索最接近校正向量Uf的候选校正向量,将与该候选校正向量对应的校正向量码设为校正LSP码Df
而且,如前述的那样,校正向量Uf至少包含预测对应编码单元320的编码的量化误差(Θf-^Θf),所以也可以说校正向量编码单元312在频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,至少将预测对应编码单元320的量化误差(Θf-^Θf)进行编码。
在接受了表示不执行校正编码处理的控制信号C、或者0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,校正向量编码单元312不进行校正向量Uf的编码,得不到校正LSP码Df,不输出。
<第二实施方式的线性预测系数解码装置400>
图10表示第二实施方式的线性预测系数解码装置400的功能方框图,图11表示其处理流程的例子。
第二实施方式的线性预测系数解码装置400包含预测对应解码单元420和非预测对应解码单元410。
线性预测系数解码装置400接受LSP码Cf和校正LSP码Df,生成解码预测对应LSP参数^θf[1],^θf[2],…,^θf[p]和解码非预测对应LSP参数
Figure BDA0002265454330000221
并输出。而且,根据需要,生成将解码预测对应LSP参数^θf[1],^θf[2],…,^θf[p]和解码非预测对应LSP参数
Figure BDA0002265454330000222
各自变换为线性预测系数而得到的解码预测对应线性预测系数^af[1],^af[2],…,^af[p]和解码非预测对应线性预测系数^bf[1],^bf[2],…,^bf[p]并输出。
<预测对应解码单元420>
图12表示预测对应解码单元420的功能方框图。
预测对应解码单元420包含向量码本402、向量解码单元401、延迟输入单元403和预测对应加法单元405,根据需要,还包括预测对应线性预测系数计算单元406。
预测对应解码单元420接受LSP码Cf,将LSP码Cf解码而得到解码差分向量^Sf并输出。进而,预测对应解码单元420将解码差分向量^Sf和至少包含来自过去的帧的预测的预测向量相加,生成LSP参数向量Θf的解码值构成的解码预测对应LSP参数向量^Θf(s420)并输出。预测对应解码单元420,根据需要,进一步将解码预测对应LSP参数向量^Θf变换为解码预测对应线性预测系数^af[1],^af[2],…,^af[p]并输出。
在本实施方式中,预测向量是将预定的预测对应平均向量V、和过去的帧的解码差分向量^Sf-1的α倍相加而得到的向量V+α×^Sf-1
<向量码本402>
在向量码本402中,预先存储各候选差分向量和与该各候选差分向量对应的差分向量码。而且,向量码本402包含与前述的线性预测系数编码装置300的向量码本306共同的信息。
<向量解码单元401>
向量解码单元401接受LSP码Cf,将LSP码Cf解码,得到与LSP码Cf对应的解码差分向量^Sf并输出。在LSP码Cf的解码中,使用与编码装置的向量编码单元304的编码方法对应的解码方法。
这里,说明使用与将向量编码单元304的差分向量Sf进行向量量化的方法对应的解码方法的情况的例子。向量解码单元401从向量码本402中存储的多个差分向量码中,搜索与LSP码Cf对应的差分向量码,将与该差分向量码对应的候选差分向量作为解码差分向量^Sf输出(s401)。而且,解码差分向量^Sf与前述的向量编码单元304输出的量化差分向量^Sf对应,如果没有传输错误、或者编码、解码的过程没有错误等,则与量化差分向量^Sf为相同的值。
<延迟输入单元403>
延迟输入单元403接受解码差分向量^Sf,保持解码差分向量^Sf,使其延迟相当于1帧,作为前帧解码差分向量^Sf-1输出(s403)。即,在预测对应加法单元405对第f帧的解码差分向量^Sf进行处理时,输出第f-1帧的解码差分向量^Sf-1
<预测对应加法单元405>
预测对应加法单元405例如包含存储了规定的系数α的存储单元405c、存储了预测对应平均向量V的存储单元405d、乘法单元404、加法单元405a以及405b而构成。
预测对应加法单元405接受当前的帧的解码差分向量^Sf以及前帧解码差分向量^Sf-1
预测对应加法单元405生成将解码差分向量^Sf、预测对应平均向量V=(v[1],v[2],…,v[N])T和向量α×^Sf-1相加后的向量,即解码预测对应LSP参数向量^Θf(=^Sf+V+α^Sf-1)=^θf[1],^θf[2],…,^θf[p](s405)并输出。
乘法单元404将存储单元405c中存储的规定的系数α与前帧解码差分向量^Sf-1相乘,得到向量α×^Sf-1
在图12中,使用两个加法单元405a以及405b,首先,在加法单元405a中,对当前的帧的解码差分向量^Sf加上向量α×^Sf-1后,在加法单元405b中加上预测对应平均向量V,但是该顺序也可以相反。或者,也可以通过将向量α×^Sf-1和预测对应平均向量V相加后的向量,加上解码差分向量^Sf,生成解码预测对应LSP参数向量^Θf
而且,这里使用的预测对应平均向量V设为与在前述的线性预测系数编码装置300的预测对应编码单元320中使用的预测对应平均向量V相同。
<预测对应线性预测系数计算单元406>
预测对应线性预测系数计算单元406接受解码预测对应LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p]),将解码预测对应LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p])变换为解码预测对应线性预测系数^af[1],^af[2],…,^af[p](s406)并输出。
<非预测对应解码单元410>
非预测对应解码单元410包含:校正向量码本412、校正向量解码单元411、非预测对应加法单元413和指标计算单元415,根据需要,还包含非预测对应线性预测系数计算单元414。指标计算单元415与第一实施方式的指标计算单元205对应。
在非预测对应解码单元410中,输入校正LSP码Df、解码差分向量^Sf、以及解码预测对应LSP参数向量^Θf。非预测对应解码单元410将校正LSP码Df解码,得到解码校正向量^Uf。进而,非预测对应解码单元410在解码校正向量^Uf中至少加上解码差分向量^Sf,生成当前的帧的LSP参数的解码值构成的解码非预测对应LSP参数向量
Figure BDA0002265454330000241
并输出。这里,解码差分向量^Sf是至少包含来自过去的帧的预测的预测向量。非预测对应解码单元410,根据需要,进一步将解码非预测对应LSP参数向量
Figure BDA0002265454330000242
变换为解码非预测对应线性预测系数^bf[1],^bf[2],…,^bf[p](s410)并输出。
以下,说明各单元的处理内容。
<指标计算单元415>
指标计算单元415接受解码预测对应LSP参数向量^Θf,计算对应于解码预测对应LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p])T的、与频谱包络的峰谷大小的大峰谷对应的指标Q,即,频谱包络的峰谷越大其变得越大的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’,即,频谱包络的峰谷越大则变得越小的指标Q’(s415)。指标计算单元415根据指标Q以及/或者Q’的大小,输出表示在校正向量解码单元411以及非预测对应加法单元413中执行/不执行校正解码处理的控制信号C,或者,表示以规定的比特数执行校正解码处理的控制信号C。指标Q以及Q’与在指标计算单元205中说明的指标相同,也可以使用作为解码预测对应LSP参数向量^Θf的各元素的解码预测对应LSP参数^θf[1],^θf[2],…,^θf[p],替代解码LSP参数^θf[1],^θf[2],…,^θf[p],以同样的方法进行计算。
在频谱包络的峰谷大于规定的基准的情况,即,在上述的例子中(A-1)指标Q为规定的阈值Th1以上的情况,以及/或者,(B-1)指标Q’为规定的阈值Th1’以下的情况,指标计算单元415输出表示在非预测对应加法单元413以及校正向量解码单元411中执行校正解码处理的控制信号C,在除此以外的情况下,输出表示在非预测对应加法单元413以及校正向量解码单元411中不执行校正解码处理的控制信号C。
而且,也可以设为在(A-1)以及/或者(B-1)的情况下,指标计算单元415输出表示规定的比特数的正的整数(或者表示正的整数的码)作为控制信号C,在除此以外的情况下,也可以输出0作为控制信号C的结构。
而且,也可以设为以下结构,即在校正向量解码单元411以及非预测对应加法单元413中接受了控制信号C时,识别执行校正解码处理的结构的情况下,(A-1)以及/或者(B-1)以外的情况下,指标计算单元415不输出控制信号C。
<校正向量码本412>
校正向量码本412存储与线性预测系数编码装置300内的校正向量码本313相同的内容的信息。即,在校正向量码本412中,存储各候选校正向量和与该各候选校正向量对应的校正向量码。
<校正向量解码单元411>
校正向量解码单元411接受校正LSP码Df和控制信号C。在接受了表示执行校正解码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,校正向量解码单元411将校正LSP码Df解码,得到解码校正向量^Uf(s411)并输出。例如,校正向量解码单元411从校正向量码本412中存储的多个校正向量码中,搜索与校正LSP码Df对应的校正向量码,输出与搜索到的校正向量码对应的候选校正向量作为解码校正向量^Uf
在接受了表示不执行校正解码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,校正向量解码单元411不进行校正LSP码Df的解码,得不到解码校正向量^Uf,不输出。
<非预测对应加法单元413>
非预测对应加法单元413例如包含存储了非预测对应平均向量Y=(y[1],y[2],…,y[p])T的存储单元413c、加法单元413a以及413b而构成。
非预测对应加法单元413接受控制信号C和解码差分向量^Sf。非预测对应加法单元413在接受了表示执行校正解码处理的控制信号C,或正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,(A-1)以及/或者(B-1)的情况下,进而还接受解码校正向量^Uf。然后,非预测对应加法单元413生成将解码校正向量^Uf、解码差分向量^Sf和非预测对应平均向量Y相加得到的解码非预测对应LSP参数向量^Φf=^Uf+Y+^Sf(s413)并输出。而且,在图10中,使用两个加法单元413a以及413b,首先,在加法单元413a中对解码校正向量^Uf加上解码差分向量^Sf后,在加法单元413b中加上存储单元413c中存储的非预测对应平均向量Y,但是这些相加的顺序也可以相反。或者,也可以通过将非预测对应平均向量Y与解码差分向量^Sf相加后的向量,加上解码校正向量^Uf来生成解码非预测对应LSP参数向量^Φf
非预测对应加法单元413在接受了表示校正向量解码单元411不执行校正解码处理的控制信号C、或者接受了0作为控制信号C的情况,总之,在频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,不接受解码校正向量^Uf。然后,非预测对应加法单元413生成将解码差分向量^Sf和非预测对应平均向量Y相加得到的解码非预测对应LSP参数向量^Φf=Y+^Sf(s413)并输出。
<非预测对应线性预测系数计算单元414>
非预测对应线性预测系数计算单元414接受解码非预测对应LSP参数向量
Figure BDA0002265454330000261
将解码非预测对应LSP参数向量
Figure BDA0002265454330000262
变换为解码非预测对应线性预测系数^bf[1],^bf[2],…,^bf[p](s414)并输出。
<第二实施方式的效果>
第二实施方式设为在频谱包络的峰谷大的情况下,将对非预测对应平均向量Y和解码差分向量^Sf加上解码校正LSP码Df而得到的解码校正向量^Uf的向量,设为解码非预测对应LSP参数向量^Φf的结构。通过这样的结构,可以得到与第一实施方式一样的、抑制作为整体码量的增大,并且对于频谱的峰谷大的帧,也可以将可变换为线性预测系数的系数进行高精度地编码以及解码的效果。
而且,例如,校正向量码的比特长度为2bit,在校正向量码本313中存储、与4种校正向量码(「00」「01」「10」「11」)对应的4种候选校正向量。
<第二实施方式的变形例1>
可以进行与第一实施方式的变形例1相同的变形。
也将LSP码Cf或者与LSP码Cf对应的码称为第一码,将预测对应编码单元称为第一编码单元。同样,也将校正LSP码Df或者与校正LSP码Df对应的码称为第二码,将非预测对应编码单元中的非预测对应减法单元和校正向量编码单元的处理单元称为第二编码单元,将非预测对应编码单元中的预测对应加法单元和指标计算单元的处理单元称为指标计算单元。而且,也将解码预测对应LSP参数向量^Θf或者与解码预测对应LSP参数向量^Θf对应的向量称为第一解码向量,将预测对应解码单元称为第一解码单元。而且,也将解码非预测对应LSP参数向量^Φf或者与解码非预测对应LSP参数向量^Φf对应的向量称为第二解码向量,将非预测对应解码单元中的校正向量解码单元和非预测对应加法单元的处理单元称为二解码单元。
在本实施方式中,仅利用了相当于1帧作为“过去的帧”,也可以根据需要,适当利用相当于2帧以上。
<第三实施方式>
以与第二实施方式不同的部分为中心进行说明。
在校正向量码本中存储的候选校正向量的数多,意味着以与其相当的较高的近似精度进行编码。因此,在本实施方式中,起因于LSP码的传输错误的解码精度的降低的影响越大,使用越高的精度的校正向量码本执行校正向量编码单元以及校正向量解码单元。
<第三实施方式的线性预测系数编码装置500>
图13是第三实施方式的线性预测系数编码装置500的功能方框图,图8表示该处理流程的例子。
第三实施方式的线性预测系数编码装置500包含非预测对应编码单元510,取代非预测对应编码单元310。与第二实施方式的线性预测系数编码装置300同样,源于音响信号Xf的LSP参数θ由其它的装置生成,在线性预测系数编码装置500的输入为LSP参数θf[1],θf[2],…,θf[p]的情况下,线性预测系数编码装置500也可以不包含线性预测分析单元301和LSP计算单元302。
非预测对应编码单元510包含:非预测对应减法单元311、校正向量编码单元512、校正向量码本513A以及513B、预测对应加法单元314和指标计算单元315。
第三实施方式的线性预测系数编码装置500具有多个校正向量码本,在校正向量编码单元512中,根据指标计算单元515中计算的指标Q以及/或者Q’,选择其中一个校正向量码本513A以及513B进行编码,这一点与第二实施方式不同。
以下,以具有两类校正向量码本513A以及513B的情况为例进行说明。
校正向量码本513A以及513B存储的候选校正向量的总数是不同的。候选校正向量的总数多,意味着对应的校正向量码的比特数大。相反换言之,如果增大校正向量码的比特数,则可以准备更多的候选校正向量。例如,若将校正向量码的比特数设为A,则可以准备最大2A个候选校正向量。
以下,设为与校正向量码本513B相比,校正向量码本513A一方存储的候选校正向量的总数多来进行说明。换言之,在校正向量码本513A中存储的码的码长(平均码长)大于在校正向量码本513B中存储的码的码长(平均码长)。例如,在校正向量码本513A中存储2A个码长为A比特的校正向量码和候选校正向量的组,在校正向量码本513B中存储2B个(2B<2A)码长为B比特(B<A)的校正向量码和候选校正向量的组。
而且,在本实施方式中,如在第一实施方式的变形例2中说明的那样,指标计算单元输出指标Q以及/或者指标Q’取代控制信号C,根据指标Q以及/或者指标Q’的大小,判断在校正向量编码单元以及校正向量解码单元中分别进行哪样的编码以及解码。非预测对应减法单元311根据指标Q以及/或者指标Q’的大小,判断是否进行减法处理。非预测对应加法单元413根据指标Q以及/或者指标Q’的大小,判断进行哪样的加法处理。非预测对应减法单元311以及非预测对应加法单元413中的判断是与上述的指标计算单元315以及指标计算单元415中说明的相同的判断。
其中,也可以如第二实施方式那样,设为以下结构,即指标计算单元进行在校正向量编码单元以及校正向量解码单元中分别进行哪样的编码以及解码的判断、非预测对应减法单元311是否进行减法的判断、在非预测对应加法单元413进行哪样的加法处理的判断,输出与该判断结果对应的控制信号C。
<校正向量编码单元512>
校正向量编码单元512接受指标Q以及/或者指标Q’和校正向量Uf。在(A-2)指标Q越大,以及/或者,(B-2)指标Q’越小,校正向量编码单元512得到越多的比特数(码长越大)的校正LSP码Df(s512)并输出。例如,使用规定的阈值Th2,以及/或者,规定的阈值Th2',如以下那样进行编码。而且,校正向量编码单元512执行编码处理的是指标Q为规定的阈值Th1以上的情况,以及/或者,指标Q’为规定的阈值Th1'以下的情况,所以Th2是大于Th1的值,Th2'是小于Th1'的值。
(A-5)指标Q为规定的阈值Th2以上的情况,以及/或者,(B-5)指标Q’为规定的阈值Th2’以下的情况下,作为校正LSP码Df的比特数,设定作为正的整数的A,校正向量编码单元512参照存储有2A个比特数(码长)A的校正向量码和候选校正向量的组的校正向量码本513A,对校正向量Uf进行编码,得到校正LSP码Df(s512)并输出。
在(A-6)指标Q小于规定的阈值Th2、且为规定的阈值Th1以上的情况下,以及/或者,(B-6)指标Q’大于规定的阈值Th2’且指标Q’为规定的阈值Th1’以下的情况下,作为校正LSP码Df的比特数,设定小于比特数A的正的整数即B,校正向量编码单元512参照存储有2B个比特数(码长)B的校正向量码和候选校正向量的组的校正向量码本513B,对校正向量Uf进行编码,得到校正LSP码Df(s512)并输出。
在(C-6)除此以外的情况下,作为校正LSP码Df的比特数,设定0,校正向量编码单元512不对校正向量Uf进行编码,得不到校正LSP码Df,不输出。
由此,在指标计算单元315中计算出的指标Q大于规定的阈值Th1的情况,以及/或者,指标Q’小于规定的阈值Th1’的情况下,第三实施方式的校正向量编码单元512被执行。
<第三实施方式的线性预测系数解码装置600>
图14是第三实施方式的线性预测系数解码装置600的功能方框图,图11表示其处理流程的例子。
第三实施方式的线性预测系数解码装置600包含非预测对应解码单元610,取代非预测对应解码单元410。
非预测对应解码单元610包含非预测对应加法单元413、校正向量解码单元611、校正向量码本612A以及612B和指标计算单元415,根据需要还包含解码非预测对应线性预测系数计算单元414。
第三实施方式的线性预测系数解码装置600具有多个校正向量码本,在校正向量解码单元611中,根据在指标计算单元415中计算出的指标Q以及/或者Q’选择其中一个校正向量码本进行解码,这一点与第二实施方式的线性预测系数解码装置400不同。
以下,以具有两类校正向量码本612A以及612B的情况为例进行说明。
校正向量码本612A以及612B分别存储有与线性预测系数编码装置500的校正向量码本513A以及513B共同的内容。即,在校正向量码本612A以及612B中,存储各候选校正向量和与该各候选校正向量对应的校正向量码,校正向量码本612A中存储的码的码长(平均码长)大于校正向量码本612B中存储的码的码长(平均码长)。例如,在校正向量码本612A中存储2A个码长为A比特的校正向量码和候选校正向量的组,在校正向量码本612B中存储2B个(2B<2A)码长为B比特(B<A)的校正向量码和候选校正向量的组。
<校正向量解码单元611>
校正向量解码单元611接受指标Q以及/或者指标Q’和校正LSP码Df。(A-2)指标Q越大,以及/或者,(B-2)指标Q’越小,校正向量解码单元611对具有越多的比特数的校正LSP码Df进行解码,从越多的候选校正向量得到解码校正向量^Uf(s611)。例如,使用规定的阈值Th2,以及/或者,Th2',如以下那样进行解码。而且,校正向量解码单元611执行解码处理的是指标Q为规定的阈值Th1以上的情况,以及/或者,指标Q’为规定的阈值Th1'以下的情况,所以Th2为大于Th1的值,Th2'为小于Th1'的值。
在(A-5)指标Q为规定的阈值Th2以上的情况,以及/或者,(B-5)指标Q’为规定的阈值Th2’以下的情况下,作为校正LSP码Df的比特数,设定作为正的整数的A,校正向量解码单元611参照存储有2A个比特数(码长)A的校正向量码和候选校正向量的组的校正向量码本612A,得到对应于与校正LSP码Df一致的校正向量码的候选校正向量作为解码校正向量^Uf(s611)并输出。
在(A-6)指标Q小于规定的阈值Th2且为规定的阈值Th1以上的情况,以及/或者,(B-6)指标Q’大于规定的阈值Th2’且指标Q’为规定的阈值Th1’以下的情况下,作为校正LSP码Df的比特数,设定小于比特数A的正的整数即B,校正向量解码单元611参照存储有2B个比特数(码长)B的校正向量码和候选校正向量的组的校正向量码本612B,得到对应于与校正LSP码Df一致的校正向量码的候选校正向量作为解码校正向量^Uf(s611)并输出。
在(C-6)除此以外的情况下,作为校正LSP码Df的比特数,设定0,校正向量解码单元611不对校正LSP码Df进行解码,不生成解码校正向量^Uf
由此,在指标计算单元415中计算出的指标Q大于规定的阈值Th1的情况,以及/或者,指标Q’小于规定的阈值Th1’的情况下,第三实施方式的校正向量解码单元611被执行。
<第三实施方式的效果>
通过这样的结构,可以得到与第二实施方式相同的效果。进而,通过根据频谱的变动的大小,变更可变换为线性预测系数的系数的编码精度,可以抑制作为整体码量的增大,并且可以进行更高精度的编码以及解码处理。
<第三实施方式的变形例1>
校正向量码本的个数不一定是2个,也可以是3个以上。在每个校正向量码本中存储不同的比特数(码长)的校正向量码,存储与该校正向量码对应的校正向量。只要根据校正向量码本的个数设定阈值即可。设定对于指标Q的阈值,使得阈值的值越大,在该阈值以上的情况中使用的校正向量码本中存储的校正向量码的比特数越大。同样,设定对于指标Q’的阈值,使得阈值的值越小,在该阈值以下的情况中使用的校正向量码本中存储的校正向量码的比特数越大。通过设为这样的结构,抑制作为整体码量的增大,并且可以进行更高精度的编码以及解码处理。
<全部实施方式的变形例1>
在以上的第一~第三实施方式中,既可以将执行图3的校正编码单元108和加法单元109、图7、图13的非预测对应编码单元310、510中进行的处理(非预测对应编码处理)的对象,仅视为小于预测阶数p的规定的阶数TL以下的LSP参数(低阶的LSP参数),也可以在解码侧进行与它们对应的处理。
首先,说明对于第一实施方式的编码装置100和解码装置200的变形。
<校正编码单元108>
校正编码单元108在接受了表示执行校正编码处理的控制信号C,或正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,LSP编码单元63的量化误差中的低阶的量化误差,即,对输入的LSP参数θf[1],θf[2],…,θf[p]中的TL阶以下的LSP参数即低阶LSP参数θf[1],θf[2],…,θf[TL]、和输入的量化LSP参数^θf[1],^θf[2],…,^θf[p]中的TL阶以下的量化LSP参数即低阶量化LSP参数^θf[1],^θf[2],…,^θf[TL]的各阶的差分即θf[1]-^θf[1],θf[2]-^θf[2],…,θf[TL]-^θf[TL]进行编码,得到校正LSP码CL2f并输出。而且,校正编码单元108得到与校正LSP码CL2f对应的低阶量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[TL]并输出。
校正编码单元108在接受了表示不执行校正编码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,不进行θf[1]-^θf[1],θf[2]-^θf[2],…,θf[TL]-^θf[TL]的编码,不输出校正LSP码CL2f、低阶量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[TL]。
<加法单元109>
加法单元109在接受了表示执行校正编码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,对于TL阶以下的各阶,将量化LSP参数^θf[1],^θf[2],…,^θf[TL]和量化LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[TL]相加得到的^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[TL]+^θdifff[TL]作为在系数变换单元64中使用的量化LSP参数^θf[1],^θf[2],…,^θf[TL],对于p阶以下的超过TL阶的各阶,将接受的量化LSP参数原样作为系数变换单元64中使用的量化LSP参数^θf[TL+1],^θf[TL+2],…,^θf[p]输出。
加法单元109在接受了表示不执行校正编码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,将接受的量化LSP参数^θf[1],^θf[2],…,^θf[p]原样输出到系数变换单元64。
<校正解码单元206>
校正解码单元206接收校正LSP码CL2f,将校正LSP码CL2f进行解码,得到解码低阶LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[TL]并输出。
<加法单元207>
加法单元207在接受了表示执行校正解码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,由解码LSP参数^θf[1],^θf[2],…,^θf[p]求得的频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,对于TL阶以下的各阶,将解码LSP参数^θf[1],^θf[2],…,^θf[TL]和解码LSP参数差分值^θdifff[1],^θdifff[2],…,^θdifff[TL]相加得到的^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[TL]+^θdifff[TL]作为在系数变换单元73中使用的解码LSP参数^θf[1],^θf[2],…,^θf[TL],对于p阶以下的超过TL阶的各阶,将接受的解码LSP参数^θf[TL+1],^θf[TL+2],…,^θf[p]原样输出到系数变换单元73。
加法单元207在接受了表示不执行校正解码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,由解码LSP参数^θf[1],^θf[2],…,^θf[p]求得的频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,将接受的解码LSP参数^θf[1],^θf[2],…,^θf[p]原样输出到系数变换单元73。
接着,说明对于第二实施方式和第三实施方式的线性预测系数编码装置300、500、线性预测系数解码装置400、600的变形。
<非预测对应减法单元311>
非预测对应减法单元311在接受了表示执行校正编码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)的情况下,生成从输入的LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T中的TL阶以下的LSP参数构成的低阶LSP参数向量Θ’f=(θf[1],θf[2],…,θf[TL])T,减去在存储单元311c中存储的非预测对应低阶平均向量Y’=(y[1],y[2],…,y[TL])T和输入的量化差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T中的TL阶以下的元素构成的低阶量化差分向量^S’f=(^sf[1],^sf[2],…,^sf[TL])T的向量,即低阶校正向量U’f=Θ’f-Y’-^S’f并输出。即,非预测对应减法单元311生成校正向量Uf的元素的一部分构成的向量即低阶校正向量U’f并输出。
这里,非预测对应低阶平均向量Y'=(y[1],y[2],…,y[TL])T是预定的向量,是在解码装置中使用的非预测对应平均向量Y=(y[1],y[2],…,y[p])T中的TL阶以下的元素构成的向量。
而且,也可以从LSP计算单元302输出LSP参数向量Θf中的TL阶以下的LSP参数构成的低阶LSP参数向量Θ’f,输入到非预测对应减法单元311。而且,也可以从向量编码单元304输出量化差分向量^Sf中的TL阶以下的元素构成的低阶量化差分向量^S’f,输入到非预测对应减法单元311。
非预测对应减法单元311在接受了表示不执行校正编码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,不生成低阶校正向量U’f即可。
<校正向量编码单元312、512>
校正向量编码单元312以及512参照校正向量码本313、513A、513B,对校正向量Uf的元素的一部分构成的向量即低阶校正向量U’f进行编码,得到校正LSP码Df并输出。校正向量码本313、513A、513B中存储的各候选校正向量作为TL阶的向量即可。
<校正向量解码单元411、611>
校正向量解码单元411、611接收校正LSP码Df,参照校正向量码本412、612A、612B,对校正LSP码Df进行解码,得到解码低阶校正向量^U’f并输出。解码低阶校正向量^U’f=(uf[1],uf[2],…,uf[TL])T是TL阶的向量。与校正向量码本313、513A、513B同样,校正向量码本412、612A、612B中预先存储的各候选校正向量作为TL阶的向量即可。
<非预测对应加法单元413>
非预测对应加法单元413接收控制信号C和解码差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T
非预测对应加法单元413在接受了表示执行校正解码处理的控制信号C,或者接受了正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况,(A-1)以及/或者(B-1)的情况下,还接受解码低阶校正向量^U’f。然后,非预测对应加法单元413生成对TL阶以下的各阶,将解码低阶校正向量^U’f、解码差分向量^Sf和非预测对应平均向量Y的元素相加,对于p阶以下的超过TL阶的各阶,将解码差分向量^Sf和非预测对应平均向量Y的元素相加而得到的解码非预测对应LSP参数向量^Φf并输出。即,解码非预测对应LSP参数向量^Φf为,^Φf=(uf[1]+y[1]+^sf[1],uf[2]+y[2]+^sf[2],…,uf[TL]+y[TL]+^sf[TL],y[TL+1]+^sf[TL+1],…,y[p]+^sf[p])。
非预测对应加法单元413在接受了表示不执行校正解码处理的控制信号C,或者接受了0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,不接受解码低阶校正向量^U’f。然后,非预测对应加法单元413生成将解码差分向量^Sf和非预测对应平均向量Y相加而得到的解码非预测对应LSP参数向量^Φf=Y+^Sf并输出。
由此,通过将低阶LSP参数优先地使编码失真降低,抑制失真的增大,并且与第一~第三实施方式的方法相比,还可以抑制码量的增大。
<全部实施方式的变形例2>
在第一~第三实施方式中,将LSP计算单元的输入作为了线性预测系数af[1],af[2],…,af[p],但是例如也可以将对线性预测系数的各系数af[i]乘以了γ的i次方的系数的序列af[1]×γ,af[2]×γ2,…,af[p]×γp作为LSP计算单元的输入。
而且,在第一~第三实施方式中,将编码或解码的对象作为LSP参数,但是也可以只要是线性预测系数本身或可变换为ISP参数等的线性预测系数的系数,则将任何系数作为编码或解码的对象都可以。
<其它的变形例>
本发明不限于上述的实施方式以及变形例。例如,上述的各种处理不仅按照记载的时序列被执行,也可以根据执行处理的装置的处理能力或者根据需要并行地或者单独地执行。另外,能够在不脱离本发明的宗旨的范围内进行适当变更。
<程序以及记录介质>
而且,也可以通过计算机实现在上述的实施方式以及变形例中说明的各装置中的各种处理功能。在该情况下,通过程序记述各装置应具有的功能的处理内容。然后,通过用计算机执行该程序,在计算机上实现上述各装置中的各种处理功能。
记述了该处理内容的程序可以预先记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如,磁记录装置、光盘、光磁记录介质、半导体存储器等什么样的介质都可以。
而且,例如,通过销售、转让、租借记录了该程序的DVD、CD-ROM等可移动型记录介质,进行该程序的流通。而且,也可以将该程序存储在服务器计算机的存储装置中,经由网络,通过将该程序从服务器计算机转发到其它计算机,使该程序流通。
执行这样的程序的计算机,例如,首先,将可移动型记录介质中记录的程序或者从服务器计算机转发的程序暂时存储在自己的存储单元中。然后,在执行处理时,该计算机读取自己的存储单元中存储的程序,按照读取的程序执行处理。而且,作为该程序的其它的实施方式,计算机也可以从可移动型记录介质直接读取程序,按照该程序执行处理。进而,也可以每当从服务器计算机对该计算机转发程序时,逐次执行按照接受的程序的处理。而且,也可以设为不进行从服务器计算机至该计算机的程序的转发,而仅通过该执行指示和结果获取来实现处理功能的所谓ASP(Application Service Provider,应用服务提供商)型的服务,执行上述的处理的结构。而且,设为在程序中,包含作为供电子计算机的处理用的信息的、按照程序看待的内容(具有虽然不是对于计算机的直接的指令,但是规定计算机的处理的性质的数据等)。
而且,虽然设为通过在计算机上执行规定的程序,构成各装置,但是这些处理内容的至少一部分也可以以硬件方式实现。

Claims (11)

1.一种解码装置,包括:
第一解码单元,对第一码进行解码,得到与可变换为多阶的线性预测系数的系数对应的第一解码值;
指标计算单元,使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;
第二解码单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;以及
加法单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到与可变换为多阶的线性预测系数的系数对应的第三解码值,
所述第二解码值的阶数与所述第一解码值的阶数相比为低阶,
所述加法单元对于与所述第二解码值的阶数相比的高阶,将各阶的所述第一解码值原样设为第三解码值。
2.一种解码装置,包括:
第一解码单元,对第一码进行解码,得到与可变换为多阶的线性预测系数的系数对应的第一解码值;
指标计算单元,使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;
第二解码单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;以及
加法单元,在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到与可变换为多阶的线性预测系数的系数对应的第三解码值,
所述第二解码单元对所述指标Q越大,以及/或者,所述指标Q’越小,具有越多的比特数的所述第二码进行解码,从越多的解码值的候选得到所述第二解码值。
3.如权利要求1或2所述的解码装置,
可变换为所述线性预测系数的系数是线频谱对的参数,
所述指标Q’是与所述第一码对应的、全阶或者低阶的第一解码值的相邻阶数的解码值的差分、和最低阶的第一解码值中的最小值。
4.如权利要求1或2所述的解码装置,
可变换为所述线性预测系数的系数是线频谱对的参数,
所述指标Q’是与所述第一码对应的、全阶或者低阶的第一解码值的相邻阶数的解码值的差分的最小值。
5.如权利要求1或2所述的解码装置,
可变换为所述线性预测系数的系数是线频谱对的参数,
设p为预测阶数,所述指标计算单元使用规定的阶数T以下的所述第一解码值^θf[1],^θf[2],…,^θf[p],通过
Figure FDA0002265454320000021
Figure FDA0002265454320000022
计算所述指标Q,其中T≦p。
6.如权利要求1或2所述的解码装置,
可变换为所述线性预测系数的系数是PARCOR系数,
设p为预测阶数,所述指标计算单元使用所述第一解码值^kf[1],^kf[2],…,^kf[p],通过
Figure FDA0002265454320000023
计算Q’。
7.一种解码方法,包括:
第一解码步骤,第一解码单元对第一码进行解码,得到对应于可变换为多阶的线性预测系数的系数的第一解码值;
指标计算步骤,所述指标计算单元使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;
第二解码步骤,第二解码单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;
加法步骤,加法单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到对应于可变换为多阶的线性预测系数的系数的第三解码值,
所述第二解码值的阶数与所述第一解码值的阶数相比为低阶,
所述加法步骤对于与所述第二解码值的阶数相比的高阶,将各阶的所述第一解码值原样设为第三解码值。
8.一种解码方法,包括:
第一解码步骤,第一解码单元对第一码进行解码,得到对应于可变换为多阶的线性预测系数的系数的第一解码值;
指标计算步骤,所述指标计算单元使用全阶或者低阶的所述第一解码值,计算与频谱包络的峰谷大小的大峰谷对应的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’;
第二解码步骤,第二解码单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,对第二码进行解码,得到多阶的第二解码值;
加法步骤,加法单元在所述指标Q为规定的阈值Th1以上的情况,以及/或者,所述指标Q’为规定的阈值Th1’以下的情况下,将各阶的所述第一解码值和所述第二解码值相加,得到对应于可变换为多阶的线性预测系数的系数的第三解码值,
所述第二解码步骤对所述指标Q越大,以及/或者,所述指标Q’越小,具有越多的比特数的所述第二码进行解码,从越多的解码值的候选得到所述第二解码值。
9.如权利要求7或8所述的解码方法,
可变换为所述线性预测系数的系数是线频谱对的参数,
所述指标Q’是与所述第一码对应的、全阶或者低阶的第一解码值的相邻阶数的解码值的差分、和最低阶的第一解码值中的最小值。
10.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求7或8的解码方法的程序。
11.一种程序,用于使计算机执行权利要求7或8的解码方法。
CN201911086118.XA 2014-05-01 2015-03-16 解码装置、及其方法、记录介质 Active CN110875047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911086118.XA CN110875047B (zh) 2014-05-01 2015-03-16 解码装置、及其方法、记录介质

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014094759 2014-05-01
JP2014-094759 2014-05-01
CN201911086118.XA CN110875047B (zh) 2014-05-01 2015-03-16 解码装置、及其方法、记录介质
CN201580023537.2A CN106463137B (zh) 2014-05-01 2015-03-16 编码装置、及其方法、记录介质
PCT/JP2015/057728 WO2015166734A1 (ja) 2014-05-01 2015-03-16 符号化装置、復号装置、及びその方法、プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580023537.2A Division CN106463137B (zh) 2014-05-01 2015-03-16 编码装置、及其方法、记录介质

Publications (2)

Publication Number Publication Date
CN110875047A true CN110875047A (zh) 2020-03-10
CN110875047B CN110875047B (zh) 2023-06-09

Family

ID=54358474

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201911086244.5A Active CN110875048B (zh) 2014-05-01 2015-03-16 编码装置、及其方法、记录介质
CN201580023537.2A Active CN106463137B (zh) 2014-05-01 2015-03-16 编码装置、及其方法、记录介质
CN201910613605.0A Active CN110534122B (zh) 2014-05-01 2015-03-16 解码装置、及其方法、记录介质
CN201911086118.XA Active CN110875047B (zh) 2014-05-01 2015-03-16 解码装置、及其方法、记录介质

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN201911086244.5A Active CN110875048B (zh) 2014-05-01 2015-03-16 编码装置、及其方法、记录介质
CN201580023537.2A Active CN106463137B (zh) 2014-05-01 2015-03-16 编码装置、及其方法、记录介质
CN201910613605.0A Active CN110534122B (zh) 2014-05-01 2015-03-16 解码装置、及其方法、记录介质

Country Status (8)

Country Link
US (5) US10074376B2 (zh)
EP (4) EP3786949B1 (zh)
JP (4) JP6301452B2 (zh)
KR (3) KR101883817B1 (zh)
CN (4) CN110875048B (zh)
ES (4) ES2843300T3 (zh)
PL (4) PL3594946T3 (zh)
WO (1) WO2015166734A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102372369B1 (ko) 2021-04-02 2022-03-10 주식회사 강림퓨얼테크 친환경 가탄제 조성물

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1179820A2 (en) * 2000-08-10 2002-02-13 Mitsubishi Denki Kabushiki Kaisha Method of coding LSP coefficients during speech inactivity
JP2002236495A (ja) * 2000-11-30 2002-08-23 Matsushita Electric Ind Co Ltd 音声復号化装置および音声復号化方法
EP1672619A2 (en) * 2004-12-14 2006-06-21 LG Electronics, Inc. Speech coding apparatus and method therefor
CN1947174A (zh) * 2004-04-27 2007-04-11 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
CN101048649A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 可扩展解码装置及可扩展编码装置
CN101273404A (zh) * 2005-09-30 2008-09-24 松下电器产业株式会社 语音编码装置以及语音编码方法
JP2009139505A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
CN101903945A (zh) * 2007-12-21 2010-12-01 松下电器产业株式会社 编码装置、解码装置以及编码方法
CN102411933A (zh) * 2007-03-02 2012-04-11 松下电器产业株式会社 解码装置和解码方法
CN102422540A (zh) * 2009-05-20 2012-04-18 日本电信电话株式会社 编码方法、编码装置、解码方法、解码装置、程序以及记录介质
CN103460287A (zh) * 2011-04-05 2013-12-18 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序、记录介质

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06118998A (ja) * 1992-10-01 1994-04-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
US5913446A (en) 1994-06-21 1999-06-22 Von Holdt, Sr.; John W. Plastic bucket and lid
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JP3283152B2 (ja) * 1995-02-27 2002-05-20 松下電器産業株式会社 音声パラメータ量子化装置およびベクトル量子化装置
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
EP0921491A1 (en) * 1997-12-05 1999-06-09 Datalogic S.P.A. Method of estimating the mid-points of bar code elements"
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
JP3590342B2 (ja) * 2000-10-18 2004-11-17 日本電信電話株式会社 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
EP1339040B1 (en) * 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters
US6947551B2 (en) * 2001-03-26 2005-09-20 Tellabs Operations, Inc. Apparatus and method of time delay estimation
JP3636094B2 (ja) * 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3472279B2 (ja) * 2001-06-04 2003-12-02 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ符号化方法及び装置
DE10133945A1 (de) * 2001-07-17 2003-02-06 Bosch Gmbh Robert Verfahren und Vorrichtung zum Austausch und zur Verarbeitung von Daten
US8442276B2 (en) * 2006-03-03 2013-05-14 Honeywell International Inc. Invariant radial iris segmentation
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
EP2088588B1 (en) * 2006-11-10 2013-01-09 Panasonic Corporation Parameter decoding device, parameter encoding device, and parameter decoding method
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
CN101919164B (zh) * 2007-12-11 2013-10-30 日本电信电话株式会社 编码方法、解码方法、使用了这些方法的装置、程序、记录介质
JP5013293B2 (ja) * 2008-02-29 2012-08-29 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体
JP5038995B2 (ja) * 2008-08-25 2012-10-03 株式会社東芝 声質変換装置及び方法、音声合成装置及び方法
JP4735711B2 (ja) * 2008-12-17 2011-07-27 ソニー株式会社 情報符号化装置
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
FR2943875A1 (fr) * 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
US9076442B2 (en) * 2009-12-10 2015-07-07 Lg Electronics Inc. Method and apparatus for encoding a speech signal
WO2012005211A1 (ja) * 2010-07-05 2012-01-12 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体
JP5663461B2 (ja) * 2011-12-06 2015-02-04 日本電信電話株式会社 符号化方法、符号化装置、プログラム、記録媒体
CN103093757B (zh) * 2012-01-17 2014-10-29 大连理工大学 一种窄带码流转换为宽带码流的转换方法
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
CN103325375B (zh) * 2013-06-05 2016-05-04 上海交通大学 一种极低码率语音编解码设备及编解码方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1179820A2 (en) * 2000-08-10 2002-02-13 Mitsubishi Denki Kabushiki Kaisha Method of coding LSP coefficients during speech inactivity
US20020038210A1 (en) * 2000-08-10 2002-03-28 Hisashi Yajima Speech coding apparatus capable of implementing acceptable in-channel transmission of non-speech signals
JP2002236495A (ja) * 2000-11-30 2002-08-23 Matsushita Electric Ind Co Ltd 音声復号化装置および音声復号化方法
CN1947174A (zh) * 2004-04-27 2007-04-11 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
CN101048649A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 可扩展解码装置及可扩展编码装置
EP1672619A2 (en) * 2004-12-14 2006-06-21 LG Electronics, Inc. Speech coding apparatus and method therefor
CN101273404A (zh) * 2005-09-30 2008-09-24 松下电器产业株式会社 语音编码装置以及语音编码方法
CN102411933A (zh) * 2007-03-02 2012-04-11 松下电器产业株式会社 解码装置和解码方法
JP2009139505A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
CN101903945A (zh) * 2007-12-21 2010-12-01 松下电器产业株式会社 编码装置、解码装置以及编码方法
CN102422540A (zh) * 2009-05-20 2012-04-18 日本电信电话株式会社 编码方法、编码装置、解码方法、解码装置、程序以及记录介质
CN103460287A (zh) * 2011-04-05 2013-12-18 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序、记录介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DONG-IL CHANG ET AL.: "\"Efficient quantization of LSF parameters using classified SVQ combined with conditional splitting\"", 《INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING》 *

Also Published As

Publication number Publication date
US20190287545A1 (en) 2019-09-19
CN110534122B (zh) 2022-10-21
EP3594945B1 (en) 2020-11-04
ES2761681T3 (es) 2020-05-20
KR20180059561A (ko) 2018-06-04
JP6668532B2 (ja) 2020-03-18
PL3594946T3 (pl) 2021-03-08
US10529350B2 (en) 2020-01-07
CN110875048B (zh) 2023-06-09
US20190304476A1 (en) 2019-10-03
ES2840349T3 (es) 2021-07-06
US10381015B2 (en) 2019-08-13
ES2843300T3 (es) 2021-07-16
US10553229B2 (en) 2020-02-04
EP3594945A1 (en) 2020-01-15
KR101883817B1 (ko) 2018-07-31
EP3786949A1 (en) 2021-03-03
JP6495492B2 (ja) 2019-04-03
CN106463137A (zh) 2017-02-22
US10074376B2 (en) 2018-09-11
CN110875048A (zh) 2020-03-10
EP3594946B1 (en) 2020-10-28
JP2019113859A (ja) 2019-07-11
EP3139383A4 (en) 2017-10-11
CN106463137B (zh) 2019-12-10
PL3139383T3 (pl) 2020-03-31
US20180330741A1 (en) 2018-11-15
US10811021B2 (en) 2020-10-20
EP3139383A1 (en) 2017-03-08
US20200090673A1 (en) 2020-03-19
JP6301452B2 (ja) 2018-03-28
KR20180058846A (ko) 2018-06-01
KR101860888B1 (ko) 2018-05-28
KR20160138558A (ko) 2016-12-05
KR101883823B1 (ko) 2018-08-01
PL3786949T3 (pl) 2022-05-02
ES2912595T3 (es) 2022-05-26
JP2018063457A (ja) 2018-04-19
EP3139383B1 (en) 2019-09-25
US20170047075A1 (en) 2017-02-16
JPWO2015166734A1 (ja) 2017-04-20
PL3594945T3 (pl) 2021-05-04
CN110875047B (zh) 2023-06-09
WO2015166734A1 (ja) 2015-11-05
CN110534122A (zh) 2019-12-03
EP3786949B1 (en) 2022-02-16
JP2019109542A (ja) 2019-07-04
JP6668531B2 (ja) 2020-03-18
EP3594946A1 (en) 2020-01-15

Similar Documents

Publication Publication Date Title
CN110444215B (zh) 编码装置、编码方法、记录介质
JP6668532B2 (ja) 復号装置、及びその方法、プログラム、記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant