CN107408390A - 线性预测编码装置、线性预测解码装置、它们的方法、程序以及记录介质 - Google Patents

线性预测编码装置、线性预测解码装置、它们的方法、程序以及记录介质 Download PDF

Info

Publication number
CN107408390A
CN107408390A CN201680021332.5A CN201680021332A CN107408390A CN 107408390 A CN107408390 A CN 107408390A CN 201680021332 A CN201680021332 A CN 201680021332A CN 107408390 A CN107408390 A CN 107408390A
Authority
CN
China
Prior art keywords
coefficient
linear
transform
unit
code book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680021332.5A
Other languages
English (en)
Other versions
CN107408390B (zh
Inventor
守谷健弘
镰本优
原田登
龟冈弘和
杉浦亮介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Publication of CN107408390A publication Critical patent/CN107408390A/zh
Application granted granted Critical
Publication of CN107408390B publication Critical patent/CN107408390B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

线性预测编码装置包括:线性预测分析单元(221),使用通过进行将与时序信号对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;适配单元(22A),使存储在码本存储单元(222)中的码本所储存的可变换为线性预测系数的系数的多个候选、和线性预测分析单元(221)所得到的可变换为线性预测系数的系数、的η的值适配;以及编码单元(224),使用η的值被适配的可变换为线性预测系数的系数的多个候选和可变换为线性预测系数的系数,得到与线性预测分析单元(221)所得到的可变换为线性预测系数的系数相对应的线性预测系数码。

Description

线性预测编码装置、线性预测解码装置、它们的方法、程序以 及记录介质
技术领域
本发明涉及对可变换为线性预测系数的系数进行编码或解码的技术。
背景技术
作为可变换为线性预测系数的系数之一即LSP参数的量化技术,已知向量量化等方法(例如参照非专利文献1)。
另外,虽非公知,但发明人提出了参数η。该参数η例如是对在诸如3GPP EVS(增强语音服务(Enhanced Voice Services))标准中使用的利用线性预测包络的频域的系数的量化值进行算术编码的编码方式中确定算术码的编码对象所属的概率分布的形状参数。参数η与编码对象的分布具有关联性,若适当地确定参数η,则能够进行高效的编码及解码。
此外,参数η可以成为表示时序信号的特征的指标。因此,若适当地使用参数η,则能够对LSP参数等可变换为线性预测系数的系数高效地进行编码及解码。
现有技术文献
非专利文献
非专利文献1:守谷健弘,“高压缩语音编码的必要技术:线谱对(LSP)(高圧縮音声符号化の必須技術:線スペクトル対(LSP))”,NTT技术期刊,2014年9月,P.58-60
发明内容
发明要解决的课题
但是,不知道使用了参数η的可变换为线性预测系数的系数的编码及解码技术。
本发明的目的在于,提供使用参数η进行可变换为线性预测系数的系数的编码或解码的线性预测编码装置、线性预测解码装置、它们的方法、程序以及记录介质。
用于解决课题的方案
根据本发明的一方式的线性预测编码装置,将参数η设为正数,将与时序信号相对应的参数η设为对用与该时序信号相对应的频域样本串的绝对值的η次幂视为功率谱从而估计出的频谱包络除频域样本串算出的序列即白化频谱序列的直方图进行近似的广义高斯分布的形状参数,η1设为参数η的规定的值,该线性预测编码装置包括:线性预测分析单元,使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;码本存储单元,存储与N种类(N是1以上的整数)的参数η各自相对应的N个码本,在各码本中储存了多个与各参数η相对应的可变换为线性预测系数的系数的候选;适配单元,使存储在码本存储单元中的码本所储存的可变换为线性预测系数的系数的多个候选、和线性预测分析单元所得到的可变换为线性预测系数的系数、的η的值适配;以及编码单元,使用使η的值适配了的可变换为线性预测系数的系数的多个候选和可变换为线性预测系数的系数,得到与线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
根据本发明的一方式的线性预测编码装置,将参数η设为正数,将与时序信号相对应的参数η设为对用通过将与该时序信号相对应的频域样本串的绝对值的η次幂视为功率谱而估计出的频谱包络除频域样本串算出的序列即白化频谱序列的直方图进行近似的广义高斯分布的形状参数,η1设为参数η的规定的值,该线性预测编码装置包括:线性预测分析单元,使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;码本存储单元,存储了码本;适配单元,基于被输入的η1,使存储在码本存储单元中的码本和可变换为线性预测系数的系数的至少一方适配;以及编码单元,使用码本或者进行了适配的码本,对可变换为线性预测系数的系数或者进行了适配的可变换为线性预测系数的系数进行编码。
根据本发明的一方式的线性预测解码装置,包含:码本存储单元,存储了码本;以及适配单元,将η1设为正数,基于被输入的η1,使存储在码本存储单元中的码本、和储存在码本中的多个可变换为线性预测系数的系数的候选中的、与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选的至少一方适配,可变换为线性预测系数的系数用于得到将与可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η1次幂的序列、即非平滑化频谱包络序列。
发明效果
能够使用参数η进行可变换为线性预测系数的系数的编码或解码。
附图说明
图1是用于说明线性预测编码装置的例子的框图。
图2是用于说明线性预测编码装置的例子的框图。
图3是用于说明线性预测编码装置的例子的框图。
图4是用于说明线性预测编码方法的例子的流程图。
图5是用于说明LSP参数和η的关系的例子的图。
图6是用于说明线性预测解码装置的例子的框图。
图7是用于说明线性预测解码方法的例子的流程图。
图8是用于说明编码装置的例子的框图。
图9是用于说明编码方法的例子的流程图。
图10是用于说明编码单元的例子的框图。
图11是用于说明编码单元的例子的框图。
图12是用于说明编码单元的处理的例子的流程图。
图13是用于说明解码装置的例子的框图。
图14是用于说明解码方法的例子的流程图。
图15是用于说明解码单元的处理的例子的流程图。
图16是用于说明编码装置的例子的框图。
图17是用于说明编码方法的例子的流程图。
图18是用于说明参数决定装置的例子的框图。
图19是用于说明参数决定方法的例子的流程图。
图20是用于说明广义高斯分布的例子的图。
图21是用于说明线性预测编码装置的例子的框图。
图22是用于说明线性预测编码方法的例子的流程图。
图23是用于说明线性预测解码装置的例子的框图。
图24是用于说明线性预测解码方法的例子的流程图。
图25是用于说明线性预测编码装置的例子的框图。
图26是用于说明线性预测编码装置的例子的框图。
图27是用于说明线性预测编码装置的例子的框图。
图28是用于说明线性预测解码装置的例子的框图。
具体实施方式
[线性预测编码装置、线性预测解码装置以及它们的方法]
以下,说明线性预测编码装置、线性预测解码装置以及使用了它们的方法的编码装置、解码装置以及它们的方法的例子。
[线性预测编码装置、线性预测解码装置以及它们的方法的第一实施方式]
(编码)
说明第一实施方式的线性预测编码装置以及方法的一例。
如图1、图2或者图3所示,第一实施方式的线性预测编码装置例如包括线性预测分析单元221、码本存储单元222、编码单元224以及线性变换单元225。在图1、图2或者图3的例子中,在线性预测编码装置的外部设置有频域变换单元220,但线性预测编码装置也可以进一步包括频域变换单元220。线性预测编码装置的各单元通过进行图4中例示的各处理而实现线性预测编码方法。
<频域变换单元220>
频域变换单元220中被输入作为时序信号的时域的声音信号。
频域变换单元41以规定的时间长度的帧单位,将被输入的时域的声音信号变换为频域的N点的MDCT系数串X(0),X(1),…,X(N-1)。N是正整数。
所得到的MDCT系数串X(0),X(1),…,X(N-1)被输出到线性预测分析单元221。
除非特别予以否认,否则假设以后的处理以帧单位进行。
这样,频域变换单元220求与时序信号相对应的、例如MDCT系数串即频域样本串。
<线性预测分析单元221>
线性预测分析单元221中被输入例如MDCT系数串X(0),X(1),…,X(N-1)即频域样本串以及与该频域样本串相对应的参数η1
参数η1是正数。参数η1例如由后述的参数决定单元27、27’决定。参数η1例如是对在3GPP EVS(Enhanced Voice Services)标准中使用的利用线性预测包络的频域的系数的量化值进行算术编码的编码方式中确定算术码的编码对象所属的概率分布的参数η。参数η可以成为表示时序信号的特征的指标。后面出现的参数η2、η3也是参数η。也可以说η1、η2、η3是参数η的规定的值。
另外,假设关于参数η1的信息被发送到线性预测解码装置。例如,表示参数η1的参数码被发送到线性预测解码装置。
线性预测分析单元221使用MDCT系数串X(0),X(1),…,X(N-1)以及η1,使用由以下的式(A7)定义的~R(0),~R(1),…,~R(N-1)进行线性预测分析,生成可变换为线性预测系数的系数(步骤DE1)。
[数学式1]
所生成的可变换为线性预测系数的系数被输出到编码单元224。
具体而言,线性预测分析单元22首先通过进行相当于将MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η1次幂视为功率谱的傅立叶逆变换的运算、即式(A7)的运算,求与MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η1次幂相对应的时域的信号串、即伪相关函数信号串~R(0),~R(1),…,~R(N-1)。接着,线性预测分析单元22使用求出的伪相关函数信号串R(0),~R(1),…,R(N-1)进行线性预测分析,生成可变换为线性预测系数的系数。
这样,线性预测分析单元221将η1设为正数,使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数。
所谓可变换为线性预测系数的系数,例如是LSP、PARCOR系数、ISP等。可变换为线性预测系数的系数也可以是线性预测系数本身。
设p是规定的正数,设线性预测系数中可能的系数的阶数是p阶。
<码本存储单元222>
在码本存储单元222中,存储有储存了与参数η2相对应的可变换为线性预测系数的系数的多个候选的码本。
以下,将可变换为线性预测系数的系数的候选和与该可变换为线性预测系数的系数的候选相对应的码的对,称为候选码对。在码本中存储有多个候选码对。换言之,若设N为规定的2以上的数,则在码本中存储有N个候选对。与可变换为线性预测系数的系数的候选相对应的各码被分配了规定的数的比特。各码用被分配的规定的数的比特表示。
可变换为线性预测系数的系数的阶数为p,所以可变换为线性预测系数的系数的各候选由p个值构成。
所谓与参数η2相对应的可变换为线性预测系数的系数的候选,是为了对与参数η的值为η2的频域样本串相对应的可变换为线性预测系数的系数进行编码而进行了最优化的可变换为线性预测系数的系数的候选。
<线性变换单元225>
线性变换单元225中被输入线性预测分析单元221所得到的可变换为线性预测系数的系数和与该可变换为线性预测系数的系数相对应的参数η1。参数η1例如由后述的参数决定单元27、27’决定。
线性变换单元225包括第一线性变换单元2251及第二线性变换单元2252中的至少一方。
以下,(1)如图1所示,将线性变换单元225包括第一线性变换单元2251的情况设为第1情况,(2)如图2所示,将线性变换单元225包括第二线性变换单元2252的情况设为第2情况,(3)如图3所示,将线性变换单元225包括第一线性变换单元2251及第二线性变换单元2252的情况设为第3情况,说明各情况。
(1)第1情况
在该情况下,线性变换单元225的第一线性变换单元2251对存储在码本存储单元222中的可变换为线性预测系数的系数的候选,至少进行与被输入的参数η1相应的第一线性变换(步骤DE2)。
例如,第一线性变换单元2251通过与被输入的参数η1、和与储存在码本存储单元222中的可变换为线性预测系数的系数的候选相对应的参数η2相应的第一线性变换,将从码本存储单元222读入的与参数η2相对应的可变换为线性预测系数的系数的候选,变换为与参数η1相对应的可变换为线性预测系数的系数的候选。
所谓与参数η1相对应的可变换为线性预测系数的系数的候选,是为了对与参数η的值为η1的频域样本串相对应的可变换为线性预测系数的系数进行编码而进行了最优化的可变换为线性预测系数的系数的候选。
第一线性变换后的可变换为线性预测系数的系数的候选被输出到编码单元224。
另外,在参数η1的值和参数η2的值相同的情况下,第一线性变换单元2251也可以不进行第一线性变换。
此外,例如,线性变换单元225的第一线性变换单元2251根据被输入的参数η1,对从码本存储单元222读入的可变换为线性预测系数的系数的候选进行第一线性变换,使得被输入的参数η1越小则与第一线性变换后的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列越平坦,并将变换后的可变换为线性预测系数的系数的候选输出。
通常,参数η越小,则存在非平滑化频谱包络序列越平坦的趋势,存在可变换为线性预测系数的系数取更加相同的值的趋势。例如在可变换为线性预测系数的系数为LSP的情况下,存在参数η越小,则LSP即可变换为线性预测系数的系数更加接近于将从0至π为止进行均分后的值的趋势。
图5表示参数η取各值时的LSP参数的值的例子。图5的横轴是参数η,纵轴是LSP参数。观察图5可知,存在参数η越小则LSP参数更加接近于将从0至π为止进行均分后的值的趋势。
利用该趋势,使用以与参数η1越小则非平滑化频谱包络序列变得越平坦的情况相对应的方式对可变换为线性预测系数的系数的候选进行了变换的系数进行编码及解码,从而能够更加提高量化性能。
(2)第2情况
在该情况下,线性变换单元225的第二线性变换单元2252对线性预测分析单元221所得到的可变换为线性预测系数的系数,至少进行与所输入的参数η1相应的第二线性变换(步骤DE2)。
例如,第二线性变换单元2252将线性预测分析单元221所得到的与参数η1相对应的可变换为线性预测系数的系数,第二线性变换为与参数η2相对应的可变换为线性预测系数的系数,以使其与储存在码本存储单元222中的可变换为线性预测系数的系数的候选相对应。
第二线性变换后的可变换为线性预测系数的系数被输出到编码单元224。
另外,在参数η1的值和参数η2的值相同的情况下,第二线性变换单元2252也可以不进行第二线性变换。
或者,例如,线性变换单元225的第二线性变换单元2252根据被输入的参数η1,对被输入的可变换为线性预测系数的系数进行第二线性变换,使得被输入的参数η1越小则与第二线性变换后的可变换为线性预测系数的系数相对应的振幅频谱包络的序列越平坦,并输出变换后的可变换为线性预测系数的系数。
(3)第3情况
在该情况下,线性变换单元225的第一线性变换单元2251对存储在码本存储单元222中的可变换为线性预测系数的系数的候选,至少进行与参数η3相应的第一线性变换。参数η3是正值,对其预先确定不同于参数η2的值,或者从线性预测系数编码装置的外部输入。
例如,第一线性变换单元2251通过根据参数η3和与储存在码本存储单元222中的可变换为线性预测系数的系数的候选相对应的参数η2的第一线性变换,将从码本存储单元222读入的与参数η2相对应的可变换为线性预测系数的系数的候选,变换为与参数η3相对应的可变换为线性预测系数的系数的候选。
所谓与参数η3相对应的可变换为线性预测系数的系数的候选,是为了对与参数η的值为η3的频域样本串相对应的可变换为线性预测系数的系数进行编码而进行了最优化的可变换为线性预测系数的系数的候选。
第一线性变换后的可变换为线性预测系数的系数的候选被输出到编码单元224。
另外,在参数η2的值和参数η3的值相同的情况下,第一线性变换单元2251也可以不进行第一线性变换。
此外,例如,线性变换单元225的第一线性变换单元2251对从码本存储单元222读入的可变换为线性预测系数的系数的候选进行第一线性变换,使得参数η3越小则与第一线性变换后的可变换为线性预测系数的系数的候选相对应的振幅频谱包络越平坦,并输出变换后的可变换为线性预测系数的系数的候选。
此外,该第3情况下,线性变换单元225的第二线性变换单元2252对线性预测分析单元221所得到的可变换为线性预测系数的系数至少进行与参数η1相应的第二线性变换。
例如,第二线性变换单元2252将线性预测分析单元221所得到的与参数η1相对应的可变换为线性预测系数的系数进行第二线性变换为与参数η3相对应的可变换为线性预测系数的系数。
第二线性变换后的可变换为线性预测系数的系数的候选被输出到编码单元224。
另外,在参数η1的值和参数η3的值相同的情况下,第二线性变换单元2252也可以不进行第二线性变换。
或者,例如,线性变换单元225的第二线性变换单元2252根据被输入的参数η1,对被输入的可变换为线性预测系数的系数进行第二线性变换,使得被输入的参数η1越小则与第二线性变换后的可变换为线性预测系数的系数相对应的振幅频谱包络越平坦,并输出变换后的可变换为线性预测系数的系数。
这样,在(3)第3情况下,线性变换单元225进行对存储在码本存储单元222中的可变换为线性预测系数的系数的候选的、与η3相应的第一线性变换、和对线性预测分析单元221所得到的可变换为线性预测系数的系数的、与η3相应的第二线性变换中的至少一方(步骤DE2)。
<编码单元224>
编码单元224的处理根据线性变换单元225的结构而不同。因此,在下面说明线性变换单元225在(1)第1情况、(2)第2情况以及(3)第3情况的各情况下的编码单元224的处理。
(1)第1情况
线性变换单元22在(1)第1情况下,编码单元224中被输入线性预测分析单元221所得到的可变换为线性预测系数的系数、和线性变换单元225的第一线性变换单元2251所得到的第一线性变换后的可变换为线性预测系数的系数的候选。
编码单元224针对可变换为线性预测系数的系数,使用第一线性变换后的可变换为线性预测系数的系数的候选来进行编码而得到线性预测系数码(步骤DE3)。
具体而言,编码单元224从第一线性变换后的可变换为线性预测系数的系数的多个候选中,选择与可变换为线性预测系数的系数最接近的候选,并将与该选择出的候选相对应的码设为线性预测系数码。
所得到的线性预测系数码被输出到解码装置。
(2)第2情况
线性变换单元22在(2)第2情况下,编码单元224中被输入线性预测分析单元221的第二线性变换单元2252所得到的可变换为线性预测系数的系数、和存储在码本存储单元222中的可变换为线性预测系数的系数的候选。
编码单元224针对第二线性变换后的可变换为线性预测系数的系数,使用可变换为线性预测系数的系数的候选来进行编码而得到线性预测系数码(步骤DE3)。
具体而言,编码单元224从可变换为线性预测系数的系数的多个候选中,选择与第二线性变换后的可变换为线性预测系数的系数最接近的候选,并将与该选择出的候选相对应的码设为线性预测系数码。
所得到的线性预测系数码被输出到解码装置。
(3)第3情况
线性变换单元22在(3)第3情况下,编码单元224中被输入线性预测分析单元221的第二线性变换单元2252所得到的可变换为线性预测系数的系数、和线性预测分析单元221的第一线性变换单元2251所得到的可变换为线性预测系数的系数的候选。
编码单元224针对第二线性变换后的可变换为线性预测系数的系数,使用第一线性变换后的可变换为线性预测系数的系数的候选来进行编码而得到线性预测系数码(步骤DE3)。
具体而言,编码单元224从第一线性变换后的可变换为线性预测系数的系数的多个候选中,选择与第二线性变换后的可变换为线性预测系数的系数最接近的候选,并将与该选择出的候选相对应的码设为线性预测系数码。
所得到的线性预测系数码被输出到解码装置。
如上述,在使用可变换为线性预测系数的系数的候选对可变换为线性预测系数的系数进行编码时,通过将对可变换为线性预测系数的系数和可变换为线性预测系数的系数的候选的至少任一者进行了线性变换后的系数用于编码,使得与可变换为线性预测系数的系数相对应的参数η和与可变换为线性预测系数的系数的候选相对应的参数η成为相同的值或者相近的值,从而能够减小编码失真以及/或者能够减小线性预测系数码的码量。
(解码)
说明第一实施方式的线性预测解码装置及方法的一例。
如图6所示,第一实施方式的线性预测解码装置例如包括码本存储单元311、解码单元313及线性变换单元314。线性预测解码装置的各单元通过进行图7中例示的各处理而实现线性预测解码方法。
<码本存储单元311>
码本存储单元311中存储有与存储在码本存储单元222中的码本相同的码本。即,码本存储单元311中存储有储存了与参数η2相对应的可变换为线性预测系数的系数的多个候选的码本。
<解码单元313>
解码单元313中被输入线性预测编码装置所输出的线性预测系数码。
解码单元313得到存储在码本存储单元311中的可变换为线性预测系数的系数的多个候选中的、与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选,作为可变换为线性预测系数的系数(步骤DD1)。
所得到的可变换为线性预测系数的系数被输出到线性变换单元314。
所得到的可变换为线性预测系数的系数是,存储在码本存储单元311中的与参数η2相对应的可变换为线性预测系数的系数的多个候选中的任1个。因此,解码单元313所得到的可变换为线性预测系数的系数成为与参数η2相对应的可变换为线性预测系数的系数。
<线性变换单元314>
线性变换单元314中被输入解码单元313所得到的与参数η2相对应的可变换为线性预测系数的系数、和参数η1。该参数η1例如是通过对从线性预测编码装置接收到的参数码进行解码而得到的。
线性变换单元314对与参数η2相对应的可变换为线性预测系数的系数至少进行与参数η1相应的线性变换,得到线性变换后的可变换为线性预测系数的系数。
例如,线性变换单元314通过根据被输入的参数η1和与可变换为线性预测系数的系数相对应的参数η2的线性变换,将与参数η2相对应的可变换为线性预测系数的系数,变换为与参数η1相对应的可变换为线性预测系数的系数。
所得到的线性变换后的可变换为线性预测系数的系数作为通过线性预测解码装置或者方法得到的解码结果被输出。
另外,在参数η1的值和参数η2的值相同的情况下,线性变换单元314也可以不进行线性变换。
此外,线性变换单元314也可以设为下述结构:在对与参数η2相对应的可变换为线性预测系数的系数进行线性变换如图得到与参数η1相对应的可变换为线性预测系数的系数时,使用既不同于参数η1也不同于参数η2的参数η4,多次进行线性变换。
例如,说明进行2次线性变换的情况。在该情况下,线性变换单元314对与参数η2相对应的可变换为线性预测系数的系数进行线性变换而得到与参数η4相对应的可变换为线性预测系数的系数。此外,线性变换单元314对所得到的与参数η4相对应的可变换为线性预测系数的系数进行线性变换而得到与参数η1对应的可变换为线性预测系数的系数。这里,如果将参数η4设为与线性预测系数编码装置所使用的参数η3相同的值,则在2个线性变换中,能够使用与线性预测系数编码装置的线性变换单元225的第3情况下的根据与参数η2相对应的可变换为线性预测系数的系数的候选而得到与参数η3相对应的可变换为线性预测系数的系数的候选的线性变换、和线性预测系数编码装置的线性变换单元225的第3情况下的根据与参数η1相对应的可变换为线性预测系数的系数而得到与参数η3相对应的可变换为线性预测系数的系数的线性变换相同的线性变换。
另外,线性变换单元314也可以通过对与参数η2相对应的可变换为线性预测系数的系数进行将从参数η2向参数η3的线性变换和从参数η3向参数η1的线性变换合成后的1个线性变换,从而得到与参数η1相对应的可变换为线性预测系数的系数。
所得到的与参数η1相对应的可变换为线性预测系数的系数作为通过线性预测解码装置或者方法得到的解码结果被输出。
此外,例如,线性变换单元314也可以与线性预测编码装置的线性变换单元225同样地,对解码单元313所得到的可变换为线性预测系数的系数进行线性变换而得到线性变换后的可变换为线性预测系数的系数,使得被输入的η1越小,则与线性变换后的可变换为线性预测系数的系数相对应的振幅频谱包络越平坦。
这基于通常参数η越小则非平滑化频谱包络序列越平坦这一趋势。
线性变换单元314所得到的线性变换后的可变换为线性预测系数的系数被用于得到将与线性变换单元314所得到的可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η1次幂的序列、即非平滑化频谱包络序列。
[线性变换]
以下,说明第一线性变换及第二线性变换等线性变换的例子。
将线性变换前的可变换为线性预测系数的系数或者可变换为线性预测系数的系数的候选设为^ω[k][k=1,2,…,p],将线性变换后的可变换为线性预测系数的系数或者上述可变换为线性预测系数的系数的候选设为ω[k][k=1,2,…,p]。此外,假设线性变换前的可变换为线性预测系数的系数为LSP。此时,第一线性变换单元2251、第二线性变换单元2252、线性逆变换单元226以及线性变换单元314例如进行以下的式子所示的线性变换。
[数学式2]
这里,将x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp设为规定的非负数,假设y1,y2,…yp-1,z2,z3,…zp中的至少1个是规定的正数,将K设为除x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp以外的要素为0的矩阵。
x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp的具体的值,基于与线性变换前的可变换为线性预测系数的系数或者可变换为线性预测系数的系数的候选相对应的参数η(以下设为线性变换前参数ηA)的值、和与线性变换后的可变换为线性预测系数的系数或者可变换为线性预测系数的系数的候选相对应的参数η(以下设为线性变换后参数ηB)的值而适当地确定。
将与线性变换前参数ηA和线性变换后参数ηB的不同的多个组相对应的x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp的具体的值预先存储在未图示的存储单元中。第一线性变换单元2251、第二线性变换单元2252、线性逆变换单元226及线性变换单元314在进行线性变换时,读入与该线性变换中的线性变换前参数ηA和线性变换后参数ηB的组相对应的x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp的具体的值,使用读入的这些值进行上述式的线性变换即可。
另外,在参数η1大的情况下,存在使用可变换为线性预测系数的系数计算出的频谱包络的变动大的趋势。因此,期望使用阶数大的可变换为线性预测系数的系数的候选进行编码及解码。
相反,在参数η1小的情况下,存在使用可变换为线性预测系数的系数计算出的频谱包络的变动小的趋势。因此,即使使用阶数小的可变换为线性预测系数的系数的候选进行编码及解码,量化失真也小,所以编码及解码的精度并不会变得很差。
因此,线性变换单元225的第一线性变换单元2251也可以进行第一线性变换使得参数η1越小则第一线性变换后的可变换为线性预测系数的系数的候选的阶数越小。
同样,线性变换单元314也可以进行线性变换使得参数η1越小则线性变换后的可变换为线性预测系数的系数的阶数越小。
如上述,也可以进行线性变换使得线性变换前的线性变换前的可变换为线性预测系数的系数或者可变换为线性预测系数的系数的候选的阶数、和线性变换后的可变换为线性预测系数的系数或者可变换为线性预测系数的系数的候选的阶数不同。
另外,第一线性变换单元2251也可以在进行了线性变换前的阶数和线性变换后的阶数相同的线性变换后将线性变换后的可变换为线性预测系数的系数的候选的阶数减少。此外,第一线性变换单元2251也可以在将线性变换后的可变换为线性预测系数的系数的候选的阶数减少后进行线性变换前的阶数和线性变换后的阶数相同的线性变换。
同样,线性变换单元314也可以在进行了线性变换前的阶数和线性变换后的阶数相同的线性变换后将线性变换后的可变换为线性预测系数的系数的阶数减少。此外,线性变换单元314也可以在将线性变换后的可变换为线性预测系数的系数的阶数减少后进行线性变换前的阶数和线性变换后的阶数相同的线性变换。
此外,第一线性变换单元2251在参数η1小的情况下也可以通过将线性变换后的可变换为线性预测系数的系数的多个候选合并,从而参数η1越小则越减少线性变换后的可变换为线性预测系数的系数的多个候选数。
[线性预测编码装置、线性预测解码装置以及它们的方法的第二实施方式]
(编码)
说明第二实施方式的线性预测编码装置及方法的一例。
如图21所示,第二实施方式的线性预测编码装置例如包括线性预测分析单元221、码本存储单元222、码本选择单元223以及编码单元224。在图21的例子中,在线性预测编码装置的外部设置有频域变换单元220,但是线性预测编码装置也可以还包括频域变换单元220。线性预测编码装置的各单元通过进行图22中例示的各处理而实现线性预测编码方法。
在第二实施方式中将“参数η1”标记为“参数η”。
<频域变换单元220>
频域变换单元220中被输入作为时序信号的时域的声音信号。
频域变换单元41以规定的时间长度的帧单位,将被输入的时域的声音信号变换为频域的N点的MDCT系数串X(0),X(1),…,X(N-1)。N是正整数。
所得到的MDCT系数串X(0),X(1),…,X(N-1)被输出到线性预测分析单元221。
除非特别予以否认,否则假设以后的处理以帧单位进行。
这样,频域变换单元220求出与时序信号相对应的例如MDCT系数串即频域样本串。
<线性预测分析单元221>
线性预测分析单元221中被输入例如MDCT系数串X(0),X(1),…,X(N-1)即频域样本串、以及与该频域样本串相对应的参数η。
参数η是正数。参数η例如由后述的参数决定单元27、27’决定。参数η例如是在3GPPEVS(增强语音服务(Enhanced Voice Services))标准中使用的对利用线性预测包络的频域的系数的量化值进行算术编码的编码方式中,确定算术码的编码对象所属的概率分布的形状参数。参数η可以成为表示时序信号的特征的指标。
线性预测分析单元221、线性预测分析单元22使用MDCT系数串X(0),X(1),…,X(N-1)及η,使用由以下的式(A7)定义的R(0),R(1),…,R(N-1)进行线性预测分析,生成可变换为线性预测系数的系数(步骤DE1)。
[数学式3]
所生成的可变换为线性预测系数的系数被输出到编码单元224。
具体而言,线性预测分析单元22首先通过进行相当于将MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η次幂视为功率谱的傅立叶逆变换的运算、即式(A7)的运算,求出与MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η次幂相对应的时域的信号串、即伪相关函数信号串R(0),R(1),…,R(N-1)。然后,线性预测分析单元22使用求出的伪相关函数信号串R(0),R(1),…,R(N-1)进行线性预测分析,生成可变换为线性预测系数的系数。
这样,线性预测分析单元221使用通过将η设为正数且进行将与时序信号相对应的频域样本串的绝对值的η次幂视为功率谱的傅立叶逆变换得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数。
所谓可变换为线性预测系数的系数,例如是LSP、PARCOR系数、ISP等。可变换为线性预测系数的系数也可以是线性预测系数本身。
将p设为规定的正数,将可变换为线性预测系数的系数的阶数设为p次。
<码本存储单元222>
码本存储单元222中存储有多个码本。
以下,假设将可变换为线性预测系数的系数的候选、和与该可变换为线性预测系数的系数的候选相对应的码的对称为候选码对。在各码本中存储有多个的候选码对。换言之,若将I设为规定的2以上的数,将Ni设为根据i确定的规定的2以上的数,则各码本i(i=1,2,…,I)中存储有Ni个候选对。与可变换为线性预测系数的系数的候选相对应的各码被分配了规定的数的比特。各码由被分配的规定的数的比特表示。
可变换为线性预测系数的系数的阶数为p,所以可变换为线性预测系数的系数的各候选由p个值构成。
存储在码本存储单元222中的多个码本根据码本选择单元223的码本的选择方法而不同。因此,与后述的码本选择单元223的例子一起说明存储在码本存储单元222中的多个码本的例子。
<码本选择单元223>
码本选择单元223中被输入参数η。
码本选择单元223根据被输入的η,从存储在码本存储单元222中的多个码本中选择码本(步骤DE2)。与选择出的码本有关的信息被输出到编码单元224。
以下,说明存储在码本存储单元222中的多个码本的例子以及码本选择单元223所进行的码本的选择基准的例子。
(1)第一方法
在第一方法中,在码本存储单元222中存储有可变换为线性预测系数的系数的候选数不同的多个码本。此外,参数η越大,码本选择单元223从存储在码本存储单元222中的多个码本中选择可变换为线性预测系数的系数的候选数越多的码本。
在参数η大的情况下,存在可变换为线性预测系数的系数的可取得的范围大的趋势,所以为了表示可变换为线性预测系数的系数而所需的可变换为线性预测系数的系数的候选数变多。因此,在参数η大的情况下,期望使用可变换为线性预测系数的系数的候选数多的码本进行编码及解码。
相反,在参数η小的情况下,存在可变换为线性预测系数的系数的可取得的范围窄的趋势,所以能够用较少个数的可变换为线性预测系数的系数的候选表示可变换为线性预测系数的系数。因此,在参数小的情况下,即使使用可变换为线性预测系数的系数的候选数少的码本进行编码及解码,量化失真也小,所以编码及解码的精度不会变得很差。
因此,在第一方法中,参数η越大,码本选择单元223从存储在码本存储单元222中的多个码本中选择可变换为线性预测系数的系数的候选数越多的码本。
能够基于阈值进行参数η的大小的判断、换言之适当的码本的选择。例如,假设第一码本的可变换为线性预测系数的系数的候选数比第二码本的可变换为线性预测系数的系数的候选数少。在该情况下,将参数η的阈值预先确定1个,在被输入的参数η比阈值小的情况下,判断为参数η小,选择第一码本。在被输入的参数η为阈值以上的情况下,判断为参数η大,选择第二码本。在码本数为3以上的情况下,使用其个数为从码本数减去1的值的阈值,与上述同样地选择码本即可。
另外,也可以是,码本具有多层构造,根据参数η决定使用到哪层为止。例如,说明p=16且用2层的码本对16阶的可变换为线性预测系数的系数进行编码的例子。假设对该码本的第一层分配了10比特的量化比特数,对第二层分配了5比特的量化比特数。由此,假设在第一层中储存210=1024个、可变换为线性预测系数的系数的候选即16维向量和与该候选相对应的码的对,在第二层中储存25=32个、可变换为线性预测系数的系数的候选即16维向量和与该候选相对应的码的对。
在该情况下,假设在参数η大的情况下使用第一层及第二层,在参数η小的情况下仅使用第一层。参数η是大还是小的判断能够与上述同样地基于阈值进行。
在参数η大的情况下,首先从第一层的可变换为线性预测系数的系数的候选中选择与被输入的可变换为线性预测系数的系数最接近的候选以及相对应的码。然后,从被输入的可变换为线性预测系数的系数减去所选择出的可变换为线性预测系数的系数的候选的值,从第二层的可变换为线性预测系数的系数的候选中选择与该减法运算值最接近的候选以及相对应的码。在该情况下,在第一层及第二层选择出的2个码成为线性预测系数码。即,线性预测系数码用15比特表示。此外,第一层及第二层中选择出的可变换为线性预测系数的系数的候选之和,成为被输入的可变换为线性预测系数的系数的量化结果。
在参数η小的情况下,从第一层的可变换为线性预测系数的系数的候选中选择与被输入的可变换为线性预测系数的系数最接近的候选以及相对应的码。在该情况下,第一层中选择出的码成为线性预测系数码。即,线性预测系数码用10比特表示。此外,第一层中选择出的可变换为线性预测系数的系数的候选成为可变换为被输入的线性预测系数的系数的量化结果。
若将由第一层构成的码本、和由第一层及第二层构成的码本认为是不同的码本,则本例也可以称为是(1)第一方法的一例。
如具有该多层构造的码本的例子所示,在1个码本中的候选码对的数量可变的情况下,换言之在1个码本中的候选码对的检索范围可变的情况下,也可以是,参数η越小则使候选码对的检索范围越窄。若将检索范围不同的候选码对的集合认为是不同的码本,则本例也可以称为是(1)第一方法的一例。
(2)第二方法
在第二方法中,码本存储单元222中存储有对与存储在码本中的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η次幂的序列、即非平滑化频谱包络序列的平坦程度不同的多个码本。此外,η越小,码本选择单元223从存储在码本存储单元222中的多个码本中选择对与存储在码本中的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η次幂的序列、即非平滑化频谱包络序列越平坦的码本。
通常,参数η越小,则存在非平滑化频谱包络序列越平坦的趋势,存在可变换为线性预测系数的系数取更加相同的值的趋势。例如在可变换为线性预测系数的系数为LSP的情况下,存在参数η越小则LSP参数即可变换为线性预测系数的系数越接近将从0至π为止进行均分后的值的趋势。
图5表示参数η取各值时的LSP参数的值的例子。图5的横轴是参数η,纵轴是LSP参数。观察图5可知,存在参数η越小则LSP参数越接近于将从0至π为止进行均分后的值的趋势。
在可变换为线性预测系数的系数是ISP参数的情况下,也存在同样的趋势。即,在可变换为线性预测系数的系数是ISP参数的情况下,存在参数η越小则ISP参数即可变换为线性预测系数的系数越接近于将0至π为止进行均分后的值的趋势。
在可变换为线性预测系数的系数是PARCOR系数的情况下,存在参数η越小则PARCOR系数即可变换为线性预测系数的系数从整体上其值变得越小的趋势。
第二方法是通过使用这些趋势,使用与参数η越小则非平滑化频谱包络序列越平坦的情况相对应的可变换为线性预测系数的系数的候选来进行编码及解码,从而提高量化性能的方法。
假设可变换为线性预测系数的系数是LSP或者PARCOR系数,将码本i(i=1,2,…,I)的可变换为线性预测系数的系数的候选标记为^ωn[1],^ωn[2],…,^ωn[p](n=1,2,…,Ni)。此外,将与非平滑化频谱包络最平坦的情况相对应的可变换为线性预测系数的系数标记为ωF[1],ωF[2],…,ωF[p]。
在该情况下,第二方法例如是通过假定在码本存储单元222中存储有以下的Si 1的值不同的多个码本i(i=1,2,…,I),且η越小则码本选择单元223选择以下的Si 1的值越小的码本i而实现的。
Si 1=(1/pNi)∑n=1 Nik=1 p|^ωn[k]-ωF[k]|
在第二方法中,也可以基于阈值进行适当的码本的选择。例如,假设对与第一码本的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η次幂的序列即非平滑化频谱包络序列,比对与第二码本的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η次幂的序列即非平滑化频谱包络序列平坦。在该情况下,将参数η的阈值预先确定1个,在被输入的参数η比阈值小的情况下判断为参数η小,选择第一码本。在被输入的参数η为阈值以上的情况下判断为参数η大,选择第二码本。在码本数为3以上的情况下,使用其个数为从码本数减去1的值的阈值,与此同样地选择码本即可。
(3)第三方法
在第三方法中,在码本存储单元222中存储有可变换为线性预测系数的系数的候选间的间隔不同的多个码本。此外,η越小,则码本选择单元223从存储在码本存储单元222中的多个码本中选择可变换为线性预测系数的系数的候选间的间隔越窄的码本。
所谓可变换为线性预测系数的系数的候选间的间隔,只要是表示该码本所包含的可变换为线性预测系数的系数的候选间的间隔的宽度的指标,则可以是任意的。例如,可变换为线性预测系数的系数的候选间的间隔,既可以是该码本所包含的、可变换为线性预测系数的系数的某个候选和可变换为线性预测系数的系数的另一候选的距离的平均值,也可以是该距离的最大值、最小值或者中央值。
如第一方法所述,在参数η大的情况下,存在可变换为线性预测系数的系数的变动大的趋势。因此,期望使用可变换为线性预测系数的系数的候选间的间隔宽的码本进行编码及解码。
相反,在参数η小的情况下,存在可变换为线性预测系数的系数的变动小的趋势。因此,即使使用可变换为线性预测系数的系数的候选间的间隔窄的码本进行编码及解码,量化失真也小,所以编码及解码的精度不会变得那么差。
第三方法是利用了该趋势的方法。
将码本i(i=1,2,…,I)的可变换为线性预测系数的系数的候选标记为^ωn[1],^ωn[2],…,^ωn[p](n=1,2,…,Ni)。
在该情况下,第三方法例如是通过假设在码本存储单元222中存储有以下的Si 2的值不同的多个码本i(i=1,2,…,I),且η越小则码本选择单元223选择以下的Si 2的值越小的码本i而实现的。
Si 2=(1/Ni)∑n=11 Ni-1(∑k=1 p(^ωn[k]-^ωn+1[k])|2)1/2
如本例所示,可变换为线性预测系数的系数的候选间的间隔也可以是该码本所包含的、相邻的2个可变换为线性预测系数的系数的候选的距离的平均值。
在第三方法中,也可以基于阈值进行适当的码本的选择。例如,假设第一码本的可变换为线性预测系数的系数的候选间的间隔,比第二码本的可变换为线性预测系数的系数的候选间的间隔窄。在该情况下,将参数η的阈值预先确定1个,在被输入的参数η比阈值小的情况下判断为参数η小,选择第一码本。在被输入的参数η为阈值以上的情况下判断为参数η大,选择第二码本。在码本数为3以上的情况下,使用其个数为从码本数减去1的值的阈值,与上述同样地选择码本即可。
<编码单元224>
编码单元224中被输入与线性预测分析单元221所得到的可变换为线性预测系数的系数以及码本选择单元223得到的被选择出的码本有关的信息。
编码单元224使用选择出的码本,对可变换为线性预测系数的系数进行编码而得到线性预测系数码(步骤DE3)。所得到的线性预测系数码被输出到解码装置。
(解码)
说明第二实施方式的线性预测解码装置及方法的一例。
如图23所示,第二实施方式的线性预测解码装置例如包括码本存储单元311、码本选择单元312以及解码单元313。线性预测解码装置的各单元通过进行图24中例示的各处理而实现线性预测解码方法。
在第二实施方式中将“参数η1”标记为“参数η”。
<码本存储单元311>
码本存储单元311中存储有多个码本。
以下,假设将可变换为线性预测系数的系数的候选、和与该可变换为线性预测系数的系数的候选相对应的码的对称为候选码对。在各码本中存储有多个候选码对。换言之,若将I设为规定的2以上的数,将Ni设为根据i确定的规定的2以上的数,则码本i(i=1,2,…,I)中存储有Ni个候选对。与可变换为线性预测系数的系数的候选相对应的各码被分配了规定的数的比特。各码用被分配的规定的数的比特表示。
若将p设为规定的正数,假设可变换为线性预测系数的系数的维为p,则可变换为线性预测系数的系数的各候选由p个值构成。
存储在码本存储单元311中的多个码本根据码本选择单元312的码本的选择方法而不同。因此,与后述的码本选择单元312的例子一起说明存储在码本存储单元311中的多个码本的例子。
另外,码本存储单元311中存储有与存储在码本存储单元222中的多个码本相同的码本。
<码本选择单元312>
码本选择单元312中被输入参数η。参数η是通过对参数码进行解码而得到的。参数η也可以是在编码装置及解码装置中预先确定的相同的数。
码本选择单元312根据被输入的η,从存储在码本存储单元311中的多个码本中选择码本(步骤DD1)。与选择出的码本有关的信息被输出到解码单元313。
假设码本存储单元311中存储有与存储在码本存储单元222中的多个码本相同的码本。此外,假设码本选择单元312中预先确定了与编码装置的码本选择单元223的码本的选择基准相同的选择基准。由此,在解码侧也选择与在编码侧选择的码本相同内容的码本。
关于码本的选择基准,在编码侧已予以说明,所以这里省略重复说明。
<解码单元313>
解码单元313中被输入与编码装置所输出的线性预测系数码以及码本选择单元312得到的被选择出的码本有关的信息。此外,解码单元313从码本存储单元311读入由与选择出的码本有关的信息所确定的码本。
解码单元313使用选择出的码本,对线性预测系数码进行解码而得到可变换为线性预测系数的系数(步骤DD2)。
可变换为线性预测系数的系数用于得到对与可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η次幂的序列、即非平滑化频谱包络序列。
[线性预测编码装置、线性预测解码装置以及它们的方法的变形例]
如图1至图3、图21以及图25至图27中单点划线所示,若设适配单元22A由码本选择单元223及线性变换单元225中的至少一方构成,则可以说,适配单元22A基于被输入的η1,使存储在码本存储单元222中的码本、和由线性预测分析单元221生成的可变换为线性预测系数的系数中的至少一方适配(adapted)。换言之,可以说,适配单元22A使η的值适配存储在码本存储单元22中的码本所储存的可变换为线性预测系数的系数的多个候选、和线性预测分析单元221所得到的可变换为线性预测系数的系数。也可以说,适配单元22A例如至少对一方的可变换为线性预测系数的系数进行变形,使得与适配前的“与存储在码本存储单元222中的码本、即可变换为线性预测系数的系数的多个候选相对应的参数η的值、和与由线性预测分析单元221生成的可变换为线性预测系数的系数对应的参数η的值之差”相比,适配后的2个参数η的值之差变小。另外,也可以说,适配单元22A进行适配,使得在适配后2个参数η的值变为大致相同的值。第一实施方式中说明的线性变换单元225的第一线性变换单元2251的处理以及第二实施方式中说明的码本选择单元223的处理是存储在码本存储单元222中的码本的适配的一例。第二实施方式中说明的线性变换单元225的第二线性变换单元2252的处理是由线性预测分析单元221生成的可变换为线性预测系数的系数的适配的一例。
在该情况下,可以说,编码单元224使用由适配单元22A进行了适配的至少一方的码本以及可变换为线性预测系数的系数进行编码。换言之,可以说,编码单元224使用码本选择单元223选择出的码本或者由适配单元22A进行了适配的码本,对由线性预测分析单元221得到的可变换为线性预测系数的系数或者由适配单元22A进行了适配的可变换为线性预测系数的系数进行编码。进一步,换言之,可以说,编码单元224使用η的值被进行了适配的可变换为线性预测系数的系数的多个候选、和可变换为线性预测系数的系数,得到与线性预测分析单元221所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
可以说,第一实施方式的(1)第1情况的适配单元22A包括对存储在码本存储单元222中的可变换为线性预测系数的系数的候选进行与η1相应的第一线性变换,得到第一线性变换后的可变换为线性预测系数的系数的多个候选的线性变换单元225。在该情况下,可以说,编码单元224使用线性预测分析单元221所得到的可变换为线性预测系数的系数、和适配单元22A所得到的第一线性变换后的可变换为线性预测系数的系数的多个候选,得到与线性预测分析单元221所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
可以说,第一实施方式的(2)第2情况的适配单元22A包括对线性预测分析单元221所得到的可变换为线性预测系数的系数进行与η1相应的第二线性变换,得到第二线性变换后的可变换为线性预测系数的系数的线性变换单元225。在该情况下,可以说,编码单元224使用适配单元22A所得到的第二线性变换后的可变换为线性预测系数的系数、和储存在码本中的可变换为线性预测系数的系数的多个候选,得到与线性预测分析单元221所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
可以说,第一实施方式的(3)第3情况的适配单元22A假设在码本存储单元222中存储有与η2相对应的码本,对存储在码本存储单元222中的可变换为线性预测系数的系数的多个候选进行与η3相应的第一线性变换,得到第一线性变换后的可变换为线性预测系数的系数的多个候选,对线性预测分析单元221所得到的可变换为线性预测系数的系数进行与η3相应的第二线性变换,得到第二线性变换后的可变换为线性预测系数的系数。在该情况下,可以说,编码单元224使用适配单元22A所得到的第二线性变换后的可变换为线性预测系数的系数、和适配单元22A所得到的第一线性变换后的可变换为线性预测系数的系数的多个候选,得到与线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
适配单元22A也可以通过例如图25所示的码本选择单元223及第二线性变换单元2252进行码本的适配。例如,参数η2设为规定的参数η,码本选择单元223根据参数η2从存储在码本存储单元222中的多个码本中选择码本。接着,第二线性变换单元2252进行对于线性预测分析单元221所得到的可变换为线性预测系数的系数的、与η2相应的第二线性变换。在该情况下,编码单元224使用被选择出的码本对第二线性变换后的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
适配单元22A例如也可以通过图26所示的码本选择单元223及第一线性变换单元2251进行码本的适配。例如,参数η2设为规定的参数η,码本选择单元223根据参数η2从存储在码本存储单元222中的多个码本中选择码本。接着,第一线性变换单元2251进行对于储存在被选择出的码本中的可变换为线性预测系数的系数的多个候选的、与η1相应的第一线性变换。在该情况下,编码单元224使用第一线性变换后的可变换为线性预测系数的系数的候选对线性预测分析单元221所得到的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
适配单元22A例如也可以通过图27所示的码本选择单元223、第一线性变换单元2251以及第二变换单元2252进行码本的适配。例如,参数η2、η3设为规定的参数η,码本选择单元223根据参数η3从存储在码本存储单元222中的多个码本中选择码本。然后,第一线性变换单元2251进行对于储存在被选择出的码本中的可变换为线性预测系数的系数的多个候选的、与η2相应的第一线性变换。然后,第二线性变换单元2252进行对于线性预测分析单元221所得到的可变换为线性预测系数的系数的、与η2相应的第二线性变换。在该情况下,编码单元224使用第一线性变换后的可变换为线性预测系数的系数的候选对第二线性变换后的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
如图6、图23及图28中单点划线所示,若适配单元31A由码本选择单元312及线性变换单元314的至少一方、和解码单元313构成,则可以说,适配单元31A将η1设为正数,基于被输入的η1,使存储在码本存储单元311中的码本、和储存在码本中的可变换为线性预测系数的系数的多个候选中的与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选中的至少一方适配。
适配单元31A例如也可以在图28所示的码本选择单元312及线性变换单元314这二者中进行适配的处理。例如,将η2设为正数,码本选择单元312根据参数η2从存储在码本存储单元311中的多个码本中选择码本。然后,线性变换单元314对解码单元313所得到的可变换为线性预测系数的系数进行与作为规定的正数的η1相应的线性变换,得到可变换为线性预测系数的系数。
[编码装置、解码装置以及它们的方法]
以下,说明线性预测编码装置、线性预测解码装置以及使用了它们的方法的编码装置、解码装置以及它们的方法的例子。
[编码装置、解码装置以及它们的方法的第一实施方式]
(编码)
在图8中示出第一实施方式的编码装置的结构例。如图8所示,第一实施方式的编码装置例如包括频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、编码单元26和参数决定单元27。在图9中示出由该编码装置实现的第一实施方式的编码方法的各处理的例子。
以下,说明图8的各单元。
<参数决定单元27>
在第一实施方式中,假设在每个规定的时间区间,能够由参数决定单元27选择多个参数η中的任一者。
在参数决定单元27中,假设多个参数η被作为参数η的候选予以存储。参数决定单元27依次读出多个参数中的1个参数η,输出到线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23以及解码单元26(步骤A0)。
频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25以及编码单元26基于参数决定单元27依次读出的各参数η,进行例如以下说明的从步骤A1到步骤A6的处理,对与同一规定的时间区间的时序信号相对应的频域样本串,生成码。一般而言,给出参数η,有时对与同一规定的时间区间的时序信号相对应的频域样本串可得到2个以上的码。在该情况下,针对与同一规定的时间区间的时序信号相对应的频域样本串的码,是将上述所得到的2个以上的码进行了汇总的码。在本例中,码是将线性预测系数码、增益码、和整数信号码进行了合并的码。由此,可得到针对与同一规定的时间区间的时序信号相对应的频域样本串的各参数η的码。
在步骤A6的处理后,参数决定单元27从对与同一规定的时间区间的时序信号相对应的频域样本串按各参数η而得到的码中选择1个码,决定与选择出的码相对应的参数η(步骤A7)。该决定的参数η成为针对与该同一规定的时间区间的时序信号相对应的频域样本串的参数η。然后,参数决定单元27将选择出的码以及表示所决定的参数η的码输出到解码装置。参数决定单元27所进行的步骤A7的处理的细节将后述。
以下,假设由参数决定单元27读出了1个参数η1,且关于该读出的1个参数η1进行处理。
<频域变换单元21>
频域变换单元21中被输入作为时域的时序信号的声音信号。声音信号的例子是语音数字信号或者声学数字信号。
频域变换单元21以规定的时间长度的帧单位,将被输入的时域的声音信号变换为频域的N点的MDCT系数串X(0),X(1),…,X(N-1)(步骤A1)。N是正整数。
所得到的MDCT系数串X(0),X(1),…,X(N-1)被输出到线性预测分析单元22和包络归一化单元25。
除非特别予以否认,否则假设以后的处理以帧单位进行。
这样,频域变换单元21求与声音信号相对应的、例如作为MDCT系数串的频域样本串。
<线性预测分析单元22>
频域变换单元21所得到的MDCT系数串X(0),X(1),…,X(N-1)被输入到线性预测分析单元22。
线性预测分析单元22是在[线性预测编码装置、线性预测解码装置以及它们的方法]中说明的图1至图3、图21中的任一者的线性预测编码装置。在[编码装置、解码装置以及它们的方法]以及图8中,将在[线性预测编码装置、线性预测解码装置以及它们的方法]中说明的图1至图3、图21中的任一者的线性预测编码装置标记为“线性预测分析单元22”。另外,线性预测分析单元22也可以是图25至图27中的任一者的线性预测编码装置。
线性预测分析单元22通过与在[线性预测编码装置、线性预测解码装置以及它们的方法]中说明的处理同样的处理,例如使用通过进行将MDCT系数串即频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数,对所得到的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
所得到的线性预测系数码被输出到参数决定单元27及解码装置。
此外,线性预测编码装置的线性变换单元225在(1)第1情况下,与编码单元224所得到的线性预测系数码相对应的、与参数η1相对应的可变换为线性预测系数的系数作为量化线性预测系数^β1,^β2,…,^βp,输出到非平滑化频谱包络序列生成单元23和平滑化振幅频谱包络序列生成单元24。
线性预测编码装置的线性变换单元225在(2)第2情况下,与编码单元224所得到的线性预测系数码相对应的、与参数η2相对应的可变换为线性预测系数的系数,被输入到图2中虚线所示的线性逆变换单元226。线性逆变换单元226对与线性预测系数码相对应的、与参数η2相对应的可变换为线性预测系数的系数进行第二线性变换单元2252所进行的第二线性变换的相反的线性变换,设为与参数η1相对应的可变换为线性预测系数的系数。与该参数η1相对应的可变换为线性预测系数的系数作为量化线性预测系数^β1,^β2,…,^βp,输出到非平滑化频谱包络序列生成单元23和平滑化振幅频谱包络序列生成单元24。另外,在参数η1的值和参数η2的值相同的情况下,线性逆变换单元226也可以不进行线性变换。
线性预测编码装置的线性变换单元225在(3)第3情况下,与编码单元224所得到的线性预测系数码相对应的、与参数η3相对应的可变换为线性预测系数的系数,被输入到图3中虚线所示的线性逆变换单元226。线性逆变换单元226对与线性预测系数码相对应的、与参数η3相对应的可变换为线性预测系数的系数进行第二线性变换单元2252所进行的第二线性变换的相反的线性变换,设为与参数η1相对应的可变换为线性预测系数的系数。与该参数η1相对应的可变换为线性预测系数的系数作为量化线性预测系数^β1,^β2,…,^βp,输出到非平滑化频谱包络序列生成单元23和平滑化振幅频谱包络序列生成单元24。另外,在参数η1的值和参数η3的值相同的情况下,线性逆变换单元226也可以不进行线性变换。
另外,通过线性预测分析处理的过程来计算预测残差的能量σ2。在该情况下,算出的预测残差的能量σ2被输出到编码单元26的方差参数决定单元268。
<非平滑化振幅频谱包络序列生成单元23>
线性预测分析单元22所生成的量化线性预测系数^β1,^β2,…,^βp被输入到非平滑化振幅频谱包络序列生成单元23。
非平滑化振幅频谱包络序列生成单元23生成与量化线性预测系数^β1,^β2,…,^βp相对应的振幅频谱包络的序列、即非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)(步骤A3)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)被输出到编码单元26。
非平滑化振幅频谱包络序列生成单元23使用量化线性预测系数^β1,^β2,…,^βp,生成由式(A2)定义的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1),作为非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)。
[数学式4]
这样,非平滑化振幅频谱包络序列生成单元23通过得到将与由线性预测分析单元22生成的可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η1次幂的序列、即非平滑化频谱包络序列,从而进行频谱包络的估计。这里,所谓将c设为任意的数,且将由多个值构成的序列进行了c次幂的序列,是由将多个值各自进行了c次幂后的值构成的序列。例如,所谓将振幅频谱包络的序列进行了1/η1次幂的序列,是由将振幅频谱包络的各系数进行了1/η1次幂的值构成的序列。
非平滑化振幅频谱包络序列生成单元23所进行的1/η1次幂的处理,归因于线性预测分析单元22所进行的将频域样本串的绝对值的η1次幂视为功率谱的处理。即,非平滑化振幅频谱包络序列生成单元23所进行的1/η1次幂的处理是为了将由线性预测分析单元22进行的将频域样本串的绝对值的η1次幂视为功率谱的处理导致被进行了η1次幂的值恢复为原先的值而进行的。
<平滑化振幅频谱包络序列生成单元24>
平滑化振幅频谱包络序列生成单元24中被输入线性预测分析单元22所生成的量化线性预测系数^β1,^β2,…,^βp
平滑化振幅频谱包络序列生成单元24生成使与量化线性预测系数^β1,^β2,…,^βp相对应的振幅频谱包络的序列的振幅的凹凸钝化的序列、即平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)(步骤A4)。
所生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)被输出到包络归一化单元25及编码单元26。
平滑化振幅频谱包络序列生成单元24使用量化线性预测系数^β1,^β2,…,^βp和校正系数γ,生成由式(A3)定义的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1),作为平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)。
[数学式5]
这里,校正系数γ是预先规定的小于1的常数,是使非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)的振幅的凹凸钝化的系数,换言之是对非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)进行平滑化的系数。
<包络归一化单元25>
包络归一化单元25中被输入频域变换单元21所得到的MDCT系数串X(0),X(1),…,X(N-1)以及平滑化振幅频谱包络生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)。
包络归一化单元25将MDCT系数串X(0),X(1),…,X(N-1)的各系数,用相对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)的各值进行归一化,从而生成归一化MDCT系数串XN(0),XN(1),…,XN(N-1)(步骤A5)。
所生成的归一化MDCT系数串被输出到编码单元26。
包络归一化单元25例如设k=0,1,…,N-1,通过用平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)除MDCT系数串X(0),X(1),…,X(N-1)的各系数X(k),生成归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的各系数XN(k)。即,设k=0,1,…,N-1,XN(k)=X(k)/^Hγ(k)。
<编码单元26>
编码单元26中被输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),…,XN(N-1)、非平滑化振幅频谱包络生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)以及线性预测分析单元22算出的预测残差的能量σ2
编码单元26例如通过进行图12所示的从步骤A61到步骤A65的处理,进行编码(步骤A6)。
编码单元26求与归一化MDCT系数串XN(0),XN(1),…,XN(N-1)相对应的全局增益g(步骤A61),求对用全局增益g除归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的各系数算出的结果进行了量化的整数值的序列、即量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)(步骤A62),根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)和平均残差的能量σ2,通过式(A1)求与量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数相对应的方差参数(步骤A63),使用方差参数对量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)进行算术编码而得到整数信号码(步骤A64),得到与全局增益g相对应的增益码(步骤A65)。
[数学式6]
这里,上述的式(A1)中的归一化振幅频谱包络序列^HN(0),^HN(1),…,^HN是,将非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)的各值用相对应的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)的各值相除而得到的值,即是通过以下的式(A8)求得的值。
[数学式7]
所生成的整数信号码和增益码作为与归一化MDCT系数串相对应的码,被输出到参数决定单元27。
编码单元26通过从步骤A61至步骤A65,实现下述功能:决定整数信号码的比特数为预先分配的比特数即分配比特数B以下且成为尽可能大的值的全局增益g,生成与决定的全局增益g相对应的增益码、和与该决定的全局增益g相对应的整数信号码。
编码单元26所进行的从步骤A61至步骤A65中,包含特征性的处理的步骤是步骤A63,通过对全局增益g和各量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)进行编码从而得到与归一化MDCT系数串相对应的码的编码处理本身,存在包括非专利文献1中记载的技术在内的各种公知技术。以下说明由编码单元26进行的编码处理的两个具体例。
[编码单元26进行的编码处理的具体例1]
说明不包含循环处理的例子,作为编码单元26进行的编码处理的具体例1。
在图10中示出具体例1的编码单元26的结构例。如图10所示,具体例1的编码单元26例如包括增益取得单元261、量化单元262、方差参数决定单元268、算术编码单元269和增益编码单元265。以下,说明图10的各单元。
<增益取得单元261>
增益取得单元261中被输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),…,XN(N-1)。
增益取得单元261根据归一化MDCT系数串XN(0),XN(1),…,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下且成为尽可能大的值的全局增益g,并输出(步骤S261)。增益取得单元261例如得到归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的能量的合计的平方根、和与分配比特数B存在负相关的常数的乘法运算值作为全局增益g,并输出。或者,增益取得单元261也可以预先将归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的能量的合计、分配比特数B、和全局增益g的关系表格化,参照该表格,从而得到全局增益g,并输出。
这样,增益取得单元261得到例如用于对归一化MDCT系数串即归一化频域样本串的全部样本进行除法运算的增益。
所得到的全局增益g被输出到量化单元262及方差参数决定单元268。
<量化单元262>
量化单元262中被输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),…,XN(N-1)以及增益取得单元261所得到的全局增益g。
量化单元262得到用全局增益g除归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的各系数算出的结果的整数部分的序列、即量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1),并输出(步骤S262)。
这样,量化单元262例如用增益除归一化MDCT系数串即归一化频域样本串的各样本,并且进行量化,求出量化归一化完成系数序列。
所得到的量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)被输出到算术编码单元269。
<方差参数决定单元268>
方差参数决定单元268中被输入参数决定单元27读出的参数η1、增益取得单元261所得到的全局增益g、非平滑化振幅频谱包络生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)以及线性预测分析单元22所得到的预测残差的能量σ2
方差参数决定单元268根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)、和预测残差的能量σ2,通过上述的式(A1)、式(A8)得到方差参数序列的各方差参数,并输出(步骤S268)。
所得到的方差参数序列被输出到算术编码单元269。
<算术编码单元269>
算术编码单元269中被输入参数决定单元27读出的参数η1、量化单元262所得到的量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)以及方差参数决定单元268所得到的方差参数序列
算术编码单元269使用方差参数序列的各方差参数作为与量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数相对应的方差参数,对量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)进行算术编码,得到整数信号码,并输出(步骤S269)。
算术编码单元269在算术编码之时,构成如在量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数符合广义高斯分布时成为最佳的算术码,通过基于该结构的算术码进行编码。其结果,对量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数的比特分配的期望值由方差参数序列决定。
所得到的整数信号码被输出到参数决定单元27。
也可以跨量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)中的多个系数进行算术编码。在该情况下,从式(A1)、式(A8)可知,方差参数序列的各方差参数基于非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1),所以可以说,算术编码单元269基于估计出的频谱包络(非平滑化振幅频谱包络),进行实际上比特分配会改变的编码。
<增益编码单元265>
增益编码单元265中被输入增益取得单元261所得到的全局增益g。
增益编码单元265对全局增益g进行编码而得到增益码,并输出(步骤S265)。
所生成的整数信号码和增益码作为与归一化MDCT系数串相对应的码,被输出到参数决定单元27。
本具体例1的步骤S261、S262、S268、S269、S265分别与上述的步骤A61、A62、A63、A64、A65相对应。
[编码单元26进行的编码处理的具体例2]
说明包含循环处理的例子,作为编码单元26进行的编码处理的具体例2。
在图11中示出具体例2的编码单元26的结构例。如图11所示,具体例2的编码单元26例如包括增益取得单元261、量化单元262、方差参数决定单元268、算术编码单元269、增益编码单元265、判定单元266和增益更新单元267。以下,说明图11的各单元。
<增益取得单元261>
增益单元261中被输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),…,XN(N-1)。
增益取得单元261根据归一化MDCT系数串XN(0),XN(1),…,XN(N-1),决定整数信号码的比特数为预先分配的比特数即分配比特数B以下且成为尽可能大的值的全局增益g,并输出(步骤S261)。增益取得单元261例如得到归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的能量的合计的平方根、和与分配比特数B存在负相关的常数的乘法运算值作为全局增益g,并输出。
所得到的全局增益g被输出到量化单元262及方差参数决定单元268。
增益取得单元261所得到的全局增益g成为量化单元262及方差参数决定单元268所使用的全局增益的初始值。
<量化单元262>
量化单元262中被输入包络归一化单元25生成的归一化MDCT系数串XN(0),XN(1),…,XN(N-1)以及增益取得单元261或增益更新单元267所得到的全局增益g。
量化单元262得到用全局增益g除归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的各系数的结果的整数部分的序列、即量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1),并输出(步骤S262)。
这里,量化单元262首次被执行时用到的全局增益g是增益取得单元261所得到的全局增益g、即全局增益的初始值。此外,量化单元262在第2次以后被执行时用到的全局增益g是增益更新单元267所得到的全局增益g、即全局增益的更新值。
所得到的量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)被输出到算术编码单元269。
<方差参数决定单元268>
方差参数决定单元268中被输入参数决定单元27读出的参数η1、增益取得单元261或者增益更新单元267所得到的全局增益g、非平滑化振幅频谱包络生成单元23生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络生成单元24生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)以及线性预测分析单元22所得到的预测残差的能量σ2
方差参数决定单元268根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)、和预测残差的能量σ2,通过上述的式(A1)、式(A8)得到方差参数序列的各方差参数,并输出(步骤S268)。
这里,方差参数决定单元268首次被执行时用到的全局增益g是增益取得单元261所得到的全局增益g、即全局增益的初始值。此外,方差参数决定单元268在第2次以后被执行时用到的全局增益g是增益更新单元267所得到的全局增益g、即全局增益的更新值。
所得到的方差参数序列被输出到算术编码单元269。
<算术编码单元269>
算术编码单元269中被输入参数决定单元27读出的参数η1、量化单元262所得到的量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)以及方差参数决定单元268所得到的方差参数序列
算术编码单元269使用方差参数序列的各方差参数作为与量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数相对应的方差参数,对量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)进行算术编码,得到整数信号码和作为整数信号码的比特数的消耗比特数C,并输出(步骤S269)。
算术编码单元269在算术编码之时,通过算术码进行如在量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数符合广义高斯分布时成为最佳的比特分配,通过基于所进行的比特分配的算术码进行编码。
所得到的整数信号码及消耗比特数C被输出到判定单元266。
也可以跨量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)中的多个系数而进行算术编码。在该情况下,从式(A1)、式(A8)可知,方差参数序列的各方差参数基于非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1),所以可以说,算术编码单元269基于估计出的频谱包络(非平滑化振幅频谱包络),进行实际上比特分配会改变的编码。
<判定单元266>
判定单元266中被输入算术编码单元269所得到的整数信号码。
判定单元266,在增益的更新次数是预先规定的次数的情况下,输出整数信号码,并且对增益编码单元265输出将增益更新单元267所得到的全局增益g进行编码的指示信号,而在增益的更新次数小于预先规定的次数的情况下,对增益更新单元267输出算术编码单元264测量出的消耗比特数C(步骤S266)。
<增益更新单元267>
增益更新单元267中被输入算术编码单元264测量出的消耗比特数C。
增益更新单元267,在消耗比特数C比分配比特数B多的情况下,将全局增益g的值更新为大值并输出,而在消耗比特数C比分配比特数B少的情况下,将全局增益g的值更新为小值并输出更新后的全局增益g的值(步骤S267)。
增益更新单元267所得到的更新后的全局增益g被输出到量化单元262及增益编码单元265。
<增益编码单元265>
增益编码单元265中被输入来自判定单元266的输出指示以及增益更新单元267所得到的全局增益g。
增益编码单元265按照指示信号,对全局增益g进行编码而得到增益码,并输出(步骤265)。
判定单元266输出的整数信号码、和增益编码单元265输出的增益码作为与归一化MDCT系数串相对应的码,被输出到参数决定单元27。
即,在本具体例2中,最后进行的步骤S267与上述的步骤A61相对应,步骤S262、S263、S264、S265分别与上述的步骤A62、A63、A64、A65相对应。
另外,编码单元26进行的编码处理的具体例2在国际公开公报WO2014/054556等中予以更详细的说明。
[编码单元26的变形例]
编码单元26例如也可以通过进行以下的处理,进行基于估计出的频谱包络(非平滑化振幅频谱包络)而改变比特分配的编码。
编码单元26首先求出与归一化MDCT系数串XN(0),XN(1),…,XN(N-1)相对应的全局增益g,求出对用全局增益g除归一化MDCT系数串XN(0),XN(1),…,XN(N-1)的各系数算出的结果进行了量化的整数值的序列、即量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)。
假定与该量化归一化完成系数序列XQ(0),XQ(1),…,XQ(N-1)的各系数相对应的量化比特在存在XQ(k)的分布的范围内是一致的,该范围能够根据包络的估计值来确定。也能够对多个样本各自的包络的估计值进行编码,但是编码单元26例如能够如以下的式(A9)那样使用基于线性预测的归一化振幅频谱包络序列的值^HN(k)来确定XQ(k)的范围。
[数学式8]
在对某个k的XQ(k)进行量化时,为了使XQ(k)的平方误差最小,能够基于
[数学式9]
的制约,设定分配比特数b(k)为如下。
[数学式10]
B是预先规定的正整数。此时,也可以进行四舍五入使得b(k)成为整数,而在比0小的情况下设为b(k)=0等,由编码单元26进行b(k)的再调整的处理。
此外,编码单元26也能够不对每个样本确定分配,而将多个样本汇总来确定分配比特数,量化时也不是进行每个样本的标量量化,而进行将多个样本汇总的每个向量的量化。
样本k的XQ(k)的量化比特数b(k)由上述给出,若对每个样本进行编码,则XQ(k)可以取得从-2b(k)-1到2b(k)-1为止的2b(k)种的整数。编码单元26用b(k)比特对各样本进行编码,得到整数信号码。
所生成的整数信号码被输出到解码装置。例如,与所生成的XQ(k)相对应的b(k)比特的整数信号码从k=0起依次被输出到解码装置。
若在XQ(k)超过上述的从-2b(k)-1到2b(k)-1为止的范围的情况下,置换为最大值或者最小值。
若g过小,则在该置换中发生量化失真,若g过大,则量化误差变大,XQ(k)可取得的范围与b(k)相比过小,不能实现信息的有效利用。因此,也可以进行g的最优化。
编码单元26对全局增益g进行编码而得到增益码,并输出。
如该编码单元26的变形例所示,编码单元26也可以进行算术编码以外的编码。
<参数决定单元27>
通过从步骤A1至步骤A6的处理,针对与同一规定的时间区间的时序信号相对应的频域样本串按照各参数η1生成的码(在本例中是线性预测系数码、增益码及整数信号码)被输入到参数决定单元27。
参数决定单元27从针对与同一规定的时间区间的时序信号相对应的频域样本串按照各参数η1得到的码中选择1个码,决定与选择出的码相对应的参数η(步骤A7)。该决定出的参数η成为针对与该同一规定的时间区间的时序信号相对应的频域样本串的参数η。然后,参数决定单元27将选择出的码及表示决定的参数η的参数码输出到解码装置。码的选择是基于码的码量以及与码相对应的编码失真的至少一方进行的。例如,选择码量最小的码或者编码失真最小的码。
这里,所谓编码失真,是从输入信号得到的频域样本串、和通过对所生成的码进行本地解码得到的频域样本串的误差。编码装置也可以包括用于计算编码失真的编码失真计算单元。该编码失真计算单元包括进行与以下所述的解码装置同样的处理的解码单元,该解码单元对所生成的码进行本地解码。然后,编码失真计算单元计算从输入信号得到的频域样本串、和通过进行本地解码得到的频域样本串的误差,并设为编码失真。
(解码)
在图13中示出与编码装置相对应的解码装置的结构例。如图13所示,第一实施方式的解码装置例如包括线性预测系数解码单元31、非平滑化振幅频谱包络序列生成单元32、平滑化振幅频谱包络序列生成单元33、解码单元34、包络逆归一化单元35、时域变换单元36和参数解码单元37。在图14中示出由该解码装置实现的第一实施方式的解码方法的各处理的例子。
解码装置中至少被输入编码装置输出的参数码、与归一化MDCT系数串相对应的码以及线性预测系数码。
以下,说明图13的各单元。
<参数解码单元37>
参数解码单元37中被输入编码装置输出的参数码。
参数解码单元37通过对参数码进行解码来求出解码参数η。求出的解码参数η被输出到线性预测系数解码单元31、非平滑化振幅频谱包络序列生成单元32、平滑化振幅频谱包络序列生成单元33以及解码单元34。参数解码单元37中存储有多个解码参数η作为候选。参数解码单元37将与参数码相对应的解码参数η的候选作为解码参数η而求出。存储在参数解码单元37中的多个解码参数η与存储在编码装置的参数决定单元27中的多个参数η相同。
<线性预测系数解码单元31>
线性预测系数解码单元31中被输入编码装置输出的线性预测系数码以及由参数解码单元37得到的解码参数η。
线性预测系数解码单元31是在[线性预测编码装置、线性预测解码装置以及它们的方法]中说明的使用图6、图21进行了上述说明的线性预测解码装置。在[编码装置、解码装置以及它们的方法]以及图13中,将[线性预测编码装置、线性预测解码装置以及它们的方法]中说明的图6、图21的线性预测编码装置标记为“线性预测系数解码单元31”。另外,线性预测系数解码单元31也可以是图28的线性预测解码装置。
线性预测系数解码单元31通过将解码参数η设为参数η1的与在[线性预测编码装置、线性预测解码装置以及它们的方法]中说明的处理同样的处理,对被输入的线性预测系数码进行解码,从而得到解码后的可变换为线性预测系数的系数、即解码线性预测系数^β1,^β2,…,^βp(步骤B1)。
所得到的解码线性预测系数^β1,^β2,…,^βp被输出到非平滑化振幅频谱包络序列生成单元32以及非平滑化振幅频谱包络序列生成单元33。
<非平滑化振幅频谱包络序列生成单元32>
非平滑化振幅频谱包络序列生成单元32中被输入参数解码单元37求出的解码参数η以及线性预测系数解码单元31所得到的解码线性预测系数^β1,^β2,…,^βp
非平滑化振幅频谱包络序列生成单元32通过上述的式(A2)生成与解码线性预测系数^β1,^β2,…,^βp相对应的振幅频谱包络的序列、即非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)(步骤B2)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)被输出到解码单元34。
这样,非平滑化振幅频谱包络序列生成单元32得到将与由线性预测系数解码单元31生成的可变换为线性预测系数的系数相对应的的振幅频谱包络的序列进行了1/η次幂的序列、即非平滑化频谱包络序列。
<平滑化振幅频谱包络序列生成单元33>
平滑化振幅频谱包络序列生成单元33中被输入参数解码单元37求出的解码参数η以及线性预测系数解码单元31所得到的解码线性预测系数^β1,^β2,…,^βp
平滑化振幅频谱包络序列生成单元33通过上述的式(A3)生成使与解码线性预测系数^β1,^β2,…,^βp相对应的振幅频谱包络的序列的振幅的凹凸钝化了的序列、即平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)(步骤B3)。
所生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)被输出到解码单元34及包络逆归一化单元35。
<解码单元34>
解码单元34中被输入参数解码单元37求出的解码参数η、编码装置输出的与归一化MDCT系数串相对应的码、非平滑化振幅频谱包络生成单元32生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)以及平滑化振幅频谱包络生成单元33生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)。
解码单元34包括方差参数决定单元342。
解码单元34例如通过进行图15所示的从步骤B41至步骤B44的处理而进行解码(步骤B4)。即,解码单元34按每个帧,对被输入的与归一化MDCT系数串相对应的码所包含的增益码进行解码,得到全局增益g(步骤B41)。解码单元34的方差参数决定单元342根据全局增益g、非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)、平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)和参数η,通过上述的式(A1)求出方差参数序列的各方差参数(步骤B42)。解码单元34按照与方差参数序列的各方差参数相对应的算术解码的结构,对与归一化MDCT系数串相对应的码所包含的整数信号码进行算术解码,得到解码归一化完成系数序列^XQ(0),^XQ(1),…,^XQ(N-1)(步骤B43),将全局增益g与解码归一化完成系数序列^XQ(0),^XQ(1),…,^XQ(N-1)的各系数相乘,生成解码归一化MDCT系数串^XN(0),^XN(1),…,^XN(N-1)(步骤B44)。如上述,解码单元34也可以按照基于非平滑化频谱包络序列而实质上改变的比特分配,进行被输入的整数信号码的解码。
另外,在通过[编码单元26的变形例]中记载的处理进行了编码的情况下,解码单元34例如进行以下的处理。解码单元34按每个帧,对被输入的与归一化MDCT系数串相对应的码所包含的增益码进行解码,得到全局增益g。解码单元34的方差参数决定单元342根据非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)和平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1),通过上述的式(A9)求方差参数序列的各方差参数。解码单元34能够基于方差参数序列的各方差参数通过式(A10)求b(k),用其比特数b(k)依次对XQ(k)的值进行解码,得到解码归一化完成系数序列^XQ(0),^XQ(1),…,^XQ(N-1),将全局增益g与解码归一化完成系数序列^XQ(0),^XQ(1),…,^XQ(N-1)的各系数相乘,生成解码归一化MDCT系数串^XN(0),^XN(1),…,^XN(N-1)。这样,解码单元34也可以按照基于非平滑化频谱包络序列而改变的比特分配,进行被输入的整数信号码的解码。
所生成的解码归一化MDCT系数串^XN(0),^XN(1),…,^XN(N-1)被输出到包络逆归一化单元35。
<包络逆归一化单元35>
包络逆归一化单元35中被输入平滑化振幅频谱包络生成单元33生成的平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)以及解码单元34生成的解码归一化MDCT系数串^XN(0),^XN(1),…,^XN(N-1)。
包络逆归一化单元35使用平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1),对解码归一化MDCT系数串^XN(0),^XN(1),…,^XN(N-1)进行逆归一化,从而生成解码MDCT系数串^X(0),^X(1),…,^X(N-1)(步骤B5)。
所生成的解码MDCT系数串^X(0),^X(1),…,^X(N-1)被输出到时域变换单元36。
例如,包络逆归一化单元35设k=0,1.…,N-1,将平滑化振幅频谱包络序列^Hγ(0),^Hγ(1),…,^Hγ(N-1)的各包络值^Hγ(k)与解码归一化MDCT系数串^XN(0),^XN(1),…,^XN(N-1)的各系数^XN(k)相乘,从而生成解码MDCT系数串^X(0),^X(1),…,^X(N-1)。即,设k=0,1,…,N-1,^X(k)=^XN(k)×^Hγ(k)。
<时域变换单元36>
时域变换单元36中被输入包络逆归一化单元35生成的解码MDCT系数串^X(0),^X(1),…,^X(N-1)。
时域变换单元36按每个帧,将包络逆归一化单元35所得到的解码MDCT系数串^X(0),^X(1),…,^X(N-1)变换到时域,得到帧单位的声音信号(解码声音信号)(步骤B6)。
这样,解码装置通过频域中的解码而得到时序信号。
[编码装置、解码装置以及它们的方法的第二实施方式]
第一实施方式的编码装置及方法对多个参数η分别进行编码而生成码,从按每个参数η生成的码中选择最佳的码,输出所选择的码以及与选择的码相对应的参数码。
相对地,第二实施方式的编码装置及方法是,首先参数决定单元27决定参数η,基于所决定的参数η进行编码而生成码,并输出。在第二实施方式中,在每个规定的时间区间,参数η被参数决定单元27设为可变。这里,所谓在每个规定的时间区间参数η可变,意思是若规定的时间区间改变,则参数η也可能改变,假设在同一时间区间内参数η的值不变。
以下,以与第一实施方式不同的部分为中心进行说明。对与第一实施方式同样的部分省略重复说明。
(编码)
在图16中示出第二实施方式的编码装置的结构例。如图16所示,编码装置例如包括频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25、编码单元26和参数决定单元27’。在图17中示出由该编码装置实现的编码方法的各处理的例子。
以下,说明图16的各单元。
<参数决定单元27’>
参数决定单元27’中被输入作为时序信号的时域的声音信号。声音信号的例子是语音数字信号或者声学数字信号。
参数决定单元27’基于被输入的时序信号,通过后述的处理,决定参数η(步骤A7’)。以下,将由参数决定单元27’决定的参数η设为参数η1
由参数决定单元27’决定的η1被输出到线性预测分析单元22、非平滑化振幅频谱包络估计单元23、平滑化振幅频谱包络估计单元24以及编码单元26。
此外,参数决定单元27’通过对所决定的η1进行编码而生成参数码。所生成的参数码被发送到解码装置。
参数决定单元27’的细节将后述。
频域变换单元21、线性预测分析单元22、非平滑化振幅频谱包络序列生成单元23、平滑化振幅频谱包络序列生成单元24、包络归一化单元25以及编码单元26基于参数决定单元27决定的参数η1,通过与第一实施方式同样的处理而生成码(从步骤A1到步骤A6)。在本例中,码是将线性预测系数码、增益码、和整数信号码合并的码。所生成的码被发送到解码装置。
在图18中示出参数决定单元27’的结构例。如图18所示,参数决定单元27’例如包括频域变换单元41、频谱包络估计单元42、白化频谱序列生成单元43、和参数取得单元44。频谱包络估计单元42例如包括线性预测分析单元421及非平滑化振幅频谱包络序列生成单元422。例如在图19中示出由该参数决定单元27’实现的参数决定方法的各处理的例子。
以下,说明图18的各单元。
<频域变换单元41>
频域变换单元41中被输入作为时序信号的时域的声音信号。声音信号的例子是语音数字信号或者声学数字信号。
频域变换单元41以规定的时间长度的帧单位,将被输入的时域的声音信号变换为频域的N点的MDCT系数串X(0),X(1),…,X(N-1)。N是正整数。
所得到的MDCT系数串X(0),X(1),…,X(N-1)被输出到频谱包络估计单元42以及白化频谱序列生成单元43。
除非特别予以否认,否则假设以后的处理以帧单位进行。
这样,频域变换单元41求出与声音信号相对应的、例如MDCT系数串即频域样本串(步骤C41)。
<频谱包络估计单元42>
频谱包络估计单元42中被输入频域变换单元21所得到的MDCT系数串X(0),X(1),…,X(N-1)。
频谱包络估计单元42基于用规定的方法确定的参数η0,进行将与时序信号相对应的频域样本串的绝对值的η0次幂用作功率谱的频谱包络的估计(步骤C42)。
估计出的频谱包络被输出到白化频谱序列生成单元43。
频谱包络估计单元42例如通过以下说明的线性预测分析单元421及非平滑化振幅频谱包络序列生成单元422的处理,生成非平滑化振幅频谱包络序列,从而进行频谱包络的估计。
假设参数η0是用规定的方法确定的。例如,η0设为大于0的规定的数。例如,假设η0=1。此外,也可以使用通过比当前试图求出参数η的帧更靠前的帧求出的η。所谓比当前试图求出参数η的帧(以下设为当前帧。)更靠前的帧,例如是比当前帧更靠前且当前帧的附近的帧。当前帧的附近的帧例如是当前帧的前一个帧。
<线性预测分析单元421>
线性预测分析单元421中被输入频域变换单元41所得到的MDCT系数串X(0),X(1),…,X(N-1)。
线性预测分析单元421使用MDCT系数串X(0),X(1),…,X(N-1),生成使用由以下的式(C1)定义的~R(0),~R(1),…,~R(N-1)进行了线性预测分析的线性预测系数β12,…,βp,对所生成的线性预测系数β12,…,βp进行编码,生成线性预测系数码和与线性预测系数码相对应的量化后的线性预测系数即量化线性预测系数^β1,^β2,…,^βp
[数学式11]
所生成的量化线性预测系数^β1,^β2,…,^βp被输出到非平滑化频谱包络序列生成单元422。
具体而言,线性预测分析单元421通过首先进行相当于将MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η0次幂视为功率谱的傅立叶逆变换的运算、即式(C1)的运算,求出与MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η0次幂相对应的时域的信号串、即伪相关函数信号串~R(0),R(1),…,~R(N-1)。然后,线性预测分析单元421使用求出的伪相关函数信号串R(0),~R(1),…,~R(N-1)进行线性预测分析,生成线性预测系数β12,…,βp。然后,线性预测分析单元421通过对所生成的线性预测系数β12,…,βp进行编码,得到线性预测系数码、和与线性预测系数码相对应的量化线性预测系数^β1,^β2,…,^βp
线性预测系数β12,…,βp是与将MDCT系数串X(0),X(1),…,X(N-1)的绝对值的η0次幂视为功率谱时的时域的信号相对应的线性预测系数。
线性预测分析单元421所进行的线性预测系数码的生成例如是通过以往的编码技术进行的。所谓以往的编码技术,例如是将与线性预测系数本身相对应的码设为线性预测系数码的编码技术、将线性预测系数变换为LSP参数而将与LSP参数相对应的码设为线性预测系数码的编码技术、将线性预测系数变换为PARCOR系数而将与PARCOR系数相对应的码设为线性预测系数码的编码技术等。
这样,线性预测分析单元421例如使用通过进行将MDCT系数串即频域样本串的绝对值的η0次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,生成可变换为线性预测系数的系数(步骤C421)。
另外,线性预测分析单元421也可以通过在[线性预测编码装置、线性预测解码装置以及它们的方法]一栏中说明的方法,得到线性预测系数码,将与所得到的线性预测系数码相对应的可变换为线性预测系数的系数设为量化线性预测系数^β1,^β2,…,^βp
<非平滑化振幅频谱包络序列生成单元422>
非平滑化振幅频谱包络序列生成单元422中被输入线性预测分析单元421生成的量化线性预测系数^β1,^β2,…,^βp
非平滑化振幅频谱包络序列生成单元422生成与量化线性预测系数^β1,^β2,…,^βp相对应的振幅频谱包络的序列、即非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)。
所生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)被输出到白化频谱序列生成单元43。
非平滑化振幅频谱包络序列生成单元422使用量化线性预测系数^β1,^β2,…,^βp,生成由式(C2)定义的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1),作为非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)。
[数学式12]
这样,非平滑化振幅频谱包络序列生成单元422基于由线性预测分析单元421生成的可变换为线性预测系数的系数,得到将与伪相关函数信号串相对应的振幅频谱包络的序列进行了1/η0次幂的序列、即非平滑化频谱包络序列,从而进行频谱包络的估计(步骤C422)。
<白化频谱序列生成单元43>
白化频谱序列生成单元43中被输入频域变换单元41所得到的MDCT系数串X(0),X(1),…,X(N-1)以及非平滑化振幅频谱包络生成单元422生成的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)。
白化频谱序列生成单元43将MDCT系数串X(0),X(1),…,X(N-1)的各系数用相对应的非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)的各值进行除法运算,从而生成白化频谱序列XW(0),XW(1),…,XW(N-1)。
所生成的白化频谱序列XW(0),XW(1),…,XW(N-1)被输出到参数取得单元44。
白化频谱序列生成单元43例如设k=0,1,…,N-1,用非平滑化振幅频谱包络序列^H(0),^H(1),…,^H(N-1)的各值^H(k)除MDCT系数串X(0),X(1),…,X(N-1)的各系数X(k),从而生成白化频谱序列XW(0),XW(1),…,XW(N-1)的各值XW(k)。即,设k=0,1,…,N-1,XW(k)=X(k)/^H(k)。
这样,白化频谱序列生成单元43得到用例如作为非平滑化振幅频谱包络序列的频谱包络除例如作为MDCT系数串的频域样本串而算出的序列、即白化频谱序列(步骤C43)。
<参数取得单元44>
参数取得单元44中被输入白化频谱序列生成单元43生成的白化频谱序列XW(0),XW(1),…,XW(N-1)。
参数取得单元44求将参数η设为形状参数的广义高斯分布对白化频谱序列XW(0),XW(1),…,XW(N-1)的直方图进行近似的参数η(步骤C44)。换言之,参数取得单元44决定如将参数η设为形状参数的广义高斯分布接近于白化频谱序列XW(0),XW(1),…,XW(N-1)的直方图的分布的参数η。
将参数η设为形状参数的广义高斯分布,例如如下定义。Γ是伽玛函数(gammafunction)。
[数学式13]
广义高斯分布通过改变作为形状参数的η,如图20所示,诸如在η=1时表现拉普拉斯分布、在η=2时表现高斯分布这样能够表现各种分布。η是大于0的规定的数。η也可以是大于0且除2以外的规定的数。具体而言,η可以是小于2的规定的正数。是与方差相对应的参数。
这里,参数取得单元44求出的η例如由以下的式(C3)定义。F-1是函数F的反函数。该式是通过所谓矩量法(moment method)导出的。
[数学式14]
在反函数F-1被公式化的情况下,参数取得单元44计算将m1/((m2)1/2)的值输入到被公式化的反函数F-1中时的输出值,从而能够求出参数η。
在反函数F-1未被公式化的情况下,为了计算由式(C3)定义的η的值,参数取得单元44例如也可以通过以下说明的第一方法或第二方法来求参数η。
说明用于求出参数η的第一方法。在第一方法中,参数取得单元44基于白化频谱序列计算m1/((m2)1/2),参照预先准备的η和相对应的F(η)的不同的多个对,取得与计算出的m1/((m2)1/2)最接近的F(η)相对应的η。
预先准备的η和相对应的F(η)的不同的多个对,预先存储在参数取得单元44的存储单元441中。参数取得单元44参照存储单元441,找出与所计算的m1/((m2)1/2)最接近的F(η),从存储单元441读取并输出与找到的F(η)相对应的η。
所谓与所计算的m1/((m2)1/2)最接近的F(η),是与所计算的m1/((m2)1/2)的差的绝对值最小的F(η)。
说明用于求出参数η的第二方法。在第二方法中,将反函数F-1的近似曲线函数设为例如由以下的式(C3’)所表示的F-1,参数取得单元44基于白化频谱序列而计算m1/((m2)1/2),通过计算将计算出的m1/((m2)1/2)输入到了近似曲线函数F-1时的输出值而求出η。该近似曲线函数F-1只要是在所使用的定义域中输出成为正值的单调增加函数即可。
[数学式15]
另外,参数取得单元44求出的η可以不是由式(C3)定义,而通过如式(C3”)那样使用预先规定的正整数q1及q2(其中q1<q2)将式(C3)进行了一般化后的式子来定义。
[数学式16]
另外,在η由式(C3”)定义的情况下,也能够通过与η由式(C3)定义的情况同样的方法来求η。即,参数取得单元44在基于白化频谱序列而计算出基于其q1阶矩(q1-th ordermoment)即mq1和其q2阶距即mq2的值mq1/((mq2)q1/q2)后,例如能够与上述的第一及第二方法同样,参照预先准备的η和相对应的F’(η)的不同的多个对,取得与最接近计算出的mq1/((mq2)q1/q2)的F’(η)相对应的η,或者将反函数F’-1的近似曲线函数设为F’-1,计算将计算出的mq1/((mq2)q1/q2)输入到了近似曲线函数F-1时的输出值来求η。
如上述,也可以说η是基于维数不同的2个矩mq1、mq2的值。例如,也可以基于维数不同的2个不同的矩mq1、mq2中的、维数低的那个矩的值或基于它的值(以下设为前者。)和维数高的那个矩的值或基于它的值(以下设为后者)之比的值、基于该比值的值、或者用后者除前者得到的值,来求η。所谓基于矩的值,例如是将该矩设为m、将Q设为规定的实数时为mQ。此外,也可以将这些值输入近似曲线函数F-1来求η。该近似曲线函数F’-1与上述同样,只要是在所使用的定义域中输出成为正值的单调增加函数即可。
参数决定单元27’也可以通过循环处理来求参数η。即,参数决定单元27’也可以进一步将把参数取得单元44求出的参数η设为用规定的方法确定的参数η0的、频谱包络估计单元42、白化频谱序列生成单元43以及参数取得单元44的处理进行1次以上。
在该情况下,例如,如图18中虚线所示,参数取得单元44求出的参数η被输出到频谱包络估计单元42。频谱包络估计单元42将参数取得单元44求出的η用作参数η0,进行与上述说明的处理同样的处理,进行频谱包络的估计。白化频谱序列生成单元43基于新估计出的频谱包络,进行与上述说明的处理同样的处理,生成白化频谱序列。参数取得单元44基于新生成的白化频谱序列,进行与上述说明的处理同样的处理,求参数η。
例如,频谱包络估计单元42、白化频谱序列生成单元43以及参数取得单元44的处理也可以进一步进行作为规定的次数的τ次。τ是规定的正整数,例如τ=1或者τ=2。
此外,频谱包络估计单元42也可以反复进行频谱包络估计单元42、白化频谱序列生成单元43以及参数取得单元44的处理,直至本次求出的参数η和上次求出的参数η之差的绝对值变为规定的阈值以下。
(解码)
第二实施方式的解码装置及方法与第一实施方式同样,所以省略重复说明。
[编码装置、解码装置以及它们的方法的变形例]
若将线性预测分析单元22及非平滑化振幅频谱包络序列生成单元23理解为1个频谱包络估计单元2A,则可以说,该频谱包络估计单元2A进行将与时序信号相对应的例如MDCT系数串即频域样本串的绝对值的η1次幂视为功率谱的频谱包络(非平滑化振幅频谱包络序列)的估计。这里,所谓“视为功率谱”,意思是在通常使用功率谱的地方使用η1次幂的频谱。
在该情况下,可以说,频谱包络估计单元2A的线性预测分析单元22例如使用通过进行将MDCT系数串即频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数。此外,可以说,频谱包络估计单元2A的非平滑化振幅频谱包络序列生成单元23得到将与通过线性预测分析单元22得到的可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η1次幂的序列、即非平滑化频谱包络序列,从而进行频谱包络的估计。
此外,若将平滑化振幅频谱包络序列生成单元24、包络归一化单元25及编码单元26理解为1个编码单元2B,则可以说,该编码单元2B对与时序信号相对应的例如MDCT系数串即频域样本串的各系数,进行基于由频谱包络估计单元2A估计出的频谱包络(非平滑化振幅频谱包络序列)而改变比特分配或者实质上比特分配会改变的编码。
若将解码单元34及包络逆归一化单元35理解为1个解码单元3A,则可以说,该解码单元3A按照基于非平滑化频谱包络序列而改变的比特分配或者实质上改变的比特分配,进行被输入的整数信号码的解码,从而得到与时序信号相对应的频域样本串。
编码单元2B只要是进行基于频谱包络(非平滑化振幅频谱包络序列)而改变比特分配或者实质上比特分配改变的编码,则也可以进行上述说明的除算术编码以外的编码处理。在该情况下,解码单元3A进行与编码单元2B所进行的编码处理相对应的解码处理。
例如,编码单元2B也可以使用基于频谱包络(非平滑化振幅频谱包络序列)而决定的莱斯(Rice)参数对频域样本串进行Golomb-Rice编码。在该情况下,解码单元3A也可以使用基于频谱包络(非平滑化振幅频谱包络序列)而决定出的莱斯(Rice)参数来进行Golomb-Rice解码。
在第一实施方式中,编码装置在决定参数η时也可以不将编码处理进行到最后。换言之,参数决定单元27也可以基于估计码量来决定参数η。在该情况下,编码单元2B使用多个参数η中的各个,得到通过针对与同一规定的时间区间的时序信号相对应的频域样本串的与上述同样的编码处理而得到的码的估计码量。参数决定单元27基于所得到的估计码量而选择多个参数η的任1个。例如,选择估计码量最小的参数η。编码单元2B使用所选择的参数η进行与上述同样的编码处理,从而得到码并输出。
上述说明的处理不仅可以按照记载的顺序以时序予以执行,还可以根据执行处理的装置的处理能力或者根据需要并行地或者单独地予以执行。
[程序及记录介质]
此外,也可以由计算机实现各装置或者各方法中的各单元。在该情况下,各装置或者各方法的处理内容由程序记述。然后,通过用计算机执行该程序,在计算机上实现各装置或者各方法中的各单元。
记述了该处理内容的程序能够预先记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如也可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任意介质。
此外,该程序的流通例如通过销售、转让、借贷记录了该程序的DVD、CD-ROM等移动式记录介质而进行。进一步,也可以预先将该程序储存在服务器计算机的存储装置中,经由网络从服务器计算机将该程序转发到其他计算机,从而使该程序流通。
执行这样的程序的计算机例如首先将记录在移动式记录介质中的程序或者从服务器计算机转发的程序暂时储存在自身的存储单元中。然后,在执行处理时,该计算机读取储存在自身的存储单元中的程序,执行遵循读取出的程序的处理。此外,作为该程序的其他实施方式,也可以是,计算机从移动式记录介质直接读取程序,执行遵循该程序的处理。进一步,也可以是,每当该计算机被从服务器计算机转发程序时,依次执行遵循接收到的程序的处理。此外,也可以设为下述结构:通过不进行从服务器计算机向该计算机的程序的转发、仅通过其执行指示和结果取得来实现处理功能的、所谓ASP(Application ServiceProvider)型的服务,执行上述的处理。另外,假设在程序中包含有助于电子计算机所进行的处理之用的信息且相当于程序的准程序(虽然不是对计算机的直接的指令,但是是具有对计算机的处理进行规定的性质的数据等)。
此外,通过在计算机上执行规定的程序而构成各装置,但是也可以通过硬件方式实现这些处理内容的至少一部分。

Claims (30)

1.一种线性预测编码装置,其将参数η设为正数,将与时序信号相对应的参数η设为对用与该时序信号相对应的频域样本串的绝对值的η次幂视为功率谱从而估计出的频谱包络除所述频域样本串而算出的序列即白化频谱序列的直方图进行近似的广义高斯分布的形状参数,η1设为参数η的规定的值,所述线性预测编码装置包括:
线性预测分析单元,使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;
码本存储单元,存储与N种(N是1以上的整数)参数η各自相对应的N个码本,在各码本中储存了与各自的参数η相对应的可变换为线性预测系数的系数的多个候选;
适配单元,使存储在所述码本存储单元中的码本所储存的可变换为线性预测系数的系数的多个候选、和所述线性预测分析单元所得到的可变换为线性预测系数的系数、的η的值适配;以及
编码单元,使用所述η的值被适配后的可变换为线性预测系数的系数的多个候选和可变换为线性预测系数的系数,得到与所述线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
2.如权利要求1所述的线性预测编码装置,其中,
所述适配单元包含对存储在所述码本存储单元中的可变换为线性预测系数的系数的候选进行与η1相应的第一线性变换,并得到第一线性变换后的可变换为线性预测系数的系数的多个候选的线性变换单元,
所述编码单元使用所述线性预测分析单元所得到的可变换为线性预测系数的系数、和所述适配单元所得到的所述第一线性变换后的可变换为线性预测系数的系数的多个候选,得到与所述线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
3.如权利要求1所述的线性预测编码装置,其中,
所述适配单元包含对所述线性预测分析单元所得到的可变换为线性预测系数的系数进行与η1相应的第二线性变换,并得到第二线性变换后的可变换为线性预测系数的系数的线性变换单元,
所述编码单元使用所述适配单元所得到的所述第二线性变换后的可变换为线性预测系数的系数、和储存在所述码本中的可变换为线性预测系数的系数的多个候选,得到与所述线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
4.如权利要求1所述的线性预测编码装置,其中,
η2、η3设为参数η的规定的值,
在所述码本存储单元中存储有与η2相对应的码本,
所述适配单元是下述线性变换单元:对存储在所述码本存储单元中的可变换为线性预测系数的系数的多个候选进行与η3相应的第一线性变换,得到第一线性变换后的可变换为线性预测系数的系数的多个候选,并对所述线性预测分析单元所得到的可变换为线性预测系数的系数进行与η3相应的第二线性变换,得到第二线性变换后的可变换为线性预测系数的系数,
所述编码单元使用所述适配单元所得到的所述第二线性变换后的可变换为线性预测系数的系数、和所述适配单元所得到的所述第一线性变换后的可变换为线性预测系数的系数的多个候选,得到与所述线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
5.如权利要求1所述的线性预测编码装置,其中,
η2设为参数η的规定的值,
在所述码本存储单元中存储有多个码本,
所述适配单元,是根据所述η2从存储在所述码本存储单元中的多个码本中选择码本的码本选择单元、和进行对于所述线性预测分析单元所得到的可变换为线性预测系数的系数的、与η2相应的第二线性变换的线性变换单元,
所述编码单元使用所述选择的码本对所述第二线性变换后的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
6.如权利要求1所述的线性预测编码装置,其中,
η2设为参数η的规定的值,
在所述码本存储单元中存储有多个码本,
所述适配单元,是根据所述η2从存储在所述码本存储单元中的多个码本中选择码本的码本选择单元、和进行对于储存在所述选择的码本中的可变换为线性预测系数的系数的多个候选的、与η1相应的第一线性变换的线性变换单元,
所述编码单元使用所述第一线性变换后的可变换为线性预测系数的系数的候选对所述线性预测分析单元所得到的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
7.如权利要求1所述的线性预测编码装置,其中,
η2、η3设为参数η的规定的值,
在所述码本存储单元中存储有多个码本,
所述适配单元,是根据所述η3从存储在所述码本存储单元中的多个码本中选择码本的码本选择单元、和进行对于储存在所述选择的码本中的可变换为线性预测系数的系数的多个候选的、与η2相应的第一线性变换,并且进行对于所述线性预测分析单元所得到的可变换为线性预测系数的系数的、与η2相应的第二线性变换的线性变换单元,
所述编码单元使用所述第一线性变换后的可变换为线性预测系数的系数的候选对所述第二线性变换后的可变换为线性预测系数的系数进行编码,得到线性预测系数码。
8.如权利要求2所述的线性预测编码装置,其中,
所述线性变换单元进行所述第一线性变换,使得所述η1越小则与所述第一线性变换后的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列越平坦。
9.如权利要求2至8的任意一项所述的线性预测编码装置,其中,
将p设为可变换为线性预测系数的系数的阶数,将所述可变换为线性预测系数的系数或者所述可变换为线性预测系数的系数的候选设为^ω[k][k=1,2,…,p],将所述第一线性变换后以及所述第二线性变换后的可变换为线性预测系数的系数或者所述可变换为线性预测系数的系数的候选设为~ω[k][k=1,2,…,p],将x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp设为规定的非负数,设y1,y2,…yp-1,z2,z3,…zp的至少1个为规定的正数,将K设为x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp以外的要素为0的矩阵,
所述线性变换单元通过下述式进行所述第一线性变换和所述第二线性变换的至少一方:
[数学式17]
<mrow> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mi>p</mi> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>=</mo> <mi>K</mi> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> <mo>-</mo> <mfrac> <mi>&amp;pi;</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> <mo>-</mo> <mfrac> <mrow> <mn>2</mn> <mi>&amp;pi;</mi> </mrow> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mi>p</mi> <mo>&amp;rsqb;</mo> <mo>-</mo> <mfrac> <mrow> <mi>p</mi> <mi>&amp;pi;</mi> </mrow> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>+</mo> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mi>p</mi> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
10.如权利要求2所述的线性预测编码装置,其中,
所述线性变换单元进行所述第一线性变换,使得所述η1越小则所述第一线性变换后的可变换为线性预测系数的系数的候选的阶数越小。
11.如权利要求1、2、3、4的任意一项所述的线性预测编码装置,其中,
在所述码本存储单元中存储有多个码本,
所述适配单元包含根据所述η1从存储在所述码本存储单元中的多个码本中选择码本的码本选择单元,
所述编码单元使用所述线性预测分析单元所得到的可变换为线性预测系数的系数、和所述适配单元所得到的可变换为线性预测系数的系数的多个候选,得到与所述线性预测分析单元所得到的所述可变换为线性预测系数的系数相对应的线性预测系数码。
12.如权利要求11所述的线性预测编码装置,其中,
在所述码本存储单元中存储有可变换为线性预测系数的系数的候选数不同的多个码本,
所述码本选择单元在所述η1越大时,从存储在所述码本存储单元中的多个码本中选择可变换为线性预测系数的系数的候选数越多的码本。
13.如权利要求11或12所述的线性预测编码装置,其中,
在所述码本存储单元中存储有将与存储在码本中的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η1次幂的序列即非平滑化频谱包络序列的平坦程度不同的多个码本,
所述码本选择单元在所述η1越小时,从存储在所述码本存储单元中的多个码本中选择将与存储在码本中的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η1次幂的序列即非平滑化频谱包络序列越平坦的码本。
14.如权利要求11或12所述的线性预测编码装置,其中,
在所述码本存储单元中存储有可变换为线性预测系数的系数的候选间的间隔不同的多个码本,
所述码本选择单元在所述η越小时,从存储在所述码本存储单元中的多个码本中选择可变换为线性预测系数的系数的候选间的间隔越窄的码本。
15.一种线性预测编码装置,其将参数η设为正数,将与时序信号相对应的参数η设为对用通过将与该时序信号相对应的频域样本串的绝对值的η次幂视为功率谱而估计出的频谱包络除所述频域样本串算出的序列即白化频谱序列的直方图进行近似的广义高斯分布的形状参数,η1设为参数η的规定的值,所述线性预测编码装置包括:
线性预测分析单元,使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;
码本存储单元,存储了码本;
适配单元,基于被输入的η1,使存储在所述码本存储单元中的码本和所述可变换为线性预测系数的系数的至少一方适配;以及
编码单元,使用所述码本或者进行了所述适配的码本,对所述可变换为线性预测系数的系数或者进行了所述适配的可变换为线性预测系数的系数进行编码。
16.一种线性预测解码装置,包含:
码本存储单元,存储了码本;以及
适配单元,将η1设为正数,基于被输入的η1,使存储在所述码本存储单元中的码本、和储存在所述码本中的可变换为线性预测系数的系数的多个候选中的与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选的至少一方适配,
所述可变换为线性预测系数的系数,用于得到将与所述可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η1次幂的序列即非平滑化频谱包络序列。
17.如权利要求16所述的线性预测解码装置,其中,
还包含将储存在所述码本中的可变换为线性预测系数的系数的多个候选中的与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选,作为可变换为线性预测系数的系数来得到的解码单元,
所述适配单元是对所述解码单元所得到的可变换为线性预测系数的系数进行与作为规定的正数的η1相应的线性变换而得到可变换为线性预测系数的系数的线性变换单元。
18.如权利要求16所述的线性预测解码装置,其中,
在所述码本中存储有多个码本,
将η2设为正数,所述适配单元是根据所述η2从存储在所述码本存储单元中的多个码本中选择码本的码本选择单元、和对解码单元所得到的可变换为线性预测系数的系数进行与作为规定的正数的η1相应的线性变换而得到可变换为线性预测系数的系数的线性变换单元,
所述线性预测解码装置还包含将储存在所述选择的码本中的可变换为线性预测系数的系数的多个候选中的、与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选作为可变换为线性预测系数的系数来得到的所述解码单元。
19.如权利要求17所述的线性预测解码装置,其中,
所述线性变换单元进行所述线性变换,使得所述η1越小则与所述线性变换单元所得到的可变换为线性预测系数的系数相对应的振幅频谱包络的序列越平坦。
20.如权利要求17至19的任意一项所述的线性预测解码装置,其中,
将p设为可变换为线性预测系数的系数的阶数,将所述解码单元所得到的可变换为线性预测系数的系数设为^ω[k][k=1,2,…,p],将所述线性变换后的可变换为线性预测系数的系数设为~ω[k][k=1,2,…,p],将x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp设为规定的非负数,设y1,y2,…yp-1,z2,z3,…zp的至少1个为规定的正数,将K设为x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp以外的要素为0的矩阵,
所述线性变换单元通过下述式进行线性变换:
[数学式18]
<mrow> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mi>p</mi> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>=</mo> <mi>K</mi> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> <mo>-</mo> <mfrac> <mi>&amp;pi;</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> <mo>-</mo> <mfrac> <mrow> <mn>2</mn> <mi>&amp;pi;</mi> </mrow> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mi>p</mi> <mo>&amp;rsqb;</mo> <mo>-</mo> <mfrac> <mrow> <mi>p</mi> <mi>&amp;pi;</mi> </mrow> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>+</mo> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mrow> <mover> <mi>&amp;omega;</mi> <mo>~</mo> </mover> <mo>&amp;lsqb;</mo> <mi>p</mi> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
21.如权利要求17所述的线性预测解码装置,其中,
所述线性变换单元进行所述线性变换,使得所述η1越小则所述线性变换后的可变换为线性预测系数的系数的阶数越小。
22.如权利要求16所述的线性预测解码装置,其中,
在所述码本中存储有多个码本,
所述适配单元,是根据所述η1从存储在所述码本存储单元中的多个码本中选择码本的码本选择单元,并且还包含使用所述选择的码本对被输入的线性预测系数码进行解码而得到可变换为线性预测系数的系数的解码单元。
23.如权利要求22所述的线性预测解码装置,其中,
在所述码本存储单元中存储有可变换为线性预测系数的系数的候选数不同的多个码本,
所述码本选择单元在所述η1越大时,从存储在所述码本存储单元中的多个码本中,选择可变换为线性预测系数的系数的候选数越多的码本。
24.如权利要求22或23所述的线性预测解码装置,其中,
在所述码本存储单元中存储有将与存储在码本中的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η1次幂的序列即非平滑化频谱包络序列的平坦程度不同的多个码本,
所述码本选择单元在所述η1越小时,从存储在所述码本存储单元中的多个码本中,选择将与存储在码本中的可变换为线性预测系数的系数的候选相对应的振幅频谱包络的序列进行了1/η1次幂的序列即非平滑化频谱包络序列越平坦的码本。
25.如权利要求22或23所述的线性预测解码装置,其中,
在所述码本存储单元中存储有可变换为线性预测系数的系数的候选间的间隔不同的多个码本,
所述码本选择单元在所述η1越小时,从存储在所述码本存储单元中的多个码本中,选择可变换为线性预测系数的系数的候选间的间隔越窄的码本。
26.一种线性预测编码方法,其将参数η设为正数,将与时序信号相对应的参数η设为对用通过将与该时序信号相对应的频域样本串的绝对值的η次幂视为功率谱而估计出的频谱包络除所述频域样本串算出的序列即白化频谱序列的直方图进行近似的广义高斯分布的形状参数,η1设为参数η的规定的值,所述线性预测编码方法包含:
线性预测分析步骤,线性预测分析单元使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;
适配步骤,适配单元使存储在码本存储单元中的码本所储存的可变换为线性预测系数的系数的多个候选、和所述线性预测分析步骤所得到的可变换为线性预测系数的系数、的η的值适配,其中,所述码本存储单元存储与N种(N是1以上的整数)参数η各自相对应的N个码本,在各码本中储存了与各自的参数η相对应的可变换为线性预测系数的系数的多个候选;以及
编码步骤,编码单元使用所述η的值被适配的可变换为线性预测系数的系数的多个候选和可变换为线性预测系数的系数,得到与所述线性预测分析单元所得到的可变换为线性预测系数的系数相对应的线性预测系数码。
27.一种线性预测编码方法,其将参数η设为正数,将与时序信号相对应的参数η设为对用通过进行将与该时序信号相对应的频域样本串的绝对值的η次幂视为功率谱而估计出的频谱包络除所述频域样本串算出的序列即白化频谱序列的直方图进行近似的广义高斯分布的形状参数,η1设为参数η的规定的值,所述线性预测编码方法包含:
线性预测分析步骤,使用通过进行将与时序信号相对应的频域样本串的绝对值的η1次幂视为功率谱的傅立叶逆变换而得到的伪相关函数信号串,进行线性预测分析,得到可变换为线性预测系数的系数;
适配步骤,基于被输入的η1,使存储在码本存储单元中的码本和所述可变换为线性预测系数的系数的至少一方适配;以及
编码步骤,使用所述码本或者进行了所述适配的码本,对所述可变换为线性预测系数的系数或者进行了所述适配的可变换为线性预测系数的系数进行编码。
28.一种线性预测解码方法,其中,
包含将η1设为正数,基于被输入的η1,使存储在码本存储单元中的码本、和储存在所述码本中的可变换为线性预测系数的系数的多个候选中的与被输入的线性预测系数码相对应的可变换为线性预测系数的系数的候选的至少一方适配的适配步骤,
所述可变换为线性预测系数的系数,用于得到将与所述可变换为线性预测系数的系数相对应的振幅频谱包络的序列进行了1/η1次幂的序列、即非平滑化频谱包络序列。
29.一种程序,用于使计算机作为权利要求1至15的任意一项所述的线性预测编码装置或者权利要求16至25的任意一项所述的线性预测解码装置的各单元发挥功能。
30.一种计算机可读取的记录介质,记录了用于使计算机作为权利要求1至15的任意一项所述的线性预测编码装置或者权利要求16至25的任意一项所述的线性预测解码装置的各单元发挥功能的程序。
CN201680021332.5A 2015-04-13 2016-04-11 线性预测编码装置、线性预测解码装置、它们的方法以及记录介质 Active CN107408390B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2015-081747 2015-04-13
JP2015081747 2015-04-13
JP2015081746 2015-04-13
JP2015-081746 2015-04-13
PCT/JP2016/061682 WO2016167215A1 (ja) 2015-04-13 2016-04-11 線形予測符号化装置、線形予測復号装置、これらの方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
CN107408390A true CN107408390A (zh) 2017-11-28
CN107408390B CN107408390B (zh) 2021-08-06

Family

ID=57126589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680021332.5A Active CN107408390B (zh) 2015-04-13 2016-04-11 线性预测编码装置、线性预测解码装置、它们的方法以及记录介质

Country Status (6)

Country Link
US (1) US10325609B2 (zh)
EP (1) EP3270376B1 (zh)
JP (2) JP6517924B2 (zh)
KR (1) KR102061300B1 (zh)
CN (1) CN107408390B (zh)
WO (1) WO2016167215A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112350760A (zh) * 2019-08-09 2021-02-09 大唐移动通信设备有限公司 一种预编码码本选择的方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6499206B2 (ja) * 2015-01-30 2019-04-10 日本電信電話株式会社 パラメータ決定装置、方法、プログラム及び記録媒体
CN107210042B (zh) * 2015-01-30 2021-10-22 日本电信电话株式会社 编码装置、编码方法以及记录介质
KR20210133554A (ko) * 2020-04-29 2021-11-08 한국전자통신연구원 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
CN111901004B (zh) * 2020-08-04 2022-04-12 三维通信股份有限公司 平坦度的补偿方法和装置、存储介质和电子设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186013B2 (ja) * 1995-01-13 2001-07-11 日本電信電話株式会社 音響信号変換符号化方法及びその復号化方法
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
CN1488135A (zh) * 2000-11-30 2004-04-07 ���µ�����ҵ��ʽ���� 线性预测编码参数的矢量量化装置
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2007105586A (ja) * 2005-10-12 2007-04-26 Tsukishima Kikai Co Ltd ろ過装置
JP4365610B2 (ja) * 2003-03-31 2009-11-18 パナソニック株式会社 音声復号化装置および音声復号化方法
CN102449689A (zh) * 2009-06-03 2012-05-09 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、编码程序、解码程序以及它们的记录介质
CN102637436A (zh) * 2011-02-09 2012-08-15 索尼公司 声音信号处理装置、声音信号处理方法和程序
CN102687199A (zh) * 2010-01-08 2012-09-19 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序以及记录介质
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
WO2013176177A1 (ja) * 2012-05-23 2013-11-28 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
CN103824561A (zh) * 2014-02-18 2014-05-28 北京邮电大学 一种语音线性预测编码模型的缺失值非线性估算方法
US8977543B2 (en) * 2011-04-21 2015-03-10 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6253028A (ja) 1985-09-02 1987-03-07 Nec Corp 適応形符号化復号化方式とその装置
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
EP1988544B1 (en) 2006-03-10 2014-12-24 Panasonic Intellectual Property Corporation of America Coding device and coding method
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
FR2961937A1 (fr) * 2010-06-29 2011-12-30 France Telecom Codage/decodage predictif lineaire adaptatif
WO2014021318A1 (ja) * 2012-08-01 2014-02-06 独立行政法人産業技術総合研究所 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム
PL3252762T3 (pl) * 2012-10-01 2019-07-31 Nippon Telegraph And Telephone Corporation Sposób kodowania, koder, program i nośnik zapisu
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
EP3447766B1 (en) * 2014-04-24 2020-04-08 Nippon Telegraph and Telephone Corporation Encoding method, encoding apparatus, corresponding program and recording medium
JP6457552B2 (ja) 2014-11-27 2019-01-23 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
CN107210042B (zh) * 2015-01-30 2021-10-22 日本电信电话株式会社 编码装置、编码方法以及记录介质
JP6499206B2 (ja) * 2015-01-30 2019-04-10 日本電信電話株式会社 パラメータ決定装置、方法、プログラム及び記録媒体
US10147443B2 (en) * 2015-04-13 2018-12-04 Nippon Telegraph And Telephone Corporation Matching device, judgment device, and method, program, and recording medium therefor

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186013B2 (ja) * 1995-01-13 2001-07-11 日本電信電話株式会社 音響信号変換符号化方法及びその復号化方法
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
CN1488135A (zh) * 2000-11-30 2004-04-07 ���µ�����ҵ��ʽ���� 线性预测编码参数的矢量量化装置
JP4365610B2 (ja) * 2003-03-31 2009-11-18 パナソニック株式会社 音声復号化装置および音声復号化方法
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2007105586A (ja) * 2005-10-12 2007-04-26 Tsukishima Kikai Co Ltd ろ過装置
CN102449689A (zh) * 2009-06-03 2012-05-09 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、编码程序、解码程序以及它们的记录介质
CN102687199A (zh) * 2010-01-08 2012-09-19 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序以及记录介质
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
CN102637436A (zh) * 2011-02-09 2012-08-15 索尼公司 声音信号处理装置、声音信号处理方法和程序
US8977543B2 (en) * 2011-04-21 2015-03-10 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore
WO2013176177A1 (ja) * 2012-05-23 2013-11-28 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
CN103824561A (zh) * 2014-02-18 2014-05-28 北京邮电大学 一种语音线性预测编码模型的缺失值非线性估算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
彭远疆: ""基于线性预测编码的低速率语音编码算法的研究"", 《中国优秀博硕士学位论文全文数据库(硕士)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112350760A (zh) * 2019-08-09 2021-02-09 大唐移动通信设备有限公司 一种预编码码本选择的方法及装置
CN112350760B (zh) * 2019-08-09 2021-07-23 大唐移动通信设备有限公司 一种预编码码本选择的方法及装置

Also Published As

Publication number Publication date
WO2016167215A1 (ja) 2016-10-20
EP3270376A4 (en) 2018-08-29
EP3270376A1 (en) 2018-01-17
CN107408390B (zh) 2021-08-06
EP3270376B1 (en) 2020-03-18
US20180096694A1 (en) 2018-04-05
JP2019079069A (ja) 2019-05-23
JPWO2016167215A1 (ja) 2018-02-01
KR20170127533A (ko) 2017-11-21
US10325609B2 (en) 2019-06-18
KR102061300B1 (ko) 2020-02-11
JP6633787B2 (ja) 2020-01-22
JP6517924B2 (ja) 2019-05-22

Similar Documents

Publication Publication Date Title
CN107408390A (zh) 线性预测编码装置、线性预测解码装置、它们的方法、程序以及记录介质
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
CN105719655A (zh) 用于高频带宽扩展的对信号进行编码和解码的设备和方法
CN104321814B (zh) 频域基音周期分析方法和频域基音周期分析装置
CN103294729B (zh) 处理、预测包含样本点的时间序列的方法和设备
CN106537500B (zh) 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质
JP6650540B2 (ja) 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム
CN107004422A (zh) 编码装置、解码装置、它们的方法及程序
JP7380836B2 (ja) 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
CN107430869A (zh) 参数决定装置、方法、程序及记录介质
CN112820305A (zh) 编码装置、编码方法、编码程序、记录介质
JP6387117B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JP2008519308A5 (zh)
CN105340010B (zh) 用于通过应用分布量化和编码分裂音频信号包络的音频信号包络编码、处理和解码的装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant