CN101176148A - 编码装置、解码装置和其方法 - Google Patents

编码装置、解码装置和其方法 Download PDF

Info

Publication number
CN101176148A
CN101176148A CNA2006800161859A CN200680016185A CN101176148A CN 101176148 A CN101176148 A CN 101176148A CN A2006800161859 A CNA2006800161859 A CN A2006800161859A CN 200680016185 A CN200680016185 A CN 200680016185A CN 101176148 A CN101176148 A CN 101176148A
Authority
CN
China
Prior art keywords
decoded signal
unit
signal
decoded
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800161859A
Other languages
English (en)
Other versions
CN101176148B (zh
Inventor
佐藤薰
森井利幸
山梨智史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101176148A publication Critical patent/CN101176148A/zh
Application granted granted Critical
Publication of CN101176148B publication Critical patent/CN101176148B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种在可扩展编码方式中,抵消作为解码信号的质量恶化原因的编码装置固有的特性,能够实现提高所生成的解码信号的质量的编码装置。在该编码装置中,第一编码单元(102)对下采样后的输入信号进行编码。第一解码单元(103)对从第一编码单元(102)输出的第一编码信息进行解码。调整单元(105)通过将上采样后的第一解码信号与调整用的脉冲响应进行卷积,调整上采样后的第一解码信号。加法器(107)使调整后的第一解码信号的极性反转后,与输入信号相加。第二编码单元(108)对从加法器(107)输出的残差信号进行编码。复用单元(109)将从第一编码单元(102)输出的第一编码信息与从第二编码单元(108)输出的第二编码信息复用并输出。

Description

编码装置、解码装置和其方法
技术领域
本发明涉及对输入信号进行可扩展编码并传输的通信系统中所使用的编码装置、解码装置和其方法。
背景技术
在以数字无线通信和因特网通信为代表的分组通信或语音存储等领域中,为了实现有效利用电波等的传输路径容量或存储媒体,语音信号的编码和解码技术必不可少,至目前为止已开发了许多语音编码和解码方式。
而且,现在,CELP方式的语音编码和解码方式作为主流方式而被实用化(例如,非专利文献1)。CELP方式的语音编码方式主要是存储发声语音的模型,基于预先存储的语音模型,对输入语音进行编码的方式。
并且,近年以来,已开发了可扩展编码技术,该技术是在语音信号和音频信号的编码时应用CELP方式,即使从编码信息的一部分也能够对语音和音频信号进行解码,而即使在发生分组损失的情况下,也能够抑制音质的恶化(例如,参照专利文献1)。
可扩展编码方式通常由基本层和多个扩展层构成,并且各个层以基本层作为最低层,形成分层结构。然后,在各个层,对较低层的输入信号与输出信号之间的差即残差信号进行编码。根据该结构,使用所有层的编码信息或部分层的编码信息,能够对语音和音频进行解码。
另外,在可扩展编码时,通常进行输入信号的采样频率变换,并对下采样后的输入信号进行编码。此时,通过对低层的解码信号进行上采样,并求输入信号与上采样后的解码信号之间的差,从而生成由高层进行编码的残差信号。
[专利文献1]特开平10-97295号公报
[非专利文献1]M.R.Schroeder,B.S.Atal,″Code Excited Linear Prediction:High Quality Speech at Very Low Bit Rate″,IEEE proc.,ICASSP′85 pp.937-940
发明内容
发明需要解决的问题
在此,一般而言,编码装置具有作为解码信号的质量恶化原因的固有特性。例如,在基本层对下采样后的输入信号进行编码时,因采样频率变换而产生解码信号的相位偏差,导致解码信号的质量恶化。
然而,在以往的可扩展编码方式中,不考虑编码装置的固有特性而进行编码,所以由于该编码装置的固有特性导致低层的解码信号的质量恶化,使解码信号与输入信号之间的误差大,而成为导致高层的编码效率降低的原因。
本发明的目的为提供在可扩展编码方式中,即使存在编码装置的固有特性时,也能够抵消解码信号受到影响的特性的编码装置、解码装置和其方法。
解决该问题的方案
本发明的编码装置为对输入信号进行可扩展编码的编码装置,该装置所采用的结构包括:第一编码单元,对所述输入信号进行编码而生成第一编码信息;第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;调整单元,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;延迟单元,使所述输入信号延迟,以使其与调整后的第一解码信号同步;加法单元,求延迟处理后的输入信号与所述调整后的第一解码信号之间的差分即残差信号;以及第二编码单元,对所述残差信号进行编码而生成第二编码信息。
本发明的编码装置为对输入信号进行可扩展编码的编码装置,该装置所采用的结构包括:频率变换单元,通过对所述输入信号进行下采样,从而进行采样频率变换;第一编码单元,对下采样后的输入信号进行编码而生成第一编码信息;第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;频率变换单元,通过对所述第一解码信号进行上采样,从而进行采样频率变换;调整单元,通过将上采样后的第一解码信号与调整用的脉冲响应进行卷积,从而进行所述上采样后的第一解码信号的调整;延迟单元,使所述输入信号延迟,以使其与调整后的第一解码信号同步;加法单元,求延迟处理后的输入信号与所述调整后的第一解码信号之间的差分即残差信号;以及第二编码单元,对所述残差信号进行编码而生成第二编码信息。
本发明的解码装置为对上述的编码装置所输出的编码信息进行解码的解码装置,该装置所采用的结构包括:第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;第二解码单元,对所述第二编码信息进行解码而生成第二解码信号;调整单元,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;加法单元,将调整后的第一解码信号与所述第二解码信号相加;以及信号选择单元,选择所述第一解码单元所生成的第一解码信号或所述加法单元的相加结果中的一个并输出。
本发明的解码装置为对上述的编码装置所输出的编码信息进行解码的解码装置,该装置所采用的结构包括:第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;第二解码单元,对所述第二编码信息进行解码而生成第二解码信号;频率变换单元,通过对所述第一解码信号进行上采样,从而进行采样频率变换;调整单元,通过将上采样后的第一解码信号与调整用的脉冲响应进行卷积,从而进行所述上采样后的第一解码信号的调整;加法单元,将调整后的第一解码信号与所述第二解码信号相加;以及信号选择单元,选择所述第一解码单元所生成的第一解码信号或所述加法单元的相加结果中的一个并输出。
本发明的编码方法为对输入信号进行可扩展编码的编码方法,该方法所采用的方法包括:第一编码步骤,对所述输入信号进行编码而生成第一编码信息;第一解码步骤,对所述第一编码信息进行解码而生成第一解码信号;调整步骤,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;延迟步骤,使所述输入信号延迟,以使其与调整后的第一解码信号同步;加法步骤,求延迟处理后的输入信号与所述调整后的第一解码信号之间的差分即残差信号;以及第二编码步骤,对所述残差信号进行编码而生成第二编码信息。
本发明的解码方法为对通过上述的编码方法编码的编码信息进行解码的解码方法,该方法所采用的方法包括:第一解码步骤,对所述第一编码信息进行解码而生成第一解码信号;第二解码步骤,对所述第二编码信息进行解码而生成第二解码信号;调整步骤,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;加法步骤,将调整后的第一解码信号与所述第二解码信号相加;以及信号选择步骤,选择所述第一解码步骤中所生成的第一解码信号或所述加法步骤中的相加结果中的一个并输出。
发明的有益效果
根据本发明,通过对所输出的解码信号进行调整,能够抵消编码装置的固有特性,能够实现提高解码信号的质量,并能够提高高层的编码效率。
附图说明
图1是表示本发明实施方式1的编码装置和解码装置的主要结构的方框图。
图2是表示本发明实施方式1的第一编码单元和第二编码单元的内部结构的方框图。
图3是用于简单说明决定自适应声源延迟的处理的图。
图4是用于简单说明决定固定声源向量的处理的图。
图5是表示本发明实施方式1的第一解码单元和第二解码单元的内部结构的方框图。
图6是表示本发明实施方式1的调整单元的内部结构的方框图。
图7是表示本发明实施方式2的语音和音频发送装置的结构的方框图。
图8是表示本发明实施方式2的语音和音频接收装置的结构的方框图。
具体实施方式
以下,参照附图详细说明本发明的实施方式。另外,在以下的实施方式中,对通过由两层构成的分层性的信号编码和解码方法而进行CELP类型的语音编码和解码的情况,进行说明。此外,分层性的信号编码方法是指,在高层中存在多个信号编码方法而形成分层结构的方法,该信号编码方法对在低层中的输入信号与输出信号之间的差分信号进行编码并输出编码信息。
(实施方式1)
图1是表示本发明实施方式1的编码装置100和解码装置150的主要结构的方框图。编码装置100主要由频率变换单元101和104、第一编码单元102、第一解码单元103、调整单元105、延迟单元106、加法器107、第二编码单元108、以及复用单元109构成。另外,解码装置150主要由复用分离单元151、第一解码单元152、第二解码单元153、频率变换单元154、调整单元155、加法器156、以及信号选择单元157构成。编码装置100所输出的编码信息,通过传输路径M被传输到解码装置150。
以下,说明图1所示的编码装置100的各个结构单元的处理内容。作为语音和音频信号的信号被输入到频率变换单元101以及延迟单元106。频率变换单元101进行输入信号的采样频率变换,并将下采样后的输入信号输出到第一编码单元102。
第一编码单元102使用CELP方式的语音和音频编码方法,对下采样后的输入信号进行编码,并将通过编码生成的第一编码信息输出到第一解码单元103以及复用单元109。
第一解码单元103使用CELP方式的语音和音频解码方法,对从第一编码单元102输出的第一编码信息进行解码,并将通过解码生成的第一解码信号输出到频率变换单元104。频率变换单元104对从第一解码单元103输出的第一解码信号进行采样频率变换,并将上采样后的第一解码信号输出到调整单元105。
调整单元105通过将上采样后的第一解码信号与调整用的脉冲响应进行卷积,对上采样后的第一解码信号进行调整,并将调整后的第一解码信号输出到加法器107。如此,在调整单元105中,通过对上采样后的第一解码信号进行调整,能够吸收编码装置固有的特性。另外,调整单元105的内部结构以及卷积处理的详细说明将后述。
延迟单元106将所输入的语音和音频信号暂时存储于缓冲区,从缓冲区提取语音和音频信号并输出到加法器107,以使其与从调整单元105输出的第一解码信号在时间上取得同步。加法器107将对从调整单元105输出的第一解码信号进行极性反转后的信号与从延迟单元106输出的输入信号相加,并将相加结果的残差信号输出到第二编码单元108。
第二编码单元108使用CELP方式的语音和音频编码方法,对从加法器107输出的残差信号进行编码,并将通过编码生成的第二编码信息输出到复用单元109。
复用单元109将从第一编码单元102输出的第一编码信息与从第二编码单元108输出的第二编码信息复用,并将其作为复用信息而输出到传输路径M。
接着,说明图1所示的解码装置150的各个结构单元的处理内容。复用分离单元151将从编码装置100传输的复用信息分离为第一编码信息与第二编码信息,并将第一编码信息输出到第一解码单元152,将第二编码信息输出到第二解码单元153。
第一解码单元152接收到从复用分离单元151输出的第一编码信息,使用CELP方式的语音和音频解码方法对第一编码信息进行解码,并将通过解码求出的第一解码信号输出到频率变换单元154以及信号选择单元157。
第二解码单元153接收到从复用分离单元151输出的第二编码信息,使用CELP方式的语音和音频解码方法对第二编码信息进行解码,并将通过解码求出的第二解码信号输出到加法器156。
频率变换单元154对从第一解码单元152输出的第一解码信号进行采样频率变换,并将上采样后的第一解码信号输出到调整单元155。
调整单元155使用与调整单元105相同的方法,对从频率变换单元154输出的第一解码信号进行调整,并将调整后的第一解码信号输出到加法器156。
加法器156将从第二解码单元153输出的第二解码信号与从调整单元155输出的第一解码信号相加,求作为相加结果的第二解码信号。
信号选择单元157基于控制信号,将从第一解码单元152输出的第一解码信号或从加法器156输出的第二解码信号的任一方,输出到进行后级步骤的单元。
接着,以频率变换单元101将采样频率是16kHz的输入信号下采样到8kHz的情况为例,详细说明在编码装置100和解码装置150中的频率变换处理。
此时,频率变换单元101首先将输入信号输入到低通滤波器,除去高频的频率分量(4~8kHz),以使输入信号的频率分量为0~4kHz。然后,频率变换单元101在经过低通滤波器后的输入信号的样本中提取每隔一个样本,将提取后的样本的序列作为下采样后的输入信号。
频率变换单元104和154将第一解码信号的采样频率从8kHz上采样到16kHz。具体而言,频率变换单元104和154在8kHz的第一解码信号的样本与样本之间,插入具有“ 0”的值的样本,将第一解码信号的样本的序列伸长为两倍长度。接着,频率变换单元104和154将伸长后的第一解码信号输入到低通滤波器,除去高频的频率分量(4~8kHz),以使第一解码信号的频率分量为0~4kHz。接着,频率变换单元104和154对经过低通滤波器后的第一解码信号进行功率的补偿,并将补偿后的第一解码信号作为上采样后的第一解码信号。
按照下面的步骤进行功率的补偿。频率变换单元104和154存储了用于功率补偿的系数r。假设系数r的初始值为“1”。此外,系数r的初始值也可变更为适合于各个编码装置的值。对每个帧进行以下的处理。首先,根据以下的式(1),求伸长前的第一解码信号的RMS(均方根)与经过低通滤波器后的第一解码信号的RMS’。
RMS = Σ i = 0 N / 2 - 1 ys ( i ) 2 N / 2 ···式(1)
RM S ′ = Σ i = 0 N - 1 y s ′ ( i ) 2 N
其中,ys(i)为伸长前的第一解码信号,i取0~N/2-1的值。此外,ys′(i)为经过低通滤波器后的第一解码信号,i取0~N-1的值。另外,N相当于帧的长度。接着,根据以下的式(2),对于各个i(0~N-1)进行系数r的更新(update)以及第一解码信号的功率补偿。
r=r×0.99+(RMS/RMS′)×0.01    ···式(2)
ys″(i)=ys′(i)×r
式(2)中的上面的式为对系数r进行更新的式,系数r的值在当前帧中进行功率补偿之后,在下一个帧中的处理时继续被使用。式(2)中的下面的式为使用系数r进行功率补偿的式。通过式(2)求得的ys”(i)为上采样后的第一解码信号。式(2)的0.99和0.01的值也可变更为适合于各个编码装置的值。此外,在式(2)中,RMS’的值为“0 ” 时,进行处理以能够求(RMS/RMS’)的值。例如,在RMS’的值为“0”时,假设将RMS的值代入到RMS’,以使(RMS/RMS’)的值为“1”。
接着,使用图2的方框图说明第一编码单元102以及第二编码单元108的内部结构。另外,这些编码单元的内部结构是相同的,但是作为编码对象的语音和音频信号的采样频率是不同的。此外,第一编码单元102以及第二编码单元108将所输入的语音和音频信号划分为每N个样本(N为自然数),并将N个样本作为1个帧而对各个帧进行编码。该N的值有时在第一编码单元102与第二编码单元108之间不相同。
作为输入信号和残差信号的其中一方的语音和音频信号被输入到预处理单元201。预处理单元201进行用于除去DC分量的高通滤波处理,或者进行波形整形处理以带来后续的编码处理的性能改善,或进行预加重(pre-emphasis)处理,并将这些处理后的信号(Xin)输出到LSP分析单元202以及加法器205。
LSP分析单元202使用Xin进行线性预测分析,并将分析结果的LPC(线性预测系数)变换为LSP(Line Spectral Pairs)后,输出到LSP量化单元203。
LSP量化单元203对从LSP分析单元202输出的LSP进行量化处理,并将量化后的量化LSP输出到合成滤波器204。另外,LSP量化单元203将表示量化LSP的量化LSP代码(L)输出到复用单元214。
合成滤波器204使用基于量化LSP的滤波系数,通过对从后述的加法器211输出的驱动声源进行滤波合成而生成合成信号,并将合成信号输出到加法器205。
加法器205通过使合成信号的极性反转后与Xin相加而计算出误差信号,并将误差信号输出到听觉加权单元212。
自适应声源代码本206将以前由加法器211输出的驱动声源存储在缓冲区,在缓冲区中从参数决定单元213输出的信号所确定的取出位置开始取出相当于1个帧的样本,并将其作为自适应声源向量而输出到乘法器209。另外,自适应声源代码本206每当接收到从加法器211输出的驱动声源时,进行缓冲区的更新。
量化增益生成单元207根据从参数决定单元213输出的信号,决定量化自适应声源增益和量化固定声源增益,并将这些增益分别输出到乘法器209和乘法器210。
固定声源代码本208将具有从参数决定单元213输出的信号所确定的形状的向量,作为固定声源向量而输出到乘法器210。
乘法器209将从量化增益生成单元207输出的量化自适应声源增益与从自适应声源代码本206输出的自适应声源向量相乘,并输出到加法器211。乘法器210将从量化增益生成单元207输出的量化固定声源增益与从固定声源代码本208输出的固定声源向量相乘,并输出到加法器211。
加法器211分别接收到从乘法器209和乘法器210输出的与增益相乘后的自适应声源向量和固定声源向量,将与增益相乘后的自适应声源向量和固定声源向量相加,并将作为相加结果的驱动声源输出到合成滤波器204和自适应声源代码本206。另外,自适应声源代码本206中所输入的驱动声源被存储于缓冲区。
听觉加权单元212对从加法器205输出的误差信号进行听觉加权,并将其作为编码失真而输出到参数决定单元213。
参数决定单元213从自适应声源代码本206中选择自适应声源延迟,该自适应声源延迟使从听觉加权单元212输出的编码失真最小,并将表示选择结果的自适应声源延迟代码(A)输出到复用单元214。其中,“自适应声源延迟”是指取出自适应声源向量的取出位置,其详细说明将后述。另外,参数决定单元213从固定声源代码本208中选择固定声源向量,该固定声源向量使从听觉加权单元212输出的编码失真最小,并将表示选择结果的固定声源向量代码(F)输出到复用单元214。此外,参数决定单元213从量化增益生成单元207中选择量化自适应声源增益和量化固定声源增益,该量化自适应声源增益和量化固定声源增益使从听觉加权单元212输出的编码失真最小,并将表示选择结果的量化声源增益代码(G)输出到复用单元214。
复用单元214接收从LSP量化单元203输出的量化LSP代码(L)与从参数决定单元213输出的自适应声源延迟代码(A)、固定声源向量代码(F)和量化声源增益代码(G),并将这些信息复用后,作为编码信息而输出。其中,假设第一编码单元102输出的编码信息为第一编码信息,第二编码单元108输出的编码信息为第二编码信息。
接着,以假设分配给量化LSP代码(L)的比特数为“8”而对LSP进行向量量化的情况为例,简单地说明LSP量化单元203决定量化LSP的处理。
LSP量化单元203具有LSP代码本,该LSP代码本中存储预先创建的256种LSP代码向量lsp(l)(i)。其中,l是附加在LSP代码向量的索引,取0~255的值。另外,LSP代码向量lsp(l)(i)为N维的向量,i取0~N-1的值。LSP量化单元203接收从LSP分析单元202输出的LSPα(i)。其中,LSPα(i)为N维的向量,i取0~N-1的值。
接着,LSP量化单元203通过式(3)求LSPα(i)与LSP代码向量lsp(l)(i)之间的均方误差er。
er = Σ i = 0 N - 1 ( α ( i ) - lsp ( l ) ( i ) ) 2 ···式(3)
接着,LSP量化单元203对每个l求均方误差er,并决定使均方误差er最小的l的值(lmin)。再者,LSP量化单元203将lmin作为量化LSP代码(L)而输出到复用单元214,并且将lsp(lmin)(i)作为量化LSP而输出到合成滤波器204。
如此,由LSP量化单元203求出的lsp(lmin)(i)就是“量化LSP”。
接着,使用图3说明参数决定单元213决定自适应声源延迟的处理。
在该图3中,缓冲区301为自适应声源代码本206中所具备的缓冲区,位置302为自适应声源向量的取出位置,向量303为取出后的自适应声源向量。另外,数值“41”和“296”与使取出位置302移动的范围的下限和上限对应。
在假设分配给表示自适应声源延迟的代码(A)的比特数为“8”时,使取出位置302移动的范围可设定为“256”的长度的范围(例如,41~296)。另外,也可任意地设定使取出位置302移动的范围。
参数决定单元213使取出位置302在所设定的范围内移动,并将取出位置302依序指示给自适应声源代码本206。接着,自适应声源代码本206使用参数决定单元213所指示的取出位置302,取出相当于帧长度的自适应声源向量303,并将取出后的自适应声源向量输出到乘法器209。接着,参数决定单元213在所有的取出位置302取出自适应声源向量303时,求从听觉加权单元212输出的编码失真,并决定使编码失真最小的取出位置302。
如此,由参数决定单元213求出的缓冲区的取出位置302就是“自适应声源延迟”。
接着,使用图4说明参数决定单元213决定固定声源向量的处理。另外,其中,以假设分配给固定声源向量代码(F)的比特数为“12”的情况为例进行说明。
在图4中,音轨401、音轨402和音轨403分别生成一个单位脉冲(振幅值为1)。另外,乘法器404、乘法器405和乘法器406分别对在音轨401~403被生成的单位脉冲附加极性。加法器407为将所生成的三个单位脉冲进行相加的加法器,向量408为由三个单位脉冲构成的“固定声源向量”。
能够生成单位脉冲的位置因各个音轨而不同,在图4中,各个音轨的结构分别为音轨401在{0,3,6,9,12,15,18,21}的八处中的一处、音轨402在{1,4,7,10,13,16,19,22}的八处中的一处、音轨403在{2,5,8,11,14,17,20,23}的八处中的一处,建立一个单位脉冲。
接着,所生成的单位脉冲分别被乘法器404~406附加极性,通过加法器407使三个单位脉冲相加,从而作为相加结果的固定声源向量408被构成。
在该例子中,按各个单位脉冲有8种位置,有正和负的两种极性,所以位置信息3比特以及极性信息1比特用于表现各个单位脉冲。因此,合计成12比特的固定声源代码本。参数决定单元213使三个单位脉冲的生成位置和极性移动,并将生成位置和极性依序指示给固定声源代码本208。接着,固定声源代码本208使用参数决定单元213所指示的生成位置和极性而构成固定声源向量408,并将构成后的固定声源向量408输出到乘法器210。接着,参数决定单元213对生成位置和极性的所有组合,求从听觉加权单元212输出的编码失真,并决定使编码失真最小的生成装置和极性的组合。接着,参数决定单元213将固定声源向量代码(F)输出到复用单元214,该固定声源向量代码(F)表示使编码失真最小的生成位置和极性的组合。
接着,以假设分配给量化声源增益代码(G)的比特数为“8”的情况为例,简单地说明参数决定单元213决定由量化增益生成单元207生成的量化自适应声源增益与固定声源增益的处理。量化增益生成单元207具有声源增益代码本,该声源增益代码本中存储预先创建的256种声源增益代码向量gain(k)(i)。其中,k是附加在声源增益代码向量的索引,取0~255的值。另外,声源增益代码向量gain(k)(i)为二维的向量,i取0~1的值。参数决定单元213将从0至255的k的值,依序指示给量化增益生成单元207。量化增益生成单元207使用参数决定单元213所指示的k,从声源增益代码本中选择声源增益代码向量gain(k)(i),将gain(k)(0)作为量化自适应声源增益而输出到乘法器209,并且将gain(k)(1)作为量化固定声源增益而输出到乘法器210。
如此,由量化增益生成单元207求出的gain(k)(0)就是“量化自适应声源增益”,gain(k)(1)则是“量化固定声源增益”。
参数决定单元213对所有的k求从听觉加权单元212输出的编码失真,并决定使编码失真最小的k的值(kmin)。接着,参数决定单元213将kmin作为量化声源增益代码(G)而输出到复用单元214。
接着,使用图5的方框图说明第一解码单元103、第一解码单元152以及第二解码单元153的内部结构。另外,这些解码单元的内部结构是相同的。
第一编码信息和第二编码信息的其中一方的编码信息被输出到复用分离单元501。所输入的编码信息被复用分离单元501分离为个别的代码(L、A、G和F)。分离后的量化LSP符号(L)被输出到LSP解码单元502,分离后的自适应声源延迟代码(A)被输出到自适应声源代码本505,分离后的量化声源增益代码(G)被输出到量化增益生成单元506,分离后的固定声源向量代码(F)被输出到固定声源代码本507。
LSP解码单元502从复用分离单元501所输出的量化LSP代码(L)中解码量化LSP,并将解码后的量化LSP输出到合成滤波器503。
自适应声源代码本505从缓冲区中取出在复用分离单元501所输出的自适应声源延迟代码(A)所指定的取出位置开始相当于一个帧的样本,并将取出后的向量作为自适应声源向量而输出到乘法器508。另外,自适应声源代码本505每当接收到从加法器510输出的驱动声源时,进行缓冲区的更新。
量化增益生成单元506对从复用分离单元501输出的量化声源增益代码(G)所指定的量化自适应声源增益和量化固定声源增益进行解码,并将量化自适应声源增益输出到乘法器508,将量化固定声源增益输出到乘法器509。
固定声源代码本507生成从复用分离单元501输出的固定声源向量代码(F)所指定的固定声源向量,并将其输出到乘法器509。
乘法器508将自适应声源向量与量化自适应声源增益相乘,并输出到加法器510。乘法器509将固定声源向量与量化固定声源增益相乘,并输出到加法器510。
加法器510将从乘法器508和509输出的、与增益相乘后的自适应声源向量和固定声源向量相加,从而生成驱动声源,并将驱动声源输出到合成滤波器503以及自适应声源代码本505。另外,自适应声源代码本505中所输入的驱动声源被存储于缓冲区。
合成滤波器503使用从加法器510输出的驱动声源与由LSP解码单元502进行了解码的滤波系数,进行滤波合成,并将合成信号输出到后处理单元504。
后处理单元504对从合成滤波器503输出的合成信号进行改善语音的主观质量的处理,例如共振峰增强或音调增强等的处理,或者进行改善静态噪声的主观质量的处理等,并将其作为解码信号而输出。其中,假设第一解码单元103以及第一解码单元152输出的解码信号为第一解码信号,第二解码单元153输出的解码信号为第二解码信号。接着,使用图6的方框图说明调整单元105以及调整单元155的内部结构。
存储单元603存储通过后述的学习方法而预先求得的调整用脉冲响应h(i)。
第一解码信号被输入到存储单元601。以下,将第一解码信号表示为y(i)。第一解码信号y(i)为N维的向量,i取n~n+N-1的值。其中,N相当于帧的长度。另外,n是位于各个帧的开头的样本,相当于N的整数倍。
存储单元601具备缓冲区,该缓冲区用于存储以前从频率变换单元104和154输出的第一解码信号。以下,将存储单元601中所具备的缓冲区表示为ybuf(i)。缓冲区ybuf(i)是长度N+W-1的缓冲区,i取0~N+W-2的值。其中,W相当于卷积单元602进行卷积时的窗的长度。存储单元601根据式(4),使用所输入的第一解码信号y(i)进行缓冲区的更新。
ybuf(i)=ybuf(i+N)(i=(0,…,W-2)    ···式(4)
ybuf(i+W-1)=y(i+n)(i=0,…,N-1)
通过根据式(4)的更新,在缓冲区ybuf(0)到ybuf(W-2)存储更新前的缓冲区的一部分ybuf(N)到ybuf(N+W-2),在缓冲区ybuf(W-1)到ybuf(N+W-2)存储所输入的第一解码信号y(n)~y(n+N-1)。接着,存储单元601将更新后的缓冲区ybuf(i)均输出到卷积单元602。
卷积单元602从存储单元601接收缓冲区ybuf(i),从存储单元603接收调整用脉冲响应h(i)。调整用脉冲响应h(i)为W维的向量,i取0~W-1的值。接着,卷积单元602通过式(5)的卷积,进行第一解码信号的调整,从而求调整后的第一解码信号。
ya ( n - D + i ) = Σ j = 0 W - 1 h ( j ) × ybuf ( W + i - j - 1 ) , ( i = 0 , . . . , N - 1 ) ···式(5)
如此,通过将缓冲区ybuf(i)到ybuf(i+W-1)与调整用脉冲响应h(0)~h(W-1)进行卷积,能够求调整后的第一解码信号ya(n-D+i)。调整用脉冲响应h(i)已学习了以通过进行调整而使调整后的第一解码信号与输入信号之间的误差小。其中,求出的调整后的第一解码信号是从ya(n-D)到ya(n-D+N-1)的信号,与输入到存储单元601中的第一解码信号y(n)~y(n+N-1)相比,在时间(样本数)上产生D的延迟。接着,卷积单元602输出求出的第一解码信号。
接着,说明通过学习预先求调整用脉冲响应h(i)的方法。首先,准备学习用的语音和音频信号,而将其输入到编码装置100。其中,假设学习用的语音和音频信号为x(i)。接着,对学习用的语音和音频信号进行编码和解码,将从频率变化单元104输出的第一解码信号y(i)按各个帧输入到调整单元105。接着,在存储单元601中,对各个帧进行根据式(4)的缓冲区的更新。将缓冲区中所存储的第一解码信号与未知的调整用脉冲响应h(i)进行卷积的信号以及学习用的语音和音频信号x(i)之间的、以帧为单位的均方误差E(n)由式(6)表示。
E ( n ) = Σ i = 0 N - 1 ( x ( n - D + i ) - Σ j = 0 W - 1 h ( i ) × ybuf ( W + i - j - 1 ) ) 2 ···式(6)
其中,N相当于帧的长度。另外,n是位于各个帧的开头的样本,为N的整数倍。此外,W相当于进行卷积时的窗的长度。
在帧的总数为R时,各个帧的均方误差E(n)的总和Ea由式(7)表示。
Ea = Σ k = 0 R - 1 E ( k × N ) = Σ k = 0 R - 1 Σ i = 0 N - 1 ( x ( k × N - D + i ) - Σ j = 0 W - j h ( j ) × ybuf k ( W + i - j - 1 ) ) 2 ···式(7)
其中,缓冲区ybufk(i)为帧k中的缓冲区ybuf(i)。缓冲区ybuf(i)按各个帧进行更新,所以缓冲区的内容因各个帧而不同。另外,假设x(-D)~x(-1)的值均为“0”。此外,假设从缓冲区ybuf(0)至ybuf(n+W-2)的初始值均为“0”。
为了求调整用脉冲响应h(i),求使式(7)的均方误差的总和Ea最小的h(i)。也就是说,对式(7)中的所有h(J),求满足δEa/δh(j)的h(j)。式(8)为能够从δEa/δh(j)=0导出的联立方程式。通过求满足式(8)的联立方程式的h(j),能够求已被学习的调整用脉冲响应h(i)。
Σ k = 0 R - 1 Σ i = 0 N - 1 x ( k × N - D + i ) × ybuf k ( W + i - J - 1 )
= ( Σ j = 0 W - 1 h ( j ) × ( Σ k = 0 R - 1 Σ i = 0 N - 1 ybuf k ( W + i - j - 1 ) × ybuf k ( W + i - J - 1 ) ) ) , ( J = 0 , . . . , W - 1 )
···式(8)
接着,通过式(9)定义W维的向量V以及W维的向量H。
V = Σ k = 0 R - 1 Σ i = 0 N - 1 x ( k × N - D + i ) × ybuf k ( i + W - 1 ) Σ k = 0 R - 1 Σ i = 0 N - 1 x ( k × N - D + i ) × ybuf k ( i + W - 2 ) . . . Σ k = 0 R - 1 Σ i = 0 N - 1 x ( k × N - D + i ) × ybuf k ( i ) H = h ( 0 ) h ( 1 ) . . . h ( W - 1 ) ···式(9)
另外,通过式(10)定义W×W的矩阵Y后,式(8)能够由式(11)表示。
Figure S2006800161859D00152
···式(10)
V=Y·H     ···式(11)
因此,为了求调整用脉冲响应h(i),通过式(12)求向量H。
H=Y-1·V   ···式(12)
如此,使用学习用的语音和音频信号进行学习,能够求调整用脉冲响应h(i)。已学习了调整用脉冲响应h(i),以通过对第一解码信号进行调整而使调整后的第一解码信号与输入信号之间的均方误差小。在调整单元105中,通过以上的方法而求出的调整用脉冲响应h(i)与从频率变换单元104输出的第一解码信号进行卷积,抵消编码装置100固有的特性,能够使第一解码信号与输入信号之间的均方误差更小。
接着,说明延迟单元106使输入信号延迟并输出的处理。延迟单元106将所输入的语音和音频信号存储于缓冲区。接着,延迟单元106从缓冲区提取语音和音频信号并将其作为输入信号而输出到加法器107,以使其与从调整单元105输出的第一解码信号在时间上取得同步。具体而言,在所输入的语音和音频信号为x(n)~x(n+N-1)时,从缓冲区提取在时间(样本数)上产生D的延迟的信号,并将提取后的信号x(n-D)~x(n-D+N-1)作为输入信号而输出到加法器107。
另外,在本实施方式中,以编码装置100具有两个编码单元的情况为例进行了说明,但编码单元的个数不限于此,也可具有三个以上的编码单元。
另外,在本实施方式中,以解码装置150具有两个解码单元的情况为例进行了说明,但解码单元的个数不限于此,也可具有三个以上的解码单元。
此外,在本实施方式中,以用脉冲形成固定声源代码本208所生成的固定声源向量的情况为例进行了说明,但本发明也可适用于形成固定声源向量的脉冲为扩频脉冲的情况,能够获得与本实施方式相同的作用和效果。在此,扩频脉冲不是指单位脉冲,而是指在连着几个样本上都具有特定形状的脉冲状的波形。
另外,在本实施方式中,对编码单元和解码单元是CELP类型的语音和音频编码和解码方法的情况进行了说明,但本发明也可适用于编码单元和解码单元是CELP类型以外的语音和音频编码和解码方法(例如,脉冲代码调制、预测编码、向量量化和声码器)的情况,能够获得与本实施方式相同的作用和效果。此外,本发明也可适用于语音和音频编码和解码方法因各个编码单元和解码单元而不同的情况,能够获得与本实施方式相同的作用和效果。
(实施方式2)
图7是表示本发明实施方式2的语音和音频发送装置的结构的方框图,该装置包含在上述的实施方式1中所说明的编码装置。
语音和音频信号701被输入装置702变换为电信号,并输出到A/D变换装置703。A/D变换装置703将从输入装置702输出的(模拟)信号变换为数字信号,并输出到语音和音频编码装置704。语音和音频编码装置704装载图1所示的编码装置100,对从A/D变换装置703输出的数字语音和音频信号进行编码,并将编码信息输出到RF调制装置705。RF调制装置705将从语音和音频编码装置704输出的编码信息变换为用于装载在电波等的传播媒体而送出的信号,并输出到发送天线706。发送天线706将从RF调制装置705输出的输出信号作为电波(RF信号)而送出。另外,在图中的RF信号707表示从发送天线706送出的电波(RF信号)。
图8是表示本发明实施方式2的语音和音频接收装置的结构的方框图,该装置包含在上述的实施方式1中所说明的解码装置。
RF信号801被接收天线802接收并输出到RF解调装置803。另外,在图中的RF信号801表示接收天线802所接收的电波,而若在传播路径中没有信号的衰减或噪声的重叠,就完全与RF信号707相同。
RF解调装置803从接收天线802所输出的RF信号中解调编码信息,并将其输出到语音和音频解码装置804。语音和音频解码装置804装载图1所示的解码装置150,从RF解调装置803输出的编码信息中解码语音和音频信号,并将其输出到D/A变换装置805。D/A变换装置805将从语音和音频解码装置804输出的数字语音和音频信号变换为模拟的电信号,并输出到输出装置806。输出装置806将电信号变换为空气振动并作为声波而输出,以使人类的耳朵能够听见。另外,在图中,参照标号807表示所输出的声波。
通过在无线通信系统中的基站装置和通信终端装置具备如上所述的语音和音频信号发送装置以及语音和音频信号接收装置,能够获得高质量的输出信号。
如此,根据本实施方式,将本发明的编码装置以及解码装置能够装载于语音和音频信号发送装置以及语音和音频信号接收装置。
本发明的编码装置以及解码装置不限于上述的实施方式1和2,也可通过各种变更而实施。
本发明的编码装置和解码装置也可装载于移动通信系统中的移动终端装置和基站装置,由此能够提供具有与上述同样的作用效果的移动终端装置和基站装置。
另外,其中,举例说明了以硬件构成本发明的情况,但本发明也可通过软件来实现。
本说明书基于在2005年5月11日申请的日本专利申请第2005-138151号。其内容全部包含于此。
工业实用性
本发明具有即使存在编码装置固有的特性,也可获得质量佳的解码语音信号的效果,并适合于对语音和音频信号进行编码而传输的通信系统中的编码装置和解码装置。

Claims (12)

1.一种编码装置,对输入信号进行可扩展编码,该装置包括:
第一编码单元,对所述输入信号进行编码而生成第一编码信息;
第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;
调整单元,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;
延迟单元,使所述输入信号延迟,以使其与调整后的第一解码信号同步;
加法单元,求延迟处理后的输入信号与所述调整后的第一解码信号之间的差分即残差信号;以及
第二编码单元,对所述残差信号进行编码而生成第二编码信息。
2.一种编码装置,对输入信号进行可扩展编码,该装置包括:
频率变换单元,通过对所述输入信号进行下采样,从而进行采样频率变换;
第一编码单元,对下采样后的输入信号进行编码而生成第一编码信息;
第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;
频率变换单元,通过对所述第一解码信号进行上采样,从而进行采样频率变换;
调整单元,通过将上采样后的第一解码信号与调整用的脉冲响应进行卷积,从而进行所述上采样后的第一解码信号的调整;
延迟单元,使所述输入信号延迟,以使其与调整后的第一解码信号同步;
加法单元,求延迟处理后的输入信号与所述调整后的第一解码信号之间的差分即残差信号;以及
第二编码单元,对所述残差信号进行编码而生成第二编码信息。
3.如权利要求1所述的编码装置,其中,
调整用的脉冲响应通过学习而求得。
4.一种解码装置,对权利要求1所述的编码装置所输出的编码信息进行解码,该解码装置包括:
第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;
第二解码单元,对所述第二编码信息进行解码而生成第二解码信号;
调整单元,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;
加法单元,将调整后的第一解码信号与所述第二解码信号相加;以及
信号选择单元,选择所述第一解码单元所生成的第一解码信号或者所述加法单元的相加结果中的一个并输出。
5.一种解码装置,对权利要求2所述的编码装置输出的编码信息进行解码,该解码装置包括:
第一解码单元,对所述第一编码信息进行解码而生成第一解码信号;
第二解码单元,对所述第二编码信息进行解码而生成第二解码信号;
频率变换单元,通过对所述第一解码信号进行上采样,从而进行采样频率变换;
调整单元,通过将上采样后的第一解码信号与调整用的脉冲响应进行卷积,从而进行所述上采样后的第一解码信号的调整;
加法单元,将调整后的第一解码信号与所述第二解码信号相加;以及
信号选择单元,选择所述第一解码单元所生成的第一解码信号或所述加法单元的相加结果中的一个并输出。
6.如权利要求4所述的解码装置,其中,
调整用的脉冲响应通过学习而求得。
7.一种基站装置,包括权利要求1所述的编码装置。
8.一种基站装置,包括权利要求4所述的解码装置。
9.一种通信终端装置,包括权利要求1所述的编码装置。
10.一种通信终端装置,包括权利要求4所述的解码装置。
11.一种编码方法,对输入信号进行可扩展编码,该方法包括:
第一编码步骤,对所述输入信号进行编码而生成第一编码信息;
第一解码步骤,对所述第一编码信息进行解码而生成第一解码信号;
调整步骤,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;
延迟步骤,使所述输入信号延迟,以使其与调整后的第一解码信号同步;
加法步骤,求延迟处理后的输入信号与所述调整后的第一解码信号之间的差分即残差信号;以及
第二编码步骤,对所述残差信号进行编码而生成第二编码信息。
12.一种解码方法,对通过权利要求11所述的编码方法编码的编码信息进行解码,该解码方法包括:
第一解码步骤,对所述第一编码信息进行解码而生成第一解码信号;
第二解码步骤,对所述第二编码信息进行解码而生成第二解码信号;
调整步骤,通过将所述第一解码信号与调整用的脉冲响应进行卷积,从而进行所述第一解码信号的调整;
加法步骤,将调整后的第一解码信号与所述第二解码信号相加;以及
信号选择步骤,选择所述第一解码步骤中所生成的第一解码信号或者所述加法步骤中的相加结果中的一个并输出。
CN2006800161859A 2005-05-11 2006-04-28 编码装置、解码装置和其方法 Expired - Fee Related CN101176148B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP138151/2005 2005-05-11
JP2005138151 2005-05-11
PCT/JP2006/308940 WO2006120931A1 (ja) 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法

Publications (2)

Publication Number Publication Date
CN101176148A true CN101176148A (zh) 2008-05-07
CN101176148B CN101176148B (zh) 2011-06-15

Family

ID=37396440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800161859A Expired - Fee Related CN101176148B (zh) 2005-05-11 2006-04-28 编码装置、解码装置和其方法

Country Status (7)

Country Link
US (1) US7978771B2 (zh)
EP (1) EP1881488B1 (zh)
JP (1) JP4958780B2 (zh)
CN (1) CN101176148B (zh)
BR (1) BRPI0611430A2 (zh)
DE (1) DE602006018129D1 (zh)
WO (1) WO2006120931A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575508A (zh) * 2014-06-10 2017-04-19 瑞内特有限公司 音频信号的数字封装
CN112786001A (zh) * 2019-11-11 2021-05-11 北京地平线机器人技术研发有限公司 语音合成模型训练方法、语音合成方法和装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
WO2008023682A1 (fr) * 2006-08-22 2008-02-28 Panasonic Corporation Décodeur de sortie pondéré, décodeur itératif et procédé de calcul de valeur de décision pondérée
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
CN101989429B (zh) * 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
AU2015200065B2 (en) * 2010-07-02 2016-10-20 Dolby International Ab Post filter, decoder system and method of decoding
CA3093517C (en) 2010-07-02 2021-08-24 Dolby International Ab Audio decoding with selective post filtering
JP5492139B2 (ja) * 2011-04-27 2014-05-14 富士フイルム株式会社 画像圧縮装置、画像伸長装置、方法、及びプログラム
KR102138320B1 (ko) * 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
JP6082703B2 (ja) * 2012-01-20 2017-02-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声復号装置及び音声復号方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1085466C (zh) * 1993-09-14 2002-05-22 株式会社金星社 图象解码器中包括半象素单元运动补偿装置的b帧处理装置
JPH1097295A (ja) 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
DE69840008D1 (de) * 1997-10-22 2008-10-23 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung für die Erzeugung von gestreuten Vektoren
EP2378517A1 (en) * 1998-06-09 2011-10-19 Panasonic Corporation Speech coding apparatus and speech decoding apparatus
JP2000305599A (ja) 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
AUPQ941600A0 (en) * 2000-08-14 2000-09-07 Lake Technology Limited Audio frequency response processing sytem
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
WO2005064594A1 (ja) * 2003-12-26 2005-07-14 Matsushita Electric Industrial Co., Ltd. 音声・楽音符号化装置及び音声・楽音符号化方法
JP3598111B2 (ja) * 2004-04-09 2004-12-08 三菱電機株式会社 広帯域音声復元装置
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575508A (zh) * 2014-06-10 2017-04-19 瑞内特有限公司 音频信号的数字封装
CN112786001A (zh) * 2019-11-11 2021-05-11 北京地平线机器人技术研发有限公司 语音合成模型训练方法、语音合成方法和装置
CN112786001B (zh) * 2019-11-11 2024-04-09 北京地平线机器人技术研发有限公司 语音合成模型训练方法、语音合成方法和装置

Also Published As

Publication number Publication date
CN101176148B (zh) 2011-06-15
WO2006120931A1 (ja) 2006-11-16
US7978771B2 (en) 2011-07-12
EP1881488B1 (en) 2010-11-10
US20090016426A1 (en) 2009-01-15
BRPI0611430A2 (pt) 2010-11-23
DE602006018129D1 (de) 2010-12-23
JP4958780B2 (ja) 2012-06-20
EP1881488A1 (en) 2008-01-23
JPWO2006120931A1 (ja) 2008-12-18
EP1881488A4 (en) 2008-12-10

Similar Documents

Publication Publication Date Title
CN101176148B (zh) 编码装置、解码装置和其方法
CN101615396B (zh) 语音编码设备、以及语音解码设备
CN100362568C (zh) 用于预测量化有声语音的方法和设备
EP1750254B1 (en) Audio/music decoding device and audio/music decoding method
JP3042886B2 (ja) ベクトル量子化器の方法および装置
US7840402B2 (en) Audio encoding device, audio decoding device, and method thereof
EP1339040B1 (en) Vector quantizing device for lpc parameters
CN101421780B (zh) 用于编码和解码时变信号的方法和设备
US20020111800A1 (en) Voice encoding and voice decoding apparatus
WO1990013112A1 (en) Voice encoder
CN101006495A (zh) 语音编码装置、语音解码装置、通信装置以及语音编码方法
EP2805324B1 (en) System and method for mixed codebook excitation for speech coding
CN101185123B (zh) 可扩展编码装置及可扩展编码方法
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
KR100819623B1 (ko) 음성 데이터의 처리 장치 및 처리 방법
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
JP2002169595A (ja) 固定音源符号帳及び音声符号化/復号化装置
Mazor et al. Adaptive subbands excited transform (ASET) coding
Shoham Low complexity speech coding at 1.2 to 2.4 kbps based on waveform interpolation
JP2005215502A (ja) 符号化装置、復号化装置、およびこれらの方法
JPH0455899A (ja) 音声信号符号化方式
JP2002229597A (ja) Lpcパラメータのベクトル量子化装置
Sadek et al. An enhanced variable bit-rate CELP speech coder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140717

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140717

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20170524

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110615

Termination date: 20180428

CF01 Termination of patent right due to non-payment of annual fee