CN111710342B - 编码装置、解码装置、编码方法、解码方法及程序 - Google Patents

编码装置、解码装置、编码方法、解码方法及程序 Download PDF

Info

Publication number
CN111710342B
CN111710342B CN202010460132.8A CN202010460132A CN111710342B CN 111710342 B CN111710342 B CN 111710342B CN 202010460132 A CN202010460132 A CN 202010460132A CN 111710342 B CN111710342 B CN 111710342B
Authority
CN
China
Prior art keywords
frequency
signal
low
encoded
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010460132.8A
Other languages
English (en)
Other versions
CN111710342A (zh
Inventor
S.纳吉塞蒂
Z.X.刘
江原宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to CN202010460132.8A priority Critical patent/CN111710342B/zh
Publication of CN111710342A publication Critical patent/CN111710342A/zh
Application granted granted Critical
Publication of CN111710342B publication Critical patent/CN111710342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明的编码装置包括:生成将包含语音或音频的输入信号的规定频率以下的低频信号的信号编码所得的第1编码信号和低频解码信号的第1编码单元;基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号的第2编码单元;以及将所述第1编码信号和所述高频编码信号进行复用而输出编码信号的第1复用单元。所述第2编码单元计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号之中的高频非音调信号的能量比率,作为高频编码信号输出。

Description

编码装置、解码装置、编码方法、解码方法及程序
本申请是申请日为2015年3月23日、申请号为201580003573.2、发明名称为“编码装置、解码装置、编码方法、解码方法及程序”的发明专利申请的分案申请。
技术领域
本发明涉及将语音信号和音频信号(以下,设为语音信号等。)编码的装置、解码的装置。
背景技术
将语音信号等以低比特率压缩的语音编码技术,是实现移动通信中的电波等的有效利用的重要技术。而且,近年来对通话语音的质量提高的期待不断高涨,一直期望实现现场感强的通话服务。为了实现这样的通话服务,将频带宽的语音信号等以高比特率编码即可。可是,该方法与电波和频带的有效利用矛盾。
作为将频带宽的信号以低比特率高质量地编码的方法,有将输入信号的频谱分割为低频部分和高频部分的2个频谱,通过高频频谱复制低频频谱并与其置换、即将高频频谱用低频频谱替代,使整体的比特率降低的技术(专利文献1)。该技术在低频频谱的编码上分配很多比特而高质量地编码,另一方面,将高频频谱复制编码后的低频频谱作为基本的处理,以较少的比特分配进行编码。
在直接采用专利文献1的技术的情况下,因低频频谱中出现的峰值性强的信号被直接复制到高频中,产生如钟声响起那样可听见的噪声,主观性的质量下降。因此,有将适当地调整了低频频谱的动态范围所得的频谱作为高频频谱的技术(专利文献2)。
现有技术文献
专利文献
专利文献1:特表2001-521648号公报
专利文献2:国际公开第2005/111568号
发明内容
根据专利文献2的技术,动态范围考虑构成低频频谱的全体要素而确定。可是,语音信号等的频谱由峰值性较强的分量、即振幅较大的分量(音调分量)和峰值性较弱的分量、即振幅较小的分量(非音调分量)构成,根据专利文献2的技术,由于成为组合了两者的整体下的评价,所以未必可得到最好的结果。
本发明的一方式,通过使整体的比特率降低,并且将音调分量和非音调分量分离、独立而用于编码,提供能够编码、解码更加高质量的语音信号等的装置。
本发明的编码装置包括:第1编码单元,生成将语音或音频输入信号的规定频率以下的低频信号编码而生成第1编码信号、和将第1编码信号解码的低频解码信号;第2编码单元,基于低频解码信号,将比低频信号高频的信号编码而生成高频编码信号;以及第1复用单元,将第1编码信号和高频编码信号进行复用而输出编码信号,第2编码单元采用以下结构:计算高频信号的噪声分量即高频噪声分量和由低频解码信号生成的高频解码信号的高频非音调分量的能量比率,作为高频编码信号输出。
再有,这些概括性的并且具体的方式,可以通过系统、方法、集成电路、计算机程序、或记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意的组合来实现。
根据本发明的一方式的编码装置和解码装置,能够编码、解码更加高质量的语音信号等。
根据本发明的一个方面,提供了一种编码装置,包括:第1编码单元(102),对来自语音或音频输入信号的、频率低于或等于规定频率的低频信号编码以生成第1编码信号,以及对第1编码信号解码以生成低频解码信号;第2编码单元(106),基于低频解码信号,对频率高于低频信号的频率的、来自语音或音频输入信号的高频信号编码以生成高频编码信号;以及第1复用单元(103),将第1编码信号和高频编码信号进行复用以生成并输出编码信号,其中,该第2编码单元(106)计算作为高频信号的噪声分量的高频噪声分量和根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率,其中,该高频编码信号包括关于计算的能量比率的信息。
根据本发明的一个方面,提供了一种解码装置,该编码装置接收第1编码信号和高频编码信号,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码装置包括:分离单元(401),分离第1编码信号和高频编码信号;第1解码单元(402),对第1编码信号解码,以生成低频解码信号;以及第2解码单元(403),对高频编码信号解码,以通过使用低频解码信号生成宽带解码信号,其中,该高频编码信号包含关于作为噪声分量的高频噪声分量和从低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率的信息,其中,该第2解码单元(403)通过参照高频编码信号中包含的关于能量比率的信息,来调整作为低频解码信号的非音调分量的低频非音调信号的振幅,或者调整从低频解码音频信号生成的高频解码音频信号的高频非音调分量的振幅。
根据本发明的一个方面,提供了一种解码装置,该编码装置接收第1编码信号、高频编码信号和频带能量编码信号,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码装置包括:第1解码单元(402),对该第1编码信号解码,以生成低频解码信号;第2解码单元(403),对该高频编码信号解码,以通过使用低频解码信号生成宽带解码信号;以及第3解码单元(501),对频带能量编码信号解码,以生成量化频带能量,其中,该第2解码单元包括:分离单元(503,603),从低频解码信号分离作为低频解码信号的非音调分量的低频非音调信号和作为低频解码信号的音调分量的低频音调信号;第1频带扩展单元(504),通过使用对高频编码信号解码所得的滞后信息,将低频非音调信号复制为高频以生成高频非音调信号;第1缩放单元(505),通过使用对高频编码信号解码所得的比例因子来调整高频非音调信号的振幅;音调信号能量估计单元(510),根据高频非音调信号的能量和量化频带能量,估计高频音调信号的能量;第1结合单元(506),将低频非音调信号和高频非音调信号相结合以生成宽带非音调信号;第2频带扩展单元(508),通过使用滞后信息,将低频音调信号复制为高频以生成高频音调信号;第2缩放单元(511),基于高频音调信号的能量,调整高频音调信号的振幅;第2结合单元(509),将低频音调信号和调整了振幅的高频音调信号相结合以生成宽带音调信号;以及加法运算单元(507),将宽带非音调信号和宽带音调信号进行加法运算以生成宽带解码信号,其中,该滞后信息是关于特定频带的位置信息,在该特定频带中高频信号和低频音调信号之间的相关性为最大,其中,该比例因子是关于高频噪声分量和高频非音调信号之间的能量比率的信息,该高频噪声分量为对应于滞后信息的高频信号的噪声分量。
根据本发明的一个方面,提供了一种终端装置,包括如上所述的编码装置。
根据本发明的一个方面,提供了一种终端装置,包括如上所述的解码装置。
根据本发明的一个方面,提供了一种编码方法,包括:对来自语音或音频输入信号的、频率低于或等于规定频率的低频信号编码以生成第1编码信号;对第1编码信号解码以生成低频解码信号;基于低频解码信号,对频率高于低频信号的频率的、来自语音或音频输入信号的高频信号编码以生成高频编码信号;计算作为高频信号的噪声分量的高频噪声分量和根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率;将第1编码信号和高频编码信号进行复用以生成并输出编码信号,该高频编码信号包括关于计算的能量比率的信息。
根据本发明的一个方面,提供了一种用于第1编码信号和高频编码信号的解码方法,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码方法包括:分离第1编码信号和高频编码信号,对第1编码信号进行解码,以生成低频解码信号;以及对高频编码信号进行解码,以通过使用低频解码信号生成宽带解码信号,其中,该高频编码信号包含关于作为噪声分量的高频噪声分量和从低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率的信息,通过参照高频编码信号中包含的关于能量比率的信息,来调整作为低频解码信号的非音调分量的低频非音调信号的振幅,或者调整从低频解码音频信号生成的高频解码音频信号的高频非音调分量的振幅。
根据本发明的一个方面,提供了一种用于第1编码信号、高频编码信号和频带能量编码信号的解码方法,该第1编码信号表示来自语音或音频信号的、频率低于或等于规定频率的低频信号,该高频编码信号表示频率高于低频信号的频率的、来自语音或音频信号的高频信号,该解码方法包括:对第1编码信号进行解码,以生成低频解码信号;对高频编码信号进行解码,以通过使用低频解码信号生成宽带解码信号;对频带能量编码信号进行解码,以生成量化频带能量;从低频解码信号分离作为低频解码信号的非音调分量的低频非音调信号和作为低频解码信号的音调分量的低频音调信号;通过使用对高频编码信号解码所得的滞后信息,将低频非音调信号复制为高频以生成高频非音调信号;通过使用对高频编码信号解码所得的比例因子,调整高频非音调信号的振幅;根据高频非音调信号的能量和量化频带能量,估计高频音调信号的能量;将低频非音调信号和高频非音调信号相结合以生成宽带非音调信号;通过使用滞后信息,将该低频音调信号复制为高频以生成高频音调信号;基于高频音调信号的能量,调整高频音调信号的振幅;将低频音调信号和调整了振幅的高频音调信号相结合以生成宽带音调信号;以及将宽带非音调信号和宽带音调信号进行加法运算以生成宽带解码信号,其中,该滞后信息是关于特定频带的位置信息,在该特定频带中高频信号和低频音调信号之间的相关性为最大,其中,该比例因子是关于高频噪声分量和高频非音调信号之间的能量比率的信息,该高频噪声分量为对应于滞后信息的高频信号的噪声分量。
根据本发明的一个方面,提供了一种程序,使处理器执行如上所述的编码方法。
根据本发明的一个方面,提供了一种程序,使处理器执行如上所述的解码方法。
附图说明
图1是本发明的编码装置的整体结构图。
图2是本发明的实施方式1中的编码装置的第2层编码单元的结构图。
图3是本发明的实施方式2中的编码装置的第2层编码单元的结构图。
图4是本发明的实施方式中的另一编码装置的整体结构图。
图5是本发明的解码装置的整体结构图。
图6是本发明的实施方式3中的解码装置的第2层解码单元的结构图。
图7是本发明的实施方式4中的解码装置的第2层解码单元的结构图。
图8是本发明的实施方式中的另一解码装置的整体结构图。
图9是本发明的实施方式中的另一编码装置的整体结构图。
图10是本发明的实施方式中的另一解码装置的整体结构图。
具体实施方式
以下,参照附图说明本发明的实施方式的结构和动作。再有,本发明的对编码装置输入的输入信号、和从解码装置输出的输出信号,除了仅指狭义的语音信号的情况,还包含频带更宽的音频信号的情况,而且,也包含这些信号混合的情况。
(实施方式1)
图1是表示实施方式1的语音信号等的编码装置的结构的框图。这里,作为例子说明编码信号具有多个层组成的层结构的情况,即进行分层编码(可扩展编码)的情况。作为包含分层编码以外的例子,在后述的图4中说明。图1所示的编码装置100由下采样单元101、第1层编码单元102、复用单元103、第1层解码单元104、延迟单元105、第2层编码单元106构成。此外,在复用单元103中连接着未图示的天线。
下采样单元101从输入信号生成采样率低的信号,作为规定的频率以下的低频信号输出到第1层编码单元102。
第1层编码单元102是构成第1编码单元的要素的一方式,将低频信号编码。作为编码的例子,可列举CELP编码和变换编码。编码的低频信号,作为用作第1编码信号的低频编码信号被输出到第1层解码单元104和复用单元103。
第1层解码单元104是共同构成第1编码单元的要素的一方式,将低频编码信号解码,生成低频解码信号。然后,第1层解码单元104将低频解码信号S1输出到第2层编码单元106。
另一方面,延迟单元105使输入信号延迟规定的时间。该延迟时间用于校正在下采样单元101、第1层编码单元102、和第1层解码单元104中产生的时间延迟。延迟单元105将延迟的输入信号S2输出到第2层编码单元106。
第2层编码单元106是第2编码单元的一方式,基于由第1层解码单元104生成的低频解码信号S1,将输入信号S2之中规定的频率以上的高频信号编码而生成高频编码信号。第2层编码单元中输入的低频解码信号S1、输入信号S2被施加MDCT等的变频后输入。然后,第2层编码单元106将高频编码信号输出到复用单元103。第2层编码单元106的细节,将后述。
复用单元103将低频编码信号和高频编码信号进行复用而生成编码信号,将它通过未图示的天线发送到解码装置。
图2是表示本实施方式中的第2层编码单元106的结构的框图。第2层编码单元106由噪声加法运算单元201、分离单元202、频带扩展单元203、噪声分量能量计算单元204(第1计算单元)、增益计算单元205(第2计算单元)、能量计算单元206、复用单元207、频带扩展单元208构成。
噪声加法运算单元201对从第1层解码单元104输入的低频解码信号S1,相加噪声信号。再有,噪声信号是指具有随机的性质的信号,例如是信号强度的振幅相对时间轴或频率轴不规则地上下变动的信号。噪声信号的生成,可以每次基于随机数生成,也可以将预先生成的噪声信号(例如,白噪声、高斯噪声、粉红噪声等)保存在存储器等的存储装置中,调用该噪声信号并输出。此外,噪声信号不限于一个,也可以根据规定的条件,从多个噪声信号之中选择一个并输出。
将输入信号编码时,若可分配的比特数少,则仅有小部分的频率分量能量化,有主观质量劣化的问题,但通过在噪声加法运算单元201中相加噪声,将未被量化就为零的分量用噪声信号填充,能够期待缓和劣化的效果。
再有,噪声加法运算单元201是任意的结构。然后,噪声加法运算单元201将相加了噪声信号的低频解码信号输出到分离单元202。
分离单元202将相加了噪声信号的低频解码信号分离为非音调分量即低频非音调信号和音调分量即低频音调信号。这里,音调分量是指振幅比规定的阈值大的分量、或用脉冲量化器量化过的分量。此外,非音调分量是指具有规定的阈值以下的振幅的分量、或未用脉冲量化器量化而为零的分量。
在使用规定的阈值区分音调分量和非音调分量的情况下,对于构成低频解码信号的分量,以振幅是否比规定的阈值大来分离。在以是否用脉冲量化器进行了量化来区分音调分量和非音调分量的情况下,由于相当于规定的阈值为零的情况,所以通过从噪声加法运算单元201中相加了噪声的低频解码信号中减去低频解码信号S1,能够生成低频音调信号。
然后,分离单元202将低频非音调信号输出到频带扩展单元203,将低频音调信号输出到频带扩展单元208。
频带扩展单元208将输入信号S2的高频信号作为目标,搜索使用于频带扩展所生成的低频音调信号之间的相关为最大的低频音调信号的特定的频带。搜索也可以通过从预先准备的特定的候选位置之中选择使所述相关最大的候选来进行。用于频带扩展所生成的低频音调信号,可以直接使用由分离单元202分离出的(量化过的)低频音调信号,也可以使用进行了平滑或归一化的音调信号。
然后,频带扩展单元208将表示搜索出的特定的频带的位置的信息、即确定用于扩展频带的生成的低频频谱的位置(频率)的信息、也就是滞后信息输出到复用单元207和频带扩展单元203。再有,滞后信息不必与所有的扩展频带对应的滞后信息齐备,也可以仅传送与一部分扩展频带对应的滞后信息。例如,也可以对于通过频带扩展而生成的子带之中的一部分,将滞后信息编码,剩余的部分不编码,将在解码装置侧使用滞后信息生成的频谱折叠地生成。
此外,频带扩展单元208通过从输入信号S2的高频信号之中选择振幅大的信号,仅使用该选择出的分量进行所述相关的计算,削减相关运算的计算量,同时将选择的分量的频率位置信息作为高频音调分量频率位置信息输出到噪声分量能量计算单元204(第1计算单元)。
频带扩展单元203以用滞后信息确定的特定的频带的位置为基准,截取低频非音调信号作为高频非音调信号,将该高频非音调信号输出到增益计算单元205。
噪声分量能量计算单元204使用高频音调分量频率位置信息,计算输入信号S2的高频信号的噪声分量即高频噪声分量的能量,输出到增益计算单元205。具体地说,通过从输入信号S2的高频部分整体的能量中减去高频部分之中高频音调分量频率位置的分量的能量,求不是高频音调分量的分量能量,将它作为高频噪声分量能量输出到增益计算单元205。
增益计算单元205计算从频带扩展单元203输出的高频非音调信号的能量,计算该能量和从噪声分量能量计算单元204输出的高频噪声分量的能量之间的比率,将它作为比例因子输出到复用单元207。
能量计算单元206计算输入信号S2的每个子带的能量。例如,能够计算将输入信号S2分割为子带的情况下的、子带内的频谱的平方和。例如,能够按下式定义。
其中,X是MDCT系数,b是子带的号,Epsilon是用于标量量化的常数。
然后,能量计算单元206将表示求得的量化频带能量的大小的指标作为量化频带能量输出到复用单元207。
复用单元207将滞后信息、比例因子和量化频带能量编码,将它进行复用。然后,将通过复用得到的信号作为高频编码信号输出。再有,复用单元207和复用单元103可以单独地设置,也可以作为一体设置。
这样,在本实施方式中,在增益计算单元205(第2计算单元)中,求输入信号的高频信号之中的高频非音调(噪声)分量的能量和由低频解码信号生成的高频解码信号之中的高频非音调(噪声)信号的能量的比率,所以具有能够更准确地再现解码信号中的非音调(噪声)分量的能量的效果。
即,能够更准确地再现比音调分量小、容易出现误差的非音调分量的能量,解码信号中的非音调分量的能量稳定。此外,使用频带能量和非音调分量的能量计算的音调分量的能量也能够更准确地再现。然后,能够以较少的比特数编码高频编码信号。
(实施方式2)
接着,使用图3说明本发明的实施方式2中的编码装置的结构。再有,与实施方式1同样,本实施方式中的编码装置100整体的结构具有图1的结构。
图3是表示本实施方式中的第2层编码单元106的结构的框图。与实施方式1的第2层编码单元106的不同在于,噪声加法运算单元和分离单元的位置关系相反,并具有分离单元302、噪声加法运算单元301。
分离单元302将低频解码信号分离为非音调分量即低频非音调信号和音调分量即低频音调信号。与实施方式1中说明的同样,分离方法将规定的阈值为基准,按振幅的大小进行分离。也可以将阈值设定为零。
噪声加法运算单元301对从分离单元302输出的低频非音调信号,相加噪声信号。为了对已经具有振幅的分量不相加噪声信号,也可以参照低频解码信号S1。
再有,对实施方式1、2说明了使用分层编码的例子,但实施方式1、2也能够适用于采用了分层编码以外的情况。图4和图9是其另一编码装置110、610的例子。首先说明图4的编码装置110。
图4所示的编码装置110由时间-变频单元111、第1编码单元112、复用单元113、频带能量归一化单元114、第2编码单元115构成。
时间-变频单元111对输入信号使用MDCT等进行变频。
频带能量归一化单元114对施加了变频的输入信号即输入频谱,对每个规定的频带进行频带能量的计算、量化和编码,将频带能量编码信号输出到复用单元113。此外,频带能量归一化单元114使用量化的频带能量,计算对第1编码单元和第2编码单元分配的比特分配信息B1和B2,分别输出到第1编码单元112和第2编码单元115。此外,频带能量归一化单元114进而以量化的频带能量进行各频带的输入频谱的归一化,将归一化输入频谱S2输出到第1编码单元112和第2编码单元115。
第1编码单元112基于输入的比特分配信息B1,对包含规定的频率以下的低频信号的归一化输入频谱S2,进行第1编码。然后,第1编码单元112将编码的结果生成的第1编码信号输出到复用单元113。此外,第1编码单元112将编码的过程中得到的低频解码信号S1输出到第2编码单元115。
第2编码单元115对归一化输入频谱S2之中第1编码单元112无法编码的每个部分,进行第2编码。第2编码单元115可采用图2、图3中说明的第2层编码单元106的结构。
接着,说明图9的编码装置610。图9所示的编码装置610由时间-变频单元611、第1编码单元612、复用单元613、第2编码单元614构成。
时间-变频单元611对输入信号使用MDCT等进行变频。
第1编码单元612对施加了频率变化的输入信号即输入频谱,对每个规定的频带进行频带能量的计算和量化,将频带能量编码信号输出到复用单元613。此外,第1编码单元612使用量化的频带能量,计算对第1编码信号和第2编码信号分配的比特分配信息,基于比特分配信息,对包含规定的频率以下的低频信号的归一化输入频谱S2,进行第1编码。然后,第1编码单元612将第1编码信号输出到复用单元613,同时将第1编码信号的解码信号之中的、低频分量即低频解码信号输出到第2编码单元614。这里,也可以对于将输入信号以量化频带能量进行了归一化的信号进行第1编码。该情况下,第1编码信号的解码信号为以量化频带能量进行了解归一化的信号。此外,第1编码单元612将分配给第2编码信号的比特分配信息和高频的量化频带能量信息输出到第2编码单元614。
第2编码单元614对输入频谱S2之中第1编码单元612无法编码的每个部分,进行第2编码。第2编码单元614可采用在图2、3中说明的第2层编码单元106的结构。再有,在图2、图3中没有明确记载,但比特分配信息被输入到将滞后信息编码的频带扩展单元208、和将比例因子编码的增益计算单元。此外,在图2、图3中,示出了使用输入信号计算频带能量并进行量化的能量计算单元206,而在图9中,由于在第1编码单元612中进行该处理,所以不是必要的。
(实施方式3)
图5是表示实施方式3的语音信号解码装置的结构的框图。这里,编码信号是从具有多个层组成的层结构的编码装置发送的信号,作为例子说明将该编码信号解码的解码装置。再有,对于没有层结构的例子,用图8说明。
图5所示的解码装置400由分离单元401、第1层解码单元402、第2层解码单元403构成。此外,在分离单元401上,连接着未图示的天线。
分离单元401将通过未图示的天线输入的编码信号分离为用于第1编码信号的低频编码信号和高频编码信号。分离单元401将低频编码信号输出到第1层解码单元402,将高频编码信号输出到第2层解码单元403。
第1层解码单元402是第1解码单元的一方式,将低频编码信号解码,生成低频解码信号S1。作为第1层解码单元402的解码的例子,可列举CELP解码。第1层解码单元402将低频解码信号输出到第2层解码单元403。
第2层解码单元403是第2解码单元的一方式,将高频编码信号解码,使用低频解码信号生成宽带解码信号并输出。第2层解码单元403的细节,将后述。
然后,低频解码信号、和/或宽带解码信号通过未图示的放大器和扬声器被再生。
图6是表示本实施方式中的第2层解码单元403的结构的框图。第2层解码单元403由解码和分离单元501、噪声加法运算单元502、分离单元503、频带扩展单元504、缩放单元505、结合单元506、加法运算单元507、频带扩展单元508、结合单元509、音调信号能量估计单元510、缩放单元511构成。
解码和分离单元501将高频编码信号解码,分离为量化频带能量A、比例因子B、和滞后信息C。再有,分离单元401与解码和分离单元501可以单独地设置,也可以作为一体设置。
噪声加法运算单元502对从第1层解码单元402输入的低频解码信号S1相加噪声信号。噪声信号使用与编码装置100的噪声加法运算单元201中相加的噪声信号相同的噪声信号。然后,噪声加法运算单元502将相加了噪声信号的低频解码信号输出到分离单元503。
分离单元503从相加了噪声信号的低频解码信号中,分离非音调分量和音调分量,分别作为低频非音调信号和低频音调信号输出。分离为低频非音调信号和低频音调信号的方法,与编码装置100的分离单元202中说明的方法是同样的。
频带扩展单元504使用滞后信息C,将特定的频带的低频非音调信号复制为高频而生成高频非音调信号。
缩放单元505通过对频带扩展单元504中生成的高频非音调信号乘以比例因子B,调整高频非音调信号的振幅。
然后,在结合单元506中,将低频非音调信号和由缩放单元505调整了振幅的高频非音调信号相结合,生成宽带非音调信号。
另一方面,分离单元503中分离出的低频音调信号被输入到频带扩展单元508。然后,与频带扩展单元504相同,频带扩展单元508使用滞后信息C,将特定的频带的低频音调信号复制为高频而生成高频音调信号。
音调信号能量估计单元510计算调整了从缩放单元505输入的振幅的高频非音调信号的能量,同时将从量化频带能量A的值减去高频非音调信号的能量来求高频音调信号的能量。然后,将高频非音调信号的能量和高频音调信号的能量之比输出到缩放单元511。
缩放单元511通过将高频音调信号乘以高频非音调信号的能量和高频音调信号的能量之比,调整高频音调信号的振幅。
然后,由结合单元509将低频音调信号和调整了振幅的高频音调信号相结合,生成宽带音调信号。
最后,由加法运算单元507将宽带非音调信号和宽带音调信号相加,生成、输出宽带解码信号。
这样,在本实施方式中,具有使用低频量化频谱,以较少的比特生成非音调分量,以比例因子调整以具有适当的能量,使用该调整过的非音调分量的能量,调整高频音调信号的能量的结构,所以用较少的信息量编码、传输、解码音乐信号等,能够适当地再现高频的非音调分量的能量。此外,通过使用量化频带能量信息和非音调分量的能量信息来确定音调分量的能量,合适的音调分量的能量也能够再现。
(实施方式4)
接着,使用图7说明本发明的实施方式4中的解码装置的结构。再有,与实施方式1同样,本实施方式中的解码装置400整体的结构具有图4的结构。
图7是表示本实施方式中的第2层解码单元403的结构的框图。与实施方式1和实施方式2之间的关系同样,与实施方式3的第2层解码单元403的不同在于,噪声加法运算单元和分离单元的位置关系相反,具有分离单元603、噪声加法运算单元602。再有,在图7中,解码和分离单元501省略记载。
分离单元603将低频解码信号分离为非音调分量即低频非音调信号和音调分量即低频音调信号。
噪声加法运算单元602对于从分离单元603输出的低频非音调信号,相加噪声信号。
再有,对于实施方式3、4说明了使用分层编码的例子,但实施方式3、4也能够适用于采用了分层编码以外的情况。图8和图10是其另一解码装置410、620的例子。首先,说明图8所示的解码装置410。
图8所示的解码装置410由分离单元411、第1解码单元412、第2解码单元413、频率-时间转换单元414、频带能量解归一化单元415、合成单元116构成。
分离单元411将通过未图示的天线输入的编码信号分离为第1编码信号、高频编码信号和频带能量编码信号。分离单元411将第1编码信号输出到第1解码单元412,将高频编码信号输出到第2解码单元413,将频带能量编码信号输出到频带能量解归一化单元415。
频带能量解归一化单元415将频带能量编码信号解码,生成量化频带能量。频带能量解归一化单元415基于量化频带能量,计算对第1解码单元和第2解码单元的比特分配信息B1和B2,并分别输出。此外,频带能量解归一化单元415将生成的量化频带能量乘以从合成单元416输入的归一化宽带解码信号,进行解归一化,生成最终的宽带解码信号,输出到频率-时间转换单元414。
第1解码单元412根据比特分配信息B1,将第1编码信号解码,生成低频解码信号S1和高频解码信号。第1解码单元412将低频解码信号输出到第2解码单元413,将高频解码信号输出到合成单元416。
第2解码单元413根据比特分配信息B2,将高频编码信号解码,使用低频解码信号生成宽带解码信号并输出。第2解码单元413可采用与图6、图7中说明的第2层解码单元403相同的结构。
合成单元416将由第1解码单元解码的高频解码信号加入到从第2解码单元输入的宽带解码信号中,生成归一化宽带解码信号,输出到频带能量解归一化单元415。
然后,从频带能量解归一化单元415输出的宽带解码信号由频率-时间转换单元414转换为时域的信号,通过未图示的放大器和扬声器被再生。
接着,说明图10所示的解码装置620。图10是其另一解码装置620的例子。图10所示的解码装置620由第1解码单元621、第2解码单元622、合成单元623,频率-时间转换单元624构成。
第1解码单元621输入通过未图示的天线输入的编码信号(包含第1编码信号、高频编码信号和频带能量编码信号),首先将频带能量分离、解码。将解码的频带能量的高频部分作为高频频带能量(A)输出到第2解码单元622。接着,第1解码单元621基于解码的频带能量计算比特分配信息,将第1编码信号分离、解码。该解码处理也可以包含采用了所述解码的频带能量的解归一化处理。将解码的第1解码信号的低频部分作为低频解码信号输出到第2解码单元622。接着,第1解码单元621基于所述比特分配信息,将高频编码信号分离、解码。解码的高频解码信号包含比例因子(B)和滞后信息(C),将它们输出到第2解码单元622。此外,第1解码单元621将所述第1解码信号的高频部分作为高频解码信号输出到合成单元623。也有高频解码信号为零的情况。
第2解码单元622使用从第1解码单元621输入的、低频解码信号、解码的量化频带能量、比例因子、滞后信息生成宽带解码信号并输出。第2解码单元622也可以采用与图6、图7中说明的第2层解码单元403相同的结构。
合成单元623将由第1解码单元621解码的高频解码信号加入到从第2解码单元622输入的宽带解码信号中,生成宽带解码信号,由频率-时间转换单元624转换为时域的信号,通过未图示的放大器和扬声器被再生。
根据本公开的一方面,提供了编码装置,包括:第1编码单元,将语音或音频输入信号的规定频率以下的低频信号编码而生成第1编码信号,将所述第1编码信号解码而生成低频解码信号;第2编码单元,基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号;以及第1复用单元,将所述第1编码信号和所述高频编码信号进行复用而输出编码信号,所述第2编码单元计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,作为高频编码信号输出。
根据本公开的一方面,上述编码装置还包括:能量计算单元,计算所述语音或音频输入信号的能量并作为量化频带能量输出,所述第1复用单元将所述量化频带能量、所述第1编码信号和所述高频编码信号复用并输出。
根据本公开的一方面,所述第2编码单元包括:分离单元,将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;第1频带扩展单元,将使所述高频信号和所述低频音调信号之间的相关为最大的特定的频带的位置信息作为滞后信息输出;第2频带扩展单元,将与所述滞后信息对应的所述低频非音调信号作为高频非音调信号输出;第1计算单元,从与所述滞后信息对应的所述高频信号,计算噪声分量即高频噪声分量的能量;第2计算单元,从所述高频噪声分量和所述高频非音调信号的能量比率计算所述比率,作为比例因子输出;以及第2复用单元,将所述滞后信息和所述比例因子进行复用并作为高频编码信号输出。
根据本公开的一方面,所述第2编码单元还包括噪声加法运算单元,在所述低频解码信号中相加噪声信号。
根据本公开的一方面,所述第2编码单元还包括:噪声加法运算单元,在所述分离单元输出的所述低频非音调信号中相加噪声信号。
根据本公开的另一方面,提供了解码装置,其是被输入了在编码装置中将语音或音频输入信号的规定频率以下的低频信号编码所得的第1编码信号、和将比所述低频信号高频的信号编码所得的高频编码信号的解码装置,包括:分离单元,分离为所述第1编码信号和所述高频编码信号;第1解码单元,将所述第1编码信号解码而生成低频解码信号;以及第2解码单元,将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号,所述高频编码信号包含噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,所述第2解码单元参照解码的所述比率,调整所述低频解码信号的非音调分量即低频非音调信号的振幅。
根据本公开的另一方面,提供了解码装置,其是被输入了在编码装置中将语音或音频输入信号的规定频率以下的低频信号编码所得的第1编码信号、将比所述低频信号高频的信号编码所得的高频编码信号、以及频带能量编码信号的解码装置,包括:第1解码单元,将所述第1编码信号解码而生成低频解码信号;第2解码单元,将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号;以及第3解码单元,将所述频带能量编码信号解码而生成量化频带能量,所述第2解码单元包括:分离单元,将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;第1频带扩展单元,使用将所述高频编码信号解码所得的滞后信息,将所述低频非音调信号复制为高频而生成高频非音调信号;第1缩放单元,使用将所述高频编码信号解码所得的比例因子来调整所述高频非音调信号的振幅;音调信号能量估计单元,从所述高频非音调信号的能量和所述量化频带能量,估计高频音调信号的能量;第1结合单元,将所述低频非音调信号和所述高频非音调信号相结合而生成宽带非音调信号;第2频带扩展单元,使用所述滞后信息,将所述低频音调信号复制为高频而生成高频音调信号;第2缩放单元,基于所述高频音调信号的能量,调整所述高频音调信号的振幅;第2结合单元,将所述低频音调信号和调整了振幅的所述高频音调信号相结合而生成宽带音调信号;以及加法运算单元,将所述宽带非音调信号和所述宽带音调信号进行加法运算而生成宽带解码信号,所述滞后信息是使高频信号和低频音调信号之间的相关为最大的特定的频带的位置信息,所述比例因子是对应于所述滞后信息的高频信号的噪声分量即高频噪声分量和高频非音调信号的能量比率。
根据本公开的另一方面,其中,所述第2解码单元还包括:噪声加法运算单元,在所述低频解码信号中相加噪声信号。
根据本公开的另一方面,其中,所述第2解码单元还包括:噪声加法运算单元,在从所述分离单元输出的所述低频非音调信号中相加噪声信号。
根据本公开的又一方面,提供了终端装置,具有上述的编码装置。
根据本公开的又一方面,提供了终端装置,具有上述的解码装置。
根据本公开的又一方面,提供了编码方法,包括以下步骤:将语音或音频输入信号的规定频率以下的低频信号编码而生成第1编码信号;将所述第1编码信号解码而生成低频解码信号;基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号;计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率;将所述第1编码信号和包含所述比率的高频编码信号进行复用并输出编码信号。
根据本公开的一方面,上述解码方法还包括:计算所述语音或音频输入信号的能量并作为量化频带能量输出;将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;将使所述高频信号和所述低频音调信号之间的相关为最大的特定的频带的位置信息作为滞后信息输出;将与所述滞后信息对应的所述低频非音调信号作为高频非音调信号输出;从与所述滞后信息对应的所述高频信号,计算噪声分量即高频噪声分量的能量;计算所述高频噪声分量和所述高频非音调信号的能量比率并作为比例因子输出。
根据本公开的又一方面,提供了解码方法,包括以下步骤:对于在编码装置中将语音或音频输入信号的规定频率以下的低频信号编码所得的第1编码信号、和将比所述低频信号高频的信号编码所得的高频编码信号,分离为所述第1编码信号和所述高频编码信号,将所述第1编码信号进行解码而生成低频解码信号;以及将所述高频编码信号进行解码,使用所述低频解码信号生成宽带解码信号,所述高频编码信号包含噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,生成解码的所述比率,参照所述比率,调整所述低频解码信号的非音调分量即低频非音调信号的振幅。
根据本公开的又一方面,提供了解码方法,包括以下步骤:对于在编码装置中将语音或音频输入信号的规定频率以下的低频信号进行了编码的第1编码信号、将比所述低频信号高频的信号进行了编码的高频编码信号、以及频带能量编码信号,将所述第1编码信号解码而生成低频解码信号;将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号;将所述频带能量编码信号解码而生成量化频带能量;将所述低频解码信号分离为所述低频解码信号的非音调分量即低频非音调信号和所述低频解码信号的音调分量即低频音调信号;使用将所述高频编码信号解码所得的滞后信息,将所述低频非音调信号复制为高频而生成高频非音调信号;使用将所述高频编码信号解码所得的比例因子,调整所述高频非音调信号的振幅;从所述高频非音调信号的能量和所述量化频带能量,估计高频音调信号的能量;将所述低频非音调信号和所述高频非音调信号相结合而生成宽带非音调信号;使用所述滞后信息,将所述低频音调信号复制为高频而生成高频音调信号;基于所述高频音调信号的能量,调整所述高频音调信号的振幅;将所述低频音调信号和调整了振幅的所述高频音调信号相结合而生成宽带音调信号;以及将所述宽带非音调信号和所述宽带音调信号进行加法运算而生成宽带解码信号,所述滞后信息是使高频信号和低频音调信号之间的相关为最大的特定的频带的位置信息,所述比例因子是对应于所述滞后信息的高频信号的噪声分量即高频噪声分量和高频非音调信号的能量比率。
根据本公开的又一方面,提供了程序,使处理器执行以下处理:将语音或音频的输入信号的规定频率以下的低频信号编码而生成第1编码信号的处理;将所述第1编码信号解码而生成低频解码信号的处理;基于所述低频解码信号,将比所述低频信号高频的信号编码而生成高频编码信号的处理;计算所述高频信号的噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率的处理;以及将所述第1编码信号和包含所述比率的高频编码信号进行复用并输出编码信号的处理。
根据本公开的又一方面,提供了程序,使处理器执行以下处理:对于在编码装置中将语音或音频的输入信号的规定频率以下的低频信号编码所得的第1编码信号、和将比所述低频信号高频的信号编码所得的高频编码信号,分离为所述第1编码信号和所述高频编码信号的处理;将所述第1编码信号解码而生成低频解码信号的处理;将所述高频编码信号解码,使用所述低频解码信号生成宽带解码信号的处理;所述高频编码信号包含噪声分量即高频噪声分量和由所述低频解码信号生成的高频解码信号的高频非音调分量的能量比率,生成解码的所述比率,参照所述比率来调整所述低频解码信号的非音调分量即低频非音调信号的振幅的处理。
(总结)
以上,用实施方式1到4说明了本发明的编码装置和解码装置。本发明的编码装置和解码装置既可以是主板和半导体元件为代表的半成品和部件级别的形式,也可以是包含终端装置和基站装置的完成品级别的形式的概念。在本发明的解码装置和编码装置为半成品和部件级别的形式的情况下,通过与天线、DA/AD转换器、放大器、扬声器、和话筒等组合成为完成品级别的形式。
再有,从图1到图10的框图表示专用地设计的硬件的结构和动作(方法),同时也包含通过在通用的硬件中安装执行本发明的动作(方法)的程序,由处理器执行来实现的情况。作为通用的硬件的电子计算机,例如可列举个人计算机、智能手机等的各种移动信息终端、和移动电话等。
此外,专用地设计的硬件不限于移动电话和固定电话等的完成品级别(消费电子),也包含主板和半导体元件等半成品和部件级别。
再有,作为在基站中使用本发明的情况的例子,可列举在基站中进行变更语音编码方式的编码转换的情况。再有,基站是包含在通信线路的中途存在的各种节点的概念。
工业实用性
本发明的编码装置和解码装置可应用于与语音信号和音频信号的纪录、传输、再生有关的设备。
标号说明
100,110,610编码装置
101下采样单元
102第1层编码单元
103,113,613复用单元
104第1层解码单元
105延迟单元
106第2层编码单元
201,301噪声加法运算单元
202,302分离单元
203频带扩展单元
204噪声分量能量计算单元(第1计算单元)
205增益计算单元(第2计算单元)
206 能量计算单元
207 复用单元
208 频带扩展单元
400,410,620解码装置
401,411分离单元
402第1层解码单元
403第2层解码单元
501解码和分离单元
502,602噪声加法运算单元
503,603分离单元
504 频带扩展单元
505 缩放单元
506 结合单元
507 加法运算单元
508 频带扩展单元
509 结合单元
510 音调信号能量估计单元
511缩放单元(scaling unit)
112,612第1编码单元
115,614第2编码单元
412,621第1解码单元
413,622第2解码单元

Claims (13)

1.一种编码装置,包括:
第1编码单元(102),对来自音频输入信号的、频率低于或等于规定频率的低频信号编码以生成第1编码信号,以及对第1编码信号解码以生成低频解码信号;
第2编码单元(106),基于低频解码信号,对频率高于低频信号的频率的、来自音频输入信号的高频信号编码以生成高频编码信号;以及
第1复用单元(103),将第1编码信号和高频编码信号进行复用以生成并输出编码信号,
其中,所述第2编码单元(106)计算作为高频信号的噪声分量的高频噪声分量和由频带扩展单元根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率,其中,所述高频编码信号包括关于计算的能量比率的信息,其中所述高频解码信号的高频非音调分量是具有小于或等于预定阈值的振幅的高频解码信号的分量。
2.如权利要求1所述的编码装置,还包括:
能量计算单元(206),计算音频输入信号的能量,并将计算的能量作为量化频带能量输出,
其中,所述第1复用单元(103)将量化频带能量、第1编码信号和高频编码信号进行复用并输出编码信号。
3.一种解码装置,所述解码装置接收第1编码信号和高频编码信号,所述第1编码信号表示来自音频信号的、频率低于或等于规定频率的低频信号,所述高频编码信号表示频率高于低频信号的频率的、来自音频信号的高频信号,所述解码装置包括:
分离单元(401),分离第1编码信号和高频编码信号;
第1解码单元(402),对第1编码信号解码,以生成低频解码信号;以及
第2解码单元(403),对高频编码信号解码,以通过使用低频解码信号生成宽带解码信号,
其中,所述高频编码信号包含关于作为噪声分量的高频噪声分量和由频带扩展单元根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率的信息,其中所述高频解码信号的高频非音调分量是具有小于或等于预定阈值的振幅的高频解码信号的分量,
其中,所述第2解码单元(403)通过参照高频编码信号中包含的关于能量比率的信息,来调整作为低频解码信号的非音调分量的低频非音调信号的振幅,或者调整所述高频解码信号的高频非音调分量的振幅,其中所述低频解码信号的非音调分量是具有小于或等于预定阈值的振幅的低频解码信号的分量。
4.如权利要求3所述的解码装置,其中,所述第2解码单元(403)还包括噪声加法单元(502),其将噪声信号加到低频解码信号。
5.如权利要求3所述的解码装置,其中,所述第2解码单元(403)还包括噪声加法单元(602),其将噪声信号加到从分离单元(603)输出的低频非音调信号。
6.一种解码装置,所述解码装置接收编码信号,所述编码信号包括第1编码信号、高频编码信号和频带能量编码信号,所述第1编码信号表示来自音频信号的、频率低于或等于规定频率的低频信号,所述高频编码信号表示频率高于低频信号的频率的、来自音频信号的高频信号,所述解码装置包括:
分离单元(401),用于从所述编码信号分离所述第1编码信号和所述高频编码信号;
第1解码单元(402),对所述第1编码信号解码,以生成低频解码信号;
第2解码单元(403),对所述高频编码信号解码,以通过使用低频解码信号生成宽带解码信号;以及
第3解码单元(501),对频带能量编码信号解码,以生成量化频带能量,
其中,所述第2解码单元包括:
分离单元(503,603),从低频解码信号分离作为低频解码信号的非音调分量的低频非音调信号和作为低频解码信号的音调分量的低频音调信号,其中所述低频解码信号的非音调分量是具有小于或等于预定阈值的振幅的低频解码信号的分量;
第1频带扩展单元(504),通过使用对高频编码信号解码所得的滞后信息,将低频非音调信号复制为高频以生成高频非音调信号;
第1缩放单元(505),通过使用对高频编码信号解码所得的比例因子来调整高频非音调信号的振幅;
音调信号能量估计单元(510),根据高频非音调信号的能量和量化频带能量,估计高频音调信号的能量;
第1结合单元(506),将低频非音调信号和高频非音调信号相结合以生成宽带非音调信号;
第2频带扩展单元(508),通过使用滞后信息,将低频音调信号复制为高频以生成高频音调信号;
第2缩放单元(511),基于高频音调信号的能量,调整高频音调信号的振幅;
第2结合单元(509),将低频音调信号和调整了振幅的高频音调信号相结合以生成宽带音调信号;以及
加法运算单元(507),将宽带非音调信号和宽带音调信号进行加法运算以生成所述宽带解码信号,
其中,所述滞后信息是关于特定频带的位置信息,在所述特定频带中高频信号和低频音调信号之间的相关性为最大,
其中,所述比例因子是关于高频噪声分量和高频非音调信号之间的能量比率的信息,所述高频噪声分量为对应于滞后信息的高频信号的噪声分量。
7.一种终端装置,包括如权利要求1所述的编码装置。
8.一种终端装置,包括如权利要求3所述的解码装置。
9.一种编码方法,包括:
对来自音频输入信号的、频率低于或等于规定频率的低频信号编码以生成第1编码信号;
对第1编码信号解码以生成低频解码信号;
基于低频解码信号,对频率高于低频信号的频率的、来自音频输入信号的高频信号编码以生成高频编码信号;
计算作为高频信号的噪声分量的高频噪声分量和由频带扩展处理根据低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率,其中所述高频解码信号的高频非音调分量是具有小于或等于预定阈值的振幅的高频解码信号的分量;以及
将第1编码信号和高频编码信号进行复用以生成并输出编码信号,所述高频编码信号包括关于计算的能量比率的信息。
10.一种用于第1编码信号和高频编码信号的解码方法,所述第1编码信号表示来自音频信号的、频率低于或等于规定频率的低频信号,所述高频编码信号表示频率高于低频信号的频率的、来自音频信号的高频信号,所述解码方法包括:
分离第1编码信号和高频编码信号,
对第1编码信号进行解码,以生成低频解码信号;
对高频编码信号进行解码,以通过使用低频解码信号生成宽带解码信号,
其中,所述高频编码信号包含关于作为噪声分量的高频噪声分量和由频带扩展处理从低频解码信号生成的高频解码信号的高频非音调分量之间的能量比率的信息,其中所述高频解码信号的高频非音调分量是具有小于或等于预定阈值的振幅的高频解码信号的分量;以及
通过参照高频编码信号中包含的关于能量比率的信息,来调整作为低频解码信号的非音调分量的低频非音调信号的振幅,或者调整所述高频解码信号的高频非音调分量的振幅,其中所述低频解码信号的非音调分量是具有小于或等于预定阈值的振幅的低频解码信号的分量。
11.一种用于解码编码信号的解码方法,所述编码信号包括第1编码信号、高频编码信号和频带能量编码信号,所述第1编码信号表示来自音频信号的、频率低于或等于规定频率的低频信号,所述高频编码信号表示频率高于低频信号的频率的、来自音频信号的高频信号,所述解码方法包括:
从所述编码信号分离所述第1编码信号和所述高频编码信号;
对第1编码信号进行解码,以生成低频解码信号;
对高频编码信号进行解码,以通过使用低频解码信号生成宽带解码信号;
对频带能量编码信号进行解码,以生成量化频带能量;
从低频解码信号分离作为具有小于或等于预定阈值的振幅的低频解码信号的非音调分量的低频非音调信号和作为低频解码信号的音调分量的低频音调信号;
通过使用对高频编码信号解码所得的滞后信息,将低频非音调信号复制为高频以生成高频非音调信号;
通过使用对高频编码信号解码所得的比例因子,调整高频非音调信号的振幅;
根据高频非音调信号的能量和量化频带能量,估计高频音调信号的能量;
将低频非音调信号和高频非音调信号相结合以生成宽带非音调信号;
通过使用滞后信息,将所述低频音调信号复制为高频以生成高频音调信号;
基于高频音调信号的能量,调整高频音调信号的振幅;
将低频音调信号和调整了振幅的高频音调信号相结合以生成宽带音调信号;以及
将宽带非音调信号和宽带音调信号进行加法运算以生成宽带解码信号,
其中,所述滞后信息是关于特定频带的位置信息,在所述特定频带中高频信号和低频音调信号之间的相关性为最大,以及
其中,所述比例因子是关于高频噪声分量和高频非音调信号之间的能量比率的信息,所述高频噪声分量为对应于滞后信息的高频信号的噪声分量。
12.一种存储介质,在其上存储了计算机程序,所述计算机程序使处理器执行如权利要求9所述的编码方法。
13.一种存储介质,在其上存储了计算机程序,所述计算机程序使处理器执行如权利要求10或11所述的解码方法。
CN202010460132.8A 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序 Active CN111710342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010460132.8A CN111710342B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201461972722P 2014-03-31 2014-03-31
US61/972,722 2014-03-31
JP2014-153832 2014-07-29
JP2014153832 2014-07-29
CN202010460132.8A CN111710342B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序
PCT/JP2015/001601 WO2015151451A1 (ja) 2014-03-31 2015-03-23 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
CN201580003573.2A CN105874534B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580003573.2A Division CN105874534B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序

Publications (2)

Publication Number Publication Date
CN111710342A CN111710342A (zh) 2020-09-25
CN111710342B true CN111710342B (zh) 2024-04-16

Family

ID=54239798

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580003573.2A Active CN105874534B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序
CN202010460132.8A Active CN111710342B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580003573.2A Active CN105874534B (zh) 2014-03-31 2015-03-23 编码装置、解码装置、编码方法、解码方法及程序

Country Status (11)

Country Link
US (3) US10269361B2 (zh)
EP (3) EP3550563B1 (zh)
JP (1) JPWO2015151451A1 (zh)
KR (1) KR102121642B1 (zh)
CN (2) CN105874534B (zh)
BR (1) BR112016019838B1 (zh)
ES (1) ES2975073T3 (zh)
MX (1) MX367639B (zh)
PL (2) PL3128513T3 (zh)
RU (1) RU2689181C2 (zh)
WO (1) WO2015151451A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112016019838B1 (pt) * 2014-03-31 2023-02-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória
BR112017000629B1 (pt) 2014-07-25 2021-02-17 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschug E.V. aparelho de codificação de sinal de áudio e método de codificação de sinal de áudio
PT3174050T (pt) * 2014-07-25 2019-02-04 Fraunhofer Ges Forschung Aparelho de codificação de sinal de áudio, dispositivo de descodificação de sinal de áudio, e seus métodos
JP6691440B2 (ja) * 2016-06-21 2020-04-28 日本電信電話株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体
CN113192523B (zh) * 2020-01-13 2024-07-16 华为技术有限公司 一种音频编解码方法和音频编解码设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
JP2008058727A (ja) * 2006-08-31 2008-03-13 Toshiba Corp 音声符号化装置
CN101371295A (zh) * 2006-01-18 2009-02-18 Lg电子株式会社 用于编码和解码信号的设备和方法
CN102208188A (zh) * 2011-07-13 2011-10-05 华为技术有限公司 音频信号编解码方法和设备
CN102334159A (zh) * 2009-02-26 2012-01-25 松下电器产业株式会社 编码装置、解码装置及其方法
AU2014201331A1 (en) * 2009-06-29 2014-03-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
CN105874534B (zh) * 2014-03-31 2020-06-19 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
CN101656077B (zh) * 2004-05-14 2012-08-29 松下电器产业株式会社 音频编码装置、音频编码方法以及通信终端和基站装置
KR101213840B1 (ko) 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
CA2603246C (en) * 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US8612216B2 (en) * 2006-01-31 2013-12-17 Siemens Enterprise Communications Gmbh & Co. Kg Method and arrangements for audio signal encoding
US8239191B2 (en) * 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
US8990073B2 (en) 2007-06-22 2015-03-24 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8401845B2 (en) * 2008-03-05 2013-03-19 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
ES2642906T3 (es) * 2008-07-11 2017-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
TR201808500T4 (tr) * 2008-12-15 2018-07-23 Fraunhofer Ges Forschung Ses kodlayıcısı ve bant-genişliği genişletme kod-çözücüsü.
ES2400661T3 (es) * 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
JP5493655B2 (ja) 2009-09-29 2014-05-14 沖電気工業株式会社 音声帯域拡張装置および音声帯域拡張プログラム
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8306493B2 (en) 2010-04-13 2012-11-06 Newport Media, Inc. Pilot based adaptation for FM radio receiver
RU2527735C2 (ru) * 2010-04-16 2014-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы
CA2803269A1 (en) 2010-07-05 2012-01-12 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, device, program, and recording medium
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
RU2648595C2 (ru) * 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
BR112013033900B1 (pt) * 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
CN106847295B (zh) * 2011-09-09 2021-03-23 松下电器(美国)知识产权公司 编码装置和编码方法
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
EP2954516A1 (en) * 2013-02-05 2015-12-16 Telefonaktiebolaget LM Ericsson (PUBL) Enhanced audio frame loss concealment
JP2014153832A (ja) 2013-02-06 2014-08-25 Seiko Instruments Inc 携帯型電子機器用のカバー
EP3010018B1 (en) * 2013-06-11 2020-08-12 Fraunhofer Gesellschaft zur Förderung der Angewand Device and method for bandwidth extension for acoustic signals
US9615185B2 (en) * 2014-03-25 2017-04-04 Bose Corporation Dynamic sound adjustment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN101371295A (zh) * 2006-01-18 2009-02-18 Lg电子株式会社 用于编码和解码信号的设备和方法
JP2008058727A (ja) * 2006-08-31 2008-03-13 Toshiba Corp 音声符号化装置
CN102334159A (zh) * 2009-02-26 2012-01-25 松下电器产业株式会社 编码装置、解码装置及其方法
AU2014201331A1 (en) * 2009-06-29 2014-03-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
CN102208188A (zh) * 2011-07-13 2011-10-05 华为技术有限公司 音频信号编解码方法和设备
CN105874534B (zh) * 2014-03-31 2020-06-19 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序

Also Published As

Publication number Publication date
JPWO2015151451A1 (ja) 2017-04-13
MX367639B (es) 2019-08-29
CN105874534B (zh) 2020-06-19
KR102121642B1 (ko) 2020-06-10
EP3128513B1 (en) 2019-05-15
CN105874534A (zh) 2016-08-17
CN111710342A (zh) 2020-09-25
PL3550563T3 (pl) 2024-07-08
US20160336017A1 (en) 2016-11-17
BR112016019838A2 (zh) 2017-08-15
RU2689181C2 (ru) 2019-05-24
US11232803B2 (en) 2022-01-25
US20190251979A1 (en) 2019-08-15
EP4376304A3 (en) 2024-07-24
EP4376304A2 (en) 2024-05-29
EP3550563A1 (en) 2019-10-09
BR112016019838B1 (pt) 2023-02-23
US20220130402A1 (en) 2022-04-28
RU2016138694A3 (zh) 2018-08-27
MX2016010595A (es) 2016-11-29
US10269361B2 (en) 2019-04-23
KR20160138373A (ko) 2016-12-05
WO2015151451A1 (ja) 2015-10-08
EP3128513A4 (en) 2017-03-29
EP3128513A1 (en) 2017-02-08
EP3550563B1 (en) 2024-03-06
PL3128513T3 (pl) 2019-11-29
EP3550563C0 (en) 2024-03-06
RU2016138694A (ru) 2018-05-07
ES2975073T3 (es) 2024-07-03

Similar Documents

Publication Publication Date Title
US11521625B2 (en) Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
US11232803B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JP2017138616A (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
US9230551B2 (en) Audio encoder or decoder apparatus
CN111370008B (zh) 解码装置、编码装置、解码方法、编码方法、终端装置、以及基站装置
JP6957444B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant