CN102257567A - 音响信号处理装置、音响编码装置及音响解码装置 - Google Patents

音响信号处理装置、音响编码装置及音响解码装置 Download PDF

Info

Publication number
CN102257567A
CN102257567A CN2010800036821A CN201080003682A CN102257567A CN 102257567 A CN102257567 A CN 102257567A CN 2010800036821 A CN2010800036821 A CN 2010800036821A CN 201080003682 A CN201080003682 A CN 201080003682A CN 102257567 A CN102257567 A CN 102257567A
Authority
CN
China
Prior art keywords
qmf
sequence
coefficient
acoustic signal
coefficient sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800036821A
Other languages
English (en)
Other versions
CN102257567B (zh
Inventor
石川智一
则松武志
张国成
周欢
钟海珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN102257567A publication Critical patent/CN102257567A/zh
Application granted granted Critical
Publication of CN102257567B publication Critical patent/CN102257567B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种音响信号处理装置,能够以较低的运算量实现诸如时间规整处理或者频率调制处理那样的音响信号处理。音响信号处理装置使用规定的调整系数对输入音响信号序列进行变换,该音响信号处理装置具有:滤波器组(2601),使用QMF(正交镜像滤波器)分析滤波器将输入音响信号序列变换为QMF系数序列;以及调整部(2602),根据规定的调整系数来调整QMF系数序列。

Description

音响信号处理装置、音响编码装置及音响解码装置
技术领域
本发明涉及对音响信号及声音信号(以下称为音响信号)进行数字信号处理的音响信号处理装置。
背景技术
关于在时间轴上对音响信号进行压缩及拉伸的技术有相位声码器(Phase Vocoder)技术。非专利文献1公开的相位声码器装置对已数字化的音响信号适用快速傅立叶变换(FFT:Fast Fourier Transform)或者短时间傅立叶变换(STFT:Short Time Fourier Transform),在频域中实现时间方向的规整处理(时间拉伸处理)以及基音变换处理(基音位移处理)等。
基音也被称为基音频率,是指声音的高低。时间拉伸处理是指不改变音响信号的基音,而对音响信号的时间长度进行规整的处理。基音位移处理是频率调制处理的示例,是不改变音响信号的时间长度,而改变音响信号的基音的处理。基音位移处理也被称为基音拉伸处理。
在单纯地变更音响信号的再现速度的情况下,音响信号的时间长度和基音双方都被改变。另一方面,也存在如下情况:不改变基音,而变更已进行了时间规整的音响信号的再现速度,由此音响信号的时间长度恢复原状,只有音响信号的基音被变换。因此,存在基音位移处理包括时间拉伸处理的情况。相反,也存在时间拉伸处理包括基音位移处理的情况。这样,时间拉伸处理和基音位移处理具有对应的关系。
时间拉伸处理不需改变对输入音响信号进行FFT而得到的频谱信号的局部频谱特性,即可改变输入音响信号的持续时间(再现时间)。其原理如下所述。
(a)执行时间拉伸处理的音响信号处理装置,首先按照固定时间间隔来分割输入音响信号,并按照每固定时间间隔(例如每1024样本)进行分析。此时,音响信号处理装置在分割的时间单位内,按照比分割时间单位更短的每时间间隔(例如128样本)使进行重叠(overlap),而对输入音响信号进行处理。在此,将使进行重叠的时间间隔称为跳跃尺寸(Hop Size)。
在图30A中,输入信号的跳跃尺寸是Ra。并且,通过相位声码器处理而计算出的输出音响信号也是将时间间隔按照固定样本数量进行重叠而得到的音响信号。在图30B中,输出音响信号的跳跃尺寸是Rs。在进行时间拉伸的情况下是Rs>Ra,在进行时间压缩的情况下是Rs<Ra。在此,以进行时间拉伸的情况(Rs>Ra)为例进行说明。按照式1所示定义时间拉伸的比例r。
[数式1]
r = R a R s (式1)
(b)如上所述,按照每固定时间间隔进行分割并且重叠的状态下的各个时间块信号,大多是在时间上具有相干性(Coherent)的模式(pattern)。因此,音响信号处理装置对各个时间块信号实施频率变换。代表性的是,音响信号处理装置对输入的各个时间块信号进行频率变换,并调整相位信息。然后,音响信号处理装置将频域的信号恢复为时域的信号,并作为输出的时间块信号。
按照上述的原理,过去的经典性的相位声码器装置利用STFT进行向频域的变换,在进行频域的各种调整处理之后,进行短时间傅立叶逆变换。并且,由此实现时间变换和基音位移处理。下面,对基于STFT的处理进行说明。
(1)分析
首先,音响信号处理装置按照以跳跃尺寸Ra进行重叠而得到的每时间块单位来执行窗口长度L的分析窗口函数。具体地讲,音响信号处理装置利用FFT将各个块变换到频域。例如,根据式2计算点uRa(u∈N)的频率特性。
[数式2]
Figure BDA0000069940820000022
(式2)
其中,h(n)表示分析窗口函数,k表示频率索引,其范围是k=0,…,L-1。并且,根据下式计算WL mK
[数式3]
W L mk = e - j 2 πmk / L
(2)调整
将这样计算出的频率信号的相位信息即调整前的相位信息设为φ(uRa,k)。在调整相位中,音响信号处理装置利用下述的方法计算频率索引为k的频率成分ω(uRa,k)。
首先,为了计算频率成分ω(uRa,k),音响信号处理装置根据式3计算连续的分析点即(u-1)Ra和uRa的相位信号的增加量Δφk u
[数式4]
Figure BDA0000069940820000032
(式3)
为了按照时间间隔Ra来计算增加量Δφk u,音响信号处理装置根据式4计算各个频率成分ω(uRa,k)。
[数式5]
Figure BDA0000069940820000033
(式4)
然后,音响信号处理装置根据式5计算合成点uRs的相位。
ψ(uRs,k)=ψ((u-1)Rs,k)+Rs·ω(uRa,k)  (式5)
(3)再合成
音响信号处理装置针对所有的频率索引,计算利用FFT计算出的频率信号的振幅|X(uRa,k)|和调整后的相位ψ(uRs,k)。并且,音响信号处理装置利用逆FFT变换,将频率信号再合成为时间信号。根据式6来执行再合成。
[数式6]
x ^ ( uR s , m ) = Σ k = 0 L - 1 | X ( uR a , k ) | · e jψ ( uR s , k ) · W L - mk · h ( k ) (式6)
音响信号处理装置将再合成后的时间块信号插入到合成点uRs。并且,音响信号处理装置对被合成输出的信号、和在前一个块中被合成输出的信号进行重叠相加,由此生成时间拉伸信号。与前一个块的合成输出的重叠相加如式7所示。
[数式7]
y ( uR s + m ) = y ( uR s + m ) + x ^ ( uR s , m ) ( m = 0 , . . . , L - 1 ) (式7)
对分析点(u+1)Ra也执行上述的3个步骤。并且,对所有输入信号块反复执行上述的3个步骤。结果,音响信号处理装置能够计算按照拉伸比Rs/Ra进行时间拉伸得到的信号。
另外,为了对进行时间拉伸后的信号的振幅方向的调制(时间上的摆动)进行校正,窗口函数h(m)需要满足功率补偿(power-complemntary)条件。
关于与时间拉伸对应的处理有基音位移处理。基音位移处理是不改变信号的经过时间,而改变信号的基音的方法。改变数字音响信号的基音的简单方法是对输入信号进行采集(resample,重新取样)。基音位移处理能够与时间拉伸处理进行组合。例如,音响信号处理装置也能够在时间拉伸处理之后,按照原来的输入信号的时间长度进行重新取样。
另一方面,也存在直接原样计算基音位移处理的方法。计算基音位移处理的方法通常存在产生比时间轴的重新取样处理更差的副作用的情况,但在本发明中不做详细说明。
另外,时间拉伸的处理存在根据拉伸比而成为时间压缩的处理的情况。因此,这里时间拉伸的表述是指时间规整,包括时间压缩。
现有技术文献
非专利文献
非专利文献1:Improved Phase Vocoder Time-Scale Modification ofAudio(IEEE Trans ASP Vol.7 No.3,May 1989)
发明概要
发明要解决的问题
但是,如上所述,由FFT和逆FFT构成的经典性的相位声码器装置需要设定更精细的跳跃尺寸,来实现高质量的时间拉伸。因此,结果是需要实施庞大次数的FFT和逆FFT,使得运算量增大。
并且,存在音响信号处理装置在时间拉伸处理之后,执行与时间拉伸处理不同的处理的情况。在这种情况下,音响信号处理装置需要将时域的信号变换为分析用的区域的信号。例如,作为这种分析用的区域,有在时间轴方向和频率轴方向双方具有成分的QMF(Quadrature Mirror Filter:正交镜像滤波器)区域。QMF区域由于在时间轴方向和频率轴方向双方具有成分,所以有时也被称为合成复数区域、合成频域、子带(sub-band)区域或者频率子带区域等。
通常,复数QMF滤波器组是将时域的信号变换为在时间轴和频率轴双方具有成分的合成复数区域的一种方法。代表性的是,在Spectral BandReplication(SBR:频带复制)技术、Parametric Stereo(PS:参量立体声)、以及Spatial Audio Coding(SAC:空间音频编码)等基于参量的音频编码方法中采用QMF滤波器组。在这些编码中采用的QMF滤波器组具有按照每个子带,对利用复数的值表述的频域的信号进行2倍过度取样的特性。这是用于实现对子带频域的信号进行处理,而不产生折返畸变的方法。
下面进行稍微详细的说明。QMF分析滤波器组将输入信号的实数值的离散时间信号x(n)变换为子带频域的复数信号sk(n)。根据式(8)计算sk(n)。
[数式8]
s k ( n ) = Σ l = 0 L - 1 x ( M · n - l ) p ( l ) e j π M ( k + 0.5 ) ( l + α ) (式8)
其中,p(n)表示具有低通特性的L-1次原型滤波器的脉冲响应。α表示相位参数,M表示子带数。并且,k表示子带的索引,k=0,1,…,M-1。
在此,将由QMF分析滤波器组分割为子带区域的信号的信号称为QMF系数。在参量编码方法中,QMF系数大多是在合成处理的前期阶段进行调整。
QMF合成滤波器组对QMF系数的前头的M个系数进行补零(用0填充数值),由此计算子带信号s’k(n)。并且,QMF合成滤波器组根据式9计算时间信号x’(n)。
[数式9]
Figure BDA0000069940820000061
(式9)
其中,β表示相位参数。
在上述的情况下,设计利用实数值构成的线性相位原型滤波器系数p(n)及相位参数,以便基本满足输入的实数值信号x(n)的可再合成条件(perfect reconstruction)。
如上所述,QMF变换是指时间轴方向与频率轴方向的混合变换。即,能够抽取信号中包含的频率成分、和表示频率按时间的变化的信息。并且,能够按照每个子带和每个单位时间来抽取频率成分。在此,将单位时间称为时隙。
在图31中进行了详细图示。实数的输入信号被分割为长度L且以跳跃尺寸M进行重叠而得到的块。在QMF分析处理中,各个块被变换为使M个复数子带信号成为一个时隙的形式(图31中的上段)。这样,时域的L样本的信号被变换为L个复数QMF系数。该复数QMF系数如图31中的中段所示,由L/M个时隙和M个子带构成。对于各时隙,在QMF合成处理中,使用该时隙之前的(L/M-1)个时隙的QMF系数,将各个时隙合成为M个实数时间信号(图31中的下段)。
与上述的STFT同样地,音响信号处理装置根据时间分辨率与频率分辨率的本来组合,能够在QMF区域中计算出某个瞬间的频率信号。
并且,音响信号处理装置能够从由L/M个时隙和M个子带构成的复数QMF系数块,计算某个时隙的相位信息与邻接的时隙的相位信息之间的相位差。例如,根据式10计算某个时隙的相位信息与邻接的时隙的相位信息之间的相位差。
Δφ(n,k)=φ(n,k)-φ(n-1,k)  (式10)
其中,φ(n,k)表示相位信息。n表示时隙索引,n=0,1,…,L/M-1。k表示子带索引,k=0,1,…,M-1。
存在在进行时间拉伸处理之后,在这种QMF区域中对音响信号进行信号处理的情况。但是,在这种情况下,音响信号处理装置必须在伴随有运算量较大的FFT和逆FFT的时间拉伸处理的基础上,进行将时域的信号变换为QMF区域的信号的处理。因此,运算量进一步增加。
发明内容
本发明的目的在于,提供一种能够以较低的运算量实现音响信号处理的音响信号处理装置。
用于解决问题的手段
为了解决上述问题,本发明的音响信号处理装置使用规定的调整系数对输入音响信号序列进行变换,该音响信号处理装置具有:滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述输入音响信号序列变换为QMF系数序列;以及调整部,根据所述规定的调整系数来调整所述QMF系数序列。
由此,在QMF区域中执行音响信号处理。因此,由于不采用运算量较大的现有的音响信号处理,因而运算量降低。
并且,也可以是,所述调整部根据表示规定的时间规整比的所述规定的调整系数,对所述QMF系数序列进行调整,以便能够从调整后的所述QMF系数序列得到以所述规定的时间规整比进行了时间规整的所述输入音响信号序列。
由此,在QMF区域中执行相当于音响信号的时间规整的处理。因此,由于不采用运算量较大的现有的时间规整处理,因而运算量降低。
并且,也可以是,所述调整部根据表示规定的频率调制比的所述规定的调整系数,对所述QMF系数序列进行调整,以便能够从调整后的所述QMF系数序列得到以所述规定的频率调制比进行了频率调制的所述输入音响信号序列。
由此,在QMF区域中执行相当于音响信号的频率调制的处理。因此,由于不采用运算量较大的过去的频率调制处理,因而运算量降低。
并且,也可以是,所述滤波器组按照每个时间间隔将所述输入音响信号序列逐次变换为所述QMF系数序列,由此生成按照每个所述时间间隔的所述QMF系数序列,所述调整部具有:计算电路,针对按照每个所述时间间隔生成的所述QMF系数序列的每个时隙及每个子带,计算相位信息;以及调整电路,根据所述规定的调整系数调整每个所述时隙及每个所述子带的所述相位信息,由此调整所述QMF系数序列。
由此,根据调整系数适应性地调整QMF系数的相位信息。
并且,也可以是,所述调整电路针对每个所述子带,将根据所述QMF系数序列的最初的时隙的所述相位信息和所述规定的调整系数计算出的值,与每个所述时隙的所述相位信息相加,由此调整每个所述时隙的所述相位信息。
由此,针对每个时隙,根据调整系数适应性地调整相位信息。
并且,也可以是,所述计算电路还对按照每个所述时间间隔生成的所述QMF系数序列的每个所述时隙及每个所述子带计算振幅信息,所述调整电路还根据所述规定的调整系数调整每个所述时隙及每个所述子带的所述振幅信息,由此调整所述QMF系数序列。
由此,根据调整系数适应性地调整QMF系数的振幅信息。
并且,也可以是,所述调整部还具有频带限制部,该频带限制部在所述QMF系数序列的调整之前或者调整之后,从所述QMF系数序列提取与预先设定的带宽对应的新的QMF系数序列。
由此,只得到需要的频带的QMF系数。
并且,也可以是,所述调整部针对每个子带以调整所述QMF系数序列的比例进行加权,并针对每个所述子带调整所述QMF系数序列。
由此,根据频带适应性地调整QMF系数。
并且,也可以是,所述调整部还具有区域变换器,该区域变换器在所述QMF系数序列的调整之前或者调整之后,将所述QMF系数序列变换为时间及频率的分辨率不同的新的QMF系数序列。
由此,QMF系数序列被变换为具有与处理对应的子带数量的QMF系数序列。
并且,也可以是,所述调整部从调整之前的所述QMF系数序列检测瞬变成分,并从调整之前的所述QMF系数序列提取检测到的所述瞬变成分,并对提取到的所述瞬变成分进行调整,将调整后的所述瞬变成分恢复为调整之后的所述QMF系数序列,由此调整所述QMF系数序列。
由此,抑制对时间拉伸处理不适合的瞬变成分的影响。
并且,也可以是,所述音响信号处理装置还具有:高频带生成部,使用预先设定的变换系数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及高频带插补部,针对所述高频带之中、未由所述高频带生成部生成所述高频带系数序列的频带即缺失频带的系数,使用属于与所述缺失频带的两侧邻接的频带的所述高频带系数序列进行插补。
由此,得到与高频带对应的QMF系数。
并且,也可以是,本发明的音响编码装置对第1音响信号序列进行编码,该音响编码装置具有:第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述第1音响信号序列变换为第1QMF系数序列;向下取样部,对所述第1音响信号序列进行向下取样,由此生成第2音响信号序列;第1编码部,对所述第2音响信号序列进行编码;第2滤波器组,使用QMF分析滤波器,将所述第2音响信号序列变换为第2QMF系数序列;调整部,根据规定的调整系数来调整所述第2QMF系数序列;第2编码部,将所述第1QMF系数序列和调整后的所述第2QMF系数序列进行比较,由此生成在解码时使用的参数,并对所述参数进行编码;以及重叠部,将编码后的所述第2音响信号序列和编码后的所述参数进行重叠。
由此,利用QMF区域的音响信号处理,对音响信号进行编码。因此,由于不采用运算量较大的现有的音响信号处理,因而运算量降低。并且,通过QMF区域的音响信号处理而得到的QMF系数不会变换为时域的音响信号,而是在后面的处理中使用。因此,运算量进一步降低。
并且,也可以是,本发明的音响解码装置从所输入的比特流中对第1音响信号序列进行解码,该音响解码装置具有:分离部,从所输入的所述比特流中分离出编码后的参数和编码后的第2音响信号序列;第1解码部,对编码后的所述参数进行解码;第2解码部,对编码后的所述第2音响信号序列进行解码;第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将由所述第2解码部解码后的所述第2音响信号序列变换为QMF系数序列;调整部,根据规定的调整系数来调整所述QMF系数序列;高频带生成部,使用解码后的所述参数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及第2滤波器组,使用QMF合成滤波器,将所述高频带系数序列及调整之前的所述QMF系数序列变换为时域的所述第1音响信号序列。
由此,利用QMF区域的音响信号处理,对音响信号进行解码。因此,由于不采用运算量较大的现有的音响信号处理,因而运算量降低。并且,通过QMF区域的音响信号处理而得到的QMF系数不会变换为时域的音响信号,而是在后面的处理中使用。因此,运算量进一步降低。
并且,也可以是,本发明的音响信号处理方法使用规定的调整系数对输入音响信号序列进行变换,该音响信号处理方法包括:变换步骤,使用QMF(正交镜像滤波器)分析滤波器将所述输入音响信号序列变换为QMF系数序列;以及调整步骤,根据所述规定的调整系数来调整所述QMF系数序列。
由此,本发明的音响信号处理装置可以实现为音响信号处理方法。
并且,也可以是,本发明的音响编码方法对第1音响信号序列进行编码,该音响编码方法包括:第1变换步骤,使用QMF(正交镜像滤波器)分析滤波器将所述第1音响信号序列变换为第1QMF系数序列;向下取样步骤,对所述第1音响信号序列进行向下取样,由此生成第2音响信号序列;第1编码步骤,对所述第2音响信号序列进行编码;第2变换步骤,使用QMF分析滤波器,将所述第2音响信号序列变换为第2QMF系数序列;调整步骤,根据规定的调整系数来调整所述第2QMF系数序列;第2编码步骤,将所述第1QMF系数序列和调整后的所述第2QMF系数序列进行比较,由此生成在解码时使用的参数,并对所述参数进行编码;以及重叠步骤,将编码后的所述第2音响信号序列和编码后的所述参数进行重叠。
由此,本发明的音响编码装置可以实现为音响编码方法。
并且,也可以是,本发明的音响解码方法从所输入的比特流中对第1音响信号序列进行解码,该音响解码方法包括:分离步骤,从所输入的所述比特流中分离出编码后的参数和编码后的第2音响信号序列;第1解码步骤,对编码后的所述参数进行解码;第2解码步骤,对编码后的所述第2音响信号序列进行解码;第1变换步骤,使用QMF(正交镜像滤波器)分析滤波器,将由所述第2解码步骤解码后的所述第2音响信号序列变换为QMF系数序列;调整步骤,根据规定的调整系数来调整所述QMF系数序列;高频带生成步骤,使用解码后的所述参数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及第2变换步骤,使用QMF合成滤波器,将所述高频带系数序列及调整之前的所述QMF系数序列变换为时域的所述第1音响信号序列。
由此,本发明的音响解码装置可以实现为音响解码方法。
并且,也可以是,本发明的程序是用于使计算机执行所述音响信号处理方法中包含的步骤的程序。
由此,本发明的音响信号处理方法可以实现为程序。
并且,也可以是,本发明的程序是用于使计算机执行所述音响编码方法中包含的步骤的程序。
由此,本发明的音响编码方法可以实现为程序。
并且,也可以是,本发明的程序是用于使计算机执行所述音响解码方法中包含的步骤的程序。
由此,本发明的音响解码方法可以实现为程序。
并且,也可以是,本发明的集成电路使用规定的调整系数对输入音响信号序列进行变换,该集成电路具有:滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述输入音响信号序列变换为QMF系数序列;以及调整部,根据所述规定的调整系数来调整所述QMF系数序列。
由此,本发明的音响信号处理装置可以实现为集成电路。
并且,也可以是,本发明的集成电路对第1音响信号序列进行编码,该集成电路具有:第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述第1音响信号序列变换为第1QMF系数序列;向下取样部,对所述第1音响信号序列进行向下取样,由此生成第2音响信号序列;第1编码部,对所述第2音响信号序列进行编码;第2滤波器组,使用QMF分析滤波器将所述第2音响信号序列变换为第2QMF系数序列;调整部,根据规定的调整系数来调整所述第2QMF系数序列;第2编码部,将所述第1QMF系数序列和调整后的所述第2QMF系数序列进行比较,由此生成在解码时使用的参数,并对所述参数进行编码;以及重叠部,将编码后的所述第2音响信号序列和编码后的所述参数进行重叠。
由此,本发明的音响编码装置可以实现为集成电路。
并且,也可以是,本发明的集成电路从所输入的比特流中对第1音响信号序列进行解码,该集成电路具有:分离部,从所输入的所述比特流中分离出编码后的参数和编码后的第2音响信号序列;第1解码部,对编码后的所述参数进行解码;第2解码部,对编码后的所述第2音响信号序列进行解码;第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将由所述第2解码部解码后的所述第2音响信号序列变换为QMF系数序列;调整部,根据规定的调整系数来调整所述QMF系数序列;高频带生成部,使用解码后的所述参数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及第2滤波器组,使用QMF合成滤波器,将所述高频带系数序列及调整之前的所述QMF系数序列变换为时域的所述第1音响信号序列。
由此,本发明的音响解码装置可以实现为集成电路。
发明效果
根据本发明,能够以较低的运算量实现音响信号处理。
附图说明
图1是表示实施方式1的音响信号处理装置的结构图。
图2是表示实施方式1的时间拉伸处理的说明图。
图3是表示音响解码装置的结构图。
图4是表示实施方式1的频率调制电路的结构图。
图5A是表示实施方式2的QMF系数块的说明图。
图5B是表示QMF区域的每个时隙的能量分布的图。
图5C是表示QMF区域的每个子带的能量分布的图。
图6A是表示与瞬变(過渡)成分对应的时间拉伸处理的第1模式的说明图。
图6B是表示与瞬变成分对应的时间拉伸处理的第2模式的说明图。
图6C是表示与瞬变成分对应的时间拉伸处理的第3模式的说明图。
图7A是表示实施方式2的瞬变成分抽取处理的说明图。
图7B是表示实施方式2的瞬变成分插入处理的说明图。
图8是表示瞬变位置与QMF相位推移比例的线性关系的图。
图9是表示实施方式2的时间拉伸处理的流程图。
图10是表示实施方式2的时间拉伸处理的畸变例的流程图。
图11是表示实施方式3的时间拉伸处理的说明图。
图12是表示实施方式4的时间拉伸处理的说明图。
图13是表示实施方式5的音响信号处理装置的结构图。
图14是表示实施方式5的音响信号处理装置的第1畸变例的结构图。
图15是表示实施方式5的音响信号处理装置的第2畸变例的结构图。
图16A是表示通过重新取样处理进行基音位移处理后的输出的图。
图16B是表示通过时间拉伸处理而期待的输出的图。
图16C是表示通过时间拉伸处理的错误的输出的图。
图17是表示实施方式6的音响信号处理装置的结构图。
图18是表示实施方式6的QMF区域变换处理的示意图。
图19是实施方式6的频率调制处理的流程图。
图20A是表示QMF原型滤波器的振幅响应的图。
图20B是表示频率与振幅的关系的图。
图21是表示实施方式6的音响编码装置的结构图。
图22是表示音质的评价的说明图。
图23A是表示实施方式7的音响信号处理装置的结构图。
图23B是表示实施方式7的音响信号处理装置的处理的流程图。
图24是表示实施方式7的音响信号处理装置的畸变例的结构图。
图25是表示实施方式7的音响编码装置的结构图。
图26是表示实施方式7的音响编码装置的处理的流程图。
图27是表示实施方式7的音响解码装置的结构图。
图28是表示实施方式7的音响解码装置的处理的流程图。
图29是表示实施方式7的音响解码装置的畸变例的结构图。
图30A是表示时间拉伸处理前的音响信号的状态的说明图。
图30B是表示时间拉伸处理后的音响信号的状态的说明图。
图31是表示QMF分析处理和QMF合成处理的说明图。
具体实施方式
下面,参照附图说明本发明的实施方式。
(实施方式1)
实施方式1的音响信号处理装置对所输入的音响信号进行QMF变换,进行相位调整,实施逆QMF变换,由此实现时间拉伸处理。
图1是表示实施方式1的音响信号处理装置的结构图。首先,QMF分析滤波器组901将所输入的音响信号变换为QMF系数X(m,n)。其中,m表示子带索引,n表示时隙索引。调整电路902对通过变换而得到的QMF系数进行调整。下面,对调整电路902的调整进行说明。式11使用各个QMF系数各自的振幅和相位来表述调整之前的该各个QMF系数。
[数式10]
X(m,n)=r(m,n)·exp(j·a(m,n))  (式11)
r(m,n)表示振幅信息,a(m,n)表示相位信息。调整电路902将相位信息a(m,n)调整为下式所示的相位信息。
[数式11]
a ~ ( m , n )
调整电路902根据式12,利用调整之后的相位信息和调整之前的振幅信息r(m,n),计算新的QMF系数。
[数式12]
X ~ ( m , n ) = r ( m , n ) · exp ( j · a ~ ( m , n ) ) (式12)
最后,QMF合成滤波器组903将根据式12计算出的新的QMF系数变换为时间信号。下面,对调整相位信息的方法进行说明。
在实施方式1中,基于QMF的时间拉伸处理由以下所示的步骤构成。即,时间拉伸处理包括:(1)调整相位信息的步骤,(2)根据QMF变换的加法定理来执行QMF区域的重叠相加的步骤。
下面,在有关时间拉伸的说明中,以利用拉伸系数s对2L样本的实数值的时间信号进行时间拉伸的情况为例。QMF分析滤波器组901例如将2L样本的实数值的时间信号变换为由2L/M个时隙和M个子带构成的2L个QMF系数。即,QMF分析滤波器组901将2L样本的实数值的时间信号变换为合成频域的QMF系数。
与基于STFT的时间拉伸方法相同地,通过QMF变换而计算出的QMF系数,在调整相位信息的前期容易受到分析窗口函数的影响。在实施方式1中,通过下述3个步骤来实现向QMF系数的变换。
(1)分析窗口函数h(n)(窗口长度L)被变换为QMF区域用,由此计算QMF区域用的分析窗口函数H(v,k)(由L/M个时隙和M个子带构成)。
(2)利用下式将计算出的分析窗口函数H(v,k)进行简化。
[数式13]
H 0 ( v ) = Σ k = 0 M - 1 H ( v , k ) (v=0,…,L/M-1)
(3)QMF分析滤波器组901根据X(m,k)=X(m,k)·H0(w)(其中,w=mod(m,L/M),mod()表示计算余数的运算),计算QMF系数。
如图2中的上段所示,原来的QMF系数是在L/M个时隙中,由以跳跃尺寸按照每1个时隙进行重叠而得到的L/M+1个QMF块构成。
调整电路902对调整之前的各个QMF块的相位信息进行调整,并构成新的QMF块,以便确实避免相位信息不连续。即,在将第μ个和第μ+1个QMF块进行重叠的情况下,需要确保新的QMF块的相位信息在μ·s样本点处的连续性(s表示拉伸系数)。在利用时域进行说明时,这相当于确保跳跃点μ·M·s(μ∈N)处的连续性。
调整电路902根据复数即QMF系数X(u,k)(时隙索引u=0、…、2L/M-1,子带索引k=0、1、…、M-1),计算调整之前的各个QMF块的相位信息φu(k)。如图2中的中段所示,调整电路902按照时隙从旧到新的顺序来运算各个QMF块,而生成新的QMF块。各个QMF块分别利用不同的图案示出。图2表示错开2时隙量的跳跃尺寸来进行处理的情况。
将第n个(n=1、…、L/M+1)新的QMF块的相位信息表述为ψu (n)(k)(时隙索引u=0、…、L/M-1,子带索引k=0、1、…、M-1)。新的相位信息ψu (n)(k)根据进行时间拉伸后的新的QMF块被重新配置在何处而不同。
在重新配置第1个QMF块X(1)(u,k)(u=0、…、L/M-1)时,假设该QMF块的新的相位信息ψu (1)(k)与调整之前的QMF块的相位信息φu(k)相同。即,根据ψu (1)(k)=φu(k)(u=0、…、L/M-1,k=0、1、…、M-1)来计算新的相位信息ψu (1)(k)。
第2个QMF块X(2)(u,k)(u=0、…、L/M-1)移动s时隙的跳跃尺寸来进行重新配置(图2表示2时隙的情况)。在这种情况下,块的前头的频率成分需要与第1个新的QMF块X(1)(u,k)的第s个时隙相连续。因此,使X(2)(u,k)的第1个时隙的频率成分与原来的QMF块的第2个时隙的频率成分一致。即,根据ψ0 (2)(k)=ψ0 (1)(k)+Δφ1(k)来计算新的相位信息ψ0 (2)(k)。
由于第1个时隙的相位信息发生变化,所以根据原来的QMF块的相位信息来调整剩余的相位信息。即,根据ψu (2)(k)=ψu-1 (2)(k)+Δφu+1(k)(u=0、…、L/M-1)来计算新的相位信息ψu (2)(k)。
其中,Δφu(k)表示根据Δφu(k)=φu(k)-φu-1(k)计算的、调整之前的QMF块的相位差。
调整电路902反复执行L/M+1次上述的流程,并生成调整之后的QMF块。即,根据式13和式14计算第m个(m=3、…、L/M+1)新的QMF块的调整之后的相位信息ψu (m)(k)。
ψ0 (m)(k)=ψ0 (m-1)(k)+Δφm-1(k)   (式13)
ψu (m)(k)=ψu-1 (m)(k)+Δφm+u-1(k)(u=1、…、L/M-1)(式14)
调整电路902对新的QMF块的振幅信息使用原来的QMF块的振幅信息,由此能够计算新的QMF块的QMF系数。
调整电路902也可以对QMF区域的第偶数个子带和第奇数个子带利用不同的调整方法来调整相位信息。例如,对于谐波构造较强(音调较强)的音响信号,在QMF区域中,相位差信息(Δφ(n,k)=φ(n,k)-φ(n-1,k))因每个频率成分而不同。在这种情况下,调整电路902根据式15确定瞬时频率成分ω(n,k)。
[数式14]
Figure BDA0000069940820000171
(式15)
其中,princarg(α)表示α的变换,并按照式16进行定义。
princarg(α)=mod(α+π,-2π)+π  (式16)
mod(a,b)表示将a用b去除而得到的余数。
对以上内容进行汇总,根据式17计算上述的相位调整方法中的相位差信息Δφu(k)。
[数式15]
(式17)
另外,QMF合成滤波器组903也可以不对新的各个QMF块适用QMF合成处理,以便削减时间拉伸处理的运算量。取而代之,QMF合成滤波器组903对新的QMF块进行重叠相加,并对由此得到的信号适用QMF合成处理。
与基于STFT的拉伸处理相同地通过QMF变换而计算出的QMF系数,在进行重叠相加的前期容易受到合成窗口函数的影响。因此,与上述的分析窗口函数同样地,利用X(n+1)(u,k)=X(n+1)(u,k)·H0(w)(其中,w=mod(u,L/M))实现合成窗口函数。
在QMF变换中加法定理是成立的,所以全部的L/M+1个QMF块能够按照s时隙的跳跃尺寸进行重叠相加。重叠相加的结果即Y(u,k)可以根据式18计算得到。
Y(ns+u,k)=Y(ns+u,k)+X(n+1)(u,k)(n=0、…、L/M,u=1、…、L/M,k=0、1、…、M-1)     (式18)
QMF合成滤波器组903通过对上述Y(u,k)适用QMF合成滤波器,能够生成进行时间拉伸后的最终的音响信号。能够对原来的信号实施s倍的时间拉伸处理,这能够根据Y(u,k)的时间索引u的范围得到明确。
如上述的式12所示,在实施方式1中,调整电路902在QMF区域中进行相位调整和振幅调整。如前面叙述的那样,QMF分析滤波器组901利用QMF滤波器将按照每时间单位而划分的音响信号逐次变换为QMF系数(QMF块)。并且,调整电路902调整各个QMF块的振幅和相位,以便对应于预先指定的拉伸率(s倍,例如s=2、3、4等)保持相邻的每个QMF块的相位和振幅的连续性。由此,实现相位声码器处理。
QMF合成滤波器组903将在QMF区域中进行相位声码器处理而得到的QMF系数,变换为时域的信号。由此,得到拉伸到s倍后的时域的音响信号。并且,也存在通过时间拉伸处理的后期的信号处理得到更好的QMF系数的情况。例如,也可以对在QMF区域中进行相位声码器处理而得到的QMF系数,实施基于SBR技术的频带扩大处理等某种音响处理。并且,QMF合成滤波器组903也可以采取在后期的信号处理之后变换为时域的音响信号的结构。
图3所示的结构是这种组合的一例。这是将QMF区域的相位声码器处理和音响信号的频带扩大技术相结合的音响解码装置的一例。下面,说明采用相位声码器处理的音响解码装置的结构。
分离部1201将输入的比特流分离为高频带生成用的参数和低频带解码用的编码信息。参数解码部1207对高频带生成用的参数进行解码。解码部1202根据低频带解码用的编码信息,对低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为QMF区域的音响信号。
频率调制电路1205和时间拉伸电路1204对QMF区域的音响信号实施所述相位声码器处理。然后,高频带生成电路1206使用高频带生成用的参数来生成高频带频率成分的信号。概略形状调整电路1208对高频带成分的频率概略形状进行调整。QMF合成滤波器组1209将QMF区域中的低频带成分和高频带成分的音响信号变换为时域的音响信号。
另外,在上述低频带成分的编码处理或者解码处理中可以采用MPEG-AAC方式、MPEG-Layer3等音响编码方式,或者也可以采用ACELP等声音编码方式。
并且,调整电路902当在QMF区域中进行相位声码器处理时,在根据式12计算调整之后的QMF系数时,也可以对QMF块的每个子带索引进行加权运算。由此,调整电路902也能够利用具有不同的值的调制系数按照每个子带索引进行调制。例如,在与高频带频率对应的子带索引中,具有在进行拉伸时畸变增大的音响信号。调整电路902也可以使用减小这种音响信号的调制参数。
另外,作为在QMF区域中进行相位声码器处理的另一种结构,音响信号处理装置也可以在QMF分析滤波器组901的后面还设置另外的QMF分析滤波器组。存在只采用QMF分析滤波器组901时低频带的频率分辨率较低的情况。在这种情况下,即使对包括较多低频带成分的音响信号实施相位声码器处理,也不能得到充足的效果。
因此,为了提高低频带成分的频率分辨率,可以采用用于分析低频带部分(例如,QMF分析滤波器组901的输出中包含的全部QMF块的一半)的另外的QMF分析滤波器组。由此,频率分辨率提高为2倍。在此基础上,调整电路902实施上述的QMF区域的相位声码器处理。由此,在保持音质的状态下,运算量以及存储器消耗量的削减效果提高。
图4是表示提高QMF区域的分辨率的结构示例的图。QMF合成滤波器组2401利用QMF合成滤波器暂且将输入的音响信号合成。然后,QMF分析滤波器组2402利用2倍析像度的QMF分析滤波器计算QMF系数。针对达到2倍分辨率的QMF区域的信号进行2倍的时间拉伸、和进行2倍或3倍或4倍的基音位移处理,这种相位声码器处理电路(第1时间拉伸电路2403、第2时间拉伸电路2404和第3时间拉伸电路2405)可以并列构成。
并且,各个相位声码器处理电路统一按照2倍析像度进行拉伸比例不同的相位声码器处理。并且,合并电路2406将通过相位声码器处理而得到的信号进行合成。
基于QMF滤波器的相位声码器处理如以上所明确的那样,与基于STFT的相位声码器处理相比,不需要采用运算量较大的FFT处理。因此,具有能够大幅削减运算量的显著效果。
(实施方式2)
关于实施方式2,说明将实施方式1记载的基于块的时间轴拉伸方法进行扩展的方式。实施方式2的音响信号处理装置具有与图1所示的实施方式1的音响信号处理装置相同的构成要素。并且,利用下述的两种方法进行相位信息的计算,以便避免上述的相位信息的不连续的影响。
(a)调整电路902调整相位信息,以使在调整之后的QMF块中相重叠的时隙的相位信息在块之间是连续的。即,调整电路902根据ψ0 (m)(k)=ψ0 (m-1)(k)+Δφm-1(k)来调整相位信息。
(b)调整电路902调整相位信息,以使在调整之后的各个QMF块中在块内相连续的时隙之间,相位信息是连续的。即,调整电路902根据ψu (m)(k)=ψu-1 (m)(k)+Δφm+u-1(k)(其中,u=1、…、L/M-1)来调整相位信息。
在上述的相位信息的调整方法中,假设对应于音调较强的成分,相位信息相对于调整之前的QMF块发生变化。
但是,实际上,上述的假设不一定始终正确。代表性的是,在原来的信号是音响上的瞬变性信号的情况下,上述的假设不正确。当在时域中具有尖锐的攻击音响的情况下等,瞬变信号是非稳定形式的信号。通过对相位信息和频率成分之间假设固定的关系,可以得知以下事项。即,在离散性地包含大量的音调较强的成分,而且在较短的时间间隔的期间包含间隔较宽的频率成分的情况下,很难对瞬变信号进行处理。结果,导致通过规整处理而生成具有能够察觉到的音响畸变的输出信号。
在实施方式2中,为了应对在对包含许多瞬变信号的信号进行拉伸处理时产生的上述问题,将伴随有实施方式1的相位信息的调整的时间规整处理,变形为能够应对音调较强的信号和瞬变信号双方的时间规整处理。
首先,调整电路902在QMF区域中检测瞬变信号中包含的瞬变成分,以便去除有可能成为潜在问题的时间规整处理。
检测瞬变状态的方法有各种方法,并且已经在许多文献中公开。在实施方式2中公开了检测QMF块中的瞬变响应的两个简单方法。
图5A是说明对通过QMF变换而计算出的QMF块X(u,k)(2L/M个时隙、M个子带)进行时间拉伸的情况的说明图。第一个方法是根据所述每个QMF块的能量值的变化来检测瞬变状态的方法,第二个方法是在频率轴上检测每个QMF块的振幅值的变化的方法。
第一个检测方法如下所述。调整电路902按照图5B所示,对各个QMF块的每个时隙计算能量值E0~E2L/M1。图5C是表示每个子带的能量值的图。调整电路902对每个时隙计算能量值的差分,并设为dEu=Eu+1-Eu(其中,u=0、…、2L/M-2)。根据规定的阈值T0,在下式成立的情况下,
[数式16]
dE i Σ j dE j ≥ T 0 ( j ∈ [ 0,2 L / M - 2 ] , dE j > 0 )
在第i个时隙中检测到瞬变成分。
第二个检测方法如下所述。在QMF块中包含的所有时隙和子带的振幅是A(u,k)的情况下,对各个时隙计算振幅信息的概略形状,并利用下式表示。
[数式17]
F u = M · Π k = 0 M - 1 A ( u , k ) M Σ k = 0 m - 1 A ( u , k ) (其中,u=0,…,2L/M-1)
根据规定的阈值T1和T2,在Fi>T1且下式成立的情况下,
[数式18]
min k ( A ( i , k ) ) > T 2
在第i个时隙中检测到瞬变成分。
假设当在第u0个时隙中检测到瞬变成分的情况下,对包括第u0个时隙在内的新的QMF块修改上述的相位信息的拉伸处理。
拉伸处理的修改具有两个目的。一个目的在于,在任意的相位信息拉伸处理中避免第u0个时隙的处理。另一个目的在于,假设在第u0个时隙没有进行任何处理即旁通通过的情况下,保持QMF块内和QMF块之间的连续性。为了达到这两个目的,按照下面所述来修改前述的相位信息拉伸处理。
在第m个新的QMF块(m=2、…、L/M+1)中,其相位ψu (m)(k)如下所述。
(a)在m<u0<m+L/M-1的情况下,为了确保QMF块内的相位信息的连续性,根据下式计算相位ψu (m)(k)(图6A)。
[数式19]
Figure BDA0000069940820000221
(b)在m=u0而且mod(u0,s)=0的情况下,为了从任意的相位信息处理中避免第u0个时隙的处理,根据下式计算相位ψ0 (m)(k)(图6B)。
[数式20]
Figure BDA0000069940820000222
并且,为了确保QMF块之间的相位信息的连续性,根据下式计算相位ψ1 (m)(k)。
[数式21]
Figure BDA0000069940820000223
(c)在m=u0而且mod(u0,s)≠0的情况下,为了从任意的相位信息处理中避免第u0个时隙的处理,根据下式计算相位ψ0 (m)(k)(图6C)。
[数式22]
Figure BDA0000069940820000224
并且,为了确保QMF块之间的相位信息的连续性,根据下式计算相位ψ1 (m)(k)。
[数式23]
实际上,从音响方面考虑,在大多情况下不期望进行上述的针对瞬变信号的拉伸处理。也可以是,调整电路902不对瞬变信号进行拉伸处理,而是在从QMF块中去除瞬变信号成分的基础上进行拉伸处理,再针对已进行拉伸处理的QMF块将刚刚被去除的瞬变信号恢复。
图7A和图7B表示上述的处理。在此,说明在对通过QMF变换而计算出的QMF块信号X(u,k)(假设具有L/M个时隙和M个子带)进行时间拉伸的情况下,利用上述的瞬变信号检测方法在第u0个时隙中检测到瞬变信号的情况。按照下面的步骤来执行各个块的时间拉伸。
(1)调整电路902从QMF块中去除第u0个时隙成分,对所取出的第u0个时隙填充“0”,或者进行“内插”处理。
(2)调整电路902按照上述拉伸方法,将新的QMF块的信号拉伸成为s·L/M个时隙。
(3)调整电路902将在上述(1)被去除的时隙的信号插入到在上述(2)被拉伸的块的位置(第s·u0个时隙的位置)。
在此,上述方法是第s·u0个时隙不是针对瞬变响应成分的合适位置时的简单示例。这是因为QMF变换的时间分辨率较低。
为了实现更高音质的时间拉伸电路,需要对上述的简单示例进行扩展。并且,需要瞬变响应成分的准确位置。实际上,QMF区域的几个信息、例如振幅信息和相位推移信息等,对确定瞬变响应成分的准确位置比较有用。
优选通过分别检测各个QMF块的信号的振幅成分和相位推移信息的两个步骤,来确定瞬变响应成分的位置(下面称为瞬变位置)。对只在t0时刻具有脉冲成分的情况进行说明。脉冲成分是瞬变响应成分的代表性示例。
首先,调整电路902在QMF区域中计算各个QMF块的振幅信息,由此进行瞬变位置t0的大致推定。
在考虑上述的QMF变换的步骤时,可知如下事项。即,为了进行分析窗口处理,脉冲成分对QMF区域的多个时隙都产生影响。通过分析这些时隙的振幅值的分布,可知存在以下两种情况。
(1)在第n0个时隙具有更高的能量(振幅值的平方)的情况下,调整电路902将瞬变位置t0推定为(n0-5)·64-32<t0<(n0-5)·64+32。
(2)在第n0-1个时隙和第n0个时隙具有大致相同的能量的情况下,调整电路902将瞬变位置t0推定为t0=(n0-5)·64-32。
(n0-5)表示经由QMF分析滤波器组901使延迟5个时隙量。并且,在上述(2)的情况下,调整电路902只通过振幅分析即可准确确定瞬变位置。
并且,在上述(1)的情况下,调整电路902使用QMF区域的相位信息,能够更加高效率地确定瞬变位置t0
下面,说明对第n0个时隙内的相位信息φ(n0,k)(k=0、1、…、M-1)进行分析的情况。以2π进行巡回(round)的相位信息φ(n0,k)的推移比例,在瞬变位置t0、与和瞬变位置t0最近的左侧(在时间上是过去)的时隙或者第n0个时隙的中间位置之间,必须具有完全线性关系。即,k·Δt=C0-g0成立。其中,相位推移比例利用下式表示。
[数式24]
Figure BDA0000069940820000241
unwrap(P)表示使弧度相位P以2π进行巡回,并修改π以上的变化的函数。C0表示常数。
Δt表示瞬变位置t0与和瞬变位置t0最近的左侧(在时间上是过去)的时隙或者第n0个时隙之间的距离。即,根据式19计算Δt。
[数式25]
&Delta;t = t 0 - ( ( n 0 - 5 ) &CenterDot; 64 - 32 ) if g 0 < 0 t 0 - ( n 0 - 5 ) &CenterDot; 64 otherwise ; (式19)
上述的参数示例是指诸如利用式20表示的值。
[数式26]
C 0 = - 1.5953 if g 0 < 0 3.117 otherwise ; K = 0.0491 . (式20)
图8是表示瞬变位置t0与QMF相位推移比例g0之间的线性关系的图。如图8所示,只要n0(能量最高的时隙的索引)固定,t0和g0就一对一对应。
根据上述情况来说明另一个示例。该示例是当在QMF区域中进行时间拉伸处理的期间对瞬变成分进行处理的方法。与上述的简单方法相比,本方法在以下方面具有优点。即,本方法能够准确检测原来信号的瞬变位置。并且,本方法能够检测已进行时间拉伸的瞬变成分所存在的时隙、和合适的相位信息。下面详细说明本方法。另外,本方法的步骤在图9中以流程图的形式示出。
QMF分析滤波器组901接受所输入的时间信号x(n)(S2001)。QMF分析滤波器组901根据作为时间拉伸的对象的时间信号x(n),计算QMF块X(m,k)(S2002)。在此,将X(m,k)的振幅设为r(m,k),将相位信息设为φ(m,k)。在该QMF块包含瞬变成分的信号的情况下,最佳的时间拉伸方法如下所述。
(a)调整电路902根据能量分布,根据式21检测瞬变信号存在的时隙m0(S2003)。
[数式27]
m 0 = max m ( &Sigma; k = 0 K - 1 r ( m , k ) ) (式21)
(b)调整电路902估计瞬变响应存在的时隙中、瞬变响应明显的时隙的相位推移比例,并利用下式表示(S2004)。
[数式28]
Figure BDA0000069940820000253
即,调整电路902推定时隙的相位角ω0和相位推移比例,并利用下式表示。
[数式29]
Figure BDA0000069940820000254
(c)调整电路902根据式(22)计算多项式残差。
[数式30]
Figure BDA0000069940820000261
(式22)
(d)调整电路902根据式(23)确定瞬变位置t0(S2005)。
[数式31]
Figure BDA0000069940820000262
(式23)
其中,常数K为K=0.0491。
(e)调整电路902根据式(23)确定处于瞬变状态的区域(S2006)。
[数式32]
T &OverBar; 0 = m 0 if mod ( t 0 , 64 ) = 0 m 0 - 1 , m 0 , m 0 + 1 otherwise (式24)
调整电路902使用标量值,按照式25使QMF系数在处于瞬变状态的区域内减小(S2007)。
[数式33]
X ( m , k ) = &alpha; &CenterDot; X ( m , k ) ifm &Element; T &OverBar; 0 (式25)
α是较小的值,例如α=0.001。
(f)调整电路902对没有处于瞬变状态的QMF块实施通常的时间拉伸处理(S2008)。
(g)调整电路902按照下面所述计算瞬变位置s·t0的新的时隙和相位推移比例。
<i>调整电路902根据m1=ceil((s·t0-32)/64)+5,计算已进行时间拉伸的时隙索引m1(S2009)。其中,ceil是指取最接近的整数的处理。
<ii>调整电路902根据式26计算瞬变位置与和新的时隙最近的左侧(在时间上是指过去)的位置之间的距离。
Δt1=s·t0-(m1-5)·64+32    (式26)
<iii>调整电路902根据式27计算新的相位推移比例。
[数式34]
Figure BDA0000069940820000271
(式27)
(h)调整电路902对瞬变响应明显的时隙m1的QMF系数进行重新合成。
时隙m1的振幅继承了拉伸前的时隙m0的振幅。调整电路902根据新的相位推移比例和相位差,根据式28计算相位信息(S2010)。
[数式35]
Figure BDA0000069940820000272
(式28)
并且,调整电路902根据式29计算新的QMF系数(S2011)。
[数式36]
Figure BDA0000069940820000273
(式29)
(i)调整电路902根据式30确定新的瞬变区域(S2013)。
[数式37]
T &OverBar; 1 = m 1 if &Delta;t 1 = 32 m 1 - 1 , m 1 , m 1 + 1 otherwise (式30)
(j)在利用下式表示的重新确定的瞬变区域中包含多个时隙的情况下,
[数式38]
T &OverBar; 1
调整电路902根据式31重新调整这些时隙的相位(S2015)。
[数式39]
Figure BDA0000069940820000276
(式31)
并且,调整电路902对于由这样进行调整后的时隙构成的QMF块系数,根据式32进行重新合成。
[数式40]
(式32)
Figure BDA0000069940820000282
最后,调整电路902输出已进行时间拉伸处理的QMF块(S2012)。
从运算量方面考虑,为了检测瞬变位置而执行的上述(a)~(d),也可以直接利用时域的瞬变响应检测方法置换。例如,用于在时域中检测瞬变位置的瞬变位置检测部(未图示)配置在QMF分析滤波器组901的前面。并且,时域的瞬变响应检测方法的代表性步骤如下所述。
(1)瞬变位置检测部将时间信号x(n)(n=0、1、…、N·L0-1)分割为长度L0的N个区段。
(2)瞬变位置检测部计算各个区段的能量,并利用下式表示。
[数式41]
E s ( i ) = &Sigma; n = i &CenterDot; L 0 ( i + 1 ) &CenterDot; L 0 - 1 x 2 ( n )
(3)瞬变位置检测部按照Elt(i)=α·Elt(i-1)+(1-α)·Es(i),计算整体区段的能量。
(4)如果Es(i)/Elt(i)>R1、Es(i)>R2,瞬变位置检测部判定第i个区段是包括瞬变响应成分的瞬变区段。其中,R1和R2表示规定的阈值。
(5)瞬变位置检测部根据t0=(i+0.5)·L0,计算瞬变区段的正中间的位置,作为最终的瞬变位置的估算位置。
如果采用时域的瞬变成分检测,则图9的流程图按照图10所示进行变更。
另外,也可以与实施方式1相同地将实施方式2的音响信号处理与QMF区域的另外的音响处理进行组合。例如,QMF分析滤波器组901利用QMF滤波器将按照每单位时间而划分的音响信号逐次变换为QMF系数(QMF块)。并且,调整电路902调整各个QMF块的振幅和相位,以便对应于预先指定的拉伸率(s倍,例如s=2、3、4等)保持相邻的每个QMF块的相位和振幅的连续性。由此,实现相位声码器处理。
QMF合成滤波器组903将在QMF区域中进行相位声码器处理而得到的QMF系数,变换为时域的信号。由此,得到拉伸到s倍后的时域的音响信号。并且,也存在通过时间拉伸处理的后期的信号处理得到更好的QMF系数的情况。例如,也可以对在QMF区域中进行相位声码器处理而得到的QMF系数,实施基于SBR技术的频带扩大处理等某种音响处理。并且,QMF合成滤波器组903也可以采取在后期的信号处理之后变换为时域的音响信号的结构。
图3所示的结构是这种组合的一例。这是将QMF区域的相位声码器处理和音响信号的频带扩大技术相结合的音响解码装置的一例。下面,说明采用相位声码器处理的音响解码装置的结构。
分离部1201将输入的比特流分离为高频带生成用的参数和低频带解码用的编码信息。参数解码部1207对高频带生成用的参数进行解码。解码部1202根据低频带解码用的编码信息,对低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为QMF区域的音响信号。
频率调制电路1205和时间拉伸电路1204对QMF区域的音响信号实施所述相位声码器处理。然后,高频带生成电路1206使用高频带生成用的参数来生成高频带频率成分的信号。概略形状调整电路1208对高频带成分的频率概略形状进行调整。QMF合成滤波器组1209将QMF区域中的低频带成分和高频带成分的音响信号变换为时域的音响信号。
另外,在上述低频带成分的编码处理或者解码处理中可以采用MPEG-AAC方式、MPEG-Layer3等音响编码方式,或者也可以采用ACELP等声音编码方式。
另外,作为在QMF区域中进行相位声码器处理的另一种结构,音响信号处理装置也可以在QMF分析滤波器组901的后面还设置另外的QMF分析滤波器组。存在只采用QMF分析滤波器组901时低频带的频率分辨率较低的情况。在这种情况下,即使对包括较多低频带成分的音响信号实施相位声码器处理,也不能得到充足的效果。
因此,为了提高低频带成分的频率分辨率,可以采用用于分析低频带部分(例如,QMF分析滤波器组901的输出中包含的全部QMF块的一半)的另外的QMF分析滤波器组。由此,频率分辨率提高为2倍。在此基础上,调整电路902实施上述的QMF区域的相位声码器处理。由此,在保持音质的状态下,运算量以及存储器消耗量的削减效果提高。
图4是表示提高QMF区域的分辨率的结构示例的图。QMF合成滤波器组2401利用QMF合成滤波器暂且将输入的音响信号合成。然后,QMF分析滤波器组2402利用2倍析像度的QMF分析滤波器计算QMF系数。针对达到2倍分辨率的QMF区域的信号进行2倍的时间拉伸、和进行2倍或3倍或4倍的基音位移处理,这种相位声码器处理电路(第1时间拉伸电路2403、第2时间拉伸电路2404和第3时间拉伸电路2405)可以并列构成。
并且,各个相位声码器处理电路统一按照2倍析像度进行拉伸比例不同的相位声码器处理。并且,合并电路2406将通过相位声码器处理而得到的信号进行合成。
另外,实施方式2的音响信号处理装置也可以具有如下结构。
调整电路902也可以根据输入的音响信号的音调(音响谐波构造的大小)和音响信号的瞬变特性进行灵活调整。调整电路902也可以通过对QMF区域的系数检测瞬变信号来调整相位信息。也可以是,调整电路902以确保相位信息的连续性、而且使QMF区域的系数的瞬变信号成分不变化的方式,调整相位信息。也可以是,调整电路902将与避免了时间规整的瞬变信号成分相关联的QMF系数,恢复为对瞬变信号成分进行解压缩或者压缩而得到的QMF系数,由此调整相位信息。
音响信号处理装置还可以具有:检测部,检测输入信号的瞬变特性;以及衰减器,进行削弱由检测部检测到的瞬变成分的处理。衰减器被设于进行相位调整的前段。调整电路902在进行时间拉伸处理之后,对实施了削弱处理的瞬变成分进行扩展。衰减器也可以调整频域的系数的振幅值,由此削弱瞬变成分。
也可以是,调整电路902对于已进行时间拉伸的瞬变成分,使其增加频域的振幅,并调整相位,由此对已进行时间拉伸的瞬变成分进行扩展。
(实施方式3)
实施方式3的音响信号处理装置对所输入的音响信号进行QMF变换,并对QMF系数进行相位调整和振幅调整,由此实现时间拉伸和频率调制处埋。
实施方式3的音响信号处理装置具有与图1所示的实施方式1的音响信号处理装置相同的构成要素。QMF分析滤波器组901将输入的音响信号变换为QMF系数X(m,n)。调整电路902对QMF系数进行调整。使用振幅和相位,利用式33来表述调整前的QMF系数X(m,n)。
[数式42]
X(m,n)=r(m,n)·exp(j·a(m,n))    (式33)
调整电路902将相位信息a(m,n)调整为如下式所示。
[数式43]
a ~ ( m , n )
调整电路902根据调整后的相位信息和原来的振幅信息r(m,n),根据式34计算新的QMF系数。
[数式44]
X ~ ( m , n ) = r ( m , n ) &CenterDot; exp ( j &CenterDot; a ~ ( m , n ) ) (式34)
最后,QMF合成滤波器组903将根据式34计算出的新的QMF系数变换为时间信号。另外,实施方式3的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理。
与实施方式1的不同之处是如图11所示,在时间拉伸系数是s的情况下,在原来的QMF区域的时隙的后面插入(s-1)个假想时隙。
在这种情况下,调整电路902需要维持原来的音响信号的基音。并且,调整电路902需要计算相位信息,以便避免听觉上的音质恶化。例如,在将原来的QMF块的相位信息设为φn(k)时(时隙索引n=1、…、L/M,子带索引k=0、1、…、M-1),调整电路902根据式35计算上述假想时隙的调整后的新的相位信息。
ψq(k)=ψq-1(k)+Δφn(k)
(q=s·(n-1)+1、…、s·n,n=1、…、L/M)    (式35)
在此,与实施方式1同样地,根据Δφn(k)=φn(k)-φn-1(k)计算相位差Δφn(k)。
并且,也根据式36计算相位差Δφn(k)。
[数式45]
Figure BDA0000069940820000321
(式36)
所插入的时隙的振幅信息是利用对前一个时隙与后一个时隙之间进行线性插补(内插)的值构成的,以便使其在所插入的边界处是连续的。例如,在将原来的QMF块设为an(k)时,根据式37对所插入的假想时隙的振幅信息进行线性插补。
[数式46]
r q ( k ) = a n - 1 ( k ) - a n - 1 ( k ) s &CenterDot; ( q - s &CenterDot; ( n - 1 ) ) + a n - 1 ( k ) (式37)
(q=s·(n-1)+1,…,s·n、n=1,…,L/M)
QMF合成滤波器组903将通过这样插入假想时隙而构成的新的QMF块,与实施方式1相同地变换为时域的信号。由此,计算已进行时间拉伸的信号。另外,如上所述,实施方式3的音响信号处理装置也可以不实施QMF合成滤波器组,而将新的QMF系数直接输出给后面的音响信号处理装置。
实施方式3的音响信号处理装置也不采用FFT运算,与基于STFT的相位声码器处理相比,能够以相当少的运算量实现相同的效果。
(实施方式4)
实施方式4的音响信号处理装置对所输入的音响信号进行QMF变换,并对QMF系数进行相位调整。并且,实施方式4的音响信号处理装置按照每个子带来处理原来的QMF块,由此实现时间拉伸处理。
实施方式4的音响信号处理装置具有与图1所示的实施方式1的音响信号处理装置相同的构成要素。QMF分析滤波器组901将输入的音响信号变换为QMF系数X(m,n)。调整电路902对QMF系数进行调整。使用振幅和相位,利用式38来表述调整前的QMF系数X(m,n)。
[数式47]
X(m,n)=r(m,n)·exp(j·a(m,n))    (式38)
调整电路902将相位信息a(m,n)调整为如下式所示。
[数式48]
a ~ ( m , n )
调整电路902利用调整后的相位信息和原来的振幅信息r(m,n),根据式39计算新的QMF系数。
[数式49]
X ~ ( m , n ) = r ( m , n ) &CenterDot; exp ( j &CenterDot; a ~ ( m , n ) ) (式39)
最后,QMF合成滤波器组903将根据式39计算的新的QMF系数变换为时间信号。另外,实施方式4的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。
QMF变换具有将所输入的音响信号变换为具有时间特性的合成频域的作用。因此,基于STFT的时间拉伸方法能够适用于QMF块的时间特性。
与实施方式1的不同之处是如图12所示,按照每个子带对原来的QMF块进行时间拉伸。
原来的QMF块由L/M个时隙和M个子带构成。各个QMF块由M个标量值构成,各个标量值利用L/M个系数构成时间经过信息。
在实施方式4中,基于STFT的时间拉伸方法直接适用于各个子带的标量值。即,调整电路902连续地对各个子带的标量值进行FFT变换,并调整相位信息,执行逆FFT。由此,调整电路902计算新的子带的标量值。另外,由于是对每个子带执行该时间拉伸处理,所以运算量不会增大。
例如,在时间拉伸系数是2的情况下(将音响信号拉伸为2倍时间的情况下),调整电路902按照每个跳跃尺寸Ra反复执行上述的处理。结果,实现诸如使原来的QMF块的子带包括2·L/M个系数的时间拉伸。调整电路902通过反复执行上述的步骤,能够将原来的QMF块变换为2倍长度的QMF块。
QMF合成滤波器组903将这样得到的新的QMF块合成为时间信号。由此,实施方式4的音响信号处理装置能够对原来的时间信号进行时间拉伸使成为具有原来的2倍长度的时间信号。另外,在此,把实施方式4的音响信号处理方法称为基于子带的时间拉伸方法。
以上,根据多个实施方式说明了采用三种不同的方法的时间拉伸处理。表1是对这些方法的运算量(复杂性评价:Complexity Measurement)的大小进行整理得到的比较表。
[表1]
Figure BDA0000069940820000341
可知相比经典的基于STFT的时间拉伸方法,三种时间拉伸方法的运算量都非常少。这是因为基于STFT的时间拉伸方法进行在内部循环的处理。而基于QMF的方法不进行这种循环处理。
(实施方式5)
实施方式5实现与实施方式1~4相同的QMF区域的时间拉伸。不同之处是如图13所示在QMF区域中对QMF系数进行调整。
QMF分析滤波器组1101将输入音响信号变换为QMF系数,以便实现时间规整和频率调制这双方。并且,调整电路1002与实施方式1~4相同地进行所得到的QMF系数的相位调整。
并且,QMF区域变换器1003将调整后的QMF系数变换为新的QMF系数。带通滤波器1004根据需要,在QMF区域中实施频带限制。在降低折返畸变时需要频带限制。最后,QMF合成滤波器组1005将新的QMF系数变换为时域的信号。
另外,实施方式5的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。以上是实施方式5的概要。
图14所示的结构是这样一种结构,通过对QMF区域的相位和振幅进行变换处理,实现作为对象的音响信号的时间规整处理和频率调制处理。
首先,QMF分析滤波器组1801将音响信号变换为QMF系数,以便实现时间规整和频率调制这双方。频率调制电路1803针对这样得到的QMF系数,在QMF区域中实施频率调制处理。带通滤波器即频带限制滤波器1802有时在频率调制处理之前进行频带限制,以便去除折返畸变。
并且,频率调制电路1803对多个QMF块连续地适用相位变换处理和振幅变换处理,由此进行频率调制处理。并且,时间拉伸电路1804进行通过频率调制处理而生成的QMF系数的时间规整处理。利用与实施方式1等相同的方法实现时间规整处理。
另外,以上记述了频率调制电路1803和时间拉伸电路1804按照顺序进行连接的结构,但这些电路的连接顺序不限于此。即,也可以是,在时间拉伸电路1804执行时间规整处理之后,频率调制电路1803执行频率调制处理。
最后,QMF合成滤波器组1805将通过实施频率调制处理和时间规整处理而得到的QMF系数,变换为新的音响信号。新的音响信号是在时间轴方向和频率轴方向相比原来的音响信号进行规整后的信号。
另外,图14所示的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。
在实施方式1~4中示出了时间拉伸方法。实施方式5的音响信号处理装置的结构是在这些实施方式的音响信号处理装置的结构基础上,追加了基于基音拉伸处理的频率调制处理。用于将时间或者频率调整为理想状态的方法有几种方法。但是,经典的基音拉伸处理、即对通过进行时间拉伸而得到的信号进行重新取样(采集)的方法,不能直接适用于频率调制处理。
图14所示的音响信号处理装置在QMF分析滤波器组1801的处理之后,在QMF区域上实现基音拉伸处理。通过QMF分析滤波器组1801的处理,时域的规定的信号成分(特定频率的正弦波成分)成为两个不同的QMF子带的信号。因此,以后很难从一个QMF系数块中分离出有关频率和振幅双方的正确的信号成分,也很难进行基音变换。
因此,实施方式5的音响信号处理装置也可以畸变为先执行基音拉伸处理的结构。即,如图15所示,在QMF分析滤波器组的前面,对时域的输入信号进行重新取样。在图15中,重新取样部500对音响信号进行重新取样,QMF分析滤波器组504将音响信号变换为QMF系数,时间拉伸电路505对QMF系数进行调整。
图15所示的重新取样部500由下述的三个模块构成。即,重新取样部500具有(1)M倍的向上取样部501、(2)抑制折返畸变的低通滤波器502、和(3)D倍的向下取样部503。即,在QMF分析滤波器组504的处理之前,重新取样部500对输入的原来信号进行重新取样使之成为系数M/D倍。这样,重新取样部500将全体的QMF区域的频率成分设为M/D倍。
在需要多次基音拉伸处理的情况下,例如,在需要2倍和3倍这两种基音拉伸处理的情况下,最好是进行如下所述的处理。为了对不同倍率的重新取样处理进行整合,需要对应各个重新取样处理具有不同的延迟量的多个延迟电路。在将通过2倍或者3倍的基音拉伸处理而得到的输出信号进行合成之前,这些延迟电路实施时间调整。
下面,说明通过使包含低频带的信号进行2倍或者3倍的基音拉伸处理,而对频带进行扩展的情况。为了实现该目的,音响信号处理装置首先实施重新取样处理。图16A是表示基音拉伸处理的输出的图。图16A的纵轴表示频率轴,横轴表示时间轴。
音响信号处理装置通过重新取样处理,生成包含低频带的信号(图16A中最粗的黑线)的2倍(图16A中粗的黑线)以及3倍(图16A中细的黑线)基音拉伸处理后的信号。如果在时域中产生偏差,2倍的基音拉伸处理信号具有d0时间的延迟时间,3倍的基音拉伸处理信号具有d1时间的延迟时间。
音响信号处理装置为了得到高频带的信号,分别对原来的信号、具有2倍的频带的信号以及具有3倍的频带的信号进行时间拉伸为2倍、3倍和4倍。结果,音响信号处理装置能够生成这些信号的合成信号作为如图16B所示的高频带的信号。
另外,在产生时间偏差的情况下,如图16C所示,延迟量的不一致也被直接进行基音拉伸,因而有时在高频带信号中产生延迟量不一致的问题。上述的多个延迟电路进行时间调整,由此降低时间偏差。
也可以直接执行上述的重新取样方法。但是,为了进一步削减上述处理的运算量,低通滤波器502也可以利用多相滤波器组实现。在低通滤波器502的次数较高的情况下,也可以根据卷积原理在FFT区域中实现低通滤波器502,以便削减运算量。
另外,在M/D<1.0的情况下,即基音通过基音拉伸处理而变高的情况下,后面的QMF分析滤波器组504和时间拉伸电路505的运算量将大于重新取样处理所需要的处理量。因此,将时间拉伸和重新取样处理的顺序置换,由此削减运算量。
并且,在图15中,重新取样部500被设于QMF分析滤波器组504的前面。这是为了将在对特定音源(例如单一正弦波等)实施基音拉伸处理时产生的音质恶化抑制在最小限度。当在QMF分析滤波器组504的处理之后实施基音位移处理的情况下,成为原来的音响信号中包含的正弦波信号被分离为多个QMF块的状态。因此,在对该信号实施了基音位移处理的情况下,会导致原来的正弦波信号扩散到多个QMF块中。
即,按照上述的结构对单一正弦波等特殊音源进行重新取样处理比较好。但是,在通常的音响信号的基音位移处理中只输入单一正弦波,基本上等于没有。因此,也可以省略成为运算量的增大原因的重新取样处理。
并且,音响信号处理装置也可以构成为对由QMF分析滤波器组504得到的QMF系数直接实施基音拉伸处理。在这种情况下,已进行基音拉伸处理的音响信号的质量有时在单一正弦波等特殊音源中会变差一些。但是,具有这种结构的音响信号处理装置能够对除此之外的通常的音响信号保持足够好的质量。鉴于这种情况,通过省略重新取样处理,能够省略处理量非常大的处理部。因此,能够削减整体处理量。
并且,音响信号处理装置也可以根据应用用途,利用适当的组合而构成。
(实施方式6)
实施方式6的音响信号处理装置与实施方式5相同地进行QMF区域的时间规整和频率调制处理。在实施方式6中,不采用在实施方式5中采用的重新取样处理,这一点与实施方式5不同。实施方式6的音响信号处理装置具有图13所示的音响信号处理装置的构成要素。
图13所示的音响信号处理装置进行时间规整处理和频率调制处理这两种处理。因此,QMF分析滤波器组1001将音响信号变换为QMF系数。并且,调整电路1002按照实施方式1~4记述的那样,对所得到的QMF系数进行相位调整。
并且,QMF区域变换器1003将调整后的QMF系数变换为新的QMF系数。带通滤波器1004根据需要,在QMF区域中进行频带限制。在降低折返畸变时需要频带限制。最后,QMF合成滤波器组1005将新的QMF系数变换为时域的信号。
另外,实施方式6的音响信号处理装置也可以不实施QMF合成滤波器,而将新的QMF系数直接输出给后面的另外的音响信号处理装置。后面的音响信号处理装置执行例如基于SBR技术的音响信号处理等。以上是实施方式6的整体结构。
关于基于基音拉伸处理的频率调制处理,实施方式6的音响信号处理装置进行与实施方式5不同的处理。
为了通过对基音进行规整来实现频率调制处理,对时域的音响信号进行重新取样的方法是非常简单的。但是,在结构上需要为了抑制折返畸变所需的低通滤波器。因此,通过低通滤波器而产生延迟。通常,为了提高重新取样处理的精度,需要次数较大的低通滤波器。另一方面,在次数较大时,滤波器的延迟增大。
因此,图17所示的实施方式6的音响信号处理装置具有在QMF区域中对系数的结构进行变换的QMF区域变换器603。并且,通过QMF区域变换器603执行与重新取样处理不同的基音位移处理。
QMF分析滤波器组601根据输入的时间信号计算QMF系数。与实施方式1~5相同地,时间拉伸电路602对计算出的QMF系数进行时间拉伸。QMF区域变换器603对已进行时间拉伸的QMF系数实施基音拉伸处理。
如图18所示,QMF区域变换器603不需重新利用QMF合成滤波器和QMF分析滤波器,即可将某个QMF区域的QMF系数直接变换为频率和时间的分辨率都不同的另外的QMF区域的QMF系数。如图18所示,QMF区域变换器603将由M个子带和L/M个时隙构成的某个QMF块,变换为由N个子带和L/N个时隙构成的新的QMF块。
QMF区域变换器603能够改变时隙数和子带数。并且,该输出信号的时间和频率的分辨率相对于输入信号被变更。因此,为了同时实现时间拉伸处理和基音拉伸处理这两种处理,需要计算新的时间拉伸系数。例如,将期望的时间拉伸系数设为s,将期望的基音拉伸系数设为w,根据下式计算新的时间拉伸系数。
[数式50]
s ~ = s &CenterDot; w
图17是表示实现时间拉伸处理和基音拉伸处理这两种处理的结构的图。另外,图17所示的音响信号处理装置是按照时间拉伸处理(时间拉伸电路602)和基音拉伸处理(QMF区域变换器603)的顺序构成的。但是,音响信号处理装置也可以构成为先进行基音拉伸处理,然后进行时间拉伸处理。在此,假设有L个输入样本。
QMF分析滤波器组601根据L个样本,计算由M个子带和L/M个时隙构成的QMF块。时间拉伸电路602根据这样计算出的QMF块的各个QMF系数,计算由M个子带和下式所示个数的时隙构成的QMF块。
[数式51]
s ~ &CenterDot; L / M
最后,QMF区域变换器603将已被拉伸的QMF块变换为由w·M个子带和s·L/M个时隙构成的另外的QMF块(在w>1.0的情况下,最小的M个子带成为最终的输出信号)。
QMF区域变换器603的处理相当于对QMF合成滤波器组和QMF分析滤波器组的运算处理进行数学压缩。音响信号处理装置构成为在使用QMF合成滤波器组和QMF分析滤波器组进行运算的情况下,在内部包含延迟电路。与此相比,具有QMF区域变换器603的音响信号处理装置能够削减运算延迟和运算量。例如,音响信号处理装置在将子带索引为Sk(k=0、…、M-1)的子带变换成子带索引为S1(1=0、…、wM-1)的情况下,执行式40的计算。
[数式52]
Sl=QMF_ANAwM(QMF_SYNM(Sk,PM),PwM)
                                         (式40)
=QMF_convert(Sk,PM,PwM)
其中,PM和PwM分别表示QMF分析滤波器组和QMF合成滤波器组的原型函数。
下面,说明基音位移处理的另一个示例。与以上叙述的基音位移处理不同,音响信号处理装置按照下面所述进行处理。
(a)音响信号处理装置检测拉伸处理前的QMF块中包含的信号的频率成分。
(b)音响信号处理装置利用规定的变换系数对频率进行位移。进行频率位移用的简单方法是将所述变换系数与输入信号的基音相乘的方法。
(c)音响信号处理装置构成期望的位移频率成分的新的QMF块。
音响信号处理装置针对通过QMF变换而计算出的QMF块,根据式41计算信号的频率成分ω(n,k)。
[数式53]
Figure BDA0000069940820000401
(式41)
其中,princarg(α)表示α的基础频率。并且,Δφ(n,k)是指Δφ(n,k)=φ(n,k)-φ(n-1,k),表示同一子带k中的两个QMF成分的相位差。
使用变换系数P0(假设P0>1)计算期望的拉伸后的基础频率,并设为P0·ω(n,k)。
基音的拉伸和压缩(一并称为位移)的本质在于,在位移后的QMF块上构建期望的频率成分。基音位移处理也能够按照图19所示的下述步骤来实现。
(a)首先,音响信号处理装置将位移后的QMF块初始化(S1301)。音响信号处理装置将所有QMF块中的相位ψ(n,k)和振幅r1(n,k)设定为0。
(b)然后,音响信号处理装置将子带提升相当于变换系数P0的量,由此确定子带的边界(S1302)。在P0>1的情况下,音响信号处理装置计算较低的子带边界klb并设klb=0,并且计算较高的子带边界kub并设kub=floor(M/P0),以便避免折返畸变。
这是因为所有频率成分包含在下式所示的范围内。
[数式54]
下限:
Figure BDA0000069940820000411
上限: 1 P 0 ( 1 - 1 2 M )
(c)音响信号处理装置针对位于[klb,kub]的第j个子带,将位移处理后的频率P0·ω(n,j)映射为索引q(n)=round(P0·ω(n,j))(S1305)。
(d)音响信号处理装置重建新的块(n,q(n))的相位和振幅(S1306)。在此,音响信号处理装置根据式42计算新的振幅。
[数式55]
r 1 ( n , q ( n ) ) = r 1 ( n , q ( n ) ) + r 0 ( n , j ) &CenterDot; F ( P 0 &CenterDot; &omega; ( n , j ) - q ( n ) - 1 2 ) ; (式42)
关于函数F()将在后面进行说明。
音响信号处理装置根据式43计算新的相位。
[数式56]
&psi; ( n , q ( n ) ) = 1 / 2 &CenterDot; ( &psi; ( n , q ( n ) ) + &psi; ( n - 1 , q ( n ) ) + ( df ( n ) - 1 ) &CenterDot; &pi; ) q ( n ) ifeven 1 / 2 ( &psi; ( n , q ( n ) ) + &psi; ( n - 1 , q ( n ) ) + ( df ( n ) - 1 ) &CenterDot; &pi; - &pi; ) q ( n ) isodd
(式43)
在此,以“包含”df(n)=P0·ω(n,j)-q(n)和ψ(n,q(n))的调整为前提。音响信号处理装置多次相加2π,以便保证-π≤ψ(n,q(n))<π。
(e)音响信号处理装置将下式所示的关于期望的频率成分P0·ω(n,j)的子带索引,
[数式57]
q ~ ( n )
映射为根据式44计算出的子带(S1307)。
[数式58]
q ~ ( n ) = q ( n ) + 1 if P 0 &CenterDot; &omega; ( n , j ) > q ( n ) + 1 / 2 q ( n ) - 1 if P 0 &CenterDot; &omega; ( n , j ) < q ( n ) + 1 / 2 (式44)
(f)音响信号处理装置重建下式所示的新的块的相位和振幅(S1308)。
[数式59]
( n , q ~ ( n ) )
并且,音响信号处理装置根据式45计算新的振幅。
[数式60]
r 1 ( n , q ~ ( n ) ) = r 1 ( n , q ~ ( n ) ) + r 0 ( n , j ) &CenterDot; F ( P 0 &CenterDot; &omega; ( n , j ) - q ~ ( n ) - 1 2 ) ; (式45)
关于函数F()将在后面进行说明。
音响信号处理装置根据式46计算新的相位。
[数式61]
&psi; ( n , q ~ ( n ) ) = &psi; ( n , q ( n ) ) - &psi; ( n - 1 , q ( n ) ) + &psi; ( n - 1 , q ~ ( n ) ) + &pi; (式46)
[数式62]
&psi; ( n , q ~ ( n ) )
以“包含”上式的调整为前提。音响信号处理装置多次相加2π,以便保证下式成立。
[数式63]
- &pi; &le; &psi; ( n , q ~ ( n ) ) < &pi;
(g)音响信号处理装置在暂且对包含于范围[klb,kub]中的所有子带信号进行处理后,由于P0>1,所以存在新的QMF块中包含的值为“0”的情况。音响信号处理装置针对这种块,以使各个相位信息成为“非0”的方式进行线性插补。并且,音响信号处理装置根据相位信息对各个振幅进行插补(S1310)。
(h)音响信号处理装置将新的QMF块的振幅和相位信息变换为复数系数的块信号(S1311)。
在此省略有关上述的振幅调整和插补的说明。因为这些处理都涉及QMF区域中的信号的频率成分与振幅之间的相关性。
正弦的基音较强的信号也许会产生上述(c)和(e)所述的两个不同的QMF子带的信号成分。分析的结果是这两个子带的振幅的关系依赖于QMF分析滤波器组(QMF变换)的原型滤波器。
例如,以QMF分析滤波器组(QMF变换)是在MPEGSurround和HE-AAC方式中采用的滤波器组为前提。图20A是表示原型滤波器p(n)(滤波器长度640样本)的振幅响应的图。该振幅响应在频率[-0.5,0.5]的外侧急剧衰减,以便基本完整地实现重建特性。以该原型滤波器为基准,将具有M个频带数的复数QMF分析滤波器组的系数定义如下:
[数式64]
h k ( n ) = p ( n ) exp { i &pi; M ( k + 1 2 ) ( n - &theta; ) } ( k = 0,1 , . . . , M - 1 )
在这种情况下,复数滤波器组构成为在第k个子带中频率的中央为k+1/2。图20B是表示被采集的频率响应的图。为了方便起见,在图20B的左侧利用折线表示第k-1个子带的振幅特性,在图20B的右侧利用折线表示第k+1个子带的振幅特性。
如图20B所示,关于频率f0(k-1≤f0<k+1)的成分,如果0<df=f0-(k+1/2)<1,则分别提供第k个和第k+1个子带的两个块。并且,在-1<df=f0-(k+1/2)<0的情况下,提供第k-1个和第k个子带的两个块(参照上述(e))。与其对应的振幅依赖于频率f0与第k个子带的中央频率之差、以及子带滤波器的振幅。
子带的振幅F(df)在-1≤df<1时是对称的函数,利用下式表示。
[数式65]
F ( x ) = F ( - x ) = 0 x = - 1 2 / 2 x = - 1 / 2 1 x = 0
由于两个块处于相同的频率,所以这两个块的相位差需要满足下式(参照上述(f))。
[数式66]
&Delta;&psi; ( n , q ~ ( n ) ) = &Delta;&psi; ( n , q ( n ) ) + &pi;
根据以上所述,可知振幅的插补处理不应该作为线性插补进行处理。取而代之,信号的频率成分与振幅信息之间的关系应该是上述的关系。
如上所述,在实施方式6中,进行QMF区域的相位调整和振幅调整。如前面叙述的那样,音响信号处理装置利用QMF滤波器组将按照每单位时间而划分的音响信号逐次变换为QMF区域的系数(QMF块)。并且,音响信号处理装置调整各个QMF块的振幅和相位,以便对应于预先指定的拉伸率(s倍,例如s=2、3、4等)保持相邻的每个QMF块的相位和振幅的连续性。由此,音响信号处理装置实现相位声码器处理。
音响信号处理装置利用QMF合成滤波器组将在QMF区域中进行相位声码器处理而得到的QMF系数,变换为时域的信号。由此,得到拉伸到s倍后的时域的音响信号。并且,也存在后面的另外的音响信号处理装置采用QMF系数的情况。在这种情况下,后面的另外的音响信号处理装置可以对在QMF区域中进行相位声码器处理而得到的QMF块的系数,实施基于SBR技术的频带扩大处理等某种音响处理。并且,这种后面的另外的音响信号处理装置也可以利用QMF合成滤波器组将QMF系数变换为时域的音响信号。
图3所示的结构是这种组合的一例。这是将QMF区域的相位声码器处理和音响信号的频带扩大技术相组合的音响解码装置的一例。下面,说明采用相位声码器处理的音响解码装置的结构。
分离部1201将输入的比特流分离为高频带生成用的参数和低频带解码用的编码信息。参数解码部1207对高频带生成用的参数进行解码。解码部1202根据低频带解码用的编码信息,对低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为QMF区域的音响信号。
频率调制电路1205和时间拉伸电路1204对QMF区域的音响信号实施所述相位声码器处理。然后,高频带生成电路1206使用高频带生成用的参数来生成高频带频率成分的信号。概略形状调整电路1208对高频带成分的频率概略形状进行调整。QMF合成滤波器组1209将QMF区域中的低频带成分和高频带成分的音响信号变换为时域的音响信号。
另外,在上述低频带成分的编码处理或者解码处理中可以采用MPEG-AAC方式、MPEG-Layer3等音响编码方式,或者也可以采用ACELP等声音编码方式。
并且,当在QMF区域中进行相位声码器处理时,对于调制系数r(m,n),也可以对QMF块的每个子带索引(m,n)进行加权。由此,能够利用对于每个子带索引具有不同的值的调制系数对QMF系数进行调制。例如,在与高频带频率对应的子带索引中,存在当进行拉伸时音响信号的畸变增大的情况。针对这种子带索引,采用减小拉伸比例的拉伸参数。
另外,作为在QMF区域中进行相位声码器处理的另一种结构,音响信号处理装置也可以在QMF分析滤波器组的后面还设置另外的QMF分析滤波器组。存在只采用第1QMF分析滤波器组时低频带的频率分辨率较低的情况。在这种情况下,即使对包括较多低频带成分的音响信号实施相位声码器处理,也不能得到充足的效果。
因此,为了提高低频带成分的频率分辨率,可以采用用于分析低频带部分(例如,第1QMF分析滤波器组的输出中包含的全部QMF块的一半)的第2QMF分析滤波器组。由此,频率分辨率提高为2倍。在此基础上,在上述QMF区域实施相位声码器处理,由此在保持音质的状态下,运算量以及存储器消耗量的削减效果提高。
图4是表示提高QMF区域的分辨率的结构示例的图。QMF合成滤波器组2401暂且利用QMF合成滤波器将输入的音响信号合成。然后,QMF分析滤波器组2402利用2倍析像度的QMF分析滤波器计算QMF系数。针对达到2倍分辨率的QMF区域的信号进行2倍的时间拉伸、和进行2倍或3倍或4倍的基音位移处理,这种相位声码器处理电路(第1时间拉伸电路2403、第2时间拉伸电路2404和第3时间拉伸电路2405)可以并列构成。
并且,各个相位声码器处理电路统一按照2倍析像度进行拉伸比例不同的相位声码器处理。并且,合并电路2406将通过相位声码器处理而得到的信号进行合成。
下面,说明音响信号的编码装置采用前面说明的时间拉伸处理和基音拉伸处理的示例。
图21是表示采用时间拉伸处理和基音拉伸处理对音响信号进行编码的音响编码装置的结构图。图21所示的音响编码装置对按照每固定数量的样本分割得到的音响信号进行成帧处理。
首先,向下取样部1102对音响信号进行向下取样,由此生成只包含低频带的频率成分的信号。编码部1103采用以MPEG-AAC、MPEG-Layer3或者AC3方式等为代表的音响编码方式,对只包含该低频带的音响信号进行编码,由此生成编码信息。同时,QMF分析滤波器组1104将只包含低频带成分的音响信号变换为QMF系数。另一方面,QMF分析滤波器组1101将包含全部频带成分的音响信号变换为QMF系数。
时间拉伸电路1105和频率调制电路1106按照在上述的多个实施方式中说明的那样,对将只包含低频带成分的音响信号变换为QMF区域的信号(QMF系数)进行调整,并生成高频带的假想QMF系数。
参数计算部1107将上述的假想的高频带QMF系数与包含全部频带成分的QMF系数(实际的QMF系数)进行比较,由此计算高频带成分的概略形状信息。重叠部1108将计算出的概略形状信息与编码信息重叠。
图3是表示音响解码装置的结构的图。图3所示的音响解码装置是接收由上述的音响编码装置进行编码后的编码信息,并解码成为音响信号的装置。分离部1201将接收到的编码信息分离为第1编码信息和第2编码信息。参数解码部1207将第2编码信息变换为高频带的QMF系数的概略形状信息。另一方面,解码部1202根据第1编码信息对只包含低频带成分的音响信号进行解码。QMF分析滤波器组1203将被解码后的音响信号变换为只包含低频带成分的QMF系数。并且,时间拉伸电路1204和频率调制电路1205按照在上述的多个实施方式中说明的那样,对只包含该低频带成分的QMF系数进行时间和基音的调整。由此,生成包含高频带成分的假想QMF系数。
概略形状调整电路1208和高频带生成电路1206根据接收到的第2编码信息中包含的概略形状信息,对包含高频带成分的假想QMF系数进行调整。QMF合成滤波器组1209将调整后的QMF系数和低频带的QMF系数进行合成。并且,QMF合成滤波器组1209利用QMF合成滤波器,将所得到的合成QMF系数变换为包含低频带成分和高频带成分双方的时域的音响信号。
这样,音响编码装置将时间规整比作为编码信息进行传输。音响解码装置使用时间规整比对音响信号进行解码。由此,音响编码装置能够按照每个帧来多样化地改变时间规整比。因此,高频带成分的控制变灵活。由此,实现较高的编码效率。
图22是表示在过去采用基于SFTF的时间拉伸电路和频率调制电路的情况下、和采用基于QMF的时间拉伸电路和频率调制电路的情况下,进行音质比较实验的结果的图。图22所示的结果依据于比特速率为16kbps、单声道信号条件下的实验。并且,该结果依据于MUSHRA(Multiple Stimuliwith Hidden Reference and Anchor:隐藏参考和基准的多刺激法)法的评价。
在图22中,纵轴表示与STFT方式的音质差异,横轴表示具有不同的音响特性的多个音源。根据图22可知,与基于SFTF的方式相比,基于QMF的方式能够以基本相同的音质进行编码和解码。在本实验中采用的音源是在进行编码和解码时尤其容易产生恶化的音源。因此,针对除此之外的普通音响信号,当然能够进行具有相同性能的编码和解码。
这样,本发明的音响信号处理装置在QMF区域中进行时间拉伸处理和基音拉伸处理。本发明的音响信号处理与经典的基于STFT的时间拉伸处理和基音拉伸处理相比,能够使用QMF滤波器实现。因此,本发明的音响信号处理不需要使用运算量较大的FFT,能够以更少的运算量实现相同的效果。并且,基于STFT的方式需要实施基于跳跃尺寸的处理,因而产生处理延迟。基于QMF的方式的QMF滤波器的处理延迟非常短。因此,本发明的音响信号处理装置还具有能够使处理延迟非常小的优点。
(实施方式7)
图23A是表示实施方式7的音响信号处理装置的结构图。图23A所示的音响信号处理装置具有滤波器组2601和调整部2602。滤波器组2601进行与图1所示的QMF分析滤波器组901等相同的动作。调整部2602进行与图1所示的调整电路902等相同的动作。并且,图23A所示的音响信号处理装置使用规定的调整系数,对输入音响信号序列进行变换。在此,规定的调整系数相当于时间规整比、频率调制比、以及二者相结合的比例中的任意一个比例。
图23B是表示图23A所示的音响信号处理装置的处理的流程图。滤波器组2601使用QMF分析滤波器,将输入音响信号序列变换为QMF系数序列(S2601)。调整部2602根据规定的调整系数对QMF系数序列进行调整(S2602)。
例如,调整部2602根据表示预先设定的时间规整比的调整系数,对QMF系数序列的相位信息和振幅信息进行调整,以便能够从调整后的QMF系数序列得到以预先设定的时间规整比进行时间规整后的输入音响信号序列。或者,调整部2602根据表示预先设定的频率调制比的调整系数,对QMF系数序列的相位信息和振幅信息进行调整,以便能够从调整后的QMF系数序列得到以预先设定的频率调制比进行频率调制(基音位移)后的输入音响信号序列。
图24是表示图23A所示的音响信号处理装置的畸变例的结构图。图24所示的音响信号处理装置在图23A所示的音响信号处理装置的基础上,还具有高频带生成部2705和高频带插补部2706。并且,调整部2602具有频带限制部2701、计算电路2702、调整电路2703和区域变换器2704。
滤波器组2601按照每固定时间间隔将输入音响信号序列逐次变换为QMF系数序列,由此生成按照每固定时间间隔的QMF系数序列。计算电路2702对按照每固定时间间隔生成的QMF系数序列的每个时隙和每个子带,计算相位信息和振幅信息。调整电路2703根据规定的调整系数来调整每个时隙和每个子带的相位信息,由此调整QMF系数序列的相位信息和振幅信息。
频带限制部2701进行与图14所示的频带限制滤波器1802相同的动作。即,频带限制部2701在进行QMF系数序列的调整之前,从QMF系数序列取出与预先设定的带宽对应的新的QMF系数序列。区域变换器2704进行与图17所示的QMF区域变换器相同的动作。即,区域变换器2704在进行QMF系数序列的调整之后,将QMF系数序列变换为时间和频率的分辨率分别不同的新的QMF系数序列。
另外,频带限制部2701也可以在进行QMF系数序列的调整之后,从QMF系数序列取出与预先设定的带宽对应的新的QMF系数序列。并且,区域变换器2704也可以在进行QMF系数序列的调整之前,将QMF系数序列变换为时间和频率的分辨率分别不同的新的QMF系数序列。
高频带生成部2705进行与图3所示的高频带生成电路1206相同的动作。即,高频带生成部2705使用预先设定的变换系数,从调整后的QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整前的QMF系数序列所对应的频带高的高频带。
高频带插补部2706进行与图3所示的概略形状调整电路1208相同的动作。即,高频带插补部2706针对高频带中、未由高频带生成部2705生成高频带系数序列的频带即缺失频带的系数,使用属于与缺失频带的两侧邻接的频带中的高频带系数序列进行插补。
图25是表示实施方式7的音响编码装置的结构图。图25所示的音响编码装置具有向下取样部2802、第1滤波器组2801、第2滤波器组2804、第1编码部2803、第2编码部2807、调整部2806和重叠部2808。图25所示的音响编码装置进行与图21所示的音响编码装置相同的动作。并且,图25所示的构成要素对应于图21所示的构成要素。
即,向下取样部2802进行与向下取样部1102相同的动作。第1滤波器组2801进行与QMF分析滤波器组1101相同的动作。第2滤波器组2804进行与QMF分析滤波器组1104相同的动作。第1编码部2803进行与编码部1103相同的动作。第2编码部2807进行与参数计算部1107相同的动作。调整部2806进行与时间拉伸电路1105相同的动作。重叠部2808进行与重叠部1108相同的动作。
图26是表示图25所示的音响编码装置的处理的流程图。
首先,第1滤波器组2801使用QMF分析滤波器,将音响信号序列变换为QMF系数序列(S2901)。然后,向下取样部2802对音响信号序列进行向下取样,由此生成的新的音响信号序列(S2902)。然后,第1编码部2803对所生成新的音响信号序列进行编码(S2903)。然后,第2滤波器组2804使用QMF分析滤波器,将所生成新的音响信号序列变换为第2QMF系数序列(S2904)。
然后,调整部2806根据规定的调整系数,对第2QMF系数序列进行调整(S2905)。规定的调整系数相当于以上所述的时间规整比、频率调制比、以及二者相结合的比例中的任意一个比例。
然后,第2编码部2807将第1QMF系数序列和调整后的第2QMF系数序列进行比较,由此生成在进行解码时使用的参数,并对所生成的参数进行编码(S2906)。然后,重叠部2808将已被编码的音响信号序列和已被编码的参数重叠(S2907)。
图27是表示实施方式7的音响解码装置的结构图。图27所示的音响解码装置具有分离部3001、第1解码部3007、第2解码部3002、第1滤波器组3003、第2滤波器组3009、调整部3004和高频带生成部3006。图27所示的音响解码装置进行与图3所示的音响解码装置相同的动作。并且,图27所示的构成要素对应于图3所示的构成要素。
即,分离部3001进行与分离部1201相同的动作。第1解码部3007进行与参数解码部1207相同的动作。第2解码部3002进行与解码部1202相同的动作。第1滤波器组3003进行与QMF分析滤波器组1203相同的动作。第2滤波器组3009进行与QMF合成滤波器组1209相同的动作。调整部3004进行与时间拉伸电路1204相同的动作。高频带生成部3006进行与高频带生成电路1206相同的动作。
图28是表示图27所示的音响解码装置的处理的流程图。
首先,分离部3001从所输入的比特流中分离出被编码后的参数和被编码后的音响信号序列(S3101)。然后,第1解码部3007对被编码后的参数进行解码(S3102)。然后,第2解码部3002对被编码后的音响信号序列进行解码(S3103)。然后,第1滤波器组3003使用QMF分析滤波器,将由第2解码部3002进行解码后的音响信号序列变换为QMF系数序列(S3104)。
然后,调整部3004根据规定的调整系数来调整QMF系数序列(S3105)。规定的调整系数相当于以上所述的时间规整比、频率调制比、以及二者相结合的比例中的任意一个比例。
然后,高频带生成部3006使用被解码后的参数,从被调整后的QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比QMF系数序列所对应的频带高的高频带(S3106)。然后,第2滤波器组3009使用QMF合成滤波器,将QMF系数序列和高频带系数序列变换为时域的音响信号序列。
图29是表示图27所示的音响解码装置的畸变例的结构图。图29所示的音响解码装置具有解码部2501、QMF分析滤波器组2502、频率调制电路2503、耦合部2504、高频重建部2505和QMF合成滤波器组2506。
解码部2501从比特流中对音响信号进行解码。QMF分析滤波器组2502将被解码后的音响信号变换为QMF系数。频率调制电路2503对QMF系数实施频率调制处理。该频率调制电路2503具有图4所示的构成要素。如图4所示,在频率调制处理中执行内部的时间拉伸处理。并且,耦合部2504将从QMF分析滤波器组2502得到的QMF系数、和从频率调制电路2503得到的QMF系数进行耦合。高频重建部2505根据耦合后的QMF系数重建与高频带对应的QMF系数。QMF合成滤波器组2506将从高频重建部2505得到的QMF系数变换为音响信号。
本发明的音响信号处理装置与基于STFT的相位声码器处理相比,能够削减运算量。并且,音响信号处理装置在QMF区域中输出信号,所以在SBR技术或者参数立体声(ParametricStereo)等参量编码处理中能够解决区域变换的非效率性。并且,音响信号处理装置也能够削减进行区域变换的运算所需要的存储器的容量。
以上,根据多个实施方式对本发明的音响信号处理装置、音响编码装置和音响解码装置进行了说明,但是本发明不限于这些实施方式。对这些实施方式实施本领域技术人员能够想到的畸变而得到的方式、以及将这些实施方式中的构成要素进行任意组合而实现的其它方式,都包含在本发明中。
例如,由特定的处理部执行的处理也可以由另外的处理部执行。并且,也可以变更执行处理的顺序,还可以并行执行多个处理。
并且,本发明不仅能够实现为音响信号处理装置、音响编码装置或者音响解码装置,也能够实现为将构成音响信号处理装置、音响编码装置或者音响解码装置的处理单元作为步骤的方法。并且,本发明也能够实现为使计算机执行这些方法中包含的步骤的程序。另外,本发明还能够实现为记录了该程序的CD-ROM等计算机能够读取的记录介质。
并且,音响信号处理装置、音响编码装置或者音响解码装置所包含的多个构成要素也可以实现为集成电路即LSI(Large Scale Integration:大规模集成电路)。这些构成要素可以是独立的单片,也可以是包含一部分或者全部构成要素的单片。在此,把集成电路设为LSI,但根据集成度的不同,有时也称为IC(Integrated Circuit:集成电路)、系统LSI、超级LSI或者特级LSI。
并且,集成电路化的方法不限于LSI,也可以利用专用电路或通用处理器实现。也可以采用能够编程的FPGA(Field Programmable Gate Array:可现场编程门阵列)、能够重构架LSI内部的电路单元的连接和设定的可重构处理器(reconfigurable processor)。
另外,如果伴随半导体技术的发展或利用派生的其他技术替换LSI的集成电路化的技术问世,当然也可以使用该技术实现音响信号处理装置、音响编码装置或者音响解码装置所包含的构成要素的集成电路。
产业上的可利用性
本发明的音响信号处理装置对音频录制器、音频播放器、携带电话等是有用的。
标号说明
500重新取样部;501向上取样部;502低通滤波器;503、1102、2802向下取样部;504、601、901、1001、1101、1104、1203、1801、2402、2502、QMF分析滤波器组;505、602、1105、1204、1804时间拉伸电路;603、1003QMF区域变换器;902、1002、2703调整电路;903、1005、1209、1805、2401、2506QMF合成滤波器组;1004带通滤波器;1103编码部;1106、1205、1803、2503频率调制电路;1107参数计算部;1108、2808重叠部;1201、3001分离部;1202、2501解码部;1206高频带生成电路;1207参数解码部;1208概略形状调整电路;1802频带限制滤波器;2403第1时间拉伸电路;2404第2时间拉伸电路;2405第3时间拉伸电路;2406合并电路;2504耦合部;2505高频重建部;2601滤波器组;2602、2806、3004调整部;2701频带限制部;2702计算电路;2704区域变换器;2705、3006高频带生成部;2706高频带插补部;2801、3003第1滤波器组;2803第1编码部;2804、3009第2滤波器组;2807第2编码部;3002第2解码部;3007第1解码部。

Claims (22)

1.一种音响信号处理装置,使用规定的调整系数对输入音响信号序列进行变换,该音响信号处理装置具有:
滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述输入音响信号序列变换为QMF系数序列;以及
调整部,根据所述规定的调整系数来调整所述QMF系数序列。
2.根据权利要求1所述的音响信号处理装置,所述调整部根据表示规定的时间规整比的所述规定的调整系数,对所述QMF系数序列进行调整,以便能够从调整后的所述QMF系数序列得到以所述规定的时间规整比进行了时间规整的所述输入音响信号序列。
3.根据权利要求1所述的音响信号处理装置,所述调整部根据表示规定的频率调制比的所述规定的调整系数,对所述QMF系数序列进行调整,以便能够从调整后的所述QMF系数序列得到以所述规定的频率调制比进行了频率调制的所述输入音响信号序列。
4.根据权利要求1~3中任意一项所述的音响信号处理装置,所述滤波器组按照每个时间间隔将所述输入音响信号序列逐次变换为所述QMF系数序列,由此生成按照每个所述时间间隔的所述QMF系数序列,
所述调整部具有:
计算电路,针对按照每个所述时间间隔生成的所述QMF系数序列的每个时隙及每个子带,计算相位信息;以及
调整电路,根据所述规定的调整系数调整每个所述时隙及每个所述子带的所述相位信息,由此调整所述QMF系数序列。
5.根据权利要求4所述的音响信号处理装置,所述调整电路针对每个所述子带,将根据所述QMF系数序列的最初的时隙的所述相位信息和所述规定的调整系数计算出的值,与每个所述时隙的所述相位信息相加,由此调整每个所述时隙的所述相位信息。
6.根据权利要求4或5所述的音响信号处理装置,所述计算电路还对按照每个所述时间间隔生成的所述QMF系数序列的每个所述时隙及每个所述子带计算振幅信息,
所述调整电路还根据所述规定的调整系数调整每个所述时隙及每个所述子带的所述振幅信息,由此调整所述QMF系数序列。
7.根据权利要求1~6中任意一项所述的音响信号处理装置,所述调整部还具有频带限制部,该频带限制部在所述QMF系数序列的调整之前或者调整之后,从所述QMF系数序列提取与预先设定的带宽对应的新的QMF系数序列。
8.根据权利要求1~7中任意一项所述的音响信号处理装置,所述调整部针对每个子带以调整所述QMF系数序列的比例进行加权,并针对每个所述子带调整所述QMF系数序列。
9.根据权利要求1~8中任意一项所述的音响信号处理装置,所述调整部还具有区域变换器,该区域变换器在所述QMF系数序列的调整之前或者调整之后,将所述QMF系数序列变换为时间及频率的分辨率不同的新的QMF系数序列。
10.根据权利要求1~9中任意一项所述的音响信号处理装置,所述调整部从调整之前的所述QMF系数序列检测瞬变成分,并从调整之前的所述QMF系数序列提取检测到的所述瞬变成分,并对提取到的所述瞬变成分进行调整,将调整后的所述瞬变成分恢复为调整之后的所述QMF系数序列,由此调整所述QMF系数序列。
11.根据权利要求1~10中任意一项所述的音响信号处理装置,所述音响信号处理装置还具有:
高频带生成部,使用预先设定的变换系数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及
高频带插补部,针对所述高频带之中、未由所述高频带生成部生成所述高频带系数序列的频带即缺失频带的系数,使用属于与所述缺失频带的两侧邻接的频带的所述高频带系数序列进行插补。
12.一种音响编码装置,对第1音响信号序列进行编码,该音响编码装置具有:
第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述第1音响信号序列变换为第1QMF系数序列;
向下取样部,对所述第1音响信号序列进行向下取样,由此生成第2音响信号序列;
第1编码部,对所述第2音响信号序列进行编码;
第2滤波器组,使用QMF分析滤波器,将所述第2音响信号序列变换为第2QMF系数序列;
调整部,根据规定的调整系数来调整所述第2QMF系数序列;
第2编码部,将所述第1QMF系数序列和调整后的所述第2QMF系数序列进行比较,由此生成在解码时使用的参数,并对所述参数进行编码;以及
重叠部,将编码后的所述第2音响信号序列和编码后的所述参数进行重叠。
13.一种音响解码装置,从所输入的比特流中对第1音响信号序列进行解码,该音响解码装置具有:
分离部,从所输入的所述比特流中分离出编码后的参数和编码后的第2音响信号序列;
第1解码部,对编码后的所述参数进行解码;
第2解码部,对编码后的所述第2音响信号序列进行解码;
第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将由所述第2解码部解码后的所述第2音响信号序列变换为QMF系数序列;
调整部,根据规定的调整系数来调整所述QMF系数序列;
高频带生成部,使用解码后的所述参数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及
第2滤波器组,使用QMF合成滤波器,将所述高频带系数序列及调整之前的所述QMF系数序列变换为时域的所述第1音响信号序列。
14.一种音响信号处理方法,使用规定的调整系数对输入音响信号序列进行变换,该音响信号处理方法包括:
变换步骤,使用QMF(正交镜像滤波器)分析滤波器将所述输入音响信号序列变换为QMF系数序列;以及
调整步骤,根据所述规定的调整系数来调整所述QMF系数序列。
15.一种音响编码方法,对第1音响信号序列进行编码,该音响编码方法包括:
第1变换步骤,使用QMF(正交镜像滤波器)分析滤波器将所述第1音响信号序列变换为第1QMF系数序列;
向下取样步骤,对所述第1音响信号序列进行向下取样,由此生成第2音响信号序列;
第1编码步骤,对所述第2音响信号序列进行编码;
第2变换步骤,使用QMF分析滤波器,将所述第2音响信号序列变换为第2QMF系数序列;
调整步骤,根据规定的调整系数来调整所述第2QMF系数序列;
第2编码步骤,将所述第1QMF系数序列和调整后的所述第2QMF系数序列进行比较,由此生成在解码时使用的参数,并对所述参数进行编码;以及
重叠步骤,将编码后的所述第2音响信号序列和编码后的所述参数进行重叠。
16.一种音响解码方法,从所输入的比特流中对第1音响信号序列进行解码,该音响解码方法包括:
分离步骤,从所输入的所述比特流中分离出编码后的参数和编码后的第2音响信号序列;
第1解码步骤,对编码后的所述参数进行解码;
第2解码步骤,对编码后的所述第2音响信号序列进行解码;
第1变换步骤,使用QMF(正交镜像滤波器)分析滤波器,将由所述第2解码步骤解码后的所述第2音响信号序列变换为QMF系数序列;
调整步骤,根据规定的调整系数来调整所述QMF系数序列;
高频带生成步骤,使用解码后的所述参数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及
第2变换步骤,使用QMF合成滤波器,将所述高频带系数序列及调整之前的所述QMF系数序列变换为时域的所述第1音响信号序列。
17.一种程序,该程序使计算机执行权利要求14所述的音响信号处理方法中包含的步骤。
18.一种程序,该程序使计算机执行权利要求15所述的音响编码方法中包含的步骤。
19.一种程序,该程序使计算机执行权利要求16所述的音响解码方法中包含的步骤。
20.一种集成电路,使用规定的调整系数对输入音响信号序列进行变换,该集成电路具有:
滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述输入音响信号序列变换为QMF系数序列;以及
调整部,根据所述规定的调整系数来调整所述QMF系数序列。
21.一种集成电路,对第1音响信号序列进行编码,该集成电路具有:
第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将所述第1音响信号序列变换为第1QMF系数序列;
向下取样部,对所述第1音响信号序列进行向下取样,由此生成第2音响信号序列;
第1编码部,对所述第2音响信号序列进行编码;
第2滤波器组,使用QMF分析滤波器将所述第2音响信号序列变换为第2QMF系数序列;
调整部,根据规定的调整系数来调整所述第2QMF系数序列;
第2编码部,将所述第1QMF系数序列和调整后的所述第2QMF系数序列进行比较,由此生成在解码时使用的参数,并对所述参数进行编码;以及
重叠部,将编码后的所述第2音响信号序列和编码后的所述参数进行重叠。
22.一种集成电路,从所输入的比特流中对第1音响信号序列进行解码,该集成电路具有:
分离部,从所输入的所述比特流中分离出编码后的参数和编码后的第2音响信号序列;
第1解码部,对编码后的所述参数进行解码;
第2解码部,对编码后的所述第2音响信号序列进行解码;
第1滤波器组,使用QMF(正交镜像滤波器)分析滤波器,将由所述第2解码部解码后的所述第2音响信号序列变换为QMF系数序列;
调整部,根据规定的调整系数来调整所述QMF系数序列;
高频带生成部,使用解码后的所述参数,从调整之后的所述QMF系数序列生成新的QMF系数序列即高频带系数序列,该高频带系数序列对应于比调整之前的所述QMF系数序列所对应的频带高的高频带;以及
第2滤波器组,使用QMF合成滤波器,将所述高频带系数序列及调整之前的所述QMF系数序列变换为时域的所述第1音响信号序列。
CN201080003682.1A 2009-10-21 2010-10-19 音响信号处理装置、音响编码装置及音响解码装置 Active CN102257567B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2009-242603 2009-10-21
JP2009242603 2009-10-21
JP2010005282 2010-01-13
JP2010-005282 2010-01-13
JP2010059784 2010-03-16
JP2010-059784 2010-03-16
PCT/JP2010/006180 WO2011048792A1 (ja) 2009-10-21 2010-10-19 音響信号処理装置、音響符号化装置および音響復号装置

Publications (2)

Publication Number Publication Date
CN102257567A true CN102257567A (zh) 2011-11-23
CN102257567B CN102257567B (zh) 2014-05-07

Family

ID=43900037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080003682.1A Active CN102257567B (zh) 2009-10-21 2010-10-19 音响信号处理装置、音响编码装置及音响解码装置

Country Status (6)

Country Link
US (1) US9026236B2 (zh)
EP (2) EP2704143B1 (zh)
JP (1) JP5422664B2 (zh)
CN (1) CN102257567B (zh)
TW (1) TWI509596B (zh)
WO (1) WO2011048792A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111093302A (zh) * 2019-11-26 2020-05-01 深圳市奋达科技股份有限公司 音箱灯光控制方法和音箱
TWI769766B (zh) * 2020-08-04 2022-07-01 新唐科技股份有限公司 音頻處理裝置及音頻處理方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5854520B2 (ja) * 2010-03-09 2016-02-09 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ信号用の位相ボコーダに基づく帯域幅拡張方法における改善された振幅応答及び時間的整列のための装置及び方法
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
JP2014041240A (ja) * 2012-08-22 2014-03-06 Pioneer Electronic Corp タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム
PT2951825T (pt) 2013-01-29 2022-02-02 Fraunhofer Ges Forschung Aparelho e método para geração de um sinal aprimorado em frequência utilizando suavização temporal de sub-bandas
BR112015025022B1 (pt) 2013-04-05 2022-03-29 Dolby International Ab Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US9609451B2 (en) * 2015-02-12 2017-03-28 Dts, Inc. Multi-rate system for audio processing
CN106297813A (zh) * 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理
US9613628B2 (en) 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
CN106454449A (zh) * 2016-10-25 2017-02-22 深圳芯智汇科技有限公司 主音箱、从音箱及路由器控制同步播放音频的方法
CN108429713B (zh) * 2017-02-13 2020-06-16 大唐移动通信设备有限公司 一种数据压缩方法及装置
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
US10726828B2 (en) * 2017-05-31 2020-07-28 International Business Machines Corporation Generation of voice data as data augmentation for acoustic model training
US20190074805A1 (en) * 2017-09-07 2019-03-07 Cirrus Logic International Semiconductor Ltd. Transient Detection for Speaker Distortion Reduction
TWI763207B (zh) * 2020-12-25 2022-05-01 宏碁股份有限公司 聲音訊號處理評估方法及裝置
US20230143318A1 (en) * 2021-11-09 2023-05-11 Landis+Gyr Innovations, Inc. Sampling rate converter with line frequency and phase locked loops for energy metering

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954362A (zh) * 2004-05-19 2007-04-25 松下电器产业株式会社 音频信号编码装置及音频信号解码装置
CN1981326A (zh) * 2004-07-02 2007-06-13 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
WO2007126015A1 (ja) * 2006-04-27 2007-11-08 Panasonic Corporation 音声符号化装置、音声復号化装置、およびこれらの方法
EP2093757A1 (en) * 2007-02-20 2009-08-26 Panasonic Corporation Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0287741B1 (en) * 1987-04-22 1993-03-31 International Business Machines Corporation Process for varying speech speed and device for implementing said process
JP3491425B2 (ja) * 1996-01-30 2004-01-26 ソニー株式会社 信号符号化方法
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US20030182106A1 (en) * 2002-03-13 2003-09-25 Spectral Design Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal
US7627056B1 (en) * 2002-03-29 2009-12-01 Scientific Research Corporation System and method for orthogonally multiplexed signal transmission and reception on a non-contiguous spectral basis
US7160619B2 (en) 2003-10-14 2007-01-09 Advanced Energy Technology Inc. Heat spreader for emissive display device
WO2006027038A2 (en) * 2004-09-09 2006-03-16 Fujitsu Siemens Computers, Inc. Computer arrangement for providing services for clients over a network
AU2006232361B2 (en) 2005-04-01 2010-12-23 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
DE602006010323D1 (de) * 2006-04-13 2009-12-24 Fraunhofer Ges Forschung Audiosignaldekorrelator
UA94117C2 (ru) 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
US7647229B2 (en) * 2006-10-18 2010-01-12 Nokia Corporation Time scaling of multi-channel audio signals
KR101513028B1 (ko) * 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
CA2699316C (en) 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
JP5326465B2 (ja) * 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
EP2674943B1 (en) * 2009-01-28 2015-09-02 Dolby International AB Improved harmonic transposition
BR122021014305B1 (pt) * 2010-03-09 2022-07-05 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954362A (zh) * 2004-05-19 2007-04-25 松下电器产业株式会社 音频信号编码装置及音频信号解码装置
CN1981326A (zh) * 2004-07-02 2007-06-13 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
WO2007126015A1 (ja) * 2006-04-27 2007-11-08 Panasonic Corporation 音声符号化装置、音声復号化装置、およびこれらの方法
EP2093757A1 (en) * 2007-02-20 2009-08-26 Panasonic Corporation Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111093302A (zh) * 2019-11-26 2020-05-01 深圳市奋达科技股份有限公司 音箱灯光控制方法和音箱
CN111093302B (zh) * 2019-11-26 2023-05-12 深圳市奋达科技股份有限公司 音箱灯光控制方法和音箱
TWI769766B (zh) * 2020-08-04 2022-07-01 新唐科技股份有限公司 音頻處理裝置及音頻處理方法

Also Published As

Publication number Publication date
EP2704143A2 (en) 2014-03-05
JP5422664B2 (ja) 2014-02-19
EP2360688A1 (en) 2011-08-24
EP2360688A4 (en) 2013-09-04
TWI509596B (zh) 2015-11-21
US9026236B2 (en) 2015-05-05
JPWO2011048792A1 (ja) 2013-03-07
EP2360688B1 (en) 2018-12-05
EP2704143A3 (en) 2014-04-02
CN102257567B (zh) 2014-05-07
TW201137859A (en) 2011-11-01
WO2011048792A1 (ja) 2011-04-28
EP2704143B1 (en) 2015-01-07
US20120022676A1 (en) 2012-01-26

Similar Documents

Publication Publication Date Title
CN102257567B (zh) 音响信号处理装置、音响编码装置及音响解码装置
ES2247466T3 (es) Mejora de codificacion de la fuente utilizando replicacion de la banda espectral.
JP5425250B2 (ja) 瞬間的事象を有する音声信号の操作装置および操作方法
TWI446337B (zh) 用以使用級聯濾波器排組處理輸入音訊信號的裝置與方法
RU2487426C2 (ru) Устройство и способ преобразования звукового сигнала в параметрическое представление, устройство и способ модификации параметрического представления, устройство и способ синтеза параметрического представления звукового сигнала
RU2563164C2 (ru) Кодер расширения полосы пропускания, декодер расширения полосы пропускания и фазовый вокодер
CN101540171B (zh) 音频信号编码或解码
RU2490729C2 (ru) Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала
CN102741921B (zh) 改进的基于子带块的谐波换位
CA2879823C (en) Device, method and computer program for freely selectable frequency shifts in the subband domain
CN101894559A (zh) 音频处理方法及其装置
Beltrán et al. Estimation of the instantaneous amplitude and the instantaneous frequency of audio signals using complex wavelets
RU2409874C9 (ru) Сжатие звуковых сигналов
KR101333162B1 (ko) Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법
Gillan et al. Harmonic-band Complex Wavelet Transform Audio Analysis and Synthesis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140926

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140926

Address after: Seaman Avenue Torrance in the United States of California No. 2000 room 200

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.