CN1504993A - 用较少的计算量重构高频分量的声频解码方法和装置 - Google Patents
用较少的计算量重构高频分量的声频解码方法和装置 Download PDFInfo
- Publication number
- CN1504993A CN1504993A CNA200310101234A CN200310101234A CN1504993A CN 1504993 A CN1504993 A CN 1504993A CN A200310101234 A CNA200310101234 A CN A200310101234A CN 200310101234 A CN200310101234 A CN 200310101234A CN 1504993 A CN1504993 A CN 1504993A
- Authority
- CN
- China
- Prior art keywords
- sound channel
- fdrequency component
- high fdrequency
- signal
- channel signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000005236 sound signal Effects 0.000 claims description 47
- 238000012986 modification Methods 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 238000012805 post-processing Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000005237 high-frequency sound signal Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
提供一种以较小的计算量重构高频分量的声频信号解码方法和装置。所述解码装置包括:解码器;声道相似性确定单元;高频分量发生单元;和声频合成单元。所述方法对每个声道信号每隔一帧跳跃地产生各帧的高频分量;在左右声道信号彼此相似时,使用另一个声道信号的相对应的帧产生的高频分量,产生任何一个声道信号跳跃帧的高频分量;在左右声道信号彼此不相似时,使用相关声道信号的前帧,产生每个声道信号的跳跃帧的高频分量。
Description
技术领域
本发明涉及声频编码方法和装置,特别涉及一通过用较少的计算量重构声频信号的高频分量而能够获得和输出高质量的声频信号的声频解码方法和装置。
背景技术
一般,在声频编码中使用心理声学模型高效地压缩声频数据,使得少量位分配到人耳不能收听的高频分量中。此时,增加了压缩比,但是损失了高频声信号。由于损失高频声信号,所以在再现声频数据时,声音的音调改变,可读性降低,产生模糊的声音。因此,需要后处理方法,重构损失的高频分量来加强声音质量,以便完全地再现原始声音的音调和提高声频信号的可读性。
结合图1说明加强声频信号的声音质量的后处理方法。参见图1,如果输入编码的信号,它们被分成左右声道信号,并通过解码器110分别解码被分开的信号。然后,分别用第一和第二高频分量发生器单元120和130重构解码的左右声道信号的高频分量。
但是,因为大多数的声频信号的左右声道的声频信号彼此基本相似和高度冗余,所以不对它们单独编码。因此,存在的问题是,分开地重构左右声道信号的现有技术的后处理方法不能够有效地利用声道信号之间地相似性,因而不必要地增加了计算时间。
发明内容
本发明的一个目的是提供一种即使使用较少的计算也能加强声频信号的声音质量的声音解码方法和装置。
为实现上述目的,根据本发明的一个方面,提供了一种声频解码方法,该方法包括步骤:对每个声道信号每隔一帧跳跃地产生帧的高频分量;在左右声道信号彼此相似时,使用所产生的另一个声道信号的相应帧的高频分量,产生任何一个声道信号的跳跃的帧的高频分量;和在左右声道信号彼此不相似时,用相关的声道信号的前帧,产生每个声道信号的跳跃帧的高频分量。
根据本发明的另一方面,提供一种重构高频分量的声频解码装置,它包括:声频解码器,它接收编码的声频数据,解码接收的数据,和输出第一和第二声道的解码的声频数据;声道相似性确定单元,它确定在第一和第二声道信号之间的相似性;高频分量发生单元,它基于第一和声道信号之间的相似性,产生每个声道的声频信号的高频分量;和声频合成单元,它将解码的声频信号与产生的高频分量结合并输出结合的声频信号。
附图说明
通过结合以下优选实施例的说明将明了本发明的上述目的和其它特征。
图1是应用现有技术后处理算法的声频解码装置的方框图;
图2是根据本发明的声音解码装置的配置示意图;
图3是MPEG(活动图像专家组)一1层3的格式示意图;
图4是根据本发明的声频解码方法的整个处理过程流程图;
图5是根据本发明对每个声道信号每隔一个帧跳跃地,产生高频分量的处理图;
图6是在声道信号彼此不相似时,产生左右声道信号的高频分量的方法示意图;
图7是在声道信号彼此相似时,产生左右声道信号的高频分量的方法示意图;和
图8的图表,示出了与现有技术比较,本发明的声频解码方法声音质量的加强。
具体实施方式
下面参照附图详细说明本发明的声频解码装置的配置和工作。
图2示出声频解码装置200的配置示意图。参见图2,声频解码装置200包括:解码器210;声道相似性确定单元220;高频分量发生单元230;和声频合成单元240。装置200被配置成解码声频位流,然后重构来自解码的声频信号的各声道信号的高频分量。
解码器210解码输入的声频位流并产生声频信号。即,从输入的声频位流解码声频数据,然后将解码的数据去量化(dequantize),以恢复在声频数据的编码处理中以前进行的量化操作,使得输出原始声频信号。
这里,在解码器210中采用的解码方法可以根据压缩声频信号使用的编码类型,例如比例因子编码、AC一3、MEPG和霍夫曼(Huffman)编码等变化。然而,因为在声频信号处理中使用的编码器的配置和操作基本彼此相同,所以,在此省略其详细说明。
同时,已知SBR(频谱带复制Spectral Band Replication),即,从声频信号的低频范围重构高频范围的算法是迄今提出的声音质量强化的几种后处理算法当中的最有效的技术。但是,不能够将SBR2应用到各种声频编解码器,因为它是依靠MEPG-1层3的后处理算法。另外,与SBR2比较,SBRl能够用于各种声频编解码器,但是它将对每帧的左右声道信号进行后处理操作。因此,操作中不能够有效地利用两个声道之间的相似性,结果,增加了计算时间。因此,存在着几乎不能够将这种算法用于相关的产品的限制。
因此,为了减少与能够用于各种声频编解码器的相应于SBRl(下面简称为SBR)的问题的大计算量,和具有优良的重构性能,将本发明成配置成这样,通过声道相似性确定单元220和高频分量发生单元230,有效地利用声道的相似性,即使使用小的计算量也能够重构高频分量。
在输入解码的声频信号时,声道相似性确定单元220分析输入的声频信号是否包括模式信息。然后,声道相似性确定单元220根据该模式信息确定左右声道信号之间的相似性。否则,基于从声道信号之间的和及差信息获得的SNR(信噪比),确定声道信号之间的相似性。
这里,在声频信号不包括模式信息时使用SNR确定声道信号之间相似性的原因是,基于从声道信号之间的和及差获得的SNR值,能够容易地确定左右声道之间的相似性,因为在压缩比高时,在通常的声频编解码器中频繁编码该和及差信息。
下面,为了更好理解本发明,通过MEPG-1层3声频信号的例子说明确定左右声道信号之间相似性的方法。
图3示出了MEPG-1层3声频流的格式。
MEPG一1层3声频流由多个AAU(声音访问单元)300构成。每个AAU300是能够单个解码并含有预定的固定数目的压缩数据的取样的最小的单元。
每个AAU300包括:标题310,循环冗余校验(CRC)320,声频数据330,和辅助数据340。
标题310含有关于同步字、ID、层、保护位的存在、位速率指数、取样频率、填充位的存在、专用使用位、模式、模式扩展、版权、原始/复制和强调特征的信息。
CRC320是可任选的,16位长,并且标题310定义在每个AAU300中是否包括CRC320。
声频数据330是含有压缩声音数据的部分。
辅助数据340是在每个声频数据330的尾端未达到相关AAU的尾端时的剩余的部分。在辅助数据340中能够包括除了MPEG声频数据外的任何数据
如图3所示,MP3声频位流的标题310含有模式信息,该模式信息表示所述流是否使用声道信号之间的相似性被压缩。因此,通过分析输入的MP3声频位流的模式信息,能够容易地确定在声道信号之间的相似性。
因此,在包括上述模式信息的MEPG-1层3声频信号输入时,声道相似性确定单元220分析在输入信号中的模式信息,并根据模式信息是否是具有左右声道信号之间很大相似性的共同立体声(joint stereo)模式值,或是具有在声道信号之间很小相似性的立体声模式值,来确定在声道信号之间的相似性。
在另一方面,在解码的声频信号中不包括模式信息的情况,声道相似性确定单元220基于从声频信号获得的声道信号之间的和及差信息,计算与代表声道信号之间相似性的参数相对应的SNR。然后,如果计算的SNR值小于声道信号之间相似性的阈值,则确定这两个声道信号彼此相似。否则确定这两个声道信号不彼此相似。
即,将从关于声道的信号之间的和及差的信息获得的SNR值用作代表声道之间相似性的参数。现在详细说明基于关于两个声道信号之间的和及差的信息计算SNR值的方法。
首先,计算在这两个声道信号之间的和及差的能量值。然后,对通过用这两个声道信号之间的和及差的相加值除以声道信号之间的差的能量值获得的值取对数。然后,用10乘这个对数值。此时,为了减小计算能量值需要的计算,最好是使用这个信号之间的和及差的数值。
这里,可对声道信号之间相似性的阈值赋予试验值。在本发明中,20分贝的值确定为声道信号之间相似性的阈值。
因此,声道相似性确定单元220分析声频信号是否包括模式信息。如果是,则确定单元基于该模式信息确定左右声道信号之间的相似性。否则,确定单元基于从这两个声道信号之间的和及差的信息获得的SNR,确定相似性
本领域的技术人员能够作出确定左右声道信号之间相似性的方法的各种修改和等同的变型。例如,如果不是MPEG-1层3,而是AC-3声频信号包括在左右声道信号之间的差的信息中,也能够确定左右声道信号之间的相似性。另外,如果在声频位流中存在线性预测系数,则通过解码这个线性预测系数和建模谱包络信号也能够确定左右声道信号之间的相似性。
另外,高频分量发生单元230使用SBR算法,对每个声道每隔一个帧跳跃地重构左右声道信号的高频分量。然后,在左右声道信号彼此相似时,用在一个声道中产生的高频分量重构另外一个声道信号的跳跃的帧的高频分量。在左右声道信号彼此不相似时,用每个声道信号的前帧的高频分量,重构相关声道信号的跳跃帧的高频分量。稍后参照图5和7说明其详细情况。
在高频发生单元230重构每个声道信号的高频分量时,声频合成单元240产生通过将发生的高频分量加到解码的视频信号获得的输出。因此,依靠在声道信号之间的相似性,合适地重构高频分量,从而能够减少不必要的计算,并且也能够加强声音质量。
下面参照附图详细说明本发明的声频信号解码方法。
图4是根据本发明的声频信号解码方法的整个处理过程流程图。
首先,解码器210解码输入的声频位流并输出声频信号(S10)。这里,这个解码方法能够根据压缩声频信号使用的如AC-3、MEPG和霍夫曼编码等编码类型变化。
然后,高频分量发生单元230使用SBR算法对每个声道每隔一个帧跳跃地重构左右声道信号的高频分量(S20)。下面参照图5对上述更具体说明。
图5是根据本发明对每个声道信号每隔一个帧跳跃地产生高频分量的处理过程示意图。参见图5,高频发生单元230分别对左右声道信号每隔一个帧跳跃地重构高频分量。
即,从时间t1的帧产生左声道的高频分量(Lt1),而在时间t2的帧产生右声道(Rt2)的高频分量。相似地,这个处理在时间t3、t4、t5等被重复地进行。
然后,声道相似性确定单元220确定左右声道信号之间的相似性(S30)。下面简要说明确定声道信号之间相似性的方法。
首先,声道相似性确定单元220分析解码的声频信号是否包括模式信息。如果是,确定单元220基于模式信息确定声道信号之间的相似性,即,根据模式信息是具有左右声道信号之间大的相似性的共同立体声模式值,或是具有声道信号之间小的相似性的立体声模式值,确定声道信号之间的相似性
另一方面,在解码的声频信号中不包括模式信息时,声道相似性确定单元220基于从声频信号获得的声道信号之间的和及差的信息,计算相应于表示声道信号之间相似性的参数的SNR。然后,如果计算的SNR值小于声道信号之间的相似性的阈值,则确定这两个声道信号是彼此相似的。否则,确定这两个声道信号彼此不相似。即,如果在解码声频信号中不含有模式信息,则将从声道信号的和及差信息获得的SNR作为表示声道信号之间相似性的参数,然后与20分贝的阈值比较,确定声道信号之间的相似性。
已就图2和3说明了依靠模式信息确定声道信号之间相似性的方法,在此省略其详细说明。
另外,在声道相似性确定单元220确定左右声道信号彼此不相似时,高频分量发生单元230,使用每个声道信号的前帧的高频分量,重构跳跃帧的高频分量,从而产生各声道信号的高频分量(S40)。下面参照图6更详细说明这个处理。
图6是在两个声道信号彼此不相似时的产生左右声道信号的方法示意图。参见图6,在两个声道信号彼此不相似时,高频分量发生单元230用对每个声道信号的前帧产生的高频分量(在每隔一个帧跳跃时产生的高频分量),重构跳跃的帧的高频分量。
也就是说,用在时间t1的左声道信号信号的高频分量Lt1代替跳跃的帧的高频分量,即在时间t2的左声道的高频分量Lt2。相似地,在时间t2的右声道信号的高频分量Rt2代替在时间t3的高频分量Rt3。
在另一方面,在声道相似性确定单元220确定左右声道信号彼此相似时,高频分量发生单元230利用从一个声道信号产生的高频分量,重构另一声道信号的高频分量(S50)。下面参照图7详细说明这个处理。
图7是在左右声道信号彼此相似时的重构每个声道信号的高频分量的方法示意图。参见图7,在确定左右声道彼此相似时,高频分量发生单元230使得左声道信号的高频分量分别代替左右声道信号的跳跃帧的高频分量。此时,从每个声道信号产生的高频分量能够乘以预定的修改值(例如,特定的常数)并用于产生另一声道信号的高频分量。
即,左声道信号高频分量(Lt1)代替在时间t1的右声道信号相对应的高频分量Rt1,并且右声道信号的高频分量(Rt2)代替时间t2的左声道的高频分量(Lt2)。
此时,因为左右声道信号通常彼此很相似,所以声音质量的降低变得最小。而且,对每个声道信号每隔一帧跳跃地产生高频分量,并且将它们有效地用于另一声道信号的高频分量。因此,与传统的SBR算法相比较,计算量约能够减少30%。
最后,产生的高频分量与解码的声频信号结合,然后输出结合的信号(S60)。
总的来说,因为多数声频信号的左右声道信号彼此相似,所以根据本发明的解码方法解码声频信号位流,使得重构高频分量需要的计算,与现有技术相比,约减少30%。
图8示出了与现有技术的SBR和MP3方法相比较,本发明加强声音质量的例子。为了评价在64kbps的比率压缩的包括3首爵士音乐、9首流行音乐、7首摇滚音乐和6首古典音乐的各种歌曲的声频信号的声音质量,进行了14次试验。使用用于测量压缩数字声响/声频信号的周知的系统的歌剧工具(opera tool),作为声音质量评价程序。按照由歌剧工具测量的值接近零,确定改进重构的声音质量。
如图8所示,能够理解,根据本发明重构高频分量的方法再现的声频信号的声音质量,几乎与现有技术SBR和MP3方法再现的声频信号的声音质量相同或它们的差别可忽略。
因此,与传统的SBR算法相比较,本发明使得即使在计算量减少约30%的情况下也能够输出高质量的声频信号,而现有技术的SBR算法,尽管也具有良好的加强声音质量的作用,但是由于过量的计算时间,实际应用到相关产品是困难的。
而且,本发明的优选实施例能够以计算机可执行的程序的形式实现。另外,通过计算机可读记录介质,所述程序能够在数字计算机上运行。
所述计算机可读记录介质包括磁性记录介质(如ROM、软盘、硬盘等),光学可读介质(如CD ROM、DVD等)和载波(如通过因特网传输)。
虽然现有技术能够使得声音质量改善,但是由于过多的计算时间,现有技术应用到相关产品是困难的,但是根据上述的本发明,能够解决这个关键问题。因此,优点是重构高频分量需要的计算时间能够约减少了30%。
虽然结合图示的优选实施例说明了本发明,但是本领域的技术人员应当理解,在不偏离本发明的范围和精神的情况下,能够做出各种改变。因此,本发明的优选实施例是示范说明,而不是限定本发明。本发明由权利要求限定,各种修改方案应包括在本发明内。
Claims (17)
1.一种在解码声频数据时产生高频分量的方法,包括步骤:
利用第一和第二声道信号之间的相似性,产生高频分量。
2.如权利要求1所述的方法,其中基于第一和第二声道信号之间的和及差的信息获得的信噪比(SNR),确定声道信号之间的相似性。
3.如权利要求1所述的方法,其中声频数据包括模式信息。
4.如权利要求3所述的方法,还包括步骤:确定模式信息是否是表示在第一和第二声道信号之间大的相似性的共同立体声值,或是表示第一和第二声道信号之间没有相似性的立体声模式值。
5.如权利要求1所述的方法,还包括步骤:在第一和第二声道信号彼此相似时,
产生每个声道信号的仅一些帧的高频分量;和
使用另一声道信号的某些帧的产生的高频分量,产生每个声道信号的其它一些帧的高频分量。
6.如权利要求5所述的方法,其中通过适当修改一些帧的高频分量产生其它帧的高频分量。
7.如权利要求1所述的方法,还包括步骤:在第一和第二声道信号彼此不相似时,
产生每个声道信号的仅一些帧的高频分量;和
使用相关声道信号的一些帧的产生的高频分量,产生每个声道信号的其它帧的高频分量。
8.如权利要求7所述的方法,其中通过适当修改一些帧的高频分量产生其它帧的高频分量。
9.一种重构高频分量的声频解码方法,包括步骤:
(a)接收编码的声频数据,解码接收的数据,和输出第一和第二声道的解码的声频信号;
(b)产生每个第一和第二声道信号的仅一些帧的高频分量;
(c)确定在第一声道和第二声道信号之间的相似性;
(d)在第一和第二声道信号彼此相似时,使用另一声道信号的一些帧的产生的高频分量,产生每个声道信号的另一些帧的高频分量;和
(e)将产生的高频分量与解码的声频信号结合,并输出结合的声频信号。
10.如权利要求9所述的方法,其中步骤(c)包括步骤:基于从第一和第二声道信号的和及差信息获得的信噪比(SNR),确定声道信号之间的相似性。
11.如权利要求9所述的方法,其中声频数据包括模式信息。
12.如权利要求9所述的方法,其中步骤(c)包括步骤:确定模式信息是否是表示表在第一和第二声道信号之间大的相似性的共同立体声值,或是表示第一和第二声道信号之间无相似性的立体声模式值。
13.如权利要求9所述的方法,还包括步骤:在确定第一和第二声道信号彼此不相似时,使用相关声道信号的一些帧的产生的高频分量,产生每个声道信号的其它帧的高频分量。
14.一种重构高频分量的声频解码装置,包括:
声频解码器,接收编码的声频数据,解码接收的数据,和输出第一和第二声道的解码的声频数据;
声道相似性确定单元,确定第一和第二声道信号之间的相似性;
高频分量发生单元,基于第一和第二声道信号之间的相似性,产生每个声道的声频信号的高频分量;和
声频合成单元,将解码的声频信号与产生的高频分量结合,并输出结合的声频数据。
15.如权利要求14所述的装置,其中高频分量发生单元被配置成在第一和第二声道信号彼此相似时,产生每个第一和第二声道信号的仅一些帧的高频分量,然后使用另一声道信号的一些帧的产生的高频分量,产生每个声道信号的其它帧的高频分量。
16.如权利要求14所述的装置,其中高频分量发生单元被配置成在第一和第二声道信号彼此不相似时,产生每个声道的仅一些帧的高频分量,然后使用相关声道信号的一些帧的产生的高频分量,产生每个声道信号其它帧的高频分量。
17.一种计算机可读记录介质,其中记录了在计算机中执行权利要求1-13任何一项权利要求所述方法的程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR0075529/2002 | 2002-11-29 | ||
KR10-2002-0075529A KR100501930B1 (ko) | 2002-11-29 | 2002-11-29 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
KR0075529/02 | 2002-11-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1504993A true CN1504993A (zh) | 2004-06-16 |
CN1266672C CN1266672C (zh) | 2006-07-26 |
Family
ID=32388286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003101012347A Expired - Fee Related CN1266672C (zh) | 2002-11-29 | 2003-10-13 | 用较少的计算量重构高频分量的声频解码方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7444289B2 (zh) |
JP (1) | JP4022504B2 (zh) |
KR (1) | KR100501930B1 (zh) |
CN (1) | CN1266672C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010111841A1 (zh) * | 2009-04-03 | 2010-10-07 | 华为技术有限公司 | 频域脉冲解码的预测方法和预测装置及解码器 |
CN104813395A (zh) * | 2012-09-17 | 2015-07-29 | 弗兰霍菲尔运输应用研究公司 | 从带宽有限音频信号生成带宽扩展信号的设备和方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
WO2009084226A1 (ja) * | 2007-12-28 | 2009-07-09 | Panasonic Corporation | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 |
JP2010102042A (ja) * | 2008-10-22 | 2010-05-06 | Ntt Docomo Inc | 音声信号出力装置、音声信号出力方法および音声信号出力プログラム |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
CN107818789B (zh) * | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
JP5744992B2 (ja) * | 2013-09-17 | 2015-07-08 | 株式会社Nttドコモ | 音声信号出力装置、音声信号出力方法および音声信号出力プログラム |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
US11545162B2 (en) | 2017-10-24 | 2023-01-03 | Samsung Electronics Co., Ltd. | Audio reconstruction method and device which use machine learning |
CN109979486B (zh) * | 2017-12-28 | 2021-07-09 | 中国移动通信集团北京有限公司 | 一种语音质量评估方法及装置 |
CN108231091B (zh) * | 2018-01-24 | 2021-05-25 | 广州酷狗计算机科技有限公司 | 一种检测音频的左右声道是否一致的方法和装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5639646A (en) * | 1979-09-07 | 1981-04-15 | Pioneer Electronic Corp | Processor for demodulation output of stereophonic signal |
US6289308B1 (en) * | 1990-06-01 | 2001-09-11 | U.S. Philips Corporation | Encoded wideband digital transmission signal and record carrier recorded with such a signal |
KR0134318B1 (ko) * | 1994-01-28 | 1998-04-29 | 김광호 | 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치 |
JP2798003B2 (ja) | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JP3136995B2 (ja) * | 1996-05-30 | 2001-02-19 | 日本ビクター株式会社 | ラウドネス回路 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3484341B2 (ja) * | 1998-03-30 | 2004-01-06 | 三菱電機株式会社 | 音声信号伝送装置 |
JP3596296B2 (ja) | 1998-08-06 | 2004-12-02 | 松下電器産業株式会社 | 音場再生装置および方法 |
US7031474B1 (en) | 1999-10-04 | 2006-04-18 | Srs Labs, Inc. | Acoustic correction apparatus |
JP3894722B2 (ja) * | 2000-10-27 | 2007-03-22 | 松下電器産業株式会社 | ステレオオーディオ信号高能率符号化装置 |
JP2002168694A (ja) * | 2000-12-04 | 2002-06-14 | Inst Of Physical & Chemical Res | 分光器 |
JP3951690B2 (ja) * | 2000-12-14 | 2007-08-01 | ソニー株式会社 | 符号化装置および方法、並びに記録媒体 |
JP2002182699A (ja) * | 2000-12-15 | 2002-06-26 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
JP3755739B2 (ja) | 2001-02-15 | 2006-03-15 | 日本電信電話株式会社 | ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体 |
KR100462615B1 (ko) * | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
-
2002
- 2002-11-29 KR KR10-2002-0075529A patent/KR100501930B1/ko not_active IP Right Cessation
-
2003
- 2003-08-12 JP JP2003292364A patent/JP4022504B2/ja not_active Expired - Fee Related
- 2003-09-02 US US10/652,189 patent/US7444289B2/en not_active Expired - Fee Related
- 2003-10-13 CN CNB2003101012347A patent/CN1266672C/zh not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010111841A1 (zh) * | 2009-04-03 | 2010-10-07 | 华为技术有限公司 | 频域脉冲解码的预测方法和预测装置及解码器 |
CN102246229B (zh) * | 2009-04-03 | 2013-03-27 | 华为技术有限公司 | 频域脉冲解码的预测方法和预测装置及解码器 |
CN104813395A (zh) * | 2012-09-17 | 2015-07-29 | 弗兰霍菲尔运输应用研究公司 | 从带宽有限音频信号生成带宽扩展信号的设备和方法 |
CN104813395B (zh) * | 2012-09-17 | 2017-11-24 | 弗劳恩霍夫应用研究促进协会 | 从带宽有限音频信号生成带宽扩展信号的设备和方法 |
US9997162B2 (en) | 2012-09-17 | 2018-06-12 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
US10580415B2 (en) | 2012-09-17 | 2020-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
Also Published As
Publication number | Publication date |
---|---|
CN1266672C (zh) | 2006-07-26 |
US20040107090A1 (en) | 2004-06-03 |
KR20040047361A (ko) | 2004-06-05 |
KR100501930B1 (ko) | 2005-07-18 |
US7444289B2 (en) | 2008-10-28 |
JP2004184975A (ja) | 2004-07-02 |
JP4022504B2 (ja) | 2007-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1205755C (zh) | 以少量计算恢复高频分量的音频解码方法和装置 | |
CN1197254C (zh) | 编码无损压缩方法及其装置和译码无损压缩方法及其装置 | |
CN1272911C (zh) | 音频信号解码装置及音频信号编码装置 | |
CN1266672C (zh) | 用较少的计算量重构高频分量的声频解码方法和装置 | |
CN1262990C (zh) | 利用谐波提取的音频编码方法和设备 | |
JP2005157390A (ja) | 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 | |
CN1878001A (zh) | 对音频数据编码及解码的设备及方法 | |
CN1961351A (zh) | 可缩放的无损音频编解码器和创作工具 | |
CN1357136A (zh) | 不损失译码器兼容性下低比特率音频编码系统的音质提高 | |
CN101030373A (zh) | 使用自适应掩蔽阈值的立体声感知音频编码的系统和方法 | |
CN1784020A (zh) | 使用频带间的相关来处理音频信号的设备、方法和介质 | |
CN1945695A (zh) | 对音频信号编码/解码的方法和设备 | |
JP2006201785A (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
CN1885724A (zh) | 产生音频信号比特流方法和设备及音频编解码方法和设备 | |
JP3824607B2 (ja) | 時間−周波数相関性を利用した改善されたオーディオ符号化及び/または復号化方法とその装置 | |
CN1252678C (zh) | 可缩放的立体声音频编码/解码方法及装置 | |
WO2008116065A1 (en) | Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms | |
CN1227812C (zh) | 为编码器中的预测滤波器生成系数 | |
CN1273955C (zh) | 采用带宽扩展技术编码和/或解码音频数据的方法和装置 | |
JP2002132295A (ja) | ステレオオーディオ信号高能率符号化装置 | |
CN1148106C (zh) | 压缩多声道音频位元流的解码装置及方法 | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
CN1722277A (zh) | 直接由编码器硬件生成dvd数据流的系统及方法 | |
Malvar | Lossless and near-lossless audio compression using integer-reversible modulated lapped transforms | |
KR100349329B1 (ko) | 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060726 Termination date: 20141013 |
|
EXPY | Termination of patent right or utility model |