CN101772805A - 正弦音频编码的方法和装置及正弦音频解码的方法和装置 - Google Patents
正弦音频编码的方法和装置及正弦音频解码的方法和装置 Download PDFInfo
- Publication number
- CN101772805A CN101772805A CN200880101939A CN200880101939A CN101772805A CN 101772805 A CN101772805 A CN 101772805A CN 200880101939 A CN200880101939 A CN 200880101939A CN 200880101939 A CN200880101939 A CN 200880101939A CN 101772805 A CN101772805 A CN 101772805A
- Authority
- CN
- China
- Prior art keywords
- sinusoidal signal
- frequency
- sinusoid
- amplitude
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000013139 quantization Methods 0.000 claims description 15
- 238000013459 approach Methods 0.000 claims description 14
- 238000011002 quantification Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供了一种用于正弦音频编码和解码的方法和装置。该正弦音频编码的方法包括:对输入信号执行正弦分析并提取当前帧的正弦信号;通过使用延续到当前帧的连续模式正弦信号的前一帧的正弦信号来跟踪并编码当前帧的连续模式正弦信号;搜索具有最接近于当前帧的原生模式正弦信号的频率的频率的正弦信号;计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差;以及编码该原生模式正弦信号的频率。
Description
优先权
本申请要求于2007年6月7日向韩国知识产权局提交的韩国专利申请No.10-2007-0055717的优先权,该在先申请的全部内容以引用的方式并入本文。
技术领域
与本发明一致的方法和装置涉及音频信号的编码和解码,更具体地,涉及原生(birth)模式正弦信号(sinusoid)的高效编码和解码。
背景技术
参量编码是一种根据某些参数编码音频信号的方法。参量编码用于运动图像专家组-4(MPEG-4)标准中。
图1是用于描述现有技术参量编码方法的图。参量编码方法分析输入音频信号并且将其参数化。
参考图1,对输入音频信号执行音频读取和滤波。对输入音频信号的每个区域执行瞬态分析、正弦分析和噪声分析,从而提取每个区域的音频分量的参数。瞬态分析对应于非常动态的音频变化。正弦分析对应于确定性的音频变化。噪声分析对应于随机的或非确定的音频变化。
对提取的参数执行比特流格式化。
在执行正弦分析之后,跟踪提取的正弦信号以用于自适应差分脉冲码调制(ADPCM)编码或差分脉冲码调制(DPCM)编码。该跟踪搜索当前帧的从前一帧的正弦信号延续的正弦信号并且在它们之间设置对应性。当前帧的可以从前一帧的正弦信号跟踪的正弦信号被称为连续模式正弦信号。连续模式正弦信号可以通过使用对应于该连续模式正弦信号的前一帧的正弦信号来高效地编码。
另一方面,当前帧的不能从前一帧的正弦信号跟踪的正弦信号被称为原生模式正弦信号。原生模式正弦信号是在当前帧中新产生的而不是从前一帧的正弦信号延续的。一般说来,原生模式正弦信号不能通过使用前一帧的正弦信号编码,因而编码需要大量的比特。
因此,需要一种降低比特数目的方法来编码原生模式正弦信号。
图2是现有技术音频编码方法的流程图。
参考图2,对输入音频信号执行正弦分析,并且提取正弦信号(也称为泛音(partial))。在操作S100中通过使用关于该正弦信号的信息来跟踪提取的正弦信号。该跟踪搜索当前帧的从前一帧的正弦信号延续的正弦信号并且在它们之间设置对应性。在跟踪正弦信号期间,编码连续模式正弦信号。
在操作S110中,按照频率递增的顺序来对当前帧的正弦信号当中的原生模式正弦信号进行排序。这里,原生模式正弦信号的数目假定为n。
在操作S120中,按照从具有较低频率的原生模式正弦信号到具有较高频率的原生模式正弦信号的频率顺序一个接一个地输入原生模式正弦信号,以便执行后续操作。这里,原生模式正弦信号的频率和幅度分别被表示为f(i)和a(i)。
1.在操作S130中量化幅度a(i)。量化后的幅度被表示为q_a(i)。
2.在操作S140中,确定原生模式正弦信号是否具有最低频率。如果确定原生模式正弦信号具有最低频率,则在操作S150和S170中,绝对编码量化后的幅度q_a(i)。
3.如果确定原生模式正弦信号不具有最低频率,则在操作S160中计算当前原生模式正弦信号的量化幅度q_a(i)与前一原生模式正弦信号的量化幅度q_a(i-1)之间的差,并且在操作S170中编码该差。
图3是应用图2的音频编码方法的示例的图。
参考图3,当前帧的正弦信号是p30、p31、p32、p33、p34、p35和p36并且连续模式正弦信号是p31、p32、p34和p36。连续模式正弦信号p31从前一正弦信号p20延续,连续模式正弦信号p32从前一正弦信号p21延续,连续模式正弦信号p34从前一正弦信号p22延续,以及连续模式正弦信号p36从前一正弦信号p23延续。
另一方面,原生模式正弦信号是p30、p33和p35。
如果这里应用图2的现有技术音频编码方法,则原生模式正弦信号p30的幅度a30被绝对编码。但是,对于原生模式正弦信号p33的幅度a33,计算并编码差diff33=a33-a30。此外,对于原生模式正弦信号p35的幅度a35,计算并编码差diff35=a35-a33。
发明内容
技术问题
本发明通过解决在原生模式正弦信号之间执行差分编码的现有技术方法的问题来提供高效编码方法。
在音频信号中,频率彼此接近的正弦信号也具有相似的幅度。因此,当对正弦信号的幅度执行差分编码时,计算与具有接近频率的正弦信号的幅度差是有益的。但是,反过来参考图2,在原生模式正弦信号之间执行差分编码,从而如果它们之间的频率差很大的话,会大大降低编码效率。反过来参考图3,当原生模式正弦信号p33被编码时,由于原生模式正弦信号p30和p33之间的大的频率差,它们之间的幅度差也可能很大。在这种情况下,如果幅度差被编码,则编码值具有大量的比特。例如,如果幅度a33为3比特并且幅度a30为10比特,则幅度差大于幅度a33。
如果正弦信号的幅度之间具有相关性的话,则执行差分编码,因为编码所需的比特数目小于执行绝对编码时的比特数目。但是,在上述示例中,绝对编码可能更高效。
本发明提出一种通过使用其间具有大的相关性的正弦信号来进一步降低编码原生模式正弦信号所需的比特数目的高效方法。
技术方案
本发明提供一种用于能够高效编码原生模式正弦信号的正弦音频编码的方法和装置以及其上记录有用于运行该正弦音频编码的方法的计算机程序的计算机可读记录介质。
本发明还提供一种用于能够高效解码原生模式正弦信号的正弦音频解码的方法和装置以及其上记录有用于运行该正弦音频解码的方法的计算机程序的计算机可读记录介质。
有益效果
如上所述,根据本发明的示范性实施例,可以通过从包括连续模式正弦信号以及原生模式正弦信号的正弦信号当中搜索具有最接近于原生模式正弦信号的频率的正弦信号并且计算原生模式正弦信号与具有最接近的频率的正弦信号之间的幅度差,来编码原生模式正弦信号的幅度以使得编码后的幅度具有低比特率。因而,实现音频信号的高效编码。
附图说明
通过下面参考附图对本发明的示范性实施例的详细描述,本发明的上述及其它方面将变得更加明显,其中:
图1是用于描述分析并参数化输入音频信号的现有技术的参量编码方法的图;
图2是现有技术音频编码方法的流程图;
图3是应用图2的音频编码方法的示例的图;
图4是根据本发明的示范性实施例的用于正弦音频编码的装置的框图;
图5是根据本发明的示范性实施例的正弦音频编码方法的流程图;
图6是根据本发明的示范性实施例的用于正弦音频解码的装置的框图;
图7是应用根据本发明的示范性实施例的正弦音频编码方法的示例的图;
图8是应用根据本发明的另一个示范性实施例的正弦音频编码方法的示例的图;以及
图9是根据本发明的示范性实施例的正弦音频编码方法与现有技术正弦音频编码方法相比获得的编码增益(gain)的表。
具体实施方式
根据本发明的一方面,提供一种正弦音频编码的方法,该方法包括:对输入信号执行正弦分析并提取当前帧的正弦信号;通过使用延续到当前帧的连续模式正弦信号的前一帧的正弦信号来跟踪并编码当前帧的连续模式正弦信号;搜索具有最接近于当前帧的原生模式正弦信号的频率的频率的正弦信号;计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差;以及编码该原生模式正弦信号的频率。
所述搜索具有最接近的频率的正弦信号的步骤可以包括:从具有比该原生模式正弦信号的频率低的频率的正弦信号当中搜索具有最接近的频率的另一个正弦信号。
所述搜索具有最接近的频率的正弦信号的步骤可以包括:从先前编码的正弦信号当中搜索具有最接近的频率的另一个正弦信号。
所述计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差的步骤可以包括:量化具有最接近的频率的正弦信号的幅度;逆量化该量化的幅度;计算该原生模式正弦信号的幅度与该逆量化的幅度之间的差;量化该差;以及编码该量化的差。
根据本发明的另一方面,提供一种正弦音频编码的装置,该装置包括:正弦分析单元,对输入信号执行正弦分析并提取当前帧的正弦信号;正弦信号跟踪单元,通过使用延续到当前帧的连续模式正弦信号的前一帧的正弦信号来跟踪并编码当前帧的连续模式正弦信号;原生模式幅度编码单元,搜索具有最接近于当前帧的原生模式正弦信号的频率的频率的正弦信号,以及计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差;以及原生模式频率编码单元,编码该原生模式正弦信号的频率。
该原生模式幅度编码单元可以从具有比该原生模式正弦信号的频率低的频率的正弦信号当中搜索具有最接近的频率的正弦信号。
该原生模式幅度编码单元可以从先前编码的正弦信号当中搜索具有最接近的频率的正弦信号。
该原生模式幅度编码单元可以量化具有最接近的频率的正弦信号的幅度、逆量化该量化的幅度、计算该原生模式正弦信号的幅度与逆量化的幅度之间的差、量化该差、以及编码该量化的差。
根据本发明的另一方面,提供一种正弦音频解码的方法,该方法包括:解码当前帧的编码的正弦信号当中的连续模式正弦信号;解码当前帧的原生模式正弦信号的频率;搜索具有最接近于解码的频率的频率的正弦信号;解码该原生模式正弦信号的编码的幅度差;以及通过将具有最接近的频率的正弦信号的幅度与该解码的幅度差相加来计算原生模式正弦信号的幅度。
所述搜索具有最接近的频率的正弦信号的步骤可以包括:从具有比该原生模式正弦信号的频率低的频率的正弦信号当中搜索具有最接近的频率的正弦信号。
所述搜索具有最接近的频率的正弦信号的步骤可以包括:从先前解码的正弦信号当中搜索具有最接近的频率的正弦信号。
根据本发明的另一方面,提供一种正弦音频解码的装置,该装置包括:连续模式正弦解码单元,用于解码当前帧的编码的正弦信号当中的连续模式正弦信号;原生模式频率解码单元,用于解码当前帧的原生模式正弦信号的频率;以及原生模式幅度解码单元,用于搜索具有最接近于解码的频率的频率的正弦信号,解码该原生模式正弦信号的编码的幅度差,以及通过将具有最接近的频率的正弦信号的幅度与该解码的幅度差相加来计算原生模式正弦信号的幅度。
该原生模式幅度解码单元可以从具有比该原生模式正弦信号的频率低的频率的正弦信号当中搜索具有最接近的频率的正弦信号。
该原生模式幅度解码单元可以从先前解码的正弦信号当中搜索具有最接近的频率的正弦信号。
具体实施方式
下面将通过参考附图描述本发明的示范性实施例来详细描述本发明。
图4是根据本发明的示范性实施例的用于正弦音频编码的装置100的框图。
参考图4,装置100包括正弦分析单元110、正弦信号跟踪单元120、原生模式幅度编码单元130和原生模式频率编码单元140。
正弦分析单元110对输入音频信号执行正弦分析并且提取当前帧的正弦信号。
正弦信号跟踪单元120通过使用延续到当前帧的连续模式正弦信号的前一帧的正弦信号来跟踪并编码当前帧的连续模式正弦信号。
原生模式幅度编码单元130搜索具有最接近于当前帧的原生模式正弦信号的频率的频率的正弦信号,以及计算并编码具有最接近的频率的正弦信号的幅度与原生模式正弦信号的幅度之间的差。
原生模式频率编码单元140编码原生模式正弦信号的频率。
图5是根据本发明的示范性实施例的正弦音频编码方法的流程图。将结合图4来描述图5的流程图。
参考图5,正弦分析单元110对输入信号执行正弦分析并且提取当前帧的正弦信号(操作未示出)。正弦信号也被称为泛音。
在操作S200中,正弦信号跟踪单元120跟踪并编码连续模式正弦信号。执行连续模式正弦信号的跟踪以便确定当前帧的正弦信号是否从前一帧的正弦信号延续而来。
不从前一帧的正弦信号跟踪的正弦信号是在当前帧中新产生的并且被称为原生模式正弦信号或原生泛音。在操作S210中按照频率递增的顺序对原生模式正弦信号进行排序。这里,原生泛音的数目假定为n。
在操作S220中,按照从具有较低频率的原生模式正弦信号到具有较高频率的原生模式正弦信号的频率顺序一个接一个地输入原生模式正弦信号,以便执行后续操作。这里,原生模式正弦信号以及原生模式正弦信号的频率和幅度分别被表示为p(i)、f(i)和a(i)。
1.在操作S330中量化频率f(i)。量化后的频率被表示为q_f(i)。
2.在操作S240中将量化的频率q_f(i)逆量化。逆量化后的频率被表示为iq_f(i)。
3.在操作S250中查找具有最接近于频率f(i)的频率的正弦信号。具有最接近的频率的正弦信号被表示为pnf(i)。
4.在操作S260中计算并编码当前要被编码的原生模式正弦信号p(i)的幅度a(i)与具有最接近的频率的正弦信号pnf(i)的幅度b(i)之间的差。
执行操作S230和S240以便将频率设置为与以后执行解码时所用的频率相同。
图6是根据本发明的示范性实施例的用于正弦音频解码的装置200的框图。
参考图6,装置200包括连续模式正弦信号解码单元210、原生模式频率解码单元220和原生模式幅度解码单元230。
连续模式正弦信号解码单元210解码当前帧的编码的正弦信号当中的连续模式正弦信号。
原生模式频率解码单元220解码当前帧的原生模式正弦信号的频率。
原生模式幅度解码单元230搜索具有最接近于解码的频率的频率的正弦信号、解码原生模式正弦信号的编码的幅度差、以及通过将具有最接近的频率的正弦信号的幅度与解码的幅度差相加来计算原生模式正弦信号的幅度。
图7是应用根据本发明的示范性实施例的正弦音频编码方法的示例的图。
参考图7,当前帧的正弦信号是p30、p31、p32、p33、p34、p35和p36,并且连续模式正弦信号是p31、p32、p34和p36。连续模式正弦信号p31从前一正弦信号p20延续,连续模式正弦信号p32从前一正弦信号p21延续,连续模式正弦信号p34从前一正弦信号p22延续,以及连续模式正弦信号p36从前一正弦信号p23延续。
另一方面,原生模式正弦信号是p30、p33和p35。
在根据现有技术方法的图3中,为了编码原生模式正弦信号p33的幅度a33,在原生模式正弦信号p30、p33和p35当中查找具有与原生模式正弦信号p33最接近的频率的原生模式正弦信号p30,并且计算并编码差diff33_related=a33-a30。
另一方面,根据当前示范性实施例,从包括连续模式正弦信号以及原生模式正弦信号的所有正弦信号当中查找具有最接近于原生模式正弦信号p33的频率的频率的连续模式正弦信号p32,并且计算并编码差diff33_present10=a33-a32。
由于原生模式正弦信号p33和原生模式正弦信号p30之间的频率差很大,因此差diff33_related也很大。另一方面,由于原生模式正弦信号p33和连续模式正弦信号p32之间的频率差较小,因此差diff33_present 10也较小。因而,根据本发明,降低了编码原生模式正弦信号的幅度所需的比特数。
反过来参考图5,可以通过使用如下所述的各种方法来执行操作S250中的搜索具有最接近的频率的正弦信号。
1.从紧接着的前一帧和当前帧的先前编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
2.从先前编码并存储在存储单元中的正弦信号,也即所有先前帧和当前帧的编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
3.从除了当前帧的正弦信号之外的所有先前编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
4.从当前帧的先前编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
5.从具有比要被编码的原生模式正弦信号的频率低的频率的、紧接着的前一帧和当前帧的先前编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
6.从具有比要被编码的原生模式正弦信号的频率低的频率的、先前编码并存储在存储单元中的正弦信号,也即所有先前帧和当前帧的编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
7.从具有比要被编码的原生模式正弦信号的频率低的频率的、除当前帧的正弦信号之外的所有先前编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
8.从具有比要被编码的原生模式正弦信号的频率低的频率的、当前帧的先前编码的正弦信号当中搜索具有最接近的频率的正弦信号的方法。
现在将参考图8描述通过使用除了当前帧的正弦信号之外的前一帧的正弦信号获得的优点。
图8是应用根据本发明的另一个示范性实施例的正弦音频编码方法的示例的图。
参考图8,假定正弦信号p33’被编码,在当前帧中具有最接近的频率的正弦信号是正弦信号p32’。但是,在前一帧中具有最接近的频率的正弦信号是正弦信号p21’。因此,如果仅仅使用当前帧的正弦信号,则通过使用正弦信号p32’来编码正弦信号p33’的幅度。在这种情况下,由参考数字21来表示幅度差。但是,如果也使用前一帧的正弦信号的话,则通过使用正弦信号p21’来编码正弦信号p33’的幅度。在这种情况下,由参考数字20表示幅度差。
反过来参考图5,在操作S260中的计算并编码幅度a(i)和幅度b(i)之间的差可以通过使用如下所述的各种方法来执行。
1.量化要被编码的正弦信号的幅度a(i)和具有最接近的频率的正弦信号的幅度b(i)中的每一个(量化后的幅度分别被表示为qa和qb)以及计算并编码量化的幅度之间的差(y=qa-qb)的方法。这里,解码器具有与qb和y对应的值,因而可以计算出qa=qb+y。
2.量化具有最接近的频率的正弦信号的幅度b(i)(量化后的幅度被表示为qb)、计算要被编码的正弦信号的幅度a(i)与量化的幅度qb之间的差(d=a(i)-qb)、以及量化并编码该差d的方法。
这里,解码器可以通过逆量化该编码值来计算差d,并且可以由差d计算正弦信号的幅度a(i)(a(i)=d+qb)。
现在将参考测试的结果来相互比较根据本发明的示范性实施例的正弦音频编码方法的编码效率和传统的正弦音频编码方法的编码效率。
图9是根据本发明的示范性实施例的正弦音频编码方法与现有技术正弦音频编码方法相比获得的编码增益的表。
在图9中,编码增益是编码的数据的比特数目的减少率。例如,15.89%的编码增益意思是比特数目减少了15.89%。
参考图9,通过使用八个测试序列,诸如Bass、Brahms、Dongwoo、Dust、Harp、Horn、Hotel和Trilogy来执行测试。
第一列的原生模式正弦信号的幅度的编码增益意味着用于编码原生模式正弦信号的幅度的比特数目的减少率。如图9所示,与传统的正弦音频编码方法相比,获得了15.89%的平均编码增益。
第二列的原生模式正弦信号的编码增益意味着用于编码原生模式正弦信号的幅度、频率和相位的比特数目的减少率。如图9所示,用于编码全部原生模式正弦信号的比特数目平均减少了4.28%。
第三列的全部比特率的编码增益意味着用于编码原生模式正弦信号和连续模式正弦信号二者的比特数目的减少率。如图9所示,与现有技术正弦音频编码方法相比,所有编码的比特数目平均减少了2.11%。
本本发明的示范性实施例也可以被具体化为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可以储存其后可以被计算机系统读取的数据的任何数据存储设备。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备。
尽管已经参考本本发明的示范性实施例对本发明进行了具体图示和描述,但是本领域技术人员应当理解,在不脱离由所附权利要求书所定义的本发明的精神和范围的情况下,可以对本发明做出形式和细节上的各种修改。示范性实施例应该被认为是描述的意义上的而不是限制的目的。因此,本发明的范围不是由本发明的细节描述定义的而是由所附权利要求书定义的,该范围内的所有差别将被认为包括在本发明内。
Claims (21)
1.一种用于正弦音频编码的方法,该方法包括:
从输入信号中提取当前帧的正弦信号;
通过使用延续到当前帧的连续模式正弦信号的前一帧的正弦信号来跟踪并编码当前帧的连续模式正弦信号;
搜索具有最接近于当前帧的原生模式正弦信号的频率的频率的正弦信号;
计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差;以及
编码该原生模式正弦信号的频率,
其中该原生模式正弦信号是在当前帧中产生的而不是从前一帧延续而来。
2.如权利要求1所述的方法,其中所述具有最接近的频率的正弦信号是具有低于该原生模式正弦信号的频率的频率的正弦信号之一。
3.如权利要求1所述的方法,其中所述具有最接近的频率的正弦信号是先前编码的正弦信号之一。
4.如权利要求3所述的方法,其中所述具有最接近的频率的正弦信号是当前帧的正弦信号。
5.如权利要求3所述的方法,其中所述具有最接近的频率的正弦信号不是当前帧的正弦信号。
6.如权利要求5所述的方法,其中所述具有最接近的频率的正弦信号是紧接在当前帧之前的帧的正弦信号。
7.如权利要求1所述的方法,其中所述计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差的步骤包括:
量化具有最接近的频率的正弦信号的幅度;
逆量化该量化的幅度;
计算该原生模式正弦信号的幅度与该逆量化的幅度之间的差;
量化该差;以及
编码该量化的差。
8.一种用于正弦音频编码的装置,该装置包括:
正弦分析单元,从输入信号中提取当前帧的正弦信号;
正弦信号跟踪单元,通过使用延续到当前帧的连续模式正弦信号的前一帧的正弦信号来跟踪并编码当前帧的连续模式正弦信号;
原生模式幅度编码单元,搜索具有最接近于当前帧的原生模式正弦信号的频率的频率的正弦信号,以及计算并编码具有最接近的频率的正弦信号的幅度与该原生模式正弦信号的幅度之间的差;以及
原生模式频率编码单元,编码该原生模式正弦信号的频率,
其中该原生模式正弦信号是在当前帧中产生的而不是从前一帧延续而来。
9.如权利要求8所述的装置,其中所述具有最接近的频率的正弦信号是具有低于该原生模式正弦信号的频率的频率的正弦信号之一。
10.如权利要求8所述的装置,其中所述具有最接近的频率的正弦信号是先前编码的正弦信号之一。
11.如权利要求10所述的装置,其中,所述具有最接近的频率的正弦信号是当前帧的正弦信号。
12.如权利要求10所述的装置,其中,所述具有最接近的频率的正弦信号不是当前帧的正弦信号。
13.如权利要求12所述的装置,其中所述具有最接近的频率的正弦信号是紧接在当前帧之前的帧的正弦信号。
14.如权利要求8所述的装置,其中该原生模式幅度编码单元量化具有最接近的频率的正弦信号的幅度、逆量化该量化的幅度、计算该原生模式正弦信号的幅度与逆量化的幅度之间的差、量化该差、以及编码该量化的差。
15.一种用于正弦音频解码的方法,该方法包括:
解码当前帧的编码的正弦信号当中的连续模式正弦信号;
解码当前帧的原生模式正弦信号的频率;
搜索具有最接近于解码的频率的频率的正弦信号;
解码该原生模式正弦信号的编码的幅度差;以及
通过将具有最接近的频率的正弦信号的幅度与该解码的幅度差相加来计算原生模式正弦信号的幅度,
其中该连续模式正弦信号是从前一帧延续而来的正弦信号,以及该原生模式正弦信号是在当前帧中产生的而不是从前一帧延续而来的正弦信号。
16.如权利要求15所述的方法,其中所述具有最接近的频率的正弦信号是具有低于该原生模式正弦信号的频率的频率的正弦信号之一。
17.如权利要求15所述的方法,其中所述具有最接近的频率的正弦信号是先前解码的正弦信号之一。
18.一种用于正弦音频解码的装置,该装置包括:
连续模式正弦信号解码单元,用于解码当前帧的编码的正弦信号当中的连续模式正弦信号;
原生模式频率解码单元,用于解码当前帧的原生模式正弦信号的频率;以及
原生模式幅度解码单元,用于搜索具有最接近于解码的频率的频率的正弦信号,解码该原生模式正弦信号的编码的幅度差,以及通过将具有最接近的频率的正弦信号的幅度与该解码的幅度差相加来计算原生模式正弦信号的幅度,
其中该连续模式正弦信号是从前一帧延续而来的正弦信号,以及该原生模式正弦信号是在当前帧中产生的而不是从前一帧延续而来的正弦信号。
19.如权利要求18所述的装置,其中所述具有最接近的频率的正弦信号是具有低于该原生模式正弦信号的频率的频率的正弦信号之一。
20.如权利要求18所述的装置,其中所述具有最接近的频率的正弦信号是先前解码的正弦信号之一。
21.一种其上记录有用于运行正弦音频解码的方法的计算机程序的计算机可读记录介质,该方法包括:
解码当前帧的编码的正弦信号当中的连续模式正弦信号;
解码当前帧的原生模式正弦信号的频率;
搜索具有最接近于解码的频率的频率的正弦信号;
解码该原生模式正弦信号的编码的幅度差;以及
通过将具有最接近的频率的正弦信号的幅度与该解码的幅度差相加来计算原生模式正弦信号的幅度,
其中该连续模式正弦信号是从前一帧延续而来的正弦信号,以及该原生模式正弦信号是在当前帧中产生的而不是从前一帧延续而来的正弦信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2007-0055717 | 2007-06-07 | ||
KR1020070055717A KR101317269B1 (ko) | 2007-06-07 | 2007-06-07 | 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 |
PCT/KR2008/001222 WO2008150061A1 (en) | 2007-06-07 | 2008-03-04 | Method and apparatus for sinusoidal audio coding and method and apparatus for sinusoidal audio decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101772805A true CN101772805A (zh) | 2010-07-07 |
CN101772805B CN101772805B (zh) | 2013-02-27 |
Family
ID=40093845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880101939XA Expired - Fee Related CN101772805B (zh) | 2007-06-07 | 2008-03-04 | 正弦音频编码的方法和装置及正弦音频解码的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9076444B2 (zh) |
KR (1) | KR101317269B1 (zh) |
CN (1) | CN101772805B (zh) |
WO (1) | WO2008150061A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
KR101325760B1 (ko) * | 2009-12-17 | 2013-11-08 | 한국전자통신연구원 | 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5179626A (en) * | 1988-04-08 | 1993-01-12 | At&T Bell Laboratories | Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
FR2784218B1 (fr) | 1998-10-06 | 2000-12-08 | Thomson Csf | Procede de codage de la parole a bas debit |
KR100297832B1 (ko) * | 1999-05-15 | 2001-09-26 | 윤종용 | 음성 신호 위상 정보 처리 장치 및 그 방법 |
CN1154975C (zh) * | 2000-03-15 | 2004-06-23 | 皇家菲利浦电子有限公司 | 用于声频编码的拉盖尔函数 |
KR20030011912A (ko) * | 2001-04-18 | 2003-02-11 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
BR0204835A (pt) | 2001-04-18 | 2003-06-10 | Koninkl Philips Electronics Nv | Métodos para codificar um sinal de áudio, e para decodificar um fluxo de áudio, codificador de áudio, reprodutor de áudio, sistema de áudio, fluxo de áudio, e, meio de armazenamento |
CN1272911C (zh) * | 2001-07-13 | 2006-08-30 | 松下电器产业株式会社 | 音频信号解码装置及音频信号编码装置 |
EP1442453B1 (en) * | 2001-10-19 | 2006-09-06 | Koninklijke Philips Electronics N.V. | Frequency-differential encoding of sinusoidal model parameters |
KR20040060946A (ko) * | 2001-10-26 | 2004-07-06 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코더에서의 사인곡선의 파라미터의 추적 |
EP1318611A1 (en) * | 2001-12-06 | 2003-06-11 | Deutsche Thomson-Brandt Gmbh | Method for retrieving a sensitive criterion for quantized spectra detection |
US6915256B2 (en) | 2003-02-07 | 2005-07-05 | Motorola, Inc. | Pitch quantization for distributed speech recognition |
US7640156B2 (en) * | 2003-07-18 | 2009-12-29 | Koninklijke Philips Electronics N.V. | Low bit-rate audio encoding |
KR20060083202A (ko) * | 2003-09-05 | 2006-07-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 낮은 비트율 오디오 인코딩 |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
-
2007
- 2007-06-07 KR KR1020070055717A patent/KR101317269B1/ko not_active IP Right Cessation
-
2008
- 2008-02-13 US US12/030,275 patent/US9076444B2/en not_active Expired - Fee Related
- 2008-03-04 WO PCT/KR2008/001222 patent/WO2008150061A1/en active Application Filing
- 2008-03-04 CN CN200880101939XA patent/CN101772805B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101772805B (zh) | 2013-02-27 |
KR20080107669A (ko) | 2008-12-11 |
US9076444B2 (en) | 2015-07-07 |
US20080305752A1 (en) | 2008-12-11 |
WO2008150061A1 (en) | 2008-12-11 |
KR101317269B1 (ko) | 2013-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101689369B (zh) | 用于编码和解码分音的幅度的方法和装置 | |
CN102449689B (zh) | 编码方法、编码装置、编码程序、以及它们的记录介质 | |
DK1514355T3 (da) | Fremgangsmåde og system til multi-rate gittervektorkvantificering af et signal | |
CN101577605A (zh) | 基于滤波器相似度的语音lpc隐藏和提取算法 | |
CN105229734A (zh) | 编码装置和方法、解码装置和方法以及程序 | |
CN101772805B (zh) | 正弦音频编码的方法和装置及正弦音频解码的方法和装置 | |
JP4550176B2 (ja) | 音声符号化方法 | |
CN101609681B (zh) | 编码方法、编码器、解码方法及解码器 | |
CN105047200A (zh) | 一种基于fpga的flac硬件解码器及解码方法 | |
CN101454829B (zh) | 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备 | |
CN101675476B (zh) | 用于正弦音频编码的方法和设备 | |
KR20090084544A (ko) | 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치 | |
CN101785316A (zh) | 用于处理死亡正弦波和普通连续正弦波的音频编码方法和设备以及音频解码方法和设备 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
JP4888048B2 (ja) | オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム | |
JP3435310B2 (ja) | 音声符号化方法および装置 | |
CN101779111B (zh) | 对音频信号的连续正弦信号信息编码的方法和设备以及对其解码的方法和设备 | |
JP2006350090A (ja) | クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体 | |
CN101790755B (zh) | 用于对音频信号的连续正弦信号编码和解码的方法和设备 | |
CN112908346B (zh) | 丢包恢复方法及装置、电子设备和计算机可读存储介质 | |
CN1774742B (zh) | 码变换方法及码变换装置 | |
JP4184817B2 (ja) | 時系列信号の符号化方法および装置 | |
JP2633683B2 (ja) | ベクトル量子化装置 | |
JP2582763B2 (ja) | 音声分析合成装置 | |
US20010044716A1 (en) | Encoding and decoding system using code books |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130227 Termination date: 20180304 |