CN101779462B - 对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法 - Google Patents
对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法 Download PDFInfo
- Publication number
- CN101779462B CN101779462B CN2008801034031A CN200880103403A CN101779462B CN 101779462 B CN101779462 B CN 101779462B CN 2008801034031 A CN2008801034031 A CN 2008801034031A CN 200880103403 A CN200880103403 A CN 200880103403A CN 101779462 B CN101779462 B CN 101779462B
- Authority
- CN
- China
- Prior art keywords
- sinusoidal signal
- component
- sinusoidal
- amplitude
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000000873 masking effect Effects 0.000 title claims abstract description 61
- 239000000284 extract Substances 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 5
- 238000013519 translation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000003340 mental effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
提供了一种对根据心理声学模型幅度小于掩蔽值的正弦信号进行有效编码的编码方法和设备,用于对编码的正弦信号进行解码的解码设备和方法,以及具有在其上记录有用于执行所述编码方法/解码方法的程序的计算机可读记录介质。通过使用指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码对第一正弦信号进行编码,使用根据使用特定代码的方法选择的一个正弦信号或者多个正弦信号来执行对与第一正弦信号连接的下一帧的第三正弦信号的差分编码,解码设备使用选择的正弦信号通过发送的差获得和。
Description
技术领域
本申请要求于2007年8月16日提交到韩国知识产权局的第10-2007-82287号韩国专利申请的优先权,其公开完整地包含于此,以资参考。
与本发明一致的方法和设备总体涉及处理音频信号,更具体地讲,涉及对根据心理声学模型(psychoacoustic model)幅度(magnitude)小于掩蔽值(masking value)的正弦信号进行编码以及对编码的正弦信号进行解码。
背景技术
参数编码(parametric coding)通过特定参数表示音频信号,参数编码用于运动图像专家组(MPEG)-4标准。
在参数编码中,通过执行三种类型的分析(即,瞬态分析、正弦分析和噪声分析)提取在每个域中的音频分量的参数。将提取的分量格式化为比特流以发送到解码器。
在正弦分析之后,对正弦信号进行跟踪以针对正弦信号进行自适应差分脉冲编码调制(ADPCM)编码或差分脉冲编码调制(DPCM)编码。跟踪是从包括在先前帧和下一帧中的正弦分量中搜索相互连续的正弦分量并设置找到的正弦分量之间的对应关系的过程。
可从先前帧的正弦分量跟踪的当前帧的正弦分量称为连续(continuation)正弦分量。由于可使用与连续正弦分量对应的先前帧的正弦分量对连续正弦分量执行差分编码,所以可有效地对连续正弦分量进行编码。与下一帧的正弦分量不连续并消失的连续正弦分量称作终止(death)正弦分量。
另一方面,无法从先前帧的正弦分量跟踪的当前帧的正弦分量称为新生(birth)正弦分量。无法对新生正弦分量执行使用先前帧的正弦分量的差分编码,并且可对新生正弦分量执行绝对编码。因此,新生正弦分量需要大量比特以进行编码。
在对音频数据进行编码中,试图使用心理声学模型减少编码的数据的比特数。图1A是解释根据心理声学模型的掩蔽效果的示图。
如图1A所示,当存在特定音频信号4时,人耳听不见信号幅度小于音频信号4的幅度的声音。在特定音频信号4存在的情况下,表示人耳可听见的信号的最小幅度的线被称作掩蔽曲线2,在特定频率处的掩蔽曲线2的值被称为掩蔽值。
参照图1A,正弦信号6的幅度大于掩蔽值,因此人耳可听到正弦信号6。因此,必须对正弦信号6进行编码。
另一方面,正弦信号8的幅度小于掩蔽值,因此人耳无法听到正弦信号8。因此,在使用心理声学模型的编码中不对正弦信号8进行编码。换言之,使用心理声学模型的编码将幅度比掩蔽值小的正弦信号处理为不存在。
图1B是解释在正弦跟踪中如何处置(treat)根据心理声学模型幅度比掩蔽值小的正弦信号的示图。
参照图1B,正弦信号10具有根据心理声学模型小于掩蔽值的幅度。正弦信号10的幅度小于在与正弦信号10相同帧中的正弦信号18和20的幅度。
当不应用心理声学模型时,正弦信号10与先前帧的正弦信号12和下一帧的正弦信号14连接。因此,执行正弦信号12、正弦信号10和正弦信号14的跟踪,因此可对正弦信号14执行可应用到连续正弦信号的差分编码。
然而,当应用心理声学模型时,如在空位置16中视为没有任何信号一样,将幅度小于掩蔽值的信号视为不存在。
当应用心理声学模型时,将正弦信号10视为不存在,因此将正弦信号14视为新生正弦信号,需要大量比特以进行编码。
如果将根据心理声学模型幅度比掩蔽值小的信号视为不存在,则必须将下一帧的正弦信号作为新生正弦信号进行编码。
此外,即使对幅度小于掩蔽值的这些信号进行编码,仍出现问题。
图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方法的流程图。
首先,在操作S10执行正弦跟踪。假设,作为正弦跟踪的结果,P(n-2)与P(n-1)连接,P(n-1)与P(n)连接。
在操作S20,将P(n-1)假设为根据心理声学模型幅度小于掩蔽值的信号。这样的信号可具有较小值或0的振幅(amplitude)。
在操作S30,根据应用或不应用心理声学模型的前述两种方法确定是否对P(n-1)进行编码。
当应用心理声学模型并因此将P(n-1)视为不存在时,在操作S40不对P(n-1)进行编码,并在操作50根据用于新生正弦信号的解码方法对作为下一帧的正弦信号的P(n)进行绝对编码。
当确定对P(n-1)进行编码时,在操作S60根据用于连续正弦信号的编码方法执行P(n-1)与P(n-2)之间的差分编码,并在操作S70执行P(n)与P(n-1)之间的差分编码。
如上所述,当在操作S40中对P(n-1)不进行编码时,由于将用于新生正弦信号的编码方法应用到P(n),所以需要大量的比特以对振幅、频率和相位分量进行编码。
当在操作S60中对P(n-1)进行编码时,用于对频率或振幅分量进行编码的比特数较少。然而,由于P(n-1)的振幅小或等于0,所以P(n-1)的振幅与P(n-2)的振幅之差很大。此外,P(n-1)的振幅与P(n)的振幅之差很大。因此,大量的比特可被用于对所述差进行编码或者所述差可能在无法表示的范围内。
这样,为了使用现有方法对包括根据心理声学模型幅度小于掩蔽值的正弦信号的音频信号进行编码,,需要比一般正弦信号的编码的情况下更多数量的比特,降低编码效率。
发明公开
技术方案
本发明提供一种对根据心理声学模型幅度小于掩蔽值的正弦信号进行有效编码的编码方法和设备以及用于对编码的正弦信号进行解码的解码设备和方法。
有益效果
如上所述,根据本发明示例性实施例,通过使用指示根据心理声学模型第一正弦信号的幅度比掩蔽值小的特定代码(code)对第一正弦信号编码,根据使用特定代码的方法,仅使用与第一正弦信号连接的先前帧的第二正弦信号或者使用第一正弦信号和第二正弦信号,执行对与第一正弦信号连接的下一帧的第三正弦信号的差分编码,解码设备使用根据特定代码的类型选择的一个正弦信号或多个正弦信号对第三正弦信号进行解码。
另一方面,现有方法使用第一正弦信号对第三正弦信号的所有分量执行绝对编码或差分编码,以对第三正弦信号进行编码。
因此,与现有方法相比,可减少编码所需的比特的数量,从而可获得有效地编码。
附图说明
通过参照附图对本发明示例性实施例进行详细描述,本发明的上述和其它方面将会变得更清楚,其中:
图1A是解释根据心理声学模型的掩蔽(masking)效国的示图;
图1B是解释在正弦跟踪中如何处置根据心理声学模型的幅度比掩蔽值小的正弦信号的示图;
图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方法的流程图;
图3是示出根据本发明示例性实施例的对正弦信号进行编码的编码方法的流程图;
图4是根据本发明示例性实施例的用于对正弦信号进行编码的编码设备的框图;
图5示出与仅使用第二正弦信号对第三正弦信号进行编码对应的曲线;
图6示出与使用第一正弦信号和第二正弦信号对第三正弦信号进行编码对应的曲线;
图7是根据本发明示例性实施例的用于对正弦信号进行解码的解码设备的框图。
最佳模式
根据本发明的一方面,提供了一种对正弦信号进行编码的编码方法。所述编码方法包括:对包括第一正弦信号的音频信号执行正弦跟踪,以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号,从当前帧之后的下一帧的正弦信号中确定第三正弦信号,其中,第一正弦信号的幅度根据心理声学模型小于掩蔽值,第二正弦信号和第三正弦信号连接到第一正弦信号;使用特定代码对第一正弦信号进行编码,其中,所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值;通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。
根据本发明的另一方面,提供了一种用于对正弦信号进行编码的设备。所述编码设备包括正弦跟踪单元、第一编码单元和第二编码单元。正弦跟踪单元对包括第一正弦信号的音频信号的进行正弦跟踪,以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号,从当前帧之后的下一帧的正弦信号中确定第三正弦信号,其中,第一正弦信号的幅度根据心理声学模型小于掩蔽值,第二正弦信号和第三正弦信号连接到第一正弦信号。第一编码单元使用特定代码对第一正弦信号进行编码,其中,所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值。第二编码单元通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。
根据本发明的另一方面,提供了一种对正弦信号进行解码的方法。所述解码方法包括:从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码,其中,第一正弦信号连接到包括第三正弦信号的当前帧之前的先前帧的正弦信号中的将被解码的第三正弦信号;根据所述特定代码的类型仅使用第二正弦信号或第一正弦信号和第二正弦信号二者对第三正弦信号进行解码,其中,先前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
根据本发明的另一方面,提供了一种用于对正弦信号进行解码的设备。所述解码设备包括代码提取单元和正弦信号加码单元。代码提取单元从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码,其中,第一正弦信号连接到包括第三正弦信号的当前帧之前的先前帧的正弦信号中的将被解码的第三正弦信号。正弦信号解码单元根据所述特定代码的类型仅使用第二正弦信号或第一正弦信号和第二正弦信号二者对第三正弦信号进行解码,其中,先前前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
具体实施方式
以下,参照附图对本发明示例性实施例进行详细描述。应该注意,相同的标号指示一个或多个附图中示出的相同的部件。在以下对本发明的描述中,为了简明和清楚,将省略合并于此的已知功能和配置的详细描述。
图3是示出根据本发明示例性实施例的对正弦信号进行编码的编码方法的流程图,图4是根据本发明示例性实施例的用于对正弦信号进行编码的编码设备100的框图。
参照图4,编码设备100可包括正弦跟踪单元110、第一编码单元120和第二编码单元130。
假设,P(n-1)是根据心理声学模型幅度小于掩蔽值的正弦信号,P(n-2)与P(n-1)连接,P(n-1)与P(n)连接。在以下描述中,根据心理声学模型幅度小于掩蔽值的正弦信号是当前帧的正弦信号中的第一正弦信号,先前帧的正弦信号中与第一正弦信号连接的一个正弦信号是第二正弦信号,下一帧的正弦信号中与第一正弦信号连接的一个正弦信号是第三正弦信号。
在操作S100,正弦跟踪单元110执行正弦跟踪,以确定与第一正弦信号连接的第二正弦信号和第三正弦信号。
在图3中,第一正弦信号是P(n-1),第二正弦信号是P(n-2),第三正弦信号是P(n)。
在操作S110,第一编码单元120通过使用特定代码表示P(n-1)(即,第一正弦信号)来对第一正弦信号进行编码。第一编码单元120使用特定代码,所述特定代码指示第一正弦信号的幅度根据心理声学模型小于掩蔽值。
在操作S120,第二编码单元130对P(n)(即,第三正弦信号)进行编码。第二编码单元130可根据第一编码单元120使用特定代码的方法,仅使用第二正弦信号P(n-2)或使用第一正弦信号P(n-1)和第二正弦信号P(n-2)来对第三正弦信号P(n)执行差分编码。
所述使用特定代码的方法可包括以下示例。然而,所述所述方法不限于示例,只要第一编码单元120使用指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码,所述方法可变化。
<使用特定代码的方法>
1.将控制标志中的一个指定为指示将被编码的正弦信号具有根据心理 声学模型小于掩蔽值的幅度的标志。
控制标志被用于对正弦信号进行编码。通过指定控制标志中的一个,可指示将被编码的正弦信号具有根据心理声学模型小于掩蔽值的幅度。当指定这样的控制标志时,不需要对第一正弦信号的振幅、频率和相位分量进行编码。对于下一帧的第三正弦信号,可使用第二正弦信号执行差分编码。与将第一正弦信号视为不存在的现有方法相比较,可通过执行差分编码以对第三正弦信号进行编码来减少比特的数量。
2.对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值 进行编码,来取代对第一正弦信号的振幅分量进行编码。
对第一正弦信号的频率和相位分量,使用先前帧的第二正弦信号的频率和相位分量执行差分编码。在这一方法中,在第三正弦信号的编码期间,使用第二正弦信号的振幅分量执行用于第三正弦信号的振幅分量的差分编码,使用第一正弦信号的频率分量执行用于第三正弦信号的频率分量的差分编码,使用第一正弦信号的相位分量执行用于第三正弦信号的相位分量的差分编码。通过执行差分编码而非绝对编码来对第三正弦信号进行编码,可减少编码所需的比特数量。此外,与仅使用第一正弦信号执行用于第三正弦信号的差分编码的现有方法相比较,通过使用第二正弦信号的振幅分量执行用于第三正弦信号的振幅分量的差分编码,可解决对差进行编码需要大量的比特,或者所述差在无法表示的范围内的现有技术问题。
3.对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值 进行编码,来取代对第一正弦信号的频率分量(或相位分量)进行编码。
在这一方法中,不需要对第一正弦信号的振幅和相位分量(或者频率分量)进行编码。在这一方面中,该方法与将控制标志中的一个指定为指示将被编码的正弦信号具有根据心理声学模型小于掩蔽值的幅度的标志的第一方法类似。
对于下一帧的第三正弦信号,使用第二正弦信号执行差分编码。与将第一正弦信号视为不存在的现有技术方法相比较,当前方法可通过执行差分编码一对第三正弦信号进行编码来减少比特的数量。
当前方法与第一方法相似,可根据实施例选择这两个方法中的一个以进一步减少比特的数量。换言之,可选择在标志中使用特定代码的第一方法和取代第一正弦信号的频率或相位分量对特定值进行编码的当前方法中的一个,其中当前方法导致用于编码的更少数量的比特。
在一些实施例中,可难于另外地指定特定标志。在该情况中,可使用当前方法来克服这些困难。
<对第三正弦信号进行编码的方法>
A.当第一编码单元120使用第一方法和第三方法中的一个时,第二编码 单元130仅使用第二正弦信号执行对第三正弦信号的差分编码。
图5示出与仅使用第二正弦信号对第三正弦信号进行编码对应的曲线。在图5中,n是5。因此,第一正弦信号是P4、第二正弦信号是P3和第三正弦信号是P5。
为了对第一正弦信号P4进行编码,根据第一方法指定特定标志或者根据第三方法对特定值而非第一正弦信号P4的频率或相位分量进行编码
为了对第三正弦信号P5进行编码,仅使用第二正弦信号P3执行差分编码。换言之,对于第三正弦信号P5的振幅分量,获得第三正弦信号P5的振幅分量与第二正弦信号P3的振幅分量之差,然后对所述差进行编码,对于第三正弦信号P5的频率分量,获得第三正弦信号P5的频率分量与第二正弦信号P3的频率分量之差,然后对所述差进行编码,对于第三正弦信号P5的相位分量,获得第三正弦信号P5的相位分量与第二正弦信号P3的相位分量之差,然后对所述差进行编码。
B.当第一编码单元120使用第二种方法时,第二编码单元130使用第一 正弦信号和第二正弦信号执行对第三正弦信号的差分编码。
图6示出与使用第一正弦信号和第二正弦信号对第三正弦信号进行编码对应的曲线。在图6中,n是5。因此,第一正弦信号是P4、第二正弦信号是P3,第三正弦信号是P5。
为了对第一正弦信号P4进行编码,根据第二方法对特定值进行编码,来取代对第一正弦信号P4的振幅分量进行编码。换言之,对于第一正弦信号P4的频率分量,获得第一正弦信号P4的频率分量与第二正弦信号P3的频率分量之差,然后对所述差进行编码,对于第一正弦信号P4的相位分量,获得第一正弦信号P4的相位分量与第二正弦信号P3的相位分量之差,然后对所述差进行编码。
为了对第三正弦信号P5进行编码,使用第二正弦信号P3和第一正弦信号P4执行差分编码。换言之,对于第三正弦信号P5的振幅分量,获得第三正弦信号P5的振幅分量与第二正弦信号P3的振幅分量之差,然后对所述差进行编码,对于第三正弦信号P5的频率分量,获得第三正弦信号P5的频率分量与第一正弦信号P4的频率分量之差,然后对所述差进行编码,对于第三正弦信号P5的相位分量,获得第三正弦信号P5的相位分量与第一正弦信号P4的相位分量之差,然后对所述差进行编码。
虽未在图4中示出,但是编码设备100还可包括频率转换单元。频率转换单元转换第一正弦信号的频率,并将频率转换的第一正弦信号发送至第一编码单元120。
当第二正弦信号的频率分量是fp,第三正弦信号的频率分量是fn时,频率转换单元将第一正弦信号的频率转换为第二正弦信号和第三正弦信号的频率的平均频率值,即,(fp+fn)/2。
将编码的正弦信号格式化为比特流以发送到用于对来自编码设备100的正弦信号进行解码的解码设备。
图7是根据本发明示例性实施例的用于对正弦信号进行解码的解码设备200的框图。
参照图7,解码设备200可包括代码提取单元210和正弦信号解码单元220。
代码提取单元210从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码。
正弦信号解码单元220如下根据所述特定代码的类型使用第二正弦信号或使用第一正弦信号和第二正弦信号对第三正弦信号进行解码。
<对第三正弦信号进行解码的方法>
A.当编码设备100利用使用特定代码的第一方法或第三方法时,正弦信 号解码单元220仅使用第二正弦信号对第三正弦信号进行解码。
换言之,在用于对第一正弦信号编码的控制标志中已指定指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志(第一方法),或者已对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码来取代对第一正弦信号的频率(或相位)分量进行编码(第二方法),并且标志或编码的特定值已包括在输入比特流中。
由于没有对第一正弦信号的振幅(频率或相位)分量进行编码,所以从输入比特流提取用于第三正弦信号的振幅(频率或相位)分量的编码的差,并对所述编码的差进行解码。将解码的差与第二正弦信号的振幅(频率或相位)分量相加,从而获得第三正弦信号的振幅(频率或相位)分量。
B.当编码设备100利用使用特定代码的第二方法时,正弦信号解码单元 220使用第一正弦信号和第二正弦信号对第三正弦信号进行解码。
换言之,指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值已取代第一正弦信号的振幅分量被编码,并且包括在输入比特流中。
由于没有对第一正弦信号的振幅分量进行编码,所以从输入比特流中提取用于第三正弦信号的振幅分量的编码的差,对所述编码的差进行解码。将解码的差与第二正弦信号的振幅分量相加,从而获得第三正弦信号的振幅分量。
另一方面,对于第一正弦信号的频率和相位分量,编码设备00使用第二正弦信号的频率和相位执行了差分编码。因此,从输入比特流提取用于第一正弦信号的频率(相位)分量的编码的差,并对其进行解码。将解码的差与第二正弦信号的频率(相位)分量相加,从而获得第一正弦信号的频率(相位)分量。
从输入比特流提取用于第三正弦信号的频率(相位)分量的编码的差,并对所述编码的差进行解码。将解码的差与第一正弦信号的频率(相位)分量相加,从而获得第三正弦信号的频率(相位)分量。
<第一正弦信号的分量的指定>
第一正弦信号具有根据心理声学模型小于掩蔽值的幅度。由于人耳听不到该信号,所以可不通过解码设备200对其进行解码。
然而,虽然人耳听不到,但是由于第一正弦信号的存在,第一正弦信号可改变声音的感受。因此,可指定代替第一正弦信号的特定信号。
首先,将根据心理声学模型小于掩蔽值的值指定为第一正弦信号的振幅分量。
将第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值(fp+fn)/2指定为第一正弦信号的频率分量。
通过指定第一正弦信号的振幅和频率分量,可不影响第三正弦信号的解码而产生第一正弦信号。
本发明也可实现为可被计算机读取的代码,其中,所述计算机包括对计算机可读记录介质具有信息处理功能的任何装置。所述计算机可读记录介质为任何可存储其后能由计算机系统读取的数据的数据存储装置。所述计算机可读记录介质的例子包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置。
虽然参照本发明示例性实施例具体示出和描述了本发明,但是本领域普通技术人员应该理解的是,在不脱离权利要求限定的本发明的精神和范围的情况下,可进行各种形式和细节的修改。
Claims (20)
1.一种对正弦信号进行编码的方法,所述方法包括:
对包括第一正弦信号的音频信号执行正弦跟踪,以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号,从当前帧之后的下一帧的正弦信号中确定第三正弦信号,其中,第一正弦信号的幅度根据心理声学模型小于掩蔽值,第二正弦信号和第三正弦信号连接到第一正弦信号;
使用特定代码对第一正弦信号进行编码,其中,所述特定代码指示第一正弦信号的幅度根据心理声学模型小于掩蔽值;以及
通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。
2.如权利要求1所述的方法,其中,所述使用特定代码对第一正弦信号进行编码的步骤包括:将用于对第一正弦信号进行编码的控制标志中的一个指定为指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志。
3.如权利要求1所述的方法,其中,所述使用特定代码对第一正弦信号进行编码的步骤包括:
对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码,来取代对第一正弦信号的振幅分量进行编码;
获得并编码第一正弦信号的频率分量与第二正弦信号的频率分量之差;
获得并编码第一正弦信号的相位分量与第二正弦信号的相位分量之差。
4.如权利要求1所述的方法,其中,所述使用特定代码对第一正弦信号进行编码的步骤包括:对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码,来取代对第一正弦信号的频率分量或相位分量进行编码。
5.如权利要求1所述的方法,还包括:在使用特定代码对第一正弦信号进行编码之前,将第一正弦信号的频率分量转换为第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值(fp+fn)/2。
6.如权利要求1所述的方法,其中,所述对第三正弦信号进行编码的步骤包括:
获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差;
获得并编码第三正弦信号的频率分量与第二正弦信号的频率分量之差;
获得并编码第三正弦信号的相位分量与第二正弦信号的相位分量之差。
7.如权利要求1所述的方法,其中,所述对第三正弦信号进行编码的步骤包括:
获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差;
获得并编码第三正弦信号的频率分量与第一正弦信号的频率分量之差;
获得并编码第三正弦信号的相位分量与第一正弦信号的相位分量之差。
8.一种用于对正弦信号进行编码的设备,所述设备包括:
正弦跟踪单元,对包括第一正弦信号的音频信号执行正弦跟踪,以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号,从当前帧之后的下一帧的正弦信号中确定第三正弦信号,其中,第一正弦信号的幅度根据心理声学模型小于掩蔽值,第二正弦信号和第三正弦信号连接到第一正弦信号;
第一编码单元,使用特定代码对第一正弦信号进行编码,其中,所述特定代码指示第一正弦信号的幅度根据心理声学模型小于掩蔽值;以及
第二编码单元,通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行用于第三正弦信号的差分编码来对第三正弦信号进行编码。
9.如权利要求8所述的设备,其中,第一编码单元将用于对第一正弦信号进行编码的控制标志中的一个指定为指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志。
10.如权利要求8所述的设备,其中,第一编码单元对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码,来取代对第一正弦信号的振幅分量进行编码,获得并编码第一正弦信号的频率分量与第二正弦信号的频率分量之差,获得并编码第一正弦信号的相位分量与第二正弦信号的相位分量之差。
11.如权利要求8所述的设备,其中,第一编码单元对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码,来取代对第一正弦信号的频率分量或相位分量进行编码。
12.如权利要求8所述的设备,还包括:频率转换单元,将第一正弦信号的频率分量转换为第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值(fp+fn)/2,并将频率转换的第一正弦信号发送至第一编码单元。
13.如权利要求8所述的设备,其中,第二编码单元获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差,获得并编码第三正弦信号的频率分量与第二正弦信号的频率分量之差,获得并编码第三正弦信号的相位分量与第二正弦信号的相位分量之差。
14.如权利要求8所述的设备,其中,第二编码单元获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差,获得并编码第三正弦信号的频率分量与第一正弦信号的频率分量之差,获得并编码第三正弦信号的相位分量与第一正弦信号的相位分量之差。
15.一种对正弦信号进行解码的方法,所述方法包括:
从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码,其中,第一正弦信号连接到包括第一正弦信号的当前帧之后的下一帧的正弦信号中的将被解码的第三正弦信号;
根据所述特定代码的类型,仅使用第二正弦信号或使用第一正弦信号和第二正弦信号对第三正弦信号进行解码,其中,当前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
16.如权利要求15所述的解码方法,其中,所述根据特定代码的类型对第三正弦信号进行解码的步骤包括:如果已从用于对第一正弦信号进行编码的控制标志中指定了指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志,或者已对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行了编码来取代对第一正弦信号的频率分量或相位分量进行编码,并且所述标志或编码的特定值已被包括在输入比特流中,
则通过从输入比特流提取用于第三正弦信号的振幅分量的编码的差,对提取的用于第三正弦信号的振幅分量的差进行解码,将解码的用于第三正弦信号的振幅分量的差与第二正弦信号的振幅分量相加,来获得第三正弦信号的振幅分量;
通过从输入比特流提取用于第三正弦信号的频率分量的编码的差,对提取的用于第三正弦信号的频率分量的差进行解码,将解码的用于第三正弦信号的频率分量的差与第二正弦信号的频率分量相加,来获得第三正弦信号的频率分量;
通过从输入比特流提取用于第三正弦信号的相位分量的编码的差,对提取的用于第三正弦信号的相位分量的差进行解码,将解码的用于第三正弦信号的相位分量的差与第二正弦信号的相位分量相加,来获得第三正弦信号的相位分量。
17.如权利要求15所述的解码方法,其中,所述根据特定代码的类型对第三正弦信号进行解码的步骤包括:如果已对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行了编码来取代对第一正弦信号的振幅分量进行编码,并且所述特定值已包括在输入比特流中,
则通过从输入比特流提取用于第三正弦信号的振幅分量的编码的差,对提取的用于第三正弦信号的振幅分量的差进行解码,将解码的用于第三正弦信号的振幅分量的差与第二正弦信号的振幅分量相加,来获得第三正弦分量的振幅分量;
通过从输入比特流提取用于第三正弦信号的频率分量的编码的差,对提取的用于第三正弦信号的频率分量的差进行解码,将解码的用于第三正弦信号的频率分量的差与第一正弦信号的频率分量相加,来获得第三正弦分量的频率分量;
通过从输入比特流提取用于第三正弦信号的相位分量的编码的差,对提取的用于第三正弦信号的相位分量的差进行解码,将解码的用于第三正弦信号的相位分量的差与第一正弦信号的相位分量相加,来获得第三正弦分量的相位分量。
18.如权利要求17所述的解码方法,还包括:在根据特定代码的类型对第三正弦信号进行解码之前,
通过从输入比特流提取用于第一正弦信号的频率分量的编码的差,对提取的用于第一正弦信号的频率分量的差进行解码,将解码的用于第一正弦信号的频率分量的差与第二正弦信号的频率分量相加,来获得第一正弦分量的频率分量;
通过从输入比特流提取用于第一正弦信号的相位分量的编码的差,对提取的用于第一正弦信号的相位分量的差进行解码,将解码的用于第一正弦信号的相位分量的差与第二正弦信号的相位分量相加,来获得第一正弦分量的相位分量。
19.如权利要求15所述的解码方法,还包括:
将根据心理声学模型小于掩蔽值的值指定为第一正弦信号的振幅分量;
将第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值(fp+fn)/2指定为第一正弦信号的频率分量。
20.一种用于对正弦信号进行解码的设备,所述设备包括:
代码提取单元,从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码,其中,第一正弦信号连接到包括第一正弦信号的当前帧之后的下一帧的正弦信号中的将被解码的第三正弦信号;
正弦信号解码单元,根据所述特定代码的类型,仅使用第二正弦信号或使用第一正弦信号和第二正弦信号对第三正弦信号进行解码,其中,当前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070082287A KR101346771B1 (ko) | 2007-08-16 | 2007-08-16 | 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치 |
KR10-2007-0082287 | 2007-08-16 | ||
PCT/KR2008/002939 WO2009022789A1 (en) | 2007-08-16 | 2008-05-27 | Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101779462A CN101779462A (zh) | 2010-07-14 |
CN101779462B true CN101779462B (zh) | 2012-05-30 |
Family
ID=40350828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801034031A Expired - Fee Related CN101779462B (zh) | 2007-08-16 | 2008-05-27 | 对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8165871B2 (zh) |
EP (1) | EP2179588B1 (zh) |
KR (1) | KR101346771B1 (zh) |
CN (1) | CN101779462B (zh) |
AT (1) | ATE534118T1 (zh) |
WO (1) | WO2009022789A1 (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320257A (zh) * | 1999-06-18 | 2001-10-31 | 皇家菲利浦电子有限公司 | 带有改进的编码器的音频传输系统 |
CN1463547A (zh) * | 2001-04-18 | 2003-12-24 | 皇家菲利浦电子有限公司 | 部分加密的声频编码 |
CN1717577A (zh) * | 2002-11-28 | 2006-01-04 | 皇家飞利浦电子股份有限公司 | 音频信号编码 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5274711A (en) * | 1989-11-14 | 1993-12-28 | Rutledge Janet C | Apparatus and method for modifying a speech waveform to compensate for recruitment of loudness |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
US7120587B2 (en) * | 2000-11-03 | 2006-10-10 | Koninklijke Philips Electronics N.V. | Sinusoidal model based coding of audio signals |
JP2005506581A (ja) * | 2001-10-19 | 2005-03-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 正弦波モデルパラメータの周波数差分符号化 |
AU2003201097A1 (en) * | 2002-02-18 | 2003-09-04 | Koninklijke Philips Electronics N.V. | Parametric audio coding |
CN1717718A (zh) | 2002-11-27 | 2006-01-04 | 皇家飞利浦电子股份有限公司 | 正弦波音频编码 |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
WO2006018748A1 (en) * | 2004-08-17 | 2006-02-23 | Koninklijke Philips Electronics N.V. | Scalable audio coding |
BRPI0515343A8 (pt) | 2004-09-17 | 2016-11-29 | Koninklijke Philips Electronics Nv | Codificador e decodificador de áudio, métodos de codificar um sinal de áudio e de decodificar um sinal de áudio codificado, sinal de áudio codificado, meio de armazenamento, dispositivo, e, código de programa legível por computador |
JP2008518264A (ja) * | 2004-11-01 | 2008-05-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 振幅の包絡線を有するパラメトリックオーディオコーディング |
-
2007
- 2007-08-16 KR KR1020070082287A patent/KR101346771B1/ko not_active IP Right Cessation
-
2008
- 2008-05-27 WO PCT/KR2008/002939 patent/WO2009022789A1/en active Application Filing
- 2008-05-27 AT AT08765913T patent/ATE534118T1/de active
- 2008-05-27 CN CN2008801034031A patent/CN101779462B/zh not_active Expired - Fee Related
- 2008-05-27 EP EP08765913A patent/EP2179588B1/en not_active Not-in-force
- 2008-06-02 US US12/131,446 patent/US8165871B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320257A (zh) * | 1999-06-18 | 2001-10-31 | 皇家菲利浦电子有限公司 | 带有改进的编码器的音频传输系统 |
CN1463547A (zh) * | 2001-04-18 | 2003-12-24 | 皇家菲利浦电子有限公司 | 部分加密的声频编码 |
CN1717577A (zh) * | 2002-11-28 | 2006-01-04 | 皇家飞利浦电子股份有限公司 | 音频信号编码 |
Also Published As
Publication number | Publication date |
---|---|
CN101779462A (zh) | 2010-07-14 |
KR101346771B1 (ko) | 2013-12-31 |
EP2179588B1 (en) | 2011-11-16 |
KR20090017819A (ko) | 2009-02-19 |
EP2179588A1 (en) | 2010-04-28 |
US8165871B2 (en) | 2012-04-24 |
US20090048826A1 (en) | 2009-02-19 |
ATE534118T1 (de) | 2011-12-15 |
EP2179588A4 (en) | 2010-11-24 |
WO2009022789A1 (en) | 2009-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101203907B (zh) | 音频编码装置、音频解码装置以及音频编码信息传输装置 | |
CN1965610A (zh) | 编码混响声音信号 | |
AR022190A1 (es) | Aparato y metodo para la codificacion de una senal de informacion digital, el portador de grabacion que comprende la senal digital y el decodificador para decodificar tal senal | |
CN100489964C (zh) | 音频解码 | |
CN101641733B (zh) | 对音频信号编码和解码的方法和设备 | |
JP4359499B2 (ja) | オーディオ信号の編集 | |
GB2359468B (en) | Method of and apparatus for converting an audio signal between data compression formats | |
CN105869647B (zh) | 一种智能手机原生dsd音频解码方法、系统及智能手机 | |
CN105047200A (zh) | 一种基于fpga的flac硬件解码器及解码方法 | |
CN101779462B (zh) | 对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法 | |
WO2002103572A1 (en) | Selective processing of data embedded in a multimedia file | |
CN101454829B (zh) | 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备 | |
CN112689194B (zh) | 功能机视频配乐方法、装置、终端设备及存储介质 | |
WO2009025447A1 (en) | Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid | |
US20090024396A1 (en) | Audio signal encoding method and apparatus | |
JP5384943B2 (ja) | オーディオデータ符号化及び/または復号化方法、記録媒体及びシステム | |
US9070362B2 (en) | Audio quantization coding and decoding device and method thereof | |
US8160869B2 (en) | Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same | |
KR101317269B1 (ko) | 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 | |
CN113763970B (zh) | 一种音频传输方法、装置及音频传输设备 | |
KR101425355B1 (ko) | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 | |
US20010039495A1 (en) | Linking internet documents with compressed audio files | |
US20090063161A1 (en) | Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal | |
TW504906B (en) | Method and apparatus for decoding digital audio data | |
KR20120069906A (ko) | 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120530 Termination date: 20180527 |