CN101454829B - 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备 - Google Patents
搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备 Download PDFInfo
- Publication number
- CN101454829B CN101454829B CN2007800190396A CN200780019039A CN101454829B CN 101454829 B CN101454829 B CN 101454829B CN 2007800190396 A CN2007800190396 A CN 2007800190396A CN 200780019039 A CN200780019039 A CN 200780019039A CN 101454829 B CN101454829 B CN 101454829B
- Authority
- CN
- China
- Prior art keywords
- space
- code book
- core layer
- layer code
- pulse position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000012792 core layer Substances 0.000 claims abstract description 211
- 239000010410 layer Substances 0.000 claims abstract description 151
- 230000000593 degrading effect Effects 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 55
- 230000003044 adaptive effect Effects 0.000 description 30
- 238000013139 quantization Methods 0.000 description 25
- 239000002131 composite material Substances 0.000 description 17
- 238000001914 filtration Methods 0.000 description 13
- 230000008447 perception Effects 0.000 description 13
- 238000011002 quantification Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000000873 masking effect Effects 0.000 description 9
- 238000007792 addition Methods 0.000 description 6
- 101150055297 SET1 gene Proteins 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 238000005086 pumping Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供一种用于使用码激励线性预测(CELP)算法将语音信号编码和解码的方法和设备。为了基于CELP降低比特率,而不降低增强层的性能,将核心层的固定码本和增强层的固定码本中的每个分成多个空间。搜索除了与核心层的固定码本的多个空间当中确定的最低失真空间相应的空间以外的增强层的固定码本的空间。
Description
技术领域
本申请要求于2006年5月25日在韩国知识产权局提交的第10-2006-0047118号韩国专利申请的优先权,该公开完全包含于此以资参考。
本发明总体构思涉及一种用于使用码激励线性预测(CELP)算法对语音信号进行编码和解码的方法和设备。更具体地讲,本发明总体构思涉及一种用于搜索固定码本的方法和设备,所述方法和设备基于CELP降低比特率,而不降低增强层的性能。
背景技术
在移动通信系统中,采用CELP算法的语音编解码器被广泛地使用,并且语音编解码器基于线性预测编码(LPC)。
这些使用CELP算法的语音编解码器将语音信号编码为核心层和增强层,所述核心层包括能够恢复声音的最低质量的编码信息,所述增强层包括除了核心层提供的比特以外的用于增强恢复的声音的质量的附加比特。因而,这些语音编解码器将编码的语音信号解码。
核心层和增强层通常共享同一固定码本的空间。由于所述空间共享,所以表示的代码的数目增加,因而比特率提高。
发明内容
技术问题
本发明总体构思提供一种固定码本搜索方法和设备,所述固定码本搜索方法和设备基于CELP以下面方式降低比特率,而不降低增强层的性能:将核心层的固定码本和增强层的固定码本分为多个空间,并且搜索除了与从核心层的固定码本的多个空间确定的最低失真空间相应的空间以外的增强层的固定码本的空间。本发明总体构思还提供一种使用固定码本搜索方法和设备的语音信号编码/解码方法和设备。
本发明总体构思的其他目的部分在以下描述中给予阐述,部分从以下描述将变得清楚,或者部分通过实践可以领会。
通过提供一种对语音信号编码的设备实现本发明总体构思的前述和/或其他方面,所述设备包括:具有多个空间的核心层码本,可能的脉冲位置的组合被分为所述多个空间;核心层产生单元,搜索核心层码本的多个空间中的每个,并且通过确定核心层码本的多个空间当中的最低失真空间来产生核心层;具有多个空间的增强层码本,所述多个空间与核心层码本的多个空间相应;增强层产生单元,通过搜索除了与在核心层码本中确定的空间相应的空间以外的增强层码本的空间来产生增强层;和编码单元,将语音信号编码为核心层和增强层。
还通过提供一种对语音信号编码的编码设备实现本发明总体构思的前述和/或其他方面,所述设备包括:核心层产生单元,具有核心固定码本,所述核心固定码本具有可搜索代码以将语音信号的核心层编码的多个空间;和增强层产生单元,具有增强固定码本,所述增强固定码本具有可搜索代码以将语音信号的增强层编码的多个空间,所述增强固定码本的可搜索空间与核心固定码本的可搜索空间不同。
还通过提供一种对语音信号编码的编码设备实现本发明总体构思的前述和/或其他方面,所述设备包括:核心层产生单元,具有第一固定码本,所述第一固定码本至少具有第一部分和第二部分,所述第一部分和第二部分都可被搜索以找到将第一信号的失真最小化的第一固定码本矢量;和增强层产生单元,具有第二固定码本,所述第二固定码本至少具有第一部分和第二部分,所述第一部分和第二部分与第一固定码本的第一部分和第二部分相应,当在第一固定码本的第二部分中找到第一固定码本矢量时,可从所述第二固定码本的第一部分搜索第二固定码本矢量,并且当在第一固定码本的第一部分中找到第一固定码本矢量时,可从所述第二固定码本的第二部分搜索第二固定码本矢量。
还通过提供一种对编码为核心层和增强层的语音信号解码的设备实现本发明总体构思的前述和/或其他方面,所述设备包括:具有多个空间的核心层码本,可能的脉冲位置的组合被分为所述多个空间;核心层解码单元,通过搜索由包括在编码的语音信号中的标识符指示的核心层码本的空间来将核心层解码;具有多个空间的增强层码本,所述多个空间与核心层码本的多个空 间相应;和增强层解码单元,通过搜索除了与核心层码本的确定的空间相应的空间以外的增强层码本的空间来将增强层解码。
还通过提供一种固定码本搜索方法实现本发明总体构思的前述和/或其他方面,所述方法包括:搜索核心层码本的每个空间;确定核心层码本的多个空间中的最低失真空间;和搜索除了与确定的核心层码本的空间相应的空间以外的增强层码本的空间,其中,通过将可能的脉冲位置分为多个空间来配置核心层码本,并且通过将可能的脉冲位置分为与核心层码本的空间相应的多个空间来配置增强层码本。
还通过提供一种用于将编码的语音信号解码的解码设备实现本发明总体构思的前述和/或其他方面,所述设备包括:核心层解码单元,具有核心固定码本,所述核心固定码本具有可搜索代码以将编码的语音信号的核心层解码的多个空间;和增强层解码单元,具有增强固定码本,所述增强固定码本具有可搜索代码以将编码的语音信号的增强层解码的空间,增强固定码本的可搜索空间与核心固定码本的可搜索空间不同。
还通过提供一种将语音信号编码的方法实现本发明总体构思的前述和/或其他方面,所述方法包括:搜索核心层码本的多个空间中的每个;通过确定核心层码本的多个空间当中的最低失真空间来产生核心层;通过搜索除了与核心层码本的确定的空间相应的空间以外的增强层码本的空间来产生增强层;和将语音信号编码为核心层和增强层,其中,通过将可能的脉冲位置分为多个空间来配置核心层码本,并且通过将可能的脉冲位置分为与核心层码本的空间相应的多个空间来配置增强层码本。
还通过提供一种搜索固定码本的方法实现本发明总体构思的前述和/或其他方面,所述方法包括:在核心层的固定码本的第一空间和第二空间中搜索固定码本矢量;将从第一空间选择的第一固定码本矢量的失真值与从第二空间选择的第二固定码本矢量的失真值进行比较;基于所述失真值的比较,产生用于指示第一空间和第二空间之一的标识符;和从第一空间和第二空间中的所述标识符没有指示的另一个空间搜索增强层的固定码本矢量。
还通过提供一种对被编码为核心层和增强层的语音信号解码的方法实现本发明总体构思的前述和/或其他方面,所述方法包括:通过搜索由包括在编码的语音信号中的标识符指示的核心层码本的空间来将核心层解码;和通过搜索除了与核心层码本的确定的空间相应的空间以外的增强层码本的空间来 将增强层解码,其中,通过将可能的脉冲位置分为多个空间来配置核心层码本,并且通过将可能的脉冲位置分为与核心层码本的空间相应的多个空间来配置增强层码本。
技术方案
有益效果
附图说明
通过下面结合附图对实施例进行的描述,本发明总体构思的上述和其他方面将会变得清楚且易于理解,其中:
图1是示出根据本发明总体构思的实施例的用于对语音信号进行编码的设备的框图;
图2是示出根据本发明总体构思的实施例的用于对语音信号进行解码的设备的框图;
图3是示出根据本发明总体构思的实施例的将语音信号编码的方法的流程图;
图4是示出根据本发明总体构思的实施例的将语音信号解码的方法的流程图;
图5是示出根据本发明总体构思的实施例的搜索固定码本的方法的流程图;
图6是示出核心层和增强层中的每个的固定码本的概念框图,其中,在所述固定码本中,可能的脉冲位置的组合被分为第一空间和第二空间;
图7A是示出当在核心层的固定码本中找到的脉冲位置值是偶数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图;
图7B是示出当在核心层的固定码本中找到的脉冲位置值是奇数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图;
图8A示出根据本发明总体构思的实施例的分配给核心层的固定码本的比特;
图8B示出根据本发明总体构思的实施例的分配给增强层的固定码本的比特;
图8C示出分配给核心层的G.729固定码本的比特;
图8D示出分配给增强层的G.729固定码本的比特;
图9A示出根据本发明总体构思的另一实施例的分配给核心层的固定码本的比特;
图9B示出根据本发明总体构思的另一实施例的分配给增强层的固定码本的比特;
图9C示出在3GPP2VMR-WB速率集-1中分配给核心层的固定码本的比特;
图9D示出在3GPP2VMR-WB速率集-1中分配给增强层的固定码本的比特;
图10A是示出在根据本发明总体构思的实施例和现有技术的PESQ(语音质量的感知测评)之间的比较结果的曲线图;和
图10B是示出在根据本发明总体构思的实施例的固定码本中使用的每个子帧的比特和在现有技术的固定码本中使用的每个子帧的比特之间的比较结果的曲线图。
实施方式
现在将详细地描述本发明总体构思的实施例,其示例在附图中示出,其中,相同的标号始终表示相同的部件。以下参照附图描述所述实施例,以解释本发明总体构思。
图1是示出根据本发明总体构思的实施例的用于对语音信号进行编码的设备的框图。图1的设备包括核心层产生单元100、增强层产生单元150和复用单元190。
核心层产生单元100产生包括编码信息的核心层,并且恢复语音信号的最低质量。为此,核心层产生单元100使用线性预测编码(LPC)方法对输入语音信号进行滤波,以产生与语音信号相应的激励信号。
核心层产生单元100包括预处理器102、LPC分析器104、LPC系数量化器106、第一合成滤波器108、加法器110、第一减法器112、第一感知权重滤波器114、基音(pitch)分析器116、基音基值(contribution)去除器118、固定码本120、码本搜索器122、自适应码本124、空间确定器130、标识符产生器132、增益量化器140、第一乘法器141和第二乘法器142。
预处理器102从通过输入端口IN接收的语音信号去除直流(DC)分量。更具体地,预处理器102通过使用包括在预处理器102中的高通滤波器对语 音信号进行滤波来去除低频带中的噪声分量。
LPC分析器104从已被预处理器102去除DC分量的语音信号提取LPC系数。
LPC系数量化器106将LPC分析器104提取的LPC系数矢量量化。
第一合成滤波器108使用LPC系数量化器106的矢量量化的结果产生与加法器110输出的激励信号相应的合成信号。
第一减法器112从预处理器102输出的语音信号输出的信号减去第一合成滤波器108输出的合成信号。
第一感知权重滤波器114对第一减法器112输出的信号进行滤波,从而所述信号的量化噪声变得小于或等于掩蔽门限(masking threshold),以便利用人的听觉结构的掩蔽效果。第一感知权重滤波器114产生包括权重的信号,从而将第一减法器112输出的信号的量化噪声最小化。
基音分析器116将第一感知权重滤波器114输出的信号分为多个子帧(sub-frame),并且分析每个子帧的基音,从而产生自适应码本124的索引和增益。
基音基值去除器118使用自适应码本124的索引,从固定码本120检测用来搜索与第一感知权重滤波器114输出的信号相应的固定码本矢量所需的目标信号。
通过将可能的脉冲位置的组合分为多个空间来配置固定码本120。
如图6所示,可通过将可能的脉冲位置的组合分为第一空间610和第二空间620来配置固定码本120。第一空间610可包括在核心层中极可能被搜索的可能的脉冲位置。
根据可能的脉冲位置是偶数还是奇数,第一空间610和第二空间620可彼此区分。图7A是示出当在核心层的固定码本中找到的脉冲位置值是偶数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7A,当在核心层的固定码本中找到的脉冲位置值是偶数时,与奇数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。图7B是示出当在核心层的固定码本中找到的脉冲位置值是奇数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7B,当在核心层的固定码本中找到的脉冲位置值是奇数时,与偶数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。因此,可通过将奇数号的可能的脉冲位置分为第一空间、将偶数号 的可能的脉冲位置分为第二空间来配置核心层和增强层的码本中的每个。或者,如图6所示,可通过将偶数号的可能的脉冲位置分为第一空间610、将奇数号的可能的脉冲位置分为第二空间620来配置核心层和增强层的码本中的每个。
参照图1,固定码本120使用码本搜索器122找到的索引输出固定码本矢量。
码本搜索器122从固定码本120搜索与基音基值去除器118检测到的目标信号相应的固定码本矢量,并且输出固定码本120的索引和增益。更具体地,码本搜索器122搜索将目标信号的均方误差(MSE)最小化的固定码本矢量。
当码本搜索器122搜索固定码本矢量时,包括在固定码本120中的多个空间中的每个被搜索。如果固定码本120被分为第一空间610和第二空间620(见图6),则从第一空间610搜索将目标信号的MSE最小化的固定码本矢量,还从第二空间620搜索将目标信号的MSE最小化的固定码本矢量。
空间确定器130从码本搜索器122在固定码本120的所有空间中找到的固定码本矢量检测最低失真固定码本矢量,并且输出检测到的固定码本矢量所属的空间。
标识符产生器132产生指示空间确定器130确定的空间的标识符。例如,在图8A和图9A中示出的比特“偏移”与空间确定器130输出的空间的标识符相应。
自适应码本124输出与基音分析器116输出的索引相应的自适应码本矢量。
增益量化器140将码本搜索器122输出的固定码本120的增益以及基音分析器116输出的自适应码本124的增益进行量化,并且输出量化的结果。增益量化器140将固定码本120的量化增益Gc输出给第一乘法器141,并且将自适应码本124的量化增益Gp输出给第二乘法器142。
第一乘法器141将由固定码本120输出的固定码本矢量与从增益量化器140接收的固定码本120的量化增益Gc相乘。
第二乘法器142将由自适应码本124输出的自适应码本矢量与从增益量化器140接收的自适应码本124的量化增益Gp相乘。
加法器110将从第一乘法器141接收的乘积与第二乘法器142接收的乘 积相加。
增强层产生单元150产生用作除了核心层产生单元100提供的比特以外的附加比特的增强层,以便增强恢复的声音质量。例如,当核心层提供8kbps的比特率时,增强层可提供4kbps的附加比特率。
增强层产生单元150包括第二减法器152、第二感知权重滤波器154、码本搜索器156、增益差量化器158、固定码本160、第三乘法器162和第二合成滤波器164。
第二减法器152从第一减法器112输出的结果减去第二感知权重滤波器154输出的结果。
第二感知权重滤波器154执行滤波操作,以便量化噪声小于或等于掩蔽门限,从而利用人的听力结构的掩蔽效果。更具体地,第二感知权重滤波器154产生包括权重的信号,以将第二减法器152输出的信号的量化噪声最小化。
固定码本160输出与码本搜索器156获得的索引相应的固定码本矢量。将增强层产生单元150的固定码本160分为与核心层产生单元100的固定码本120的空间(即图6的第一空间610和第二空间620)相应的多个空间。
码本搜索器156从固定码本160搜索与第二感知权重滤波器154的滤波的结果相应的固定码本矢量,并且输出固定码本160的索引和增益。
当码本搜索器156搜索固定码本矢量时,搜索除了核心层产生单元100的空间确定器130确定的空间以外的固定码本160的每个空间。因而,如果核心层产生单元100的固定码本120和增强层产生单元150的固定码本160中的每个被分别分为第一空间610和第二空间620(见图6),并且由空间确定器130确定第一空间610,则增强层产生单元150的码本搜索器156从第二空间620搜索固定码本矢量。如果由核心层产生单元100的空间确定器130确定第二空间620,则增强层产生单元150的码本搜索器156从第一空间610搜索固定码本矢量。
增益差量化器158获得增强层产生单元150的码本搜索器156输出的固定码本160的增益和核心层产生单元100的增益量化器140输出的固定码本120的量化增益Gc之间的差,并且将所述差量化。增益差量化器158将所述量化的增益差Gce输出给第三乘法器162和复用单元190。
第三乘法器162将增强层产生单元150的固定码本160输出的固定码本 矢量与从增益差量化器158接收的量化的增益差Gce相乘。
第二合成滤波器164使用LPC系数量化器106的矢量量化的结果产生与第三乘法器162输出的乘积相应的合成信号。
复用单元190从LPC系数量化器106、基音分析器116、码本搜索器122、标识符产生器132、增益量化器140、码本搜索器156和增益差量化器158的输出产生比特流。复用单元190随后通过输出端口OUT输出所述比特流。
图2是示出根据本发明总体构思的实施例的用于对语音信号进行解码的设备的框图。图2的设备包括解复用单元200、LPC系数解码单元210、核心层解码单元220、增强层解码单元230、增益解码单元240、增益差解码单元250、第一加法器260、第一乘法器262、第二乘法器264、第二加法器266、第三加法器268、第一切换单元270、第二切换单元275、合成滤波器280和后处理单元290。
解复用单元200通过输入端口IN接收比特流,并且分析所述比特流。解复用单元200将LPC系数量化信息输出给LPC系数解码单元210,将固定码本222的索引和标识符输出给固定码本解码器224,将自适应码本226的索引输出给自适应码本解码器228,将固定码本232的索引和标识符输出给固定码本解码器234,将增益量化信息输出给增益解码单元240,并且将增益差量化信息输出给增益差解码单元250。
LPC系数解码单元210使用从解复用单元200接收的LPC系数量化信息对LPC系数进行解码。
核心层解码单元220将核心层解码。核心层解码单元220包括固定码本222、固定码本解码器224、自适应码本226和自适应码本解码器228。
如在图1的核心层产生单元100的固定码本120和增强层产生单元150的固定码本160中一样,通过将可能的脉冲位置的组合分成多个空间来配置核心层解码单元220的固定码本222。
可通过将可能的脉冲位置的组合分成如图6所示的第一空间610和第二空间620来配置固定码本222。第一空间610可包括在核心层中极可能被搜索的可能的脉冲位置。
根据可能的脉冲位置是偶数还是奇数,第一空间610和第二空间620可彼此区分。图7A是示出当在核心层的固定码本中找到的脉冲位置值是偶数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7A, 当在核心层的固定码本中找到的脉冲位置值是偶数时,与奇数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。图7B是示出当在核心层的固定码本中找到的脉冲位置值是奇数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7B,当在核心层的固定码本中找到的脉冲位置值是奇数时,与偶数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。因此,可通过将奇数号的可能的脉冲位置分为第一空间、将偶数号的可能的脉冲位置分为第二空间来配置核心层和增强层的码本中的每个。或者,如图6所示,可通过将偶数号的可能的脉冲位置分为第一空间610、将奇数号的可能的脉冲位置分为第二空间620来配置核心层和增强层的码本中的每个。
重新参照图2,固定码本解码器224使用解复用单元200输出的标识符确定固定码本222的多个空间中将被搜索的空间,从确定的空间搜索与解复用单元200输出的索引相应的码字,并且将所述码字解码。这里,所述标识符表示图8A和图9A中示出的比特“偏移”。
自适应码本解码器228从自适应码本226搜索与解复用单元200输出的索引相应的码字,并且将所述码字解码。
增强层解码单元230将增强层解码。增强层解码单元230包括固定码本232和固定码本解码器234。
固定码本232被分为与核心层解码单元220的固定码本222的多个空间相应的多个空间。
固定码本解码器234从除了核心层解码单元220的固定码本解码器224确定的空间以外的固定码本232的空间搜索与解复用单元200输出的索引相应的码字,并且将找到的码字解码。因而,如果将核心层解码单元220的固定码本222和增强层解码单元230的固定码本232中的每个各分为第一空间610和第二空间620,并且由固定码本解码器224确定第一空间610,则固定码本解码器234从第二空间620搜索码字。如果由固定码本解码器224确定第二空间620,则固定码本解码器234从第一空间610搜索码字。
增益解码单元240将从解复用单元200接收的增益量化信息(所述信息包括核心层的固定码本增益Gc和自适应码本增益Gp)解码,并且输出固定码本增益Gc和自适应码本增益Gp。
增益差解码单元250将由解复用单元200输出的核心层和增强层的固定 码本的增益之间的差解码。
第一加法器260将核心层解码单元220的固定码本解码器224输出的结果与增强层解码单元230的固定码本解码器234输出的结果相加。
第一切换单元270根据控制信号,选择性地在固定码本解码器224输出的结果和第一加法器260的相加的结果之间切换。
第三加法器268将增益解码单元240输出的核心层的固定码本增益Gc与增益差解码单元250输出的结果相加。
第二切换单元275根据控制信号,选择性地在增益解码单元240输出的核心层的固定码本增益Gc和第三加法器268的相加的结果之间切换。
第二乘法器264将第一切换单元270输出的结果与第二切换单元275输出的结果相乘。
第一乘法器262将自适应码本解码器228的解码结果与增益解码单元240输出的自适应码本增益Gp相乘。
第二加法器266将第一乘法器262的相乘的结果与第二乘法器264的相乘的结果相加。
合成滤波器280使用从LPC系数解码单元210接收的解码的LPC系数合成第二加法器266的相加的结果,从而恢复语音信号。
后处理单元290改善合成滤波器280恢复的语音信号的质量,并且通过输出端口OUT输出改善的语音信号。更具体地,后处理单元290使用高通滤波器和LPC系数解码单元210输出的解码的LPC系数对恢复的语音信号滤波,以改善合成滤波器280恢复的语音信号的质量。
根据本发明总体构思的实施例的码本搜索设备包括在图1的语音信号编码设备和图2的语音信号解码设备中。
图3是示出根据本发明总体构思的实施例的将语音信号编码的方法的流程图。可以由图1的编码设备执行图3的方法。首先,在操作302,将DC分量从输入语音信号去除。也就是,在操作302中,使用高通滤波器对语音信号进行滤波,以从语音信号去除低频段中的噪声分量。
在操作304,从在操作302中已从其中去除了DC分量的语音信号提取LPC系数。
在操作306,将在操作304提取的LPC系数矢量量化。
在操作308,减法器从已从其中去除了DC分量的语音信号减去由核心 层的合成滤波器输出的信号。
在操作310,为了利用人的听力结构的掩蔽效果,核心层的感知权重滤波器对操作308中相减的结果进行滤波,从而量化噪声变得小于或等于掩蔽门限。在操作310,产生包括权重的信号,以便将在操作308中输出的信号的量化噪声最小化。
在操作312,将在操作310滤波的信号分为多个子帧,并且对每个子帧的基音进行分析,以输出自适应码本的索引和增益。
在操作314,使用在操作312输出的自适应码本的索引来检测从固定码本搜索与在操作310滤波的信号相应的固定码本矢量所需要的目标信号。
在操作316,从固定码本搜索与在操作314检测到的目标信号相应的固定码本矢量。在操作316,搜索将目标信号的均方误差(MSE)最小化的固定码本矢量。
通过将可能的脉冲位置的组合分为多个空间来配置核心层的固定码本。
如图6所示,可以通过将可能的脉冲位置的组合分为第一空间610和第二空间620来配置核心层的固定码本。第一空间610可包括在核心层中极有可能被搜索的可能的脉冲位置。
根据可能的脉冲位置是偶数还是奇数,第一空间610和第二空间620可彼此区分。图7A是示出当在核心层的固定码本中找到的脉冲位置值是偶数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7A,当在核心层的固定码本中找到的脉冲位置值是偶数时,与奇数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。图7B是示出当在核心层的固定码本中找到的脉冲位置值是奇数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7B,当在核心层的固定码本中找到的脉冲位置值是奇数时,与偶数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。因此,可通过将奇数号的可能的脉冲位置分为第一空间、将偶数号的可能的脉冲位置分为第二空间来配置核心层和增强层的码本中的每个。或者,如图6所示,可通过将偶数号的可能的脉冲位置分为第一空间610、将奇数号的可能的脉冲位置分为第二空间620来配置核心层和增强层的码本中的每个。
重新参照图3,在操作316的固定码本搜索中,搜索核心层的固定码本的空间的每个。因而,如果固定码本被分为第一空间610和第二空间620(见 图6),则从第一空间610搜索将目标信号的MSE最小化的固定码本矢量,并且还从第二空间620搜索将目标信号的MSE最小化的固定码本矢量。
在操作318,从在核心层的固定码本的多个空间中找到的固定码本矢量检测最低失真的固定码本矢量,并且输出在其中找到所检索到的固定码本矢量的空间。在操作318,输出属于确定的空间的固定码本的索引和增益。
在操作320,产生指示在操作318确定的空间的标识符。例如,在图8A和图9A中示出的比特“偏移”与在操作318中确定的空间的标识符相应。
在操作322,将在操作318输出的固定码本的增益和在操作312输出的自适应码本的增益进行量化,以产生量化的固定码本增益Gc和量化的自适应码本增益Gp。
在操作324,将在操作318检测到的固定码本矢量与在操作322产生的量化的固定码本增益Gc相乘。
在操作326,将在操作312检测到的自适应码本矢量与在操作322产生的量化的自适应码本增益Gp相乘。
在操作328,将在操作324的相乘的结果与在操作326相乘的结果相加。
在操作330,合成滤波器使用在操作306中的矢量量化的结果输出与在操作328获得的激励信号相应的合成信号。
在操作308之后,在操作354,对与操作308中相减的结果相应的信号进行滤波,从而所述信号的量化噪声变得小于或等于掩蔽门限,以便利用人的听力结构的掩蔽效果。换句话说,在操作354,产生包括权重的信号,以将在操作308获得的信号的量化噪声最小化。
在操作356,在固定码本中搜索与操作354中的滤波的结果相应的固定码本矢量。在操作356,输出在操作356中找到的固定码本矢量的索引和增益。
将增强层的固定码本分为与核心层的固定码本的多个空间相应的多个空间。
在操作354的固定码本矢量搜索中,搜索除了在操作318确定的空间以外的增强层的固定码本的多个空间中的每个。因而,如果核心层和增强层的固定码本的每个都被分为第一空间610和第二空间620(见图6),并且在操作318第一空间610被确定,则在操作356,从第二空间620搜索固定码本矢量。如果在操作318第二空间620被确定,则在操作356,从第一空间610 搜索固定码本矢量。
在操作358,获得在操作356输出的固定码本的增益和在操作322输出的固定码本的量化增益Gc之间的差,并且将所述差量化以产生量化的增益差Gce。
在操作360,将在操作356输出的固定码本矢量与在操作358输出的量化的增益差Gce相乘。
在操作362,合成滤波器使用在操作306的矢量量化的结果产生与在操作360的相乘的结果相应的合成的信号。
在操作380,从在操作306、312、318、320、322、356和358输出的结果产生比特流。
图4是示出根据本发明总体构思的实施例的将语音信号解码的方法的流程图。可由图2的解码设备执行图4的方法。首先,在操作400,从语音信号编码设备接收比特流,并且分析所述比特流。更具体地,在操作400,输出LPC系数量化信息、核心层的固定码本的索引和标识符、核心层的自适应码本的索引、增强层的固定码本的索引和标识符、增益量化信息和增益差量化信息。
在操作405,使用在操作400输出的LPC系数量化信息将LPC系数解码。
在操作415,使用在操作400输出的标识符确定核心层的固定码本的多个空间中将要被搜索的空间,从确定的空间搜索与在操作400输出的索引相应的码字,并且将所述码字解码。这里,所述标识符表示在核心层的固定码本中提供的特定空间,如图8A和图9A所示的比特“偏移”。
如在增强层的固定码本中一样,通过将可能的脉冲位置的组合分为多个空间来配置核心层的固定码本。
可通过将可能的脉冲位置的组合分为如图6中示出的第一空间610和第二空间620来配置核心层的固定码本。第一空间610可包括在核心层中极可能被搜索的可能的脉冲位置。
根据可能的脉冲位置是偶数还是奇数,第一空间610和第二空间620可彼此区分。图7A是示出当在核心层的固定码本中找到的脉冲位置值是偶数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7A,当在核心层的固定码本中找到的脉冲位置值是偶数时,与奇数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。图7B是示出当在核心层的固 定码本中找到的脉冲位置值是奇数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7B,当在核心层的固定码本中找到的脉冲位置值是奇数时,与偶数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。因此,可通过将奇数号的可能的脉冲位置分为第一空间、将偶数号的可能的脉冲位置分为第二空间来配置核心层和增强层的码本中的每个。或者,如图6所示,可通过将偶数号的可能的脉冲位置分为第一空间610、将奇数号的可能的脉冲位置分为第二空间620来配置核心层和增强层的码本中的每个。
重新参照图4,在操作420,从核心层的自适应码本搜索与在操作400输出的核心层的自适应码本的索引相应的码字,并且将所述码字解码。
在操作425,在除了在操作415确定的空间以外的增强层的固定码本的空间中搜索与在操作400输出的增强层的固定码本的索引相应的码字,并且将所述码字解码。因而,如果核心层和增强层的固定码本的每个都被分为第一空间610和第二空间620(见图6),并且在操作415第一空间610被确定,则从第二空间620搜索码字。如果在操作415第二空间620被确定,则从第一空间610搜索码字。
通过将可能的脉冲位置的组合分成与核心层的固定码本的多个空间相应的空间来配置增强层的固定码本。
在操作430,将在操作400输出的固定码本增益和自适应码本增益解码。
在操作435,将在操作400输出的核心层和增强层的固定码本增益之间的差解码。
在操作440,对在操作415、420、430和435的解码的结果执行预定的操作。
在操作445,使用在操作405中输出的解码的LPC系数,在合成滤波器中对在操作440中执行的操作的结果进行合成,从而恢复语音信号。
在操作450,改善在操作445恢复的语音信号的质量,从而输出改善的恢复的语音信号。更具体地,在操作450,通过使用高通滤波器和在操作405输出的解码的LPC系数对恢复的语音信号滤波,来改善在操作445恢复的语音信号的质量。
在图3的语音信号编码方法和图4的语音信号解码方法期间,执行根据本发明总体构思的实施例的码字搜索方法。
图5是示出根据本发明总体构思的实施例的搜索固定码本的方法的流程图。可通过将可能的脉冲位置的组合分成第一空间610和第二空间620(见图6)来配置核心层和增强层的固定码本中的每个。
第一空间610可包括在核心层中极可能被搜索的可能的脉冲位置。
根据可能的脉冲位置是偶数还是奇数,第一空间610和第二空间620可彼此区分。图7A是示出当在核心层的固定码本中找到的脉冲位置值是偶数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7A,当在核心层的固定码本中找到的脉冲位置值是偶数时,与奇数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。图7B是示出当在核心层的固定码本中找到的脉冲位置值是奇数时,每个脉冲的位置从增强层的固定码本被选择的概率的曲线图。参照图7B,当在核心层的固定码本中找到的脉冲位置值是奇数时,与偶数相应的脉冲位置值从增强层的固定码本被选择的概率相当高。因此,可通过将奇数号的可能的脉冲位置分为第一空间、将偶数号的可能的脉冲位置分为第二空间来配置核心层和增强层的码本中的每个。或者,如图6所示,可通过将偶数号的可能的脉冲位置分为第一空间610、将奇数号的可能的脉冲位置分为第二空间620来配置核心层和增强层的码本中的每个。
重新参照图5,首先,在操作500,在核心层的固定码本的第一空间610和第二空间620的每个中搜索将目标信号的均方误差(MSE)最小化的固定码本矢量。
在操作510,从在操作500中核心层的固定码本的第一空间610选择的固定码本矢量的失真值D0减去从在操作500中核心层的固定码本的第二空间620选择的固定码本矢量的失真值D1。
在操作520,确定与操作510中的相减的结果相应的值D0-D1是否大于0。
在操作530,如果在操作520确定D0-D1大于0,则产生核心层的固定码本的第一空间610的标识符。这里,标识符表示核心层的固定码本中提供的特定空间,如图8A和图9A中示出的比特“偏移”。
在操作530之后,在操作540,仅从增强层的固定码本的第二空间620搜索固定码本矢量。
在操作550,如果在操作520确定值D0-D1小于或等于0,则产生核心 层的固定码本的第二空间620的标识符。
在操作560,仅从增强层的固定码本的第一空间610搜索固定码本矢量。
图8A示出根据本发明总体构思的实施例的分配给核心层的固定码本的比特。图8B示出根据本发明总体构思的实施例的分配给增强层的固定码本的比特。图8C示出分配给核心层的G.729固定码本的比特。图8D示出分配给增强层的G.729固定码本的比特。图9A示出根据本发明总体构思的另一实施例的分配给核心层的固定码本的比特。图9B示出根据本发明总体构思的另一实施例的分配给增强层的固定码本的比特。图9C示出在3GPP2VMR-WB速率集-1中分配给核心层的固定码本的比特。图9D示出在3GPP2VMR-WB速率集-1中分配给增强层的固定码本的比特。图10A是示出在根据本发明总体构思的实施例的PESQ(语音质量的感知测评)和现有技术PESQ之间的比较结果的曲线图。在图10A中,通过虚线柱状图表示本实施例的PESQ,而通过具有对角线的柱状图表示现有技术的PESQ。图10B是示出在根据本发明总体构思的实施例的固定码本中使用的每个子帧的比特和在现有技术的固定码本中使用的每个子帧的比特之间的比较结果的曲线图。在图10B中,通过虚线柱状图表示本实施例的比特数目,而通过具有对角线的柱状图表示现有技术的比特数目。
在根据本发明总体构思的实施例的固定码本搜索方法和设备以及使用所述固定码本搜索方法和设备的语音信号编码/解码方法和设备中,为了基于CELP降低比特率,而不降低增强层的性能,将核心层的固定码本和增强层的固定码本中的每个分为多个空间。因而,搜索除了与核心层的固定码本的多个空间当中确定的最低失真的空间相应的空间之外的增强层的固定码本的空间。
这样,根据本发明总体构思,不需要将用下划线表示的位置值的比特分配给图8A、图8B、图9A和图9B的固定码本。因此,图8A、图8B、图9A和图9B的固定码本的比特数目能够比图8C和图8D中示出的分配给G.729固定码本的比特数目以及图9C和图9D中示出的在3GPP2VMR-WB速率集-1中分配给固定码本的比特数目更少。也可以从图10A中示出的PESQ结果以及图10B中示出的在根据本发明总体构思的固定码本中使用的每个子帧的比特和在现有技术的固定码本中使用的每个子帧的比特之间的比较结果看出根据本发明总体构思在固定码本中使用数目较少的比特。因此,在根据本发 明总体构思的实施例的固定码本搜索方法和设备以及使用所述固定码本搜索方法和设备的语音信号编码/解码方法和设备中,可以使用数目少的比特将语音信号编码或解码,而不降低性能。
可以将总体发明构思实现为计算机(指具有信息处理功能的任何装置)可读记录介质上的计算机可读代码。所述计算机可读记录介质是可存储其后可由计算机系统读取的程序或数据的任何数据存储装置。计算机可读记录记者的实例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、硬盘、软盘、闪速存储器、光学数据存储装置等。
虽然已示出并描述了本发明总体构思的一些实施例,但是本领域的普通技术人员将会理解,在不脱离由所附权利要求及其等同物限定其范围的本发明总体构思的原理和精神的情况下,可以对这些实施例进行各种改变。
Claims (18)
1.一种固定码本搜索设备,包括:
包括多个空间的核心层码本,可能的脉冲位置的组合被分为所述多个空间;
核心层搜索单元,搜索核心层码本的多个空间中的每个,并且确定核心层码本的多个空间当中的最低失真空间;
包括多个空间的增强层码本,所述多个空间与核心层码本的多个空间相应;和
增强层搜索单元,搜索除了增强层码本中与在核心层码本中确定的空间相应的空间以外的增强层码本的空间,
其中,通过将可能的脉冲位置的组合分成第一空间和第二空间来配置核心层码本和增强层码本中的每个,并且第一空间包括从核心层码本极可能被搜索的可能的脉冲位置。
2.如权利要求1所述的固定码本搜索设备,其中,根据可能的脉冲位置是偶数还是奇数,将可能的脉冲位置分为核心层码本和增强层码本中的每个的第一空间和第二空间。
3.如权利要求1所述的固定码本搜索设备,其中,所述核心层搜索单元包括:
搜索器,搜索核心层码本的多个空间中的每个;
空间确定器,确定搜索的空间当中的最低失真空间;
标识符产生器,产生指示确定的空间的标识符。
4.一种用于对语音信号编码的设备,所述设备包括:
包括多个空间的核心层码本,可能的脉冲位置的组合被分为所述多个空间;
核心层产生单元,搜索核心层码本的多个空间中的每个,并且通过确定核心层码本的多个空间当中的最低失真空间来产生核心层;
包括多个空间的增强层码本,所述多个空间与核心层码本的多个空间相应;
增强层产生单元,通过搜索除了增强层码本中与在核心层码本的确定的空间相应的空间以外的增强层码本的空间来产生增强层;和
编码单元,将语音信号编码为核心层和增强层,
其中,通过将可能的脉冲位置的组合分成第一空间和第二空间来配置核心层码本和增强层码本中的每个,并且第一空间包括从核心层码本极可能被搜索的可能的脉冲位置。
5.如权利要求4所述的设备,其中,根据可能的脉冲位置是偶数还是奇数,将可能的脉冲位置分为核心层码本和增强层码本的每个的第一空间和第二空间。
6.如权利要求4所述的设备,其中,所述核心层产生单元包括:
搜索器,搜索核心层码本的多个空间中的每个;
空间确定器,确定在搜索的空间找到的结果当中的最低失真结果的空间;
层产生器,使用在确定的空间中找到的最低失真结果来产生核心层;和
标识符产生器,产生指示确定的空间的标识符。
7.一种用于对被编码为核心层和增强层的语音信号解码的设备,所述设备包括:
包括多个空间的核心层码本,可能的脉冲位置的组合被分为所述多个空间;
核心层解码单元,通过搜索由包括在编码的语音信号中的标识符指示的核心层码本的空间来将核心层解码;
包括多个空间的增强层码本,所述多个空间与核心层码本的多个空间相应;和
增强层解码单元,通过搜索除了增强层码本中与核心层码本的确定的空间相应的空间以外的增强层码本的空间来将增强层解码,
其中,通过将可能的脉冲位置的组合分成第一空间和第二空间来配置核心层码本和增强层码本中的每个,并且第一空间包括从核心层码本极可能被搜索的可能的脉冲位置。
8.如权利要求7所述的设备,其中,包括在编码的语音信号中的标识符指示用于将编码的语音信号解码的核心层码本的空间。
9.如权利要求7所述的设备,其中,根据可能的脉冲位置是偶数还是奇数,将可能的脉冲位置分为核心层码本和增强层码本中的每个的第一空间和第二空间。
10.一种固定码本搜索方法,包括:
搜索核心层码本的多个空间;
确定核心层码本的多个空间中的最低失真空间;和
搜索除了与核心层码本的确定的空间相应的空间以外的增强层码本的空间,
其中,通过将可能的脉冲位置分为多个空间来配置核心层码本,并且通过将可能的脉冲位置分为与核心层码本的空间相应的多个空间来配置增强层码本,
其中,通过将可能的脉冲位置的组合分为第一空间和第二空间来配置核心层码本和增强层码本中的每个,并且第一空间包括从核心层码本极可能被搜索的可能的脉冲位置。
11.如权利要求10所述的固定码本搜索方法,其中,根据可能的脉冲位置是偶数还是奇数,将可能的脉冲位置分为核心层码本和增强层码本中的每个的第一空间和第二空间。
12.如权利要求10所述的固定码本搜索方法,其中,所述确定最低失真空间的步骤包括:产生指示确定的空间的标识符。
13.一种将语音信号编码的方法,所述方法包括:
搜索核心层码本的多个空间;
通过确定核心层码本的多个空间当中的最低失真空间来产生核心层;
通过搜索除了与核心层码本的确定的空间相应的空间以外的增强层码本的空间来产生增强层;和
将语音信号编码为核心层和增强层,
其中,通过将可能的脉冲位置分为多个空间来配置核心层码本,并且通过将可能的脉冲位置分为与核心层码本的空间相应的多个空间来配置增强层码本,
其中,通过将可能的脉冲位置的组合分成第一空间和第二空间来配置核心层码本和增强层码本中的每个,并且第一空间包括从核心层码本极可能被搜索的可能的脉冲位置。
14.如权利要求13所述的方法,其中,根据可能的脉冲位置是偶数还是奇数,将可能的脉冲位置分为核心层码本和增强层码本中的每个的第一空间和第二空间。
15.如权利要求13所述的方法,其中,所述确定最低失真空间的步骤包括:产生指示确定的空间的标识符。
16.一种对被编码为核心层和增强层的语音信号解码的方法,所述方法包括:
通过搜索由包括在编码的语音信号中的标识符指示的核心层码本的空间来将核心层解码;和
通过搜索除了与核心层码本的确定的空间相应的空间以外的增强层码本的空间来将增强层解码,
其中,通过将可能的脉冲位置分为多个空间来配置核心层码本,并且通过将可能的脉冲位置分为与核心层码本的空间相应的多个空间来配置增强层码本,
其中,通过将可能的脉冲位置的组合分为第一空间和第二空间来配置核心层码本和增强层码本中的每个,并且第一空间包括从核心层码本极可能被搜索的可能的脉冲位置。
17.如权利要求16所述的方法,其中,包括在编码的语音信号中的标识符指示用于将编码的语音信号解码的核心层码本的空间。
18.如权利要求16所述的方法,其中,根据可能的脉冲位置是偶数还是奇数,将可能的脉冲位置分为核心层码本和增强层码本中的每个的第一空间和第二空间。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060047118 | 2006-05-25 | ||
KR10-2006-0047118 | 2006-05-25 | ||
KR1020060047118A KR101542069B1 (ko) | 2006-05-25 | 2006-05-25 | 고정 코드북 검색 방법 및 장치와 그를 이용한 음성 신호의부호화/복호화 방법 및 장치 |
PCT/KR2007/002470 WO2007139300A1 (en) | 2006-05-25 | 2007-05-22 | Method and apparatus to search fixed codebook and method and appratus to encode/decode a speech signal using the method and apparatus to search fixed codebook |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101454829A CN101454829A (zh) | 2009-06-10 |
CN101454829B true CN101454829B (zh) | 2012-05-30 |
Family
ID=38750617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800190396A Expired - Fee Related CN101454829B (zh) | 2006-05-25 | 2007-05-22 | 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8595000B2 (zh) |
EP (1) | EP2024968A4 (zh) |
KR (1) | KR101542069B1 (zh) |
CN (1) | CN101454829B (zh) |
WO (1) | WO2007139300A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
CN101964188B (zh) | 2010-04-09 | 2012-09-05 | 华为技术有限公司 | 语音信号编码、解码方法、装置及编解码系统 |
DK3217399T3 (en) | 2016-03-11 | 2019-02-25 | Gn Hearing As | Kalman filtering based speech enhancement using a codebook based approach |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1547193A (zh) * | 2003-12-03 | 2004-11-17 | 北京首信股份有限公司 | 一种用于语音编码的固定码本快速搜索算法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2729245B1 (fr) * | 1995-01-06 | 1997-04-11 | Lamblin Claude | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
US7606703B2 (en) * | 2000-11-15 | 2009-10-20 | Texas Instruments Incorporated | Layered celp system and method with varying perceptual filter or short-term postfilter strengths |
US6996522B2 (en) * | 2001-03-13 | 2006-02-07 | Industrial Technology Research Institute | Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse |
KR100464369B1 (ko) * | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US7272555B2 (en) * | 2001-09-13 | 2007-09-18 | Industrial Technology Research Institute | Fine granularity scalability speech coding for multi-pulses CELP-based algorithm |
AU2003237279A1 (en) * | 2002-05-29 | 2003-12-19 | Pixonics, Inc. | Classifying image areas of a video signal |
JP2004101588A (ja) * | 2002-09-05 | 2004-04-02 | Hitachi Kokusai Electric Inc | 音声符号化方法及び音声符号化装置 |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
DE602004004950T2 (de) * | 2003-07-09 | 2007-10-31 | Samsung Electronics Co., Ltd., Suwon | Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren |
KR100668300B1 (ko) | 2003-07-09 | 2007-01-12 | 삼성전자주식회사 | 비트율 확장 음성 부호화 및 복호화 장치와 그 방법 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
-
2006
- 2006-05-25 KR KR1020060047118A patent/KR101542069B1/ko not_active IP Right Cessation
-
2007
- 2007-02-22 US US11/709,255 patent/US8595000B2/en not_active Expired - Fee Related
- 2007-05-22 WO PCT/KR2007/002470 patent/WO2007139300A1/en active Application Filing
- 2007-05-22 EP EP07746618A patent/EP2024968A4/en not_active Withdrawn
- 2007-05-22 CN CN2007800190396A patent/CN101454829B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1547193A (zh) * | 2003-12-03 | 2004-11-17 | 北京首信股份有限公司 | 一种用于语音编码的固定码本快速搜索算法 |
Non-Patent Citations (3)
Title |
---|
NOMURA T. ET AL.A Bitrate and Bandwidth Scalable CELP Coder.《PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING》.1998,341 - 344. |
NOMURA T. ET AL.A Bitrate and Bandwidth Scalable CELP Coder.《PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING》.1998,341- 344. * |
蔡幸峰.一位元可调CELP语音编码方法.《台湾国立成功大学硕士论文》.2004, * |
Also Published As
Publication number | Publication date |
---|---|
US20070276655A1 (en) | 2007-11-29 |
EP2024968A4 (en) | 2011-08-31 |
CN101454829A (zh) | 2009-06-10 |
KR20070113619A (ko) | 2007-11-29 |
KR101542069B1 (ko) | 2015-08-06 |
WO2007139300A1 (en) | 2007-12-06 |
US8595000B2 (en) | 2013-11-26 |
EP2024968A1 (en) | 2009-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
US8010348B2 (en) | Adaptive encoding and decoding with forward linear prediction | |
CN101996636B (zh) | 带多级码本和冗余编码的子带话音编解码器 | |
CN101548319B (zh) | 后置滤波器以及滤波方法 | |
CN1121683C (zh) | 语音编码 | |
CN1898723B (zh) | 信号解码装置以及信号解码方法 | |
JPH08263099A (ja) | 符号化装置 | |
KR102561265B1 (ko) | 부호화 모드 결정방법 및 장치, 오디오 부호화방법 및 장치와, 오디오 복호화방법 및 장치 | |
Huang et al. | Lossless audio compression in the new IEEE standard for advanced audio coding | |
CN101454829B (zh) | 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备 | |
US6611797B1 (en) | Speech coding/decoding method and apparatus | |
US7047186B2 (en) | Voice decoder, voice decoding method and program for decoding voice signals | |
JP2000112498A (ja) | 音声符号化方法 | |
US20090048849A1 (en) | Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid | |
US20070078651A1 (en) | Device and method for encoding, decoding speech and audio signal | |
KR101317269B1 (ko) | 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 | |
JP5174651B2 (ja) | 低演算量符号励振線形予測符号化 | |
US8762136B2 (en) | System and method of speech compression using an inter frame parameter correlation | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
JPH05232996A (ja) | 音声符号化装置 | |
EP3966818A1 (en) | Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack | |
JP2011170259A (ja) | 音声符号化装置、方法及びプログラム、並びに、コードブックデータ分類集計装置、方法及びプログラム | |
JP2005062410A (ja) | 音声信号の符号化方法 | |
JPH09269798A (ja) | 音声符号化方法および音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120530 Termination date: 20170522 |