CN100354927C - 解码自适应声源向量产生装置及其语音解码装置 - Google Patents
解码自适应声源向量产生装置及其语音解码装置 Download PDFInfo
- Publication number
- CN100354927C CN100354927C CNB2005100641069A CN200510064106A CN100354927C CN 100354927 C CN100354927 C CN 100354927C CN B2005100641069 A CNB2005100641069 A CN B2005100641069A CN 200510064106 A CN200510064106 A CN 200510064106A CN 100354927 C CN100354927 C CN 100354927C
- Authority
- CN
- China
- Prior art keywords
- pitch period
- sound source
- self
- source vector
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 claims abstract description 218
- 230000003044 adaptive effect Effects 0.000 claims abstract description 42
- 239000000284 extract Substances 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 24
- 230000000737 periodic effect Effects 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims 4
- 238000003860 storage Methods 0.000 abstract description 24
- 239000011159 matrix material Substances 0.000 description 21
- 230000004044 response Effects 0.000 description 15
- 230000035807 sensation Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 7
- 230000014759 maintenance of location Effects 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000004304 visual acuity Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
自适应声源向量发生器(ASSVG)103设置以在先前子帧中选择的整数精确度音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量P(T-frac)。上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度还是小数精确度。比较判断部件(CJS)110限制作为最佳音调周期的小数精确度音调信息的选择次数。
Description
本专利申请是下列专利申请的分案申请:
申请号:02802766.3
申请日:2002年8月1日
发明名称:音调周期搜索范围设置装置和音调周期搜索装置
技术领域
本发明涉及音调(pitch)周期搜索范围设置装置和音调周期搜索装置,特别涉及码激励线性预测(CELP)型语音编码装置的音调周期搜索范围设置装置和音调周期搜索装置。
背景技术
在诸如以数字通信和因特网通信为代表的分组通信、或语音存储等领域中,语音信号编码/解码技术是高效利用无线电波传输路径容量和存储介质的关键,当前已开发了许多语音编码/解码方法。
其中,在以中等或低位速率编码/解码语音信号时,码激励线性预测(CELP)型语音编码/解码方法广泛作为主流方法使用。在文献1(Proc.ICASSP′85,pp.937-pp.940,1985)中公开了CELP型语音编码/解码方法。
在CELP型语音编码/解码方法中,将已数字化的语音信号划分为大约20ms的多个帧,为每个帧进行对语音信号的线性预测分析,求出线性预测数和线性预测剩余向量,并单个地对线性预测数和线性预测剩余向量进行编码/解码。线性预测剩余向量也叫做激励信号向量。
使用自适应代码本和固定代码本对线性预测剩余向量进行编码/解码,所述自适应代码本中保存有过去产生的驱动声源信号,所述固定代码本中存储指定数量的定形向量(固定代码向量)。
该自适应代码本用于代表线性预测剩余向量具有的循环分量。另一方面,固定代码本用于代表线性预测剩余向量中不能由自适应代码本代表的非循环分量。一般而言,在通过将帧划分为较短的时间单元(大约5ms至10ms)而得到的子帧单元中进行线性预测剩余向量编码/解码处理。
使用CELP,从线性预测剩余向量中寻找音调周期,并进行编码。下面描述传统线性预测剩余音调周期搜索装置。图1是展示传统音调周期搜索装置的构造的方框图。
图1中的音调周期搜索装置10主要包括音调周期指示器(PCI)11、自适应代码本(ACB)12、自适应声源向量发生器(ASSVG)13、整数音调周期搜索器(IPCS)14、小数音调周期自适应声源向量发生器(FPCASSVG)15、小数音调周期搜索器(FPCS)16、以及失真比较器(DC)17。
音调周期指示器(PCI)11给自适应声源向量发生器(ASSVG)13依次指示预设音调周期搜索范围内想要的音调周期T-int。例如,当CELP语音编码/解码装置对16kHz语音信号进行编码/解码,并且从32至267以整数精确度预设目标向量音调周期搜索范围,而从32+1/2、33+1/2、...、至51+1/2以1/2小数精确度预设目标向量音调周期搜索范围时,音调周期指示器(PCI)11向自适应声源向量发生器(ASSVG)13输出236种音调周期T-int(T-int=32、33、...、267)。自适应代码本(ACB)12存储过去产生的驱动声源信号。
接着,自适应声源向量发生器(ASSVG)13从自适应代码本(ACB)12中提取具有从音调周期指示器(PCI)11接收到的整数精确度音调周期T-int的自适应声源向量p(t-int),并将其输出到整数音调周期搜索器(IPCS)14。
下面描述从自适应代码本(ACB)12中提取具有从整数精确度音调周期T-int的自适应声源向量p(t-int)的处理。图2展示帧构造的例子。
在图2中,帧21和帧31是存储在自适应代码本中的过去的驱动声源信号序列。自适应声源向量发生器(ASSVG)13在音调周期搜索范围的下限32和上限267之间搜索帧音调周期。
由于从帧21检索到的音调周期22长于子帧23的长度,自适应声源向量发生器(ASSVG)13把从帧21中以子帧的帧长度提取出的部分23当作自适应声源向量。
同样,由于从帧31检索到的音调周期32短于子帧33的长度,自适应声源向量发生器(ASSVG)13提取自适应声源向量直到音调周期32,并把通过迭代提取向量部分33直到子帧长度的长度而获得的向量部分当作自适应声源向量。
此外,自适应声源向量发生器(ASSVG)13从自适应代码本(ACB)12中提取当求出对应于小数精确度音调周期的自适应声源向量时必要的自适应声源向量,并将其输出到小数音调周期自适应声源向量发生器(FPCASSVG)15。
接下来,整数音调周期搜索器(IPCS)14从具有整数音调周期T-int的自适应声源向量p(t-int)、组合滤波器脉冲响应矩阵H、以及目标向量X,计算整数音调周期选择标准DIST(T-int)。
公式(1)用于计算整数音调周期选择标准(measure)DIST(T-int)。
当计算整数音调周期选择标准DIST(T-int)时,可以通过给组合滤波器脉冲响应矩阵H乘以听觉加权滤波器脉冲响应矩阵W获得矩阵H′,而在公式(1)中使用矩阵H′来代替组合滤波器脉冲响应矩阵H。
这里,整数音调周期搜索器(IPCS)14使用公式(1),对由音调周期指示器(PCI)11指示的从音调周期32至267的音调周期T-int的236个变化,重复执行整数音调周期选择标准DIST(T-int)计算处理。
整数音调周期搜索器(IPCS)14还从236个计算出的整数音调周期选择标准DIST(T-int)中,选择具有最大值的DIST(T-int),并向失真比较器(DC)17输出所选择的DIST(T-int)。另外,整数音调周期搜索器(IPCS)14向失真比较器(DC)17,输出与计算DIST(T-int)时参考的自适应声源向量音调周期T-int对应的索引,作为IDX(INT)。
接下来,小数音调周期自适应声源向量发生器(FPCASSVG)15通过对从自适应声源向量发生器(ASSVG)13接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac(32+1/2、33+1/2、...、51+1/2)的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)16输出该p(T-frac)。
然后,小数音调周期搜索器(FPCS)16用具有小数音调周期T-frac的自适应声源向量p(T-frac)、组合滤波器脉冲响应矩阵H、以及目标向量X,计算小数音调周期选择标准DIST(T-frac)。公式(2)用于计算小数音调周期选择标准DIST(T-frac)。
当计算小数音调周期选择标准DIST(T-frac)时,可以通过给组合滤波器脉冲响应矩阵H乘以听觉加权滤波器脉冲响应矩阵W获得矩阵H′,而在公式(1)中使用矩阵H′来代替组合滤波器脉冲响应矩阵H。
这里,小数音调周期搜索器(FPCS)16使用公式(2),对从音调周期32+1/2至51+1/2的小数音调周期T-frac的20个变化,重复执行小数音调周期选择标准DIST(T-frac)计算处理。
小数音调周期搜索器(FPCS)16还从20个计算出的小数音调周期选择标准DIST(T-frac)中,选择具有最大值的DIST(T-frac),并向失真比较器(DC)17输出所选择的DIST(T-frac)。
另外,小数音调周期搜索器(FPCS)16向失真比较器(DC)17,输出与计算DIST(T-frac)时参考的自适应声源向量音调周期T-frac对应的索引,作为IDX(FRAC)。
接下来,失真比较器(DC)17比较从整数音调周期搜索器(IPCS)14接收的DIST(INT)和从小数音调周期搜索器(FPCS)16接收的DIST(FRAC)的值。然后,失真比较器(DC)17确定当计算出具有较大的DIST(INT)和DIST(FRAC)值的音调周期选择标准DIST时的音调周期为最佳音调周期,并输出对应于最佳音调周期的索引作为最佳索引IDX。
与上例中一样,当选择从32至267的整数精确度音调周期搜索范围、和从32+1/2至51+1/2的小数精确度音调周期搜索范围为音调周期搜索范围时,总共提供256(256=236+20)个整数精确度和小数精确度音调周期搜索候选者,并将最佳索引IDX编码为8位二进制数据。
上述“使用自适应代码本的线性预测剩余音调周期搜索装置”的特征在于,在对应于比以整数精确度搜索的音调周期搜索范围短的音调周期的部分,既以整数精确度进行音调周期搜索,又进行1/2小数精确度音调周期搜索,还进行从以整数精度检索出的最佳音调周期和以小数精确度检索出的最佳音调周期中,对最终音调周期的选择。
因此,使用传统音调搜索装置,对包含许多相对较短的音调周期的女性嗓音,可以有效地对线性预测剩余音调周期进行编码/解码。在文献2(IEEEJOURNAL ON SELECTED AREAS IN COMMUNICATIONS,pp.31-pp.41,VOL.13,No.1,JANUARY 1995)等中公开了上述特征和效果。
然而,使用传统音调搜索装置,以小数精确度搜索音调周期的范围限于很短的音调周期,所以,对于包含许多相对较长的音调周期的男性嗓音,在以小数精确度搜索音调周期的范围之外搜索音调周期,只以整数精确度搜索音调周期,这导致音调周期分辨率下降的问题,从而难于有效地进行编码/解码。
发明内容
本发明的目的是提供使得能够有效地对语音信号音调周期进行编码/解码的音调搜索装置。
通过不固定以小数精确度搜索音调周期的范围,而在从先前子帧中检索出的音调周期的附近以小数精确度搜索,来实现该目的。
本发明提供了一种音调周期搜索范围设置装置,包括:音调周期指示部件,其在以子帧为基础搜索语音信号中包括的音调周期的音调周期搜索处理中,以整数精确度给自适应声源向量发生部件依次指示预设音调周期搜索范围内的音调周期候选者;自适应声源向量发生部件,用于从存储过去的驱动声源的自适应代码本中,提取具有由所述音调周期指示部件指示的音调周期的自适应声源向量;以及上一子帧整数音调周期存储部件,用于存储对先前子帧的音调周期搜索处理中最后选择的音调周期的整数分量,其中所述音调周期搜索范围设置装置将整数精确度音调周期搜索候选者和小数精确度音调周期搜索候选者的双方或两者之一设置为在正在处理的子帧部分的音调周期搜索处理中的音调周期搜索对象,其中由所述音调周期指示部件指示所述整数精确度音调周期候选者,所述小数精确度音调周期搜索候选者以小数精确度覆盖在从所述上一子帧整数音调周期存储部件中读取的整数精确度音调周期的附近的音调周期。
附图说明
图1是展示传统音调周期搜索装置结构的方框图;
图2展示帧结构的例子;
图3是展示本发明实施例1的音调周期搜索装置的构造的方框图;
图4是展示该实施例的音调周期搜索装置的操作的例子的流程图;
图5是展示本发明实施例2的解码自适应声源向量发生装置的构造的方框图;
图6是展示图4的语音解码部件503内部构造的方框图;
图7是展示语音编码装置403的构造的方框图;
图8是展示图6中语音解码部件503的内部构造的方框图。
具体实施方式
下面参考附图详细描述本发明的实施例。
(实施例1)
图3是展示本发明实施例1的音调周期搜索装置的构造的方框图。图3中的音调周期搜索装置100主要包括音调周期指示器(PCI)101、自适应代码本(ACB)102、自适应声源向量发生器(ASSVG)103、整数音调周期搜索器(IPCS)104、小数音调周期自适应声源向量发生器(FPCASSVG)105、小数音调周期搜索器(FPCS)106、失真比较器(DC)107、上一子帧整数音调周期存储器(LSFIPCS)108、最佳音调周期精确度判断部件(OPCAJS)109、以及比较判断部件(CJS)110。
音调周期指示器(PCI)101给自适应声源向量发生器(ASSVG)103依次指示预设音调周期搜索范围内的音调周期T-int。自适应代码本(ACB)102存储过去产生的驱动声源信号。
自适应声源向量发生器(ASSVG)103根据从音调周期指示器(PCI)101接收到的指令从自适应代码本(ACB)102中提取具有的整数精确度音调周期T-int的自适应声源向量p(t-int),并向整数音调周期搜索器(IPCS)104输出该自适应声源向量p(t-int)。
自适应声源向量发生器(ASSVG)103从上一子帧整数音调周期存储器(LSFIPCS)108中读取在先前的子帧中选择的整数精确度音调周期T0,设置以该音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量p(T-frac),并向小数音调周期自适应声源向量发生器(FPCASSVG)105输出所提取的自适应声源向量。
整数音调周期搜索器(IPCS)104用从自适应声源向量发生器(ASSVG)103接收的自适应声源向量p(t-int)、组合滤波器脉冲响应矩阵H、以及目标向量x,计算整数音调周期选择标准DIST(T-int)。然后,整数音调周期搜索器(IPCS)104从整数音调周期选择标准DIST(T-int)中选择值最大的DIST(T-int),并向失真比较器(DC)107输出所选DIST(T-int)。
小数音调周期自适应声源向量发生器(FPCASSVG)105通过对从自适应声源向量发生器(ASSVG)103接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2)的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)106输出该p(T-frac)。
小数音调周期搜索器(FPCS)106用从小数音调周期自适应声源向量发生器(FPCASSVG)105接收的自适应声源向量p(T-frac)、组合滤波器脉冲响应矩阵H、以及目标向量x,计算小数音调周期选择标准DIST(T-frac)。然后,小数音调周期搜索器(FPCS)106从小数音调周期选择标准DIST(T-frac)中选择具有最大值的DIST(T-frac),并向失真比较器(DC)107输出所选择的DIST(T-frac)。
失真比较器(DC)107比较从整数音调周期搜索器(IPCS)104接收的DIST(INT)和从小数音调周期搜索器(FPCS)106接收的DIST(FRAC)的值。然后,失真比较器(DC)107确定当计算出具有较大的DIST(INT)和DIST(FRAC)值的音调周期选择标准DIST时的音调周期为最佳音调周期,并输出IDX(INT)和IDX(FRAC)的、对应于最佳音调周期的索引作为最佳索引IDX。
然后,失真比较器(DC)107向上一子帧整数音调周期存储器(LSFIPCS)108输出最佳音调周期整数分量T0,并向最佳音调周期精确度判断部件(OPCAJS)109输出最佳音调周期。
上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。
最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度还是小数精确度。比较判断部件(CJS)110限制在最佳音调周期中选择小数精确度音调信息的次数。
接下来,将描述本实施例的音调周期搜索装置的操作。图4是展示本实施例的音调周期搜索装置的操作的例子的流程图。
在图4中,在步骤(下文中简称为“ST”)201,由自适应声源向量发生器(ASSVG)103从上一子帧整数音调周期存储器(LSFIPCS)108中,读取在先前子帧中选择的整数精确度音调周期T0。
在ST202,由自适应声源向量发生器(ASSVG)103产生自适应声源向量。在ST203,由整数音调周期搜索器(IPCS)104搜索最佳整数精确度音调周期T-int。
在ST204,比较判断部件(CJS)110判断是否需要小数精确度音调周期搜索。如果需要小数精确度音调周期搜索,则处理流程进入ST205。如果不需要小数精确度音调周期搜索,则处理流程进入ST207。
在ST205,由小数音调周期自适应声源向量发生器(FPCASSVG)105产生具有小数精确度音调周期T-frac的自适应声源向量。在ST206,由小数音调周期搜索器(FPCS)106搜索最佳小数精确度音调周期T-frac。
在ST207,由失真比较器(DC)107从最佳整数精确度音调周期T-int和最佳小数精确度音调周期T-frac中选择最佳音调周期。在ST208,在上一子帧整数音调周期存储器(LSFIPCS)108中存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0。
在ST209,最佳音调周期精确度判断部件(OPCAJS)109判断由失真比较器(DC)107选择的最佳音调周期是整数精确度音调周期还是小数精确度音调周期。
在ST210,由比较判断部件(CJS)110将指示选择小数精确度音调周期为最佳音调周期的次数的计数器重置为0。在ST211,由比较判断部件(CJS)110使指示选择小数精确度音调周期为最佳音调周期的次数的计数器增加1。
在ST212,如果音调周期搜索装置100的处理没有结束,则处理流程返回ST201。
下面,以在对16kHz语音信号进行编码/解码的CELP语音编码/解码装置中的、具有上述构造的音调周期搜索装置100具有8位大小的自适应代码本,并进行目标音调周期搜索为例,描述详细操作。
音调周期指示器(PCI)101给自适应声源向量发生器(ASSVG)103依次指示预设音调周期搜索范围内的音调周期T-int。例如,当在对采样频率为16kHz的语音信号进行编码/解码的CELP语音编码/解码装置中,从32至267以整数精确度预设目标向量音调周期搜索范围,而从32+1/2至51+1/2以小数精确度预设目标向量音调周期搜索范围,音调周期指示器(PCI)101向自适应声源向量发生器(ASSVG)103依次输出音调周期T-int(T-int=32、33、...、267)。
接下来,自适应声源向量发生器(ASSVG)103根据从音调周期指示器(PCI)101接收到的指令从自适应代码本(ACB)102中提取具有整数精确度音调周期T-int的自适应声源向量p(t-int),并向整数音调周期搜索器(IPCS)104输出该自适应声源向量p(t-int)。
自适应声源向量发生器(ASSVG)103从上一子帧整数音调周期存储器(LSFIPCS)108中读取在先前的子帧中选择的整数精确度音调周期T0,设置以该音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量p(T-frac),并向小数音调周期自适应声源向量发生器(FPCASSVG)105输出所提取的自适应声源向量。
具体说来,自适应声源向量发生器(ASSVG)103以整数分量T0为中心设置20个音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2),并从自适应代码本(ACB)102中提取具有这些音调周期的自适应声源向量p(T-frac)。
然后,整数音调周期搜索器(IPCS)104使用下面给出的公式(3),用从自适应声源向量发生器(ASSVG)103接收的自适应声源向量p(t-int)、组合滤波器脉冲响应矩阵H、以及目标向量x,计算整数音调周期选择标准DIST(T-int)。
这里整数音调周期搜索器(IPCS)104使用公式(3),对由音调周期指示器(PCI)101指示的从音调周期32至267的音调周期T-int的236个变化,重复执行整数音调周期选择标准DIST(T-int)计算处理。
整数音调周期搜索器(IPCS)104还从236个计算出的整数音调周期选择标准DIST(T-int)中,选择具有最大值的DIST(T-int),并向失真比较器(DC)107输出所选择的DIST(T-int)。另外,整数音调周期搜索器(IPCS)104向失真比较器(DC)107,输出与计算DIST(T-int)时参考的自适应声源向量音调周期T-int对应的索引,作为IDX(INT)。
接下来,小数音调周期自适应声源向量发生器(FPCASSVG)105通过对从自适应声源向量发生器(ASSVG)103接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2)的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)106输出该p(T-frac)。
然后,小数音调周期搜索器(FPCS)106用具有小数音调周期T-frac的自适应声源向量p(T-frac)、组合滤波器脉冲响应矩阵H、以及目标向量X,计算小数音调周期选择标准DIST(T-frac)。公式(4)用于计算小数音调周期选择标准DIST(T-frac)。
这里,小数音调周期搜索器(FPCS)106使用公式(4),对从音调周期T0-10+1/2至T0+9+1/2的小数音调周期T-frac的20个变化,重复执行小数音调周期选择标准DIST(T-frac)计算处理。
然后,小数音调周期搜索器(FPCS)106从20个计算出的小数音调周期选择标准DIST(T-frac)中,选择具有最大值的DIST(T-frac),并向失真比较器(DC)107输出所选择的DIST(T-frac)。另外,小数音调周期搜索器(FPCS)106向失真比较器(DC)107,输出与计算DIST(T-frac)时参考的自适应声源向量音调周期T-frac对应的索引,作为IDX(FRAC)。
接下来,失真比较器(DC)107比较从整数音调周期搜索器(IPCS)104接收的DIST(INT)和从小数音调周期搜索器(FPCS)106接收的DIST(FRAC)的值。然后,失真比较器(DC)107确定当计算出具有较大的DIST(INT)和DIST(FRAC)值的音调周期选择标准DIST时的音调周期为最佳音调周期,并输出IDX(INT)和IDX(FRAC)的、对应于最佳音调周期的索引作为最佳索引IDX。
然后,失真比较器(DC)107向上一子帧整数音调周期存储器(LSFIPCS)108输出最佳音调周期整数分量T0,并向最佳音调周期精确度判断部件(OPCAJS)109输出最佳音调周期。
与上例中一样,当选择从32至267的整数精确度音调周期搜索范围、和从T0-10+1/2至T0+9+1/2的小数精确度音调周期搜索范围为音调周期搜索范围时,总共提供256(256=236+20)个整数精确度和小数精确度音调周期搜索候选者,并将最佳索引IDX编码为8位二进制数据。
上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。
最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度周期还是小数精确度周期。当最佳音调周期为整数精确度,最佳音调周期精确度判断部件(OPCAJS)109将比较判断部件(CJS)110计数器重置为0。当最佳音调周期为小数精确度,最佳音调周期精确度判断部件(OPCAJS)109给比较判断部件(CJS)110计数器加1。
具体说来,比较判断部件(CJS)110拥有指示选择小数精确度音调周期为最佳音调周期的次数的计数器,并且比较判断部件(CJS)110比较计数值和预设非负整数N。如果计数值大于整数N,则比较判断部件(CJS)110向小数音调周期自适应声源向量发生器(FPCASSVG)105,输出指示不进行小数精确度音调周期的指令。如果计数值小于整数N,则比较判断部件(CJS)110向小数音调周期自适应声源向量发生器(FPCASSVG)105,输出指示要进行小数精确度音调周期的指令。
因此,根据本实施例的音调周期搜索装置,通过不固定以小数精确度搜索音调周期的范围,而在先前子帧中检索到的音调周期的附近以小数精确度搜索,即使对具有长音调周期的语音信号或对语音信号线性预测剩余,也有可能以高分辨率执行音调周期搜索。
同样,根据本实施例的音调周期搜索装置,通过在先前子帧中检索到的音调周期的附近以小数精确度搜索,有可能即使音调周期不足也改善对语音信号线性预测剩余的搜索精确度,并有可能进行高质量的语音编码和解码。
在上面的描述中,描述了使用自适应代码本搜索线性预测剩余音调周期的例子,但是音调周期搜索的目的不限于线性预测剩余,本实施例可以应用于任何具有音调周期的语音信号信息。
此外,在上面的描述中,当计算音调周期选择标准时,整数精确度音调周期搜索和小数精确度音调周期搜索被描述为使用闭环程序,但是这不是限制,用任何进行整数精确度音调周期搜索和小数精确度音调周期搜索的程序,并且比较整数精确度音调周期和小数精确度音调周期都可以实现相似的结果。
例如,如果使用上述构造执行两阶段(开环和闭环)音调周期搜索,则构造包括整数音调周期搜索器(IPCS)104和小数音调周期搜索器(FPCS)106的失真比较器(DC)107,使用从自适应声源向量发生器(ASSVG)103接收的具有整数精确度音调周期的自适应声源向量、和从小数音调周期自适应声源向量发生器(FPCASSVG)105接收的具有小数精确度音调周期的自适应声源向量,并在失真比较器(DC)107中,借助于划分为两个阶段(开环搜索和闭环搜索)的程序进行对应于要处理的子帧的最佳音调周期的索引。
此外,在上面的描述中,音调周期搜索范围取为32至267,但是对音调周期搜索范围并没有具体的限定,只要不固定小数精确度音调周期搜索范围,就可以获得与上述情况相似的结果。
同样,在上面的描述中,小数精确度音调周期搜索范围被取为以整数精确度音调周期T0为中心的20个音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2),但是对音调周期范围并没有具体的限定,可以使用基于整数精确度音调周期设置的任何范围。
此外,描述了选择最佳音调周期为小数精确度的最大次数为固定值N的情况,但是,该值N也可以根据通信环境自适应地增加或减小。
此外,在上面的描述中,选择小数精确度的次数被限定为连续N次,但是也有可能将N设置为无穷,并使选择小数精确度音调周期的次数为无穷。具体说来,如果在发射音调周期索引时——例如在包括该音调周期索引的编码信息被写入存储介质时——不需要考虑差错的出现,在不限定小数精确度音调周期选择次数的情况下,通过使选择小数精确度音调周期的次数为无穷,可以以高分辨率对音调周期搜索的结果进行编码。
此外,在上面的描述中,描述了当选择小数精确度音调周期的次数超过预定界限时不以小数精确度进行音调周期搜索的例子,但是这不是限制,当选择小数精确度音调周期的次数超过预定界限时,也可以在预定范围内——例如从32+1/2至51+1/2——执行小数精确度音调周期搜索。
通过在选择小数精确度音调周期的次数超过预定界限时以这种方式进行小数精确度音调周期搜索,即使在发射音调周期索引时出现差错,也有可能以高分辨率对音调周期搜索的结果进行编码。
在上面的描述中,当计算整数音调周期选择标准DIST(T-int)或DIST(T-frac)时,可以通过给组合滤波器脉冲响应矩阵H乘以听觉加权滤波器脉冲响应矩阵W获得矩阵H′,而使用矩阵H′来代替组合滤波器脉冲响应矩阵H。
(实施例2)
图5是展示本发明实施例2的解码自适应声源向量发生装置的构造的方框图。
图5中的自适应声源向量发生装置300主要包括自适应代码本(ACB)301、上一子帧整数音调周期存储器(LSFIPCS)302、音调周期判断部件(PCJS)303、自适应声源向量发生器(ASSVG)304、以及小数音调周期自适应声源向量发生器(FPCASSVG)305。
自适应代码本(ACB)301存储过去产生的驱动声源信号。
上一子帧整数音调周期存储器(LSFIPCS)302接收由音调周期判断部件(PCJS)303判断出的音调周期的整数分量T0,并且在处理下一子帧时,向音调周期判断部件(PCJS)303输出这一T0。
音调周期判断部件(PCJS)303判断对应于索引IDX的音调周期为整数精确度还是小数精确度。然后,音调周期判断部件(PCJS)303使用从编码端发射的索引IDX、和在先前子帧中选择的音调周期的整数分量T0,设置音调周期。
如果,例如,所接收到的IDX指示为整数精确度音调周期,则音调周期判断部件(PCJS)303将对应于索引IDX的音调周期传送给自适应声源向量发生器(ASSVG)304。
如果索引IDX指示为小数精确度音调周期,则音调周期判断部件(PCJS)303从有关对应于索引IDX的音调周期和先前子帧的音调周期整数分量T0的信息中,求出该音调周期,并将所获得的音调周期传送给自适应声源向量发生器(ASSVG)304。具体说来,音调周期判断部件(PCJS)303从小数精确度音调周期范围(-10+1/2、-9+1/2、...、9+1/2)中求出对应于索引IDX的值,并以给该值加上T0所得的结果作为小数精确度音调周期。
音调周期判断部件(PCJS)303还拥有计数器,用于对对应于索引IDX的音调周期为小数精确度音调周期的次数计数。
当,例如,对应于索引IDX的音调周期为小数精确度时,音调周期判断部件(PCJS)303给计数器加1。当对应于索引IDX的音调周期为整数精确度时,音调周期判断部件(PCJS)303将计数器重置为0。
当音调周期为整数精确度时,自适应声源向量发生器(ASSVG)304从自适应代码本(ACB)301中根据从音调周期判断部件(PCJS)303接收到的指令提取具有音调周期T-int的自适应声源向量p(t-int),并输出自适应声源向量p(t-int)。
当音调周期为小数精确度时,自适应声源向量发生器(ASSVG)304从自适应代码本(ACB)301中取出,在根据从音调周期判断部件(PCJS)303接收到的指令提取具有音调周期T-frac的自适应声源向量p(T-frac)时所需要的,自适应声源向量,并将其输出到小数音调周期自适应声源向量发生器(FPCASSVG)305。
小数音调周期自适应声源向量发生器(FPCASSVG)305通过对从自适应声源向量发生器(ASSVG)304接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)16输出该p(T-frac)。
(实施例3)
在实施例3中,描述使用实施例1的音调周期搜索装置或实施例2的解码自适应声源向量发生装置,在发射装置和接收装置中进行通信的例子。
图6是展示本发明实施例3的语音信号发射装置和接收装置的内部结构的方框图。
图6中的语音信号发射装置400主要包括输入部件401、A/D转换器402,语音编码装置403,RF调制器404、以及发射天线405。图6中的语音信号接收装置主要包括接收天线501、RF解调器502、语音解码装置503、D/A转换器504、以及输出部件505。
图6中,由输入部件401将语音信号转换为电信号,然后将其输出到A/D转换器402。A/D转换器402将从输入部件输出的(模拟)信号转换为数字信号,并将该信号输出到语音编码装置403。语音编码装置403拥有根据前述任何一个实施例的信号处理装置,采用如后所述的语言编码方法对从A/D转换器402输出的数字语言信号进行编码,并将编码信息输出到RF调制器404。RF调制器404将从语言编码装置输出的语言编码信息放置到诸如无线电波的传播介质上,转换信号用以发送,并且将其输出到发射天线405。发射天线405将从RF调制器404输出的输出信号作为无线电波(RF信号)发送。
由接收天线501接收RF信号,并输出到RF解调器502。图中的RF信号是从接收端来看的RF信号,并且如果传播路径中没有信号衰减或噪声叠加,则其与发射RF信号完全相同。RF解调器502对从接收天线501输出的RF信号中的语音已编码信息进行解调,并向语音解码部件503输出该信息。语音解码部件503拥有根据前述任何一个实施例的信号处理装置,使用后文中将描述的语音解码方法对从RF解调器502输出的语音已解码信息进行解码,并向D/A转换器504输出所得信号。D/A转换器504将从语音解码部件503输出的数字语音信号转换为模拟电信号,并向输出部件505输出该信号。输出部件505将电信号转换为空气的振动,并输出人类耳朵可以听到的声波。
通过提供上述各类语音信号发射装置和接收装置中至少一个,有可能构造移动通信系统中的基站装置和移动终端装置。
语音信号发射装置400的特别特征在于语音编码装置403。图7是展示语音编码装置403的构造的方框图。
图7中的语音编码装置主要包括预处理部件601、LPC分析部件602、LPC量化部件603、组合滤波器604、加法器605、自适应声源代码本606、量化增益发生器607、固定声源代码本608、乘法器609、乘法器610、加法器611、听觉加权部件612、参数确定部件613、以及多路复用器614。
图7中,将从图6的A/D转换器输出的输入语音信号输入到预处理部件601。预处理部件601进行高通滤波处理以除去输入语音信号中的DC分量,或涉及后续编码处理性能改善的整形处理和预增强处理,并将已处理的语音信号(Xin)输出到LPC分析部件602、加法器605、以及参数确定部件613。在尚未审查的日本专利公开第6-214600号中公开了使用该预处理的CELP编码。
LPC分析部件602使用Xin进行线性预测分析,并向LPC量化部件603输出分析结果(线性预测系数)。
LPC量化部件603将从LPC分析部件602输出的LPC系数转换为LSF参数。对由该转换获得的LSF参数进行向量量化成为量化目标向量,并向多路复用器614输出由该向量量化获得的LPC代码(L)。
同样,LPC量化部件603获得LSF区解码谱包络参数,将所获得的解码谱包络参数转换为解码LPC系数,并向组合滤波器604输出由前述转换获得的解码LPC系数。
组合滤波器604使用前述编码LPC系数和从加法器611输出的驱动声源进行滤波组合,并向加法器605输出该复合信号。
加法器605计算前述Xin和前述复合信号的误差信号,并向听觉加权部件612输出该误差信号。听觉加权部件612对从加法器605输出的误差信号进行听觉加权,在听觉加权区计算Xin和复合信号之间的失真,并向参数确定部件613输出该失真。
参数确定部件613确定在自适应声源代码本606、固定声源代码本608、以及量化增益发生器607中产生的信号,以便使从听觉加权部件612输出的编码失真最小化。通过不但通过使从听觉加权部件612输出的编码失真最小化,而且通过使用Xin组合使用分离的编码失真,来确定应该从前述三个部件输出的信号,可以进一步改善编码性能。
自适应声源代码本606缓存加法器611在过去输出的声源信号,从由参数确定部件613输出的信号(A)指定的位置提取自适应声源向量,并向乘法器609输出该向量。
固定声源代码本608向乘法器610输出由从参数确定部件613输出的信号(F)指定的形状的向量。
量化增益发生器607分别向乘法器609和乘法器610输出由从参数确定部件613输出的信号(G)指定的自适应声源增益和固定声源增益。
乘法器609将从量化增益发生器607输出的量化自适应声源增益与从自适应声源代码本606输出的自适应声源向量相乘,并向加法器611输出相乘结果。乘法器610将从量化增益发生器607输出的量化固定声源增益和从固定声源代码本608输出的固定声源向量相乘,并向加法器611输出相乘结果。
加法器611以乘法器609的增益倍增后的自适应声源向量和来自乘法器610的固定声源向量作为输入,并对自适应声源向量和固定声源向量进行向量加法运算。然后加法器611向组合滤波器604和自适应声源代码本606输出该向量加法运算的结果。
最后,多路复用器614以来自LPC量化部件603的指示量化LPC的代码L、连同来自参数确定部件613的指示自适应声源向量的代码A、指示固定声源向量的代码F、以及指示量化增益的代码G作为输入,量化这些不同的信息项目,并将其作为已编码的信息输出到传播路径中。
接下来将详细描述语音解码部件503。图8是展示图6的语音解码部件503的方框图。
图8中,将从RF解调器502输出的已编码信息输入多路复用分离器701,其中将多路复用的已编码信息分离为单个类型的代码信息。
将分离出的LPC代码L输出到LPC解码器702;将分离出的自适应声源向量代码A输出到自适应声源代码本705;将分离出的声源增益代码G输出到量化增益发生器706;并将分离出的固定声源向量代码F输出到固定声源代码本707。
LPC解码器702借助于实施例中给出的向量量化解码处理,从多路复用分离器701输出的代码L中获得解码谱包络参数,并将所获得的解码谱包络参数转换为解码LPC系数。然后LPC解码器702向组合滤波器703输出由该转换获得的解码LPC系数。
自适应声源代码本705从由多路复用分离器701输出的代码A指定的位置提取自适应声源向量,并将其输出到乘法器708。固定声源代码本707产生由从多路复用分离器701输出的代码F指定的固定声源向量,并将其输出到乘法器709。
量化增益发生器706对由从多路复用分离器701输出的声源增益代码G指定的自适应声源向量增益和固定声源向量增益进行解码,并分别将其输出到乘法器708和乘法器709。
乘法器708将前述自适应代码向量与前述自适应代码向量增益相乘,并将结果输出到加法器710。乘法器709将前述固定代码向量与前述固定代码向量增益相乘,并将结果输出到加法器710。
加法器710对从乘法器708和乘法器709输出的增益倍增后的自适应声源向量和固定声源向量进行加法运算,并将结果输出到组合滤波器703。
组合滤波器703使用组合滤波器,以从LPC解码器702提供的编码LPC系数为滤波系数,以从加法器710输出的声源向量为驱动信号,进行滤波组合,并将组合信号输出到后处理部件704。
后处理部件704执行诸如共振峰增强和音调增强的用来改善语音的主观音质的处理、改善静态噪声的主观音质的处理等等,然后输出最终的已解码的语音信号。
本发明不限于上述实施例,在不脱离本发明的范围的情况下,可以进行各种变更和修饰。例如,在上述实施例中,描述了本发明作为信号处理装置操作的情况,但是这不是限制,也有可能以软件实现该信号处理方法。
例如,可以在只读存储器(ROM)中预先存储执行上述信号处理方法的程序,并由中央处理单元(CPU)来操作。
也有可能将执行上述信号处理方法的程序存储在计算机可读存储介质上,将存储介质上存储的程序记录在计算机的随机存取存储器(RAM)中,并根据该程序操作计算机。
从上述描述中可以明白,根据本发明的音调周期搜索装置,通过不固定以小数精确度搜索音调周期的范围,而在从先前子帧中检索出的音调周期的附近以小数精确度搜索,有可能即使音调周期不足也改善对语音信号线性预测剩余的搜索精确度,并有可能进行高质量的语音编码和解码。
本申请基于2001年8月2日提交的日本专利申请第2001-234559号,其全部内容明白地合并于此作为参考。
工业实用性
本发明适用于要对语音信号进行编码和解码的移动通信系统。
Claims (5)
1、一种解码自适应声源向量产生装置,包括:
上一子帧整数音调周期存储部件,其具有存储在先前子帧部分中选择的音调周期的功能;
音调周期判断部件,其具有如下功能,使用在从所述上一子帧整数音调周期存储部件接收到的先前子帧中选择的音调周期和作为输入接收到的索引,在所述索引对应整数音调时通过求出对应前述索引的音调周期,或者在对应小数精确度音调时从小数精确度音调周期的范围内求出对应前述索引的值,从该值和在先前子帧中选择的音调周期求出小数精确度音调周期来求出最佳自适应声源向量音调周期;
自适应声源向量发生部件,其具有如下功能,如果所述音调周期判断部件所求得的音调周期为整数精确度,从自适应代码本中提取具有从所述音调周期判断部件接收到的音调周期的自适应声源向量,如果所述音调周期判断部件所求得的音调周期为小数精确度,从自适应代码本中提取用于求出自适应声源向量的向量,该自适应声源向量具有以先前子帧中所选择的整数精确度的音调周期为中心的前后范围内的小数精确度的音调周期;以及
小数音调周期自适应声源向量发生部件,其具有如下功能,在音调周期为小数精确度时,从由所述自适应声源向量发生部件提取出的所述向量,产生并输出具有小数精确度音调周期的自适应声源向量。
2、一种语音解码装置,包括:
使用解码自适应声源向量产生装置对指示由语音编码装置编码的自适应声源向量音调周期的索引进行解码而获得的解码自适应声源向量、从固定代码本中获得的解码固定声源向量、以及对由所述语音编码装置编码的指示谱特征的参数进行解码而获得的解码参数来合成复合语音信号的部件,
其中该解码自适应声源向量产生装置包括:
上一子帧整数音调周期存储部件,其具有存储在先前子帧部分中选择的音调周期的功能;
音调周期判断部件,其具有如下功能,使用在从所述上一子帧整数音调周期存储部件接收到的先前子帧中选择的音调周期和作为输入接收到的索引,在所述索引对应整数音调时通过求出对应前述索引的音调周期,或者在对应小数精确度音调时从小数精确度音调周期的范围内求出对应前述索引的值,从该值和在先前子帧中选择的音调周期求出小数精确度音调周期来求出最佳自适应声源向量音调周期;
自适应声源向量发生部件,其具有如下功能,如果所述音调周期判断部件所求得的音调周期为整数精确度,从自适应代码本中提取具有从所述音调周期判断部件接收到的音调周期的自适应声源向量,如果所述音调周期判断部件所求得的音调周期为小数精确度,从自适应代码本中提取用于求出自适应声源向量的向量,该自适应声源向量具有以先前子帧中所选择的整数精确度的音调周期为中心的前后范围内的小数精确度的音调周期;以及
小数音调周期自适应声源向量发生部件,其具有如下功能,在音调周期为小数精确度时,从由所述自适应声源向量发生部件提取出的所述向量,产生并输出具有小数精确度音调周期的自适应声源向量。
3、一种语音信号接收装置,包括:
接收天线,用于接收接收无线电波;
RF解调装置,用于对由所述接收天线接收的信号进行解调处理;
语音解码装置,用于对由所述RF解调装置获得的信息进行解码处理,该语音解码装置包括:
使用解码自适应声源向量产生装置对指示由语音编码装置编码的自适应声源向量音调周期的索引进行解码而获得的解码自适应声源向量、从固定代码本中获得的解码固定声源向量、以及对由所述语音编码装置编码的指示谱特征的参数进行解码而获得的解码参数来合成复合语音信号的部件,
其中该解码自适应声源向量产生装置包括:
上一子帧整数音调周期存储部件,其具有存储在先前子帧部分中选择的音调周期的功能;
音调周期判断部件,其具有如下功能,使用在从所述上一子帧整数音调周期存储部件接收到的先前子帧中选择的音调周期和作为输入接收到的索引,在所述索引对应整数音调时通过求出对应前述索引的音调周期,或者在对应小数精确度音调时从小数精确度音调周期的范围内求出对应前述索引的值,从该值和在先前子帧中选择的音调周期求出小数精确度音调周期来求出最佳自适应声源向量音调周期;
自适应声源向量发生部件,其具有如下功能,如果所述音调周期判断部件所求得的音调周期为整数精确度,从自适应代码本中提取具有从所述音调周期判断部件接收到的音调周期的自适应声源向量,如果所述音调周期判断部件所求得的音调周期为小数精确度,从自适应代码本中提取用于求出自适应声源向量的向量,该自适应声源向量具有以先前子帧中所选择的整数精确度的音调周期为中心的前后范围内的小数精确度的音调周期;以及
小数音调周期自适应声源向量发生部件,其具有如下功能,在音调周期为小数精确度时,从由所述自适应声源向量发生部件提取出的所述向量,产生并输出具有小数精确度音调周期的自适应声源向量;
D/A转换装置,用于对由所述语音解码装置解码的数字语音信号进行D/A转换;以及
语音输出装置,用于将从所述D/A转换装置输出的电信号转换为语音信号。
4、一种具有语音信号接收装置并与基站装置进行无线通信的移动台装置,包括:
接收天线,用于接收接收无线电波;
RF解调装置,用于对由所述接收天线接收的信号进行解调处理;
语音解码装置,用于对由所述RF解调装置获得的信息进行解码处理,该语音解码装置包括:
使用解码自适应声源向量产生装置对指示由语音编码装置编码的自适应声源向量音调周期的索引进行解码而获得的解码自适应声源向量、从固定代码本中获得的解码固定声源向量、以及对由所述语音编码装置编码的指示谱特征的参数进行解码而获得的解码参数来合成复合语音信号的部件,
其中该解码自适应声源向量产生装置包括:
上一子帧整数音调周期存储部件,其具有存储在先前子帧部分中选择的音调周期的功能;
音调周期判断部件,其具有如下功能,使用在从所述上一子帧整数音调周期存储部件接收到的先前子帧中选择的音调周期和作为输入接收到的索引,在所述索引对应整数音调时通过求出对应前述索引的音调周期,或者在对应小数精确度音调时从小数精确度音调周期的范围内求出对应前述索引的值,从该值和在先前子帧中选择的音调周期求出小数精确度音调周期来求出最佳自适应声源向量音调周期;
自适应声源向量发生部件,其具有如下功能,如果所述音调周期判断部件所求得的音调周期为整数精确度,从自适应代码本中提取具有从所述音调周期判断部件接收到的音调周期的自适应声源向量,如果所述音调周期判断部件所求得的音调周期为小数精确度,从自适应代码本中提取用于求出自适应声源向量的向量,该自适应声源向量具有以先前子帧中所选择的整数精确度的音调周期为中心的前后范围内的小数精确度的音调周期;以及
小数音调周期自适应声源向量发生部件,其具有如下功能,在音调周期为小数精确度时,从由所述自适应声源向量发生部件提取出的所述向量,产生并输出具有小数精确度音调周期的自适应声源向量;
D/A转换装置,用于对由所述语音解码装置解码的数字语音信号进行D/A转换;以及
语音输出装置,用于将从所述D/A转换装置输出的电信号转换为语音信号。
5、一种具有语音信号接收装置并与移动台装置进行无线通信的基站装置,包括:
接收天线,用于接收接收无线电波;
RF解调装置,用于对由所述接收天线接收的信号进行解调处理;
语音解码装置,用于对由所述RF解调装置获得的信息进行解码处理,该语音解码装置包括:
使用解码自适应声源向量产生装置对指示由语音编码装置编码的自适应声源向量音调周期的索引进行解码而获得的解码自适应声源向量、从固定代码本中获得的解码固定声源向量、以及对由所述语音编码装置编码的指示谱特征的参数进行解码而获得的解码参数来合成复合语音信号的部件,
其中该解码自适应声源向量产生装置包括:
上一子帧整数音调周期存储部件,其具有存储在先前子帧部分中选择的音调周期的功能;
音调周期判断部件,其具有如下功能,使用在从所述上一子帧整数音调周期存储部件接收到的先前子帧中选择的音调周期和作为输入接收到的索引,在所述索引对应整数音调时通过求出对应前述索引的音调周期,或者在对应小数精确度音调时从小数精确度音调周期的范围内求出对应前述索引的值,从该值和在先前子帧中选择的音调周期求出小数精确度音调周期来求出最佳自适应声源向量音调周期;
自适应声源向量发生部件,其具有如下功能,如果所述音调周期判断部件所求得的音调周期为整数精确度,从自适应代码本中提取具有从所述音调周期判断部件接收到的音调周期的自适应声源向量,如果所述音调周期判断部件所求得的音调周期为小数精确度,从自适应代码本中提取用于求出自适应声源向量的向量,该自适应声源向量具有以先前子帧中所选择的整数精确度的音调周期为中心的前后范围内的小数精确度的音调周期;以及
小数音调周期自适应声源向量发生部件,其具有如下功能,在音调周期为小数精确度时,从由所述自适应声源向量发生部件提取出的所述向量,产生并输出具有小数精确度音调周期的自适应声源向量;
D/A转换装置,用于对由所述语音解码装置解码的数字语音信号进行D/A转换;以及
语音输出装置,用于将从所述D/A转换装置输出的电信号转换为语音信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP234559/2001 | 2001-08-02 | ||
JP234559/01 | 2001-08-02 | ||
JP2001234559A JP3888097B2 (ja) | 2001-08-02 | 2001-08-02 | ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN028027663A Division CN1218296C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索范围设置装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1664930A CN1664930A (zh) | 2005-09-07 |
CN100354927C true CN100354927C (zh) | 2007-12-12 |
Family
ID=19066154
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB200510064104XA Expired - Fee Related CN1312661C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索装置、语音编码装置、和语音信号发射装置 |
CNB2005100641069A Expired - Fee Related CN100354927C (zh) | 2001-08-02 | 2002-08-01 | 解码自适应声源向量产生装置及其语音解码装置 |
CNB2005100641054A Expired - Fee Related CN100354926C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索装置 |
CN028027663A Expired - Fee Related CN1218296C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索范围设置装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB200510064104XA Expired - Fee Related CN1312661C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索装置、语音编码装置、和语音信号发射装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100641054A Expired - Fee Related CN100354926C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索装置 |
CN028027663A Expired - Fee Related CN1218296C (zh) | 2001-08-02 | 2002-08-01 | 音调周期搜索范围设置装置 |
Country Status (8)
Country | Link |
---|---|
US (2) | US7177802B2 (zh) |
EP (1) | EP1339043B1 (zh) |
JP (1) | JP3888097B2 (zh) |
KR (1) | KR100508618B1 (zh) |
CN (4) | CN1312661C (zh) |
CA (1) | CA2424558C (zh) |
DE (1) | DE60224498T2 (zh) |
WO (1) | WO2003015080A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5339919B2 (ja) * | 2006-12-15 | 2013-11-13 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
JP5511372B2 (ja) * | 2007-03-02 | 2014-06-04 | パナソニック株式会社 | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 |
US20100274556A1 (en) * | 2008-01-16 | 2010-10-28 | Panasonic Corporation | Vector quantizer, vector inverse quantizer, and methods therefor |
KR101115381B1 (ko) * | 2008-11-04 | 2012-02-15 | 인천대학교 산학협력단 | 진보된 패스워드 선택기 |
BRPI1008915A2 (pt) * | 2009-02-27 | 2018-01-16 | Panasonic Corp | dispositivo de determinação de tom e método de determinação de tom |
US9015039B2 (en) | 2011-12-21 | 2015-04-21 | Huawei Technologies Co., Ltd. | Adaptive encoding pitch lag for voiced speech |
EP3301677B1 (en) | 2011-12-21 | 2019-08-28 | Huawei Technologies Co., Ltd. | Very short pitch detection and coding |
CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
CN105323740B (zh) * | 2014-07-30 | 2018-10-16 | 中国电信股份有限公司 | 电路域回落的实现方法和双模终端 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651800A (ja) * | 1992-07-30 | 1994-02-25 | Sony Corp | データ数変換方法 |
JPH0659698A (ja) * | 1992-08-06 | 1994-03-04 | Fujitsu Ltd | 音声伝送方式 |
JPH07225599A (ja) * | 1994-02-15 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声の符号化方法 |
JPH07248794A (ja) * | 1994-03-10 | 1995-09-26 | Sony Corp | 音声信号処理方法 |
JPH096398A (ja) * | 1995-06-22 | 1997-01-10 | Fujitsu Ltd | 音声処理装置 |
JP2000330594A (ja) * | 1999-05-18 | 2000-11-30 | Nec Corp | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
JPH066398A (ja) | 1992-06-23 | 1994-01-14 | Toshiba Corp | 復調装置 |
CA2102080C (en) | 1992-12-14 | 1998-07-28 | Willem Bastiaan Kleijn | Time shifting for generalized analysis-by-synthesis coding |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
EP0788091A3 (en) * | 1996-01-31 | 1999-02-24 | Kabushiki Kaisha Toshiba | Speech encoding and decoding method and apparatus therefor |
AU3708597A (en) * | 1996-08-02 | 1998-02-25 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
EP1071081B1 (en) | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
CA2283202A1 (en) * | 1998-01-26 | 1999-07-29 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for enhancing pitch |
JP2000134105A (ja) | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
JP3180786B2 (ja) * | 1998-11-27 | 2001-06-25 | 日本電気株式会社 | 音声符号化方法及び音声符号化装置 |
-
2001
- 2001-08-02 JP JP2001234559A patent/JP3888097B2/ja not_active Expired - Fee Related
-
2002
- 2002-08-01 DE DE60224498T patent/DE60224498T2/de not_active Expired - Lifetime
- 2002-08-01 WO PCT/JP2002/007850 patent/WO2003015080A1/ja active IP Right Grant
- 2002-08-01 CN CNB200510064104XA patent/CN1312661C/zh not_active Expired - Fee Related
- 2002-08-01 EP EP02751823A patent/EP1339043B1/en not_active Expired - Lifetime
- 2002-08-01 CA CA002424558A patent/CA2424558C/en not_active Expired - Fee Related
- 2002-08-01 KR KR10-2003-7004675A patent/KR100508618B1/ko not_active IP Right Cessation
- 2002-08-01 US US10/380,626 patent/US7177802B2/en not_active Expired - Fee Related
- 2002-08-01 CN CNB2005100641069A patent/CN100354927C/zh not_active Expired - Fee Related
- 2002-08-01 CN CNB2005100641054A patent/CN100354926C/zh not_active Expired - Fee Related
- 2002-08-01 CN CN028027663A patent/CN1218296C/zh not_active Expired - Fee Related
-
2007
- 2007-01-04 US US11/619,667 patent/US7542898B2/en not_active Expired - Lifetime
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651800A (ja) * | 1992-07-30 | 1994-02-25 | Sony Corp | データ数変換方法 |
JPH0659698A (ja) * | 1992-08-06 | 1994-03-04 | Fujitsu Ltd | 音声伝送方式 |
JPH07225599A (ja) * | 1994-02-15 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声の符号化方法 |
JPH07248794A (ja) * | 1994-03-10 | 1995-09-26 | Sony Corp | 音声信号処理方法 |
JPH096398A (ja) * | 1995-06-22 | 1997-01-10 | Fujitsu Ltd | 音声処理装置 |
JP2000330594A (ja) * | 1999-05-18 | 2000-11-30 | Nec Corp | 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN100354926C (zh) | 2007-12-12 |
KR100508618B1 (ko) | 2005-08-17 |
CN1664928A (zh) | 2005-09-07 |
WO2003015080A1 (en) | 2003-02-20 |
CN1664929A (zh) | 2005-09-07 |
EP1339043A1 (en) | 2003-08-27 |
CN1218296C (zh) | 2005-09-07 |
CN1664930A (zh) | 2005-09-07 |
EP1339043A4 (en) | 2007-02-07 |
CA2424558C (en) | 2008-10-14 |
CN1312661C (zh) | 2007-04-25 |
JP3888097B2 (ja) | 2007-02-28 |
US7542898B2 (en) | 2009-06-02 |
CA2424558A1 (en) | 2003-03-31 |
US20070136051A1 (en) | 2007-06-14 |
JP2003044099A (ja) | 2003-02-14 |
DE60224498T2 (de) | 2008-05-21 |
CN1471704A (zh) | 2004-01-28 |
US7177802B2 (en) | 2007-02-13 |
US20040030545A1 (en) | 2004-02-12 |
DE60224498D1 (de) | 2008-02-21 |
KR20030046480A (ko) | 2003-06-12 |
EP1339043B1 (en) | 2008-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0497479B1 (en) | Method of and apparatus for generating auxiliary information for expediting sparse codebook search | |
EP1339040B1 (en) | Vector quantizing device for lpc parameters | |
KR19980080463A (ko) | 코드여기 선형예측 음성코더내에서의 벡터 양자화 방법 | |
WO2001020595A1 (en) | Voice encoder/decoder | |
US7542898B2 (en) | Pitch cycle search range setting apparatus and pitch cycle search apparatus | |
EP1041541B1 (en) | Celp voice encoder | |
JPH08272395A (ja) | 音声符号化装置 | |
JP2000155597A (ja) | デジタル音声符号器において使用するための音声符号化方法 | |
JP4550176B2 (ja) | 音声符号化方法 | |
US20030163317A1 (en) | Data processing device | |
KR20020040846A (ko) | 음성 데이터의 처리 장치 및 처리 방법 | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JPH0830299A (ja) | 音声符号化装置 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
EP0662682A2 (en) | Speech signal coding | |
JPH08179800A (ja) | 音声符号化装置 | |
JP3284874B2 (ja) | 音声符号化装置 | |
JP3230380B2 (ja) | 音声符号化装置 | |
EP0987680A1 (en) | Audio signal processing | |
Casajus-Quiros et al. | Analysis and quantization procedures for a real-time implementation of a 4.8 kb/s CELP coder | |
JPH10133696A (ja) | 音声符号化装置 | |
JP2001188550A (ja) | 音声情報圧縮符号化方法 | |
JPH10161695A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170522 Address after: Delaware Patentee after: III Holding 12 limited liability company Address before: Osaka Japan Patentee before: Matsushita Electric Industrial Co., Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20071212 Termination date: 20180801 |