CN1215460C - 数据处理装置 - Google Patents
数据处理装置 Download PDFInfo
- Publication number
- CN1215460C CN1215460C CNB028001710A CN02800171A CN1215460C CN 1215460 C CN1215460 C CN 1215460C CN B028001710 A CNB028001710 A CN B028001710A CN 02800171 A CN02800171 A CN 02800171A CN 1215460 C CN1215460 C CN 1215460C
- Authority
- CN
- China
- Prior art keywords
- data
- tap
- decoded
- sign indicating
- indicating number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 114
- 238000000605 extraction Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000005284 excitation Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 16
- 238000003672 processing method Methods 0.000 claims description 16
- 239000002131 composite material Substances 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 description 34
- 238000003786 synthesis reaction Methods 0.000 description 32
- 238000003860 storage Methods 0.000 description 29
- 230000003044 adaptive effect Effects 0.000 description 25
- 230000007850 degeneration Effects 0.000 description 20
- 238000010606 normalization Methods 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000013139 quantization Methods 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 12
- 230000015556 catabolic process Effects 0.000 description 11
- 238000006731 degradation reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013075 data extraction Methods 0.000 description 6
- 238000005086 pumping Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 101710163391 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase Proteins 0.000 description 4
- 230000003412 degenerative effect Effects 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- LTXREWYXXSTFRX-QGZVFWFLSA-N Linagliptin Chemical group N=1C=2N(C)C(=O)N(CC=3N=C4C=CC=CC4=C(C)N=3)C(=O)C=2N(CC#CC)C=1N1CCC[C@@H](N)C1 LTXREWYXXSTFRX-QGZVFWFLSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种能够获得高质量声音数据的数据处理装置。抽头生成部分(121)通过在以采用CELP方法对编码数据进行解码的方式而产生的解码语音数据内提取与感兴趣的主数据具有预定位置关系的解码语音数据,并且根据主数据在主子帧的位置提取子帧内的I码,生成用于预测部分(125)中的过程的预测抽头。类似于抽头生成部分(121),抽头生成部分(122)生成用于分类部分(123)中的过程的类抽头。分类部分(123)根据类抽头执行分类,并且系数存储器(124)输出分类结果对应的抽头系数。预测部分(125)通过使用预测抽头和抽头系数执行线性预测计算,并且输出高质量解码语音数据。本发明可以应用于用于发射和接收语音的移动电话。
Description
技术领域
本发明涉及一种数据处理装置,特别涉及一种能够将采用例如CELP(Code Excited Linear coding,码激励线性编码)方法进行编码的语音解码为高质量语音的数据处理装置。
背景技术
图1和2示出传统移动电话的示例结构。
在该移动电话中,执行采用CELP方法将语音编码为预定码并且发射这些码的发射过程,以及接收从其它移动电话发射的码并且将这些码解码为语音的接收过程。图1示出用于执行发射过程的发射部分,并且图2示出用于执行接收过程的接收部分。
在图1所示的发射部分中,从用户产生的语音输入到麦克风1,由此语音转换为作为电子信号的语音信号,并且该信号提供给A/D(Analog/Digital,模拟/数字)转换部分2。A/D转换部分2例如以8kHz等的采样率对来自麦克风1的模拟语音信号进行采样,从而模拟语音信号经过从模拟信号到数字语音信号的A/D转换。而且,A/D转换部分2以预定比特数执行信号量化,并且将信号提供给运算单元3和LPC(Linear Prediction Coefficient,线性预测系数)分析部分4。
LPC分析部分4采用来自A/D转换部分2的例如160个样本长度为一帧,并且将该帧分为40个样本的子帧,并且对每个子帧执行LPC分析,从而确定P阶线性预测系数α1、α2、...、αP。然后,LPC分析部分4采用以P阶线性预测系数αp(p=1、2、...、P)为元素的向量作为语音特征向量,提供给向量量化部分5。
向量量化部分5存储以线性预测系数为元素的码向量对应于码的码本,根据该码本对来自LPC分析部分4的特征向量α执行向量量化,并且将通过向量量化获得的码(以下适当时称作“A_code”)提供给码确定部分15。
而且,向量量化部分5将线性预测系数α1′、α2′...、αp′(形成对应于A_code的码向量α′的元素)提供给语音合成滤波器6。
语音合成滤波器6例如是IIR(Infinite Impulse Response,无限脉冲响应)类型的数字滤波器,它采用来自向量量化部分5的线性预测系数αp′(p=1、2、...、P)作为IIR滤波器的抽头系数,并且采用从运算单元14提供的剩余信号e作为输入信号,以执行语音合成。
更具体地说,由LPC分析部分4执行的LPC分析是,对于当前时间n的语音信号(样本值)sn和与上面样本值相邻的过去P个样本值sn-1、sn-2、...、sn-p,由下面方程表示的线性组合成立:
sn+α1sn-1+α2sn-2+…+αpsn-p=en …(1)
并且当根据下面方程使用过去P个样本值sn-1、sn-2、…、sn-p执行对当前时间n的样本值sn的预测值(线性预测值)sn′的线性预测时:
sn′=-(α1sn-1+α2sn-2+…+αpsn-p) …(2)
确定使实际样本值sn与线性预测值sn′之间的平方差最小的线性预测系数αp。
在此,在方程(1)中,{en}(…、en-1、en、en+1、…)是相互不相关的概率变量,其中平均值为0,并且方差为预定值σ2。
根据方程(1),样本值sn可以用下面方程表示:
sn=en-(α1sn-1+α2sn-2+…+αpsn-p) …(3)
当经过Z变换之后,获得下面方程:
S=E/(1+α1z-1+α2z-2+…+αpz-p) …(4)
其中,在方程(4)中,S和E分别表示方程(3)中sn和en的Z变换。
在此,根据方程(1)和(2),en可以用下面方程表示:
en=sn-sn′ …(5)
并且这称作实际样本值sn与线性预测值sn′之间的“剩余信号”。
因此,根据方程(4),通过采用线性预测系数αp作为IIR滤波器的抽头系数,并且采用剩余信号en作为IIR滤波器的输入信号,可以确定语音信号sn。
因此,如上所述,语音合成滤波器6采用来自向量量化部分5的线性预测系数αp′作为抽头系数,并且采用从运算单元14提供的剩余信号e作为输入信号,并且计算方程(4),从而确定语音信号(合成语音数据)ss。
在语音合成滤波器6中,由于使用作为通过向量量化而获得的码对应的码向量的线性预测系数αp′,而不是使用通过LPC分析部分4的LPC分析而获得的线性预测系数αp,也就是,由于使用包含量化误差的线性预测系数α′,因此基本上,从语音合成滤波器6输出的合成语音信号不会变得与从A/D转换部分2输出的语音信号一样。
从语音合成滤波器6输出的合成语音信号ss提供给运算单元3。运算单元3从来自语音合成滤波器6的合成语音数据ss减去由A/D转换部分2输出的语音信号(从合成语音数据ss的每个样本减去语音数据s的对应样本),并且将相减值提供给平方差计算部分7。平方差计算部分7计算来自运算单元3的相减值的平方和(以LPC分析部分4执行LPC分析的子帧为单位的平方和,如上所述,一帧分为几个子帧),并且将结果平方差提供给最小平方差确定部分8。
最小平方差确定部分8其中以对应于从平方差计算部分7输出的平方差的方式存储有作为滞后指示码的L码(L_code)、作为增益指示码的G码(G_code)和作为码字指示码的I码(I_code),并且输出从平方差计算部分7输出的平方差对应的L码、G码和I码。L码提供给自适应码本存储部分9。G码提供给增益解码器10。I码提供给激励码本存储部分11。而且,L码、G码和I码还提供给码确定部分15。
自适应码本存储部分9其中存储有7比特L码对应于预定时延(长期预测滞后)的自适应码本。自适应码本存储部分9以从最小平方差确定部分8提供的L码对应的延迟时间,延迟从运算单元14提供的剩余信号e,并且将该信号输出到运算单元12。也就是,自适应码本存储部分9例如由存储器构成,并且以用7比特记录表示的值对应的样本量延迟来自运算单元14的剩余信号e,并且将该信号输出到运算单元12。
在此,由于自适应码本存储部分9以L码对应的时间延迟剩余信号e,并且输出该信号,因此该输出信号变为近似于以延迟时间为周期的周期信号。该信号主要成为用于使用线性预测系数在语音合成中生成浊音合成语音的驱动信号。
增益解码器10其中存储有G码对应于预定增益β和γ的表,并且输出从最小平方差确定部分8提供的G码对应的增益β和γ。增益β和γ分别提供给运算单元12和13。在此,增益β通常称作长期滤波器状态输出增益,而增益γ通常称作激励码本增益。
激励码本存储部分11其中存储有例如9比特I码对应于预定激励信号的激励码本,并且将从最小平方差确定部分8提供的I码对应的激励信号输出到运算单元13。
在此,存储在激励码本中的激励信号例如是近似于白噪声的信号,并且主要成为用于使用线性预测系数在语音合成中生成非浊音合成语音的驱动信号。
运算单元12将自适应码本存储部分9的输出信号与从增益解码器10输出的增益β进行相乘,并且将相乘值1提供给运算单元14。运算单元13将激励码本存储部分11的输出信号与从增益解码器10输出的增益γ进行相乘,并且将相乘值n提供给运算单元14。运算单元14将来自运算单元12的相乘信号1与来自运算单元13的相乘信号n相加在一起,并且将作为剩余信号e的相加值提供给语音合成滤波器6和自适应码本存储部分9。
在语音合成滤波器6中,以如上所述方式,从运算单元14提供的剩余信号e由以从向量量化部分5提供的线性预测系数αp′作为抽头系数的IIR滤波器进行滤波,并且结果合成语音数据提供给运算单元3。然后,在运算单元3和平方差计算部分7中,执行与上述情况类似的处理,并且结果平方差提供给最小平方差确定部分8。
最小平方差确定部分8确定来自平方差计算部分7的平方差是否变为最小值(局部最小值)。然后当最小平方差确定部分8确定该平方差尚未变为最小值时,最小平方差确定部分8以上述方式输出平方差对应的L码、G码和I码,并且以下重复相同的过程。
另一方面,当最小平方差确定部分8确定该平方差变为最小值时,最小平方差确定部分8将确定信号输出到码确定部分15。码确定部分15顺序锁定从向量量化部分5提供的A码,并且顺序锁定从最小平方差确定部分8提供的L码、G码和I码。当从最小平方差确定部分8接收到确定信号时,码确定部分15将在此时锁定的A码、L码、G码和I码提供给信道编码器16。信道编码器16对来自码确定部分15的A码、L码、G码和I码进行多路复用,并且将它们作为码数据进行输出。该码数据通过传输路径进行传输。
根据如上所述,编码数据是具有作为子帧单元解码信息的A码、L码、G码和I码的编码数据。
在此,对每个子帧确定A码、L码、G码和I码。然而,例如,存在有时对每个帧确定A码的情况。在这种情况下,要对形成帧的四个子帧进行解码,使用相同的A码。然而,在这种情况下,形成一个帧的四个子帧中每个帧也可以看作具有相同的A码。通过这种方式,码数据可以被看作形成为具有作为子帧单元解密信息的A码、L码、G码和I码的编码数据。
在此,图1中(同样适用于后面将要描述的图2、5和13),[k]分配给每个变量,从而变量为一个数组变量。k表示子帧号,但是在本说明书中,适当时将省略其描述。
接着,以上述方式从其它移动电话的发射部分发射的码数据由图2所示的接收部分的信道解码器21进行接收。信道解码器21从码数据分离L码、G码、I码和A码,并且将它们分别提供给自适应码本存储部分22、增益解码器23、激励码本存储部分24和滤波器系数解码器25。
自适应码本存储部分22、增益解码器23、激励码本存储部分24和运算单元26到28分别类似于图1的自适应码本存储部分9、增益解码器10、激励码本存储部分11和运算单元12到14。通过执行与参照图1描述的情况相同的过程,L码、G码和I码解码为剩余信号e。该剩余信号e作为输入信号提供给语音合成滤波器29。
滤波器系数解码器25其中存储有与图1的向量量化部分5相同的码本,从而A码解码为线性预测系数αp′,并且该线性预测系数αp′提供给语音合成滤波器29。
语音合成滤波器29类似于图1的语音合成滤波器6。语音合成滤波器29采用来自滤波器系数解码器25的线性预测系数αp′作为抽头系数,采用从运算单元28提供的剩余信号e作为输入信号,并且计算方程(4),从而生成平方差在图1的最小平方差确定部分8中确定为最小值时的合成语音数据。该合成语音数据提供给D/A(Digital/Analog,数字/模拟)转换部分30。D/A转换部分30将来自语音合成滤波器29的合成语音数据从数字信号D/A转换为模拟信号,并且将模拟信号提供给扬声器31,由此输出该信号。
在码数据中,当在图2的接收部分中A码采用帧而不是子帧作为单位时,帧的A码对应的线性预测系数可以用来对形成该帧的所有四个子帧进行解码。另外,通过使用相邻帧的A码对应的线性预测系数,对每个子帧执行插值,并且通过插值而获得的线性预测系数可以用来对每个子帧进行解码。
如上所述,在移动电话的发射部分中,由于对作为文件数据提供给接收部分的语音合成滤波器29的剩余信号和线性预测系数进行编码然后发射,因此,在接收部分中,将这些码解码为剩余信号和线性预测系数。然而,因为解码剩余信号和线性预测系数(以下适当时分别称作“解码剩余信号和解码线性预测系数”)包含例如量化误差的误差,所以它们与通过执行语音LPC分析而获得的剩余信号和线性预测系数不匹配。
因此,从接收部分的语音合成滤波器29输出的合成语音信号声音质量遭到恶化,其中包含有畸变。
发明内容
本发明是鉴于这种情况而提出的,并且它的目的是获得高质量的合成语音等。
本发明提供一种数据处理装置,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理装置包括:抽头生成装置,用于生成用于预测计算的预测抽头,其包括一提取装置,用于在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合装置,用于组合该两个提取的数据,形成所述抽头;以及处理装置,用于通过至少使用所述预测抽头来产生其质量高于所述解码的数据的预测值,执行所述预测计算。
本发明还提供一种数据处理装置,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理装置包括:抽头生成装置,用于生成用来执行对主数据进行分类的分类操作的类抽头,其包括一提取装置,用于在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合装置,用于组合该两个提取的数据,形成所述抽头;以及处理装置,用于根据所述类抽头对所述主数据执行分类。
本发明还提供一种数据处理方法,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理方法包括:抽头生成步骤,生成用于预测计算的预测抽头,其包括一提取步骤,通过在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合步骤,组合该两个提取的数据,形成所述抽头抽头;以及处理步骤,通过至少使用所述预测抽头来产生其质量高于所述解码的数据的预测值,执行所述预测计算。
本发明还提供一种数据处理方法,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理方法包括:抽头生成步骤,生成用来执行对主数据进行分类的分类操作的类抽头,其包括一提取步骤,在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合步骤,用于组合该两个提取的数据,形成所述抽头;以及处理步骤,用于根据所述类抽头对所述主数据执行分类。
本发明还提供一种学习预定抽头系数的数据处理装置,用来处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理装置包括:学生数据生成装置,用于通过将充当老师的老师数据编码为具有预定单元内所述解码信息的编码数据,并且对编码数据进行解码,生成作为充当学生的学生数据的解码数据;预测抽头生成装置,用于生成用于预测老师数据的预测抽头,其包括提取装置,用于通过在作为学生数据的所述解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据在所述预定单元的位置提取所述预定单元内的所述解码信息;和组合装置,用于组合该两个提取的数据,形成所述抽头;以及学习装置,用于执行学习,从而通过执行使用所述预测抽头和所述抽头系数的预定预测计算而获得的所述老师数据的预测值的预测误差在统计上变为最小,并且用于确定所述抽头系数。
本发明还提供一种学习预定抽头系数的数据处理方法,用来处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理方法包括:学生数据生成步骤,通过将充当老师的老师数据编码为具有预定单元内所述解码信息的编码数据,并且对编码数据进行解码,生成作为充当学生的学生数据的解码数据;预测抽头生成步骤,生成用于预测老师数据的预测抽头,其包括提取步骤,通过在作为学生数据的所述解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据在所述预定单元的位置提取所述预定单元内的所述解码信息;和组合步骤,组合该两个提取的数据,形成所述抽头;以及学习步骤,执行学习,从而通过执行使用所述预测抽头和所述抽头系数的预定预测计算而获得的所述老师数据的预测值的预测误差在统计上变为最小,并且确定所述抽头系数。在本发明的第一数据处理装置、第一数据处理方法中,在以对编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的解码数据,并且根据主数据在预定单元的位置提取预定单元内的解码信息,从而生成用于预测计算或分类的抽头,并且通过使用抽头,执行预测计算或分类。
在本发明的第二数据处理装置、第二数据处理方法中,通过将充当老师的老师数据编码为具有预定单元内解码信息的编码数据,并且对编码数据进行解码,生成作为充当学生的学生数据的解码数据。而且,通过在作为学生数据的解码数据内提取与感兴趣的主数据具有预定位置关系的解码数据,并且根据主数据在预定单元的位置提取预定单元内的解码信息,生成用于预测老师数据的预测抽头。然后,执行学习,从而通过执行使用预测抽头和抽头系数的预定预测计算而获得的老师数据的预测值的预测误差在统计上变为最小,并且确定抽头系数。
附图简述
图1是示出传统移动电话发射部分示例结构的方框图;
图2是示出传统移动电话接收部分示例结构的方框图;
图3是示出本发明传输系统实施例示例结构的方框图;
图4是示出移动电话1011和1012示例结构的方框图;
图5是示出接收部分114示例结构的方框图;
图6是示出接收部分114处理的流程图;
图7示出生成预测抽头和类抽头的方法;
图8是示出抽头生成部分121和122示例结构的方框图;
图9A和9B示出对I码对应的类进行加权的方法。
图10A和10B示出对I码对应的类进行加权的方法。
图11是示出分类部分123示例结构的方框图;
图12是示出表创建过程的流程图;
图13是示出本发明学习装置实施例示例结构的方框图;
图14是示出学习过程的流程图;
图15是示出本发明计算机实施例示例结构的方框图。
最佳实施方式
图3示出应用本发明的传输系统(“系统”是指多个装置的逻辑集合,与每个结构的装置是否在同一框架中没有关系)的一个实施例结构。
在该传输系统中,移动电话1011和1012分别与基站1021和1022执行无线收发操作,并且每个基站1021和1022与交换站103执行收发操作,从而,最终,可以通过基站1021和1022以及交换站103执行移动电话1011和1012间的语音收发操作。基站1021和1022可以是相同的基站或不同的基站。
以下除非特别指明,移动电话1011和1012将称作“移动电话101”。
图4示出图3的移动电话101的示例结构。
在该移动电话101中,根据CELP方法执行语音收发操作。
更具体地说,天线111从基站1021或1022接收无线电波,将接收信号提供给调制解调器部分112,并且将来自调制解调器部分112的信号以无线电波的形式发射到基站1021或1022。调制解调器部分112对来自天线111的信号进行解调,并且将如图1所述的结果码数据提供给接收部分114。而且,调制解调器部分112对从发射部分113提供的如图1所述的码数据进行调制,并且将结果调制信号提供给天线111。发射部分113类似于图1的发射部分,采用CELP方法将向其输入的用户语音编码为码数据,并且将该数据提供给调制解调器部分112。接收部分114从调制解调器部分112接收码数据,采用CELP方法对码数据进行解码,并且解码出高质量声音进行输出。
更具体地说,在接收部分114中,使用例如分类和自适应过程将通过CELP方法解码的合成语音进一步解码为真高质量声音(的预测值)。
在此,分类和自适应过程由分类过程和自适应过程形成,从而通过分类过程根据数据属性对数据进行分类,并且对每类执行自适应过程。自适应过程如下所述。
也就是,在自适应过程中,例如,真高质量声音的预测值由通过CELP方法解码的合成语音与预定抽头系数的组合进行确定。
更具体地说,可以考虑,例如,采用高质量声音(的样本值)作为老师数据,并且采用以通过CELP方法将真高质量声音编码为L码、G码、I码和A码,并且通过图2所示的接收部分对这些码进行解码这种方式而获得的合成语音作为学生数据,并且作为老师数据的高质量声音y的预测值E[y]通过由一组合成语音(的样本值)x1、x2、…和预定抽头系数w1、w2、…的线性组合定义的线性一阶组合模型进行确定。在这种情况下,预测值E[y]可以用下面方程表示:
E[y]=w1x1+w2x2+... …(6)
推广方程(1),当由一组抽头系数wj组成的矩阵W,由一组学生数据xij组成的矩阵X,以及由一组预测值E[yj]组成的矩阵Y’如下进行定义时:
下面观察方程成立:
XW=Y’ …(7)
其中,矩阵X的xij项表示第i个学生数据集(用于预测第i个老师数据yi的一组学生数据)的第j个学生数据,并且矩阵W的wj项表示与学生数据集内第j个学生数据相乘的抽头系数。而且,yi表示第i个老师数据,从而E[yi]表示第i个老师数据的预测值。在方程(6)左边的y中,省略矩阵Y中yi项的下标i,而在方程(6)右边的x1,x2,...中,省略矩阵X中xij项的下标i。
然后,可以考虑,将最小平方法应用到该观察方程,从而确定近似于真高质量声音y的预测值E[y]。在这种情况下,当由一组作为老师数据的真高质量声音y组成的矩阵Y和由一组预测值E[y]相对于高质量声音y的剩余值e组成的矩阵E如下进行定义时:
根据方程(7),下面剩余方程成立:
XW=Y+E …(8)
在这种情况下,通过最小化下面平方差可以确定用于确定近似于真高音质语音y的预测值E[y]的抽头系数wj。
因此,如果上述平方差对抽头系数wj求偏导的结果为0,那么满足下面方程的抽头系数wj将是用于确定近似于真高音质语音y的预测值E[y]的最优值:
因此,首先通过将方程(8)对抽头系数wj求偏导,下面方程成立:
根据方程(9)和(10),获得下面方程(11):
而且,当考虑剩余方程(8)中的学生数据xij、抽头系数wj、老师数据yi和误差ei时,根据方程(11)可以获得下面规格化(normalization)方程:
当矩阵(协方差矩阵)A和向量v分别定义为:
并且向量W如同方程1所示进行定义时,方程(12)所示的规格化方程可以由下面方程表示:
AW=v …(13)
通过准备特定程度数目的学生数据xij和老师数据yi集,可以建立一组个数为要确定的抽头系数wj的数目J的方程(12)中的每个规格化方程。因此,对向量W求解方程(13)(然而,要求解方程(13),方程(13)中的矩阵A要求为正则方程),可以确定最优抽头系数(在此,最小化平方差的抽头系数)的wj。当求解方程(13)时,例如可以使用消元法(Gauss-Jordan消元法)等。
自适应过程以如上所述的方式预先确定最优抽头系数wj,并且抽头系数wj用来根据方程(6)确定近似于真高质量声音y的预测值E[y]。
例如,在采用以高采样率进行采样的语音信号或者分配有很多比特的语音信号作为老师数据,并且采用通过对作为老师数据的语音信号进行薄弱化(thinned)或者采用CELP方法对以少量比特进行重新量化的语音信号进行编码,然后对编码结果进行解码这种方式而获得的合成语音作为学生数据的情况下,对于抽头系数,当要生成以高采样率进行采样的语音信号或者分配有很多比特的语音信号时,获得预测误差在统计上为最小的高质量声音。因此,在这种情况下,获得更高质量合成语音是可能的。
在图4的接收部分114中,如上所述的分类和自适应过程将通过采用CELP方法对码数据进行解码而获得的合成语音进一步解码为更高质量声音。
更具体地说,图5示出图4的接收部分114的示例结构。与图2的情况对应的图5的组件使用相同的标号,并且在下面适当时省略其说明。
从语音合成滤波器29输出的每个子帧合成语音数据,以及从信道解码器21输出的每个子帧L码、G码、I码和A码中的L码提供给抽头生成部分121和122。抽头生成部分121和122从提供给抽头生成部分121和122的合成语音数据和I码中分别提取用于预测高质量声音预测值的预测抽头数据和用于分类的类抽头数据。预测抽头提供给预测部分125,并且类抽头提供给分类部分123。
分类部分123根据从抽头生成部分122提供的类抽头执行分类,并且将作为分类结果的类代码提供给系数存储器124。
在此,例如,使用K比特ADRC(Adaptive Dynamic Range Coding,自适应动态范围编码)方法作为分类部分123中的分类方法。
在此,例如在K比特ADRC过程中,检测形成类抽头的数据的最大值MAX和最小值MIN,并且采用DR=MAX-MIN作为集合的局部动态范围。根据该动态范围DR,形成类抽头的每个数据重新量化到K比特。也就是,从形成类抽头的每个数据减去最小值MIN,然后通过相减得到的值除以DR/2K(量化)。然后,将其中以预定次序排列形成类抽头的每个数据的K比特值的比特序列作为ADRC码进行输出。
例如,当这种K比特ADRC用于分类时,采用其中以预定次序排列通过K比特ADRC过程而获得的形成预测抽头的每个数据的K比特值的比特序列作为类代码。
另外,例如,还可以通过将类抽头考虑为其中以形成类抽头的每个数据为元素的向量,并且对作为向量的类抽头执行向量量化,执行分类。
系数存储器124存储通过在图13的学习装置中执行的学习处理(后面将要描述)而获得的用于每个类的抽头系数,并且将存储在从分类部分123输出的类代码对应的地址中的抽头系数提供给预测部分125。
预测部分125获得从抽头生成部分121输出的预测抽头和从系数存储器124输出的抽头系数,并且通过使用该预测抽头和抽头系数,执行方程(6)所示的线性预测计算。因此,预测部分125确定感兴趣主子帧(subject subframe)的高质量声音(的预测值),并且将该值提供给D/A转换部分30。
下面参照图6的流程图,对图5的接收部分114的过程进行描述。
信道解码器21从向其提供的码数据中分离L码、G码、I码和A码,并且分别将这些码提供给自适应码本存储部分22、增益解码器23、激励码本存储部分24和滤波器系数解码器25。而且,L码还提供给抽头生成部分121和122。
然后,自适应码本存储部分22、增益解码器23、激励码本存储部分24和运算单元26到28执行与图2的情况相同的过程,并且因此,L码、G码和I码解码为剩余信号e。该剩余信号提供给语音合成滤波器29。
而且,如同参照图2的描述,滤波器系数解码器25将向其提供的A码解码为线性预测系数,并且将它提供给语音合成滤波器29。语音合成滤波器29通过使用来自运算单元28的剩余信号和来自滤波器系数解码器25的线性预测系数,执行语音合成,并且将结果合成语音提供给抽头生成部分121和122。
抽头生成部分121和122顺序采用由语音合成滤波器29顺序输出的合成语音子帧作为主子帧。在步骤S1,抽头生成部分121从主子帧的合成语音和该子帧的I码中生成预测抽头(后面将要描述),并且将该预测抽头提供给预测部分125。而且,在步骤S1,例如,抽头生成部分122还从主子帧的合成语音和该子帧的I码中生成类抽头(后面将要描述),并且将该类抽头提供给分类部分123。
然后,过程进入步骤S2,其中,分类部分123根据从抽头生成部分122提供的类抽头执行分类,并且将结果类代码提供给系数存储器124,然后过程进入步骤S3。
在步骤S3中,系数存储器124从由分类部分123提供的类代码对应的地址中读取抽头系数,并且将该抽头系数提供给预测部分125。
然后过程进入步骤S4,其中,预测部分125获得从系数存储器124输出的抽头系数,并且通过使用该抽头系数和来自抽头生成部分121的预测抽头,执行方程(6)所示的乘积和计算,从而获得主子帧的高质量声音数据(的预测值)。
通过顺序使用主子帧合成语音数据的每个样本值作为主数据,执行步骤S1到S4的过程。也就是,由于子帧的合成语音数据如上所述包括40个样本,因此对于这40个样本的每个合成语音数据,执行步骤S1到S4的过程。
通过上述方式获得的高质量声音利用D/A转换部分30从预测部分125提供给扬声器31,由此从扬声器31输出高质量声音。
在步骤S4之后,过程进入步骤S5,其中,确定是否存在更多的子帧要作为主子帧进行处理。当确定确定存在子帧要作为主子帧进行处理时,过程返回到步骤S1,其中,用作下一主子帧的子帧用作新的主子帧,并且以下重复相同的过程。当在步骤S5确定不存在任何子帧要作为主子帧进行处理时,结束处理。
下面参照图7,对在图5的抽头生成部分121中生成预测抽头的方法进行描述。
例如,如图7所示,抽头生成部分121采用子帧的每个合成语音数据(从语音合成滤波器29输出的合成语音数据)作为主数据,并且提取主数据的过去N个样本的合成语音数据(图7的A所示范围内的合成语音数据)以及以主数据为中心总共N个样本的过去和将来合成语音数据(图7的B所示范围内的合成语音数据),作为预测抽头。
而且,抽头生成部分121还提取例如主数据所在的子帧(图7实施例中的子帧#3),也就是主子帧中的I码,作为预测抽头。
因此,在这种情况下,预测抽头由包含主数据的N个样本合成语音数据和主子帧的I码形成。
另外,在抽头生成部分122中,例如,以与抽头生成部分121的情况相同的方式,提取由合成语音数据和I码形成的类抽头。
然而,预测抽头和类抽头的结构模式不限于上述模式。也就是,除如上所述从主数据提取所有N个样本合成语音数据作为预测抽头和类抽头之外,每隔几个样本提取合成语音数据是可能的。
而且,虽然在上述情况下是以相同的方式形成类抽头和预测抽头,但是类抽头和预测抽头可以采用不同的方式来形成。
可以只从合成语音数据中形成预测抽头和类抽头。然而,以上述方式,除合成语音数据之外,还通过使用作为合成语音数据相关信息的I码形成预测抽头和类抽头,解码出更高质量的声音成为可能。
然而,以上述情况的方式,当在预测抽头和类抽头中只包含位于主数据所在子帧中的I码时,可以说,不能获得形成预测抽头和类抽头的合成语音数据与I码之间的平衡。因此,存在不能充分地通过分类和自适应过程改善音质效果的危险。
更具体地说,例如,在图7中,当在预测抽头中包含主数据的过去N个样本合成语音数据(图7的A所示范围内的合成语音数据)时,用作预测抽头的合成语音数据不仅包含主子帧的合成语音数据,还包含前一子帧的合成语音数据。因此,在这种情况下,如果在预测抽头中包含位于主子帧的I码,除非在预测抽头中包含位于前一子帧的I码,否则存在形成预测抽头的合成语音数据与I码之间的关系出现不平衡的危险。
因此,从中形成预测抽头和类抽头的I码子帧可以根据主数据在主子帧中的位置发生变化。
更具体地说,例如,在包含在从主数据形成的预测抽头中的合成语音数据范围扩展到主子帧的前一子帧或后一子帧(以下称作“相邻子帧”)的情况下,或者在合成语音数据扩展到临近于相邻子帧的位置的情况下,以不仅包含主子帧的I码而且包含相邻子帧的I码的方式形成预测抽头是可能的。也可以采用相同的方式形成类抽头。
采用这种方式,通过以获得形成预测抽头和类抽头的合成语音数据和I码之间的平衡这种方式形成预测抽头和类抽头,由于分类和自适应过程获得充分的音质改善成为可能。
图8示出用于形成预测抽头的抽头生成部分121示例结构,通过以如上方式根据主数据在主子帧中的位置使形成预测抽头的I码的子帧可变,能够获得形成预测抽头的合成语音数据与I码之间的平衡。用于形成类抽头的抽头生成部分122也可以类似于图8进行形成。
从图5的语音合成滤波器29输出的合成语音数据提供给存储器41A,并且存储器41A临时存储向其提供的合成语音数据。存储器41A至少具有能够存储形成一个预测抽头的N个样本合成语音数据的存储容量。而且,存储器41A以覆写最旧存储值的方式顺序存储向其提供的合成语音数据最新样本。
然后,数据提取电路42A通过从存储器41A进行读取,根据主数据提取形成预测抽头的合成语音数据,并且将该合成语音数据输出到组合电路43。
更具体地说,当采用存储在存储器41A中的最新合成语音数据作为主数据时,数据提取电路42A通过从存储器41A进行读取,提取最新合成语音数据的过去N个样本合成语音数据,并且将该数据输出到组合电路43。
如图7的B所示,当使用以主数据为中心的过去和将来N个样本合成语音数据作为预测抽头时,可以采用存储在存储器41A中的合成语音数据内的离最新合成语音数据N/2(小数部分例如增至下一整数)个样本的过去合成语音数据作为主数据,并且从存储器41A中读取以主数据为中心的总共N个样本的过去和将来合成语音数据。
同时,从图5的信道解码器21输出的子帧单元I码提供给存储器41B,并且存储器41B临时存储向其提供的I码。存储器41B至少具有能够存储形成一个预测抽头的I码量的存储容量。而且,类似于存储器41A,存储器41B以覆写最旧存储值的方式存储向其提供的最新I码。
然后,数据提取电路42B根据由数据提取电路42A采用为主数据的合成语音数据在主子帧的位置通过从存储器41B进行读取,提取仅仅主子帧的I码,或者主子帧的I码和与主子帧相邻的子帧(相邻子帧)的I码,并且将它们输出到组合电路43。
组合电路43将来自数据提取电路42A的合成语音数据与来自数据提取电路42B的I码组合(合并)为一个数据集,并且将它作为预测抽头进行输出。
在抽头生成部分121中,当以上述方式生成预测抽头时,形成预测抽头的合成语音数据固定为N个样本。然而,对于I码,存在它只是主子帧的I码的情况,并且存在它是主子帧的I码和与主子帧相邻的子帧(相邻子帧)的I码的情况。因此,I码的数目是变化的。这同样应用于在抽头生成部分122中生成的类抽头。
对于预测抽头,即使形成它的数据数目(抽头数目)是变化的,也没有问题,因为与预测抽头数目相同的抽头系数只需要在图13的学习装置中进行学习(后面将要描述),并且抽头系数只需存储在系数存储器124中。
另一方面,对于类抽头,如果形成类抽头的数目是变化的,通过类抽头获得的所有类的数目也是变化的,所带来的危险是处理变得复杂。因此,最好执行即使类抽头的抽头数目是变化的,通过类抽头获得的类数目也不发生变化的分类。
可以采用例如将主数据在主子帧中的位置考虑在内的方法作为即使类抽头的抽头数目是变化的,通过类抽头获得的类数目也不发生变化的分类执行方法。
更具体地说,在本实施例中,类抽头的抽头数目根据主数据在主子帧中的位置,增大或减小。例如,假设类抽头的抽头数目为S和大于S的L(>S)的情况,当抽头数目为S时,获得n比特的类,并且当抽头数目为L时,获得n+m比特的类代码。
在这种情况下,使用n+m+1比特作为类代码,并且,例如,n+m+1比特内的如最高位比特的1比特根据类抽头数目为S和L的情况设为0或1。因此,即使抽头数目为S或L,类总数为2n+m+1的分类成为可能。
更具体地说,当类抽头的数目为L时,可以执行获得n+m比特类代码的分类,并且采用表示抽头数目为L的最高位比特“1”加到n+m比特类代码的n+m+1比特作为最终的类代码。
而且,当类抽头的数目为S时,可以执行获得n比特类代码的分类,m个比特“0”作为高位比特可以加到n比特类代码,从而形成n+m比特,并且可以采用表示抽头数目为S的最高位比特“0”加到n+m比特的n+m+1比特作为最终的类代码。
采用上述方式,即使类抽头的抽头数目为S或L,类总数为2n+m+1的分类成为可能。当抽头数目为S时,从最高位比特开始计数的第二比特直到第(m+1)比特总是为“0”。
因此,如上所述,当执行输出n+m+1比特类代码的分类时,出现没有使用的类(对应的类代码),也就是,可以说,出现无用类。
因此,为了防止这种无用类使类的总数固定,可以通过对形成类抽头的数据进行加权,执行分类。
更具体地说,例如,在图7的A所示的主数据的过去N个样本合成语音数据包含在类抽头中,并且主子帧(以下适当时称作“主子帧#n”)的I码和前一子帧#n-1的I码的其中之一或两者根据主数据在主子帧的位置包含在类抽头中的情况下,例如,对形成类抽头的主子帧#n的I码对应的类数目和前一子帧#n-1的I码对应的类数目执行图9A所示的加权,从而允许类数目固定。
也就是,图9A示出执行主数据越位于主子帧#n的右边,主子帧#n的I码对应的类数目越大的分类。而且,图9A示出执行主数据越位于主子帧#n的右边,前一子帧#n-1的I码对应的类数目越小的分类。通过执行如图9A所示的加权,执行类总数目为固定的分类。
而且,例如,在以主数据为中心的图7的B所示的总共N个样本的过去和将来合成语音数据包含在类抽头中,并且主子帧#n的I码以及前一子帧#n-1与后一子帧#n+1的I码的其中之一或两者包含在类抽头中的情况下,例如对形成类抽头的主子帧#n的I码对应的类数目、前一子帧#n-1的I码对应的类数目以及后一子帧#n+1的I码对应的类数目执行图9B所示的加权,从而允许类数目固定。
也就是,图9B示出主数据越靠近主子帧#n的中心位置,主子帧#n的I码对应的类数目越大的分类。而且,图9B示出主数据越位于主子帧#n的左边(过去),紧邻在主子帧#n之前的子帧#n-1的I码对应的类数目越大,并且主数据越位于主子帧#n的右边(将来),紧邻在主子帧#n之后的子帧#n+1的I码对应的类数目越大的分类。通过执行如图9B所示的加权,执行类总数目为固定的分类。
图10示出在I码对应的类数目固定为512情况下的加权示例。
更具体地说,图10A示出主子帧#n的I码和前一子帧#n-1的I码的其中之一或两者根据主数据在主子帧的位置包含在类抽头中的情况下的加权特定示例。
图10B示出主子帧#n的I码以及前一子帧#n-1与后一子帧#n+1的I码的其中之一或两者根据主数据在主子帧的位置包含在类抽头中的情况下的图9B所示加权特定示例。
在图10A中,最左列示出从左端开始主数据在主子帧的位置。左起第二列示出紧邻在主子帧之前的子帧I码对应的类数目。左起第三列示出主子帧的I码对应的类数目。最右列示出形成类抽头的I码对应的类数目(主子帧的I码和前一子帧的I码对应的类数目)。
在此,例如,如上所述,由于子帧由40个样本组成,因此从左端开始主数据在主子帧的位置(最左列)取值范围为1到40。而且,例如,如上所述,因为I码的长度为9比特,所以当直接采用9比特作为类代码时,类数目为最大。因此,I码对应的类数目(从左开始的第二和第三列)取值为29(=512)或更低。
而且,如上所述,当直接使用一个I码作为类代码时,类数目为512(29)。因此,在图10A中(同样应用于图10B,后面将要描述),对主子帧的I码对应的类数目和前一子帧的I码对应的类数目执行加权,从而形成类抽头的所有I码对应的类数目(主子帧的I码和前一子帧的I码对应的类数目)为512,也就是,主子帧的I码对应的类数目与前一子帧的I码对应的类数目的乘积为512。
在图10A中,如图9A所示,主数据越位于主子帧#n的右边(表示主数据位置的值越大),主子帧#n的I码对应的类数目越大,并且紧邻在主子帧#n之前的子帧#n-1的I码对应的类数目越小。
在图10B中,最左列、左起第二列、左起第三列以及最右列示出与图10A的情况相同的内容。左起第四列示出紧邻在主子帧之后的子帧的I码对应的类数目。
在图10B中,如图9B所示,主数据越远离主子帧#n的中心位置(表示主数据位置的值比中间值大得越多或者小得越多),主子帧#n的I码对应的类数目越小。而且,主数据越位于主子帧#n的左边,紧邻在主子帧#n之前的子帧#n-1的I码对应的类数目越大。另外,主数据越位于主子帧#n的右边,紧邻在主子帧#n之后的子帧#n+1的I码对应的类数目越大。
图11示出用于执行涉及如上所述的加权的分类的图5分类部分123示例结构。
在此,假定类抽头由例如主数据的过去N个样本合成语音数据以及主数据和前一子帧的I码组成,如图7的A所示。
从抽头生成部分122(图5)输出的类抽头提供给合成语音数据提取部分51和码提取部分53。
合成语音数据提取部分51从向其提供的类抽头中裁出(提取)形成类抽头的多个样本合成语音数据,并且将合成语音数据提供给ADRC电路52。ADRC电路52对从合成语音数据提取部分51提供的多个合成语音数据项(在此为N个样本合成语音数据)执行例如1比特ADRC处理,并且将以预定次序排列结果合成语音数据多个项各自对应的1比特的比特序列提供给组合电路56。
同时,码提取部分53从向其提供的类抽头中裁出(提取)形成类抽头的I码。而且,码提取部分53将所提取的I码中的主子帧的I码和前一子帧的I码分别提供给退化部分54A和54B。
退化部分54A存储通过表创建过程(后面将要描述)创建的退化表。采用图9和10所述的方式,通过使用退化表,退化部分54A根据主数据在主子帧的位置退化(减小)由主子帧的I码表示的类数目,并且将该类数目提供给组合电路55。
也就是,当主数据在主子帧的位置为从左开始的第一到第四之一时,退化部分54A执行退化过程,从而,例如,如图10A所示,由主子帧的I码表示的512个类数目仍为512,也就是,不对主子帧的9比特I码进行特定处理,而是直接输出。
而且,当主数据在主子帧的位置为从左开始的第五到第八之一时,例如,如图10A所示,退化部分54A执行退化过程,从而,由主子帧的I码表示的512个类数目变为256,也就是,通过使用退化表将主子帧的9比特I码转换为用8比特表示的码,并且输出该码。
而且,当主数据在主子帧的位置为从左开始的第九到第十二之一时,例如,如图10A所示,退化部分54A执行退化过程,从而,由主子帧的I码表示的512个类数目变为128,也就是,通过使用退化表将主子帧的9比特I码转换为用7比特表示的码,并且输出该码。
以下采用类似的方式,退化部分54A根据主数据在主子帧的位置,如图10A的左起第二列所示退化由主子帧的I码表示的类数目,并且将该类数目输出到组合电路55。
退化部分54B还存储类似于退化部分54A的退化表。通过使用该退化表,退化部分54B根据主数据在主子帧的位置,如图10A的左起第三列所示退化由前一子帧的I码表示的类数目,并且将该类数目输出到组合电路55。
组合电路55将来自退化部分54A的适当时退化类数目的主子帧的I码与来自退化部分54B的适当时退化类数目的紧邻在主子帧之前的子帧的I码组合为一个比特序列,并且将该比特序列提供给组合电路56。
组合电路56将来自ADRC电路52的比特序列与来自组合电路55的比特序列组合为一个比特序列,并且将该比特序列作为类代码进行提供。
下面参照图12的流程图,对创建在图11的退化部分54A和54B中使用的退化表的表创建过程进行描述。
在退化表创建过程中,开始,在步骤S11,设置退化之后的类数目M。在此,为描述简洁起见,例如,M值设为提高到2的幂。而且,在此,由于创建用于退化用9比特的I码表示的类数目的退化表,因此M值设为512(这是用9比特I码表示的最大类数目)或更小。
然后,过程进入步骤S12,其中,表示退化之后类数目的变量c设为“0”,并且过程进入步骤S13。在步骤S13中,所有I码(首先,用9比特I码表示的所有数目)设为用于处理目标的目标I码,并且过程进入步骤S14。在步骤S14中,选择一个目标I码作为主(subject)I码,并且过程进入步骤S15。
在步骤S15,计算由I码表示的波形(激励信号的波形)与由所有目标码表示的每个波形之间的平方差。
更具体地说,如上所述,I码对应于预定激励信号。在步骤S15,确定由主I码表示的激励信号波形的每个样本值与用目标I码表示的激励信号波形对应样本值之间的平方差之和。在步骤S15,通过使用所有目标I码作为目标,确定对主I码的平方差之和。
然后,过程进入步骤S16,其中,检测使对主I码的平方差之和最小的目标I码(以下适当时称作“最小平方差I码”),并且使主I码和最小平方差I码对应于用变量c表示的码。也就是,因此,主I码,和在目标I码中由其表示的波形最近似于由主I码表示的波形的目标I码(最小平方差I码)退化为相同的类c。
在步骤S16之后,过程进入步骤S17,其中,例如,确定由主I码表示的波形的每个样本值与由最小平方差I码表示的波形的对应样本值的平均值,并且使平均值波形作为用变量c表示的激励信号波形对应于变量c。
然后,过程进入步骤S18,其中,从目标I码中排除主I码和最小平方差I码。然后,过程进入步骤S19,其中,变量c增1,然后过程进入步骤S20。
在步骤S20,确定是否存在用于目标I码的I码。当确定存在用于目标I码的I码时,过程返回到步骤S14,其中,从用于目标I码的I码中选择新的主I码,并且以下重复相同的过程。
当在步骤S20确定不存在用于目标I码的I码时,也就是,当变量c等于I码总数目的1/2时,过程进入步骤S21,其中,确定变量c是否等于退化之后的类数目M。
当在步骤S21确定变量c不等于退化之后的类数目M时,也就是,当用9比特I码表示的类数目尚未退化为M类时,过程进入步骤S22,其中,重新采用以变量c表示的每个值作为I码。然后,过程返回到步骤S12,并且以下使用新的I码作为目标,重复相同的过程。
对于新的I码,通过使用在步骤S17确定的波形作为由新I码表示的激励信号波形,计算步骤S15中的平方差。
另一方面,当在步骤S21确定变量c等于退化之后的类数目M时,也就是,当用9比特I码表示的类数目退化为M类时,过程进入步骤S23,其中,创建变量c的每个值与对应于该值的9比特I码之间的对应表,输出该对应表作为退化表,然后结束过程。
在图11的退化部分54A和54B中,通过将向其提供的9比特I码转换为在以上述方式创建的退化表中对应于该9比特I码的变量c,退化该9比特I码。
另外,例如,还可以通过简单地删除I码的低位比特执行9比特I码的类数目退化。然而,最好以相似类集合在一起的方式执行类数目的退化。因此,代替简单地删除I码的低位比特,如图12所述,表示具有相似波形的激励信号的I码最好分配给相同的类。
图13示出用于执行学习存储在图5的系数存储器124中的抽头系数的过程的学习装置实施例的示例结构。
麦克风201到码确定部分215的一系列组件分别类似于图1的麦克风1到码确定部分15的一系列组件。高质量的学习语音信号输入到麦克风1,并且因此,在麦克风201到码确定部分215中,对学习语音信号执行与图1的情况相同的处理。
然而,码确定部分215在L码、G码、I码和A码中只输出在本实施例中形成预测抽头和类抽头的L码。
然后,当在最小平方差确定部分208中确定平方差达到最小时,由语音合成滤波器206输出的合成语音提供给抽头生成部分131和132。而且,当码确定部分215从最小平方差确定部分208接收确定信号时,由码确定部分215输出的I码也提供给抽头生成部分131和132。而且,由A/D转换部分202输出的语音作为老师数据提供给规格化方程求和电路134。
生成部分131从由语音合成滤波器206输出的合成语音数据和由码确定部分215输出的I码中生成与图5的抽头生成部分121的情况相同的预测抽头,并且将预测抽头作为学生数据提供给规格化方程求和电路134。
抽头生成部分132还从由语音合成滤波器206输出的合成语音数据和由码确定部分215输出的I码中生成与图5的抽头生成部分122的情况相同的类抽头,并且将类抽头提供给分类部分133。
分类部分133根据来自抽头生成部分132的类抽头执行与图5的分类部分123的情况相同的分类,并且将结果类代码提供给规格化方程求和电路134。
规格化方程求和电路134接收来自A/D转换部分202的语音数据作为老师数据,并且接收来自生成部分131的预测抽头作为学生数据,并且通过使用老师数据和学生数据作为目标,对来自分类部分133的每个类代码执行求和。
更具体地说,规格化方程求和电路134通过使用预测抽头(学生数据),对从分类部分133提供的类代码对应的每个类,执行学生数据与学生数据的相乘(xinxim)(方程(13)中矩阵A的各项)以及相当于求和∑的计算。
而且,规格化方程求和电路134通过使用学生数据和老师数据,对从分类部分133提供的类代码对应的每个类,执行学生数据与老师数据的相乘(xinyi)(方程(13)中向量v的各项)以及相当于求和∑的计算。
规格化方程求和电路134通过使用向其提供的所有用于学习的语音子帧作为主子帧,执行上述求和。因此,为每个类建立方程(13)所示的规格化方程。
抽头系数确定电路135通过对在规格化方程求和电路134中为每个类生成的规格化方程进行求解,确定每个类的抽头系数,并且将该抽头系数提供给系数表存储单元69中与各个类对应的地址。
根据准备用作学习语音信号的语音信号,在规格化方程求和电路134中,可能出现不能获得确定抽头系数所需的规格化方程数目的类。对于这种类,抽头系数确定电路135输出例如缺省抽头系数。
系数存储器136将从抽头系数确定电路135提供的每个类对应的抽头系数存储在那个类对应的地址中。
下面参照图14的流程图,对在图13的学习装置中执行的确定用于解码出高质量声音的抽头系数的学习过程进行描述。
更具体地说,学习语音信号提供给学习装置。在步骤S31,从学习语音信号中生成老师数据和学生数据。
更具体地说,学习语音信号输入到麦克风201,并且麦克风201到码确定部分215分别执行与图1的麦克风1到码确定部分15的情况相同的过程。
因此,通过A/D转换部分202获得的数字语音信号作为老师数据提供给规格化方程求和电路134。而且,当在最小平方差确定部分208中确定平方差达到最小时,从语音合成滤波器206输出的合成语音作为学生数据提供给抽头生成部分131和132。而且,当在最小平方差确定部分208中确定平方差达到最小时,从码确定部分215输出的I码也作为学生数据提供给抽头生成部分131和132。
然后,过程进入步骤S32,其中,抽头生成部分131采用从语音合成滤波器206作为学生数据提供的合成语音数据子帧作为主子帧,而且顺序采用那个主子帧的合成语音数据作为主数据,与图5的抽头生成部分121的情况类似,从来自语音合成滤波器206的合成语音数据和来自码确定部分215的L码中对每个主数据生成预测抽头,并且将该预测抽头提供给规格化方程求和电路134。而且,在步骤S32,抽头生成部分132还与图5的抽头生成部分122的情况类似,从合成语音数据中生成类抽头,并且将类抽头提供给分类部分133。
在步骤S32之后,过程进入步骤S33,其中,分类部分133根据来自抽头生成部分132的类抽头执行分类,并且将结果类代码提供给规格化方程求和电路134。
然后,过程进入步骤S34,其中,规格化方程求和电路134通过使用来自A/D转换部分202作为老师数据的学习语音内的语音(对应于主数据)和来自生成部分132作为学生数据的预测抽头(从主数据生成的预测抽头)作为目标,为来自分类部分133对于主数据的每个类代码,执行如上所述方程(13)的矩阵A和向量v的求和。然后,过程进入步骤S35。
在步骤S35,确定是否存在任何更多子帧要作为主子帧进行处理。当在步骤S35中确定还存在子帧要作为主子帧进行处理时,过程返回到步骤S31,其中,采用下一子帧作为新的主子帧,并且以下重复相同的过程。
而且,当在步骤S35中确定不存在任何子帧要作为主子帧进行处理时,过程进入步骤S36,其中,抽头系数确定电路135对在规格化方程求和电路134中为每个类生成的规格化方程进行求解,从而为每个类确定抽头系数,并且将抽头系数提供给系数存储器136中与每个类对应的地址中,从而存储抽头系数,然后结束处理。
采用上述方式,在图5的系数存储器124中存储在系数存储器136中存储的每个类对应的抽头系数。
采用上述方式,由于以执行学习的方式确定存储在图5的系数存储器124中的抽头系数,从而通过执行线性预测计算而获得的高质量语音的语音预测值的预测误差(平方差)在统计上为最小,由图5的预测部分125输出的语音为高质量语音。
例如,在图5和13的实施例中,除了从语音合成滤波器206输出的合成语音数据之外,包含在编码数据中的I码(变为编码数据)也包含在预测抽头和类抽头中。然而,如图5和13的虚线所示,预测抽头和类抽头可以形成为,代替I码或者除I码之外,包含I码、L码、G码、A码、从A码获得的线性预测系数αp、从G码获得的增益β或γ以及从L码、G码、I码或A码获得的其它信息(例如,剩余信号e、用于获得剩余信号e的l或n、1/β、n/γ等)中的一个或多个。而且,在CELP方法中,存在列表插值比特、帧能量等包含在码数据中作为编码数据的情况。在这种情况下,预测抽头和类抽头也可以形成为,使用软插值比特和帧能量。
另外,既可以用硬件又可以用软件执行上述过程序列。在用软件执行过程序列的情况下,形成软件的程序安装在通用计算机等中。
因此,图15示出其中安装有用来执行上述过程序列的程序的计算机实施例的示例结构。
该程序可以预记录在硬盘305或作为计算机内置记录介质的ROM 303中。
作为替换,程序可以临时或永久地存储(记录)在可移动记录介质311中,例如软盘,CD-ROM(Compact Disc Read Only Memory,光盘只读存储器),MO(Magneto-Optical,光磁)盘,DVD(Digital Versatile Disc,数字多用途盘),磁盘或半导体存储器。该可移动记录介质311可以作为通常所谓的包软件进行提供。
除了如上所述从可移动记录介质311安装到计算机中之外,程序还可以通过用于数字卫星广播的人造卫星以无线方式从下载站点传输到计算机,或通过网络如LAN(Local Area Network,局域网)或因特网以缆线方式传输到计算机,并且在计算机中,以这种方式传输的程序通过通信部分308进行接收,并且可以安装到内置硬盘305中。
计算机具有内置的CPU(Central Processing Unit,中央处理器)302。输入/输出接口310通过总线301连接到CPU 302。当用户操作输入部分307,如键盘,鼠标或麦克风,通过输入输出接口310输入一个命令时,CPU 302根据该命令执行存储在ROM(Read Only Memory,只读存储器)303中的程序。作为替换,CPU 302载入存储在硬盘305中的程序,从卫星或网络传输的由通信部分308接收且安装到硬盘305中的程序,或者从载入在驱动器309中的可移动记录介质311读出,并且安装到硬盘305、RAM(Random AccessMemory,随机存储器)304中的程序,并且执行该程序。因此,CPU 302根据上述流程图或按照上述方框图中的结构执行的处理执行处理。然后,CPU302(如果需要)例如通过输入/输出接口310从由LCD(liquid crystal display,液晶显示器)、扬声器等形成的输出部分306输出处理结果,或者从通信部分308传输处理结果,而且将处理结果记录在硬盘305中。
在此,在本说明书中,描述用于使计算机执行各种类型处理的程序的处理步骤不一定非要按流程图中所示的时间顺序执行处理,而是也包含以并行或独立的方式执行的处理(例如并行处理或面向对象的处理)。
而且,该程序可以由一台计算机进行处理,或者可以由多台计算机以分布的方式进行处理。另外,该程序还可以传输到远程计算机,从而进行执行。
虽然在本实施例中,没有特别提到使用哪种学习语音信号作为学习语音信号,除由人类产生的语音之外,例如,可以采用乐曲(音乐)等作为学习语音信号。根据如上所述的学习装置,当使用所再现的人类语音作为学习语音信号时,获得改善人类语音声音质量的抽头系数。当使用乐曲时,获得改善乐曲声音质量的抽头系数。
虽然抽头系数预先存储在移动电话101的系数存储器124中,但是存储在系数存储器124中的抽头系数可以从图3的基站102(或交换站103)、WWW(World Wide Web,万维网)服务器(未示出)等进行下载。也就是,如上所述,可以通过学习获得适合于特定种类语音信号(例如人类语音或乐曲)的抽头系数。而且,根据用于学习的老师数据和学生数据,可以获得合成语音声音质量出现不同的抽头系数。因此,各种抽头系数可以存储在基站102等中,从而使用户可以下载用户所需的抽头系数。这种抽头系数下载服务可以采用免费或收费方式。而且,当采用收费方式执行抽头系数下载服务时,例如,下载抽头系数的费用可以与移动电话101的电话费一起进行收取。
而且,系数存储器124等可以由相对于移动电话101可拆卸的可移动存储卡等形成。在这种情况下,如果提供其中存储有如上所述各种类型的抽头系数,用户根据情况将存储有所需抽头系数的存储卡插入到移动电话101中,并且进行使用成为可能。
另外,本发明可以广泛地应用于例如从通过采用CELP方法例如VSELP(Vector Sum Excited Linear Predication,向量和激励线性预测)、PSI-CELP(Pitch Synchronous Innovation CELP,基音同步创新CELP)、或者CS-CELP(Conjugate Structure Algebraic CELP,共轭结构代数CELP)进行编码而获得的码中产生合成语音的情况。
而且,本发明不限于从通过采用CELP方法进行编码而获得的码中对合成语音进行解码的情况,并且可以广泛地应用于从具有用于在预定单元内进行解码的信息(解码信息)的编码数据中对原始数据进行解码的情况。也就是,本发明还可以应用于例如通过具有预定块单元的DCT(Discrete CosineTransform,离散余弦变换)系数的JPEG(Joint Photographic Experts Group,联合图象专家组)方法对图象进行编码的编码数据。
而且,虽然在本实施例中通过使用抽头系数的线性一阶预测计算确定剩余信号的预测值和线性预测系数,但是另外还可以通过二阶或更高阶的高阶预测计算,确定这些预测值。
例如,在日本未审查专利申请公开号8-202399中,公开一种通过使合成语音通过高频预加重滤波器来改善合成语音声音质量的方法。然而,本发明不同于日本未审查专利申请公开号8-202399之处在于,抽头系数是通过学习获得的,根据分类结果自适应地确定用于预测计算的抽头系数,而且,不仅从合成语音,而且从包含在编码数据中的I码等生成预测抽头等。
工业应用
根据本发明的数据处理装置、数据处理方法、程序和记录介质,在以对编码数据进行解码的方式而产生的解码数据内提取与感兴趣主数据具有预定位置关系的解码数据,并且根据主数据在预定单元的位置提取预定单元内的解码信息,从而生成用于预定过程的抽头,并且通过使用抽头,执行预定过程。因此,例如,获得高质量解码数据成为可能。
根据本发明的数据处理装置、数据处理方法、程序和记录介质,通过将充当老师的老师数据编码为具有预定单元内解码信息的编码数据,并且对编码数据进行解码,生成作为充当学生的学生数据的解码数据。而且,通过在作为学生数据的解码数据内提取与感兴趣主数据具有预定位置关系的解码数据,并且根据主数据在预定单元的位置提取预定单元内的解码信息,生成用于预测老师数据的预测抽头。然后,执行学习,从而通过执行使用预测抽头和抽头系数的预定预测计算而获得的老师数据的预测值的预测误差在统计上变为最小,并且确定抽头系数。因此,从编码数据获得用于解码出高质量解码数据的抽头系数成为可能。
Claims (23)
1.一种数据处理装置,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理装置包括:
抽头生成装置,用于生成用于预测计算的预测抽头,其包括一提取装置,用于在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合装置,用于组合该两个提取的数据,形成所述抽头;以及
处理装置,用于通过至少使用所述预测抽头来产生其质量高于所述解码的数据的预测值,执行所述预测计算。
2.如权利要求1所述的数据处理装置,进一步包括抽头系数获取装置,用于获取通过执行学习而确定的抽头系数,
其中,所述处理装置通过执行使用所述预测抽头和所述抽头系数的预测计算,确定所述预测值。
3.如权利要求2所述的数据处理装置,其中,所述处理装置通过执行使用所述预测抽头和所述类抽头的线性一阶预测计算,确定所述预测值。
4.如权利要求1所述的数据处理装置,其中,所述抽头生成装置还生成用于对所述主数据进行分类的分类操作的类抽头,并且
所述处理装置根据所述类抽头对所述主数据执行分类,并且通过使用通过分类而获得的类对应的所述抽头系数以及所述预测抽头,执行所述预测计算,从而确定所述预测值。
5.如权利要求1所述的数据处理装置,其中,所述抽头生成装置提取位置临近于所述主数据的所述解码数据或者预定单元内的所述解码信息。
6.如权利要求1所述的数据处理装置,其中,所述编码数据是通过对语音进行编码而产生的。
7.如权利要求6所述的数据处理装置,其中,所述编码数据是通过采用CELP(Code Excited Linear coding,码激励线性编码)方法对语音进行编码而产生的。
8.一种数据处理装置,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理装置包括:
抽头生成装置,用于生成用来执行对主数据进行分类的分类操作的类抽头,其包括一提取装置,用于在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合装置,用于组合该两个提取的数据,形成所述抽头;以及
处理装置,用于根据所述类抽头对所述主数据执行分类。
9.如权利要求8所述的数据处理装置,其中,所述处理装置通过对预定单元内形成所述类抽头的所述解码信息提供权值,执行分类。
10.如权利要求9所述的数据处理装置,其中,所述处理装置通过根据所述主数据在所述预定单元中的位置对所述预定单元内的所述解码信息提供权值,执行分类。
11.如权利要求9所述的数据处理装置,其中,所述处理装置通过以在预定单元内的所述解码信息上通过所述分类而获得的所有类数目为固定的方式提供权值,执行分类。
12.一种数据处理方法,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理方法包括:
抽头生成步骤,生成用于预测计算的预测抽头,其包括一提取步骤,通过在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合步骤,组合该两个提取的数据,形成所述抽头抽头;以及
处理步骤,通过至少使用所述预测抽头来产生其质量高于所述解码的数据的预测值,执行所述预测计算。
13.一种数据处理方法,用于处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理方法包括:
抽头生成步骤,生成用来执行对主数据进行分类的分类操作的类抽头,其包括一提取步骤,在以对所述编码数据进行解码的方式而产生的解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据的位置提取预定单元内的所述解码信息;和组合步骤,用于组合该两个提取的数据,形成所述抽头;以及
处理步骤,用于根据所述类抽头对所述主数据执行分类。
14.一种学习预定抽头系数的数据处理装置,用来处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理装置包括:
学生数据生成装置,用于通过将充当老师的老师数据编码为具有预定单元内所述解码信息的编码数据,并且对编码数据进行解码,生成作为充当学生的学生数据的解码数据;
预测抽头生成装置,用于生成用于预测老师数据的预测抽头,其包括提取装置,用于通过在作为学生数据的所述解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据在所述预定单元的位置提取所述预定单元内的所述解码信息;和组合装置,用于组合该两个提取的数据,形成所述抽头;以及
学习装置,用于执行学习,从而通过执行使用所述预测抽头和所述抽头系数的预定预测计算而获得的所述老师数据的预测值的预测误差在统计上变为最小,并且用于确定所述抽头系数。
15.如权利要求14所述的数据处理装置,其中,所述学习装置执行学习,从而通过执行使用所述预测抽头和所述抽头系数的线性一阶预测计算而获得的所述老师数据的预测值的预测误差在统计上变为最小。
16.如权利要求14所述的数据处理装置,进一步包括:
类抽头生成装置,用于通过提取与所述主数据具有预定位置关系的所述解码数据,并且根据所述主数据在所述预定单元的位置提取所述预定单元内的所述解码信息,生成用于对所述主数据进行分类的分类操作的类抽头;以及
分类装置,用于根据所述类抽头对所述主数据执行分类,
其中,所述学习装置为通过所述分类装置的分类而获得的每个类确定所述抽头系数。
17.如权利要求16所述的数据处理装置,其中,所述分类装置通过对所述预定单元内形成所述类抽头的解码信息提供权值,执行分类。
18.如权利要求17所述的数据处理装置,其中,所述分类装置通过根据所述主数据在预定单元中的位置对所述预定单元内的所述解码信息提供权值,执行分类。
19.如权利要求17所述的数据处理装置,其中,所述分类装置通过以对于预定单元内的所述解码信息通过所述分类而获得的所有类数目为固定的方式提供权值,执行分类。
20.如权利要求16所述的数据处理装置,其中,所述预测抽头生成装置或所述类抽头生成装置提取位置临近于所述主数据的所述解码数据或者预定单元内的所述解码信息。
21.如权利要求14所述的数据处理装置,其中,所述老师数据为语音数据。
22.如权利要求21所述的数据处理装置,其中,所述学生数据生成装置采用CELP(码激励线性编码)方法对作为所述老师数据的语音数据进行编码。
23.一种学习预定抽头系数的数据处理方法,用来处理具有用于在预定单元内进行解码的解码信息的编码数据,所述数据处理方法包括:
学生数据生成步骤,通过将充当老师的老师数据编码为具有预定单元内所述解码信息的编码数据,并且对编码数据进行解码,生成作为充当学生的学生数据的解码数据;
预测抽头生成步骤,生成用于预测老师数据的预测抽头,其包括提取步骤,通过在作为学生数据的所述解码数据内提取与感兴趣的主数据具有预定位置关系的所述解码数据,并且根据所述主数据在所述预定单元的位置提取所述预定单元内的所述解码信息;和组合步骤,组合该两个提取的数据,形成所述抽头;以及
学习步骤,执行学习,从而通过执行使用所述预测抽头和所述抽头系数的预定预测计算而获得的所述老师数据的预测值的预测误差在统计上变为最小,并且确定所述抽头系数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001016868A JP4857467B2 (ja) | 2001-01-25 | 2001-01-25 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
JP16868/2001 | 2001-01-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1455918A CN1455918A (zh) | 2003-11-12 |
CN1215460C true CN1215460C (zh) | 2005-08-17 |
Family
ID=18883163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB028001710A Expired - Fee Related CN1215460C (zh) | 2001-01-25 | 2002-01-24 | 数据处理装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7467083B2 (zh) |
EP (1) | EP1282114A4 (zh) |
JP (1) | JP4857467B2 (zh) |
KR (1) | KR100875783B1 (zh) |
CN (1) | CN1215460C (zh) |
WO (1) | WO2002059876A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1944760B1 (en) * | 2000-08-09 | 2009-09-23 | Sony Corporation | Voice data processing device and processing method |
CN101604526B (zh) * | 2009-07-07 | 2011-11-16 | 武汉大学 | 基于权重的音频关注度计算系统和方法 |
US8311166B2 (en) * | 2010-03-31 | 2012-11-13 | Ubidyne, Inc. | Active antenna array and method for calibration of the active antenna array |
US8441966B2 (en) | 2010-03-31 | 2013-05-14 | Ubidyne Inc. | Active antenna array and method for calibration of receive paths in said array |
US8340612B2 (en) | 2010-03-31 | 2012-12-25 | Ubidyne, Inc. | Active antenna array and method for calibration of the active antenna array |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6111800A (ja) * | 1984-06-27 | 1986-01-20 | 日本電気株式会社 | 残差励振型ボコ−ダ |
JPS63214032A (ja) * | 1987-03-02 | 1988-09-06 | Fujitsu Ltd | 符号化伝送装置 |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
JPH01205199A (ja) * | 1988-02-12 | 1989-08-17 | Nec Corp | 音声符号化方式 |
US5359696A (en) | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
EP0450064B2 (en) | 1989-09-01 | 2006-08-09 | Motorola, Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
JP3102015B2 (ja) | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
JP3077944B2 (ja) | 1990-11-28 | 2000-08-21 | シャープ株式会社 | 信号再生装置 |
JP3077943B2 (ja) | 1990-11-29 | 2000-08-21 | シャープ株式会社 | 信号符号化装置 |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JP2800599B2 (ja) | 1992-10-15 | 1998-09-21 | 日本電気株式会社 | 基本周期符号化装置 |
CA2102080C (en) | 1992-12-14 | 1998-07-28 | Willem Bastiaan Kleijn | Time shifting for generalized analysis-by-synthesis coding |
FR2734389B1 (fr) * | 1995-05-17 | 1997-07-18 | Proust Stephane | Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme |
JP3435310B2 (ja) * | 1997-06-12 | 2003-08-11 | 株式会社東芝 | 音声符号化方法および装置 |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
JP3095133B2 (ja) * | 1997-02-25 | 2000-10-03 | 日本電信電話株式会社 | 音響信号符号化方法 |
US6041297A (en) * | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP4538705B2 (ja) * | 2000-08-02 | 2010-09-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
EP1944760B1 (en) * | 2000-08-09 | 2009-09-23 | Sony Corporation | Voice data processing device and processing method |
US7082220B2 (en) * | 2001-01-25 | 2006-07-25 | Sony Corporation | Data processing apparatus |
US7143032B2 (en) * | 2001-08-17 | 2006-11-28 | Broadcom Corporation | Method and system for an overlap-add technique for predictive decoding based on extrapolation of speech and ringinig waveform |
-
2001
- 2001-01-25 JP JP2001016868A patent/JP4857467B2/ja not_active Expired - Fee Related
-
2002
- 2002-01-24 US US10/239,591 patent/US7467083B2/en not_active Expired - Fee Related
- 2002-01-24 WO PCT/JP2002/000489 patent/WO2002059876A1/ja active Application Filing
- 2002-01-24 KR KR1020027012588A patent/KR100875783B1/ko not_active IP Right Cessation
- 2002-01-24 CN CNB028001710A patent/CN1215460C/zh not_active Expired - Fee Related
- 2002-01-24 EP EP02710340A patent/EP1282114A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1282114A1 (en) | 2003-02-05 |
JP4857467B2 (ja) | 2012-01-18 |
US20030163307A1 (en) | 2003-08-28 |
WO2002059876A1 (fr) | 2002-08-01 |
KR20020081586A (ko) | 2002-10-28 |
EP1282114A4 (en) | 2005-08-10 |
CN1455918A (zh) | 2003-11-12 |
US7467083B2 (en) | 2008-12-16 |
JP2002221999A (ja) | 2002-08-09 |
KR100875783B1 (ko) | 2008-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1200403C (zh) | 线性预测编码参数的矢量量化装置 | |
CN1172292C (zh) | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
CN1097396C (zh) | 声音编码装置和方法 | |
CN1324558C (zh) | 编码设备,解码设备以及音频数据分配系统 | |
CN1187735C (zh) | 多模式话音编码装置和解码装置 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1391689A (zh) | 宽带语音和音频信号解码器中的增益平滑 | |
CN1245706C (zh) | 多模式语音编码器 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN101076853A (zh) | 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法 | |
CN1957399A (zh) | 语音/音频解码装置以及语音/音频解码方法 | |
CN1457425A (zh) | 用于语音编码的码本结构与搜索 | |
CN1193158A (zh) | 语音编码方法和装置以及声音信号编码方法和装置 | |
CN1890714A (zh) | 一种优化的复合编码方法 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1216367C (zh) | 数据处理装置 | |
CN1215460C (zh) | 数据处理装置 | |
CN1679084A (zh) | 发送设备和发送方法、接收设备和接收方法、收发器设备、通信设备和方法、记录媒体、和程序 | |
CN1135528C (zh) | 声音编码装置以及声音解码装置 | |
CN1269314C (zh) | 数据处理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20050817 Termination date: 20140124 |