CN1193159A - 语音编码译码方法和装置、电话装置、音调变换方法和介质 - Google Patents
语音编码译码方法和装置、电话装置、音调变换方法和介质 Download PDFInfo
- Publication number
- CN1193159A CN1193159A CN97126481A CN97126481A CN1193159A CN 1193159 A CN1193159 A CN 1193159A CN 97126481 A CN97126481 A CN 97126481A CN 97126481 A CN97126481 A CN 97126481A CN 1193159 A CN1193159 A CN 1193159A
- Authority
- CN
- China
- Prior art keywords
- data
- encoding
- carried out
- curve analysis
- sinusoidal curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 91
- 238000006243 chemical reaction Methods 0.000 claims abstract description 170
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 238000013211 curve analysis Methods 0.000 claims description 71
- 230000008569 process Effects 0.000 claims description 26
- 230000008859 change Effects 0.000 claims description 25
- 238000005070 sampling Methods 0.000 claims description 19
- 238000003780 insertion Methods 0.000 claims description 10
- 230000037431 insertion Effects 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000926 separation method Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 61
- 239000013598 vector Substances 0.000 description 44
- 238000001228 spectrum Methods 0.000 description 28
- 239000002131 composite material Substances 0.000 description 20
- 238000013139 quantization Methods 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 19
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000000630 rising effect Effects 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000010189 synthetic method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000002940 Newton-Raphson method Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- IXSZQYVWNJNRAL-UHFFFAOYSA-N etoxazole Chemical compound CCOC1=CC(C(C)(C)C)=CC=C1C1N=C(C=2C(=CC=CC=2F)F)OC1 IXSZQYVWNJNRAL-UHFFFAOYSA-N 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 238000012966 insertion method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
在一语音信号被编码或被译码的情况中,它可用简单的处理和构成来实施音调控制。在对于由分隔在一预置的编码单元上在该时间轴上的该语音信号所得到的每一编码单元一语音信号被进行了正弦曲线分析编码的情况中,输出该语音信号的一线性预测余项,并处理所得结果的语音编码数据,通过在一音调转换单元中的一预置的计算处理来改变由正弦曲线分析编码所编码的该语音编码数据的一音调分量。
Description
本发明涉及应用于对一语音信号进行高效编码和译码的情况的一编码方法和译码方法,应用该编码方法和译码方法的一编码装置、一译码装置和一电话装置,以及在其上记录有所处理的编码和译码的数据的各种介质。
已经公知有各种编码方法,在这些方法中一信号压缩是通过利用在时域和频域中一音频信号(这里所谓的音频信号包括一语音信号和一声音信号)的统计学特性和人类所觉感觉的特性来进行的。该编码方法概括的分为在时域上的编码、在频域上的编码、分折一合成编码等。
一语言信号的高效编码的例子已知的有MBE(多频带激励)编码、SBE(单频带激励)或正弦曲线合成编码、谐波编码、SBC(子频带编码)、LPC(线性予测编码)、DCT(散出余弦变换)、MDCT(改进型DCT)、FFT(快速傅里叶变换)等。
在利用上述各种编码方法对一语音信号编码的情况中或在该编码语音信号被译码的情况中,有时希望改变一语音的音调而不改变该语音的音素。
在常规的一语音信号的高效编码装置和高效译码装置中,没有考虑音调的变化并且它必须连接一单独的音调控制装置和进行该音调的变换,其结果出现了结构复杂的缺点。
鉴于这种情况,本发明的一个目的是当对一语音信号进行编码处理和译码处理时,用简单的处理和构成就有可能精确地进行一所希望的音调控制而不改变其音素。
为了解决上述的问题,当在一予置的编码单元中在一时间轴上分隔一语音信号、在每一编码单元中得到一线性予测余项、在该线性予测余项中进行正弦曲线分折编码和对语音编码数据进行处理时,由该正弦曲线分析编码所编码的语音编码数据的一音调分量可以由根据本发明的一予定计算处理改变。
根据本发明,在由该正弦波分析编码所编码的语音编码数据的计算处理中,可以简单地实施音调变换而不须变化该音素分量。
图1是根据本发明的一个实施例的该语音编码装置的一个例子的基本构成框图;
图2是根据本发明的一个实施例的该语音译码装置的基本构成框图;
图3是图1的该语音信号编码装置的更具体构成框图;
图4是图2的该语音信号译码装置的更具体构成框图;
图5是应用于一无线电电话装置的一传送系统的一个例子的框图;和
图6是应用于一无线电电话装置的一接收系统的一个例子的框图。
下面,参照附图来说明本发明的一个实施例。
图1是一语音编码装置的一个例子的基本构成框图,而图3是它的详细构成框图。
现在说明本发明的该实施例的语音处理的基本概念。在该语音信号的编码例,由本发明人等提出并在公开号为No.6-51800的日本待审专利所披露的有关量纲变换或数据量变换的技术已被使用。在使用该技术量化该频谱包络的幅度时,使用一定数量保持常数即量纲常数的谐波来执行矢量量化,因为该频谱包络的形状不变化,所以在该语音分量中所包含的音素分量不会改变。
在该基本概念中,图1的语音信号编码装置包括有一第一编码单元110,用来得到诸如一LPC(线性予测编码)余项之类的一短期予测余项,并且执行例如一谐波编码之类的正弦曲线分析编码;和一第二编码单元120,用来利用具有用于输入语音信号的相位传送的波形编码来执行编码。该第一编码单元110被用于对该输入信号的V(语言表达)部分编码,而第二编码单元120用于该输入信号的UV(未用语言表达)部分编码。
在该第一编码单元110中,使用了用来在该LPC余项中实施例如诸如谐波编码或多频带激励(MBE)编码之类的正弦曲线分析编码的一构成。在该第二编码单元120中,使用了例如代码激励线性予测(CELP)编码的一构成,CELP编码借助于具有使用了一利用合成的分析方法的一最佳矢量的闭环搜索的矢量量化。
在图1的例子中,被提供给一输入端101的一语音信号被传送到第一编码单元110的LPC反相滤波器111和LPC分析和量化单元113。从该LPC分析和量化单元113中得到的一LPC系数或一所谓的α参数被传送到LPC反相滤波器111。通过该LPC反相滤波器111,该输入语音信号的线性予测余项(LPC余项)被输出。如后面所述那样从该LPC分析和量化单元113输出一被量化的LSP(线性频谱对)的输出并传送到一输出端102。来自该LPC反相滤波器111的LPC余项被传送到正弦曲线分析编码部分114。
在该正弦曲线分析编码单元114中,进行一音调检测和一频谱包络幅度计算。另外,通过一V/UV判断单元115进行V(语言表达)/UV(未用语言表达)判断。来自正弦曲线分析编码部分114的频谱包络幅度数据被传送到一矢量量化单元116。作为该频谱包络的一矢量量化输出,来自该矢量量化单元116的一代码薄索引通过开关117被传送到输出端103。其为从该正弦曲线分析编码单元114所提供的音调分量数据的一音调数据通过一音调变换单元119和一开关118被传送到输出端104。自V/UV判断单元115输出的V/UV判断被传送到输出端105,并且作为其控制信号传送到开关117和118。在上述语言表达(V)声音时间,选择上述的索引和音调并分别从输出端103和104输出。
与接收到一音调变换命令的基础上,该音调变换单元119根据该命令通过计算处理而改变该音调数据并进行音调变换。其详细过程将在下面说明。
在该矢量量化单元116中的矢量量化的时间,在该频率轴上相应于有效频带的一数据块(block)的幅度数据被进行如下的处理。关于从在该块中的尾部数据到在该块中的标题数据的插入数据的这种虚数据的一适当数,或关于延伸该尾部数据和标题数据的这种虚数据的一适当数被加到该尾部和标题。该数据数被这样扩展到NF。此后,获取该频带限制型的Os倍(例如,8倍)的过取样以得到与Os倍一样多的幅度数据。Os倍的幅度数据((mMX+1)×Os幅度数据)被线性插入并因而被扩展成更多数据,即,NM(例如,2048)数据。该NM数据被变烯,因而被转换为一固定数M(例如,44)数据,并且随后进行矢量量化。
在这个例子中,第二编码单元120具有-CELP(代码激励线性予测)编码结构。来自一噪声代码薄121的一输出在一加权合成滤波器122中进行合成处理。所得结果的被加权和合成的语音被送到一减法器123。所得结果的被加权和合成的语音和通过一听觉加权滤波器125所得到的由输入端101所提供的该语音信号的语音之间的一误差被输出。这个误差被传送到一距离计算电路124并在其内进行一距离计算。在该噪声代码薄121中对这样一误差为极小值的矢量进行搜索。该时间轴波形的矢量量化是利用“边合成边分析”的方法和闭环搜索来进行的。这个CELP编码被用于编码如上所述的未用语言表达部分。当从该V/UV判断单元115提供的该V/UV判断结果是未用语言表达(UV)声音时则通过一被接通的开关127,从该噪声代码薄121作为UV数据而被提供的一代码薄索引从输出端107被输出。
参见图2,将说明用来对由图1的语音信号编码装置所编码的语音编码数据进行译码的一语音信号译码装置的基本构成。
在图2中,自输出端102所提供的作为图1所述的该LSP(线性频谱对)的量化输出的代码薄索引被输入到输入端202。从图1的输出端103、104和105的输出,即,作为包络量化输出所得到的该索引、音调、和V/UV判断输出被分别输入到输入端203,204和205。作为用于该UV(未用语言表示)声音的数据的自图1的输出端所提供的索引被输入到一输入端207。
作为LPC余项的频谱包络量化输出而提供给输入端203的该索引被传送到一逆矢量量化器212,在其内进行逆矢量量化,并随后传送给一数据转换单元270。来自输入端204的音调数据通过一音调转换单元215被提供给数据转换单元270。来自数据转换单元270的与相应于该LPC余项的频谱包络的予置音调以及与所改变的音调数据一样多的幅度数据被传送到一语言表达声音合成单元211。当接收一音调转换命令时,根据该命令通过计算处理该音调转换单元215变化该音调数据并进行音调转换。其详细过程将在后面说明。
通过使用该正弦曲线合成该语言表示合成单元合成该语言表示部分的LPC(线性予测编码)余项。从输入端205输出的V/UV判断还被加到该语言表示合成单元211。由该语言表示合成单元211提供的该语言表示声音的LPC余项被传送到一LPC合成滤波器214。来自输入端207的该UV数据的索引被传送到一未用语言表示合成单元220,在其内通过参考该噪声代码薄而输出未用语言表示的LPC余项。这个LPC余项还被传送到该LPC合成滤波器214。在该LPC合成滤波器214中,语言表示部分的LPC余项和未用语言表示部分的LPC余项被独自地分别进行LPC合成处理。另外,该语言表示部分的LPC余项和未用语言表示部分的LPC余项之和可进行PLC合成处理。这里,来自输入端202的LSP索引被传送到LPC参数再生单元213,从其中输出该LPC的α参数并传送到LPC合成滤波器214。在该LPC合成滤波器214中通过LPC合成所得到的一语音信号从输出端201被输出。
现在参照图3来说明图1中所示的该语音信号编码装置的更详细构成。在图3中,相应于图1的部件的部件由相同的标号表示。
在图3所示的该语音信号编码装置中,输入端101所提供的一语音信号在一高通滤波器(HPF)109中进行滤波处理以除去不必要频段的信号。之后,该语音信号被传送到LPC(线性予测编码)分析和量化单元113的一LPC分析电路132和LPC反相滤波器电路111。
该LPC分析和量化单元113的LPC分析电路132应用一通过所取得的输入信号波形的256个取样的长度作为一数据块的虚(Hamming)窗口,并且通过自动一对射变换方法得到一线性予测系数,即所谓的α参数。成为数据输出的该单元的成帧间隔时间约为160个取样。例如,当一取样频率fs为8KHz时,一帧间隔时间是160个取样,即20msec。
来自LPC分析电路132的该α参数被传送到-α→LSP转换电路133,并被转换成一线性频谱对(LSP)参数。作为一直接型滤波器的α参数被转换为例如10,即5对LSP参数。该转换是通过使用Newton-Raphson方法或类似方法来实施的。实施转换到LSP参数是由于在插入特性中该LSP参数更优于α参数。
来自α→LSP转换电路133的该LSP参数在一LSP量化器134中进行矩阵量化或矢量量化。这时,在得出两帧之间的差之后可实施该矢量量化,或多个帧可集中地进行矩阵量化。这里,20msec可规定为一帧。每一20msec所计算的LSP参数被用于二个帧的控制并进行矩阵量化和矢量量化。
来自LSP量化器的一量化输出,即LSP量化的索引,通过102端被输出。并且被量化的LSP矢量被传送到一LSP插入电路136。
该LSP插入电路136每20msec或40msec插入该被量化的LSP矢量,并将速率增加至8倍。换句话说,每2.5msec该LSP矢量被更新。现在说明其原因。当利用谐波编码/译码方法分析和合成该余项波形时,该合成波形的包络变成一非常缓慢倾斜和平滑的波形。因此,如果每20msec该LPS系数突然变化,则有时出现allophone。通过每2.5msec使该LPS系数逐渐地变化,则可防止出现这种allophone。
为了利用在2.5msec时这样被插入和被提供的LSP矢量来执行该输入语音的反相滤除,一LSP→α转换电路137将LPS参数转换为一α参数,这个α参数是例如接近第10阶直接型滤波器的一系数。LSP→α转换电路137的输出被传送到LPC反相滤波器电路111。在该LPS逆滤波电路111中,通过使用每2.5msec所更新的α参数实施逆滤除处理并得到一平滑输出。该LPS反相滤波器111的输出被传送到正弦曲线分析编码单元114,或具体的谐波编码电路的正交变换电路145,诸如-DFT(离散傅里叶变换)电路。
来自LPC分析和量化单元113的LPC分析电路132的α参数被传送到听觉感觉加权滤波器计算电路139以得到用于听觉感觉加权的数据。该加权数据被传送到后面所述的听觉感觉加权矢量量化器116、和第二编码单元120的听觉感觉加权滤波器125和听觉感觉加权合成滤波器122。
在诸如谐波编码电路等之类的正弦曲线分析编码单元114中,利用谐波编码的方法来分析该LPC反相滤波器111的输出。换句话说,实施音调检测、每个谐波的幅度Am的计算、和用语言表达(V)/未用语言表达的判断,通过量纲变化随该音调或幅度Am而变化的谐波的包络数变成一固定数。
在图3中所示的该正弦曲线分析编码单元114的具体例子中,假定是普通的谐波编码。但是,特别是在-MBE(多频带激励)编码的情况中,是假定在相同时间(在相同块或帧内)在每一频域中,即每一频带,存在有一用语言表示部分和一未用语言表示部分的条件下进行建立的模型。在另外的谐波编码操作中,进行在一数据块或一帧中的语音是用语言表示的还是未用语言表示的判断。在应用于该MBE编码的情况中,在随后的说明中关于在每一帧中的V/UV,“对于一帧的UV”意指所有频段均为UV。
图3中的该正弦曲线分析编码单元114的一开环音调搜索单元141被提供有来自输入端101的输入语音信号。一过零计数器142被提供有来自HPF(高通滤波器)109的信号。正弦曲线分析编码单元114的该正交变换电路145被提供有来自LPC反相滤波器111的LPC余项或线性予测余项。在该开环音调搜索单元141中,求出该输入信号的LPC余项,并进行通过使用一开环的比较粗略的搜索。所析取的近似的音调数据被传送到一高精度音调搜索单元146,并且在其中利用一后面将要说明的一闭环进行一高精度音调搜索(一精细的音调搜索)。除了该近似的音调数据之外,从该开环音调搜索单元141中还输出通过对乘以该幂LPC余项的自动校正的最大值进行标准化而得到的被标准化的自动校正最大值r(p),并传送到该V/OV(用语言表示/未用语言表示)判断单元115。
在该正交变换电路145中,进行诸如DFT(离散傅里叶变换)之类的正交变换处理。在时间轴上的LPC余项被转换成在频率轴上的频谱幅度数据。该正交变换电路145的输出被传送到高精度音调搜索单元146和用来评价该频谱幅度和包络的一频谱评价单元146。
该高精度(精细的)音调搜索单元146被提供有通过开环音调搜索单元141所析取的比较粗糙的不精确的音调数据,并且例如对在正交变换单元145中在频率轴上的数据进行DFT处理。在该高精度音调搜索单元146中,环绕具有0.2至0.5阶段值的不精确音调数据值给出了正页几个取样的摆动,并且实施将不精确音调数据值变成具有一最佳十进制点(浮点)的精细音调数据的值。这时,所谓的由合成方法所作的分析被用作为精细搜索的技术,并且选择该音调以便使被合成的幂频谱最接近于原始声音的幂频谱。利用这样一个闭环从高精度音调搜索单元146得到该音调数据,该音调数据通过音调转换单元119和开关118被传送到输出端104。在需要该音调转换的情况中,通过在后面将要说明的在该音调转换单元119中的处理而实施该音调转换。
在该频谱评价单元148中,根据该频谱幅度和作为LPC余项的正交变换输出而得到的音调来评价是它们的集合的每一谐波的幅度和一频谱包络,并传送到高精度音调搜索单元146、该V/UV(用语言表示/未用语言表示)判断单元115、和听觉感觉加权矢量量化器116。
根据该正交变换电路146的输出、来自该高精度音调单元146的最佳音调、来自该频谱评价单元148的频谱幅度数据、来自该开环音调搜索单元141的被标准化的自动校正最大值r(p)、和来自该过零计数器142的过零计数,该V/UV(用语言表示/未用语言表示)判断单元115在该帧上实施V/UV判断。另外,在该MBE的情况中,对于每一频带该V/UV判断结果的边界位置还可用作为该V/UV判断的一个条件。来自V/UV判断单元115的判断输出通过输出端105而被输出。
在该频谱评价单元148的一输出部分或该矢量量化器116的一输入部分中,提供有多个数据转换单元(用来实施一种类型取样速率转换)。考虑到在该频率轴上分割的频带数和与依据该音调不同的数这样一个事实,所提供的数据转换单元的数决定了该包络固定的幅度数据1Am1的数。例如,如果假定有效频带延伸到3400HZ,则依据该音调将这个有效频带分隔8到63个频带。在这些频带的每一频带上所得到的幅度数据1Am1的数mMX+1还可在8到63的范围内变化。因此,在数据转换单元119的数中,该幅度数据的一可变数mMX+1被转换成一固定的数据数M,例如数据44。
被安置在该频谱评价单元148的输出部分或该矢量量化器116的输入部分的一幅度数据的固定数(例如44)或自数据转换单元的数所提供的包络数据被共同放置在被转换成一矢量的每一予置的数据数,例如数据44,并在该矢量量化器116中进行加权的矢量量化。该加权是由该听觉感觉加权滤波器计算电路139的输出所给出的。来自矢量量化器116的包络索引经过开关117从输出端103输出。在该加权矢量量化之前,使用一合适的漏泄系数可以相据由一予置的数据数所构成的矢量来求得一帧间差值。
现在说明第二编码单元120。该第二编码单元120具有一所谓的CELP(代码激励线性予测)编码构成,并且它特别用于编码该输入语音信号的未用语言表示部分。在这种用于未用语言表示部分的CELP编码构成中,相应于该未用语言表示声音的LPC余项的一噪声输出是来自该噪声代码薄的一典型输出,即,所谓的随机代码薄通过一增益电路126被传送到该听觉感觉加权合成滤波器122。在该加权合成滤波器122中,所输入的噪声进行LPC合成处理。所得结果的加权未用语言表示信号被传送到减法器123。该减法器123被提供有对由在听觉感觉加权滤波器125中通过HPF(高通滤波器)109自输入端101所提供的该语音信号所进行听觉感觉加权而得到一信号。将这个信号与自合成滤波器122所提供的信号之间的差或误差输出。这个误差被传送到距离计算电路124进行一距离计算。这样一个典型值的矢量作为由该噪声代码薄121所搜索的误差的最小值。利用通过合成方法和闭环搜索的分析实施时间轴波形的矢量量化。
作为来自使用该CELP编码构成的第二编码单元120的用于该UV(未用语言表示)的数据,一来自该噪声代码薄121的代码薄的形状索引和来自该增益电路126的代码薄的增益索引被输出。来自该噪声代码薄121的该UV数据的形状索引通过一开关127s被传送到一输出端107s。该增益电路126的该UV数据的增益索引通过开关127g被传送到一输出端107g。
开关127s和127g,以及开关117和118被控制,以便通过来自V/UV判断单元115的V/UV判断结果而进行接通/断开。当一当前被传送的帧的语音信号的V/UV判断结果是用语言表示(V)时,该开关117和118被接通。当一当前被传送的帧的语音信号是未用语言表示(UV)时,该开关127s和127g接通。
参见图4,来说明图2中所示的该语音信号译码装置的一更详细的构成。在图4中,相应于图2的部件的部件用相同标号来表示。
在图4中,输入端202提供有该LSP的矢量量化输出,即,相应于自图1和3的输出端102输出的所谓代码薄的索引。
该LSP的索引被传送到LSP参量再生单元213的一LSP逆矢量量化器231,在那里对LSP(线性频谱对)数据进行逆矢量量化,然后传送到LSP插入电路232和233,在那里进行LSP插入处理,并随后传送到LSP→α转换电路234和235。LSP插入电路233和LSP→α转换电路235是对于未用语言表示(UV)声音而提供的。在该LPC合成滤波器214中,用于用语言表示部分的LPC合成滤波器236和用于未用语言表示部分的LPC合成滤波器237是分开的。换句话说,在用语言表示部分和未用语言表示部分中LPC系数插入是独立进行的。在从用语言表示声音到未用语言表示声音的一过渡部分和从未用语言表示声音到用语言表示声音的一过渡部分中,用于具有完全不同特性的相互插入LSPs而引起的不良影响可因此而被避免。
图4的输入端203提供进行了加权矢量量化的频谱包络(Am)的代码索引数据,这个输入相应于从图1和3所示的译码器侧的端口103的输出。该输入端204提供有来自图1和3的端口104的音调数据。输入端205提供有来自图1和3的端口105的V/UV判断数据。
来自该输入端203的频谱包络Am的矢量量化索引数据被传送到逆矢量量化器212并在其内进行逆矢量量化。如上所述,被施以逆矢量量化的该包络的幅度数据的数被置为等于一固定数,例如,44。在数据的一数中实施转换以根据该音调数据得到一谐波数。从该逆量化器212传送到数据转换单元270的数据数可以保留该固定数或可以在该数据数中被转换。
通过音调转换单元215从输入端204向数据转换单元270提供该音调数据,并输出一被编码的音调。在该音调转换是必须的情况下,利用在后面将要说明的在该音调转换单元215中的处理来实施该音调转换。如同相应于来自数据转换单元270的该LPC余项的频谱包络的予置音调的许多幅度数据一样,被更改的音调数据被传送到该用语言表示合成单元211的正弦曲线合成电路215。
为了在该数据转换单元270中转换该LPC余项的频谱包络的幅度数据的数,各种插入方法都是可能的。在这些方法的一个例子中,相应于在该频率轴上的有效频带的一数据块的幅度数据进行如下的处理。关于从在该数据块中的尾部数据到在该数据块中的标头数据被加有这样的虚数据以使该数据数扩展到NF。或者位于该数据块的左端和右端(标头和尾部)的数据作为虚数据而被延伸。之后,实现该频带限制型的Os倍(例如,8倍)的过取样,以得到与Os倍一样多的幅度数据。对Os倍数的幅度数据((mMX+1)×Os)幅度数据)进行线性插入并且因而被扩展为更多的数据,即,NM(例如,2048)数据。该NM数据被变薄并因而被转换为与相应于予置音调一样多的M数据。
在该数据转换单元270中,仅仅谐波所在位置被变更而不改变该频谱包络的形状。因此,该音素保持不变。
作为在该数据转换单元270中的一个操作例子,现在说明在音调滞后的时间L被转换为Fx时一频率Fo=fs/L的情况。该fs是取样频率。例如,现在假设fs=8KHZ=8000HZ。
这时,该音调频率Fo=8000/L。直至4000HZ,n=L/2个谐波被保持。在典型语音频带的该3400HZ,保持有约(L/2)×(3400/4000)个谐波。通过上述在数据数中的转换或量纲转换而被转换为例如为44之类的一固定数,并随后进行矢量量化。
如果在该频谱的矢量量化之前得到当时的编码帧间差,则在逆矢量量化之后对该帧间差译码并在数据数中实施转换以得到频谱包络数据。
除了LPC余项的频谱包络幅度数据和来自该数据转换单元270的音调数据之外,上述来自输入端205的V/UV判断数据也被提供给正弦波形合成电路215。IPC余项数据从正弦曲线合成电路215输出并传送到一加法器218。
来自逆矢量量化器212的包络数据、来自输入端204的音调、和来自输入端205的V/UV判断数据被传送到用来计算用语言表示(V)部分的噪声总和的一噪声合成电路216。来自这个噪声合成电路216的一输出通过一加权累加电路217被传送到加法器218。如果输入到该语音LPC合成滤波器的激励是由该正弦曲线合成而产生的,则会呈现诸如男性谈话等之类充满低音调的鼻音的感,并且在一V(用语言表示)声音和-UV(未用语言表示)声音之间声音的质量突然改变而导致一种不自然的感觉。因此,对于用语言表示部分的LPC合成滤波器的输入或激励,根据语音编码数据,诸如音调、频谱包络幅度、在该帧中的最大幅度、和余项信号的电平等之类的有关参数被加到LPC余项信号的用语言表示部分。
从加法器218输出的一点和被传送到用于LPC合成滤波器214的用语言表示声音的合成滤波器236并进行LPC合成处理。所得结果的暂时的波形数据在一后置滤波器238V中对用语言表示声进行滤波处理,并随后传送到一加法器239中。
图4的输入端207s和207g分别提供有来自图3的输出端107s和107g的作为UV数据的形状索引和增益索引。该形状索引和增益索引被传送到未用语言表示合成单元220。来自端口207s的形状索引被传送到未用语言表示合成单元220的一噪声代码薄221。来自端口207g的增益索引被传送到增益电路222。从该噪声代码221读出的一典型值是相应于未用语言表示声音的予置增益的一噪声信号分量。在增益电路222中变成一予置增益的一幅度被传送到一窗口电路223中,并进行用来平滑所连接的用语言表示声音的窗口处理。
作为来自该未用语言表示合成单元220的输出,该窗口电路223的一输出被传送到LPC合成滤波器214的UV(未用语言表示)合成滤波器237,并且在该合成滤波器237中对该输入进行LPC合成处理,结果得到未用语言表示部分的暂时波形数据。在一未用语言表示后置滤波器238u中对未用语言表示部分的暂时波形数据进行滤波处理并随后传送到加法器239中。
在加法器239中,来自该用语言表示后置滤波器238v的用语言表示部分的暂时波形信号和来自未用语言表示后置滤波器238u的未用语言表示部分的暂时波形信号被共同相加。其和从输出端201输出。
在包含在参照图1和3所述的语音编码装置中的该音调转换单元119中实施音调转换处理和在包含在参照图2和现在将要说明的图4所述的语音译码装置中的该音调转换单元240中实施音调转换处理。本例的构成使得可在编码的时间和译码的时间上均可实施语音的音调转换。在希望在编码的时间上进行音调转换的情况下,相应的处理是在包含在语音编码装置中的音调转换单元119中实施的。在希望在译码的时间上进行音调转换的情况下,相应的处理是在包含在语音译码装置的该音调转换单元240中实施的。因此,如果或者语音编码装置或者语音译码装置具有该音调转换单元,则基本上可实施在本例中所述的音调转换处理。在编码的时间在该语音编码装置中进行了音调转换的语音信号可以在在译码的时间在该语音译码装置中进一步进行音调转换。
之后,将说明在该音调转换中所进行处理的详细过程。在包含在该语音编码装置中的音调转换单元119中所实施的音调转换处理和包含在该语音译码装置中的音调转换单元215中所实施的音调转换处理是基本相同的。在每一个转换单元119和240中,所提供的音调数据被进行转换处理。在本例中被提供给每一个音调转换单元119的音调数据是一如图1至4所述的音调滞(周期)。通过计算处理该音调滞后被转换为差值数据并实施音调转换。
至于该音调转换的具理处理过程,选择可被实现的9种处理状态,即后面所述的第一种处理至第9种处理。根据在该编码装置或该译码装置中所包含的在一控制器等中所实施的控制,设置这些处理状态中的一个状态。在下面表示它的周期的说明中以数字公式表示该音调。在该转换单元中的实际计算处理中,与谐波一样多的数据一起实施相应的处理。第一种处理
这种处理是通过一固定时间用来提高该输入音调的处理。将输入音调pch_in乘以一固定数K1来得到一输出音调pch_ouf。其计算可由下式(1)来表示。
pch_out==K1pch_in (1)
通过设置固定数K1的值以满足关系O<K1<1,可使该频率变高并可变为高音调的语音。通过设置固定数K1的值以满足关系K1>1,可使该频率变低并可变为低音调的语音。第二种处理
这种处理是用来给出与输入音调无关的固定的输出音调。一适当的予置固定数总是被置为等于输出音调pch_out。其计算由下式(2)表示。
pch_out=P2 (2)
通过这样给出的音调固定数,使转换为单调的仿真语言变为可能。第三种处理
这种处理是用来使得输出音调pch_out等于一适当的予置固定数P3和一具有适当的幅度A3和频率F3的一正弦波之和的处理。其计算由下式(3)来表示。
pch_out=P3+A3Sin(2πF3+t(n)) (3)
在该表示式3中,n是帧数,和t(n)是在该帧中的一离散时间并由下式(4)设置。
t(n)=t(n-1)+Δt (4)
通过这样将一正弦波加到一固定的恒定音调,则可将颤音加到仿真语音。第四种处理
这种处理是用来使得输出音调pch_put等于该输入音调Pch_in和一均匀的随机数[-A4,A4]之和的处理。其中算由下式(5)来表示。
Pc_out=Pch_in+V(n) (5)
这里,r(n)是在每一n帧时所设置的一随机数。对于每个处理帧,产生一均匀随机数[-A4,A4],并且实施相加处理。通过这样的处理,转换为一诸如一卡塔地响的语音之类的语音变成可能。第五种处理
这种处理是用来使得输出音调Pch_out等于该输入音调Pch_in和一具有适当的幅度A5和频率F5的一正弦波之和的处理。其计算由下式(6)表示。
Pch_out=Pch_in+A5 Sin(2πF5t(n)) (6)
在表示式6中,n是帧数,和t(n)在该帧中的离散时间并由上述表示式(4)所设置。通过实施这样的处理,可将卡塔地响的声音加到输入语音中。在这种情况中通过所提供的具有一小的值(即,将该周期变长)的频率F5,实施对带有上升和下降的语音的转换。第六种处理
这种处理是用来使得输出音调pch_out等于一适当的固定的P6减去输入音调Pch_in的处理。其计算由下式(7)表示。
Pch_out=P6-Pch_in (7)
通过实施这样的处理,该音调变化变为与输入语音的变化相反。实施例如对具有与普通情况的字尾相反的字尾的语音的转换。第七种处理
这种处理是用来使得输出音调Pch-out等于通过平滑(平均)具有一适当时间常数τ7(这里这个时间常数τ7是在0<τ<1的范围)的输入音调Pch_in所得到的-avg_och。其计算由下式(8)表示。
avg_pch=(1-τ7)avg_pch+τ7pch_in
Pch_out=avg_pch (8)
例如通过将τ7设置为0.05,20个过去的帧的平均值变为等于avg_pch并且它的值变为输出音调。通过这种处理,实施对即不上升也不下降和具有一松驰的感觉的语音的转换。第八种处理
在这种处理中,从输入音调Pch_in中减去通过平滑(平均)具有一适当的时间常数τ8(这个时间常数是在0<τ7<1的范围内)的输入音调pch_in所得到的-avg_pch。所得的差乘以一适当的因数K8(这里K8是一常数)。所得到的乘积作为一重点分量加到输入音调Pch_in以得到输出音调Pch_out。其计算由下式(9)表示。
avg_pch=(1-τ8)avg_pch+τ8 pch_in
Pch_out=Pch_in+1<8(Pch_in-avg_pch) (9)
通过这种处理,实施对这种将该重点分量加到输入语音的状态的音调转换。为了实现这种实施而转换到被调制的语音。
第九种处理
这是用来将输入音调Pch_in转换为在一音调表中所包含的最接近的固定的音调数据的映射处理,该音调表是在音调转换单元中予先准备的。在这种情况中,例如它可想象为准备数据具有相应于在该音调表中所包括的作为固定的音调数据的音乐标度的频率间隔,并且对具有接近类似该输入音调Pch_in的一音乐标度实施转换。
通过在该编码装置中所包含的音调转换单元119或在该译码装置中所包含的音调转换单元240中执行如上所述的第一至第九种处理中的一种音调转换处理,仅仅转换了在该译码的时间控制谐波数的音调数据。这样仅仅该音调可被简单地被转换而不改变语音的音素。
现在将参照图5和图6来说明前述的语音编码装置和音语译码装置的应用的例子。首先说明如图5中所述的应用到一无线电话装置(例如一便携式电话机)的一传输系统的该语音编码装置的一个例子。由一放大器302放大由一微音器301所控制的语音信号,由一模拟/数字变换器303转换为一数字信号,并传送到一语音编码单元304。这个语音编码单元304相应于参照图1和3所述的该语音编码装置。有必要时,在该编码单元304的一音调转换单元中(相应于图1和3的音调转换单元119)实施音调转换处理。每一个在该语音编码单元304中被编的数据作为该编码单元304的一输出信号被传送到一传输线编码单元305中。在该传输线编码单元305中,实施一所谓的通道编码处理。它的输出信号被传送到一调制电路306,在其中该输出信号被调制,并通过一数字/模拟变换器307和一高频放大器308传送到天线309,进行无线电传送。
图6示出了作为一无线电电话装置的接收系统的该语音译码装置的应用的一个例子。通过一高频放大器312来放大由天线311所接收的一信号,并通过一模拟/数字变换器313传送给一解调电路314。该解调信号被传送到一传输线译码单元315。在这个传输线译码单元315中,提取进行了通道译码处理和被传输的语音信号。被提取的语音信号被传送到一语音译码单元316。这个语音译码单元316相应于参照图2和4所述的语音译码装置。有必要时,在该编码单元316中所包含的一音调转换单元(相应于图2和4的该音调转换单元)中实施音调转换处理。由该语音译码单元316译码的语音信号作为译码单元316的输出信号被传送到一数字/模拟变换器317,在放大器318中进行模拟语音处理,然后被传送到一扬声器319,作为语音被放出。
当然,本发明也可应用于除这种无线电电话装置之外的装置。换句话说,本发明可应用于包括参照图1所述的该语音编码装置在内的和处理语音信号的各种装置,并且可应用于包括参照图3所述的该语音译码装置在内的和处理语音信号的各种装置。
另外,在一记录介质上(例如一光盘、一磁光盘、或一磁带等)记录有相应于在本例子的该音调转换单元119中所实施的处理的一处理程序的情况中,在其中所记录的处理程序用来执行参照图1和3所述的语音编码处理,并且从这个介质中读出的该处理程序是在一计算机装置等上被执行以进行编码,可进行类似的音调转换处理。相类似地,在一记录介质上记录有相应于在本例子的该音调转换单元240中所实施的处理的一处理程序的情况中,在其中所记录的处理程序用来执行参照图2和4所述的语音译码处理,并且从这个介质中读出的该处理程序是在一计算机装置等上被执行以进行译码,可进行类似的音调转换处理。
根据本发明的语音编码方法,通过所予置的计算处理来改变进行了正弦曲线分析编码的该语音编码数据的音调分量以实施该音调转换。其结果,能够仅仅精确地转换该音调并用简单的计算处理来实施编码而不改变输入语音的音素。
在这种情况中,为了使得谐波数等于一予置数而实施在数据数中的转换。其结果,根据该编码数据可简单地实施音调转换。
在实施在数据数中的这种转换的情况中,通过使用过取样计算的插入处理来实施在该数据数中的转换处理。其结果,可通过使用过取样计算的简单处理来实施在该数据数中的转换。
另外,在编码的时间实施音调转换的情况中,进行了正弦曲线分析编码的该语音编码数据的音调分量被乘以该予置的系数以实施该音调转换。其结果,例如这种音调转换处理使得该输入语音的音色改变成为可能。
另外,在编码的时间实施音调转换的情况中,进行了正弦曲线分析编码的该语音编码数据的音调分量被转换为一固定值并且总是被转换成一固定的音调。因此,例如该输入语音的音调可被转换为一单调的仿真语音。
另外,在转换所实施的这个固定音调的情况中,具有一予置频率的一正弦波的数据被附加到被转换的该固定音调的数据。其结果,例如,转换为一具有在作为中心的该固定音调的上部和下部摆动的一语音成为可能。
另外,在编码的时间实施音调转换的情况中,从一予置的固定值中减去进行了正弦曲线分析编码的语音编码数据的该音调分量以实施该音调转换。其结果,例如对一引起输入语音的字尾的声调等相反变化效果的音调的转换成为可能。
另外,在编码的时间实施音调转换的情况中,一予置的随机数被附加到进行了正弦曲线分析编码的该语音编码数据的音调分量以实施该音调转换。其结果,使该语音的声调等发生不规则变化的这样一音调的转换成为可能。
另外,在编码的时间实施音调转换的情况中,将具有一予置频率的正弦波的数据附加到通过利用正弦曲线分析编码所编码的该语音编码数据的音调分量并因而实施该音调转换。其结果,例如对通过将摆动附加到输入语音而得到的这样一语音的转换成为可能。
另外,在编码的时间实施音调转换的情况中,计算进行了正弦曲线分析编码的该语音编码数据的音调分量的平均值并且这个平均值被用作为进行了该音调转换的该语音编码数据。其结果,例如对从该输入语音上升和下降中所减少的语音的转换成为可能。
另外,在编码的时间实施音调转换的情况中,计算进行了正弦曲线分析编码的该语音编码数据的音调分量的一平均值并将该语音编码数据和该平均值之间的一差值附加到该语音编码数据以实施该音调转换。其结果,例如对在该输入语音的上升和下降中被强调和为此调制的一语音的转换成为可能。
在编码的时间实施音调转换的情况中,进行了正弦曲线分析编码的该语音编码数据的音调分量被转换成予先所准备的一音调转换表的数据并转换成在这个音调转换表中所设置的一等级的音调。其结果,例如关于将输入语音的音调标准化为一固定音乐标尺的一音调的转换成为可能。
根据本发明的语音译码方法,通过予置的计算处理来改变进行了正弦曲线分析编码的数据的音调分量。其结果,通过使用简单的计算处理仅仅该译码语音的音调可被精确地转换而该语音的音素没有改变。
在这情况中,该音调分量改变,并且随后对于谐波数实施来自一予置数的数据数中的转换。其结果,借助于所改变的音调分量而可简单地实施译码。
另外,在实施在该数据数的转换的情况中,同利用该过取样计算的插入处理一起实施数据转换处理的数。其结果,同利用该过取样计算的简单处理一起可实施在该数据数中的转换。
另外,在译码的时间实施音调转换的情况中,进行了正弦曲线分析编码的该语音编码数据的音调分量与一予置的系数相乘以实施该音调转换。其结果,通过这种音调转换处理例如改变该译码语音的音色质量成为可能。
另外,在译码的时间实施该音调转换的情况中,进行了该正弦曲线分析编码的该语音编码数据的音调分量被转换为一固定值并总是被转换为一固定音调。因此,例如该译码语音的音调可转换为单调的仿真语音。
另外,在对这个固定音调实施转换的情况中,具有一予置频率的一正弦波的数据被附加到被转换为该固定音调的数据中。其结果,例如转换一具有在作为中心的固定音调的上部和下部而摆动的语音成为可能。
另外,在译码的时间实施音调转换的情况中,从一予置的固定值中减去进行了正弦曲线分析编码的语音编码数据的音调分量以实施该音调转换。其结果,例如对一引起输入语音的字尾的声调等相反变化效果的音调的转换成为可能。
另外,在译码的时间实施音调转换的情况中,一予置的附机数被附加到进行了正弦曲线分析编码的该语音编码数据的音调分量以实施该音调转换。其结果,例如使该被译码的语音的声调等发生不规则变化的这样一音调的转换成为可能。
另外,在译码的时间实施音调转换的情况中,将具有一予置频率的正弦波的数据附加到通过利用正弦曲线分析编码所编码的该语音编码数据的音调分量并因而实施该音调转换。其结果,例如对通过将摆动附加到输入语音而得到的这样一语音的转换成为可能。
另外,在译码的时间实施音调转换的情况中计算进行了正弦曲线分析编码的该语音编码数据的一平均值并且这个平均值被作为进行了该音调转换的语音编码数据。其结果,例如对在该译码语音的上升和下降中所减少的语音的转换成为可能。
另外,在译码的时间实施音调转换的情况中,计算进行了正弦曲线分析编码的该语音编码数据的音调分量的一平均值并将该语音编码数据和该平均值之间的一差值附加到该语音编码数据以实施该音调转换。其结果,例如对在该译码的语音的上升和下降中被强调和为此调制的一语音的转换成为可能。
在译码的时间实施音调转换的情况中,进行了正弦曲线编码的该语音编码数据的音调分量被转换成予先准备的一音调转换表的数据并且转换为在这个音调转换表中设置的一等级的音调。其结果,例如关于将被译码的输入语音的音调标准化为一固定音乐标尺的音调的转换成为可能。
本发明的该语音编码装置具有用来转换在该正弦曲线分析编码装置中进行了分析和编码的该音调分量的音调转换装置。因此,在利用进行了正弦曲线分析编码的该数据的音调分量的转换处理的一简单处理构成中,仅仅对音调进行精确地转换和实施编码而不改变该输入语音的音素成为可能。
在这种情况中,为了使得谐波数等于一予置数而实施在数据数中的转换。其结果,在一简单的处理构成中可实施编码。另外,根据该编码数据可简单地实施音调转换。
另外,通过使用该频带限制过取样滤波器的插入处理实施在该数据数中的转换处理。其结果,在一使用过取样滤波器的简单处理构成中可实施在该数据数中的转换。
根据本发明的该语音译码装置,通过音调转换装置转换进行了正弦曲线分析编码的数据的音调分量,并且根据线性予测余项通过利用进行了正弦曲线分析编码的转换数据和编码数据在该语音译码装置中实施译码处理。因此,在一简单的处理构成中,仅仅精确地转换该译码语音的音调而不改变该语音的音素成为可能。
在这种情况中,对于该谐波数实施在来自一予置数的数据数中的转换。其结果,为了仅仅转换该谐波数在一简单的处理构成中可实施该转换的音调的译码。
另外,通过利用该频带限制过取样滤波器的插入处理实施在该数据数中的转换处理。其结果,在一使用过取样滤波器的简单的处理构成中可实施在译码时间的在数据数中的转换。
根据本发明的该电话装置具有用来转换在该正弦曲线分析编码装置中进行了分析和编码的数据的音调分量的音调转换装置。因此,在一简单的构成中,容易地对被传送到一所希望的状态的该语音数据的音调分量进行转换成为可能。
根据本发明的该音调转换方法,通过在一语音信号上实施正弦曲线分析和编码所得到的一音调分量的数据乘以一予置系数以实施该音调转换。其结果,例如关于改变该输入语音的音色质量的这种音调转换可容易的被实施。
另外,根据本发明的该音调转换方法,通过在一语音信号上实施正弦曲线分析和编码所得到的一音调分量的数据被转换为一固定值并且总是被转换为一固定音调。因此,例如该输入语音的音调可被转换成一单调的仿真语音。
另外,根据本发明的该音调转换方法,从一予置的固定值中减去通过该正弦曲线分析和编码而被编码的语音编码数据以实施该音调转换。其结果,例如对一引起输入语音的字尾的声调等相反变化效果的音调的转换成为可能。
另外,根据本发明的该介质,一用来转换通过正弦曲线分析编码而被编码的该语音编码数据的音调分量的处理程序被记录在一在其内记录有一编码程序的介质中。因此,通过执行这个处理程序仅仅精确地转换该音调和实施该编码而不改变该输入语音的音素成为可能。
另外,根据本发明的介质,一用来转换进行了正弦曲线分析编码的数据的音调分量的音调转换处理程序被记录在其内记录有编码程序的介质中。因此,通过这个处理程序仅仅精确地转换该译码语音的音调而不改变该语音的音素成为可能。
参照附图已对本发明的各最佳实施例作了说明,但应了解的是本发明并不限于上述的实施例,本领域的普通技术人员在不违反在所附权利要求中所规定的本发明的精神或范围的前提下可对本发明进行各种变化和改进。
Claims (36)
1、一种包括有在一予置的编码单元中在一时间轴上分隔一语音信号的步骤,在每一分隔的编码单元中分隔所得到的一线性予测余项的步骤,和根据所述线性予测余项对于一语音信号实施正弦曲线分析编码的步骤的语音编码方法,包括有步骤:
通过一予置的计算步骤改变对于一语音信号进行了所述正弦曲线分析编码的语音数据的一音调分量。
2、根据权利要求1的语音编码方法,
其中通过谐波编码执行一编码处理,并且实施用来使得谐波数如同一予置数的在一数据数中的转换。
3、根据权利要求2的语音编码方法,
其中在一数据数中的所述转换处理是通过使用一过取样计算的插入处理而实施的。
4、根据权利要求1的语音编码方法,
其中所述进行了正弦曲线分析编码的该语音编码数据的音调分量由一予置系数相乘以实施该音调转换。
5、根据权利要求1的语音编码方法,
其中所述进行了正弦曲线分析编码的该语音编码数据的所述音调分量被转换为一固定值并且总是转换成一固定音调。
6、根据权利要求5的语音编码方法,
其中将一具有一予置频率的正弦波数据附加到所述固定音调的数据中。
7、根据权利要求1的语音编码方法,
其中从一予置固定值中减进行了正弦曲线分析编码的该语音编码数据的所述音调分量以实施该音调转换。
8、根据权利要求1的语音编码方法,
其中一予置的附机数被附加到进行了正弦曲线分析编码的该语音编码数据的所述音调分量中以实施该音调转换。
9、根据权利要求1的语音编码方法,
其中一具有一予置频率的正弦波的数据被附加到进行了所述正弦曲线分析编码的该语音编码数据的所述音调分量中以实施该音调转换。
10、根据权利要求1的语音编码方法,
其中计算进行了正弦曲线分析编码的语音编码数据的所述音调分量的一平均值并且所述平均值被用作进行了该音调转换的语音编码数据。
11、根据权利要求1的语音编码方法,
其中计算进行了正弦曲线分析编码的该语音编码数据的所述音调分量的一平均值并且将所述语音编码数据和所述平均值之间的一差值附加到所述语音编码数据中以实施该语音转换。
12、根据权利要求1的语音编码方法,
其中进行了正弦曲线分析编码的该语音编码数据的所述音调分量被转换为一予先准备的一音调转换表的数据并转换为在所述音调转换表中所设置的一等级的音调。
13、在一语音译码方法中,其中一语音信号根据在一时间轴上的一予置编码单元的线性予测余项数据和进行了正弦曲线分析编码的数据被译码,
一语音译码方法包括步骤:
通过一予置的计算处理改变进行了所述正弦曲线分析编码的一音调分量。
14、根据权利要求13的语音译码方法,
其中通过一予置的计算处理改变所述音调分量并且随后实施用来在一编码处理中使用谐波编码使得谐波数如同一予置数的转换。
15、根据权利要求14的语音译码方法,
其中通过使用过取样计算的一插入处理实施在一数据数中的所述转换处理。
16、根据权利要求13的语音译码方法,
其中进行了正弦曲线分析编码的该语音编码数据的所述音调分量被乘以一予置的系数以实施该音调转换。
17、根据权利要求13的语音译码方法,
其中进行了正弦曲线分析编码的该语音编码数据的所述音调分量被转换为一固定值并总是被转换为一固定音调。
18、根据权利要求17的语音译码方法,
其中将一具有一予置频率的正弦波附加到所述固定音调的数据中。
19、根据权利要求13的语音译码方法,
其中从一予置的固定值中减去进行了正弦曲线分析编码的该语音编码数据的所述音调分量以实施该音调转换。
20、根据权利要求13的语音译码方法,
其中一予置的随机数据附加到进行了正弦曲线分析编码的该语音编码数据的所述音调分量中以实施该音调转换。
21、根据权利要求13的语音译码方法,
其中将一具有一予置频率的正弦波的数据附加到进行了正弦曲线分析编码的该语音编码数据的所述音调分量中以实施该音调转换。
22、根据权利要求13的语音译码方法,
其中计算进行了正弦分析编码的该语音编码数据的所述音调分量的一平均值并且所述平均值被用作为进行了音调转换的该语音编码数据。
23、根据权利要求13的语音译码方法,
其中计算进行了正弦分析编码的该语音编码数据的所述音调分量的平均值并且将所述语音编码数据和所述平均值之间的一差值附加到所述语音编码数据以实施该音调转换。
24、根据权利要求13的语音译码方法,
具中进行了正弦曲线分析编码的该语音编码数据的所述音调分量被转换为一予先准备的一音调转换表的数据并且转换为在所述音调转换表中所设置的一等级的音调。
25、一种语音编码装置包括:
用来在一予置的编码单元中在一时间轴上得到一输入语音信号的一线性予测余项的一线性予测余项检测装置;
用来在由所述线性予测余项检测装置所检测的所述线性予测余项上实施一正弦分析编码的一正弦曲线分析编码装置;和
用来转换通过所述正弦分析编码装置进行了分析编码的一音调分量的一音调转换装置。
26、根据权利要求25的语音编码装置,
其中通过所述正弦曲线分析编码装置实施用来根据编码到一予置数的谐波来设置一谐波数的在一数据数中的转换。
27、根据权利要求26的语音编码装置,
其中通过使用一频带限制型过取样滤波器的一插入处理实施在一数据数中的所述转换处理。
28、用来根据在一予置的编码单元中的一时间轴上的线性预测余项数据和进行了一正弦曲线分析编码的数据来译码一语音信号的一语音译码装置,包括:
一用来转换进行了所述正弦曲线分析编码的数据的音调分量音调转换装置;和
一用来通过利用进行了所述正弦曲线分析编码和由所述音调转换装置所转换的所述数据以及所述线性予测余项数据实施一译码处理的语音译码装置。
29、根据权利要求28的语音译码装置,
其中根据所述被转换的音调分量实施用来设置根据编码到一予置数所使用的一谐波数的在一数据数中的转换。
30、根据权利要求29的语音译码装置,
其中通过使用一频带限制型过取样滤波器的一插入处理来实施在一数据数中的所述转换处理。
31、一种电话装置包括:
一用来在一予置的编码装置中的一时间轴上得到一输入语音信号的一线性予测余项的线性予测余项检测装置;
一用来在由所述线性予测余项检测装置所检测的所述线性予测余项上实施一正弦曲线分析编码的正弦曲线分析编码装置;
一用来转换通过由所述正弦曲线分析编码装置进行了分析编码的数据的一音调分量的音调转换装置;和
一用来将进行了分析编码和由所述音调转换装置进行了音调转换的所述数据以及所述线性予测余项数据传送到一予置的传输线的传输装置。
32、一种音调转换方法包括有步骤:
将由在一语音信号上实施正弦曲线分析和编码所得到的一音调分量的数据乘以予置的系数以实施一音调转换。
33、一种音调转换方法包括步骤:
将由在一语音信号上实施一正弦曲线分析和编码所得到的一音调分量的数据转换为一固定值以总是被转换为一固定音调。
34、一种音调转换方法包括步骤:
从一予置的固定值中减去由在一语音信号上实施一正弦曲线分析和编码所得到的一音调分量的数据以实施一音调转换。
35、一种在其中记录有一程序的介质,该介质实施;
一用来在一予置的编码单元中的一时间轴上分隔一输入语音信号的过程;
一用来在所分隔的每一编码单元上检测一线性予测余项的过程;和
一用来在所述线性予测余项上实施一正弦曲线分析编码的过程,
所述介质被安置在其中记录一用来转换进行了所述正弦曲线分析编码的语音编码数据的一音调分量的处理程序。
36、一种在其中记录有一处理程序的介质,该介质根据在一予置编码单元中的一时间轴上的线性予测余项数据和进行了正弦分析编码的数据实施对一语音信号的译码,
所述介质被安置在其中记录有一用来转换进行了所述正弦曲线分析编码的数据的一音调分量的音调转换处理程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8308259A JPH10149199A (ja) | 1996-11-19 | 1996-11-19 | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
JP308259/96 | 1996-11-19 | ||
JP308259/1996 | 1996-11-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1193159A true CN1193159A (zh) | 1998-09-16 |
CN1161750C CN1161750C (zh) | 2004-08-11 |
Family
ID=17978863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB971264813A Expired - Fee Related CN1161750C (zh) | 1996-11-19 | 1997-11-19 | 语音编码译码方法和装置、电话装置、音调变换方法和介质 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5983173A (zh) |
EP (1) | EP0843302B1 (zh) |
JP (1) | JPH10149199A (zh) |
CN (1) | CN1161750C (zh) |
DE (1) | DE69713712T2 (zh) |
SG (1) | SG55415A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1293534C (zh) * | 2001-01-16 | 2007-01-03 | 皇家菲利浦电子有限公司 | 参数编码器和参数编码方法及参数译码器和参数译码方法 |
CN111868821A (zh) * | 2018-03-13 | 2020-10-30 | 尼尔森(美国)有限公司 | 从媒体信号提取与音调无关的音色属性的方法和装置 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1071081B1 (en) * | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
US6278385B1 (en) * | 1999-02-01 | 2001-08-21 | Yamaha Corporation | Vector quantizer and vector quantization method |
DE60018246T2 (de) * | 1999-05-26 | 2006-05-04 | Koninklijke Philips Electronics N.V. | System zur übertragung eines audiosignals |
FI116992B (fi) * | 1999-07-05 | 2006-04-28 | Nokia Corp | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
JP4757971B2 (ja) * | 1999-10-21 | 2011-08-24 | ヤマハ株式会社 | ハーモニー音付加装置 |
JP4509273B2 (ja) * | 1999-12-22 | 2010-07-21 | ヤマハ株式会社 | 音声変換装置及び音声変換方法 |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
DE60305944T2 (de) * | 2002-09-17 | 2007-02-01 | Koninklijke Philips Electronics N.V. | Verfahren zur synthese eines stationären klangsignals |
KR100460411B1 (ko) * | 2002-12-28 | 2004-12-08 | 학교법인 광운학원 | 목소리 신호의 억양조절에 의한 부드러운 소리의 전화기방식 |
JP2007114417A (ja) * | 2005-10-19 | 2007-05-10 | Fujitsu Ltd | 音声データ処理方法及び装置 |
US20070147496A1 (en) * | 2005-12-23 | 2007-06-28 | Bhaskar Sherigar | Hardware implementation of programmable controls for inverse quantizing with a plurality of standards |
JP4294724B2 (ja) * | 2007-08-10 | 2009-07-15 | パナソニック株式会社 | 音声分離装置、音声合成装置および声質変換装置 |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
WO2010035438A1 (ja) * | 2008-09-26 | 2010-04-01 | パナソニック株式会社 | 音声分析装置および音声分析方法 |
US20110196673A1 (en) * | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
US5327518A (en) * | 1991-08-22 | 1994-07-05 | Georgia Tech Research Corporation | Audio analysis/synthesis system |
US5305421A (en) * | 1991-08-28 | 1994-04-19 | Itt Corporation | Low bit rate speech coding system and compression |
KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
JP4132109B2 (ja) * | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
US5729694A (en) * | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
-
1996
- 1996-11-19 JP JP8308259A patent/JPH10149199A/ja active Pending
-
1997
- 1997-11-14 US US08/970,763 patent/US5983173A/en not_active Expired - Fee Related
- 1997-11-17 EP EP97309224A patent/EP0843302B1/en not_active Expired - Lifetime
- 1997-11-17 DE DE69713712T patent/DE69713712T2/de not_active Expired - Fee Related
- 1997-11-17 SG SG1997004067A patent/SG55415A1/en unknown
- 1997-11-19 CN CNB971264813A patent/CN1161750C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1293534C (zh) * | 2001-01-16 | 2007-01-03 | 皇家菲利浦电子有限公司 | 参数编码器和参数编码方法及参数译码器和参数译码方法 |
CN111868821A (zh) * | 2018-03-13 | 2020-10-30 | 尼尔森(美国)有限公司 | 从媒体信号提取与音调无关的音色属性的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP0843302A3 (en) | 1998-08-05 |
DE69713712T2 (de) | 2003-02-27 |
JPH10149199A (ja) | 1998-06-02 |
SG55415A1 (en) | 1998-12-21 |
CN1161750C (zh) | 2004-08-11 |
EP0843302B1 (en) | 2002-07-03 |
DE69713712D1 (de) | 2002-08-08 |
EP0843302A2 (en) | 1998-05-20 |
US5983173A (en) | 1999-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1161750C (zh) | 语音编码译码方法和装置、电话装置、音调变换方法和介质 | |
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
CN1154086C (zh) | Celp转发 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1065381C (zh) | 数字音频信号编码和/或译码方法 | |
CN1154283C (zh) | 编码方法和装置以及解码方法和装置 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
JP5037772B2 (ja) | 音声発話を予測的に量子化するための方法および装置 | |
CN1123866C (zh) | 一种语音编/解码方法和装置 | |
CN1121683C (zh) | 语音编码 | |
CN1099777C (zh) | 数字信号的编码装置、解码装置和编码方法 | |
CN1183685C (zh) | 用于熵编码信号量化变换系数的系统和方法 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1334952A (zh) | 用于改善编码通信信号性能的编码增强特性 | |
CN1159691A (zh) | 用于声频信号线性预测分析的方法 | |
CN1302459C (zh) | 用于编码和解码非话音语音的方法和设备 | |
CN101061535A (zh) | 用于人工扩展语音信号的带宽的方法和装置 | |
CN1922659A (zh) | 编码模式选择 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1942928A (zh) | 音频信号编码 | |
CN1155725A (zh) | 语音编码方法和装置 | |
CN1486486A (zh) | 用于编码和解码声学参数的方法、设备和程序及用于编码和解码语音的方法、设备和程序 | |
CN1282952A (zh) | 语音编码方法和装置,输入信号判别方法,语音解码方法和装置以及程序提供介质 | |
WO2006051446A2 (en) | Method of signal encoding | |
CN1849648A (zh) | 编码装置和译码装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |