CN1048278A - 具有矢量激励源的数字语言编码器 - Google Patents
具有矢量激励源的数字语言编码器 Download PDFInfo
- Publication number
- CN1048278A CN1048278A CN90103020A CN90103020A CN1048278A CN 1048278 A CN1048278 A CN 1048278A CN 90103020 A CN90103020 A CN 90103020A CN 90103020 A CN90103020 A CN 90103020A CN 1048278 A CN1048278 A CN 1048278A
- Authority
- CN
- China
- Prior art keywords
- signal
- pumping
- code
- feature
- candidate excitation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 title abstract description 26
- 230000005284 excitation Effects 0.000 claims abstract description 27
- 238000005086 pumping Methods 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 abstract description 4
- 239000002131 composite material Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
在一个利用矢量激励的矢量激励源数字或语言
编码器中,备选激励源(111、121)认为是与某些音调
参数无关的,一旦选定一个具体的激励源后,可使音
调参数唯一地最佳化,从而获得语言质量的全面改
进。
Description
本发明涉及语言编码器,具体涉及采用矢量激励源的数字式语言编码器。
在本领域内,语言编码器是众所周知的。一些语言编码器将语音样值转换为数字化的代码,然后通过采用线性预测编码法显示出语言频谱信息。另一些语言编码器通过提供一个与原来的语音信号有关的激励信号来改进普通的线性预测编码技术。本发明人早先在美国专利Us.4817157中已叙述过一种具有改进的矢量激励源的数字式语言编码器,其中,可查阅一种激励矢量代码簿来选取一个最适合于可资利用信息的激励信号。由此可提供出一个严密代表原话音信号、复原的语言信号。
通常,如果有大量可用的备选激励矢量可用作激励源,则由此得出的译码语言信号将更严密地代表原来的未编码的语言信号。然而,这样来提高性能一般会导致代码簿规模的增大,并且通常会增加处理的复杂性和数据的速率。
因此,需要有采用矢量激励信号的一种数字式语言编码器。其中,对于给定规模的代码簿而言,可在最小限度地增加复杂性和基本上不增加数据率的情况下使译码的语言信号的质量实质上达到最高。
通过配置以这里公布的具有改进的语言质量的、带有矢量激励源的数字式语言编码器,上述的需要和其它要求基本上能得到满足。根据本发明,在对一个信号样值例如一个语言样值进行编码时,编码器首先确定这个语言样值的音调时间(pitch period)参数。部分地依赖于这个音调时间参数,可以确定出一个具体的编码的激励信号,而与音调滤波器系数无关。因此,可使得用于那个具体语言样值的音调滤波器系数最优化。这种方法允许在取定备选的激励信号时,不需相应地增加处理的复杂性或数据率。
在一个实施例中,确定编码的激励信号时基本上与任何音调信息无关。具体地说,对于由代码簿提供的备选激励信号进行处理,以便基本上消除至少部分地可由一个参数分量来代表的那些分量,而该参考分量至少部分地与中间音调矢量有关联。更具体地说,将与中间音调矢量有关的矢量分量从备选激励信号中除掉(这一步骤称为正交化)。然后,经正交化的备选激励信号与未编码的语言样值进行比较,以识别出最佳地代表这个具体的语言样值的备选激励信号。包括音调滤波器系数在内的音调信息随后可得到优化,以最佳地适合于选定的激励信号,借此产生出该语言信号的全面优化的编码信号。
在另一个实施例中,配置了一个备选激励信号第二代码簿。其中,使用两个激励信号来代表语言样值。第一激励信号可按上述方法予以选定,第二激励信号可按类似的方法选定。其中,备选的第二激励信号重要的是与中间音调矢量和先前选定的第一激励信号两者相正交。
图1示出本发明的方框图;
图2示出代表本发明一个特定的矢量图。
本发明的实施,可应用一种合适的数字信号处理器例如莫托罗拉公司的DSP 56000系列的器件来组成语言编码器。这样的DSP器件实施例的运算功能示于图1的等效电路中方框图。
将音调时间参数(101)(它按先有的技术确定出)提供给包含有音调滤波器一部分的一个音调滤波器组(102)。由此得出的合成信号(103)包含有一个中间音调矢量,它加到第一乘法器(104)和两个正交化处理器(106和107)上。第一乘法器(104)的作用是将该合成信号(103)乘以一个音调滤波器系数(108),以产生出一个音调滤波器输出(109)。音调滤波器系数(108)的选取在下面详述。
第一代码簿(111)包含有一组基本矢量,它们可以线性组合起来以形成许多合成的激励信号。根据所用的存贮器的大小和适合于应用的其它因素合成的激励信号的可能个数例如可在64至2048之间;当应用于特定的用途时,其数目可能较多。在对一个具体的语言样值编码时,问题是在这些激励源中选取哪个才能最佳地代表原语言信息的相应分量。
根据本发明,一旦具体的合成信号(103)确定后,由第一代码簿(111)组列出的激励信号将顺序地呈现作为备选激励源。每个备选激励源首先使之相对于合成信号作正交化(106)。例如参照图2,如果矢量A认为代表合成信号,矢量B认为代表一个具体的备选激励源,则备选激励源信号的正交化将得出由参考字符B′表示的矢量。(应该指出,在实践中,矢量的空间维数是包含该矢量的样值数的函数,样值数可能达到40或更多。还应指出,通过将基本矢量正交化,很容易使备选激励矢量正交化。这里,正交化的一些基本矢量彼此间的线性组合,可产生出正交化的激励矢量。)
一旦正交化后,得出的备选激励源可以与未编码信号(113)(或者在此基础上的一个合适的代表性信号)相比较(112),以确定这两者之间的相对的类似性或不一致性。然后,对第一代码簿(111)中的每个激励源重复进行该处理。于是,可作出判定,哪一个备选激励源最严密地与未编码信号(113)相一致。
如本领域内所熟知的,在这个具体实施例中,增益系数114也可用来修正每个备选激励源信号。此外,如果需要,激励源的选取和增益补偿两者也可以实质上同时实现,这也是本领域内所熟知的。
一旦通过这种处理从第一代码簿(111)中选定一个合适的激励源,此后的正交化处理(106)就可免去,并通过合适的控制机械(117)选择出该准确的激励源信号(116)。然后,在单一个代码簿编码器的情况下,可以选通音调信息(117),并与所选取的具有音调滤波器系数(108)的激励源信号相加(118),而激励增益(114)优化到使组合的激励源最严密地与未编码信号(113)相一致。一旦优化后,音调时间参数,音调滤波器系数及具体的激励源和增益都已知,于是,由此得出的合适的信号可用作为原语言样值的信号。
如图1中所示,如果需要,可以再使用一个代码簿(121),它也包含有许多个基本矢量,可导得备选激励源。使用这样多个代码簿的方法在本领域中是已知的。然而,根据本发明,一旦如上所述从第一代码簿(111)中选定激励源后,使第二代码簿(121)来的备选激励源相对于第一代码簿(111)来的合成信号(103)和选定的激励源两者都正交化。然后,选取过程可按上面所述方式继续进行,将第二代码薄(121)来的正交的备选激励源信号与对应的未编码信号(113)进行比较,以识别出最严密的适配。一旦选定这个激励源,便可如上面所述使音调滤波器系数(108)和激励增益(114和120)最佳化。
Claims (11)
1、一种对语言样值编码的方法,它包括以下步骤:
A.对语言样值确定一个音调时间参数;其特征在于:
B.对该语言样值确定一个与任何音调滤波器系数无关的编码激励信号;
C.对该语言样值一个音调一个音调滤波系数。
2、根据权利要求1所述的方法,其特征还在于,确定编码激励信号的步骤包括有提供出多个备选激励信号。
3、根据权利要求2所述的方法,其特征在于,确定编码激励信号的步骤包括有对多个备选激励信号进行处理,以提供出处理好的条选激励信号,这些信号是由与音调滤波器的输出可代表的信息基本上无关的信息组成的,而音调滤波器的输出至少部分地是音调时间参数的函数。
4、根据权利要求2所述的方法,其特征还在于,确定编码激励信号的步骤包括有对多个备选激励信号进行处理,以使多个备选激励信号相对于音调滤波器输出成正交,而音调滤波器的输出至少部分地是音调时间参数的函数。
5、根据权利要求1所述的方法,其特征还在于,确定编码激励信号的步骤包括有以下步骤:
B1.对一个激励信号进行处理,以基本上除去至少可由一参考信号部分地代表分量,而该参考信号至少部分地与音调时间参数有关联;
B2.对该语言样值确定一个合适的激励信号。
6、根据权利要求5所述的方法,其特征还在于,处理激励信号的步骤包括将该激励信号处理得使之相对于音调滤波器输出成正交,而音调滤波器的输出至少部分地是音调时间参数的函数。
7、根据权利要求5所述的方法,其特征还在于以下步骤:
C1.对一个备选激励信号进行处理,以基本上除去至少部分地可由一个参考信号代表的分量,而该参考信号至少部分地与音调时间参数有关联;另外,合适的激励信号在步骤C中确定。
8、根据权利要求7所述的方法,其特征还在于,处理备选激励信号的步骤包括将该备选激励信号处理得使之相对于参考信号和步骤C中确定的合适的激励信号两者成正交。
9、应用至少两个包含有备选激励信号方面信息的代码薄对信号样值进行编码的一种方法,它包括以下步骤:
A.应用第一代码薄对信号样值确定第一激励信号;其特征在于:
B.应用第二代码薄对该信号样值确定第二激励信号,该第二激励信号是由与第一激励信号可代表的信息基本上无关的信息组成的;
C.应用第一和第二激励信号来至少部分地代表该信号样值。
10、根据权利要求9所述的方法,其特征还在于,该信号样值包含一个语言样值。
11、根据权利要求9所述的方法,其特征还在于,确定第二激励信号的步骤包括有对备选激励信号进行处理,以使该备选激励信号相对于第一激励信号成正交。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37054189A | 1989-06-23 | 1989-06-23 | |
US370,541 | 1989-07-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1048278A true CN1048278A (zh) | 1991-01-02 |
CN1023160C CN1023160C (zh) | 1993-12-15 |
Family
ID=23460115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN90103020A Expired - Lifetime CN1023160C (zh) | 1989-06-23 | 1990-06-19 | 模拟信号样值编码为代码形式的方法 |
Country Status (10)
Country | Link |
---|---|
EP (1) | EP0484339B1 (zh) |
KR (1) | KR950003557B1 (zh) |
CN (1) | CN1023160C (zh) |
AU (1) | AU638462B2 (zh) |
BR (1) | BR9007467A (zh) |
CA (1) | CA2060310C (zh) |
DE (1) | DE69032026T2 (zh) |
IL (1) | IL94119A (zh) |
NZ (1) | NZ234180A (zh) |
WO (1) | WO1991001545A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0451200A (ja) * | 1990-06-18 | 1992-02-19 | Fujitsu Ltd | 音声符号化方式 |
JPH0451199A (ja) * | 1990-06-18 | 1992-02-19 | Fujitsu Ltd | 音声符号化・復号化方式 |
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
JP2776050B2 (ja) * | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
DE4315315A1 (de) * | 1993-05-07 | 1994-11-10 | Ant Nachrichtentech | Verfahren zur Vektorquantisierung insbesondere von Sprachsignalen |
SG43128A1 (en) * | 1993-06-10 | 1997-10-17 | Oki Electric Ind Co Ltd | Code excitation linear predictive (celp) encoder and decoder |
JP3224955B2 (ja) * | 1994-05-27 | 2001-11-05 | 株式会社東芝 | ベクトル量子化装置およびベクトル量子化方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
-
1990
- 1990-04-18 IL IL9411990A patent/IL94119A/en not_active IP Right Cessation
- 1990-05-02 EP EP90908908A patent/EP0484339B1/en not_active Expired - Lifetime
- 1990-05-02 WO PCT/US1990/002469 patent/WO1991001545A1/en active IP Right Grant
- 1990-05-02 CA CA002060310A patent/CA2060310C/en not_active Expired - Lifetime
- 1990-05-02 DE DE69032026T patent/DE69032026T2/de not_active Expired - Lifetime
- 1990-05-02 KR KR1019910701947A patent/KR950003557B1/ko not_active IP Right Cessation
- 1990-05-02 BR BR909007467A patent/BR9007467A/pt not_active IP Right Cessation
- 1990-05-02 AU AU57359/90A patent/AU638462B2/en not_active Expired
- 1990-06-19 CN CN90103020A patent/CN1023160C/zh not_active Expired - Lifetime
- 1990-06-21 NZ NZ234180A patent/NZ234180A/en unknown
Also Published As
Publication number | Publication date |
---|---|
AU638462B2 (en) | 1993-07-01 |
IL94119A (en) | 1996-06-18 |
AU5735990A (en) | 1991-02-22 |
CA2060310C (en) | 2001-07-17 |
EP0484339A4 (en) | 1993-05-05 |
BR9007467A (pt) | 1992-06-16 |
IL94119A0 (en) | 1991-01-31 |
CA2060310A1 (en) | 1990-12-24 |
NZ234180A (en) | 1993-11-25 |
KR920702787A (ko) | 1992-10-06 |
DE69032026T2 (de) | 1998-09-17 |
DE69032026D1 (de) | 1998-03-12 |
CN1023160C (zh) | 1993-12-15 |
KR950003557B1 (ko) | 1995-04-14 |
WO1991001545A1 (en) | 1991-02-07 |
EP0484339B1 (en) | 1998-02-04 |
EP0484339A1 (en) | 1992-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2113928C (en) | Voice coder system | |
EP2066109A8 (en) | Method and apparatus for digital watermarking | |
EP0887760A3 (en) | Method and apparatus for decoding bar code symbols using subpixel interpolation | |
ATE173847T1 (de) | Verfahren und gerät zur datenkodierung unter verwendung von vektorquantifizierung und lauflängenkodierung und unter verwendung von adaptiver lauflängenkodierung | |
EP0770989A3 (en) | Speech encoding method and apparatus | |
DE68914045T2 (de) | Verfahren zur Kodierung von Hilfsdaten für die Rekonstruktion eines unterabgetasteten, elektronischen Bildes. | |
EP0392517A3 (en) | Speech coding apparatus | |
CN1023160C (zh) | 模拟信号样值编码为代码形式的方法 | |
WO1996035208A1 (en) | A gain quantization method in analysis-by-synthesis linear predictive speech coding | |
CA2147394C (en) | Quantization of input vectors with and without rearrangement of vector elements of a candidate vector | |
JPS64996A (en) | Voice recognition system using vector quantization | |
EP0772185A3 (en) | Speech decoding method and apparatus | |
JP3275247B2 (ja) | 音声符号化・復号化方法 | |
EP0910042A3 (en) | Method and apparatus for encoding or decoding digital video data | |
JPH096396A (ja) | 音響信号符号化方法及び音響信号復号化方法 | |
JPH06131000A (ja) | 基本周期符号化装置 | |
JP2734995B2 (ja) | スペクトルパラメータ抽出装置 | |
EP0871294A3 (en) | Method and apparatus for compression and decompression of data | |
JPH07123276A (ja) | 画像信号のデジタル圧縮符号化方法 | |
JP3095758B2 (ja) | ベクトル量子化のコードベクトル検索方法 | |
JP2780458B2 (ja) | ベクトル量子化法および音声符号化復合化装置 | |
US5550949A (en) | Method for compressing voice data by dividing extracted voice frequency domain parameters by weighting values | |
JP2684807B2 (ja) | 音声認識装置 | |
EP1001540A3 (en) | Block coding method and apparatus | |
JP3049574B2 (ja) | 利得形状ベクトル量子化法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C53 | Correction of patent of invention or patent application | ||
COR | Change of bibliographic data |
Free format text: CORRECT: PATENTEE; FROM: MOTOROLA INC. TO: MOTOROLA, INC. |
|
CP01 | Change in the name or title of a patent holder |
Patentee after: Motorola Inc. Patentee before: Motorola. Inc |
|
C15 | Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993) | ||
OR01 | Other related matters | ||
C17 | Cessation of patent right | ||
CX01 | Expiry of patent term |
Granted publication date: 19931215 |