CN1023160C - 模拟信号样值编码为代码形式的方法 - Google Patents

模拟信号样值编码为代码形式的方法 Download PDF

Info

Publication number
CN1023160C
CN1023160C CN90103020A CN90103020A CN1023160C CN 1023160 C CN1023160 C CN 1023160C CN 90103020 A CN90103020 A CN 90103020A CN 90103020 A CN90103020 A CN 90103020A CN 1023160 C CN1023160 C CN 1023160C
Authority
CN
China
Prior art keywords
signal
code
mentioned
excited
pumping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN90103020A
Other languages
English (en)
Other versions
CN1048278A (zh
Inventor
格森·艾拉·阿伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1048278A publication Critical patent/CN1048278A/zh
Application granted granted Critical
Publication of CN1023160C publication Critical patent/CN1023160C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

在一个利用矢量激励的矢量激励源数字或语言编码器中,备选激励源(111,121)认为是与某些音调参数无关的。一旦选定一个具体的激励源后,可使音调参数唯一地最佳化,从而获得语言质量的全面改进。

Description

本发明涉及语言编码器,具体涉及一种用以将模拟的语言样值编码成为代码形式的方法。
在本领域内,语言编码器是众所周知的,一些语言编码器将语音样值转换为数字化的代码,然后通过采用线性预测编码法显示出语言频谱信息。另一些语言编码器通过提供一个与原来的语音信号有关的激励信号来改进普通的线性预测编码技术。本发明人早先在美国专利Us.4817157中已叙述过一种具有改进的矢量激励源的数字式语言编码器,其中,可查阅一种激励矢量代码簿来选取一个最适合于可资利用信息的激励信号。由此可提供出一个严密代表原话音信号、复原的语言信号。
通常,如果有大量可用的备选激励矢量可用作激励源,则由此得出的译码语言信号将更严密地代表原来的未编码的语言信号。然而,这样来提高性能一般会导致代码簿规模的增大,并且通常会增加处理的复杂性和数据的速率。
因此,需要有采用矢量激励信号的一种数字式语言编码器。其中,对于给定规模的代码簿而言,可在最小限度地增加复杂性和基本上不增加数据率的情况下使译码的语言信号的质量实质上达到最高。
通过配置以这里公布的具有改进的语言质量的、带有矢量激励源的数字式语言编码器,上述的需要和其它要求基本上能得到满足。根据本发明,在对一个信号样值例如一个语言样值进行编码时,编码器 首先确定这个语言样值的音调时间(pitch    period)参数。部分地依赖于这个音调时间参数,可以确定出一个具体的编码的激励信号,而与音调滤波器系数无关。因此,可使得用于那个具体语言样值的音调滤波器系数最优化。这种方法允许在取定备选的激励信号时,不需相应地增加处理的复杂性或数据率。
在一个实施例中,确定编码的激励信号时基本上与任何音调信息无关。具体地说,对于由代码簿提供的备选激励信号进行处理,以便基本上消除至少部分地可由一个参数分量来代表的那些分量,而该参考分量至少部分地与中间音调矢量有关联。更具体地说,将与中间音调矢量有关的矢量分量从备选激励信号中除掉(这一步骤称为正交化)。然后,经正交化的备选激励信号与未编码的语言样值进行比较,以识别出最佳地代表这个具体的语言样值的备选激励信号。包括音调滤波器系数在内的音调信息随后可得到优化,以最佳地适合于选定的激励信号,借此产生出该语言信号的全面优化的编码信号。
在另一个实施例中,配置了一个备选激励信号第二代码簿。其中,使用两个激励信号来代表语言样值。第一激励信号可按上述方法予以选定,第二激励信号可按类似的方法选定。其中,备选的第二激励信号重要的是与中间音调矢量和先前选定的第一激励信号两者相正交。
图1示出本发明的方框图;
图2示出代表本发明一个特定的矢量图。
本发明的实施,可应用一种合适的数字信号处理器例如莫托罗拉公司的DSP    56000系列的器件来组成语言编码器。这样的DSP器件实施例的运算功能示于图1的等效电路中方框图。
将音调时间参数(101)(它按先有的技术确定出)提供给包含有音调滤波器一部分的一个音调滤波器组(102)。由此得出的合成信号(103)包含有一个中间音调矢量,它加到第一乘法器(104)和两个正交化处理器(106和107)上。第一乘法器(104)的作用是将该合成信号(103)乘以一个音调滤波器系数(108),以产生出一个音调滤波器输出(109)。音调滤波器系数(108)的选取在下面详述。
第一代码簿(111)包含有一组基本矢量,它们可以线性组合起来以形成许多合成的激励信号。根据所用的存贮器的大小和适合于应用的其它因素合成的激励信号的可能个数例如可在64至2048之间;当应用于特定的用途时,其数目可能较多。在对一个具体的语言样值编码时,问题是在这些激励源中选取哪个才能最佳地代表原语言信息的相应分量。
根据本发明,一旦具体的合成信号(103)确定后,由第一代码簿(111)组列出的激励信号将顺序地呈现作为备选激励源。每个备选激励源首先使之相对于合成信号作正交化(106)。例如参照图2,如果矢量A认为代表合成信号,矢量B认为代表一个具体的备选激励源,则备选激励源信号的正交化将得出由参考字符B′表示的矢量。(应该指出,在实践中,矢量的空间维数是包含该矢量的样值数的函数,样值数可能达到40或更多。还应指出,通过将基本矢量正交化,很容易使备选激励矢量正交化。这里,正交化的一些基本矢量彼此间的线性组合,可产生出正交化的激励矢量。)
一旦正交化后,得出的备选激励源可以与未编码信号(113)(或者在此基础上的一个合适的代表性信号)相比较(112),以 确定这两者之间的相对的类似性或不一致性。然后,对第一代码簿(111)中的每个激励源重复进行该处理。于是,可作出判定,哪一个备选激励源最严密地与未编码信号(113)相一致。
如本领域内所熟知的,在这个具体实施例中,增益系数114也可用来修正每个备选激励源信号。此外,如果需要,激励源的选取和增益补偿两者也可以实质上同时实现,这也是本领域内所熟知的。
一旦通过这种处理从第一代码簿(111)中选定一个合适的激励源,此后的正交化处理(106)就可免去,并通过合适的控制机械(117)选择出该准确的激励源信号(116)。然后,在单一个代码簿编码器的情况下,可以选通音调信息(117),并与所选取的具有音调滤波器系数(108)的激励源信号相加(118),而激励增益(114)优化到使组合的激励源最严密地与未编码信号(113)相一致。一旦优化后,音调时间参数,音调滤波器系数及具体的激励源和增益都已知,于是,由此得出的合适的信号可用作为原语言样值的信号。
如图1中所示,如果需要,可以再使用一个代码簿(121),它也包含有许多个基本矢量,可导得备选激励源。使用这样多个代码簿的方法在本领域中是已知的。然而,根据本发明,一旦如上所述从第一代码簿(111)中选定激励源后,使第二代码簿(121)来的备选激励源相对于第一代码簿(111)来的合成信号(103)和选定的激励源两者都正交化。然后,选取过程可按上面所述方式继续进行,将第二代码薄(121)来的正交的备选激励源信号与对应的未编码信号(113)进行比较,以识别出最严密的适配。一旦选定这个激励源,便可如上面所述使音调滤波器系数(108)和激 励增益(114和120)最佳化。

Claims (11)

1、一种用以将模拟语言样值编码成为代码形式的方法,这种代码形式既可识别代码激励信号,又可识别音调时间参数,上述编码激励信号和音调时间参数在解码期间在重建该语言样值的模拟形式时才被使用,所述的方法包括以下步骤:
A.在确定编码激励信号之前为语言样值确定一个音调时间参数;该方法其特征在于以下步骤:
B.对该语言样值确定一个编码激励信号,该编码激励信号与任何音调滤波器系数无关;
C.然后为该语言样值优化至少一个音调滤波器系数。
2、根据权利要求1所述的方法,其特征在于,所述的确定编码激励信号的步骤包括提供多个候选激励信号。
3、根据权利要求2所述的方法,其特征在于,所述的确定编码激励信号的步骤包括处理上述多个候选激励信号,以使处理好的候选激励信号包括的信息基本上与一个音调滤波器的输出能够代表的信息无关,上述的音调滤波器的输出至少部分地是音调时间参数的函数。
4、根据权利要求2所述的方法,其特征在于,所述的确定编码激励信号的步骤包括处理上述的多个候选激励信号,以使上述的多个候选激励信号相对于一个音调滤波器输出成正交,上述的音调滤波器的输出至少部分地是音调时间参数的函数。
5、根据权利要求1所述的方法,其特征在于,所述的确定编码激励信号的步骤包括有以下步骤:
B1.处理一个激励信号,以基本上除掉那些至少部分地能用一个参考信号来代表的分量,该参考信号至少部分地与上述的音调时间参数有关联;
B2.为上述的语言样值确定一个合适的激励信号。
6、根据权利要求5所述的方法,其特征在于,所述的处理激励信号的步骤包括处理该激励信号,以使该激励信号相对于一个音调滤波器输出正交,上述的音调滤波器的输出至少部分地是上述的音调时间参数的函数。
7、根据权利要求5所述的方法,其特征在于包括以下步骤:
C1.处理一个候选激励信号,以基本上除去那些至少部分地能用一个参考信号代表的分量,而该参考信号至少部分地与上述的音调时间参数和在步骤C中确定的上述合适的激励信号有关。
8、根据权利要求7所述的方法,其特征在于,所述的处理候选激励信号的步骤包括将该候选激励信号处理得以使其相对于上述的参考信号和在步骤C中确定的上述合适的激励信号两者成正交关系。
9、一种用以将模拟信号样值编码成为代码形式的方法,这种代码形式可识别第一和第二编码激励信号,上述的第一编码激励信号与第一激励源的代码薄一起使用,上述的第二编码激励信号与第二编码激励源的代码薄一起使用,该方法包括以下步骤:
A.利用上述第一代码薄为该信号样值确定第一编码激励信号;该方法其特征在于以下步骤:
B.利用上述第二代码薄为该信号样值确定第二编码激励信号,该第二编码激励信号是由上述的与第一编码激励信号可代表的信息基本上无关的信息组成的;
C.利用上述的第一和第二编码激励信号来至少部分地包括该模拟信号样值的编码代表形式。
10、根据权利要求9所述的方法,其特征在于,所述的信号样值包含一个语言样值。
11、根据权利要求9所述的方法,其特征在于,所述的确定第二编码激励信号的步骤包括处理候选激励信号,以使该候选激励信号相对于第一激励信号成正交关系。
CN90103020A 1989-06-23 1990-06-19 模拟信号样值编码为代码形式的方法 Expired - Lifetime CN1023160C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US37054189A 1989-06-23 1989-06-23
US370,541 1989-06-23

Publications (2)

Publication Number Publication Date
CN1048278A CN1048278A (zh) 1991-01-02
CN1023160C true CN1023160C (zh) 1993-12-15

Family

ID=23460115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN90103020A Expired - Lifetime CN1023160C (zh) 1989-06-23 1990-06-19 模拟信号样值编码为代码形式的方法

Country Status (10)

Country Link
EP (1) EP0484339B1 (zh)
KR (1) KR950003557B1 (zh)
CN (1) CN1023160C (zh)
AU (1) AU638462B2 (zh)
BR (1) BR9007467A (zh)
CA (1) CA2060310C (zh)
DE (1) DE69032026T2 (zh)
IL (1) IL94119A (zh)
NZ (1) NZ234180A (zh)
WO (1) WO1991001545A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0451200A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化方式
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
JP2776050B2 (ja) * 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
DE4315315A1 (de) * 1993-05-07 1994-11-10 Ant Nachrichtentech Verfahren zur Vektorquantisierung insbesondere von Sprachsignalen
SG43128A1 (en) * 1993-06-10 1997-10-17 Oki Electric Ind Co Ltd Code excitation linear predictive (celp) encoder and decoder
JP3224955B2 (ja) * 1994-05-27 2001-11-05 株式会社東芝 ベクトル量子化装置およびベクトル量子化方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder

Also Published As

Publication number Publication date
KR920702787A (ko) 1992-10-06
EP0484339B1 (en) 1998-02-04
AU638462B2 (en) 1993-07-01
EP0484339A4 (en) 1993-05-05
WO1991001545A1 (en) 1991-02-07
CA2060310C (en) 2001-07-17
BR9007467A (pt) 1992-06-16
DE69032026T2 (de) 1998-09-17
IL94119A0 (en) 1991-01-31
NZ234180A (en) 1993-11-25
IL94119A (en) 1996-06-18
DE69032026D1 (de) 1998-03-12
KR950003557B1 (ko) 1995-04-14
CA2060310A1 (en) 1990-12-24
AU5735990A (en) 1991-02-22
CN1048278A (zh) 1991-01-02
EP0484339A1 (en) 1992-05-13

Similar Documents

Publication Publication Date Title
DE69214969T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hilfsinformationen zur Ausführung einer Suche in einem Kodebuch mit geringer Dichte
EP0784281A3 (en) Field level replication method
DE68914045D1 (de) Verfahren zur Kodierung von Hilfsdaten für die Rekonstruktion eines unterabgetasteten, elektronischen Bildes.
ATE173847T1 (de) Verfahren und gerät zur datenkodierung unter verwendung von vektorquantifizierung und lauflängenkodierung und unter verwendung von adaptiver lauflängenkodierung
EP0770989A3 (en) Speech encoding method and apparatus
EP0984616A3 (en) Method and apparatus for digital watermarking
EP0887760A3 (en) Method and apparatus for decoding bar code symbols using subpixel interpolation
WO2004040475A3 (en) Improved audio data fingerprint searching
EP0845757A3 (en) Data hiding method and data extracting method
ATE336119T1 (de) Vorrichtung und verfahren für die einbettung und wiedergewinnung von informationen in analogen signalen mit verwendung der verteilten signalmerkmale
EP0392517A3 (en) Speech coding apparatus
CN1023160C (zh) 模拟信号样值编码为代码形式的方法
EP0720145A2 (en) Speech pitch lag coding apparatus and method
CA2147394C (en) Quantization of input vectors with and without rearrangement of vector elements of a candidate vector
JPS64996A (en) Voice recognition system using vector quantization
JP3285185B2 (ja) 音響信号符号化方法
CN1062365C (zh) 发送和接收编码话音的方法
EP0910042A3 (en) Method and apparatus for encoding or decoding digital video data
GB2188466A (en) Linear predictive speech coding
EP0500076A2 (en) Method and arrangement of determining coefficients for linear predictive coding
KR910008947A (ko) 디지탈 화상데이타 필터용 디지탈 필터
EP0871294A3 (en) Method and apparatus for compression and decompression of data
US5550949A (en) Method for compressing voice data by dividing extracted voice frequency domain parameters by weighting values
JP3095758B2 (ja) ベクトル量子化のコードベクトル検索方法
JPS61184597A (ja) 単語音声認識装置の予備選択回路

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C53 Correction of patent of invention or patent application
COR Change of bibliographic data

Free format text: CORRECT: PATENTEE; FROM: MOTOROLA INC. TO: MOTOROLA, INC.

CP01 Change in the name or title of a patent holder

Patentee after: Motorola Inc.

Patentee before: Motorola. Inc

C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C17 Cessation of patent right
CX01 Expiry of patent term

Granted publication date: 19931215