FI95086B - Förfarande för effektiv kodning av en talsignal - Google Patents

Förfarande för effektiv kodning av en talsignal Download PDF

Info

Publication number
FI95086B
FI95086B FI925376A FI925376A FI95086B FI 95086 B FI95086 B FI 95086B FI 925376 A FI925376 A FI 925376A FI 925376 A FI925376 A FI 925376A FI 95086 B FI95086 B FI 95086B
Authority
FI
Finland
Prior art keywords
degree
modeling
model
signal
synthesis
Prior art date
Application number
FI925376A
Other languages
English (en)
Finnish (fi)
Other versions
FI95086C (sv
FI925376A (sv
FI925376A0 (sv
Inventor
Kari Jaervinen
Olli Ali-Yrkkoe
Original Assignee
Nokia Mobile Phones Ltd
Nokia Telecommunications Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd, Nokia Telecommunications Oy filed Critical Nokia Mobile Phones Ltd
Priority to FI925376A priority Critical patent/FI95086C/sv
Publication of FI925376A0 publication Critical patent/FI925376A0/sv
Priority to US08/155,574 priority patent/US5596677A/en
Priority to DE69325237T priority patent/DE69325237T2/de
Priority to EP93309264A priority patent/EP0599569B1/en
Priority to AU51897/93A priority patent/AU665283B2/en
Priority to JP5296618A priority patent/JPH06222798A/ja
Publication of FI925376A publication Critical patent/FI925376A/sv
Application granted granted Critical
Publication of FI95086B publication Critical patent/FI95086B/sv
Publication of FI95086C publication Critical patent/FI95086C/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations

Claims (9)

1. Talkodningsförfarande, vid vilket i och for kodning av en talsignal a) i analysatorer för ett kort tidsintervall utvecklas en 5 mot en inkommande signal svarande grupp prediktivparametrar, vilka i vart och ett block hos talsignalen som skall kodas är karakteristiska för talsignalens spektrum inom det korta tidsintervallet, b) aktiveras en excitationssignal, vilken genom matning till 10 ett syntesfilter som fungerar enligt prediktivparametrarna ästadkommer en syntetisering av en mot den ursprungliga talsignalen svarande kodad talsignal, kännetecknat av att c) filtreringsmodellen för det korta tidsintervallet bildas 15 av tvenne delar, d.v.s. av en läggradig del med ett fast gradtal och av en till sitt gradtal föränderlig del som möj -liggör en modellbildning med högt gradtal; d) för vardera delen utförs en beräkning av prediktivparametrarna för det korta tidsintervallet; 20 e) den korta tidsintervallsmodellens totala gradtal adapte-ras i vart och ett för kodning avsett talblock enligt talsignalen; och f) överföringshastigheten som används för kodning av filter-modellens parametrar samt överföringshastigheten för kodning 25 av excitationssignalen adapteras sälunda, att en ökning av gradtalet som används vid modelleringen ökar överföringshastigheten för modellens parametrar och motsvarande sänker överföringshastigheten som används för kodning av excita-tionen, d.v.s. man adapterar det inbördes förhällandet mel-30 lan överföringshastigheterna som används för förmedling av excitationssignalen respektive filtreringsmodellen för det korta tidsintervallet.
2. Förfarande enligt patentkrav 1, kännetecknat av att 35 beräkning av filtreringskoefficienterna för filtreringsmodellen med fast gradtal för det korta tidsintervallet utförs direkt frän den inkommande talsignalen som skall kodas, me-dan igen filtreringskoefficienterna för modellen med adapte- (I 95086 19 rat gradtal för det korta tidsintervallet beräknas frän en signal som erhällits genom filtrering av den inkommande för kodning avsedda talsignalen medelst ett inverterat filter för modellen med fast gradtal. 5
3. Förfarande enligt patentkrav 1 eller 2, kännetecknat av att det läggradiga, fast gradtal uppvisande modelleringsre-sultatet utnyttjas för en adaptering av gradtalet för model-leringen med adapterat gradtal sälunda, att gradtalet för 10 den korta tidsintervallsmodelleringen med adapterat gradtal beräknas lägt, ifali i signalblocket som skall kodas den största delen av energin i enlighet med en modellering med fast gradtal befinner sig pä höga frekvenser, d.v.s. ifall frekvenssvaret för syntesfiltret med fast gradtal är av hög-15 passtyp, och a andra sidan gradtalet för modelleringen med adapterat gradtal ökas, ifall syntesfiltreringen som motsva-rar modelleringen med fast gradtal är av lägpasstyp.
4. Förfarande enligt nägot av de föregäende patentkraven, 20 kännetecknat av att adapteringen av gradtalet för modelleringen utförs i enlighet med ett prognosfel för den totala modellen äterkopplat under jämförelse av hur en ökning av modelleringens gradtal päverkar prognosfelet. 25
5. Förfarande enligt patentkrav 4, kännetecknat av att .· modelleringens gradtal ökas tills ökningen medför en minsk- ning av effekten hos en felsignal som understiger ett gräns-värde, eller tills modelleringens gradtal uppnär det högsta tillätna modelleringsgradtalet. 30
6. Förfarande enligt nägot av de föregäende patentkraven, kännetecknat av att i filtret med fast gradtal utnyttjas en lägre adapteringsfrekvens för modellens parametrar än vid modelleringen med adapterat gradtal och att det används för 35 att förmedla av talaren och av mikrofonen föranledda spekt-ralegenskaper, vilka förändras längsammare än den egentliga 1judinformationen, vilken modelleras i den egentliga modelleringen med adapterat gradtal. 20 95086
7. Förfarande enligt nagot av de föregäende patentkraven, kännetecknat av att det används via en analys-genom-syntes i talkoder som utför en kodning av en excitationssignal genom kombination av en kort tidsintervallsmodell med fast gradtal 5 och adapterat gradtal tili en talkoder antingen sälunda, att vid en sluten optimering av excitationsparametrarna utförs enbart en syntesfiltrering med adapterat gradtal, varvid en inverterad filtrering som motsvarar modelleringen med fast gradtal som tillhör den korta tidsintervallsmodelleringen 10 utförs för den ursprungliga talsignalen före jämförelse med syntesresultatet, eller sälunda, att syntesmodellen för hela det korta tidsintervallet eller utöver syntesfiltreringen enligt modellen med adapterat gradtal även utförs en syntes-filtrering för det korta tidsintervallet med fast gradtal i 15 en gren som utför ett vai av koderns excitationssignal.
8. Förfarande enligt nagot av de föregäende patentkraven, kännetecknat av att adapteringen av filtreringsmodellens gradtal utförs säsom en del av kodningen som utförs enligt 20 analys-genom-syntes-förfarande, genom att via analys-genom- syntesen uppsöka ett sadant gradtal för filtret, vid vilket en ökning av gradtalet icke väsentligen förbättrar talsigna-lens kvalitet. 25
9. Förfarande enligt nagot av de föregaende patentkraven, , kännetecknat av att det är anslutet tili en felkorrigerings- kodning sälunda, att den utvalda totalmodelleringsgraden förmedlas förutom tili blocket som utför en kodning av exci-tationssignalen även till block som utför felkorrigerings-30 kodningen, varvid utöver en adaptering av överföringshas- tigheten för excitationsignalens kodning även kan adapteras . överföringshastigheten som utnyttjas för felkorrigeringskod- ningen. ti
FI925376A 1992-11-26 1992-11-26 Förfarande för effektiv kodning av en talsignal FI95086C (sv)

Priority Applications (6)

Application Number Priority Date Filing Date Title
FI925376A FI95086C (sv) 1992-11-26 1992-11-26 Förfarande för effektiv kodning av en talsignal
US08/155,574 US5596677A (en) 1992-11-26 1993-11-19 Methods and apparatus for coding a speech signal using variable order filtering
DE69325237T DE69325237T2 (de) 1992-11-26 1993-11-22 Verfahren zum Kodieren eines Sprachsignales
EP93309264A EP0599569B1 (en) 1992-11-26 1993-11-22 A method of coding a speech signal
AU51897/93A AU665283B2 (en) 1992-11-26 1993-11-25 A method for the efficient coding of a speech signal
JP5296618A JPH06222798A (ja) 1992-11-26 1993-11-26 音声信号を効率的に符号化するための方法及びこの方法を用いる符号器

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI925376A FI95086C (sv) 1992-11-26 1992-11-26 Förfarande för effektiv kodning av en talsignal
FI925376 1992-11-26

Publications (4)

Publication Number Publication Date
FI925376A0 FI925376A0 (sv) 1992-11-26
FI925376A FI925376A (sv) 1994-05-27
FI95086B true FI95086B (sv) 1995-08-31
FI95086C FI95086C (sv) 1995-12-11

Family

ID=8536280

Family Applications (1)

Application Number Title Priority Date Filing Date
FI925376A FI95086C (sv) 1992-11-26 1992-11-26 Förfarande för effektiv kodning av en talsignal

Country Status (6)

Country Link
US (1) US5596677A (sv)
EP (1) EP0599569B1 (sv)
JP (1) JPH06222798A (sv)
AU (1) AU665283B2 (sv)
DE (1) DE69325237T2 (sv)
FI (1) FI95086C (sv)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JP2993396B2 (ja) * 1995-05-12 1999-12-20 三菱電機株式会社 音声加工フィルタ及び音声合成装置
EP0815555A1 (en) * 1996-01-04 1998-01-07 Koninklijke Philips Electronics N.V. Method and system for coding human speech for subsequent reproduction thereof
US6170073B1 (en) 1996-03-29 2001-01-02 Nokia Mobile Phones (Uk) Limited Method and apparatus for error detection in digital communications
US5799272A (en) * 1996-07-01 1998-08-25 Ess Technology, Inc. Switched multiple sequence excitation model for low bit rate speech compression
GB2317788B (en) 1996-09-26 2001-08-01 Nokia Mobile Phones Ltd Communication device
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
ES2157854B1 (es) 1997-04-10 2002-04-01 Nokia Mobile Phones Ltd Metodo para disminuir el porcentaje de error de bloque en una transmision de datos en forma de bloques de datos y los correspondientes sistema de transmision de datos y estacion movil.
FI102647B (sv) * 1997-04-22 1999-01-15 Nokia Mobile Phones Ltd Programmerbar förstärkare
US6286122B1 (en) * 1997-07-03 2001-09-04 Nokia Mobile Phones Limited Method and apparatus for transmitting DTX—low state information from mobile station to base station
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6012025A (en) * 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
US6799159B2 (en) 1998-02-02 2004-09-28 Motorola, Inc. Method and apparatus employing a vocoder for speech processing
FI105634B (sv) 1998-04-30 2000-09-15 Nokia Mobile Phones Ltd Förfarande för överföring av videobilder, dataöverföringssystem och multimediadataterminal
FI981508A (sv) 1998-06-30 1999-12-31 Nokia Mobile Phones Ltd Förfarande, anordning och system för bedömning av en användares tillst ånd
GB9817292D0 (en) 1998-08-07 1998-10-07 Nokia Mobile Phones Ltd Digital video coding
FI105635B (sv) 1998-09-01 2000-09-15 Nokia Mobile Phones Ltd Förfarande för att överföra bakgrundsbrusinformation vid dataöverföring i dataramer
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
FI116992B (sv) 1999-07-05 2006-04-28 Nokia Corp Förfaranden, system och anordning för effektivisering av kodning och överföring av audiosignal
EP1580895B1 (en) * 2002-11-21 2009-03-04 Nippon Telegraph and Telephone Corporation Digital signal processing method, processor thereof, program thereof, and recording medium containing the program
CN101009097B (zh) * 2007-01-26 2010-11-10 清华大学 1.2kb/s SELP低速率声码器抗信道误码保护方法
EP2613452B1 (en) * 2010-09-01 2022-12-28 Nec Corporation Digital filter device, digital filtering method, and control program for digital filter device
US8873615B2 (en) * 2012-09-19 2014-10-28 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and controller for equalizing a received serial data stream
US10251002B2 (en) * 2016-03-21 2019-04-02 Starkey Laboratories, Inc. Noise characterization and attenuation using linear predictive coding

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE15415T1 (de) * 1981-09-24 1985-09-15 Gretag Ag Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung.
NL8400728A (nl) * 1984-03-07 1985-10-01 Philips Nv Digitale spraakcoder met basisband residucodering.
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
EP0316112A3 (en) * 1987-11-05 1989-05-31 AT&T Corp. Use of instantaneous and transitional spectral information in speech recognizers
IT1224453B (it) * 1988-09-28 1990-10-04 Sip Procedimento e dispositivo per la codifica decodifica di segnali vocali con l'impiego di un eccitazione a impulsi multipli
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
WO1990013112A1 (en) * 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Voice encoder
DE68914147T2 (de) * 1989-06-07 1994-10-20 Ibm Sprachcodierer mit niedriger Datenrate und niedriger Verzögerung.
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
FI98104C (sv) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Förfaranden för generering av en exciteringsvektor och digital talkodare
ES2240252T3 (es) * 1991-06-11 2005-10-16 Qualcomm Incorporated Vocodificador de velocidad variable.
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
FI92535C (sv) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Brusdämpningssystem för talsignaler
FI90477C (sv) * 1992-03-23 1994-02-10 Nokia Mobile Phones Ltd En metod för förbättring av kvaliteten vid ett kodningssystem som använder lineär prognostisering

Also Published As

Publication number Publication date
EP0599569B1 (en) 1999-06-09
FI95086C (sv) 1995-12-11
DE69325237T2 (de) 1999-12-16
EP0599569A2 (en) 1994-06-01
DE69325237D1 (de) 1999-07-15
FI925376A (sv) 1994-05-27
US5596677A (en) 1997-01-21
JPH06222798A (ja) 1994-08-12
AU665283B2 (en) 1995-12-21
FI925376A0 (sv) 1992-11-26
AU5189793A (en) 1994-06-09
EP0599569A3 (en) 1994-09-07

Similar Documents

Publication Publication Date Title
FI95086B (sv) Förfarande för effektiv kodning av en talsignal
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
JP4927257B2 (ja) 可変レートスピーチ符号化
JP4550289B2 (ja) Celp符号変換
EP1050040B1 (en) A decoding method and system comprising an adaptive postfilter
EP1224662B1 (en) Variable bit-rate celp coding of speech with phonetic classification
RU2331933C2 (ru) Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
US7191120B2 (en) Speech encoding method, apparatus and program
US5933803A (en) Speech encoding at variable bit rate
US6064962A (en) Formant emphasis method and formant emphasis filter device
JP3653826B2 (ja) 音声復号化方法及び装置
JP2006525533A5 (sv)
KR20010099763A (ko) 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법
KR20010101422A (ko) 매핑 매트릭스에 의한 광대역 음성 합성
JP2010181890A (ja) 音声符号化用開ループピッチ処理
WO2000038177A1 (en) Periodic speech coding
US8620645B2 (en) Non-causal postfilter
JP4040126B2 (ja) 音声復号化方法および装置
JP2004517348A (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
US5884251A (en) Voice coding and decoding method and device therefor
JP4558205B2 (ja) スピーチコーダパラメータの量子化方法
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
EP1397655A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders

Legal Events

Date Code Title Description
BB Publication of examined application