FI115327B - Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik - Google Patents

Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik Download PDF

Info

Publication number
FI115327B
FI115327B FI935423A FI935423A FI115327B FI 115327 B FI115327 B FI 115327B FI 935423 A FI935423 A FI 935423A FI 935423 A FI935423 A FI 935423A FI 115327 B FI115327 B FI 115327B
Authority
FI
Finland
Prior art keywords
index
subframe
normalized
contribution
maximum
Prior art date
Application number
FI935423A
Other languages
English (en)
Finnish (fi)
Other versions
FI935423A0 (fi
FI935423A (sv
Inventor
Luca Cellario
Daniele Sereno
Original Assignee
Telecom Italia Mobile Spa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telecom Italia Mobile Spa filed Critical Telecom Italia Mobile Spa
Publication of FI935423A0 publication Critical patent/FI935423A0/fi
Publication of FI935423A publication Critical patent/FI935423A/sv
Application granted granted Critical
Publication of FI115327B publication Critical patent/FI115327B/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Claims (12)

1. Förfarande för kvantisering av excitationsamplitud i talkodare ba-serat pa teknik med analys genom syntes, varvid talsignalsampel, som skall ko-das, organiseras i ramar, var och en innefattande ett flertal angränsande del- 5 ramar, varvid för var och en en optimal excitationssignal mäste bestämmas genom att minska ett perceptuellt betydelsefullt distorsionsmätt till minimum, varvid excitationssignalen innefattar ett första bidrag, som representerar en signalform, samt ett andra bidrag, som representerar en signalamplitud, varvid bäda bidragen väljs i respektive grupper, inom vilka varje möjligt bidrag identifie-10 ras med ett innovationsindex i[s(j)] respektive ett ökningsindex i[g(j)], kanne-t e c k n a t av att under kodning, excitationssignalens amplitudbidrag kvantise-ras för varje delram, som bestämmer ett motsvarande ökningsindex i(g); att det maximala värdet i(gmax), erhället i en ram genom ökningsindex i(g), bestäms; att ett normaliserat index i(gnor), som är relevant för varje delram, beräknas sä-15 som skillnaden mellan maximalindex i(gmax) och delramökningsindex i(g); att maximalindex i(gmax) och gruppen av normaliserade index i(gnor) kodas och sänds för att representera amplitudbidrag, som är relevanta för en ram; och att, under avkodning, ökningsindex i(g) för varje delram rekonstrueras utgäende frän maximalindex i(gmax) i ramen och frän normaliserat index i(gnor), som är rele-20 vant för delramen.
2. Förfarande enligt patentkrav 1,kännetecknat av att nämn- ... da maximalindex och alla normaliserade index identifierar kvantiserade ampli- • · · : ·[ tudvärden i en och samma grupp. :.i
3. Förfarande enligt patentkrav 2, k ä n n e t e c k n a t av att i det 25 fall, da maximalindex i en ram i(gmax) identifierar ett kvantiserat amplitudvärde, som ligger under ett första tröskelvärde, används det ökningsindex, som hör Γ·’: samman med nämnda första tröskelvärde, för att bestämma normaliserade in- :';'; dex i(gnor), och kodas och sänds istället för maximalindex.
4. Förfarande enligt patentkrav 2 eller 3, kännetecknat av att 30 gruppen med formbidragen även innefattar ett nollbidrag samt av att den rele-^ vanta informationen, när det normaliserade indexet i(gnor) i en delram identifie rar ett kvantiserat amplitudvärde högre än ett andra tröskelvärde, sänds medelst det innovationsindex, som svarar mot nollformbidraget, för att undertrycka exci-: tationen för denna delram. * 17 115327
5. Förfarande enligt patentkrav 4, k ä n n e t e c k n a t av att det index, som hör samman med nämnda andra tröskelvärde, kodas och sänds sä-som normaliserat index.
6. Förfarande enligt nagot av föregäende patentkrav, kännetec 5 k-n a t av att excitationssignalen för en delram erhalls som en kombination av excitationer, valda i separata delgrupper, innefattande en huvudgrupp och en el-ler flera sekundära delgrupper, samt av att amplitudbidraget, för huvuddelgrup-pen, kvantiseras med användning av nämnda maximalindex och nämnda nor-maliserade index, samt av att för varje sekundär delgrupp amplitudbidraget 10 kvantiseras enbart medelst en grupp av differentiella index, ett per delram, var-vid varje differentiellt index, som är relevant för den sekundära delgruppen eller för en sekundär delgrupp, erhalls genom att det ökningsindex, som är relevant för den förekommande sekundära delgruppen, subtraheras frän det ökningsindex, som bestäms för samma delram för den tidigare sekundära delgruppen el-15 ler för huvuddelgruppen, när det gäller den första sekundära delgruppen eller en enda sekundär delgrupp.
7. Förfarande enligt patentkrav 6, kännetecknat av att i det fall, varvid ett differentiellt index är högre än ett första förinställt positivt värde, det motsvarande excitationsformbidraget undertrycks och, i det fall, varvid 20 nämnda differentiella index är lägre än ett andra förutbestämt värde, detsamma ges ett värde, som inte är lägre än det andra förinställda värdet.
8. Förfarande enligt patentkrave 1, 2, 3, 4, 5, 6, eller 7, k ä n n e- ·' ‘ t e c k n a t av att de värden, som svarar mot nämnda första och andra :: tröskelvärden, sänds sasom index i(gmax) och i(gnor).
9. Anordning för att kvantisera exciteringsamplitud i talkodare, ; : baserade pä teknik med analys genom syntes, varvid sampel av den talsignal, i som skall kodas, delas i ramar, var och en innefattande ett flertal angränsande ; delramar, varvid för var och en bestäms en optimal excitationssignal genom minskning av ett perceptuellt betydelsefullt distorsionsmatt till minimum, varvid 30 nämnda excitationssignal innefattar ett första bidrag, som representerar ! signalformen, och ett andra bidrag som representerar signalamplituden, varvid bäda bidragen väljs i respektive grupper, inom vilka varje möjligt bidrag '·· identifieras med ett innovationsindex i[s(j)J respektive ett förstärkningsindex i: i[g(j)], kännetecknad av att anordningen vid sändarsidan innefattar: 35. organ (QU) för att kvantisera amplitudbidragsvärden, som bestäms av en distorsionsminimeringsenhet för varje möjligt formbidrag, varvid kvantiserings- 18 115327 organet (QU) matar kvantiserade amplitudvärden samt ökningsindex, som represeneterar dessa; - ett logiskt jämförelsenät (CFR), som frän kvantiseringsorganet, vid varje delram, mottar det ökningsindex i(g), som identifierar det optimala amplitud- 5 bidraget för denna delram, och som är anordnat att igenkänna och till en index-kodningskrets (CD) sända, vid slutet av en ram, maximalindexet i(gmax) bland de mottagna ökningsindex; - organ (R1) för att temporärt lagra ökningsindex i(g), som är relevanta för en ram; och 10. organ (S3) för att beräkna en grupp av normaliserade index i(nor), ett per delram, varvid beräkningsorganet frän det logiska jämförelsenätet (CFR) mottar maximalindexet och frän lagringsorganet (R1) de lagrade förstärkningsindex, och för att beräkna nämnda grupp av normaliserade index säsom skillnaden mellan maximalindex i(gmax) och vart och ett av de lagrade index i(g) i nämnda 15 lagringsorgan, varvid de normaliserade index matas till indexkodningskretsen (CD); samt av att anordningen pä mottagningssidan innefattar organ (S2) för att re- konstruera ett ökningindes i(g) för varje delram utgäende frän maximalindexet och frän de normaliserade index, avkokdade i en avkodningskrets (DC), och för 20 att mata ett sädant index i(g) som en läsadress till ett minne (VG), som innehäller gruppen av kvantiserade amplitudvärden.
10. Anordning enligt patentkrav 9, kän netecknad av att det ί : logiska jämförelsenätet (CFR) vid början av varje ram lagrar ett initialvärde för • » : maximalindex i(gmax), varvid nämnda initialvärde är ett första tröskelvärde, som 25 representerar det minsta tillätna värdet för maximalindex i(gmax).
: ; : 11. Anordning enligt patentkrav 9, kännetecknad av att organet (S3) för beräkning av normaliserade index matar nämnda normaliserade index tili jämförelseorgan (CM), som jämför varje normaliserat index med ett andra tröskelvärde och vid utgängen, vid varje jämförelse, matar : § 30 antingen det normaliserade indexet eller det andra tröskelvärdet, beroende pä ;!; vilket som är störst. t
12. Anordning enligt patentkrav 11,kännetecknad av att jämförelseorganet (CM), närhelst ett normaliserat index överskrider nämnda ' ‘andra tröskelvärde, signalerar detta överskridande även tili minimeringsenheten Λ 35 (EL) för att undertrycka det motsvarande formbidraget av excitationssignalen genom att sända innovationsindex svarande mot ett nollformbidrag.
FI935423A 1992-12-04 1993-12-03 Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik FI115327B (sv)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ITTO920982 1992-12-04
ITTO920982A IT1257431B (it) 1992-12-04 1992-12-04 Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi

Publications (3)

Publication Number Publication Date
FI935423A0 FI935423A0 (fi) 1993-12-03
FI935423A FI935423A (sv) 1994-06-05
FI115327B true FI115327B (sv) 2005-04-15

Family

ID=11410902

Family Applications (1)

Application Number Title Priority Date Filing Date
FI935423A FI115327B (sv) 1992-12-04 1993-12-03 Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik

Country Status (10)

Country Link
US (1) US5519807A (sv)
EP (1) EP0600504B1 (sv)
JP (1) JP3204581B2 (sv)
AT (1) ATE172045T1 (sv)
CA (1) CA2110645C (sv)
DE (2) DE600504T1 (sv)
ES (1) ES2054606T3 (sv)
FI (1) FI115327B (sv)
GR (1) GR940300069T1 (sv)
IT (1) IT1257431B (sv)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW419645B (en) * 1996-05-24 2001-01-21 Koninkl Philips Electronics Nv A method for coding Human speech and an apparatus for reproducing human speech so coded
US6069940A (en) * 1997-09-19 2000-05-30 Siemens Information And Communication Networks, Inc. Apparatus and method for adding a subject line to voice mail messages
US6370238B1 (en) 1997-09-19 2002-04-09 Siemens Information And Communication Networks Inc. System and method for improved user interface in prompting systems
US6584181B1 (en) 1997-09-19 2003-06-24 Siemens Information & Communication Networks, Inc. System and method for organizing multi-media messages folders from a displayless interface and selectively retrieving information using voice labels
SE519563C2 (sv) * 1998-09-16 2003-03-11 Ericsson Telefon Ab L M Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
DE10249386B3 (de) * 2002-10-23 2004-07-08 Pingo Erzeugnisse Gmbh Mittel zur präventiven und abwehrenden Bekämpfung von Metallbränden
US7542899B2 (en) * 2003-09-30 2009-06-02 Alcatel-Lucent Usa Inc. Method and apparatus for adjusting the level of a speech signal in its encoded format
US8265929B2 (en) * 2004-12-08 2012-09-11 Electronics And Telecommunications Research Institute Embedded code-excited linear prediction speech coding and decoding apparatus and method
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
MY164399A (en) * 2009-10-20 2017-12-15 Fraunhofer Ges Forschung Multi-mode audio codec and celp coding adapted therefore
US10373608B2 (en) * 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1229681A (en) * 1984-03-06 1987-11-24 Kazunori Ozawa Method and apparatus for speech-band signal coding
US4704730A (en) * 1984-03-12 1987-11-03 Allophonix, Inc. Multi-state speech encoder and decoder
CA1255802A (en) * 1984-07-05 1989-06-13 Kazunori Ozawa Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
JPS6332599A (ja) * 1986-07-25 1988-02-12 松下電器産業株式会社 音声符号化装置
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4803730A (en) * 1986-10-31 1989-02-07 American Telephone And Telegraph Company, At&T Bell Laboratories Fast significant sample detection for a pitch detector
DE68912692T2 (de) * 1988-09-21 1994-05-26 Nippon Electric Co Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale.
EP0422232B1 (en) * 1989-04-25 1996-11-13 Kabushiki Kaisha Toshiba Voice encoder
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
DE69129329T2 (de) * 1990-09-14 1998-09-24 Fujitsu Ltd Sprachkodierungsystem
US5369724A (en) * 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients

Also Published As

Publication number Publication date
DE69321444T2 (de) 1999-04-22
FI935423A0 (fi) 1993-12-03
CA2110645C (en) 1998-06-16
JPH06348300A (ja) 1994-12-22
DE600504T1 (de) 1994-12-08
IT1257431B (it) 1996-01-16
EP0600504B1 (en) 1998-10-07
CA2110645A1 (en) 1994-06-05
ES2054606T3 (es) 1998-12-16
ITTO920982A0 (it) 1992-12-04
GR940300069T1 (en) 1994-10-31
JP3204581B2 (ja) 2001-09-04
ITTO920982A1 (it) 1994-06-04
ATE172045T1 (de) 1998-10-15
DE69321444D1 (de) 1998-11-12
EP0600504A1 (en) 1994-06-08
US5519807A (en) 1996-05-21
FI935423A (sv) 1994-06-05
ES2054606T1 (es) 1994-08-16

Similar Documents

Publication Publication Date Title
US6014622A (en) Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
EP0696026B1 (en) Speech coding device
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
EP1353323B1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
FI115327B (sv) Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
US7792679B2 (en) Optimized multiple coding method
JP3196595B2 (ja) 音声符号化装置
JP2002202799A (ja) 音声符号変換装置
WO1994023426A1 (en) Vector quantizer method and apparatus
US6148282A (en) Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure
EP1162604B1 (en) High quality speech coder at low bit rates
US6094630A (en) Sequential searching speech coding device
US5978758A (en) Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output
KR100277096B1 (ko) 음성압축을 위한 코드워드와 양자화된 이득 선택방법
EP0910063B1 (en) Speech parameter coding method
Miki et al. Pitch synchronous innovation code excited linear prediction (PSI‐CELP)
Kövesi et al. A multi-rate codec family based on GSM EFR and ITU-t g. 729.
Popescu et al. A DIFFERENTIAL, ENCODING, METHOD FOR THE ITP DELAY IN CELP
JPH056200A (ja) 音声符号化方式
JP2001100799A (ja) 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体
JPH06138897A (ja) 音声符号化装置

Legal Events

Date Code Title Description
GB Transfer or assigment of application

Owner name: TELECOM ITALIA MOBILE S.P.A.

FG Patent granted

Ref document number: 115327

Country of ref document: FI

MA Patent expired