FI115327B - Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik - Google Patents
Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik Download PDFInfo
- Publication number
- FI115327B FI115327B FI935423A FI935423A FI115327B FI 115327 B FI115327 B FI 115327B FI 935423 A FI935423 A FI 935423A FI 935423 A FI935423 A FI 935423A FI 115327 B FI115327 B FI 115327B
- Authority
- FI
- Finland
- Prior art keywords
- index
- subframe
- normalized
- contribution
- maximum
- Prior art date
Links
- 230000005284 excitation Effects 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005516 engineering process Methods 0.000 title description 3
- 238000013139 quantization Methods 0.000 claims abstract description 30
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 20
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 19
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 3
- 229920006395 saturated elastomer Polymers 0.000 claims 1
- 239000013598 vector Substances 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 230000003321 amplification Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Claims (12)
1. Förfarande för kvantisering av excitationsamplitud i talkodare ba-serat pa teknik med analys genom syntes, varvid talsignalsampel, som skall ko-das, organiseras i ramar, var och en innefattande ett flertal angränsande del- 5 ramar, varvid för var och en en optimal excitationssignal mäste bestämmas genom att minska ett perceptuellt betydelsefullt distorsionsmätt till minimum, varvid excitationssignalen innefattar ett första bidrag, som representerar en signalform, samt ett andra bidrag, som representerar en signalamplitud, varvid bäda bidragen väljs i respektive grupper, inom vilka varje möjligt bidrag identifie-10 ras med ett innovationsindex i[s(j)] respektive ett ökningsindex i[g(j)], kanne-t e c k n a t av att under kodning, excitationssignalens amplitudbidrag kvantise-ras för varje delram, som bestämmer ett motsvarande ökningsindex i(g); att det maximala värdet i(gmax), erhället i en ram genom ökningsindex i(g), bestäms; att ett normaliserat index i(gnor), som är relevant för varje delram, beräknas sä-15 som skillnaden mellan maximalindex i(gmax) och delramökningsindex i(g); att maximalindex i(gmax) och gruppen av normaliserade index i(gnor) kodas och sänds för att representera amplitudbidrag, som är relevanta för en ram; och att, under avkodning, ökningsindex i(g) för varje delram rekonstrueras utgäende frän maximalindex i(gmax) i ramen och frän normaliserat index i(gnor), som är rele-20 vant för delramen.
2. Förfarande enligt patentkrav 1,kännetecknat av att nämn- ... da maximalindex och alla normaliserade index identifierar kvantiserade ampli- • · · : ·[ tudvärden i en och samma grupp. :.i
3. Förfarande enligt patentkrav 2, k ä n n e t e c k n a t av att i det 25 fall, da maximalindex i en ram i(gmax) identifierar ett kvantiserat amplitudvärde, som ligger under ett första tröskelvärde, används det ökningsindex, som hör Γ·’: samman med nämnda första tröskelvärde, för att bestämma normaliserade in- :';'; dex i(gnor), och kodas och sänds istället för maximalindex.
4. Förfarande enligt patentkrav 2 eller 3, kännetecknat av att 30 gruppen med formbidragen även innefattar ett nollbidrag samt av att den rele-^ vanta informationen, när det normaliserade indexet i(gnor) i en delram identifie rar ett kvantiserat amplitudvärde högre än ett andra tröskelvärde, sänds medelst det innovationsindex, som svarar mot nollformbidraget, för att undertrycka exci-: tationen för denna delram. * 17 115327
5. Förfarande enligt patentkrav 4, k ä n n e t e c k n a t av att det index, som hör samman med nämnda andra tröskelvärde, kodas och sänds sä-som normaliserat index.
6. Förfarande enligt nagot av föregäende patentkrav, kännetec 5 k-n a t av att excitationssignalen för en delram erhalls som en kombination av excitationer, valda i separata delgrupper, innefattande en huvudgrupp och en el-ler flera sekundära delgrupper, samt av att amplitudbidraget, för huvuddelgrup-pen, kvantiseras med användning av nämnda maximalindex och nämnda nor-maliserade index, samt av att för varje sekundär delgrupp amplitudbidraget 10 kvantiseras enbart medelst en grupp av differentiella index, ett per delram, var-vid varje differentiellt index, som är relevant för den sekundära delgruppen eller för en sekundär delgrupp, erhalls genom att det ökningsindex, som är relevant för den förekommande sekundära delgruppen, subtraheras frän det ökningsindex, som bestäms för samma delram för den tidigare sekundära delgruppen el-15 ler för huvuddelgruppen, när det gäller den första sekundära delgruppen eller en enda sekundär delgrupp.
7. Förfarande enligt patentkrav 6, kännetecknat av att i det fall, varvid ett differentiellt index är högre än ett första förinställt positivt värde, det motsvarande excitationsformbidraget undertrycks och, i det fall, varvid 20 nämnda differentiella index är lägre än ett andra förutbestämt värde, detsamma ges ett värde, som inte är lägre än det andra förinställda värdet.
8. Förfarande enligt patentkrave 1, 2, 3, 4, 5, 6, eller 7, k ä n n e- ·' ‘ t e c k n a t av att de värden, som svarar mot nämnda första och andra :: tröskelvärden, sänds sasom index i(gmax) och i(gnor).
9. Anordning för att kvantisera exciteringsamplitud i talkodare, ; : baserade pä teknik med analys genom syntes, varvid sampel av den talsignal, i som skall kodas, delas i ramar, var och en innefattande ett flertal angränsande ; delramar, varvid för var och en bestäms en optimal excitationssignal genom minskning av ett perceptuellt betydelsefullt distorsionsmatt till minimum, varvid 30 nämnda excitationssignal innefattar ett första bidrag, som representerar ! signalformen, och ett andra bidrag som representerar signalamplituden, varvid bäda bidragen väljs i respektive grupper, inom vilka varje möjligt bidrag '·· identifieras med ett innovationsindex i[s(j)J respektive ett förstärkningsindex i: i[g(j)], kännetecknad av att anordningen vid sändarsidan innefattar: 35. organ (QU) för att kvantisera amplitudbidragsvärden, som bestäms av en distorsionsminimeringsenhet för varje möjligt formbidrag, varvid kvantiserings- 18 115327 organet (QU) matar kvantiserade amplitudvärden samt ökningsindex, som represeneterar dessa; - ett logiskt jämförelsenät (CFR), som frän kvantiseringsorganet, vid varje delram, mottar det ökningsindex i(g), som identifierar det optimala amplitud- 5 bidraget för denna delram, och som är anordnat att igenkänna och till en index-kodningskrets (CD) sända, vid slutet av en ram, maximalindexet i(gmax) bland de mottagna ökningsindex; - organ (R1) för att temporärt lagra ökningsindex i(g), som är relevanta för en ram; och 10. organ (S3) för att beräkna en grupp av normaliserade index i(nor), ett per delram, varvid beräkningsorganet frän det logiska jämförelsenätet (CFR) mottar maximalindexet och frän lagringsorganet (R1) de lagrade förstärkningsindex, och för att beräkna nämnda grupp av normaliserade index säsom skillnaden mellan maximalindex i(gmax) och vart och ett av de lagrade index i(g) i nämnda 15 lagringsorgan, varvid de normaliserade index matas till indexkodningskretsen (CD); samt av att anordningen pä mottagningssidan innefattar organ (S2) för att re- konstruera ett ökningindes i(g) för varje delram utgäende frän maximalindexet och frän de normaliserade index, avkokdade i en avkodningskrets (DC), och för 20 att mata ett sädant index i(g) som en läsadress till ett minne (VG), som innehäller gruppen av kvantiserade amplitudvärden.
10. Anordning enligt patentkrav 9, kän netecknad av att det ί : logiska jämförelsenätet (CFR) vid början av varje ram lagrar ett initialvärde för • » : maximalindex i(gmax), varvid nämnda initialvärde är ett första tröskelvärde, som 25 representerar det minsta tillätna värdet för maximalindex i(gmax).
: ; : 11. Anordning enligt patentkrav 9, kännetecknad av att organet (S3) för beräkning av normaliserade index matar nämnda normaliserade index tili jämförelseorgan (CM), som jämför varje normaliserat index med ett andra tröskelvärde och vid utgängen, vid varje jämförelse, matar : § 30 antingen det normaliserade indexet eller det andra tröskelvärdet, beroende pä ;!; vilket som är störst. t
12. Anordning enligt patentkrav 11,kännetecknad av att jämförelseorganet (CM), närhelst ett normaliserat index överskrider nämnda ' ‘andra tröskelvärde, signalerar detta överskridande även tili minimeringsenheten Λ 35 (EL) för att undertrycka det motsvarande formbidraget av excitationssignalen genom att sända innovationsindex svarande mot ett nollformbidrag.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ITTO920982 | 1992-12-04 | ||
ITTO920982A IT1257431B (it) | 1992-12-04 | 1992-12-04 | Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi |
Publications (3)
Publication Number | Publication Date |
---|---|
FI935423A0 FI935423A0 (fi) | 1993-12-03 |
FI935423A FI935423A (sv) | 1994-06-05 |
FI115327B true FI115327B (sv) | 2005-04-15 |
Family
ID=11410902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI935423A FI115327B (sv) | 1992-12-04 | 1993-12-03 | Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik |
Country Status (10)
Country | Link |
---|---|
US (1) | US5519807A (sv) |
EP (1) | EP0600504B1 (sv) |
JP (1) | JP3204581B2 (sv) |
AT (1) | ATE172045T1 (sv) |
CA (1) | CA2110645C (sv) |
DE (2) | DE600504T1 (sv) |
ES (1) | ES2054606T3 (sv) |
FI (1) | FI115327B (sv) |
GR (1) | GR940300069T1 (sv) |
IT (1) | IT1257431B (sv) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW419645B (en) * | 1996-05-24 | 2001-01-21 | Koninkl Philips Electronics Nv | A method for coding Human speech and an apparatus for reproducing human speech so coded |
US6069940A (en) * | 1997-09-19 | 2000-05-30 | Siemens Information And Communication Networks, Inc. | Apparatus and method for adding a subject line to voice mail messages |
US6370238B1 (en) | 1997-09-19 | 2002-04-09 | Siemens Information And Communication Networks Inc. | System and method for improved user interface in prompting systems |
US6584181B1 (en) | 1997-09-19 | 2003-06-24 | Siemens Information & Communication Networks, Inc. | System and method for organizing multi-media messages folders from a displayless interface and selectively retrieving information using voice labels |
SE519563C2 (sv) * | 1998-09-16 | 2003-03-11 | Ericsson Telefon Ab L M | Förfarande och kodare för linjär prediktiv analys-genom- synteskodning |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
DE60214027T2 (de) * | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
DE10249386B3 (de) * | 2002-10-23 | 2004-07-08 | Pingo Erzeugnisse Gmbh | Mittel zur präventiven und abwehrenden Bekämpfung von Metallbränden |
US7542899B2 (en) * | 2003-09-30 | 2009-06-02 | Alcatel-Lucent Usa Inc. | Method and apparatus for adjusting the level of a speech signal in its encoded format |
US8265929B2 (en) * | 2004-12-08 | 2012-09-11 | Electronics And Telecommunications Research Institute | Embedded code-excited linear prediction speech coding and decoding apparatus and method |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
MY164399A (en) * | 2009-10-20 | 2017-12-15 | Fraunhofer Ges Forschung | Multi-mode audio codec and celp coding adapted therefore |
US10373608B2 (en) * | 2015-10-22 | 2019-08-06 | Texas Instruments Incorporated | Time-based frequency tuning of analog-to-information feature extraction |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1229681A (en) * | 1984-03-06 | 1987-11-24 | Kazunori Ozawa | Method and apparatus for speech-band signal coding |
US4704730A (en) * | 1984-03-12 | 1987-11-03 | Allophonix, Inc. | Multi-state speech encoder and decoder |
CA1255802A (en) * | 1984-07-05 | 1989-06-13 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses |
JPS6332599A (ja) * | 1986-07-25 | 1988-02-12 | 松下電器産業株式会社 | 音声符号化装置 |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4803730A (en) * | 1986-10-31 | 1989-02-07 | American Telephone And Telegraph Company, At&T Bell Laboratories | Fast significant sample detection for a pitch detector |
DE68912692T2 (de) * | 1988-09-21 | 1994-05-26 | Nippon Electric Co | Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale. |
EP0422232B1 (en) * | 1989-04-25 | 1996-11-13 | Kabushiki Kaisha Toshiba | Voice encoder |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
DE69129329T2 (de) * | 1990-09-14 | 1998-09-24 | Fujitsu Ltd | Sprachkodierungsystem |
US5369724A (en) * | 1992-01-17 | 1994-11-29 | Massachusetts Institute Of Technology | Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients |
-
1992
- 1992-12-04 IT ITTO920982A patent/IT1257431B/it active IP Right Grant
-
1993
- 1993-10-12 US US08/135,298 patent/US5519807A/en not_active Expired - Lifetime
- 1993-12-02 JP JP32962093A patent/JP3204581B2/ja not_active Expired - Lifetime
- 1993-12-03 ES ES93119522T patent/ES2054606T3/es not_active Expired - Lifetime
- 1993-12-03 FI FI935423A patent/FI115327B/sv not_active IP Right Cessation
- 1993-12-03 CA CA002110645A patent/CA2110645C/en not_active Expired - Lifetime
- 1993-12-03 EP EP93119522A patent/EP0600504B1/en not_active Expired - Lifetime
- 1993-12-03 AT AT93119522T patent/ATE172045T1/de active
- 1993-12-03 DE DE0600504T patent/DE600504T1/de active Pending
- 1993-12-03 DE DE69321444T patent/DE69321444T2/de not_active Expired - Lifetime
-
1994
- 1994-10-31 GR GR940300069T patent/GR940300069T1/el unknown
Also Published As
Publication number | Publication date |
---|---|
DE69321444T2 (de) | 1999-04-22 |
FI935423A0 (fi) | 1993-12-03 |
CA2110645C (en) | 1998-06-16 |
JPH06348300A (ja) | 1994-12-22 |
DE600504T1 (de) | 1994-12-08 |
IT1257431B (it) | 1996-01-16 |
EP0600504B1 (en) | 1998-10-07 |
CA2110645A1 (en) | 1994-06-05 |
ES2054606T3 (es) | 1998-12-16 |
ITTO920982A0 (it) | 1992-12-04 |
GR940300069T1 (en) | 1994-10-31 |
JP3204581B2 (ja) | 2001-09-04 |
ITTO920982A1 (it) | 1994-06-04 |
ATE172045T1 (de) | 1998-10-15 |
DE69321444D1 (de) | 1998-11-12 |
EP0600504A1 (en) | 1994-06-08 |
US5519807A (en) | 1996-05-21 |
FI935423A (sv) | 1994-06-05 |
ES2054606T1 (es) | 1994-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6014622A (en) | Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization | |
EP0696026B1 (en) | Speech coding device | |
JP3151874B2 (ja) | 音声パラメータ符号化方式および装置 | |
EP1353323B1 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
FI115327B (sv) | Förfarande samt anordning för kvantisering av excitationsförstärkningar i talkodare, som baserade på syntesanalysteknik | |
US6594626B2 (en) | Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook | |
US7792679B2 (en) | Optimized multiple coding method | |
JP3196595B2 (ja) | 音声符号化装置 | |
JP2002202799A (ja) | 音声符号変換装置 | |
WO1994023426A1 (en) | Vector quantizer method and apparatus | |
US6148282A (en) | Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure | |
EP1162604B1 (en) | High quality speech coder at low bit rates | |
US6094630A (en) | Sequential searching speech coding device | |
US5978758A (en) | Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output | |
KR100277096B1 (ko) | 음성압축을 위한 코드워드와 양자화된 이득 선택방법 | |
EP0910063B1 (en) | Speech parameter coding method | |
Miki et al. | Pitch synchronous innovation code excited linear prediction (PSI‐CELP) | |
Kövesi et al. | A multi-rate codec family based on GSM EFR and ITU-t g. 729. | |
Popescu et al. | A DIFFERENTIAL, ENCODING, METHOD FOR THE ITP DELAY IN CELP | |
JPH056200A (ja) | 音声符号化方式 | |
JP2001100799A (ja) | 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH06138897A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GB | Transfer or assigment of application |
Owner name: TELECOM ITALIA MOBILE S.P.A. |
|
FG | Patent granted |
Ref document number: 115327 Country of ref document: FI |
|
MA | Patent expired |