FI95086C - Menetelmä puhesignaalin tehokkaaksi koodaamiseksi - Google Patents
Menetelmä puhesignaalin tehokkaaksi koodaamiseksi Download PDFInfo
- Publication number
- FI95086C FI95086C FI925376A FI925376A FI95086C FI 95086 C FI95086 C FI 95086C FI 925376 A FI925376 A FI 925376A FI 925376 A FI925376 A FI 925376A FI 95086 C FI95086 C FI 95086C
- Authority
- FI
- Finland
- Prior art keywords
- degree
- modeling
- model
- synthesis
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 67
- 230000005284 excitation Effects 0.000 claims description 49
- 238000001914 filtration Methods 0.000 claims description 42
- 238000003786 synthesis reaction Methods 0.000 claims description 37
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 230000006978 adaptation Effects 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000001308 synthesis method Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 5
- 101000799321 Lytechinus pictus Actin, cytoskeletal 4 Proteins 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
, 95086
Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
Keksinnön kohteena on puheenkoodausmenetelmä, jossa puhesig-5 naalin koodaamisessa a) kehitetään lyhyen aikavälin analysaattoreissa sisääntule-vaa signaalia vastaava joukko ennusteparametrejä, jotka jokaisessa koodattavana olevassa puhesignaalin lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, 10 b) muodostetaan herätesignaali, joka syöttämällä ennustuspa-rametrien mukaan toimivalle synteesisuodattimelle saadaan syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali.
15 Puheen digitaalisessa koodauksessa käytetään usein ihmisen puheentuottoon perustuvaa kaksiosaista mallia, johon kuuluu ensinnäkin herätteen muodostaminen (ihmisellä: äänihuulten värähtely tai kuristuskohta ääniväylässä) ja herätesignaalin muokkaus suodatusoperaatiossa (ihmisellä: ääniväylässä ta-20 pahtuva muokkaus). Puhekoodereissa käytettävää äänikanavan muokkausta mallintavaa suodatusoperaatiota kutsutaan yleisesti ns. lyhyen aikavälin suodatukseksi tai lyhyen aikavälin mallinnukseksi. Herätesignaalin tehokkaaseen koodaamiseen on kehitetty erilaisia menetelmiä ja malleja, joilla on 25 kyetty herätesignaalin välittämiseksi tarvittavaa siirtono-: peutta alentamaan merkittävästi huonontamatta silti juuri kaan puhesignaalin laatua. Tällä hetkellä tehokkaimmiksi puheenkoodausmenetelmiksi ovat osoittautuneet analyysi synteesin kautta -menetelmää käyttäen herätesignaalille mahdol-30 lisimman pienellä siirtonopeudella välitettävissä olevan esitysmuodon hakevat puhekooderit, joista mainittakoon koo-. diherätteinen lineaarinen ennustus (Code Excited Linear Pre diction, ks. esim. patenttijulkaisu US-4 817 157). Myös lyhyen aikavälin suodatusmallin parametrien koodaamiseksi on 35 kehitetty tehokkaita menetelmiä kuten esim. välittäminen
Line Spectrum Pair -esitysmuodossa (ks. julkaisu F.K. Soong, B.H. Juang: "Optimal quantization of LSP parameters using 2 95086 delayed decisions", Proceedings of the 1990 International Conference on Acoustics, Speech, and Signal Processing).
Vaikka tehokkaita menetelmiä on kehitetty sekä herätesignaa-5 Iin että suodatusmallin välittämiseen, ei aiemmin esitetyissä menetelmissä ole otettu huomioon sitä, että eri äänteille äänikanavassa suoritettava muokkaus on erityyppinen eri ään-netyypeille ja siten erilailla mallinnettavissa lyhyen aikavälin suodattimessa. Tästä syystä mahdollisimman tehokkaan 10 puheen koodauksen aikaansaamiseksi suodatuksen astelukua tulisi adaptoida koodattavana olevan puhesignaalin mukaan. Alalla aiemmin tunnetuissa menetelmissä on kiinteäasteisen suodatinitiallinnuksen takia käytössä mallinnuksen asteluku, joka on soinnittomilla äänteillä tarpeettoman suuri niiden 15 suhteellisen tasaisesti jakautuneen spektrikäyrän välittämiseen ja johon käytetyt resurssit voitaisiin paremmin hyödyntää herätesignaalin koodaamisessa tai virheenkorjauskoodauk-sessa. Toisaalta kiinteän asteluvun käyttö johtaa soinnillisilla äänteillä helposti liian matala-asteisen suodatusmal-20 Iin käyttämiseen, vaikka soinnillisten äänteiden spektrin formanttirakenteen mallintamista voitaisiin merkittävästi tehostaa suurempaa mallinnusastelukua käyttämällä.
Esillä olevan keksinnön tarkoituksena on aikaansaada sellai-25 nen menetelmä puhesignaalin digitaaliseksi koodaamiseksi, jonka avulla edellä esitetyt puutteet ja ongelmat voitaisiin ratkaista. Tämän saavuttamiseksi keksinnölle on tunnusomaista se, mikä on esitetty patenttivaatimuksena 1. Keksinnön mukaisesti siis ensinnä säädetään lyhyen aikavälin mallin-30 nuksen astelukua adaptiivisesti puhesignaalin mukaan ja toisaalta herätesignaalia ja lyhyen aikavälin suodatusta kuvaa-: vien parametrien siirtonopeuksien keskinäistä suhdetta adap toidaan puhesignaalin mukaan. Koodauksen tehokkuuden kannalta turhan suuren suodatusmallin asteluvun pienentämisellä 35 voidaan herätesignaalin koodaukseen käytettävää siirtonopeutta kasvattaa tai siirtää vapautuvat siirtonopeusresurssit virheenkorjauskoodauksessa käytettäväksi. Toisaalta ää-• nikanavaa mallintavan suodatusoperaation astelukua voidaan il 3 95086 tarvittaessa kasvattaa, mikäli siitä on oleellista hyötyä koodauksessa, ja alentaa vastaavasti herätesignaalin koodaukseen käytettävää siirtonopeutta. Keksinnön mukaista menetelmää voidaan käyttää niin mallinnusvirheen suoraan koo-5 daaviin koodausmenetelmiin kuin suljettua herätesignaalin optimointia koodauksessa käyttäviin analyysi synteesin kautta -menetelmiin. Viimeksimainituissa menetelmissä vältetään keksinnön mukaisella asteluvun adaptoinnilla mallinnettavaan äänteeseen liian suuren mallinnuksen asteluvun käyttö ja 10 siten laskennallista kuormitusta voidaan oleellisesti laskea. Keksinnön mukaisella menetelmällä saavutetaan kiinteä-astelukuista äänikanavan mallinnussuodatusta käyttäviä menetelmiä parempi kokonaismallinnus puhesignaalille ja saadaan siten aikaan tehokas puheen koodaus.
15
Keksinnön mukaisessa menetelmässä käytetään tarkemmin kuvattuna sellaista lyhyen aikavälin suodatusmallia, joka on muodostettu kahdesta osasta eli matala-asteisesta kiinteäas-telukuisesta osuudesta ja asteluvultaan adaptoitavasta osuu-20 desta. Jälkimmäisenä mainittu adaptoitava-astelukuinen osuus tekee mahdolliseksi saavuttaa tarvittaessa korkea kokonais-mallinnuksen asteluku. Näille molemmille ennustusmalleille lasketaan erikseen lyhyen aikavälin ennusteparametrit ja molempien mallien suodatinkertoimien laskenta voi olla suo-25 ritettu millä tahansa alalla tunnetulla menetelmällä, esimerkiksi lineaarisen mallinnuksen yhteydessä jollakin lineaariseen ennustavaan koodaukseen (Linear Predictive Coding, LPC) perustuvalla laskenta-algoritmilla. Molempien mallien mukaisten mallinnusparametrien arvoja adaptoidaan eli ne 30 lasketaan puhesignaalista noin 10-40 ms:n välein. Kiinteä- astelukuisen lyhyen aikavälin suodat initial Iin suodatinkertoi-.' mien laskeminen suoritetaan suoraan koodattavaksi tulevasta puhesignaalista, kun taas adaptoitava-asteisen lyhyen aikavälin mallin suodatinkertoimet lasketaan signaalista, joka 35 on saatu suodattamalla koodattavaksi tuleva puhesignaali kiinteäasteisen mallin käänteissuodattimella. Kiinteäastelukuinen matala-asteinen malli toimii siten esisuodatustoimin-tona adaptoitava-astelukuiselle mallinnukselle. Kun mallin- 4 95086 nuksessa käytetään erillistä matala-asteista suodatinta, voidaan kiinteäasteisessa ja adaptoitava-asteisessa suodat-timessa käyttää erilaisia mallin parametrien adaptointitaajuuksia. Suodatinparametrit mainituille kahdelle lyhyen ai-5 kavälin mallille voidaan siis lähettää vastaanottimelle erilaisin aikavälein. Kiinteäasteisella mallinnuksella voidaan näin tehokkaasti välittää puhujasta ja mikrofonista aiheutuvia hitaasti muuttuvia ja matalalla asteluvulla kohtuullisen hyvin mallinnettavissa olevia spektriominaisuuksia siten, 10 että sen kertoimia adaptoidaan harvemmin kuin nopeasti muuttuvan äänneinformaation sisältäviä adaptoitava-asteisen mallin kertoimia.
Adaptoitava-asteisen lyhyen aikavälin mallinnuksen asteluku 15 säädetään eräässä keksinnön mukaisessa 8 kHz:n näytteenottotaajuudella toimivassa suoritusmuodossa kiinteäasteisen mallinnuksen tulosten mukaan seuraavasti: Asteluku adaptoitava-asteisessa suodattimessa asetetaan pieneksi (luokkaa 2-asteinen) , mikäli koodattavassa signaalilohkossa suurin osa 20 energiasta sijaitsee korkeilla taajuuksilla eli mikäli kiinteän asteluvun mallinnuksessa saatu taajuusvaste on ylipääs-tötyyppinen (helposti mallinnettavaksi luokiteltu soinniton äännetyyppi). Adaptoitava-asteisen mallinnuksen asteluku puolestaan asetetaan suureksi (luokkaa 12-asteinen), mikäli 25 kiinteän asteluvun mallinnuksessa saatu signaalin taajuus-vaste on alipäästötyyppinen (merkityksellisen formanttira-kenteen sisältäväksi luokiteltu soinnillinen äännetyyppi). Kiinteäasteisen mallinnuksen asteluku on vakio ja luokkaa 2-asteinen. Kokonaismallinnuksen asteluvuksi tulee näillä esi-30 merkkiasteluvuilla joko 4 tai 14.
: Toisessa suoritusmuodossa adaptoidaan suodatusmallinnuksen astelukua mallinnuksen onnistumisen mukaan takaisinkytketystä mallinnusvirhesignaalin perusteella. Tässä suoritusmuo-35 dossa voidaan asteluvun säätäminen suorittaa portaattomasti tekemättä karkeaa päätöstä kahden eri mallinnusasteluvun välillä.
s 95086
Seuraavassa selvitetään esimerkein joitakin keksinnön toteutusmuotoja oheisiin kuviin viitaten.
Kuva 1 havainnollistaa lyhyen aikavälin ennustussuodattimen 5 mallinnuksen toimintaa eri mallinnusasteluvuilla kahdelle eri äännetyypille /s/- (kuva la) ja /o/-äänteelle (kuva Ib);
Kuva 2 esittää keksinnön mukaisen menetelmän enkooderia seuraavasti: kokonaismallinnuksen asteluvun adaptointi matalan 10 asteen mallinnuksen kertoimien perusteella (kuva 2a), mallinnuksen asteluvun adaptointi kokonaismallinnusvirheen avulla (kuva 2b) ja virheenkorjauskoodauksen siirtonopeuden adaptointi mallinnuksen asteluvun mukaan (kuva 2c); 15 Kuva 3 esittää keksinnön mukaista menetelmää käyttävän kuvan 2a tai 2b enkooderia vastaavan dekooderin lohkokaaviota;
Kuva 4a on periaatteellinen esitys alalla tunnetusta analyysi synteesin kautta -tyypin menetelmästä, jossa herätesig-20 naalin mallintamisessa käytetään suljettua optimointia, ja kuvat 4b ja 4c esittävät keksinnön mukaisen mallinnuksen soveltamista analyysi synteesin kautta -periaatteella toimiviin puhekoodereihin.
25 Kuva 1 havainnollistaa lyhyen aikavälin mallinnuksen toimin- < taa eri mallinnusasteluvuilla kahdelle eri äännetyypille eli soinnittomalle /s/-äänteelle ja soinnilliselle /^/-äänteelle. Näytteenottotaajuutena on käytetty 8 kHz. Kuvassa la on esitetty (katkoviivalla) soinnittoman äännetyypin /s/-ään-30 teen aaltomuoto ja spektrikäyrä laskettuna FFT-menetelmällä (Fast Fourier Transform). Kuvassa la on esitetty (ehjällä viivalla) myös lyhyen aikavälin LPC-mallinnuksen taajuusvaste kahdella eri mallinnusasteluvulla 4 ja 10 (LPC4 ja LPC10). Kuvassa Ib on esitetty vastaavasti soinnillisen /o/-35 äänteen aaltomuoto ja FFT-spektrikäyrä sekä lyhyen aikavälin LPC-mallinnuksen taajuusvaste kahdella mallinnusasteluvulla . 4 ja 10 (LPC4 ja LPC10). Käytetty 4-asteinen malli (LPC4) pystyy mallintamaan melko hyvin esitetyn soinnittomalle ään- 6 95086 teelle tyypillisen suhteellisen tasaisen taajuussisällön.
Sen sijaan soinnillisten äänteiden tulkinnassa tärkeät spektrin resonanssikohdat pystytään välittämään hyvin vasta suuremmalla mallinnusasteluvulla. Esim. /o/-äänteen neljästä 5 resonanssihuipusta muodostuva spektrikäyrä kyetään mallintamaan kunnolla vasta korkeammalla asteluvulla, esim. 10-as-teisella mallilla (LPC10) kuten kuvasta Ib käy ilmi. Re-sonanssihuiput eli ns. formantit erottuvat LPC10-käyrästä selvästi taajuuksilla n. 500 Hz, 1000 Hz, 2400 Hz ja 3400 10 Hz. Kuvassa la esitetyssä /s/-äänteen mallinnuksessa ei mallin asteluvun kasvattaminen 10:een tuota vastaavaa oleellista parannusta mallinnukseen.
Kuva 2 esittää herätesignaalin suoraan lyhyen aikavälin mal-15 linnuksen virhesignaalista muodostavan koodausmenetelmän enkooderia, jossa on käytetty keksinnön mukaista adaptiivista lyhyen aikavälin suodatusmallinnuksen asteluvun adaptoin-tia. Kuvassa 2a on esitetty suoritusesimerkki enkooderista, jossa suoritetaan asteluvun adaptointi kiinteäasteisen mal-20 Iin kertoimiin perustuen. Puhesignaalille 206 suoritetaan ensin matalan asteen lyhyen aikavälin mallinnus 204, jossa muodostetaan mallia vastaavat suodatinkertoimet a(i); i*l,2,...,M1. Nämä voivat olla joko suoramuotoisen suodattimen kertoimia tai ristikkorakenteisissa suodattimissa käy-25 tettäviä ns. heijastuskertoimia. Lohkossa 204 suoritettava toiminta voidaan tehdä millä tahansa alalla tunnetulla lineaarisen ennustusmalIin suodatinkertoimien laskentamenetelmällä. Mx on vakioarvoinen ja suuruudeltaan tyypillisesti luokkaa 2. Puhesignaali 206 viedään lasketun mallin mukai-30 seen astelukua Mx olevaan käänteissuodattimeen 201. Kiinteän asteluvun käänteissuodattimesta saatava signaali (eli : kiinteäasteisen mallin ennustusvirhe) viedään edelleen adap- toitava-asteiseen käänteissuodatukseen 202. Kuvan suori-tusesimerkissä päätetään lohkossa 207 suodatinkertoimien 35 a(i); i=l,2,...,M1 perusteella adaptoitava-asteisen mallin nuksen 205 asteluvun M2 suuruudesta jäljempänä kuvatulla menetelmällä. Adaptoitava-asteisen suodattimen 202 suodatin-• kertoimet b(j); j=l,2,...,M2 lasketaan lohkossa 205. Koko- 7 95086 naismallinnuksen ennustusvirheelle etsitään sopiva koodattu esitysmuoto koodauslohkossa 203. Muodostetut ennustusvirheen välittävät herätepulssit välitetään dekooderille herätesig-naalina käytettäviksi. Herätepulssien ohella vastaanottimel-5 le välitetään lisäksi sekä matalan kiinteäasteisen mallinnuksen että adaptoitava-asteisen mallinnuksen suodatinker-toimet. Mikäli lohkossa 207 tehdään päätös käyttää adaptoi-tava-asteisessa mallinnuksessa 205 pientä mallinnusastelu-kua, käytetään mallinnuksesta vapautuvat resurssit lohkossa 10 203 suoritettavaan kokonaismallinnusvirheen koodaamiseen.
Lohkossa 203 voidaan mallinnusvirheen koodaaminen suorittaa millä tahansa alalla tunnetulla menetelmällä, esimerkiksi näytteiden määrän rajoittamiseen perustuvalla menetelmällä (ks. esim. julkaisu P. Vary, K. Hellwig, R. Hofmann, R.J.
15 Sluyter, C. Galand, M. Rosso: "Speech codec for the European mobile radio system", Proceedings of the 1988 International Conference on Acoustics, Speech, and Signal Processing). Mikäli toisaalta havaitaan, että lyhyen aikavälin mallintamiseen tarvitaan suurta mallinnusastelukua, ohjataan osa 20 muutoin herätesignaalin koodaamiseen käytettävistä resursseista välittämään lyhyen aikavälin mallin parametrejä, jolloin lyhyen aikavälin mallinnuksen astelukua voidaan kasvattaa. Tämä suoritetaan nostamalla adaptoitava-asteisessa mallinnuksessa käytettävää astelukua.
25 Päätös käytettävän suodatusmallinnuksen asteluvusta tehdään kuvan 2a sovellutusesimerkissä adaptointilohkossa 207 seu-raavalla menettelyllä: mikäli suoritettu kiinteän asteluvun mallinnus osoittaa sisääntulevan signaalin 206 sisältävän 30 suurimman osan energiastaan pienillä taajuuksilla, menetelmässä käytetään lyhyen aikavälin mallinnuksessa suurta aste-lukua. Mikäli taas signaalissa energia on kasaantunut suurille taajuuksille, käytetään matala-asteista mallinnusta. Menetelmä perustuu yksinkertaisimmillaan tulkittuna siihen, 35 että soinnittomien korkeille taajuuksille painottuneiden äänteiden spektrin verhokäyrä ei sisällä soinnillisten äänteiden lailla selviä oleellista informaatiota välittäviä • .
spektrin huippukohtia, jolloin soinnittomien äänteiden koh- 8 95086 dalla voidaan käyttää matalampaa lyhyen aikavälin mallinnusta ja ohjata suurempi osuus siirtokapasiteetista herätesig-naalin koodaamiseen. Toisaalta soinnillisten äänteiden tapauksessa spektrin verhokäyrän välittämiseen on syytä käyt-5 tää korkean asteen suodatinmal1ia, jotta niille tärkeä for-manttirakenne kyetään välittämään koodausmenetelmässä mahdollisimman tarkasti. Kuvan 2a menetelmässä voidaan käyttää kahta eri kokonaismallinnusastelukua eli matalaa soinnittomiksi luokitelluille äänteille (luokkaa 4) ja korkeaa soin-10 nillisiksi luokitelluille äänteille (luokkaa 12).
Kuvassa 2b on esitetty toinen sovellutusesimerkki keksinnön mukaisen menettelyn toteuttamiseksi digitaalisessa puhekoo-derissa. Kuvaan 2a verrattuna erona on mallinnuksen astelu-15 vun adaptointi suoraan kokonaismallinnuksen ennustusvirheen perusteella takaisinkytketysti eikä matalan asteen suodatin-kertoimien perusteella. Asteluvun M2 adaptointi suoritetaan kuvan lohkossa 227 tosiasiallisen ennustusvirheen perusteella kun taas lohkossa 207 adaptointi perustuu kiinteäasteisen 20 mallinnuksen suodatinkertoimiin aiemmin selvitetyllä menetelmällä. Kuvan 2b esimerkissä lohkossa 227 suoritettava mallinnuksen asteluvun adaptointi suoritetaan ennustusvirheen mukaan vertaamalla mallinnuksen asteluvun kasvattamisen vaikutusta ennustusvirheeseen. Menetelmässä mallinnuksen 25 astelukua kasvatetaan kunnes kasvattaminen tuottaa tiettyä kynnysarvoa P^j pienemmän ennustusvirhesignaalin tehon pienenemisen. Tällöin päätellään mallinnuksen asteluvun kasvattamisen lisää olevan tarpeetonta ja valitaan senhetkinen mallinnuksen asteluku käytettäväksi. Menetelmässä kiinteäas-30 teisessa käänteissuodattimessa käsitelty puhesignaali viedään adaptoitava-asteiseen käänteissuodattimeen siten, että adaptoitava-asteisen suodattimen astelukua lähdetään kasvattamaan sallitusta minimiarvosta kunnes havaitaan kynnysarvoa pienempi virhesignaalin pieneneminen tai saavutetaan mene-35 telmässä asetettu suurin sallittu kokonaismallinnusasteluku dmax* Koodattavana oleva puhelohko suodatetaan kullakin eri asteluvun käänteissuodattimella ja lasketaan mallinnusvir-·- heen eli käänteissuodattimen ulostulon teho kullekin eri
II
9 95086 suodatusasteluvulle. Kun suodatinrakenteena käytetään hei-jastuskertoimia käyttävää ristikkosuodatinsuodatinta ei asteluvun kasvattaminen muuta aiempia suodatinkerroinarvoja eli asteluvun kasvattaminen aiheuttaa vain uuden suoda-5 tusoperaation lisäämisen lyhyemmän mailinnusasteen suodattimen ulostuloon. Laskennassa voidaan siten käyttää suoraan hyväksi pienemmän asteen suodattimissa suoritettua laskentaa. Asteluvun adaptoinnin suorittavien lohkojen 207 ja 227 toiminnat poikkeavat oleellisesti toisistaan. Koska kuvan 2b 10 mukaisessa menetelmässä ei suodatinkertoimia käytetä mallinnuksen asteluvun adaptoinnissa, joudutaan vastaanottimelle välittämään lisäparametrinä kooderin toimintamoodi, joka ilmoittaa kussakin käsiteltävässä puhekehyksessä käytetyn mailinnusasteluvun dekooderille.
15
Kuvassa 2c on esitetty keksinnön mukaisen menetelmän yksinkertaistettu lohkokaavio 241 yhdistettynä virheenkorjausko©-daukseen 242. Kuvassa puhesignaalille 243 suoritetaan aiemmin kuvatulla tavalla kiinteäasteisen mallin kertoimien las-20 kenta ja käänteissuodatus lohkossa 249 sekä vastaava adaptoitava -asteinen käsittely lohkossa 245. Adaptoitava-asteisen mallinnuksen asteluvun valinta voidaan suorittaa joko matalan asteen mallinnuksen taajuusvasteen perusteella (kuvan 2a suoritusesimerkin tavalla) tai kokonaismallinnusvir-25 heen perusteella (kuvan 2b suoritusesimerkin tavalla). Aste-luvun adaptointimenetelmä valitaan kytkimessä 248 riippuen siitä, onko kuvan 2a (kytkin 248 asennossa a) vai kuvan 2b mukainen menetelmä (kytkin 248 asennossa b) otettu käytettäväksi. Asteluku valitaan lohkossa 250 tai 251. Keksinnön 30 mukainen menetelmä voidaan liittää kuvassa 2c esitetyllä tavalla virheenkorjauskoodaukseen siten, että valittu mal-: 1innusasteluku M2 välitetään paitsi herätesignaalin koodauk sen suorittavalle lohkolle 246 myös virheenkorjauskoodaukseen 247. Tällöin voidaan paitsi herätesignaalin koodauksen 35 siirtonopeutta muuttaa valitun kokonaismallinnuksen sallimissa rajoissa myös adaptoida virheenkorjauskoodaukseen lohkossa 242 käytettävää siirtonopeutta. Dekooderille välitettävä bittivirta 244 sisältää puhekooderin parametrit (suoda- 10 95086 tinkertoimet ja herätesignaalin) sekä virheenkorjauskoodin ja tiedon toimintamoodista eli lyhyen aikavälin suodatinmal-linnuksen asteluvusta. Mikäli asteluvun adaptio on tehty suoraan kiinteäasteisen mallinnuksen kertoimien a(i); 5 i*l,2,...,M1 perusteella (kuvan 2a suoritusesimerkin taval la) , voidaan näitä käyttää adaptoinnin asteluvun ilmoittamiseen herätesignaalin koodaukseen ja virheenkorjauskoodauk-seen, eikä erillistä mooditietoa tarvitse välittää.
10 Kuvassa 3 on esitetty keksinnön mukaisen dekooderin lohko-kaavio. Dekooderille tuodaan tieto siitä, kuinka suurta lyhyen aikavälin mallinnuksen astelukua koodauksessa on käytetty. Mallinnuksen asteluku selviää joko erityisestä välitetystä mallinnuksen asteluvun mooditiedosta (kuvan 2b en-15 kooderia vastaava dekooderi) tai suoraan matalan asteluvun mallinnuksen suodatinkertoimista (kuvan 2a enkooderia vastaava dekooderi). Kuvassa 3 on esitetty kuvan 2b enkooderia vastaava dekooderi, jolle on tuotava mallinnusasteluvun ilmoittava signaali. Kuvan 2a enkooderia vastaavassa dekoode-20 rissa mallinnusasteluku voidaan päätellä kiinteän asteluvun mallinnuskertoimista suorittamalla myös dekooderissa mallinnuksen asteluvun adaptointi lohkon 207 mukaisella menettelyllä. Tämä menettely on piirretty kuvaan 3 katkoviivoin. Tieto käytetystä asteluvusta eli toimintamoodi viedään ly-25 hyen aikavälin synteesisuodattimen 302 lisäksi myös heräte-signaalin dekoodauksen suorittavalle lohkolle 301, koska se adaptoi samalla herätteen välitykseen käytettävää bittino-peutta. Dekoodattu puhesignaali 304 saadaan menetelmässä matala-asteisen lyhyen aikavälin synteesisuodattimen 303 30 ulostulosta. Menetelmässä välitetään lisäksi sekä adaptoitava- asteisen lyhyen aikavälin mallinnuksen, että kiinteäasteisen lyhyen aikavälin mallinnuksen mallinnuskertoimet, joita käytetään synteesisuodattimissa 302 ja 303.
35 Edellä kuvatuissa suoritusesimerkeissä käsiteltiin keksinnön mukaisen menetelmän soveltamista koodausmenetelmiin, joissa herätesignaali muodostetaan suoraan lyhyen aikavälin mallin- « « ·. nuksen virhesignaalista. Näitä tehokkaammissa suodatusmal- 11 11 95086 liin perustuvissa puheenkoodausmenetelmissä herätesignaalin koodaaminen suoritetaan ns. analyysi synteesin kautta -menetelmällä. Keksinnön mukaista menetelmää voidaan soveltaa myös tämän tyypin koodausmenetelmiin, kuten seuraavassa sel-5 vitetään.
Kuvassa 4a on esitetty periaatteellinen lohkokaavio alalla tunnetusta puhekooderista, jossa käytetään analyysi synteesin kautta -tyypin menetelmää herätesignaalin koodaukseen.
10 Tällaisessa koodausmenetelmässä herätesignaalille etsitään kussakin koodattavana olevassa puhesignaalin lohkossa helposti välitettävissä oleva esitysmuoto syntesoimalla suuri määrä helposti koodattavia herätesignaaleita vastaavia pu-hesignaaleita ja valitsemalla paras heräte vertaamalla syn-15 teesitulosta koodattavana olevaan puhesignaaliin. Ennustus-virhesignaalia ei menetelmässä siis muodosteta lainkaan vaan herätteenä käytettävä signaali muodostetaan herätteenmuodos-tuslohkossa 400. Puhesignaalista 407 lasketaan lyhyen aikavälin analyysilohkossa 406 lyhyen aikavälin suodatinkertoi-20 met, joita käytetään lyhyen aikavälin synteesisuodattimessa 402. Herätesignaali muodostetaan vertaamalla erotuslohkossa 403 alkuperäistä puhesignaalia sekä syntesoitua puhesignaalia keskenään. Syntesoitu puhesignaali kaikille mahdollisille herätevaihtoehdoille saadaan muokkaamalla herätteenmuo-25 dostuslohkosta 400 saatuja herätevaihtoehtoja kutakin pitkän aikavälin synteesisuodattimessa 401 ja lyhyen aikavälin synteesisuodattimessa 402. Erotuslohkosta 403 saatava erosig-naali painotetaan painotuslohkossa 404 ihmisen kuuloaistin kannalta merkityksellisemmäksi mitaksi subjektiivisesta pu-30 heen laadusta sallimalla suhteellisesti enemmän virhettä voimakkaiden signaalitaajuuksien kohdalle ja vähemmän vaimeiden signaalitaajuuksien kohdalle. Virheen laskentalohkos-sa 405 lasketaan erosignaaliin perustuen mittaluku kunkin herätevaihtoehdon avulla saatavan synteesituloksen hyvyydel-35 le, ja tätä käytetään ohjaamaan herätteen muodostamista ja valitsemaan paras mahdollinen herätesignaali.
12 95086
Kuvassa 4b on esitetty lohkokaavio keksinnön mukaisen menetelmän soveltamisesta analyysi synteesin kautta herätesig-naalin koodaamisen suorittaviin puhekoodereihin. Kuvassa on esitetty enkooderin rakenne sovellutusesimerkistä, jossa 5 asteluvun adaptointi perustuu vastaavalla tavalla kuin kuvan 2a suoritusesimerkissä kiinteän asteluvun käänteissuodatti-men ulostulona saatavaan mallinnusvirhesignaaliin. Adaptoitavan asteluvun mallissa käytettävä asteluku saadaan lohkolta 420. Puhesignaalille 417 suoritetaan kiinteäasteinen ly-10 hyen aikavälin mallinnus lohkossa 419. Lohkossa 418 suoritetaan lohkon 419 mallinnuskertoimien a(i); j»l,2,...,M1 mukainen matala-asteinen kiinteän mallinnusasteen käänteissuo-datus. Käänteissuodatettu puhesignaali viedään edelleen adaptoitavan asteluvun mallinnuslohkolle 416, josta saadaan 15 adaptoitava-asteisen suodattimen suodatinkertoimet b(j); j=l,2,...,M2. Nämä suodatinkertoimet viedään suljetun haun haarassa sijaitsevalle lyhyen aikavälin synteesisuodattimel-le 412. Analyysi synteesin kautta -rakenteelle viedään lisäksi tieto valitun lyhyen aikavälin mallinnuksen asteluvus-20 ta M2, jota käytetään valitsemaan sopiva mallinnusasteluku suodatuslohkossa 412. Tieto mallinnuksen asteluvusta välitetään myös herätteen mallinnukseen, jossa se ilmaisee, paljonko siirtonopeutta on käytetty lyhyen aikavälin suodatin-mallin kertoimien välittämiseen ja vastaavasti paljonko 25 siirtonopeutta on käytettävissä herätesignaalin muodostamiseen lohkossa 410. Järjestelmässä on käytetty lisäksi ns. pitkän aikavälin suodatusmallia suorittamalla lohkossa 411 spektrin hienorakennetta mallintava pitkän aikavälin suodatus, jonka siirtonopeutta voidaan myös adaptoida sen mukaan 30 kuinka suuri lyhyen aikavälin mallinnus on valittu käytettäväksi. Lohkot 413, 414 ja 415 suorittavat samat toiminnot kuin kuvan 4a lohkot 403, 404 ja 405.
Analyysi synteesin kautta -koodereihin voidaan keksinnön mu-35 kaista menetelmää soveltaa toisessa suoritusmuodossaan siten, että erotuselimelle 413 viedään suoraan puhesignaali 417 ilman, että sille suoritetaan ensin analyysisuodatus • · ·- 418. Tällöin lohkossa 412 suoritettavaan adaptoitava-astei- 13 95086 seen lyhyen aikavälin synteesisuodatukseen on liitettävä mukaan myös lohkon 418 käsittelylle käänteinen kiinteäastei-nen synteesisuodatus. Kiinteäasteinen ja adaptoitava-asteinen lyhyen aikavälin malli voidaan siis yhdistää puhekoode-5 riin joko siten, että heräteparametrien optimoinnissa suoritetaan pelkästään adaptoitava-asteinen synteesisuodatus (kuten kuvan 4b suoritusesimerkissä on esitetty), jolloin lyhyen aikavälin mallinnukseen kuuluvaa kiinteäasteista mallinnusta vastaava käänteissuodatus suoritetaan alkuperäiselle 10 puhesignaalille ennen vertailua synteesitulokseen tai siten, että koko lyhyen aikavälin synteesimalli eli adaptoitava-asteisen mallin mukaisen synteesisuodatuksen lisäksi myös kiinteäasteinen lyhyen aikavälin synteesisuodatus suoritetaan kooderin suljetussa haarassa. Kuvan 4b mukainen menet-15 tely on laskennalliselta kuormitukseltaan alhaisempi. Keksinnön mukaisella menetelmällä saavutetaan tässä suoritus-esimerkissä analyysi synteesin kautta -menetelmissä pienennetty laskennallinen kuormitus, koska vain mallintamisen kannalta tarpeellisen asteluvun suuruinen suodatus tarvitsee 20 suorittaa. Analyysi synteesin kautta -menetelmissä juuri suodatusoperaatioista muodostuu menetelmän aiheuttama suuri laskennallinen kuormitus.
Kuvassa 4b sijaitseva mallinnuksen asteluvun adaptointilohko 25 420 suorittaa saman toiminnan kuin kuvan 2a mallinnuksen asteluvun adaptointilohko 207. Vastaavasti kuin kuvan 2b enkooderissa voidaan myös analyysi synteesin kautta -haussa suorittaa suodatinitiallinnuksen asteluvun adaptointi tosiasiallisen virhesignaalin avulla takaisinkytketysti. Tämä 30 järjestely on esitetty kuvassa 4c. Kuvan 4c mallinnuksen asteluvun adaptointilohko 440 vastaa toiminnaltaan kuvan 2b • adaptointilohkoa 227. Lyhyen aikavälin suodatuksen asteluvun adaptointi kuvan 4c mukaisesti eri herätesignaalikandidaa-teilla syntesoitujen signaalien perusteella kasvattaa luon-35 nollisesti menetelmän laskennallista kuormitusta verrattuna kiinteäasteisen suodatusmallin käyttöön tai kuvan 4b mukaiseen ennen herätteen optimointia suoritettavaan mallinnuksen - asteluvun valintaan. Kuvan 4c kooderi poikkeaa kuvan 4b koo- 14 95086 derista oleellisesti siinä, että kuvan 4c kooderissa on otettu suodatinmalIin asteluvun adaptointi osaksi analyysi synteesin kautta -menetelmällä suoritettavaa koodausta. Kuvassa 4c suodattimen asteluku valitaan siten myös analyysi 5 synteesin kautta -periaatteella ja kooderissa on siis kyseessä suljetun haun suorittamisen ulottaminen herätesignaa-lin koodauksesta myös suodatinkertoimiin. Tämä on suoritettu tosin hyvin yksinkertaisessa muodossa eli rajoittuen vain suodatuksen asteluvun adaptointiin. Suodatinkertoimet muo-10 dostetaan yhä tässäkin suoritusesimerkissä avoimella haulla suoraan käsiteltävästä signaalista lohkossa 446. Kuvan 4c suoritusesimerkissä voidaan analyysi synteesin kautta -menetelmää käyttää, mutta samalla pitää menetelmästä aiheutuva laskennallinen, kuormitus kohtuullisena.
15 il • ♦ .
Claims (9)
15 95086
1. Puheenkoodausmenetelmä, jossa puhesignaalin koodaamisessa a) kehitetään lyhyen aikavälin analysaattoreissa sisääntule-5 vaa signaalia vastaava joukko ennusteparametrejä, jotka jokaisessa koodattavana olevassa puhesignaalin lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, b) muodostetaan herätesignaali, joka syöttämällä ennustepa-rametrien mukaan toimivalle synteesisuodattimelle saadaan 10 syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali, tunnettu siitä, että c) lyhyen aikavälin suodatusmalli muodostetaan kahdesta osuudesta eli kiinteän asteluvun matala-asteisesta osuudesta 15 ja asteluvultaan muuttuvasta korkean mallinnuksen asteluvun mahdolliseksi tekevästä osuudesta; d) molemmille osuuksille suoritetaan lyhyen aikavälin ennus-teparametrien laskenta; e) lyhyen aikavälin mallin kokonaisastelukua adaptoidaan 20 kussakin koodattavana olevassa puhelohkossa puhesignaalin mukaan; j a f) suodatinmallin parametrien koodaamiseen käytettävää siirtonopeutta ja herätesignaalin koodaamiseen käytettävää siirtonopeutta adaptoidaan siten, että mallinnuksessa käy- 25 tettävän asteluvun kasvattaminen kasvattaa mallin parametrien siirtonopeutta ja vastaavasti laskee herätteen koodaamiseen käytettävää siirtonopeutta eli adaptoidaan herätesignaalin ja lyhyen aikavälin suodatusmallin välittämiseksi käytettyjen siirtonopeuksien keskinäistä suhdetta. 30
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii- : tä, että kiinteäasteisen lyhyen aikavälin suodatusmallin suodatinkertoimien laskeminen suoritetaan suoraan koodattavaksi tulevasta puhesignaalista, kun taas adaptoitava-astei-35 sen lyhyen aikavälin mallin suodatinkertoimet lasketaan signaalista, joka on saatu suodattamalla koodattavaksi tuleva puhesignaali kiinteäasteisen mallin käänteissuodattimellä. 16 95086
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnet-tu siitä, että matala-asteisen kiinteän asteluvun mallinnus-tulosta käytetään adaptoimaan adaptoitava-asteisen mallinnuksen astelukua siten, että adaptoitava-asteisen lyhyen 5 aikavälin mallinnuksen asteluku lasketaan pieneksi, mikäli koodattavassa signaalilohkossa suurin osa energiasta sijaitsee kiinteäasteisen mallinnuksen mukaan korkeilla taajuuksilla eli mikäli kiinteäasteisen synteesisuodattimen taajuusvaste on ylipäästötyyppinen, ja toisaalta adaptoitava-10 asteisen mallinnuksen astelukua kasvatetaan, mikäli kiinteä-asteista mallinnusta vastaava synteesisuodatus on ali-päästötyyppinen.
4. Jonkin edellisen patenttivaatimuksen mukainen menetel-15 mä, tunnettu siitä, että suoritettava mallinnuksen asteluvun adaptointi suoritetaan kokonaismallinnuksen ennustusvirheen mukaan takaisinkytketysti vertaamalla mallinnuksen asteluvun kasvattamisen vaikutusta ennustusvirheeseen.
5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu sii tä, että mallinnuksen astelukua kasvatetaan kunnes kasvattaminen tuottaa tiettyä kynnysarvoa pienemmän virhesignaalin tehon pienenemisen tai kunnes mallinnusasteluku saavuttaa suurimman sallitun mallinnuksen asteluvun. 25 . 6. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että kiinteäasteisessa suodattimessa käytetään alhaisempaa mallin parametrien adaptointitaajuutta kuin adaptoitava-asteisessa mallinnuksessa ja sitä käytetään 30 välittämään puhujasta ja mikrofonista aiheutuvia spektriomi-naisuuksia, jotka muuttuvat hitaammin kuin varsinainen ään-neinformaatio, joka mallinnetaan varsinaisesti adaptoitava-asteisessa mallinnuksessa.
7. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että sitä käytetään analyysi synteesin kautta herätesignaalin koodaamisen suorittavissa puhekoode- 4 · '· reissä yhdistämällä kiinteäasteinen ja adaptoitava-asteinen 95086 17 lyhyen aikavälin malli puhekooderiin joko siten, että herä-teparametrien suljetussa optimoinnissa suoritetaan pelkästään adaptoitava-asteinen synteesisuodatus, jolloin lyhyen aikavälin mallinnukseen kuuluvaa kiinteäasteista mallinnusta 5 vastaava käänteissuodatus suoritetaan alkuperäiselle puhe-signaalille ennen vertailua synteesitulokseen tai siten, että koko lyhyen aikavälin synteesimalli eli adaptoitava-asteisen mallin mukaisen synteesisuodatuksen lisäksi myös kiinteäasteinen lyhyen aikavälin synteesisuodatus suoriteli) taan kooderin herätesignaalin valinnan suorittavassa haarassa.
8. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että suodatinmallin asteluvun adaptointi 15 suoritetaan osana analyysi synteesin kautta -menetelmällä suoritettavaa koodausta hakemalla analyysi synteesin kautta sellainen suodattimen asteluku, josta asteluvun kasvattaminen ei oleellisesti paranna puhesignaalin laatua.
9. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että se on liitetty virheenkorjauskoo-daukseen siten, että valittu kokonaismallinnusaste välitetään paitsi herätesignaalin koodauksen suorittavalle lohkolle myös virheenkorjauskoodauksen suorittavalle lohkolle, 25 jolloin voidaan herätesignaalin koodauksen siirtonopeuden lisäksi adaptoida virheenkorjauskoodaukseen käytettävää siirtonopeutta. 18 95086
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI925376A FI95086C (fi) | 1992-11-26 | 1992-11-26 | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
US08/155,574 US5596677A (en) | 1992-11-26 | 1993-11-19 | Methods and apparatus for coding a speech signal using variable order filtering |
DE69325237T DE69325237T2 (de) | 1992-11-26 | 1993-11-22 | Verfahren zum Kodieren eines Sprachsignales |
EP93309264A EP0599569B1 (en) | 1992-11-26 | 1993-11-22 | A method of coding a speech signal |
AU51897/93A AU665283B2 (en) | 1992-11-26 | 1993-11-25 | A method for the efficient coding of a speech signal |
JP5296618A JPH06222798A (ja) | 1992-11-26 | 1993-11-26 | 音声信号を効率的に符号化するための方法及びこの方法を用いる符号器 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI925376A FI95086C (fi) | 1992-11-26 | 1992-11-26 | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
FI925376 | 1992-11-26 |
Publications (4)
Publication Number | Publication Date |
---|---|
FI925376A0 FI925376A0 (fi) | 1992-11-26 |
FI925376A FI925376A (fi) | 1994-05-27 |
FI95086B FI95086B (fi) | 1995-08-31 |
FI95086C true FI95086C (fi) | 1995-12-11 |
Family
ID=8536280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI925376A FI95086C (fi) | 1992-11-26 | 1992-11-26 | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
Country Status (6)
Country | Link |
---|---|
US (1) | US5596677A (fi) |
EP (1) | EP0599569B1 (fi) |
JP (1) | JPH06222798A (fi) |
AU (1) | AU665283B2 (fi) |
DE (1) | DE69325237T2 (fi) |
FI (1) | FI95086C (fi) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
JP2993396B2 (ja) * | 1995-05-12 | 1999-12-20 | 三菱電機株式会社 | 音声加工フィルタ及び音声合成装置 |
EP0815555A1 (en) * | 1996-01-04 | 1998-01-07 | Koninklijke Philips Electronics N.V. | Method and system for coding human speech for subsequent reproduction thereof |
US6170073B1 (en) | 1996-03-29 | 2001-01-02 | Nokia Mobile Phones (Uk) Limited | Method and apparatus for error detection in digital communications |
US5799272A (en) * | 1996-07-01 | 1998-08-25 | Ess Technology, Inc. | Switched multiple sequence excitation model for low bit rate speech compression |
GB2317788B (en) | 1996-09-26 | 2001-08-01 | Nokia Mobile Phones Ltd | Communication device |
GB2318029B (en) * | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
FI112894B (fi) | 1997-04-10 | 2004-01-30 | Nokia Corp | Menetelmä kehysvirhetodennäköisyyden pienentämiseksi tietokehysmuotoisessa tiedonsiirrossa |
FI102647B1 (fi) * | 1997-04-22 | 1999-01-15 | Nokia Mobile Phones Ltd | Ohjelmoitava vahvistin |
US6286122B1 (en) * | 1997-07-03 | 2001-09-04 | Nokia Mobile Phones Limited | Method and apparatus for transmitting DTX—low state information from mobile station to base station |
US5966688A (en) * | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
US5999897A (en) * | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
US6012025A (en) * | 1998-01-28 | 2000-01-04 | Nokia Mobile Phones Limited | Audio coding method and apparatus using backward adaptive prediction |
US6799159B2 (en) | 1998-02-02 | 2004-09-28 | Motorola, Inc. | Method and apparatus employing a vocoder for speech processing |
FI105634B (fi) | 1998-04-30 | 2000-09-15 | Nokia Mobile Phones Ltd | Menetelmä videokuvien siirtämiseksi, tiedonsiirtojärjestelmä ja multimediapäätelaite |
FI981508A (fi) | 1998-06-30 | 1999-12-31 | Nokia Mobile Phones Ltd | Menetelmä, laite ja järjestelmä käyttäjän tilan arvioimiseksi |
GB9817292D0 (en) | 1998-08-07 | 1998-10-07 | Nokia Mobile Phones Ltd | Digital video coding |
FI105635B (fi) | 1998-09-01 | 2000-09-15 | Nokia Mobile Phones Ltd | Menetelmä taustakohinainformaation lähettämiseksi tietokehysmuotoisessa tiedonsiirrossa |
US6311154B1 (en) | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
FI116992B (fi) * | 1999-07-05 | 2006-04-28 | Nokia Corp | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
CN100471072C (zh) * | 2002-11-21 | 2009-03-18 | 日本电信电话株式会社 | 数字信号处理方法 |
CN101009097B (zh) * | 2007-01-26 | 2010-11-10 | 清华大学 | 1.2kb/s SELP低速率声码器抗信道误码保护方法 |
WO2012029613A1 (ja) * | 2010-09-01 | 2012-03-08 | 日本電気株式会社 | デジタルフィルタ装置、デジタルフィルタリング方法及びデジタルフィルタ装置の制御プログラム |
US8873615B2 (en) * | 2012-09-19 | 2014-10-28 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Method and controller for equalizing a received serial data stream |
US10251002B2 (en) * | 2016-03-21 | 2019-04-02 | Starkey Laboratories, Inc. | Noise characterization and attenuation using linear predictive coding |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE15415T1 (de) * | 1981-09-24 | 1985-09-15 | Gretag Ag | Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung. |
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
EP0316112A3 (en) * | 1987-11-05 | 1989-05-31 | AT&T Corp. | Use of instantaneous and transitional spectral information in speech recognizers |
IT1224453B (it) * | 1988-09-28 | 1990-10-04 | Sip | Procedimento e dispositivo per la codifica decodifica di segnali vocali con l'impiego di un eccitazione a impulsi multipli |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
CA2005115C (en) * | 1989-01-17 | 1997-04-22 | Juin-Hwey Chen | Low-delay code-excited linear predictive coder for speech or audio |
JPH02272500A (ja) * | 1989-04-13 | 1990-11-07 | Fujitsu Ltd | コード駆動音声符号化方式 |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
EP0401452B1 (en) * | 1989-06-07 | 1994-03-23 | International Business Machines Corporation | Low-delay low-bit-rate speech coder |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
FI98104C (fi) * | 1991-05-20 | 1997-04-10 | Nokia Mobile Phones Ltd | Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
SE469764B (sv) * | 1992-01-27 | 1993-09-06 | Ericsson Telefon Ab L M | Saett att koda en samplad talsignalvektor |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
FI90477C (fi) * | 1992-03-23 | 1994-02-10 | Nokia Mobile Phones Ltd | Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään |
-
1992
- 1992-11-26 FI FI925376A patent/FI95086C/fi active
-
1993
- 1993-11-19 US US08/155,574 patent/US5596677A/en not_active Expired - Lifetime
- 1993-11-22 DE DE69325237T patent/DE69325237T2/de not_active Expired - Lifetime
- 1993-11-22 EP EP93309264A patent/EP0599569B1/en not_active Expired - Lifetime
- 1993-11-25 AU AU51897/93A patent/AU665283B2/en not_active Ceased
- 1993-11-26 JP JP5296618A patent/JPH06222798A/ja not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
AU665283B2 (en) | 1995-12-21 |
JPH06222798A (ja) | 1994-08-12 |
FI95086B (fi) | 1995-08-31 |
FI925376A (fi) | 1994-05-27 |
FI925376A0 (fi) | 1992-11-26 |
US5596677A (en) | 1997-01-21 |
DE69325237T2 (de) | 1999-12-16 |
AU5189793A (en) | 1994-06-09 |
EP0599569B1 (en) | 1999-06-09 |
DE69325237D1 (de) | 1999-07-15 |
EP0599569A2 (en) | 1994-06-01 |
EP0599569A3 (en) | 1994-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI95086C (fi) | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
JP4927257B2 (ja) | 可変レートスピーチ符号化 | |
JP4550289B2 (ja) | Celp符号変換 | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
RU2331933C2 (ru) | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах | |
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
JP4995293B2 (ja) | 音声符号化用のスカラー量子化(sq)とベクトル量子化(vq)の選択 | |
US5845244A (en) | Adapting noise masking level in analysis-by-synthesis employing perceptual weighting | |
US5933803A (en) | Speech encoding at variable bit rate | |
KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
US20040102970A1 (en) | Speech encoding method, apparatus and program | |
JP2006525533A5 (fi) | ||
KR20010099763A (ko) | 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법 | |
KR20010101422A (ko) | 매핑 매트릭스에 의한 광대역 음성 합성 | |
JPH11507739A (ja) | スピーチコーダ | |
WO2000038177A1 (en) | Periodic speech coding | |
JP4040126B2 (ja) | 音声復号化方法および装置 | |
US8620645B2 (en) | Non-causal postfilter | |
JP2004517348A (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
JP4558205B2 (ja) | スピーチコーダパラメータの量子化方法 | |
US5884251A (en) | Voice coding and decoding method and device therefor | |
US6205423B1 (en) | Method for coding speech containing noise-like speech periods and/or having background noise | |
EP1397655A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
WO2005045808A1 (en) | Harmonic noise weighting in digital speech coders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
BB | Publication of examined application |