FI95086C

FI95086C - Menetelmä puhesignaalin tehokkaaksi koodaamiseksi

Info

Publication number: FI95086C
Application number: FI925376A
Authority: FI
Inventors: Kari Jaervinen; Olli Ali-Yrkkoe
Original assignee: Nokia Mobile Phones Ltd; Nokia Telecommunications Oy
Priority date: 1992-11-26
Filing date: 1992-11-26
Publication date: 1995-12-11
Also published as: AU665283B2; JPH06222798A; FI95086B; FI925376A; FI925376A0; US5596677A; DE69325237T2; AU5189793A; EP0599569B1; DE69325237D1; EP0599569A2; EP0599569A3

Description

, 95086

Menetelmä puhesignaalin tehokkaaksi koodaamiseksi

Keksinnön kohteena on puheenkoodausmenetelmä, jossa puhesig-5 naalin koodaamisessa a) kehitetään lyhyen aikavälin analysaattoreissa sisääntule-vaa signaalia vastaava joukko ennusteparametrejä, jotka jokaisessa koodattavana olevassa puhesignaalin lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, 10 b) muodostetaan herätesignaali, joka syöttämällä ennustuspa-rametrien mukaan toimivalle synteesisuodattimelle saadaan syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali.

15 Puheen digitaalisessa koodauksessa käytetään usein ihmisen puheentuottoon perustuvaa kaksiosaista mallia, johon kuuluu ensinnäkin herätteen muodostaminen (ihmisellä: äänihuulten värähtely tai kuristuskohta ääniväylässä) ja herätesignaalin muokkaus suodatusoperaatiossa (ihmisellä: ääniväylässä ta-20 pahtuva muokkaus). Puhekoodereissa käytettävää äänikanavan muokkausta mallintavaa suodatusoperaatiota kutsutaan yleisesti ns. lyhyen aikavälin suodatukseksi tai lyhyen aikavälin mallinnukseksi. Herätesignaalin tehokkaaseen koodaamiseen on kehitetty erilaisia menetelmiä ja malleja, joilla on 25 kyetty herätesignaalin välittämiseksi tarvittavaa siirtono-: peutta alentamaan merkittävästi huonontamatta silti juuri kaan puhesignaalin laatua. Tällä hetkellä tehokkaimmiksi puheenkoodausmenetelmiksi ovat osoittautuneet analyysi synteesin kautta -menetelmää käyttäen herätesignaalille mahdol-30 lisimman pienellä siirtonopeudella välitettävissä olevan esitysmuodon hakevat puhekooderit, joista mainittakoon koo-. diherätteinen lineaarinen ennustus (Code Excited Linear Pre diction, ks. esim. patenttijulkaisu US-4 817 157). Myös lyhyen aikavälin suodatusmallin parametrien koodaamiseksi on 35 kehitetty tehokkaita menetelmiä kuten esim. välittäminen

Line Spectrum Pair -esitysmuodossa (ks. julkaisu F.K. Soong, B.H. Juang: "Optimal quantization of LSP parameters using 2 95086 delayed decisions", Proceedings of the 1990 International Conference on Acoustics, Speech, and Signal Processing).

Vaikka tehokkaita menetelmiä on kehitetty sekä herätesignaa-5 Iin että suodatusmallin välittämiseen, ei aiemmin esitetyissä menetelmissä ole otettu huomioon sitä, että eri äänteille äänikanavassa suoritettava muokkaus on erityyppinen eri ään-netyypeille ja siten erilailla mallinnettavissa lyhyen aikavälin suodattimessa. Tästä syystä mahdollisimman tehokkaan 10 puheen koodauksen aikaansaamiseksi suodatuksen astelukua tulisi adaptoida koodattavana olevan puhesignaalin mukaan. Alalla aiemmin tunnetuissa menetelmissä on kiinteäasteisen suodatinitiallinnuksen takia käytössä mallinnuksen asteluku, joka on soinnittomilla äänteillä tarpeettoman suuri niiden 15 suhteellisen tasaisesti jakautuneen spektrikäyrän välittämiseen ja johon käytetyt resurssit voitaisiin paremmin hyödyntää herätesignaalin koodaamisessa tai virheenkorjauskoodauk-sessa. Toisaalta kiinteän asteluvun käyttö johtaa soinnillisilla äänteillä helposti liian matala-asteisen suodatusmal-20 Iin käyttämiseen, vaikka soinnillisten äänteiden spektrin formanttirakenteen mallintamista voitaisiin merkittävästi tehostaa suurempaa mallinnusastelukua käyttämällä.

Esillä olevan keksinnön tarkoituksena on aikaansaada sellai-25 nen menetelmä puhesignaalin digitaaliseksi koodaamiseksi, jonka avulla edellä esitetyt puutteet ja ongelmat voitaisiin ratkaista. Tämän saavuttamiseksi keksinnölle on tunnusomaista se, mikä on esitetty patenttivaatimuksena 1. Keksinnön mukaisesti siis ensinnä säädetään lyhyen aikavälin mallin-30 nuksen astelukua adaptiivisesti puhesignaalin mukaan ja toisaalta herätesignaalia ja lyhyen aikavälin suodatusta kuvaa-: vien parametrien siirtonopeuksien keskinäistä suhdetta adap toidaan puhesignaalin mukaan. Koodauksen tehokkuuden kannalta turhan suuren suodatusmallin asteluvun pienentämisellä 35 voidaan herätesignaalin koodaukseen käytettävää siirtonopeutta kasvattaa tai siirtää vapautuvat siirtonopeusresurssit virheenkorjauskoodauksessa käytettäväksi. Toisaalta ää-• nikanavaa mallintavan suodatusoperaation astelukua voidaan il 3 95086 tarvittaessa kasvattaa, mikäli siitä on oleellista hyötyä koodauksessa, ja alentaa vastaavasti herätesignaalin koodaukseen käytettävää siirtonopeutta. Keksinnön mukaista menetelmää voidaan käyttää niin mallinnusvirheen suoraan koo-5 daaviin koodausmenetelmiin kuin suljettua herätesignaalin optimointia koodauksessa käyttäviin analyysi synteesin kautta -menetelmiin. Viimeksimainituissa menetelmissä vältetään keksinnön mukaisella asteluvun adaptoinnilla mallinnettavaan äänteeseen liian suuren mallinnuksen asteluvun käyttö ja 10 siten laskennallista kuormitusta voidaan oleellisesti laskea. Keksinnön mukaisella menetelmällä saavutetaan kiinteä-astelukuista äänikanavan mallinnussuodatusta käyttäviä menetelmiä parempi kokonaismallinnus puhesignaalille ja saadaan siten aikaan tehokas puheen koodaus.

15

Keksinnön mukaisessa menetelmässä käytetään tarkemmin kuvattuna sellaista lyhyen aikavälin suodatusmallia, joka on muodostettu kahdesta osasta eli matala-asteisesta kiinteäas-telukuisesta osuudesta ja asteluvultaan adaptoitavasta osuu-20 desta. Jälkimmäisenä mainittu adaptoitava-astelukuinen osuus tekee mahdolliseksi saavuttaa tarvittaessa korkea kokonais-mallinnuksen asteluku. Näille molemmille ennustusmalleille lasketaan erikseen lyhyen aikavälin ennusteparametrit ja molempien mallien suodatinkertoimien laskenta voi olla suo-25 ritettu millä tahansa alalla tunnetulla menetelmällä, esimerkiksi lineaarisen mallinnuksen yhteydessä jollakin lineaariseen ennustavaan koodaukseen (Linear Predictive Coding, LPC) perustuvalla laskenta-algoritmilla. Molempien mallien mukaisten mallinnusparametrien arvoja adaptoidaan eli ne 30 lasketaan puhesignaalista noin 10-40 ms:n välein. Kiinteä- astelukuisen lyhyen aikavälin suodat initial Iin suodatinkertoi-.' mien laskeminen suoritetaan suoraan koodattavaksi tulevasta puhesignaalista, kun taas adaptoitava-asteisen lyhyen aikavälin mallin suodatinkertoimet lasketaan signaalista, joka 35 on saatu suodattamalla koodattavaksi tuleva puhesignaali kiinteäasteisen mallin käänteissuodattimella. Kiinteäastelukuinen matala-asteinen malli toimii siten esisuodatustoimin-tona adaptoitava-astelukuiselle mallinnukselle. Kun mallin- 4 95086 nuksessa käytetään erillistä matala-asteista suodatinta, voidaan kiinteäasteisessa ja adaptoitava-asteisessa suodat-timessa käyttää erilaisia mallin parametrien adaptointitaajuuksia. Suodatinparametrit mainituille kahdelle lyhyen ai-5 kavälin mallille voidaan siis lähettää vastaanottimelle erilaisin aikavälein. Kiinteäasteisella mallinnuksella voidaan näin tehokkaasti välittää puhujasta ja mikrofonista aiheutuvia hitaasti muuttuvia ja matalalla asteluvulla kohtuullisen hyvin mallinnettavissa olevia spektriominaisuuksia siten, 10 että sen kertoimia adaptoidaan harvemmin kuin nopeasti muuttuvan äänneinformaation sisältäviä adaptoitava-asteisen mallin kertoimia.

Adaptoitava-asteisen lyhyen aikavälin mallinnuksen asteluku 15 säädetään eräässä keksinnön mukaisessa 8 kHz:n näytteenottotaajuudella toimivassa suoritusmuodossa kiinteäasteisen mallinnuksen tulosten mukaan seuraavasti: Asteluku adaptoitava-asteisessa suodattimessa asetetaan pieneksi (luokkaa 2-asteinen) , mikäli koodattavassa signaalilohkossa suurin osa 20 energiasta sijaitsee korkeilla taajuuksilla eli mikäli kiinteän asteluvun mallinnuksessa saatu taajuusvaste on ylipääs-tötyyppinen (helposti mallinnettavaksi luokiteltu soinniton äännetyyppi). Adaptoitava-asteisen mallinnuksen asteluku puolestaan asetetaan suureksi (luokkaa 12-asteinen), mikäli 25 kiinteän asteluvun mallinnuksessa saatu signaalin taajuus-vaste on alipäästötyyppinen (merkityksellisen formanttira-kenteen sisältäväksi luokiteltu soinnillinen äännetyyppi). Kiinteäasteisen mallinnuksen asteluku on vakio ja luokkaa 2-asteinen. Kokonaismallinnuksen asteluvuksi tulee näillä esi-30 merkkiasteluvuilla joko 4 tai 14.

: Toisessa suoritusmuodossa adaptoidaan suodatusmallinnuksen astelukua mallinnuksen onnistumisen mukaan takaisinkytketystä mallinnusvirhesignaalin perusteella. Tässä suoritusmuo-35 dossa voidaan asteluvun säätäminen suorittaa portaattomasti tekemättä karkeaa päätöstä kahden eri mallinnusasteluvun välillä.

s 95086

Seuraavassa selvitetään esimerkein joitakin keksinnön toteutusmuotoja oheisiin kuviin viitaten.

Kuva 1 havainnollistaa lyhyen aikavälin ennustussuodattimen 5 mallinnuksen toimintaa eri mallinnusasteluvuilla kahdelle eri äännetyypille /s/- (kuva la) ja /o/-äänteelle (kuva Ib);

Kuva 2 esittää keksinnön mukaisen menetelmän enkooderia seuraavasti: kokonaismallinnuksen asteluvun adaptointi matalan 10 asteen mallinnuksen kertoimien perusteella (kuva 2a), mallinnuksen asteluvun adaptointi kokonaismallinnusvirheen avulla (kuva 2b) ja virheenkorjauskoodauksen siirtonopeuden adaptointi mallinnuksen asteluvun mukaan (kuva 2c); 15 Kuva 3 esittää keksinnön mukaista menetelmää käyttävän kuvan 2a tai 2b enkooderia vastaavan dekooderin lohkokaaviota;

Kuva 4a on periaatteellinen esitys alalla tunnetusta analyysi synteesin kautta -tyypin menetelmästä, jossa herätesig-20 naalin mallintamisessa käytetään suljettua optimointia, ja kuvat 4b ja 4c esittävät keksinnön mukaisen mallinnuksen soveltamista analyysi synteesin kautta -periaatteella toimiviin puhekoodereihin.

25 Kuva 1 havainnollistaa lyhyen aikavälin mallinnuksen toimin- < taa eri mallinnusasteluvuilla kahdelle eri äännetyypille eli soinnittomalle /s/-äänteelle ja soinnilliselle /^/-äänteelle. Näytteenottotaajuutena on käytetty 8 kHz. Kuvassa la on esitetty (katkoviivalla) soinnittoman äännetyypin /s/-ään-30 teen aaltomuoto ja spektrikäyrä laskettuna FFT-menetelmällä (Fast Fourier Transform). Kuvassa la on esitetty (ehjällä viivalla) myös lyhyen aikavälin LPC-mallinnuksen taajuusvaste kahdella eri mallinnusasteluvulla 4 ja 10 (LPC4 ja LPC10). Kuvassa Ib on esitetty vastaavasti soinnillisen /o/-35 äänteen aaltomuoto ja FFT-spektrikäyrä sekä lyhyen aikavälin LPC-mallinnuksen taajuusvaste kahdella mallinnusasteluvulla . 4 ja 10 (LPC4 ja LPC10). Käytetty 4-asteinen malli (LPC4) pystyy mallintamaan melko hyvin esitetyn soinnittomalle ään- 6 95086 teelle tyypillisen suhteellisen tasaisen taajuussisällön.

Sen sijaan soinnillisten äänteiden tulkinnassa tärkeät spektrin resonanssikohdat pystytään välittämään hyvin vasta suuremmalla mallinnusasteluvulla. Esim. /o/-äänteen neljästä 5 resonanssihuipusta muodostuva spektrikäyrä kyetään mallintamaan kunnolla vasta korkeammalla asteluvulla, esim. 10-as-teisella mallilla (LPC10) kuten kuvasta Ib käy ilmi. Re-sonanssihuiput eli ns. formantit erottuvat LPC10-käyrästä selvästi taajuuksilla n. 500 Hz, 1000 Hz, 2400 Hz ja 3400 10 Hz. Kuvassa la esitetyssä /s/-äänteen mallinnuksessa ei mallin asteluvun kasvattaminen 10:een tuota vastaavaa oleellista parannusta mallinnukseen.

Kuva 2 esittää herätesignaalin suoraan lyhyen aikavälin mal-15 linnuksen virhesignaalista muodostavan koodausmenetelmän enkooderia, jossa on käytetty keksinnön mukaista adaptiivista lyhyen aikavälin suodatusmallinnuksen asteluvun adaptoin-tia. Kuvassa 2a on esitetty suoritusesimerkki enkooderista, jossa suoritetaan asteluvun adaptointi kiinteäasteisen mal-20 Iin kertoimiin perustuen. Puhesignaalille 206 suoritetaan ensin matalan asteen lyhyen aikavälin mallinnus 204, jossa muodostetaan mallia vastaavat suodatinkertoimet a(i); i*l,2,...,M1. Nämä voivat olla joko suoramuotoisen suodattimen kertoimia tai ristikkorakenteisissa suodattimissa käy-25 tettäviä ns. heijastuskertoimia. Lohkossa 204 suoritettava toiminta voidaan tehdä millä tahansa alalla tunnetulla lineaarisen ennustusmalIin suodatinkertoimien laskentamenetelmällä. Mx on vakioarvoinen ja suuruudeltaan tyypillisesti luokkaa 2. Puhesignaali 206 viedään lasketun mallin mukai-30 seen astelukua Mx olevaan käänteissuodattimeen 201. Kiinteän asteluvun käänteissuodattimesta saatava signaali (eli : kiinteäasteisen mallin ennustusvirhe) viedään edelleen adap- toitava-asteiseen käänteissuodatukseen 202. Kuvan suori-tusesimerkissä päätetään lohkossa 207 suodatinkertoimien 35 a(i); i=l,2,...,M1 perusteella adaptoitava-asteisen mallin nuksen 205 asteluvun M2 suuruudesta jäljempänä kuvatulla menetelmällä. Adaptoitava-asteisen suodattimen 202 suodatin-• kertoimet b(j); j=l,2,...,M2 lasketaan lohkossa 205. Koko- 7 95086 naismallinnuksen ennustusvirheelle etsitään sopiva koodattu esitysmuoto koodauslohkossa 203. Muodostetut ennustusvirheen välittävät herätepulssit välitetään dekooderille herätesig-naalina käytettäviksi. Herätepulssien ohella vastaanottimel-5 le välitetään lisäksi sekä matalan kiinteäasteisen mallinnuksen että adaptoitava-asteisen mallinnuksen suodatinker-toimet. Mikäli lohkossa 207 tehdään päätös käyttää adaptoi-tava-asteisessa mallinnuksessa 205 pientä mallinnusastelu-kua, käytetään mallinnuksesta vapautuvat resurssit lohkossa 10 203 suoritettavaan kokonaismallinnusvirheen koodaamiseen.

Lohkossa 203 voidaan mallinnusvirheen koodaaminen suorittaa millä tahansa alalla tunnetulla menetelmällä, esimerkiksi näytteiden määrän rajoittamiseen perustuvalla menetelmällä (ks. esim. julkaisu P. Vary, K. Hellwig, R. Hofmann, R.J.

15 Sluyter, C. Galand, M. Rosso: "Speech codec for the European mobile radio system", Proceedings of the 1988 International Conference on Acoustics, Speech, and Signal Processing). Mikäli toisaalta havaitaan, että lyhyen aikavälin mallintamiseen tarvitaan suurta mallinnusastelukua, ohjataan osa 20 muutoin herätesignaalin koodaamiseen käytettävistä resursseista välittämään lyhyen aikavälin mallin parametrejä, jolloin lyhyen aikavälin mallinnuksen astelukua voidaan kasvattaa. Tämä suoritetaan nostamalla adaptoitava-asteisessa mallinnuksessa käytettävää astelukua.

25 Päätös käytettävän suodatusmallinnuksen asteluvusta tehdään kuvan 2a sovellutusesimerkissä adaptointilohkossa 207 seu-raavalla menettelyllä: mikäli suoritettu kiinteän asteluvun mallinnus osoittaa sisääntulevan signaalin 206 sisältävän 30 suurimman osan energiastaan pienillä taajuuksilla, menetelmässä käytetään lyhyen aikavälin mallinnuksessa suurta aste-lukua. Mikäli taas signaalissa energia on kasaantunut suurille taajuuksille, käytetään matala-asteista mallinnusta. Menetelmä perustuu yksinkertaisimmillaan tulkittuna siihen, 35 että soinnittomien korkeille taajuuksille painottuneiden äänteiden spektrin verhokäyrä ei sisällä soinnillisten äänteiden lailla selviä oleellista informaatiota välittäviä • .

spektrin huippukohtia, jolloin soinnittomien äänteiden koh- 8 95086 dalla voidaan käyttää matalampaa lyhyen aikavälin mallinnusta ja ohjata suurempi osuus siirtokapasiteetista herätesig-naalin koodaamiseen. Toisaalta soinnillisten äänteiden tapauksessa spektrin verhokäyrän välittämiseen on syytä käyt-5 tää korkean asteen suodatinmal1ia, jotta niille tärkeä for-manttirakenne kyetään välittämään koodausmenetelmässä mahdollisimman tarkasti. Kuvan 2a menetelmässä voidaan käyttää kahta eri kokonaismallinnusastelukua eli matalaa soinnittomiksi luokitelluille äänteille (luokkaa 4) ja korkeaa soin-10 nillisiksi luokitelluille äänteille (luokkaa 12).

Kuvassa 2b on esitetty toinen sovellutusesimerkki keksinnön mukaisen menettelyn toteuttamiseksi digitaalisessa puhekoo-derissa. Kuvaan 2a verrattuna erona on mallinnuksen astelu-15 vun adaptointi suoraan kokonaismallinnuksen ennustusvirheen perusteella takaisinkytketysti eikä matalan asteen suodatin-kertoimien perusteella. Asteluvun M2 adaptointi suoritetaan kuvan lohkossa 227 tosiasiallisen ennustusvirheen perusteella kun taas lohkossa 207 adaptointi perustuu kiinteäasteisen 20 mallinnuksen suodatinkertoimiin aiemmin selvitetyllä menetelmällä. Kuvan 2b esimerkissä lohkossa 227 suoritettava mallinnuksen asteluvun adaptointi suoritetaan ennustusvirheen mukaan vertaamalla mallinnuksen asteluvun kasvattamisen vaikutusta ennustusvirheeseen. Menetelmässä mallinnuksen 25 astelukua kasvatetaan kunnes kasvattaminen tuottaa tiettyä kynnysarvoa P^j pienemmän ennustusvirhesignaalin tehon pienenemisen. Tällöin päätellään mallinnuksen asteluvun kasvattamisen lisää olevan tarpeetonta ja valitaan senhetkinen mallinnuksen asteluku käytettäväksi. Menetelmässä kiinteäas-30 teisessa käänteissuodattimessa käsitelty puhesignaali viedään adaptoitava-asteiseen käänteissuodattimeen siten, että adaptoitava-asteisen suodattimen astelukua lähdetään kasvattamaan sallitusta minimiarvosta kunnes havaitaan kynnysarvoa pienempi virhesignaalin pieneneminen tai saavutetaan mene-35 telmässä asetettu suurin sallittu kokonaismallinnusasteluku dmax* Koodattavana oleva puhelohko suodatetaan kullakin eri asteluvun käänteissuodattimella ja lasketaan mallinnusvir-·- heen eli käänteissuodattimen ulostulon teho kullekin eri

II

9 95086 suodatusasteluvulle. Kun suodatinrakenteena käytetään hei-jastuskertoimia käyttävää ristikkosuodatinsuodatinta ei asteluvun kasvattaminen muuta aiempia suodatinkerroinarvoja eli asteluvun kasvattaminen aiheuttaa vain uuden suoda-5 tusoperaation lisäämisen lyhyemmän mailinnusasteen suodattimen ulostuloon. Laskennassa voidaan siten käyttää suoraan hyväksi pienemmän asteen suodattimissa suoritettua laskentaa. Asteluvun adaptoinnin suorittavien lohkojen 207 ja 227 toiminnat poikkeavat oleellisesti toisistaan. Koska kuvan 2b 10 mukaisessa menetelmässä ei suodatinkertoimia käytetä mallinnuksen asteluvun adaptoinnissa, joudutaan vastaanottimelle välittämään lisäparametrinä kooderin toimintamoodi, joka ilmoittaa kussakin käsiteltävässä puhekehyksessä käytetyn mailinnusasteluvun dekooderille.

15

Kuvassa 2c on esitetty keksinnön mukaisen menetelmän yksinkertaistettu lohkokaavio 241 yhdistettynä virheenkorjausko©-daukseen 242. Kuvassa puhesignaalille 243 suoritetaan aiemmin kuvatulla tavalla kiinteäasteisen mallin kertoimien las-20 kenta ja käänteissuodatus lohkossa 249 sekä vastaava adaptoitava -asteinen käsittely lohkossa 245. Adaptoitava-asteisen mallinnuksen asteluvun valinta voidaan suorittaa joko matalan asteen mallinnuksen taajuusvasteen perusteella (kuvan 2a suoritusesimerkin tavalla) tai kokonaismallinnusvir-25 heen perusteella (kuvan 2b suoritusesimerkin tavalla). Aste-luvun adaptointimenetelmä valitaan kytkimessä 248 riippuen siitä, onko kuvan 2a (kytkin 248 asennossa a) vai kuvan 2b mukainen menetelmä (kytkin 248 asennossa b) otettu käytettäväksi. Asteluku valitaan lohkossa 250 tai 251. Keksinnön 30 mukainen menetelmä voidaan liittää kuvassa 2c esitetyllä tavalla virheenkorjauskoodaukseen siten, että valittu mal-: 1innusasteluku M2 välitetään paitsi herätesignaalin koodauk sen suorittavalle lohkolle 246 myös virheenkorjauskoodaukseen 247. Tällöin voidaan paitsi herätesignaalin koodauksen 35 siirtonopeutta muuttaa valitun kokonaismallinnuksen sallimissa rajoissa myös adaptoida virheenkorjauskoodaukseen lohkossa 242 käytettävää siirtonopeutta. Dekooderille välitettävä bittivirta 244 sisältää puhekooderin parametrit (suoda- 10 95086 tinkertoimet ja herätesignaalin) sekä virheenkorjauskoodin ja tiedon toimintamoodista eli lyhyen aikavälin suodatinmal-linnuksen asteluvusta. Mikäli asteluvun adaptio on tehty suoraan kiinteäasteisen mallinnuksen kertoimien a(i); 5 i*l,2,...,M1 perusteella (kuvan 2a suoritusesimerkin taval la) , voidaan näitä käyttää adaptoinnin asteluvun ilmoittamiseen herätesignaalin koodaukseen ja virheenkorjauskoodauk-seen, eikä erillistä mooditietoa tarvitse välittää.

10 Kuvassa 3 on esitetty keksinnön mukaisen dekooderin lohko-kaavio. Dekooderille tuodaan tieto siitä, kuinka suurta lyhyen aikavälin mallinnuksen astelukua koodauksessa on käytetty. Mallinnuksen asteluku selviää joko erityisestä välitetystä mallinnuksen asteluvun mooditiedosta (kuvan 2b en-15 kooderia vastaava dekooderi) tai suoraan matalan asteluvun mallinnuksen suodatinkertoimista (kuvan 2a enkooderia vastaava dekooderi). Kuvassa 3 on esitetty kuvan 2b enkooderia vastaava dekooderi, jolle on tuotava mallinnusasteluvun ilmoittava signaali. Kuvan 2a enkooderia vastaavassa dekoode-20 rissa mallinnusasteluku voidaan päätellä kiinteän asteluvun mallinnuskertoimista suorittamalla myös dekooderissa mallinnuksen asteluvun adaptointi lohkon 207 mukaisella menettelyllä. Tämä menettely on piirretty kuvaan 3 katkoviivoin. Tieto käytetystä asteluvusta eli toimintamoodi viedään ly-25 hyen aikavälin synteesisuodattimen 302 lisäksi myös heräte-signaalin dekoodauksen suorittavalle lohkolle 301, koska se adaptoi samalla herätteen välitykseen käytettävää bittino-peutta. Dekoodattu puhesignaali 304 saadaan menetelmässä matala-asteisen lyhyen aikavälin synteesisuodattimen 303 30 ulostulosta. Menetelmässä välitetään lisäksi sekä adaptoitava- asteisen lyhyen aikavälin mallinnuksen, että kiinteäasteisen lyhyen aikavälin mallinnuksen mallinnuskertoimet, joita käytetään synteesisuodattimissa 302 ja 303.

35 Edellä kuvatuissa suoritusesimerkeissä käsiteltiin keksinnön mukaisen menetelmän soveltamista koodausmenetelmiin, joissa herätesignaali muodostetaan suoraan lyhyen aikavälin mallin- « « ·. nuksen virhesignaalista. Näitä tehokkaammissa suodatusmal- 11 11 95086 liin perustuvissa puheenkoodausmenetelmissä herätesignaalin koodaaminen suoritetaan ns. analyysi synteesin kautta -menetelmällä. Keksinnön mukaista menetelmää voidaan soveltaa myös tämän tyypin koodausmenetelmiin, kuten seuraavassa sel-5 vitetään.

Kuvassa 4a on esitetty periaatteellinen lohkokaavio alalla tunnetusta puhekooderista, jossa käytetään analyysi synteesin kautta -tyypin menetelmää herätesignaalin koodaukseen.

10 Tällaisessa koodausmenetelmässä herätesignaalille etsitään kussakin koodattavana olevassa puhesignaalin lohkossa helposti välitettävissä oleva esitysmuoto syntesoimalla suuri määrä helposti koodattavia herätesignaaleita vastaavia pu-hesignaaleita ja valitsemalla paras heräte vertaamalla syn-15 teesitulosta koodattavana olevaan puhesignaaliin. Ennustus-virhesignaalia ei menetelmässä siis muodosteta lainkaan vaan herätteenä käytettävä signaali muodostetaan herätteenmuodos-tuslohkossa 400. Puhesignaalista 407 lasketaan lyhyen aikavälin analyysilohkossa 406 lyhyen aikavälin suodatinkertoi-20 met, joita käytetään lyhyen aikavälin synteesisuodattimessa 402. Herätesignaali muodostetaan vertaamalla erotuslohkossa 403 alkuperäistä puhesignaalia sekä syntesoitua puhesignaalia keskenään. Syntesoitu puhesignaali kaikille mahdollisille herätevaihtoehdoille saadaan muokkaamalla herätteenmuo-25 dostuslohkosta 400 saatuja herätevaihtoehtoja kutakin pitkän aikavälin synteesisuodattimessa 401 ja lyhyen aikavälin synteesisuodattimessa 402. Erotuslohkosta 403 saatava erosig-naali painotetaan painotuslohkossa 404 ihmisen kuuloaistin kannalta merkityksellisemmäksi mitaksi subjektiivisesta pu-30 heen laadusta sallimalla suhteellisesti enemmän virhettä voimakkaiden signaalitaajuuksien kohdalle ja vähemmän vaimeiden signaalitaajuuksien kohdalle. Virheen laskentalohkos-sa 405 lasketaan erosignaaliin perustuen mittaluku kunkin herätevaihtoehdon avulla saatavan synteesituloksen hyvyydel-35 le, ja tätä käytetään ohjaamaan herätteen muodostamista ja valitsemaan paras mahdollinen herätesignaali.

12 95086

Kuvassa 4b on esitetty lohkokaavio keksinnön mukaisen menetelmän soveltamisesta analyysi synteesin kautta herätesig-naalin koodaamisen suorittaviin puhekoodereihin. Kuvassa on esitetty enkooderin rakenne sovellutusesimerkistä, jossa 5 asteluvun adaptointi perustuu vastaavalla tavalla kuin kuvan 2a suoritusesimerkissä kiinteän asteluvun käänteissuodatti-men ulostulona saatavaan mallinnusvirhesignaaliin. Adaptoitavan asteluvun mallissa käytettävä asteluku saadaan lohkolta 420. Puhesignaalille 417 suoritetaan kiinteäasteinen ly-10 hyen aikavälin mallinnus lohkossa 419. Lohkossa 418 suoritetaan lohkon 419 mallinnuskertoimien a(i); j»l,2,...,M1 mukainen matala-asteinen kiinteän mallinnusasteen käänteissuo-datus. Käänteissuodatettu puhesignaali viedään edelleen adaptoitavan asteluvun mallinnuslohkolle 416, josta saadaan 15 adaptoitava-asteisen suodattimen suodatinkertoimet b(j); j=l,2,...,M2. Nämä suodatinkertoimet viedään suljetun haun haarassa sijaitsevalle lyhyen aikavälin synteesisuodattimel-le 412. Analyysi synteesin kautta -rakenteelle viedään lisäksi tieto valitun lyhyen aikavälin mallinnuksen asteluvus-20 ta M2, jota käytetään valitsemaan sopiva mallinnusasteluku suodatuslohkossa 412. Tieto mallinnuksen asteluvusta välitetään myös herätteen mallinnukseen, jossa se ilmaisee, paljonko siirtonopeutta on käytetty lyhyen aikavälin suodatin-mallin kertoimien välittämiseen ja vastaavasti paljonko 25 siirtonopeutta on käytettävissä herätesignaalin muodostamiseen lohkossa 410. Järjestelmässä on käytetty lisäksi ns. pitkän aikavälin suodatusmallia suorittamalla lohkossa 411 spektrin hienorakennetta mallintava pitkän aikavälin suodatus, jonka siirtonopeutta voidaan myös adaptoida sen mukaan 30 kuinka suuri lyhyen aikavälin mallinnus on valittu käytettäväksi. Lohkot 413, 414 ja 415 suorittavat samat toiminnot kuin kuvan 4a lohkot 403, 404 ja 405.

Analyysi synteesin kautta -koodereihin voidaan keksinnön mu-35 kaista menetelmää soveltaa toisessa suoritusmuodossaan siten, että erotuselimelle 413 viedään suoraan puhesignaali 417 ilman, että sille suoritetaan ensin analyysisuodatus • · ·- 418. Tällöin lohkossa 412 suoritettavaan adaptoitava-astei- 13 95086 seen lyhyen aikavälin synteesisuodatukseen on liitettävä mukaan myös lohkon 418 käsittelylle käänteinen kiinteäastei-nen synteesisuodatus. Kiinteäasteinen ja adaptoitava-asteinen lyhyen aikavälin malli voidaan siis yhdistää puhekoode-5 riin joko siten, että heräteparametrien optimoinnissa suoritetaan pelkästään adaptoitava-asteinen synteesisuodatus (kuten kuvan 4b suoritusesimerkissä on esitetty), jolloin lyhyen aikavälin mallinnukseen kuuluvaa kiinteäasteista mallinnusta vastaava käänteissuodatus suoritetaan alkuperäiselle 10 puhesignaalille ennen vertailua synteesitulokseen tai siten, että koko lyhyen aikavälin synteesimalli eli adaptoitava-asteisen mallin mukaisen synteesisuodatuksen lisäksi myös kiinteäasteinen lyhyen aikavälin synteesisuodatus suoritetaan kooderin suljetussa haarassa. Kuvan 4b mukainen menet-15 tely on laskennalliselta kuormitukseltaan alhaisempi. Keksinnön mukaisella menetelmällä saavutetaan tässä suoritus-esimerkissä analyysi synteesin kautta -menetelmissä pienennetty laskennallinen kuormitus, koska vain mallintamisen kannalta tarpeellisen asteluvun suuruinen suodatus tarvitsee 20 suorittaa. Analyysi synteesin kautta -menetelmissä juuri suodatusoperaatioista muodostuu menetelmän aiheuttama suuri laskennallinen kuormitus.

Kuvassa 4b sijaitseva mallinnuksen asteluvun adaptointilohko 25 420 suorittaa saman toiminnan kuin kuvan 2a mallinnuksen asteluvun adaptointilohko 207. Vastaavasti kuin kuvan 2b enkooderissa voidaan myös analyysi synteesin kautta -haussa suorittaa suodatinitiallinnuksen asteluvun adaptointi tosiasiallisen virhesignaalin avulla takaisinkytketysti. Tämä 30 järjestely on esitetty kuvassa 4c. Kuvan 4c mallinnuksen asteluvun adaptointilohko 440 vastaa toiminnaltaan kuvan 2b • adaptointilohkoa 227. Lyhyen aikavälin suodatuksen asteluvun adaptointi kuvan 4c mukaisesti eri herätesignaalikandidaa-teilla syntesoitujen signaalien perusteella kasvattaa luon-35 nollisesti menetelmän laskennallista kuormitusta verrattuna kiinteäasteisen suodatusmallin käyttöön tai kuvan 4b mukaiseen ennen herätteen optimointia suoritettavaan mallinnuksen - asteluvun valintaan. Kuvan 4c kooderi poikkeaa kuvan 4b koo- 14 95086 derista oleellisesti siinä, että kuvan 4c kooderissa on otettu suodatinmalIin asteluvun adaptointi osaksi analyysi synteesin kautta -menetelmällä suoritettavaa koodausta. Kuvassa 4c suodattimen asteluku valitaan siten myös analyysi 5 synteesin kautta -periaatteella ja kooderissa on siis kyseessä suljetun haun suorittamisen ulottaminen herätesignaa-lin koodauksesta myös suodatinkertoimiin. Tämä on suoritettu tosin hyvin yksinkertaisessa muodossa eli rajoittuen vain suodatuksen asteluvun adaptointiin. Suodatinkertoimet muo-10 dostetaan yhä tässäkin suoritusesimerkissä avoimella haulla suoraan käsiteltävästä signaalista lohkossa 446. Kuvan 4c suoritusesimerkissä voidaan analyysi synteesin kautta -menetelmää käyttää, mutta samalla pitää menetelmästä aiheutuva laskennallinen, kuormitus kohtuullisena.

15 il • ♦ .

Claims

15 95086

1. Puheenkoodausmenetelmä, jossa puhesignaalin koodaamisessa a) kehitetään lyhyen aikavälin analysaattoreissa sisääntule-5 vaa signaalia vastaava joukko ennusteparametrejä, jotka jokaisessa koodattavana olevassa puhesignaalin lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, b) muodostetaan herätesignaali, joka syöttämällä ennustepa-rametrien mukaan toimivalle synteesisuodattimelle saadaan 10 syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali, tunnettu siitä, että c) lyhyen aikavälin suodatusmalli muodostetaan kahdesta osuudesta eli kiinteän asteluvun matala-asteisesta osuudesta 15 ja asteluvultaan muuttuvasta korkean mallinnuksen asteluvun mahdolliseksi tekevästä osuudesta; d) molemmille osuuksille suoritetaan lyhyen aikavälin ennus-teparametrien laskenta; e) lyhyen aikavälin mallin kokonaisastelukua adaptoidaan 20 kussakin koodattavana olevassa puhelohkossa puhesignaalin mukaan; j a f) suodatinmallin parametrien koodaamiseen käytettävää siirtonopeutta ja herätesignaalin koodaamiseen käytettävää siirtonopeutta adaptoidaan siten, että mallinnuksessa käy- 25 tettävän asteluvun kasvattaminen kasvattaa mallin parametrien siirtonopeutta ja vastaavasti laskee herätteen koodaamiseen käytettävää siirtonopeutta eli adaptoidaan herätesignaalin ja lyhyen aikavälin suodatusmallin välittämiseksi käytettyjen siirtonopeuksien keskinäistä suhdetta. 30

2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii- : tä, että kiinteäasteisen lyhyen aikavälin suodatusmallin suodatinkertoimien laskeminen suoritetaan suoraan koodattavaksi tulevasta puhesignaalista, kun taas adaptoitava-astei-35 sen lyhyen aikavälin mallin suodatinkertoimet lasketaan signaalista, joka on saatu suodattamalla koodattavaksi tuleva puhesignaali kiinteäasteisen mallin käänteissuodattimellä. 16 95086

3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnet-tu siitä, että matala-asteisen kiinteän asteluvun mallinnus-tulosta käytetään adaptoimaan adaptoitava-asteisen mallinnuksen astelukua siten, että adaptoitava-asteisen lyhyen 5 aikavälin mallinnuksen asteluku lasketaan pieneksi, mikäli koodattavassa signaalilohkossa suurin osa energiasta sijaitsee kiinteäasteisen mallinnuksen mukaan korkeilla taajuuksilla eli mikäli kiinteäasteisen synteesisuodattimen taajuusvaste on ylipäästötyyppinen, ja toisaalta adaptoitava-10 asteisen mallinnuksen astelukua kasvatetaan, mikäli kiinteä-asteista mallinnusta vastaava synteesisuodatus on ali-päästötyyppinen.

4. Jonkin edellisen patenttivaatimuksen mukainen menetel-15 mä, tunnettu siitä, että suoritettava mallinnuksen asteluvun adaptointi suoritetaan kokonaismallinnuksen ennustusvirheen mukaan takaisinkytketysti vertaamalla mallinnuksen asteluvun kasvattamisen vaikutusta ennustusvirheeseen.

5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu sii tä, että mallinnuksen astelukua kasvatetaan kunnes kasvattaminen tuottaa tiettyä kynnysarvoa pienemmän virhesignaalin tehon pienenemisen tai kunnes mallinnusasteluku saavuttaa suurimman sallitun mallinnuksen asteluvun. 25 . 6. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että kiinteäasteisessa suodattimessa käytetään alhaisempaa mallin parametrien adaptointitaajuutta kuin adaptoitava-asteisessa mallinnuksessa ja sitä käytetään 30 välittämään puhujasta ja mikrofonista aiheutuvia spektriomi-naisuuksia, jotka muuttuvat hitaammin kuin varsinainen ään-neinformaatio, joka mallinnetaan varsinaisesti adaptoitava-asteisessa mallinnuksessa.

7. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että sitä käytetään analyysi synteesin kautta herätesignaalin koodaamisen suorittavissa puhekoode- 4 · '· reissä yhdistämällä kiinteäasteinen ja adaptoitava-asteinen 95086 17 lyhyen aikavälin malli puhekooderiin joko siten, että herä-teparametrien suljetussa optimoinnissa suoritetaan pelkästään adaptoitava-asteinen synteesisuodatus, jolloin lyhyen aikavälin mallinnukseen kuuluvaa kiinteäasteista mallinnusta 5 vastaava käänteissuodatus suoritetaan alkuperäiselle puhe-signaalille ennen vertailua synteesitulokseen tai siten, että koko lyhyen aikavälin synteesimalli eli adaptoitava-asteisen mallin mukaisen synteesisuodatuksen lisäksi myös kiinteäasteinen lyhyen aikavälin synteesisuodatus suoriteli) taan kooderin herätesignaalin valinnan suorittavassa haarassa.

8. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että suodatinmallin asteluvun adaptointi 15 suoritetaan osana analyysi synteesin kautta -menetelmällä suoritettavaa koodausta hakemalla analyysi synteesin kautta sellainen suodattimen asteluku, josta asteluvun kasvattaminen ei oleellisesti paranna puhesignaalin laatua.

9. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että se on liitetty virheenkorjauskoo-daukseen siten, että valittu kokonaismallinnusaste välitetään paitsi herätesignaalin koodauksen suorittavalle lohkolle myös virheenkorjauskoodauksen suorittavalle lohkolle, 25 jolloin voidaan herätesignaalin koodauksen siirtonopeuden lisäksi adaptoida virheenkorjauskoodaukseen käytettävää siirtonopeutta. 18 95086