FI120327B

FI120327B - Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi

Info

Publication number: FI120327B
Application number: FI961445A
Authority: FI
Inventors: Andrew P Dejaco
Original assignee: Qualcomm Inc
Priority date: 1994-08-05
Filing date: 1996-03-29
Publication date: 2009-09-15
Also published as: JP2008171017A; EP1339044B1; JP3611858B2; IL114819A0; CN1131994A; FI20070642A; FI122726B; JPH09503874A; HK1015184A1; KR100399648B1; MY129887A; EP1339044A3; MY137264A; EP0722603B1; JP4444749B2; DE69536082D1; TW271524B; CA2172062C; DE69535723D1; CN1144180C

Description

MENETELMÄ JA LAITE ALENNETUN NOPEUDEN MUUTTUVANOPEUK-SISEN VOKOODAUKSEN SUORITTAMISEKSI

Esillä olevan keksinnön kohteena on tietoliikennejärjestelmät. Erityisesti esillä oleva keksintö 5 liittyy uuteen ja kehittyneeseen menetelmään ja laitteeseen muuttuvanopeuksisen lineaarisen ennustavan koodipainotteisen koodauksen suorittamiseksi.

Äänen lähettäminen digitaalisilla menetelmillä on levinnyt laajalle, erityisesti kaukoetäisyyksil-10 lä ja radiopuhelinsovelluksissa. Tämä vuorostaan on lisännyt mielenkiintoa määrittää pienin informaatiomäärä, joka voidaan lähettää kanavalla ja joka ylläpitää halutun laadun uudelleen muodostetussa puheessa. Jos puhetta lähetetään yksinkertaisesti näytteistämäl-15 lä ja digitoimalla, vaaditaan datanopeus luokkaa 64 kilobittiä sekuntia kohden (kbps), jotta saavutetaan analogisten puhelimien puheenlaatua vastaava laatu. Kuitenkin käyttämällä puheen analysointia, sitä seu-raavaa sopivaa koodausta, lähetystä ja syntetisointia 20 vastaanottimessa, voidaan saavuttaa merkittävä datano-peuden pudotus.

Laitteita, jotka suorittavat äänitetyn puheen kompressoinnin parametreillä, jotka liittyvät ihmispu-heen mallin muodostamiseen, kutsutaan tyypillisesti 25 vokoodereiksi. Sellaiset laitteet käsittävät kooderin, joka analysoi tulevan puheen palauttaakseen relevantit parametrit, ja dekooderi, joka uudelleensyntetisoi puheen käyttäen parametreja, jotka se saa lähetyskanavalla. Ollakseen tarkka, mallin on oltava vakiollises-30 ti muuttuva. Näin ollen puhe jaetaan aikalohkoihin tai analyysikehyksiin, jonka aikana parametrit lasketaan. Parametrit päivitetään kutakin uutta kehystä varten.

Useista puhekooderiluokista ?(Code Excited Linear Predicitive Coding, CELP), tilastollinen koo-35 daus (Stochastic Coding) tai vektoripainotteinen puhe-koodaus (Vector Excited Speech Coding) ovat yksi luokka. Tämän tietyn luokan koodausalgoritmi esitetään 2 julkaisussa "A 4.8 kbps Code Excited Linear Predictive Coder", Thomas E Tremain et al. , Proceedings of the Mobile Satellite Conference. 1988.

Vokooderi toimii kompressoimalla digitoitua 5 puhesignaalia alemman bittinopeuden signaaliksi poistamalla kaikki puheeseen kuulumattomat luonnolliset redundanssit. Puheessa on tyypillisesti lyhyitä redundansseja johtuen pääasiassa äänitraktaatin suodatuksesta ja pitkiä redundansseja johtuen äänijänteiden 10 kiihottamista äänitraktaateista. CELP kooderissa näitä toimintoja mallinnetaan kahdella suodattimena, for-manttisuodattimella ja pitkäkestoisella astesuodatti-mella. Koska nämä redundanssit poistetaan, saatu resi-duaalisignaali voidaan kuvata valkoisena Gaussin kohi-15 nana, joka myös on koodattava. Tämän menetelmän taustalla on laskea parametrit suodattimelle, jota kutsutaan LPC-suodattimeksi ja joka suorittaa lyhytaikaisen puheen aaltomuotojen ennustamisen käyttäen ihmisen ää-nitraktaattimallia. Lisäksi pitkäkestoiset vaikutuk-20 set, liittyen puheen asteeseen, mallinnetaan laskemalla parametrit suodattimelle, joka olennaisesti mallintaa ihmisen äänijänteitä. Lopulta suodattimet on käynnistettävä, ja se tehdään määrittämällä mikä satun-naiskäynnistyksen aaltomuoto koodikirjassa johtaa al-25 kuperäisen puheen lähimpään approksimaatioon, kun aaltomuoto käynnistää kaksi ylläkuvattua suodatinta. Näin ollen lähetetyt parametrit liittyvät kolmeen kohtaan (1) LPC-suodatin, (2) astesuodatin ja (3) koodikirja-käynnistys .

30 Vaikka vokoodaustekniikoiden käytön kohteena on yrittää vähentää kanavalla lähetetyn informaation määrää ylläpitäen palautetun puheen laatu, tarvitaan muita tekniikoita lisävähennyksen aikaansaamiseksi. Eräs aikaisemmin käytetty tekniikka lähetetyn infor-35 maation vähentämiseksi on ääniaktiviteetin portitus.

Tässä menetelmässä ei lähetetä informaatiota puheessa olevien taukojen aikana. Vaikka tällä menetelmällä 3 saavutetaan haluttu tulos datan vähentämisessä, siinä on useita haittapuolia.

Useissa tapauksissa puheen laatu heikkenee johtuen sanojen alkuperäisten osien leikkautumisesta.

5 Toinen kanavan kiinniportitukseen epäaktiivisuuden aikana liittyvä ongelma on, että järjestelmän käyttäjät huomaavat taustakohinan puuttumisen, mikä yleensä liittyy puheeseen, ja pitävät kanavan laatua heikompana kuin normaalissa puhelussa. Aktiivisen portituksen 10 lisäongelma on, että satunnaiset äkilliset kohinat taustalla saattava liipaista lähettimen vaikka puhetta ei ole, mikä johtaa epämiellyttäviin purskeisiin vas-taanottimessa.

Yritettäessä parantaa syntetisoidun puheen 15 laatua puheaktiivisuuden portitusjärjestelmissä, syn tetisoitu huojentava kohina lisätään dekoodausproses-sin aikana. Vaikka huojentavan kohinan lisäämisellä saavutetaan hieman laadun parantumista, se ei olennaisesti kehitä koko laatua, koska huojentava kohina ei 20 mallinna todellista taustakohinaa kooderissa.

Edullinen menetelmä datakompression suorittamiseksi lähetettävän tiedon vähentämiseksi, on suorittaa muuttuvanopeuksinen vokoodaus. Koska puhe luonnostaan sisältää hiljaisia jaksoja eli taukoja, voidaan 25 näitä jaksoja edustavan datan määrää pienentää. Muut tuvanopeuksinen vokoodaus hyödyntää kaikkein tehokkaimmin tätä tosiasiaa vähentämällä datanopeutta hiljaisilla jaksoilla. Datanopeuden alentaminen, vastakohtana täydelliselle katkolle lähetyksessä, hiljai-30 silla jaksoilla poistaa puheaktiviteetin portitukseen liittyviä ongelmia toteuttaen samalla vähennystä lähetetyssä informaatiossa.

Patenttijulkaisussa US 08/00,484, jätetty 14.1.1993, "Muuttuvanopeuksinen vokooderi", jossa ha-35 kijana on sama kuin tässä hakemuksessa ja joka liite tään tähän viittauksella, esitetään yksityiskohtaisemmin aikaisemmin mainittujen puheluokkien, ?(Code Exci- 4 ted Linear Predicitive Coding, CELP), tilastollinen koodaus tai vektoripainotteinen puhekoodaus, vokoode-rin vokoodausalgoritmi. CELP tekniikka itsessään ei aikaansaa merkittävää vähennystä puhetta edustavan 5 tarpeellisen datan määrään tavalla, joka uudelleensyn-tetisoinnin yhteydessä johtaa korkeaan laatuun. Kuten aiemmin mainittiin, vokooderiparametrit päivitetään kullekin kehykselle. Patenttijulkaisussa esitetty vo-kooderi aikaansaa muuttuvanopeuksisen lähtödatan vaih-10 tamalla mallin parametrien taajuutta ja tarkkuutta.

Yllä mainitun patenttijulkaisun vokoodausalgoritmi eroaa merkittävimmin perinteisistä CELP tekniikoista tuottamalla muuttuvanopeuksisen lähtödatan perustuen puheen aktiivisuuteen. Rakenne määritetään 15 siten, että parametrit määritetään harvemmin tai pienemmällä tarkkuudella, puheen taukojen aikana. Tämä tekniikka mahdollistaa jopa vielä suuremman vähentymisen tiedon tarpeeseen. Ilmiö, jota hyödynnetään da-tanopeuden pienentämiseksi, on puheaktiviteettiker-20 roin, joka keskimääräinen aikaprosentti, minkä puhuja puhuu keskustelun aikana. Tyypillisissä kaksisuuntais-sa puhelinkeskusteluissa keskimääräistä datanopeutta pienennetään kertoimella 2 tai enemmän. Puheen taukojen aikana, vokooderilla koodataan vain taustakohina. 25 Näillä hetkillä, joitain ihmisen äänitraktiin liitty viä parametrejä ei tarvitse lähettää.

Kuten aiemmin mainittiin ennalta tapahtuvaa rajoittamista hiljaisuuden aikana lähetettävän informaation vähentämiseksi kutsutaan puheaktiviteetin por-30 tittamiseksi, tekniikka, jossa informaatiota ei lähe tetä hiljaisten hetkien aikana. Vastaanottopuolella jakso voidaan täyttää syntetisoidulla "huojentavalla kohinalla". Sitä vastoin muuttuvanopeuksinen vokooderi lähettää jatkuvasti dataa, joka hakemuksen esimerkki-35 sovellutuksessa on nopeuksilla, jotka vaihtelevat vä lillä noin 8 kbps ja 1 kbps. Vokooderi, joka aikaansaa jatkuvaa datalähetystä, eliminoi "huojentavan kohinan" 5 tarpeen koodaamalla taustakohinaa ja tarjoamalla luonnollisemman laadun syntetisoidulle puheelle. Edellä mainitun patenttihakemuksen keksintö näin ollen aikaansaa merkittävän kehityksen syntetisoidun puheen 5 laadussa puheaktiviteetin portitukseen nähden sallimalla tasaisen siirtymän puheen ja taustan välillä.

Edellä mainitun patenttihakemuksen vokoo-dausalgoritmi mahdollistaa lyhyiden taukojen tunnistamisen puheessa, vähennys puheaktiviteetin tehollisessa 10 kertoimessa realisoidaan. Nopeuspäättelyt voidaan tehdä kehys kehykseltä periaatteella ilman kanavanvaihtoa (hangover), jolloin datanopeutta voidaan pienentää pu-hetauoilla kehyksen keston mittaiseksi, tyypillisesti 20 millisekunniksi. Näin tauot, kuten tavujen väliset, 15 voidaan siepata. Tämä tekniikka vähentää puheaktivi- teettikerrointa perinteisen ajattelun edelle, koska ei enää ainoastaa pitkiä lauseiden välisiä taukoja, vaan myös lyhyempiä taukoja voidaan koodata pienemmällä nopeudella .

20 Koska nopeuspäättelyt tehdään kehyspohjalta, ei sanan alkuperäisen osan osalta esiinny leikkautumista, kuten ääniaktiviteetin portitusjärjestelmässä. Tämän tyyppinen leikkautuminen esiintyy ääniaktiviteetin portitusjärjestelmässä johtuen viiveestä puheen 25 tunnistuksen ja datan lähetyksen uudelleenkäynnistyksen välillä. Nopeuspäättelyn käyttö perustuen kuhunkin kehykseen johtaa puheeseen, jossa kaikilla siirtymillä on luonnollinen kuulo. Aina lähettävän vokooderin yhteydessä puhujaa ympäröivä taustakohina kuuluu jatku-30 vasti vastaanottopäässä ja johtaa siten luonnollisempaan ääneen puhetaukojen aikana. Näin ollen esillä oleva keksintö aikaansaa pehmeän siirtymän taustakohinaan. Se mitä kuuntelija kuulee taustalla puheen aikana ei äkkinäisesti muutu syntetisoiduksi täytekohinak-35 si taukojen aikana, kuten ääniaktiviteetin portitus-j ärj estelmässä.

6

Koska taustakohinaa vokoodataan jatkuvatoimi-sesti lähetystä varten, mielenkiintoiset tapahtumat taustalla voidaan lähettää täysin selvästi. Tietyissä tapauksissa mielenkiintoinen taustakohina voidaan jopa 5 koodata suurimmalla nopeudella. Maksminopeuden koodaus saattaa esiintyä esimerkiksi silloin kun joku puhuu taustalla äänekkäästi, tai jos ambulanssi ajaa kadunkulmassa seisovan käyttäjän ohi. Vakio- tai hitaasti muuttuva taustakohina koodataan kuitenkin pienillä no-10 peuksilla.

Muuttuvanopeuksisen koodauksen käyttö enteilee koodijakomonipääsyyn (CDMA) perustuvan digitaalisen matkaviestinjärjestelmän kapasiteetin lisäystä enemmän kuin kaksinkertaisesti. CDMA ja muuttuvanope-15 uksinen vokoodaus sovitetaan tapauskohtaisesti, koska CDMA:n yhteydessö kanavien välinen häiriö vähenee automaattisesti lähetysdatan nopeuden vähentyessä jollain kanavalla. Sitä vastoin, ajatellaan järjestelmiä, joissa lähetysaikavälit ovat osoitettuja, kuten TDMA 20 tai FDMA. Sellaisissa järjestelmissä hyödyn saamiseen datanopeuden vähenemisestä vaaditaan käyttämättömien aikavälien uudelleenosoittamisen muille käyttäjille. Luonnollinen viive sellaisessa toteutuksessa johtaa siihen, että kanavaa voidaan uudelleenosoittaa ainoas-25 taa pitkien taukojen aikana. Näin ollen täyttä hyötyä ei saada puheaktiviteettikertoimesta. Kuitenkin ulkoisella koordinoinnilla muuttuvanopeuksinen koodaus on käyttökelpoinen muissa kuin CDMArssa muista mainituista syistä.

30 CDMA järjestelmässä puheen laatu voi hieman heiketä silloin kun ylimääräistä kapasiteettia halu-taa. Abstraktisti puhuen vokooderi voidaan ajatella useiksi vokoodereiksi, jotka kaikki toimivat eri nopeudella, mikä johtaa eri puhelaatuihin. Näin ollen puhe-35 laadut voidaan sekoittaa datalaähetyksen keskimääräisen nopeuden edelleen pienentämiseksi. Alkuperäiset kokeet osoittavat, että sekoittamalla täydellä ja puo- 7 linopeudella koodattu puhe, ts. maksimi sallittu da-tanopeus vaihtelee kehys kehykseltä 8 kbps:n ja 4 kbps:n välillä, saadun puheen laatu on parempi kuin puolen nopeuden muuttuvalla, 4 kbps maksimina, mutta 5 ei yhtä hyvä kuin täyden nopeuden, 8 kbps, muuttuvalla .

On tunnettua, että useimmiten puhelinkeskustelussa vain yksi ihminen puhuu kerrallaan. Kaksisuuntaisten linkkien lisäominaisuutena voidaan aikaansaada 10 nopeuksien välinen lukitus. Jos linkin toiseen suuntaan ollaan lähettämässä suurimmalla lähetysnopeudella, niin linkin toinen lähetyssuunta pakotetaan alhaisimpaan nopeuteen. Kahden suunnan välinen lukituksella taataan enintään 50 % keskimääräinen käyttö kummalle-15 kin linkille. Kuitenkin, kun kanava on kiinniportitet-tu, kuten on tilanne nopeuslukituksessa aktiviteetti-portituksessa, ei kuuntelijalla ole mitään mahdollisuutta keskeyttää puhujaa ottaakseen puhujan roolin keskustelussa. Yllä mainitun patenttihakemuksen mukai-20 nen vokoodausmenetelmä helposti aikaansaa muuntuvan nopeuslukituksen ohjaussignaaleilla, jotka asettavat vokoodausnopeuden.

Yllä kuvatussa patenttihakemuksessa vokooderi toimii joko puheen läsnäollessa täydellä nopeudella 25 tai kun puhe ei ole läsnä kahdeksasosanopeudella. Vo-koodusalgoritmin toiminta puolella ja neljäsosanopeu-della varataan kapasiteettipiikeille tai kun muuta dataa on lähetettävänä puheen rinnalla.

US patenttihakemus 08/118,473, jätetty 30 8.9.1993, "Menetelmä ja laite lähetysdatanopeuden mää rittämiseksi monen käyttäjän tietoliikennejärjestelmässä", jossa hakijana on sama kun tässä hakemuksessa ja joka liitetään tähän, esittää yksityiskohtaisemmin menetelmän, jolla tietoliikennejärjestelmä järjestel-35 män kapasiteettimittauksen perusteella rajoittaa muut-tuvanopeuksisella vokooderilla vokoodattujen kehysten keskimääräistä datanopeutta. Järjestelmä vähentää kes- 8 kimääräistä datanopeutta pakottamalla ennalta määrätyt kehykset sarjaan täyden nopeuden kehyksiä koodattavaksi alemmalla nopeudella eli puolella nopeudella. Ongelma tämän tyyppisessä koodausnopeuden alentamisessa 5 aktiivisilla puhekehyksillä on, että rajoittaminen ei vastaa mitään tulopuheen ominaisuutta eikä näin ole optimoitu puheen kompressointilaadulle.

Lisäksi US patenttihakemuksessa 07/984,602, jätetty 2.12.1992, "Parannettu menetelmä puheen koo-10 dausnopeuden määrittämiseksi muuttuvanopeuksisessa vo-kooderissa", jossa hakijana on sama kun tässä hakemuksessa ja joka liitetään tähän, esitetään menetelmä ei-kuuluvan puheen erottamiseksi kuuluvasta puheesta. Esitetty menetelmä tutkii puheen tehoa ja spektraalis-15 ta kallistusta erottaakseen ei-kuuluvan puheen taustasta .

Muuttuvanopeuksiset kooderit, joiden koodaus-nopeus vaihtelee, perustuvat kokonaan tulopuheen ääni-aktiviteettiin laiminlyöden kompressointitehokkuuden 20 muuttuvanopeuksisessa vokooderissa, joka vaihtaa koo-dausnopeutta perustuen sisällön monimutkaisuuteen tai tietoon, joka vaihtelee dynaamisesti aktiivisen puheen aikana. Sovittamalla koodausnopeudet tuloaaltomuotoon, voidaan rakentaa tehokkaampia koodereita. Edelleen 25 järjestelmien, jotka pyrkivät dynaamisesti säätämään muuttuvanopeuksisen vokooderin lähdön datanopeutta, pitäisi vaihtaa datanopeuksia tulopuheen ominaisuuksien mukaan saavuttaakseen optimaalisen puhelaadun halutulla keskimääräisellä datanopeudella.

30

Esillä oleva keksintö on uusi ja kehittynyt menetelmä ja laite aktiivisten puhekehysten koodaamiseksi alennetulla datanopeudella koodaamalla puheke-hykset nopeuksilla väliltä ennalta määrätty maksimino-35 peus ja ennalta määrätty miniminopeus. Esillä oleva keksintö nimeää aktiivisen puheen toimintatilajoukon. Esillä olevan keksinnön esimerkkisovellutuksessa on 9 neljä aktiivisen puheen toimintatilaa, täyden nopeuden puhe, puolen nopeuden puhe, ei-kuuluva neljännesnopeu-den puhe ja kuuluva neljännesnopeuden puhe.

Esillä olevan keksinnön tarkoituksena on tuo-5 da esiin optimoitu menetelmä koodaustilan valitsemi seksi, mikä aikaansaa tulopuheen nopeudeltaan tehokkaan koodauksen. Esillä olevan keksinnön toisena tarkoituksena on identifioida parametrijoukko, joka sopii ihanteellisesti tällaiseen toiminnallisen tilan valin-10 taan ja antaa välineet tämän parametrijoukon generoimiseksi. Kolmanneksi esillä olevan keksinnön tarkoituksena on aikaansaada kahden erillisen toiminnan tunnistaminen, mikä sallii pieninopeuksisen koodauksen laadun minimiuhrauksin. Kaksi toimintaa ovat ei-15 kuuluvan puheen läsnäolo ja väliaikaisesti maskatun puheen läsnäolo. Esillä olevan keksinnön neljäntenä tarkoituksena on aikaansaada menetelmä puhekooderin keskimääräisen datalähdön nopeuden dynaaminen säätö minimaalisin vaikutuksin puheen laatuun.

20 Esillä oleva keksintö aikaansaa joukon no- peuspäättelykriteereitä, joita pidetään tilamittoina. Ensimmäinen tilamitta on kohdesovituksen signaali-kohinasuhde (TMSNR) edellisestä koodauskehyksestä, joka antaa tiedon kuinka hyvin syntetisoitu puhe vastaa 25 tulopuhetta, tai toisinsanoen kuinka hyvin koodausmal- li toimii. Toinen tilamitta on normalisoitu autokorre-laatiofunktion (NACF), joka mittaa puheen jaksollisuutta. Kolmas tilamitta on nollan ylitysten parametri, joka on laskennallisesti yksinkertainen menetelmä 30 tulopuheen korkeiden taajuuksien selvittämiseen. Nel jäs mitta on ennustevahvistuksen ero (PGD) , joka määrittää ylläpitääkö LPC-malli ennustetehokkuutensa. Viides mitta on tehoero (ED), joka vertaa nykyisen kehyksen tehoa keskimääräiseen tehoon.

35 Esillä olevan keksinnön mukaisen vokoodausal- goritmin esimerkkisovellutus käyttää viittä yllä lueteltua tilamittaa valitakseen koodaustilan aktiivisel- 10 le puhekehykselle. Esillä olevan keksinnön mukainen nopeuspäättelylogiikka vertaa NAFC:tä ensimmäiseen kynnysarvoon ja ZC:tä toiseen kynnysarvoon määrittääkseen, onko puhe koodattava ei-kuuluvana neljännesnope-5 udella.

Jos määritetään, että aktiivinen puhekehys sisältää kuuluvaa puhetta, vokooderi tutkii parametrin ED määrittääkseen pitäisikö puhekehys koodata neljän-nesnopeuden kuuluvana puheena. Jos selviää, että pu-10 hetta ei saa koodata neljännesnopeudella, niin vokooderi testaa voidaanko puhe koodata puolella nopeudella. Vokooderi testaa arvon TMSNR:n, PGD:n ja NACF:n arvot määrittääkseen voidaanko puhekehys koodata puolella nopeudella. Jos selviää, että aktiivista puheke-15 hystä ei voi koodata neljännes- tai puolella nopeudella, niin kehys koodataan täydellä nopeudella.

Vielä keksinnön kohteena on tuoda esiin menetelmä kynnysarvojen dynaamiseksi muuttamiseksi nopeus-vaatimusten sovittamiseksi. Vaihtamalla yhtä tai use-20 ampaa tilanvalintakynnystä on mahdollista lisätä tai vähentää keskimääräistä lähetysnopeutta. Näin ollen säätämällä kynnysarvoja dynaamisesti, lähtönopeutta voidaan muuttaa.

Esillä olevan keksinnön muodot, tarkoitukset 25 ja edut tulevat selvemmiksi seuraavasta yksityiskohtaisesta kuvauksesta viitaten oheisiin piirustuksiin, joissa on samat viitenumerot kauttaaltaan ja joissa: kuvio 1 on lohkokaavio, joka esittää esillä olevan keksinnön mukaista koodausnopeuden määrityslai-30 tetta; ja kuvio 2 on vuokaavio, joka esittää nopeus-päättelylogiikan koodausnopeuden valintaprosessia.

Esimerkkisovellutuksessa koodataan 160 puhe-näytteen puhekehyksiä. Esillä olevan keksinnön esi-35 merkkisovellutuksessa on neljä datanopeutta; täysino-peus, puolinopeus, neljäsosanopeus ja kahdeksasosano-peus. Täysinopeus vastaa lähtödatan nopeutta 14.4 11 kbps. Puolinopeus vastaa lähtödatan nopeutta 7.2 kbps. Neljäsosanopeus vastaa lähtödatan nopeutta 3.6 kbps. Kahdeksasosanopeus vastaa lähtödatan nopeutta 1.8 kbps, ja se varataan hiljaisuuden aikana tapahtuviin 5 lähetyksiin.

On huomattava, että esillä oleva keksintö liittyy ainoastaan aktiivisten kehysten, kehysten, joissa on tunnistettu puhetta, koodaamiseen. Puheen tunnistaminen kehyksessä suoritetaan menetelmällä, jo-10 ka on kuvattu yksityiskohtaisemmin yllä mainituissa patenttijulkaisuissa US 08/004,484 ja 07/948,602.

Viitaten kuvaan l, tilamittauselementti 12 määrittää päättelylogiikan 14 aktiivisen kehyksen koodaamiseen käytettävän koodausnopeuden määrittämiseen 15 käyttämien viiden parametrin arvot. Esimerkkisovellu-tuksessa tilamittauselementti 12 määrittää viisi parametria, jotka se antaa päättelylogiikalle 14. Perustuen tilamittauselementin 12 antamiin parametreihin, päättelylogiikka 14 valitsee koodausnopeudeksi täyden-20 , puoli- tai neljäsosanopeuden.

Nopeuden päättelylogiikka 14 valitsee yhden neljästä koodaustilasta viiden muodostetun parametrin mukaan. Neljä koodaustilaa käsittää täyden nopeuden tilan, puolen nopeuden tilan ei-kuuluvan neljäsosano-25 peuden tilan ja kuuluvan neljäsosanopeuden tilan. Kuuluva neljäsosanopeuden tila ja ei-kuuluva neljäsosanopeuden tila antavat dataa samalla nopeudella, mutta erilaisilla koodaustavoilla. Puolen nopeuden tilaa käytetään pysyvän, jaksollisen hyvin mallinnetun pu-30 heen koodaamiseen. Sekä kuuluva neljäsosanopeuden, ei- kuuluva neljäsosanopeuden ja puolen nopeuden koodaus käyttävät hyväkseen puhealueita, jotka eivät vaadi suurta tarkkuutta kehyksen koodaamisessa.

Neljäsosanopeuden ei-kuuluvaa tilaa käytetään 35 ei-kuuluvan puheen koodaamiseen. Neljäsosanopeuden kuuluvaa tilaa käytetään väliaikaisesti maskattujen puhekehyksien koodaamiseen. Useimmat CELP puhekooderit 12 käyttävät hyväkseen samanaikaista maskausta, jossa pu-heteho annetulla taajuudella maskaa pois kohinatehon samalla taajuudella ja hetkellä tehden kohinan kuulumattomaksi. Muuttuvanopeuksiset puhekooderit voivat 5 käyttää hyväkseen väliaikaista maskausta, missä pienitehoiset aktiiviset puhekehykset maskataan edeltävällä saman taajuuden sisältävällä suuritehoisella puheke-hyksellä. Koska ihmiskorva integroi tehoa ajan suhteen eri taajuuskaistoilla, pienitehoiset kehykset keskiar-10 voistetaan suuritehoisten kehysten kanssa vähentäen siten koodaustarvetta pienitehoisille kehyksille. Tämän väliaikaisen kuulomaskausilmiön hyväksikäyttö mahdollistaa muuttuvanopeuksisen puhekooderin vähentää koodausnopeutta tämän puhetilan aikana. Tämä fysioa-15 kustinen ilmiö kuvataan yksityiskohtaisemmin artikke lissa Psvchoacoustics by E. Zwicker and H. Fasti, pp. 56 - 101.

Tilamittauselementti 12 vastaanottaa neljä tulosignaalia, joilla se generoi viisi tilaparametria. 20 Ensimmäinen signaali, jonka tilamittauselementti 12 vastaanottaa on S(n), joka on koodaamaton tulopuhenäy-te. Esimerkkisovellutuksessa puhenäytteet annetaan kehyksissä, jotka sisältävät 160 puhenäytettä. Puhekehykset, jotka annetaan tilamittauselementtiin 12 si-25 sältävät kaikki aktiivista puhetta. Hiljaisuuden aika na keksinnön mukainen aktiivinen puhenopeustunnistus-järjestelmä on epäaktiivinen.

Toinen signaali, jonka tilamittauselementti 12 vastaanottaa on syntetisoitu puhenäytesignaali 30 (AS), joka on dekoodattua puhetta muuttuvanopeuksisen CELP kooderin dekooderilta. Kooderin dekooderi dekoo-daa koodatun puhekehyksen suodattimen ja muistin parametrien päivittämistä varten synteesipohjaisen CELP kooderin analyysissä. Sellaisten dekoodereiden suun-35 nittelu on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484.

13

Kolmas signaali, jonka tilamittauselementti 12 vastaanottaa on formanttiresiduaalisignaali e (n). Formanttiresiduaalisignaali on CELP kooderin lineaarisen ennustavan koodauksen (LPC) suodattimena suoda-5 tettu puhesignaali. LPC-suodattimien suunnittelu ja signaalien suodattaminen niillä on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484. Neljäs tulo tilamittausele-menttiin 12 on A(z), jotka ovat suodattimen kerroin-10 arvoja havainnollisesti painottavassa suodattimessa CELP kooderissa. Kerroinarvojen generointi ja havainnollisesti painottavan suodattimen toiminta on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484.

15 Kohdesovituksen signaali-kohinasuhteen(SNR)- laskentaelementti 2 vastaanottaa syntetisoidun puhe-signaalin, AS(n), puhenäytteet S (n) ja joukon havainnollisesti painottavan suodattimen kerroinarvoja A(z) . Kohdesovituksen SNR laskentaelementti 2 antaa paramet-20 rin, jota pidetään parametrina TMSNR ja joka osoittaa miten hyvin mallinnettu puhe seuraa tulopuhetta. Kohdesovituksen SNR laskentaelementti 2 generoi TMSNR:n alla olevan yhtälön 1 mukaan: 159 Z§w2(n) TMSNR = 10-log ^- (1) Z(S W(n)-SW(R»2 _ n=0 25 missä alaindeksi w tarkoittaa, että signaali on suodatettu havainnollisesti painottavalla suodattimena.

Huomaa, että tämä mitta lasketaan edelliselle puheke-hykselle, kun taas NACF, PGD, ED, ZC lasketaan nykyi-30 selle puhekehykselle. TSMNR lasketaan edelliselle pu-hekehykselle, koska se on valitun koodausnopeuden funktio ja siten laskennan monimutkaisuuden vuoksi se lasketaan edelliselle kehykselle koodattavana olevasta kehyksestä.

14

Havainnollisesti painottavien suodattimien suunnittelu ja toteutus on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484. On huomattava, että havainnol-5 lista painotusta (perceptual weighting) pidetään puhe-kehyksen havainnollisesti merkittävien osien painottamisena. Kuitenkin on havaittu, että mittaus voidaan tehdä ilman signaalien havainnollista painottamista.

Normalisoidun autokorrelaation laskentaele-10 mentti 4 vastaanottaa formanttijäännössignaalin, e(n). Normalisoidun autokorrelaation laskentaelementti 4 antaa tiedon puheen jaksollisuudesta puhekehyksessä. Normalisoidun autokorrelaation laskentaelementti 4 generoi parametrin NACF alla olevan yhtälön 2 mukaan: 159 X e(n) · e(n - T) NACF = max n=0 ,.9........

15 Σ*») <2) n=0 T e [20,120]

On huomattava, että tämän parametrin generointi vaatii edellisen kehyksen koodauksen formanttiresiduaalisig-naalin muistamisen. Tämä mahdollistaa ei ainoastaan jaksollisuuden testaamisen vaan myös nykyisen kehyksen 20 jaksollisuuden testaamisen edelliseen kehykseen näh den .

Syy, että esimerkkisovellutuksessa käytetään formanttiresiduaalisignaalia e(n) puhenäytteiden S (n), joita voitaisiin käyttää NACF:n muodostamisessa, si-25 jaan, on eliminoida formanttien vuorovaikutus puhesignaaliin. Puhesignaalin siirtäminen formanttisuodatti-men lävitse auttaa puheen verhokäyrän alentamisessa ja vaalentaa siten saatavaa signaalia. On huomattava, että viiveen T arvot esimerkkisovellutuksessa vastaavat 30 astetaajuuksia 66 Hz:n ja 400 Hz:n välillä näytteis-tystaajuudella 8000 näytettä sekunnissa. Astetaajuus annetulle viivearvolle lasketaan yhtälöllä 3 alla: f faste = —, missä fon nä yttestystaajuus. (3) 15

On huomattava, että taajuusaluetta voidaan laajentaa tai supistaa yksinkertaisesti valitsemalla eri viive arvo j oukko . Lisäksi on huomattava, että esillä oleva keksintö soveltuu samalla tavoin mille tahansa näyt-5 teistystaajuudelle.

Nollan ylitysten lukumäärän laskin 6 vastaanottaa puhenäytteet S(n) ja laskee puhenäytteen merkin-vaihdon kertojen määrän. Tämä on laskennallisesti helppo menetelmä korkeataajuisten komponenttien tun-10 nistamiseksi puhesignaalissa. Tämä laskin voidaan toteuttaa ohjelmallisesti seuraavanlaisella silmukalla:

Cllt=0 (4) for n=0,158 (5) if ( S(n)· S(n+1 )<0) cnt++ (6) 15 Yhtälöiden 4-6 muodostama silmukka kertoo peräkkäiset puhenäytteet ja testaa onko tulo pienempi kuin nolla, mikä osoittaa, että kahden peräkkäisen näytteen merkki on eri. Tämä olettaa, että puhesignaalissa ei ole DC-komponenttia. DC-komponentin poistaminen on sinänsä 20 tunnettua.

Ennustevahvistuksen eroelementti 8 vastaanottaa puhesignaalin ja formanttiresiduaalisignaalin e(n). Ennustevahvistuksen eroelementti 8 generoi parametrin PGD, joka määrittää ylläpitääkö LPC-malli en-25 nustustehokkuutensa. Ennustevahvistuksen eroelementti 8 generoi ennustevahvistuksen, Pg, alla olevan yhtälön 7 mukaan: 159 2>2(n) P.=·^- (7) Σ») n=0

Nykyisen kehyksen ennustevahvistusta verrataan edelli-30 sen kehyksen ennustevahvistukseen generoitaessa lähtö-parametri PGD alla olevalla yhtälöllä 8: f P (i) ^ PDG= 10-log —-- , missä i vittaa kekysmimeroon (8) 16

Edullisessa sovellutuksessa ennustevahvistuksen eroe-lementti 8 ei generoi ennustevahvistuksen Pg arvoja. LPC vakioiden generoinnissa Durbinin rekursion oheis-tulo on ennustevahvistus Pg, joten laskennan toistami-5 nen ei ole tarpeen.

Kehystehon eroelementti 10 vastaanottaa nykyisen kehyksen puhenäytteet s (n) ja laskee puhesignaalin tehon nykyisessä kehyksessä alla olevan yhtälön 9 mukaan: 159 10 E, = 2 S2 (n) (9) u=0

Nykyisen kehyksen tehoa verrataan edellisten kehysten keskimääräiseen tehoon, Eave. Esimerkkisovellutuksessa keskimääräinen teho generoidaan vuotointegraattorilla, joka on muotoa: 15 Eave = a*Eave + (1-a)»Ei, missä 0<α<1 (10)

Kerroin a määrittää kehykset, jotka ovat relevantteja laskennassa. Esimerkkisovellutuksessa a asetaan arvoon 0.8825, joka antaa kahdeksan kehyksen aikavakion. Kehystehon eroelementti 10 generoi seuraavaksi paramet-20 rin ED alla olevan yhtälön 11 mukaan: E.

ED = 10-log—— (11) ^ave

Viisi parametria, TSMNR, NACF, ZC, PGD ja Ed annetaan nopeuden päättelylogiikalle 14. Nopeuden päättelylogiikka 14 valitsee koodausnopeuden seuraa-25 valle näytekehykselle parametrien ja ennalta määrätyn valintasäännöstön mukaan. Viitaten nyt kuvaan 2 esitetään vuokaavio, joka esittää nopeuden päättelylogiikan 14 nopeusvalintaprosessia.

Nopeuden valintaprosessi alkaa lohkosta 18. 30 Lohkossa 20 normalisoidun autokorrelaatioelementin 4 lähtöä NAFC verrataan ennalta määrättyyn kynnysarvoon THR1 ja nollan ylitysten laskentaelementin lähtöä verrataan toiseen ennalta määrättyyn kynnysarvoon THR2. Jos NAFC on pienempi kuin THR1 ja ZC on suurempi kuin 35 THR2, niin edetään lohkoon 22, joka koodaa puheen nel- 17 j äsosanopeuden ei-kuuluvana. Se että NACF on alle ennalta määrätyn kynnyksen indikoi jaksollisuuden puuttumista puheesta ja että ZC on suurempi kuin ennalta määrätty kynnys indikoi suurta taajuuskomponenttia pu-5 heessa. Näiden kahden tilan yhdistelmä indikoi, että kehys sisältää ei-kuuluvaa puhetta. Esimerkkisovellu-tuksessa THR1 on 0.35 ja THR2 on 50 nollan ylitystä. Jos NACF ei ole pienempi kuin THR1 tai ZC ei ole suurempi kuin THR2, niin edetään lohkoon 24.

10 Lohkossa 24 kehystehon eroelementin 10 lähtöä ED verrataan kolmanteen kynnysarvoon THR3. Mikäli ED on pienempi kuin THR3, niin nykyinen kehys koodataan neljäsosanopeuden kuuluvana puheena lohkossa 26. Mikäli tehoero nykyisen kehyksen välillä on pienempi kuin 15 keskimäärin enemmän kuin yhden kynnyksen verran, niin tunnistetaan väliaikaisesti maskatun puheen tila. Esi-merkkisovellutuksessa THR3 on -14 dB. Mikäli ED ei ylitä THR3:a, niin edetään lohkoon 28. Lohkossa 28 kohdesovituksen SNR:n laskentaelementin 2 lähtöä TMSNR 20 verrataan neljänteen kynnysarvoon THR4; ennustevahvis-tuksen eroelementin lähtöä PGD verrataan viidenteen kynny s a rvo on THR5; ja normalisoidun autokorrelaation laskentaelementin lähtöä verrataan kuudenteen kynnysarvoon THR6. Jos TMSNR ylittää THR4:n; PGD on pienempi 25 kuin THR5; ja NACF ylittää THR6:n, niin edetään lohkoon 30 ja puhe koodataan puolella nopeudella. Se että TMSNR ylittää kynnyksen indikoi, että malli ja mallinnettava puhe vastasivat toisiaan hyvin edellisessä kehyksessä. Se että parametri PGD on pienempi kuin en-30 naita määrätty kynnys indikoi, että LPC malli ylläpitää ennustetehokkuutensa. Se että parametri NACF ylittää sen ennalta määrätyn kynnyksen indikoi, että kehys sisältää jaksollista puhetta, joka on jaksollista edelliseen kehykseen nähden.

35 Esimerkkisovellutuksessa THR4 asetetaan alus

sa 10 dB:iin, THR5 asetaan -5 dB:iin ja THR6 asetetaan 0.4. Lohkossa 28, jos TMSNR ei ylitä THR4: ää tai PGD

18 ei ylitä THR5:tä tai NACF ei ylitä THR6: ta, niin edetään lohkoon 32 ja nykyinen puhekehys koodataan täydellä nopeudella.

Säätämällä dynaamisesti kynnysarvoja, voidaan 5 saavuttaa mielivaltaisesti kaiken kattava data. Kaiken kattava keskimääräinen aktiivisen puheen datanopeus R voidaan määrittää analyysia varten ikkunan W aktiivisina puhekehyksinä seuraavasti:

Rf -#Rj kehykset + Rhkehykset + Rq ·#Rq - kehykset w (12) 10 missä Rf on täydellä nopeudella koodattujen kehysten datanopeus,

Rh on puolella nopeudella koodattujen kehysten datanopeus ,

Rq, on neljäsosanopeudella koodattujen kehysten da-15 tanopeus, ja W=#Rf-kehysten+#Rh-kehysten+#Rq-kehysten Kertomalla kukin koodausnopeus sillä nopeudella koodattujen kehysten lukumäärällä ja tulos jakamalla kehysten kokonaismäärällä näytteessä, voidaan laskea ak-20 tiivisen puheen keskimääräinen datanopeus. On tärkeää, että kehysnäytteen koko, W, on riittävän suuri pitkien ei-kuuluvien puhejaksojen ehkäisemiseksi, kuten esimerkiksi venytetty "s" kuulostaa häiriöltä keskimääräisessä puhetilastossa. Esimerkkisovellutuksessa ke-25 hysnäytteen koko W laskentaa varten keskimääräisellä nopeudella on 400 kehystä.

Keskimääräistä datanopeutta voidaan vähentää lisäämällä täydellä nopeudella koodattujen kehysten määrää koodattavaksi puolella nopeudella, ja päinvas-30 toin keskimääräistä datanopeutta voidaan kasvattaa li säämällä puolella nopeudella koodattavien datakehysten määrää koodattavaksi täydellä nopeudella. Edullisessa sovellutuksessa kynnys, jota säädetään tämän vaikutuksen aikaansaamiseksi on THR4. Esimerkkisovellutuksessa 35 TSNR:n arvojen histogrammi talletetaan. Esimerkkiso vellutuksessa tallennetut TMSNR arvot kvantisoidaan 19 kokonaislukudesibeliarvoiksi THR: n nykyisistä arvoista. Ylläpitämällä tämän kaltaista histogrammia, voidaan helposti arvioida montako kehystä olisi muuttunut edellisessä analyysissä koodattavaksi puolella nopeu-5 della täyden nopeuden koodauksesta jos THR4:ä olisi pienennetty kokonaisluvulla desibeleinä. Päinvastoin, voidaan helposti arvioida montako kehystä olisi muuttunut edellisessä analyysissä koodattavaksi täydellä nopeudella puolen nopeuden koodauksesta jos THR4:ä 10 olisi kasvatettu kokonaisluvulla desibeleinä.

Kaava, jolla määritetään nopeudesta täyteen nopeuteen muuttuneiden määrä, määritetään yhtälöllä 13 :

^ _ [kohdenopeus - keskim. nopeus]-W

VÄ 13 15 missä Δ on puolella nopeudella olevien kehysten määrä, jotka pitäisi koodata täydellä nopeudella kohdenopeu-den ylläpitämiseksi, ja W=#Rf-kehysten+#Rh-kehysten+#Rq-kehysten.

TMSNRne,, = TMSNRold + (dB: ien määrä 2 0 TMSNRold:ista Δ kehyserojen saavuttamiseksi määritettynä yhtälöllä 13 yllä)

Huomaa, että TMSNRrn alkuarvo on halutun kohdenopeuden funktio. Esimerkkisovellutuksen kohdenopeudella 8.7 kbps, järjestelmässä arvoilla Rf = 14.4 kbps, Rf = 7.2 25 kbps, Rq = 3.6 kbps, TMSNR:n alkuarvo on 10 dB. On huomattava, että kvantisoimalla TMSNR arvot kokonaislukuihin etäisyydelle kynnyksestä THR4 voidaan helposti muodostaa hienompi jaotus, kuten puoli- tai neljäs-osadesibelejä tai voidaan tehdä karkeammaksi, kuten 30 puolitoista tai kaksi desibeliä.

On havaittu, että kohdenopeus voidaan joko tallettaa päättelylogiikkaelementin 14 muistiin, jolloin kohdenopeus olisi staattinen arvo, jonka mukaan THR4 arvo dynaamisesti määritettäisiin. Lisäksi tälle 35 kohdenopeudelle on havaittu, että tietoliikennejärjestelmä voi lähettää nopeuskomentosignaalin koodausno- 20 peuden valitsinlaitteelle perustuen järjestelmän kapasiteetin nykyiseen tilaan.

Nopeuskomentosignaali voi joko spesifioida kohdenopeuden tai se voi yksinkertaisesti vaatia lisä-5 ystä tai pienennystä keskimääräiseen nopeuteen. Jos järjestelmä määrittäisi kohdenopeuden, sitä voitaisiin käyttää määritettäessä THR4:n arvoa yhtälöillä tila-mittauselementti 12 ja 13. Jos järjestelmä spesifioisi vain sen, että käyttäjän pitäisi lähettää suuremmalla 10 tai pienemmällä lähetysnopeudella, nopeuden päättely-logiikka 14 voisi vastata vaihtamalla THR4 arvoa ennalta määrätyllä lisäyksellä tai laskea muutoksen ennalta määrätyn lisäävän lisäyksen tai vähennyksen mukaan nopeudessa.

15 Lohkot 22 ja 26 indikoivat eroa puheen koo dausmenetelmässä perustuen joko puhenäytteisiin, jotka edustavat kuuluvaa tai ei-kuuluvaa puhetta. Ei-kuuluva puhe on hankausäänteen ja konsonanttiäänteen muodossa olevaa puhetta, kuten "f", "s", "sh", "t" ja "z". Nel-20 jäsosanopeuden kuuluva puhe on väliaikaisesti maskat-tua puhetta, missä hiljaa kuuluva puhekehys seuraa suhteellisen voimakasta puhekehystä samalla taajuussi-sällöllä. Ihmiskorva ei kykene kuulemaan puheen hienopisteitä alhaisella voimakkuudella, joka seuraa 25 korkeavoimakkuuksista kehystä, joten bittejä voidaan säästää koodaamalla tämä puhe neljännesnopeudella. Ei-kuuluvan neljäsosanopeuden koodauksen esimerkkisovel-lutuksessa puhekehys jaetaan neljään alikehykseen. Kaikki mikä lähetetään kullekin neljästä alikehyksestä 3 0 on vahvistusarvo G ja LPC-suodattimen kertoimet A(z) . Esimerkkisovellutuksessa lähetetään viisi bittiä edustaen vahvistusta kussakin alikehyksessä. Dekooderissa kullekin alikehykselle valitaan koodikirjaindeksi satunnaisesti. Satunnaisesti valittu koodikirjavektori 35 kerrotaan lähetetyllä vahvistusarvolla ja annetaan LPC-suodattimen läpi, A(z), syntetisoiden ei-kuuluvan puheen generoimiseksi.

21

Kuuluvan neljäsosanopeuden koodauksessa puhe-kehys jaetaan kahteen alikehykseen ja CELP kooderi määrittää koodikirjaindeksin ja vahvistuksen kullekin alikehykselle. Esimerkkisovellutuksessa viisi bittiä 5 allokoidaan koodikirjaindeksin spesifioimiseksi ja toiset viisi bittiä allokoidaan vastaavan vahvistusar-von spesifioimiseksi. Esimerkkisovellutuksessa kuuluvan neljäsosanopeuden koodauksessa käytetty koodikirja on puolen ja täyden nopeuden koodauksen käytetyn koo-10 dikirjan vektorialijoukko. Esimerkkisovellutuksessa seitsemää bittiä käytetään koodikirjaindeksin spesifi-oimiseksi täyden ja puolen nopeuden koodaustiloissa.

Kuvassa 1 lohkot voidaan toteuttaa rakenteellisina lohkoina haluttujen toimintojen suorittamiseen 15 tai lohkot voivat edustaa funktioita, jotka on suoritettu digitaalisten signaaliprosessorien (DSP) tai sovelluskohtaisten integroitujen piirien ohjelmoimiseksi. Esillä olevan keksinnön toiminnan kuvaus antaa ammattimiehelle edellytykset toteuttaa esillä oleva kek-20 sintö DSP:lie tai ASICille ilman kohtuutonta kokemusta .

Edellä oleva edullisten sovellutusten kuvaus annetaan, jotta ammattimies voisi käyttää tai valmistaa esillä olevan keksinnön mukaista laitetta. Näiden sovel-25 lutusten eri modifikaatiot ovat ammattimiehille ilmeisiä ja tässä kuvatut yleiset periaatteet ovat sovellettavissa muihin sovellutuksiin keksimättä mitään uutta. Näin ollen esillä olevaa keksintöä ei rajata tässä esitettyihin sovellutuksiin vaan tässä esitettyjen periaatteiden 30 ja uusien hahmojen käsittämään suojapiirin.

Claims

1. Laite valitsemaan koodausnopeus ennalta määrätystä joukosta koodausnopeuk-sia puhekehyksen koodaamiseksi sisältäen useita puhenäytteitä, tunnettu siitä, 5 että käsittää: moodimittausvälineet (12), jotka toimivat vasteena mainittuihin puhenäytteisiin ja ainakin yhteen signaaliin, joka on johdettu mainituista puhenäytteistä, generoimaan joukko parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia; ja 10 nopeuden määräämislogiikan (14) välineet vastaanottamaan mainittu j oukko pa- rametreja, määräämään mainittujen puhenäytteiden psykoakustinen merkitys mainitun parametri]’oukon mukaisesti ja valitsemaan koodausnopeus mainitusta ennalta määrätystä joukosta koodausnopeuksia mainitun määrätyn psykoakusti-sen merkityksen mukaisesti käyttäen ennalta määrättyjä nopeusvalintasääntöjä. 15

2. Patenttivaatimuksen 1 laite, tunnettu siitä, että mainitut nopeusvalintasäännöt valitsevat mainitun koodausnopeuden, joka varaa ensimmäisen lukumäärän bittejä mainittujen puhenäytteiden koodaamiseksi, kun mainitut puhenäytteet on määrätty psykoakustiselta merkitykseltään suuremmiksi j a j ossa mainitut nopeusva- 20 lintasäännöt valitsevat mainitun koodausnopeuden, joka varaa toisen lukumäärän bittejä mainittujen puhenäytteiden koodaamiseksi, kun mainitut puhenäytteet määrätään psykoakustiselta merkitykseltään vähäisemmiksi, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä. 25

3. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä.

4. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko paramet reja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä.

5. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäolon mainitussa puhekehyksessä. 5

6. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formant-tien kehyksestä-kehykseen -stabiliteetin.

7. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko paramet reja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksista energiassa mainitun puhekehyksen energian ja keskimääräisen kehysenergian välillä.

8. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko paramet reja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksia energiassa mainittujen puhenäytteiden energian ja keskimääräisen kehysenergian välillä, ja jossa, kun mainittu kehysenergiadifferentiaalimittaus (10) on alle ennalta määrätyn kynnyksen, mainitut nopeuden määräämisen logiikkavälineet (14) 20 valitsevat neljäsosanopeuksisen soinnillisen koodauksen (26) koodausmoodin.

9. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuudesta mainituissa puhenäytteissä ja nollaylitysten lukeman (6), joka 25 ilmaisee korkeataajuisten komponenttien läsnäolon mainitussa puhekehyksessä, ja jossa, kun mainittu normalisoidun autokorrelaation mittaus (4) on alle ensimmäisen ennalta määrätyn kynnyksen ja mainittu nollaylitysten lukema (6) ylittää toisen ennalta määrätyn kynnyksen, mainitut nopeuden määräämisen logiikkavälineet (14) valitsevat neljäsosanopeuksisen soinnittoman koodauksen 30 (22) koodausmoodin.

10. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu ennalta määrätty joukko koodausnopeuksia käsittää täysinopeuden, puolinopeuden ja nelj äsosanopeuden.

11. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja käsittää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, ja koodauslaatusuhteen (2), joka ilmaisee vastaavuutta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä, ja ennustevahvistusdifferentiaalimittauksen (8), joka 10 ilmaisee formanttiparametrien j oukon kehyksestä-kehykseen -stabiliteetin, j a jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) ylittää ennalta määrätyn ensimmäisen kynnyksen, mainittu ennustevahvistusdifferentiaali (8) on alle toisen ennalta määrätyn kynnyksen ja mainittu koodauslaatusuhde (2) ylittää ennalta määrätyn kolmannen kynnyksen, mainitut nopeuden määräämisen 15 logiikkavälineet (14) valitsevat puolinopeuksisen koodauksen koodausmoodin.

12. Alijärjestelmä dynaamisesti muuttamaan puhekehyksen lähetysnopeutta, joka lähettää etäasemalta kommunikaatiojärjestelmää varten, jossa mainittu etäasema kommunikoi keskikommunikaatiokeskuksen kanssa, joka mainittu alijäijestelmä 20 käsittää patenttivaatimuksen 1 mainitun laitteen, tunnettu siitä, että: moodimittausvälineet (12) toimivat vasteena mainittuun puhekehykseen j a mainitusta puhekehyksestä johdettuun signaaliin, generoimaan joukko parametrej a, j otka ilmaisevat mainitun puhekehyksen ominaisuuksia; j a nopeuden määräämisen logiikkavälineet (14) on sovitettu vastaanottamaan 25 nopeuskomentosignaali generoimaan ainakin yksi kynnysarvo mainitun nopeuskomentosignaalin mukaisesti, ja vertaamaan parametrien mainitun joukon ainakin yhtä parametria mainitun ainakin yhden kynnysarvon kanssa ja valitsemaan koodausnopeus mainitun vertailun mukaisesti.

13. Patenttivaatimuksen 12 alijärjestelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä valitaan mainittujen puhenäytteiden koodaamiseksi kun mainitut puhenäytteet on määrätty psykoakustiselta merkitykseltään suuremmiksi, ja jossa mainittu koodausnopeus, joka varaa toisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamiseksi kun mainitut puhenäytteet on määrätty psykoakustiselta merkitykseltään vähäisemmiksi, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurem-5 pi kuin mainittu toinen lukumäärä bittejä.

14. Patenttivaatimuksen 1 laite, tunnettu siitä, että moodimittausvälineet käsittävät moodimittauslaskimen, joka generoi joukon parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia mainittujen puhenäytteiden ja maini- 10 tusta puhenäytteistä johdetun signaalin mukaisesti; ja jossa nopeuden määräämis-logiikka käsittää nopeuden määräämislogiikan (14) vastaanottamaan mainitun joukon parametreja, määräämään mainittujen puhenäytteiden psykoakustinen merkitys parametrien mainitun joukon mukaisesti, ja valiten koodausnopeuden mainitusta ennalta määrätystä joukosta koodausnopeuksia. 15

15. Patenttivaatimuksen 14 laite, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamiseksi, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia, ja jossa mainittu koodausnopeus, joka varaa toisen 20 lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä.

16. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko para metreja sisältää koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä.

17. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko para-30 metrejä sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuudesta mainituissa puhenäytteissä.

18. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko parametreja sisältää nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäolon mainitussa puhekehyksessä.

19. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko parametreja sisältää ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formanttien kehyksestä-kehykseen -stabiliteettia.

20. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko 10 parametrej a sisältää kehysenergiadifferentiaalimittauksen (10), j oka ilmaisee muutoksia energiassa mainitun puhekehyksen energian ja keskimääräisen kehysenergian välillä.

21. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko 15 parametreja käsittää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä, ja ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formanttiparametrien joukon kehyksestä-kehykseen -stabiliteettia, ja jossa, kun 20 mainittu normalisoitu autokorrelaation mittaus (4) ylittää ennalta määrätyn ensimmäisen kynnyksen, mainittu ennustevahvistusdifferentiaali (8) on alle toisen ennalta määrätyn kynnyksen ja mainittu koodauslaatusuhde (2) ylittää ennalta määrätyn kolmannen kynnyksen, mainittu nopeuden määräämislogiikka (14) valitsee puolinopeuksisen koodauksen (30) koodausmoodin. 25

22. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, ja nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäoloa mainitussa puhekehyksessä, 30 ja jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) on alle ensimmäisen ennalta määrätyn kynnyksen ja mainittu nollaylitysten lukema (6) ylittää toisen ennalta määrätyn kynnyksen, mainittu nopeuden määräämislogiikka (14) valitsee neljäsosanopeuksisen soinnittoman koodauksen (22) koodausmoodin.

23. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko 5 parametreja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksia energiassa mainittujen puhenäytteiden energian ja keskimääräisen kehysenergian välillä, ja jossa, kun mainittu kehysenergiadifferentiaalimittaus (10) on alle ennalta määrätyn kynnyksen, mainitut nopeuden määräämislogiikan (14) välineet valitsevat nelj äsosanopeuksisen soinnillisen koodauksen (26) 10 koodausmoodin.

24. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu ennalta määrätty joukko koodausnopeuksia käsittää täysinopeuden, puolinopeuden ja nelj äsosanopeuden. 15

25. Patenttivaatimuksen 12 alijärjestelmä dynaamisesti muuttamaan puheen kehyksen lähetysnopeutta, joka lähettää mainitulta etäasemalta, tunnettu siitä, että moodimittausväline käsittää moodimittauslaskimen, joka generoi joukon parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia 20 mainittuj en puhenäytteiden mukaisesti j a signaalin, j oka on j ohdettu mainituista puhenäytteistä; ja jossa nopeuden määräämislogiikka käsittää nopeuden määräämislogiikan (14), joka vastaanottaa mainitun joukon parametreja määräämään mainittujen puhenäytteiden psykoakustinen merkitys parametrien mainitun joukon mukaisesti, ja vastaanottamaan nopeuskomentosignaali 25 generoimaan ainakin yksi kynnysarvo mainitun nopeuskomentosignaalin mukaisesti, verraten parametrien mainitun joukon ainakin yhtä parametria mainittuun ainakin yhteen kynnysarvoon ja valiten koodausnopeuden mainitun vertailun mukaisesti.

26. Patenttivaatimuksen 25 alijärjestelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia ja jossa mainittu koodausnopeus, joka varaa toisen lukumäärän bittejä, valitaan mainittujen puheen näytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen 5 lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä.

27. Menetelmä valitsemaan koodausnopeuksien ennalta määrätyn joukon koodausnopeus puhekehyksen, joka sisältää useita puhenäytteitä, koodaamiseksi, tunnettu siitä, että käsittää vaiheet: 10 generoidaan joukko parametreja, jotka ilmaisevat mainitun puhekehyksen ominaisuuksia, mainittujen puhenäytteiden ja mainituista puhenäytteistä johdetun signaalin mukaisesti; ja valitaan koodausnopeus mainitusta ennalta määrätystä joukosta koodausnopeuksia mainittujen puhenäytteiden määrätyn psykoakustisen 15 merkityksen mukaisesti, mainittujen puhenäytteiden mainitun psykoakustisen merkityksen ollessa määrätty mainitusta joukosta parametreja.

28. Patenttivaatimuksen 27 menetelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen 20 puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia, ja jossa valitaan mainittu koodausnopeus, joka varaa toisen lukumäärän bittejä mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen 25 lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä.

29. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä. 30

30. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä.

31. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäoloa mainitussa puhekehyksessä.

32. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko 10 parametrej a sisältää ennustevahvistusdifferentiaalimittauksen (8), j oka ilmaisee formanttien kehyksestä-kehykseen -stabiliteettia.

33. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee 15 muutoksia energiassa mainitun puhekehyksen energian j a keskimääräisen kehysenergian välillä.

34. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja käsittää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee 20 jaksollisuutta mainituissa puhenäytteissä, koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen j a siitä j ohdetun syntetisoidun puheen välillä, ja ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formanttiparametrien joukon kehyksestä-kehykseen -stabiliteettia, ja jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) ylittää ennalta määrätyn 25 ensimmäisen kynnyksen, mainittu ennustevahvistusdifferentiaali (8) on alle toisen ennalta määrätyn kynnyksen ja mainittu koodauslaatusub.de (2) ylittää ennalta määrätyn kolmannen kynnyksen, mainittu vaihe koodausmoodin valitsemiksi valitsee puolinopeuksisen koodauksen (30).

35. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, ja nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäoloa mainitussa puhekehyksessä, ja jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) on alle ensimmäisen ennalta määrätyn kynnyksen ja mainittu nollaylitysten lukema (6) ylittää toisen ennalta määrätyn kynnyksen, mainittu vaihe koodausmoodin 5 valitsemiseksi valitsee neljäsosanopeuksisen soinnittoman koodauksen.

36. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksia energiassa mainittujen puhenäytteiden energian ja keskimääräisen 10 kehysenergian välillä, ja jossa, kun mainittu kehysenergiadifferentiaalimittaus (10) on alle ennalta määrätyn kynnyksen, mainittu vaihe koodausmoodin valitsemiseksi valitsee neljäsosanopeuksisen soinnillisen koodauksen.

37. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu ennalta 15 määrätty joukko koodausnopeuksia käsittää täysinopeuden, puolinopeuden j a neljäsosanopeuden.

38. Patenttivaatimuksen 27 menetelmä dynaamisesti muuttamaan puheen kehyksen lähetysnopeutta, joka lähettää mainitulta etäasemalta 20 kommunikaatiojärjestelmälle, tunnettu siitä, että mainittu etäasema kommunikoi keskikommunikaatiokeskuksen kanssa, joka mainittu menetelmä käsittää vaiheet: generoidaan joukko parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia mainitun puhekehyksen ja mainitusta puhekehyksestä johdetun signaalin mukaisesti, mainittu joukko parametreja määräämään mainittujen 25 puhenäytteiden psykoakustinen merkitys-vastaanotetaan nopeuskomentosignaali; generoidaan ainakin yksi kynnysarvo mainitun nopeuskomentosignaalin mukaisesti; verrataan parametrien mainitun joukon ainakin yhtä parametria mainittuun 30 ainakin yhteen kynnysarvoon; ja valitaan koodausnopeus mainitun vertailun mukaisesti.

39. Patenttivaatimuksen 38 menetelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia, ja jossa valitaan mainittu 5 koodausnopeus, joka varaa toisen lukumäärän bittejä, mainittujen puheen näytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä. 10