FI95086C - Menetelmä puhesignaalin tehokkaaksi koodaamiseksi - Google Patents

Menetelmä puhesignaalin tehokkaaksi koodaamiseksi Download PDF

Info

Publication number
FI95086C
FI95086C FI925376A FI925376A FI95086C FI 95086 C FI95086 C FI 95086C FI 925376 A FI925376 A FI 925376A FI 925376 A FI925376 A FI 925376A FI 95086 C FI95086 C FI 95086C
Authority
FI
Finland
Prior art keywords
degree
modeling
model
synthesis
signal
Prior art date
Application number
FI925376A
Other languages
English (en)
Swedish (sv)
Other versions
FI95086B (fi
FI925376A (fi
FI925376A0 (fi
Inventor
Kari Jaervinen
Olli Ali-Yrkkoe
Original Assignee
Nokia Mobile Phones Ltd
Nokia Telecommunications Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd, Nokia Telecommunications Oy filed Critical Nokia Mobile Phones Ltd
Priority to FI925376A priority Critical patent/FI95086C/fi
Publication of FI925376A0 publication Critical patent/FI925376A0/fi
Priority to US08/155,574 priority patent/US5596677A/en
Priority to DE69325237T priority patent/DE69325237T2/de
Priority to EP93309264A priority patent/EP0599569B1/en
Priority to AU51897/93A priority patent/AU665283B2/en
Priority to JP5296618A priority patent/JPH06222798A/ja
Publication of FI925376A publication Critical patent/FI925376A/fi
Publication of FI95086B publication Critical patent/FI95086B/fi
Application granted granted Critical
Publication of FI95086C publication Critical patent/FI95086C/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations

Description

, 95086
Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
Keksinnön kohteena on puheenkoodausmenetelmä, jossa puhesig-5 naalin koodaamisessa a) kehitetään lyhyen aikavälin analysaattoreissa sisääntule-vaa signaalia vastaava joukko ennusteparametrejä, jotka jokaisessa koodattavana olevassa puhesignaalin lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, 10 b) muodostetaan herätesignaali, joka syöttämällä ennustuspa-rametrien mukaan toimivalle synteesisuodattimelle saadaan syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali.
15 Puheen digitaalisessa koodauksessa käytetään usein ihmisen puheentuottoon perustuvaa kaksiosaista mallia, johon kuuluu ensinnäkin herätteen muodostaminen (ihmisellä: äänihuulten värähtely tai kuristuskohta ääniväylässä) ja herätesignaalin muokkaus suodatusoperaatiossa (ihmisellä: ääniväylässä ta-20 pahtuva muokkaus). Puhekoodereissa käytettävää äänikanavan muokkausta mallintavaa suodatusoperaatiota kutsutaan yleisesti ns. lyhyen aikavälin suodatukseksi tai lyhyen aikavälin mallinnukseksi. Herätesignaalin tehokkaaseen koodaamiseen on kehitetty erilaisia menetelmiä ja malleja, joilla on 25 kyetty herätesignaalin välittämiseksi tarvittavaa siirtono-: peutta alentamaan merkittävästi huonontamatta silti juuri kaan puhesignaalin laatua. Tällä hetkellä tehokkaimmiksi puheenkoodausmenetelmiksi ovat osoittautuneet analyysi synteesin kautta -menetelmää käyttäen herätesignaalille mahdol-30 lisimman pienellä siirtonopeudella välitettävissä olevan esitysmuodon hakevat puhekooderit, joista mainittakoon koo-. diherätteinen lineaarinen ennustus (Code Excited Linear Pre diction, ks. esim. patenttijulkaisu US-4 817 157). Myös lyhyen aikavälin suodatusmallin parametrien koodaamiseksi on 35 kehitetty tehokkaita menetelmiä kuten esim. välittäminen
Line Spectrum Pair -esitysmuodossa (ks. julkaisu F.K. Soong, B.H. Juang: "Optimal quantization of LSP parameters using 2 95086 delayed decisions", Proceedings of the 1990 International Conference on Acoustics, Speech, and Signal Processing).
Vaikka tehokkaita menetelmiä on kehitetty sekä herätesignaa-5 Iin että suodatusmallin välittämiseen, ei aiemmin esitetyissä menetelmissä ole otettu huomioon sitä, että eri äänteille äänikanavassa suoritettava muokkaus on erityyppinen eri ään-netyypeille ja siten erilailla mallinnettavissa lyhyen aikavälin suodattimessa. Tästä syystä mahdollisimman tehokkaan 10 puheen koodauksen aikaansaamiseksi suodatuksen astelukua tulisi adaptoida koodattavana olevan puhesignaalin mukaan. Alalla aiemmin tunnetuissa menetelmissä on kiinteäasteisen suodatinitiallinnuksen takia käytössä mallinnuksen asteluku, joka on soinnittomilla äänteillä tarpeettoman suuri niiden 15 suhteellisen tasaisesti jakautuneen spektrikäyrän välittämiseen ja johon käytetyt resurssit voitaisiin paremmin hyödyntää herätesignaalin koodaamisessa tai virheenkorjauskoodauk-sessa. Toisaalta kiinteän asteluvun käyttö johtaa soinnillisilla äänteillä helposti liian matala-asteisen suodatusmal-20 Iin käyttämiseen, vaikka soinnillisten äänteiden spektrin formanttirakenteen mallintamista voitaisiin merkittävästi tehostaa suurempaa mallinnusastelukua käyttämällä.
Esillä olevan keksinnön tarkoituksena on aikaansaada sellai-25 nen menetelmä puhesignaalin digitaaliseksi koodaamiseksi, jonka avulla edellä esitetyt puutteet ja ongelmat voitaisiin ratkaista. Tämän saavuttamiseksi keksinnölle on tunnusomaista se, mikä on esitetty patenttivaatimuksena 1. Keksinnön mukaisesti siis ensinnä säädetään lyhyen aikavälin mallin-30 nuksen astelukua adaptiivisesti puhesignaalin mukaan ja toisaalta herätesignaalia ja lyhyen aikavälin suodatusta kuvaa-: vien parametrien siirtonopeuksien keskinäistä suhdetta adap toidaan puhesignaalin mukaan. Koodauksen tehokkuuden kannalta turhan suuren suodatusmallin asteluvun pienentämisellä 35 voidaan herätesignaalin koodaukseen käytettävää siirtonopeutta kasvattaa tai siirtää vapautuvat siirtonopeusresurssit virheenkorjauskoodauksessa käytettäväksi. Toisaalta ää-• nikanavaa mallintavan suodatusoperaation astelukua voidaan il 3 95086 tarvittaessa kasvattaa, mikäli siitä on oleellista hyötyä koodauksessa, ja alentaa vastaavasti herätesignaalin koodaukseen käytettävää siirtonopeutta. Keksinnön mukaista menetelmää voidaan käyttää niin mallinnusvirheen suoraan koo-5 daaviin koodausmenetelmiin kuin suljettua herätesignaalin optimointia koodauksessa käyttäviin analyysi synteesin kautta -menetelmiin. Viimeksimainituissa menetelmissä vältetään keksinnön mukaisella asteluvun adaptoinnilla mallinnettavaan äänteeseen liian suuren mallinnuksen asteluvun käyttö ja 10 siten laskennallista kuormitusta voidaan oleellisesti laskea. Keksinnön mukaisella menetelmällä saavutetaan kiinteä-astelukuista äänikanavan mallinnussuodatusta käyttäviä menetelmiä parempi kokonaismallinnus puhesignaalille ja saadaan siten aikaan tehokas puheen koodaus.
15
Keksinnön mukaisessa menetelmässä käytetään tarkemmin kuvattuna sellaista lyhyen aikavälin suodatusmallia, joka on muodostettu kahdesta osasta eli matala-asteisesta kiinteäas-telukuisesta osuudesta ja asteluvultaan adaptoitavasta osuu-20 desta. Jälkimmäisenä mainittu adaptoitava-astelukuinen osuus tekee mahdolliseksi saavuttaa tarvittaessa korkea kokonais-mallinnuksen asteluku. Näille molemmille ennustusmalleille lasketaan erikseen lyhyen aikavälin ennusteparametrit ja molempien mallien suodatinkertoimien laskenta voi olla suo-25 ritettu millä tahansa alalla tunnetulla menetelmällä, esimerkiksi lineaarisen mallinnuksen yhteydessä jollakin lineaariseen ennustavaan koodaukseen (Linear Predictive Coding, LPC) perustuvalla laskenta-algoritmilla. Molempien mallien mukaisten mallinnusparametrien arvoja adaptoidaan eli ne 30 lasketaan puhesignaalista noin 10-40 ms:n välein. Kiinteä- astelukuisen lyhyen aikavälin suodat initial Iin suodatinkertoi-.' mien laskeminen suoritetaan suoraan koodattavaksi tulevasta puhesignaalista, kun taas adaptoitava-asteisen lyhyen aikavälin mallin suodatinkertoimet lasketaan signaalista, joka 35 on saatu suodattamalla koodattavaksi tuleva puhesignaali kiinteäasteisen mallin käänteissuodattimella. Kiinteäastelukuinen matala-asteinen malli toimii siten esisuodatustoimin-tona adaptoitava-astelukuiselle mallinnukselle. Kun mallin- 4 95086 nuksessa käytetään erillistä matala-asteista suodatinta, voidaan kiinteäasteisessa ja adaptoitava-asteisessa suodat-timessa käyttää erilaisia mallin parametrien adaptointitaajuuksia. Suodatinparametrit mainituille kahdelle lyhyen ai-5 kavälin mallille voidaan siis lähettää vastaanottimelle erilaisin aikavälein. Kiinteäasteisella mallinnuksella voidaan näin tehokkaasti välittää puhujasta ja mikrofonista aiheutuvia hitaasti muuttuvia ja matalalla asteluvulla kohtuullisen hyvin mallinnettavissa olevia spektriominaisuuksia siten, 10 että sen kertoimia adaptoidaan harvemmin kuin nopeasti muuttuvan äänneinformaation sisältäviä adaptoitava-asteisen mallin kertoimia.
Adaptoitava-asteisen lyhyen aikavälin mallinnuksen asteluku 15 säädetään eräässä keksinnön mukaisessa 8 kHz:n näytteenottotaajuudella toimivassa suoritusmuodossa kiinteäasteisen mallinnuksen tulosten mukaan seuraavasti: Asteluku adaptoitava-asteisessa suodattimessa asetetaan pieneksi (luokkaa 2-asteinen) , mikäli koodattavassa signaalilohkossa suurin osa 20 energiasta sijaitsee korkeilla taajuuksilla eli mikäli kiinteän asteluvun mallinnuksessa saatu taajuusvaste on ylipääs-tötyyppinen (helposti mallinnettavaksi luokiteltu soinniton äännetyyppi). Adaptoitava-asteisen mallinnuksen asteluku puolestaan asetetaan suureksi (luokkaa 12-asteinen), mikäli 25 kiinteän asteluvun mallinnuksessa saatu signaalin taajuus-vaste on alipäästötyyppinen (merkityksellisen formanttira-kenteen sisältäväksi luokiteltu soinnillinen äännetyyppi). Kiinteäasteisen mallinnuksen asteluku on vakio ja luokkaa 2-asteinen. Kokonaismallinnuksen asteluvuksi tulee näillä esi-30 merkkiasteluvuilla joko 4 tai 14.
: Toisessa suoritusmuodossa adaptoidaan suodatusmallinnuksen astelukua mallinnuksen onnistumisen mukaan takaisinkytketystä mallinnusvirhesignaalin perusteella. Tässä suoritusmuo-35 dossa voidaan asteluvun säätäminen suorittaa portaattomasti tekemättä karkeaa päätöstä kahden eri mallinnusasteluvun välillä.
s 95086
Seuraavassa selvitetään esimerkein joitakin keksinnön toteutusmuotoja oheisiin kuviin viitaten.
Kuva 1 havainnollistaa lyhyen aikavälin ennustussuodattimen 5 mallinnuksen toimintaa eri mallinnusasteluvuilla kahdelle eri äännetyypille /s/- (kuva la) ja /o/-äänteelle (kuva Ib);
Kuva 2 esittää keksinnön mukaisen menetelmän enkooderia seuraavasti: kokonaismallinnuksen asteluvun adaptointi matalan 10 asteen mallinnuksen kertoimien perusteella (kuva 2a), mallinnuksen asteluvun adaptointi kokonaismallinnusvirheen avulla (kuva 2b) ja virheenkorjauskoodauksen siirtonopeuden adaptointi mallinnuksen asteluvun mukaan (kuva 2c); 15 Kuva 3 esittää keksinnön mukaista menetelmää käyttävän kuvan 2a tai 2b enkooderia vastaavan dekooderin lohkokaaviota;
Kuva 4a on periaatteellinen esitys alalla tunnetusta analyysi synteesin kautta -tyypin menetelmästä, jossa herätesig-20 naalin mallintamisessa käytetään suljettua optimointia, ja kuvat 4b ja 4c esittävät keksinnön mukaisen mallinnuksen soveltamista analyysi synteesin kautta -periaatteella toimiviin puhekoodereihin.
25 Kuva 1 havainnollistaa lyhyen aikavälin mallinnuksen toimin- < taa eri mallinnusasteluvuilla kahdelle eri äännetyypille eli soinnittomalle /s/-äänteelle ja soinnilliselle /^/-äänteelle. Näytteenottotaajuutena on käytetty 8 kHz. Kuvassa la on esitetty (katkoviivalla) soinnittoman äännetyypin /s/-ään-30 teen aaltomuoto ja spektrikäyrä laskettuna FFT-menetelmällä (Fast Fourier Transform). Kuvassa la on esitetty (ehjällä viivalla) myös lyhyen aikavälin LPC-mallinnuksen taajuusvaste kahdella eri mallinnusasteluvulla 4 ja 10 (LPC4 ja LPC10). Kuvassa Ib on esitetty vastaavasti soinnillisen /o/-35 äänteen aaltomuoto ja FFT-spektrikäyrä sekä lyhyen aikavälin LPC-mallinnuksen taajuusvaste kahdella mallinnusasteluvulla . 4 ja 10 (LPC4 ja LPC10). Käytetty 4-asteinen malli (LPC4) pystyy mallintamaan melko hyvin esitetyn soinnittomalle ään- 6 95086 teelle tyypillisen suhteellisen tasaisen taajuussisällön.
Sen sijaan soinnillisten äänteiden tulkinnassa tärkeät spektrin resonanssikohdat pystytään välittämään hyvin vasta suuremmalla mallinnusasteluvulla. Esim. /o/-äänteen neljästä 5 resonanssihuipusta muodostuva spektrikäyrä kyetään mallintamaan kunnolla vasta korkeammalla asteluvulla, esim. 10-as-teisella mallilla (LPC10) kuten kuvasta Ib käy ilmi. Re-sonanssihuiput eli ns. formantit erottuvat LPC10-käyrästä selvästi taajuuksilla n. 500 Hz, 1000 Hz, 2400 Hz ja 3400 10 Hz. Kuvassa la esitetyssä /s/-äänteen mallinnuksessa ei mallin asteluvun kasvattaminen 10:een tuota vastaavaa oleellista parannusta mallinnukseen.
Kuva 2 esittää herätesignaalin suoraan lyhyen aikavälin mal-15 linnuksen virhesignaalista muodostavan koodausmenetelmän enkooderia, jossa on käytetty keksinnön mukaista adaptiivista lyhyen aikavälin suodatusmallinnuksen asteluvun adaptoin-tia. Kuvassa 2a on esitetty suoritusesimerkki enkooderista, jossa suoritetaan asteluvun adaptointi kiinteäasteisen mal-20 Iin kertoimiin perustuen. Puhesignaalille 206 suoritetaan ensin matalan asteen lyhyen aikavälin mallinnus 204, jossa muodostetaan mallia vastaavat suodatinkertoimet a(i); i*l,2,...,M1. Nämä voivat olla joko suoramuotoisen suodattimen kertoimia tai ristikkorakenteisissa suodattimissa käy-25 tettäviä ns. heijastuskertoimia. Lohkossa 204 suoritettava toiminta voidaan tehdä millä tahansa alalla tunnetulla lineaarisen ennustusmalIin suodatinkertoimien laskentamenetelmällä. Mx on vakioarvoinen ja suuruudeltaan tyypillisesti luokkaa 2. Puhesignaali 206 viedään lasketun mallin mukai-30 seen astelukua Mx olevaan käänteissuodattimeen 201. Kiinteän asteluvun käänteissuodattimesta saatava signaali (eli : kiinteäasteisen mallin ennustusvirhe) viedään edelleen adap- toitava-asteiseen käänteissuodatukseen 202. Kuvan suori-tusesimerkissä päätetään lohkossa 207 suodatinkertoimien 35 a(i); i=l,2,...,M1 perusteella adaptoitava-asteisen mallin nuksen 205 asteluvun M2 suuruudesta jäljempänä kuvatulla menetelmällä. Adaptoitava-asteisen suodattimen 202 suodatin-• kertoimet b(j); j=l,2,...,M2 lasketaan lohkossa 205. Koko- 7 95086 naismallinnuksen ennustusvirheelle etsitään sopiva koodattu esitysmuoto koodauslohkossa 203. Muodostetut ennustusvirheen välittävät herätepulssit välitetään dekooderille herätesig-naalina käytettäviksi. Herätepulssien ohella vastaanottimel-5 le välitetään lisäksi sekä matalan kiinteäasteisen mallinnuksen että adaptoitava-asteisen mallinnuksen suodatinker-toimet. Mikäli lohkossa 207 tehdään päätös käyttää adaptoi-tava-asteisessa mallinnuksessa 205 pientä mallinnusastelu-kua, käytetään mallinnuksesta vapautuvat resurssit lohkossa 10 203 suoritettavaan kokonaismallinnusvirheen koodaamiseen.
Lohkossa 203 voidaan mallinnusvirheen koodaaminen suorittaa millä tahansa alalla tunnetulla menetelmällä, esimerkiksi näytteiden määrän rajoittamiseen perustuvalla menetelmällä (ks. esim. julkaisu P. Vary, K. Hellwig, R. Hofmann, R.J.
15 Sluyter, C. Galand, M. Rosso: "Speech codec for the European mobile radio system", Proceedings of the 1988 International Conference on Acoustics, Speech, and Signal Processing). Mikäli toisaalta havaitaan, että lyhyen aikavälin mallintamiseen tarvitaan suurta mallinnusastelukua, ohjataan osa 20 muutoin herätesignaalin koodaamiseen käytettävistä resursseista välittämään lyhyen aikavälin mallin parametrejä, jolloin lyhyen aikavälin mallinnuksen astelukua voidaan kasvattaa. Tämä suoritetaan nostamalla adaptoitava-asteisessa mallinnuksessa käytettävää astelukua.
25 Päätös käytettävän suodatusmallinnuksen asteluvusta tehdään kuvan 2a sovellutusesimerkissä adaptointilohkossa 207 seu-raavalla menettelyllä: mikäli suoritettu kiinteän asteluvun mallinnus osoittaa sisääntulevan signaalin 206 sisältävän 30 suurimman osan energiastaan pienillä taajuuksilla, menetelmässä käytetään lyhyen aikavälin mallinnuksessa suurta aste-lukua. Mikäli taas signaalissa energia on kasaantunut suurille taajuuksille, käytetään matala-asteista mallinnusta. Menetelmä perustuu yksinkertaisimmillaan tulkittuna siihen, 35 että soinnittomien korkeille taajuuksille painottuneiden äänteiden spektrin verhokäyrä ei sisällä soinnillisten äänteiden lailla selviä oleellista informaatiota välittäviä • .
spektrin huippukohtia, jolloin soinnittomien äänteiden koh- 8 95086 dalla voidaan käyttää matalampaa lyhyen aikavälin mallinnusta ja ohjata suurempi osuus siirtokapasiteetista herätesig-naalin koodaamiseen. Toisaalta soinnillisten äänteiden tapauksessa spektrin verhokäyrän välittämiseen on syytä käyt-5 tää korkean asteen suodatinmal1ia, jotta niille tärkeä for-manttirakenne kyetään välittämään koodausmenetelmässä mahdollisimman tarkasti. Kuvan 2a menetelmässä voidaan käyttää kahta eri kokonaismallinnusastelukua eli matalaa soinnittomiksi luokitelluille äänteille (luokkaa 4) ja korkeaa soin-10 nillisiksi luokitelluille äänteille (luokkaa 12).
Kuvassa 2b on esitetty toinen sovellutusesimerkki keksinnön mukaisen menettelyn toteuttamiseksi digitaalisessa puhekoo-derissa. Kuvaan 2a verrattuna erona on mallinnuksen astelu-15 vun adaptointi suoraan kokonaismallinnuksen ennustusvirheen perusteella takaisinkytketysti eikä matalan asteen suodatin-kertoimien perusteella. Asteluvun M2 adaptointi suoritetaan kuvan lohkossa 227 tosiasiallisen ennustusvirheen perusteella kun taas lohkossa 207 adaptointi perustuu kiinteäasteisen 20 mallinnuksen suodatinkertoimiin aiemmin selvitetyllä menetelmällä. Kuvan 2b esimerkissä lohkossa 227 suoritettava mallinnuksen asteluvun adaptointi suoritetaan ennustusvirheen mukaan vertaamalla mallinnuksen asteluvun kasvattamisen vaikutusta ennustusvirheeseen. Menetelmässä mallinnuksen 25 astelukua kasvatetaan kunnes kasvattaminen tuottaa tiettyä kynnysarvoa P^j pienemmän ennustusvirhesignaalin tehon pienenemisen. Tällöin päätellään mallinnuksen asteluvun kasvattamisen lisää olevan tarpeetonta ja valitaan senhetkinen mallinnuksen asteluku käytettäväksi. Menetelmässä kiinteäas-30 teisessa käänteissuodattimessa käsitelty puhesignaali viedään adaptoitava-asteiseen käänteissuodattimeen siten, että adaptoitava-asteisen suodattimen astelukua lähdetään kasvattamaan sallitusta minimiarvosta kunnes havaitaan kynnysarvoa pienempi virhesignaalin pieneneminen tai saavutetaan mene-35 telmässä asetettu suurin sallittu kokonaismallinnusasteluku dmax* Koodattavana oleva puhelohko suodatetaan kullakin eri asteluvun käänteissuodattimella ja lasketaan mallinnusvir-·- heen eli käänteissuodattimen ulostulon teho kullekin eri
II
9 95086 suodatusasteluvulle. Kun suodatinrakenteena käytetään hei-jastuskertoimia käyttävää ristikkosuodatinsuodatinta ei asteluvun kasvattaminen muuta aiempia suodatinkerroinarvoja eli asteluvun kasvattaminen aiheuttaa vain uuden suoda-5 tusoperaation lisäämisen lyhyemmän mailinnusasteen suodattimen ulostuloon. Laskennassa voidaan siten käyttää suoraan hyväksi pienemmän asteen suodattimissa suoritettua laskentaa. Asteluvun adaptoinnin suorittavien lohkojen 207 ja 227 toiminnat poikkeavat oleellisesti toisistaan. Koska kuvan 2b 10 mukaisessa menetelmässä ei suodatinkertoimia käytetä mallinnuksen asteluvun adaptoinnissa, joudutaan vastaanottimelle välittämään lisäparametrinä kooderin toimintamoodi, joka ilmoittaa kussakin käsiteltävässä puhekehyksessä käytetyn mailinnusasteluvun dekooderille.
15
Kuvassa 2c on esitetty keksinnön mukaisen menetelmän yksinkertaistettu lohkokaavio 241 yhdistettynä virheenkorjausko©-daukseen 242. Kuvassa puhesignaalille 243 suoritetaan aiemmin kuvatulla tavalla kiinteäasteisen mallin kertoimien las-20 kenta ja käänteissuodatus lohkossa 249 sekä vastaava adaptoitava -asteinen käsittely lohkossa 245. Adaptoitava-asteisen mallinnuksen asteluvun valinta voidaan suorittaa joko matalan asteen mallinnuksen taajuusvasteen perusteella (kuvan 2a suoritusesimerkin tavalla) tai kokonaismallinnusvir-25 heen perusteella (kuvan 2b suoritusesimerkin tavalla). Aste-luvun adaptointimenetelmä valitaan kytkimessä 248 riippuen siitä, onko kuvan 2a (kytkin 248 asennossa a) vai kuvan 2b mukainen menetelmä (kytkin 248 asennossa b) otettu käytettäväksi. Asteluku valitaan lohkossa 250 tai 251. Keksinnön 30 mukainen menetelmä voidaan liittää kuvassa 2c esitetyllä tavalla virheenkorjauskoodaukseen siten, että valittu mal-: 1innusasteluku M2 välitetään paitsi herätesignaalin koodauk sen suorittavalle lohkolle 246 myös virheenkorjauskoodaukseen 247. Tällöin voidaan paitsi herätesignaalin koodauksen 35 siirtonopeutta muuttaa valitun kokonaismallinnuksen sallimissa rajoissa myös adaptoida virheenkorjauskoodaukseen lohkossa 242 käytettävää siirtonopeutta. Dekooderille välitettävä bittivirta 244 sisältää puhekooderin parametrit (suoda- 10 95086 tinkertoimet ja herätesignaalin) sekä virheenkorjauskoodin ja tiedon toimintamoodista eli lyhyen aikavälin suodatinmal-linnuksen asteluvusta. Mikäli asteluvun adaptio on tehty suoraan kiinteäasteisen mallinnuksen kertoimien a(i); 5 i*l,2,...,M1 perusteella (kuvan 2a suoritusesimerkin taval la) , voidaan näitä käyttää adaptoinnin asteluvun ilmoittamiseen herätesignaalin koodaukseen ja virheenkorjauskoodauk-seen, eikä erillistä mooditietoa tarvitse välittää.
10 Kuvassa 3 on esitetty keksinnön mukaisen dekooderin lohko-kaavio. Dekooderille tuodaan tieto siitä, kuinka suurta lyhyen aikavälin mallinnuksen astelukua koodauksessa on käytetty. Mallinnuksen asteluku selviää joko erityisestä välitetystä mallinnuksen asteluvun mooditiedosta (kuvan 2b en-15 kooderia vastaava dekooderi) tai suoraan matalan asteluvun mallinnuksen suodatinkertoimista (kuvan 2a enkooderia vastaava dekooderi). Kuvassa 3 on esitetty kuvan 2b enkooderia vastaava dekooderi, jolle on tuotava mallinnusasteluvun ilmoittava signaali. Kuvan 2a enkooderia vastaavassa dekoode-20 rissa mallinnusasteluku voidaan päätellä kiinteän asteluvun mallinnuskertoimista suorittamalla myös dekooderissa mallinnuksen asteluvun adaptointi lohkon 207 mukaisella menettelyllä. Tämä menettely on piirretty kuvaan 3 katkoviivoin. Tieto käytetystä asteluvusta eli toimintamoodi viedään ly-25 hyen aikavälin synteesisuodattimen 302 lisäksi myös heräte-signaalin dekoodauksen suorittavalle lohkolle 301, koska se adaptoi samalla herätteen välitykseen käytettävää bittino-peutta. Dekoodattu puhesignaali 304 saadaan menetelmässä matala-asteisen lyhyen aikavälin synteesisuodattimen 303 30 ulostulosta. Menetelmässä välitetään lisäksi sekä adaptoitava- asteisen lyhyen aikavälin mallinnuksen, että kiinteäasteisen lyhyen aikavälin mallinnuksen mallinnuskertoimet, joita käytetään synteesisuodattimissa 302 ja 303.
35 Edellä kuvatuissa suoritusesimerkeissä käsiteltiin keksinnön mukaisen menetelmän soveltamista koodausmenetelmiin, joissa herätesignaali muodostetaan suoraan lyhyen aikavälin mallin- « « ·. nuksen virhesignaalista. Näitä tehokkaammissa suodatusmal- 11 11 95086 liin perustuvissa puheenkoodausmenetelmissä herätesignaalin koodaaminen suoritetaan ns. analyysi synteesin kautta -menetelmällä. Keksinnön mukaista menetelmää voidaan soveltaa myös tämän tyypin koodausmenetelmiin, kuten seuraavassa sel-5 vitetään.
Kuvassa 4a on esitetty periaatteellinen lohkokaavio alalla tunnetusta puhekooderista, jossa käytetään analyysi synteesin kautta -tyypin menetelmää herätesignaalin koodaukseen.
10 Tällaisessa koodausmenetelmässä herätesignaalille etsitään kussakin koodattavana olevassa puhesignaalin lohkossa helposti välitettävissä oleva esitysmuoto syntesoimalla suuri määrä helposti koodattavia herätesignaaleita vastaavia pu-hesignaaleita ja valitsemalla paras heräte vertaamalla syn-15 teesitulosta koodattavana olevaan puhesignaaliin. Ennustus-virhesignaalia ei menetelmässä siis muodosteta lainkaan vaan herätteenä käytettävä signaali muodostetaan herätteenmuodos-tuslohkossa 400. Puhesignaalista 407 lasketaan lyhyen aikavälin analyysilohkossa 406 lyhyen aikavälin suodatinkertoi-20 met, joita käytetään lyhyen aikavälin synteesisuodattimessa 402. Herätesignaali muodostetaan vertaamalla erotuslohkossa 403 alkuperäistä puhesignaalia sekä syntesoitua puhesignaalia keskenään. Syntesoitu puhesignaali kaikille mahdollisille herätevaihtoehdoille saadaan muokkaamalla herätteenmuo-25 dostuslohkosta 400 saatuja herätevaihtoehtoja kutakin pitkän aikavälin synteesisuodattimessa 401 ja lyhyen aikavälin synteesisuodattimessa 402. Erotuslohkosta 403 saatava erosig-naali painotetaan painotuslohkossa 404 ihmisen kuuloaistin kannalta merkityksellisemmäksi mitaksi subjektiivisesta pu-30 heen laadusta sallimalla suhteellisesti enemmän virhettä voimakkaiden signaalitaajuuksien kohdalle ja vähemmän vaimeiden signaalitaajuuksien kohdalle. Virheen laskentalohkos-sa 405 lasketaan erosignaaliin perustuen mittaluku kunkin herätevaihtoehdon avulla saatavan synteesituloksen hyvyydel-35 le, ja tätä käytetään ohjaamaan herätteen muodostamista ja valitsemaan paras mahdollinen herätesignaali.
12 95086
Kuvassa 4b on esitetty lohkokaavio keksinnön mukaisen menetelmän soveltamisesta analyysi synteesin kautta herätesig-naalin koodaamisen suorittaviin puhekoodereihin. Kuvassa on esitetty enkooderin rakenne sovellutusesimerkistä, jossa 5 asteluvun adaptointi perustuu vastaavalla tavalla kuin kuvan 2a suoritusesimerkissä kiinteän asteluvun käänteissuodatti-men ulostulona saatavaan mallinnusvirhesignaaliin. Adaptoitavan asteluvun mallissa käytettävä asteluku saadaan lohkolta 420. Puhesignaalille 417 suoritetaan kiinteäasteinen ly-10 hyen aikavälin mallinnus lohkossa 419. Lohkossa 418 suoritetaan lohkon 419 mallinnuskertoimien a(i); j»l,2,...,M1 mukainen matala-asteinen kiinteän mallinnusasteen käänteissuo-datus. Käänteissuodatettu puhesignaali viedään edelleen adaptoitavan asteluvun mallinnuslohkolle 416, josta saadaan 15 adaptoitava-asteisen suodattimen suodatinkertoimet b(j); j=l,2,...,M2. Nämä suodatinkertoimet viedään suljetun haun haarassa sijaitsevalle lyhyen aikavälin synteesisuodattimel-le 412. Analyysi synteesin kautta -rakenteelle viedään lisäksi tieto valitun lyhyen aikavälin mallinnuksen asteluvus-20 ta M2, jota käytetään valitsemaan sopiva mallinnusasteluku suodatuslohkossa 412. Tieto mallinnuksen asteluvusta välitetään myös herätteen mallinnukseen, jossa se ilmaisee, paljonko siirtonopeutta on käytetty lyhyen aikavälin suodatin-mallin kertoimien välittämiseen ja vastaavasti paljonko 25 siirtonopeutta on käytettävissä herätesignaalin muodostamiseen lohkossa 410. Järjestelmässä on käytetty lisäksi ns. pitkän aikavälin suodatusmallia suorittamalla lohkossa 411 spektrin hienorakennetta mallintava pitkän aikavälin suodatus, jonka siirtonopeutta voidaan myös adaptoida sen mukaan 30 kuinka suuri lyhyen aikavälin mallinnus on valittu käytettäväksi. Lohkot 413, 414 ja 415 suorittavat samat toiminnot kuin kuvan 4a lohkot 403, 404 ja 405.
Analyysi synteesin kautta -koodereihin voidaan keksinnön mu-35 kaista menetelmää soveltaa toisessa suoritusmuodossaan siten, että erotuselimelle 413 viedään suoraan puhesignaali 417 ilman, että sille suoritetaan ensin analyysisuodatus • · ·- 418. Tällöin lohkossa 412 suoritettavaan adaptoitava-astei- 13 95086 seen lyhyen aikavälin synteesisuodatukseen on liitettävä mukaan myös lohkon 418 käsittelylle käänteinen kiinteäastei-nen synteesisuodatus. Kiinteäasteinen ja adaptoitava-asteinen lyhyen aikavälin malli voidaan siis yhdistää puhekoode-5 riin joko siten, että heräteparametrien optimoinnissa suoritetaan pelkästään adaptoitava-asteinen synteesisuodatus (kuten kuvan 4b suoritusesimerkissä on esitetty), jolloin lyhyen aikavälin mallinnukseen kuuluvaa kiinteäasteista mallinnusta vastaava käänteissuodatus suoritetaan alkuperäiselle 10 puhesignaalille ennen vertailua synteesitulokseen tai siten, että koko lyhyen aikavälin synteesimalli eli adaptoitava-asteisen mallin mukaisen synteesisuodatuksen lisäksi myös kiinteäasteinen lyhyen aikavälin synteesisuodatus suoritetaan kooderin suljetussa haarassa. Kuvan 4b mukainen menet-15 tely on laskennalliselta kuormitukseltaan alhaisempi. Keksinnön mukaisella menetelmällä saavutetaan tässä suoritus-esimerkissä analyysi synteesin kautta -menetelmissä pienennetty laskennallinen kuormitus, koska vain mallintamisen kannalta tarpeellisen asteluvun suuruinen suodatus tarvitsee 20 suorittaa. Analyysi synteesin kautta -menetelmissä juuri suodatusoperaatioista muodostuu menetelmän aiheuttama suuri laskennallinen kuormitus.
Kuvassa 4b sijaitseva mallinnuksen asteluvun adaptointilohko 25 420 suorittaa saman toiminnan kuin kuvan 2a mallinnuksen asteluvun adaptointilohko 207. Vastaavasti kuin kuvan 2b enkooderissa voidaan myös analyysi synteesin kautta -haussa suorittaa suodatinitiallinnuksen asteluvun adaptointi tosiasiallisen virhesignaalin avulla takaisinkytketysti. Tämä 30 järjestely on esitetty kuvassa 4c. Kuvan 4c mallinnuksen asteluvun adaptointilohko 440 vastaa toiminnaltaan kuvan 2b • adaptointilohkoa 227. Lyhyen aikavälin suodatuksen asteluvun adaptointi kuvan 4c mukaisesti eri herätesignaalikandidaa-teilla syntesoitujen signaalien perusteella kasvattaa luon-35 nollisesti menetelmän laskennallista kuormitusta verrattuna kiinteäasteisen suodatusmallin käyttöön tai kuvan 4b mukaiseen ennen herätteen optimointia suoritettavaan mallinnuksen - asteluvun valintaan. Kuvan 4c kooderi poikkeaa kuvan 4b koo- 14 95086 derista oleellisesti siinä, että kuvan 4c kooderissa on otettu suodatinmalIin asteluvun adaptointi osaksi analyysi synteesin kautta -menetelmällä suoritettavaa koodausta. Kuvassa 4c suodattimen asteluku valitaan siten myös analyysi 5 synteesin kautta -periaatteella ja kooderissa on siis kyseessä suljetun haun suorittamisen ulottaminen herätesignaa-lin koodauksesta myös suodatinkertoimiin. Tämä on suoritettu tosin hyvin yksinkertaisessa muodossa eli rajoittuen vain suodatuksen asteluvun adaptointiin. Suodatinkertoimet muo-10 dostetaan yhä tässäkin suoritusesimerkissä avoimella haulla suoraan käsiteltävästä signaalista lohkossa 446. Kuvan 4c suoritusesimerkissä voidaan analyysi synteesin kautta -menetelmää käyttää, mutta samalla pitää menetelmästä aiheutuva laskennallinen, kuormitus kohtuullisena.
15 il • ♦ .

Claims (9)

15 95086
1. Puheenkoodausmenetelmä, jossa puhesignaalin koodaamisessa a) kehitetään lyhyen aikavälin analysaattoreissa sisääntule-5 vaa signaalia vastaava joukko ennusteparametrejä, jotka jokaisessa koodattavana olevassa puhesignaalin lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, b) muodostetaan herätesignaali, joka syöttämällä ennustepa-rametrien mukaan toimivalle synteesisuodattimelle saadaan 10 syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali, tunnettu siitä, että c) lyhyen aikavälin suodatusmalli muodostetaan kahdesta osuudesta eli kiinteän asteluvun matala-asteisesta osuudesta 15 ja asteluvultaan muuttuvasta korkean mallinnuksen asteluvun mahdolliseksi tekevästä osuudesta; d) molemmille osuuksille suoritetaan lyhyen aikavälin ennus-teparametrien laskenta; e) lyhyen aikavälin mallin kokonaisastelukua adaptoidaan 20 kussakin koodattavana olevassa puhelohkossa puhesignaalin mukaan; j a f) suodatinmallin parametrien koodaamiseen käytettävää siirtonopeutta ja herätesignaalin koodaamiseen käytettävää siirtonopeutta adaptoidaan siten, että mallinnuksessa käy- 25 tettävän asteluvun kasvattaminen kasvattaa mallin parametrien siirtonopeutta ja vastaavasti laskee herätteen koodaamiseen käytettävää siirtonopeutta eli adaptoidaan herätesignaalin ja lyhyen aikavälin suodatusmallin välittämiseksi käytettyjen siirtonopeuksien keskinäistä suhdetta. 30
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii- : tä, että kiinteäasteisen lyhyen aikavälin suodatusmallin suodatinkertoimien laskeminen suoritetaan suoraan koodattavaksi tulevasta puhesignaalista, kun taas adaptoitava-astei-35 sen lyhyen aikavälin mallin suodatinkertoimet lasketaan signaalista, joka on saatu suodattamalla koodattavaksi tuleva puhesignaali kiinteäasteisen mallin käänteissuodattimellä. 16 95086
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnet-tu siitä, että matala-asteisen kiinteän asteluvun mallinnus-tulosta käytetään adaptoimaan adaptoitava-asteisen mallinnuksen astelukua siten, että adaptoitava-asteisen lyhyen 5 aikavälin mallinnuksen asteluku lasketaan pieneksi, mikäli koodattavassa signaalilohkossa suurin osa energiasta sijaitsee kiinteäasteisen mallinnuksen mukaan korkeilla taajuuksilla eli mikäli kiinteäasteisen synteesisuodattimen taajuusvaste on ylipäästötyyppinen, ja toisaalta adaptoitava-10 asteisen mallinnuksen astelukua kasvatetaan, mikäli kiinteä-asteista mallinnusta vastaava synteesisuodatus on ali-päästötyyppinen.
4. Jonkin edellisen patenttivaatimuksen mukainen menetel-15 mä, tunnettu siitä, että suoritettava mallinnuksen asteluvun adaptointi suoritetaan kokonaismallinnuksen ennustusvirheen mukaan takaisinkytketysti vertaamalla mallinnuksen asteluvun kasvattamisen vaikutusta ennustusvirheeseen.
5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu sii tä, että mallinnuksen astelukua kasvatetaan kunnes kasvattaminen tuottaa tiettyä kynnysarvoa pienemmän virhesignaalin tehon pienenemisen tai kunnes mallinnusasteluku saavuttaa suurimman sallitun mallinnuksen asteluvun. 25 . 6. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että kiinteäasteisessa suodattimessa käytetään alhaisempaa mallin parametrien adaptointitaajuutta kuin adaptoitava-asteisessa mallinnuksessa ja sitä käytetään 30 välittämään puhujasta ja mikrofonista aiheutuvia spektriomi-naisuuksia, jotka muuttuvat hitaammin kuin varsinainen ään-neinformaatio, joka mallinnetaan varsinaisesti adaptoitava-asteisessa mallinnuksessa.
7. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että sitä käytetään analyysi synteesin kautta herätesignaalin koodaamisen suorittavissa puhekoode- 4 · '· reissä yhdistämällä kiinteäasteinen ja adaptoitava-asteinen 95086 17 lyhyen aikavälin malli puhekooderiin joko siten, että herä-teparametrien suljetussa optimoinnissa suoritetaan pelkästään adaptoitava-asteinen synteesisuodatus, jolloin lyhyen aikavälin mallinnukseen kuuluvaa kiinteäasteista mallinnusta 5 vastaava käänteissuodatus suoritetaan alkuperäiselle puhe-signaalille ennen vertailua synteesitulokseen tai siten, että koko lyhyen aikavälin synteesimalli eli adaptoitava-asteisen mallin mukaisen synteesisuodatuksen lisäksi myös kiinteäasteinen lyhyen aikavälin synteesisuodatus suoriteli) taan kooderin herätesignaalin valinnan suorittavassa haarassa.
8. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että suodatinmallin asteluvun adaptointi 15 suoritetaan osana analyysi synteesin kautta -menetelmällä suoritettavaa koodausta hakemalla analyysi synteesin kautta sellainen suodattimen asteluku, josta asteluvun kasvattaminen ei oleellisesti paranna puhesignaalin laatua.
9. Jonkin edellisen patenttivaatimuksen mukainen menetel mä, tunnettu siitä, että se on liitetty virheenkorjauskoo-daukseen siten, että valittu kokonaismallinnusaste välitetään paitsi herätesignaalin koodauksen suorittavalle lohkolle myös virheenkorjauskoodauksen suorittavalle lohkolle, 25 jolloin voidaan herätesignaalin koodauksen siirtonopeuden lisäksi adaptoida virheenkorjauskoodaukseen käytettävää siirtonopeutta. 18 95086
FI925376A 1992-11-26 1992-11-26 Menetelmä puhesignaalin tehokkaaksi koodaamiseksi FI95086C (fi)

Priority Applications (6)

Application Number Priority Date Filing Date Title
FI925376A FI95086C (fi) 1992-11-26 1992-11-26 Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
US08/155,574 US5596677A (en) 1992-11-26 1993-11-19 Methods and apparatus for coding a speech signal using variable order filtering
DE69325237T DE69325237T2 (de) 1992-11-26 1993-11-22 Verfahren zum Kodieren eines Sprachsignales
EP93309264A EP0599569B1 (en) 1992-11-26 1993-11-22 A method of coding a speech signal
AU51897/93A AU665283B2 (en) 1992-11-26 1993-11-25 A method for the efficient coding of a speech signal
JP5296618A JPH06222798A (ja) 1992-11-26 1993-11-26 音声信号を効率的に符号化するための方法及びこの方法を用いる符号器

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI925376 1992-11-26
FI925376A FI95086C (fi) 1992-11-26 1992-11-26 Menetelmä puhesignaalin tehokkaaksi koodaamiseksi

Publications (4)

Publication Number Publication Date
FI925376A0 FI925376A0 (fi) 1992-11-26
FI925376A FI925376A (fi) 1994-05-27
FI95086B FI95086B (fi) 1995-08-31
FI95086C true FI95086C (fi) 1995-12-11

Family

ID=8536280

Family Applications (1)

Application Number Title Priority Date Filing Date
FI925376A FI95086C (fi) 1992-11-26 1992-11-26 Menetelmä puhesignaalin tehokkaaksi koodaamiseksi

Country Status (6)

Country Link
US (1) US5596677A (fi)
EP (1) EP0599569B1 (fi)
JP (1) JPH06222798A (fi)
AU (1) AU665283B2 (fi)
DE (1) DE69325237T2 (fi)
FI (1) FI95086C (fi)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JP2993396B2 (ja) * 1995-05-12 1999-12-20 三菱電機株式会社 音声加工フィルタ及び音声合成装置
EP0815555A1 (en) * 1996-01-04 1998-01-07 Koninklijke Philips Electronics N.V. Method and system for coding human speech for subsequent reproduction thereof
US6170073B1 (en) 1996-03-29 2001-01-02 Nokia Mobile Phones (Uk) Limited Method and apparatus for error detection in digital communications
US5799272A (en) * 1996-07-01 1998-08-25 Ess Technology, Inc. Switched multiple sequence excitation model for low bit rate speech compression
GB2317788B (en) 1996-09-26 2001-08-01 Nokia Mobile Phones Ltd Communication device
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
ES2157854B1 (es) 1997-04-10 2002-04-01 Nokia Mobile Phones Ltd Metodo para disminuir el porcentaje de error de bloque en una transmision de datos en forma de bloques de datos y los correspondientes sistema de transmision de datos y estacion movil.
FI102647B1 (fi) * 1997-04-22 1999-01-15 Nokia Mobile Phones Ltd Ohjelmoitava vahvistin
US6286122B1 (en) 1997-07-03 2001-09-04 Nokia Mobile Phones Limited Method and apparatus for transmitting DTX—low state information from mobile station to base station
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6012025A (en) * 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
US6799159B2 (en) 1998-02-02 2004-09-28 Motorola, Inc. Method and apparatus employing a vocoder for speech processing
FI105634B (fi) 1998-04-30 2000-09-15 Nokia Mobile Phones Ltd Menetelmä videokuvien siirtämiseksi, tiedonsiirtojärjestelmä ja multimediapäätelaite
FI981508A (fi) 1998-06-30 1999-12-31 Nokia Mobile Phones Ltd Menetelmä, laite ja järjestelmä käyttäjän tilan arvioimiseksi
GB9817292D0 (en) 1998-08-07 1998-10-07 Nokia Mobile Phones Ltd Digital video coding
FI105635B (fi) 1998-09-01 2000-09-15 Nokia Mobile Phones Ltd Menetelmä taustakohinainformaation lähettämiseksi tietokehysmuotoisessa tiedonsiirrossa
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
FI116992B (fi) 1999-07-05 2006-04-28 Nokia Corp Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
CN100471072C (zh) * 2002-11-21 2009-03-18 日本电信电话株式会社 数字信号处理方法
CN101009097B (zh) * 2007-01-26 2010-11-10 清华大学 1.2kb/s SELP低速率声码器抗信道误码保护方法
JP4968415B2 (ja) * 2010-09-01 2012-07-04 日本電気株式会社 デジタルフィルタ装置、デジタルフィルタリング方法及びデジタルフィルタ装置の制御プログラム
US8873615B2 (en) * 2012-09-19 2014-10-28 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and controller for equalizing a received serial data stream
US10251002B2 (en) * 2016-03-21 2019-04-02 Starkey Laboratories, Inc. Noise characterization and attenuation using linear predictive coding

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0076234B1 (de) * 1981-09-24 1985-09-04 GRETAG Aktiengesellschaft Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
NL8400728A (nl) * 1984-03-07 1985-10-01 Philips Nv Digitale spraakcoder met basisband residucodering.
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
EP0316112A3 (en) * 1987-11-05 1989-05-31 AT&T Corp. Use of instantaneous and transitional spectral information in speech recognizers
IT1224453B (it) * 1988-09-28 1990-10-04 Sip Procedimento e dispositivo per la codifica decodifica di segnali vocali con l'impiego di un eccitazione a impulsi multipli
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
DE68914147T2 (de) * 1989-06-07 1994-10-20 Ibm Sprachcodierer mit niedriger Datenrate und niedriger Verzögerung.
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
DE69233794D1 (de) * 1991-06-11 2010-09-23 Qualcomm Inc Vocoder mit veränderlicher Bitrate
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
FI90477C (fi) * 1992-03-23 1994-02-10 Nokia Mobile Phones Ltd Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään

Also Published As

Publication number Publication date
DE69325237T2 (de) 1999-12-16
EP0599569B1 (en) 1999-06-09
JPH06222798A (ja) 1994-08-12
FI95086B (fi) 1995-08-31
EP0599569A3 (en) 1994-09-07
EP0599569A2 (en) 1994-06-01
FI925376A (fi) 1994-05-27
FI925376A0 (fi) 1992-11-26
AU665283B2 (en) 1995-12-21
US5596677A (en) 1997-01-21
AU5189793A (en) 1994-06-09
DE69325237D1 (de) 1999-07-15

Similar Documents

Publication Publication Date Title
FI95086C (fi) Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
JP4927257B2 (ja) 可変レートスピーチ符号化
JP4550289B2 (ja) Celp符号変換
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
RU2331933C2 (ru) Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
JP3653826B2 (ja) 音声復号化方法及び装置
JP4995293B2 (ja) 音声符号化用のスカラー量子化(sq)とベクトル量子化(vq)の選択
US5845244A (en) Adapting noise masking level in analysis-by-synthesis employing perceptual weighting
US5933803A (en) Speech encoding at variable bit rate
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
US20040102970A1 (en) Speech encoding method, apparatus and program
JP2006525533A5 (fi)
KR20010099763A (ko) 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법
KR20010101422A (ko) 매핑 매트릭스에 의한 광대역 음성 합성
JPH11507739A (ja) スピーチコーダ
WO2000038177A1 (en) Periodic speech coding
JP4040126B2 (ja) 音声復号化方法および装置
US8620645B2 (en) Non-causal postfilter
JP2004517348A (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
US5884251A (en) Voice coding and decoding method and device therefor
JP4558205B2 (ja) スピーチコーダパラメータの量子化方法
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
EP1397655A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders
WO2005045808A1 (en) Harmonic noise weighting in digital speech coders

Legal Events

Date Code Title Description
BB Publication of examined application