FI119533B - Audiosignaalien koodaus - Google Patents

Audiosignaalien koodaus Download PDF

Info

Publication number
FI119533B
FI119533B FI20045135A FI20045135A FI119533B FI 119533 B FI119533 B FI 119533B FI 20045135 A FI20045135 A FI 20045135A FI 20045135 A FI20045135 A FI 20045135A FI 119533 B FI119533 B FI 119533B
Authority
FI
Finland
Prior art keywords
frequency band
state
encoder
coding
signals
Prior art date
Application number
FI20045135A
Other languages
English (en)
Swedish (sv)
Other versions
FI20045135A0 (fi
FI20045135A (fi
Inventor
Ari Lakaniemi
Jari Maekinen
Pasi S Ojala
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of FI20045135A0 publication Critical patent/FI20045135A0/fi
Priority to FI20045135A priority Critical patent/FI119533B/fi
Priority to JP2007507809A priority patent/JP4838235B2/ja
Priority to CA2562916A priority patent/CA2562916C/en
Priority to BRPI0509963-3A priority patent/BRPI0509963A/pt
Priority to PCT/FI2005/050121 priority patent/WO2005101372A1/en
Priority to CN2005800114923A priority patent/CN1942928B/zh
Priority to RU2006139790/09A priority patent/RU2383943C2/ru
Priority to KR1020067022237A priority patent/KR100859881B1/ko
Priority to MXPA06010825A priority patent/MXPA06010825A/es
Priority to AU2005234181A priority patent/AU2005234181B2/en
Priority to EP05735286A priority patent/EP1735776A4/en
Priority to US11/107,334 priority patent/US20050246164A1/en
Publication of FI20045135A publication Critical patent/FI20045135A/fi
Priority to ZA2006/07661A priority patent/ZA200607661B/en
Priority to HK07110120.5A priority patent/HK1102036A1/xx
Application granted granted Critical
Publication of FI119533B publication Critical patent/FI119533B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

119533
Audiosignaalien koodaus
Keksinnön ala 5
Nyt esillä olevan keksinnön kohteena on kooderi, joka käsittää tulon taajuuskaistalla olevaa audiosignaalia sisältävien kehysten syöttämiseksi, analyysisuodattimen taajuuskaistan jakamiseksi ainakin ala-taajuuskaistaksi ja ylätaajuuskaistaksi, ensimmäisen koodauslohkon 10 alataajuuskaistalla olevien audiosignaalien koodaamiseksi, toisen koodauslohkon ylätaajuuskaistalla olevien audiosignaalien koodaamiseksi, ja tilanvalitsimen kooderin toimintatilan valitsemiseksi ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan signaaleja ja jossa toisessa tilassa koo-15 dataan sekä ylä- että alataajuuskaistan signaaleja. Keksinnön kohteena on myös laite, joka käsittää kooderin, joka käsittää tulon taajuuskaistalla olevan audiosignaalin kehysten syöttämiseksi, analyysisuodattimen taajuuskaistan jakamiseksi ainakin alataajuuskaistaksi ja ylätaajuuskaistaksi, ensimmäisen koodauslohkon alataajuuskaistalla 20 olevien audiosignaalien koodaamiseksi, toisen koodauslohkon ylä-:... taajuuskaistalla olevien audiosignaalien koodaamiseksi, ja tilanvalitsi- ::v men kooderin toimintatilan valitsemiseksi ainakin ensimmäisen tilan ja : \ toisen tilan joukosta, jossa ensimmäisessä toimintatavassa koodataan / / vain alataajuuskaistan signaaleja ja jossa toisessa tilassa koodataan : 25 sekä ylä- että alataajuuskaistan signaaleja. Keksinnön kohteena on myös järjestelmä, joka käsittää kooderin, joka käsittää tulon jollakin taajuuskaistalla olevan audiosignaalin kehysten syöttämiseksi, ainakin ensimmäisen herätelohkon ensimmäisen herätteen suorittamiseksi • puheenkaltaiselle audiosignaalille ja toisen herätelohkon toisen herät- .···. 30 teen suorittamiseksi ei-puheenkaltaiselle audiosignaalille. Keksintö /* kohdistuu lisäksi menetelmään taajuuskaistalla olevien audiosignaalien *’;Y pakkaamiseksi, jolloin taajuuskaista on jaettu ainakin alataajuus- kaistaksi ja ylätaajuuskaistaksi, jossa alataajuuskaistan audiosignaa-leja koodataan ensimmäisessä koodauslohkossa, ylätaajuuskaistan 35 audiosignaaleja koodataan toisessa koodauslohkossa, ja koodausta varten valitaan tila ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan 119533 2 signaaleja ja jossa toisessa tilassa koodataan sekä ala- että ylätaajuus-kaistan signaaleja. Keksintö kohdistuu moduuliin taajuuskaistalla olevan audiosignaalin kehysten koodaamiseksi, joka taajuuskaista on jaettu ainakin alataajuuskaistaksi ja ylätaajuuskaistaksi, jolloin moduuli 5 käsittää ensimmäisen koodauslohkon alataajuuskaistalla olevien audiosignaalien koodaamiseksi, toisen koodauslohkon ylätaajuus-kaistalla olevien audiosignaalien koodaamiseksi, ja tilanvalitsimen moduulin toimintatilan valitsemiseksi ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan vain ala-10 taajuuskaistan signaaleja ja jossa toisessa tilassa koodataan sekä ylä-että alataajuuskaistan signaaleja. Keksintö kohdistuu tietokone-ohjelmatuotteeseen, joka käsittää koneellisesti suoritettavia vaiheita taajuuskaistalla olevien audiosignaalien pakkaamiseksi, joka taajuuskaista on jaettu ainakin alataajuuskaistaksi ja ylätaajuuskaistaksi, 15 alataajuuskaistan audiosignaalien koodaamiseksi ensimmäisessä koodauslohkossa, ylätaajuuskaistan audiosignaalien koodaamiseksi toisessa koodauslohkossa, ja tilan valitsemiseksi koodausta varten ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan signaaleja ja jossa 20 toisessa tilassa koodataan sekä ala- että ylätaajuuskaistan signaaleja. :... Keksintö kohdistuu signaaliin, joka käsittää bittivirran, jossa on para- l:v metrejä dekooderia varten bittivirran dekoodaamiseksi, jolloin bittivirta : \ on koodattu taajuuskaistalla olevan audiosignaalin kehyksistä, joka / / taajuuskaista on jaettu ainakin alataajuuskaistaksi ja ylätaajuus- :·:: 25 kaistaksi, ja signaalille on määritelty ainakin ensimmäinen tila ja toinen ...T tila, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan signaaleja ja jossa toisessa tilassa koodataan sekä ala- että ylätaajuuskaistan signaaleja.
• * • * * • · · .·*·! 30 Keksinnön tausta ··· • ·
Monissa audiosignaalien käsittelysovelluksissa audiosignaalit pakataan käsittelytehovaatimusten pienentämiseksi audiosignaaleja käsiteltä-essä. Esimerkiksi digitaalisissa tietoliikennejärjestelmissä audiosignaali 35 vastaanotetaan yleensä analogisena signaalina, digitalisoidaan analo-gia-digitaali- (A/D) -muuntimella ja sen jälkeen koodataan ennen siirtoa langattoman radioliitännän välityksellä, joka on käyttäjän laitteen, kuten 119533 3 matkaviestimen, ja tukiaseman välissä. Koodauksen tarkoituksena on pakata digitalisoitu signaali ja siirtää se radioliitännän välityksellä mahdollisimman pienen datamäärän avulla ja samalla säilyttää hyväksyttävä signaalin laatutaso. Tämä on erityisen tärkeää, koska langattoman 5 radioliitännän radiokanavakapasiteetti on rajallinen matkaviestinverkossa. On myös sovelluksia, joissa digitalisoitu audiosignaali tallennetaan muistivälineeseen myöhempää audiosignaalin toistoa varten.
10 Pakkaus voi olla häviöllistä tai häviötöntä. Häviöllisessä pakkaamisessa osa informaatiosta katoaa pakkaamisen aikana, eikä tällöin ole mahdollista täydellisesti rekonstruoida alkuperäistä signaalia pakatun signaalin pohjalta. Häviöttömässä pakkaamisessa informaatiota ei yleensä katoa. Täten alkuperäinen signaali voidaan yleensä täydelli-15 sesti rekonstruoida pakatun signaalin perusteella.
Puhelinpalveluissa puhekaista on usein rajoitettu välille noin 200 Hz -3400 Hz. Tyypillinen näytteistystaajuus, jota A/D-muunnin käyttää muuttaakseen analogisen puhesignaalin digitaaliseksi signaaliksi, on 20 joko 8 kHz tai 16 kHz. Musiikki- tai ei-puhe-signaalit voivat sisältää :... taajuuskomponentteja, jotka ovat huomattavasti normaalia puheen ::y taajuusaluetta korkeampia. Joissakin sovelluksissa audiojärjestelmän *' \ tulisi pystyä käsittelemään taajuusaluetta, jonka laajuus on noin .*.: 20 Hz-20 000 kHz. Laskostumisen välttämiseksi tällaisten signaalien : 25 näytteistystaajuuden tulisi olla ainakin 40 000 kHz. Tässä yhteydessä on huomattava, että edellä mainitut arvot ovat vain ei-rajoittavia esimerkkejä. Esimerkiksi joissakin järjestelmissä musiikkisignaalien yläraja voi olla hyvinkin mainitun 20 000 kHz alapuolella.
• · • · ♦ • · ♦ ··· · .· ·. 30 Seuraavaksi näytteistetty digitaalinen signaali koodataan, yleensä ke- hys kehykseltä, ja näin saadaan digitaalinen datavirta, jonka bitti-nopeus määräytyy koodaamiseen käytetyn koodekin mukaan. Mitä suurempi bittinopeus on, sitä enemmän tietoa koodataan, mikä johtaa ·*·.: tulokehyksen tarkempaan esittämiseen. Koodattu audiosignaali voi- 35 daan tämän jälkeen dekoodata ja ohjata digitaali-analogia- (D/A)-muuntimen läpi sellaisen signaalin rekonstruoimiseksi, joka on niin lähellä alkuperäistä signaalia kuin mahdollista.
119533 4
Ihanteellinen koodekki koodaa audiosignaalin mahdollisimman vähillä biteillä optimoiden siten kanavan kapasiteetin sekä tuottaa samalla dekoodatun audiosignaalin, joka kuulostaa mahdollisimman tarkasti alku-5 peräiseltä audiosignaalilta. Käytännössä joudutaan yleensä tekemään kompromissi koodekin bittinopeuden ja tulkitun äänen laadun välillä.
Tällä hetkellä on olemassa lukuisia erilaisia koodekkeja, kuten adaptiivinen moninopeuksinen koodekki (adaptive multi-rate codec, AMR), 10 adaptiivinen moninopeuksinen laajakaistakoodekki (adaptive multi-rate wideband codec, AMR-WB) ja laajennettu adaptiivinen moninopeuksinen laajakaistakoodekki (extended adaptive multi-rate wideband codec, AMR-WB+) jotka on kehitetty audiosignaalien pakkaamista ja koodaamista varten. AMR kehitettiin 3rd Generation Partnership 15 Project (3GPP) -projektissa GSM/EDGE- ja WCDMA-tietoliikenneverk-koja varten. Lisäksi ennakoidaan, että AMR:ää tullaan käyttämään pakettivälitteisissä verkoissa. AMR perustuu algebralliseen koodi-herätteiseen lineaariseen ennakoivaan (Algebraic Code Excited Linear Prediction, ACELP) koodaukseen. AMR-koodekki, AMR WB -koodekki 20 ja AMR WB+ -koodekki koostuvat 8, 9 ja 12 aktiivisesta bittinopeu-desta, tässä järjestyksessä, ja sisältävät puheaktiivisuuden ilmaisun i. V (VAD) ja epäjatkuva lähetys -toiminnon (DTX). Tällä hetkellä AMR- : ·] koodekin näytteistystaajuus on 8 kHz ja AMR-WB-koodekin näytteistystaajuus on 16 kHz. On selvää, että edellä mainitut koodekit, • » : 25 koodekfcien tilat ja näytteistystaajuudet ovat vain ei-rajoittavia esimerk- keji.
··· • · • · ···
Audiokoodekkien kaistanleveyslaajennusalgoritmeissa käytetään tyy-: .·. pillisesti ydinkoodekin koodaustoimintoja ja koodausparametrejä. Toi- !···.* 30 sin sanoen koodattu äänikaista jaetaan kahdeksi, joista alempi kaista käsitellään ydinkoodekissa ja ylempi kaista koodataan sitten käyttävä mällä hyväksi tietoja ydinkaistan (eli alakaistan) koodausparametreista ja signaaleista. Koska useimmissa tapauksissa alempi ja ylempi ääni-: kaista korreloivat hyvin keskenään, alakaistan parametreja voidaan 35 jossakin määrin hyödyntää myös yläkaistalla. Käyttämällä alakaistan kooderin parametreja hyväksi yläkaistan koodauksessa pienennetään huomattavasti yläkaistan koodauksen bittinopeutta.
5 119533
Esimerkkinä jaetun kaistan koodausalgoritmista on laajennettu AMR-WB (AMR-WB+) -koodekki. Ydinkooderi sisältää täydellisiä lähde-signaalin koodausalgoritmeja, kun taas yläkaistan kooderin LPC-5 herätesignaali kopioidaan ydinkooderista, tai se on paikallisesti muodostettu satunnaissignaali.
Alakaistan koodauksessa käytetään joko algebrallisen koodiherätteisen lineaarisen ennusteen (ACELP) tyyppisiä tai muunnokseen perustuvia 10 algoritmeja. Algoritmien välinen valinta perustuu tulosignaalin ominaisuuksiin. ACELP-algoritmia käytetään yleensä puhesignaaleihin ja transientteihin, kun taas musiikkisignaaleja ja sävelenkaltaisia signaaleja koodataan yleensä muunnoskoodauksen avulla, jotta taajuus-resoluutiota pystytään käsittelemään paremmin.
15
Yläkaistan koodauksessa käytetään hyväksi lineaarista ennakoivaa koodausta yläkaistan signaalin spektrivaipan mallintamiseksi. Bitti-nopeuden säästämiseksi herätesignaali muodostetaan näytteistämällä alakaistan heräte ylemmälle kaistalle. Toisin sanoen alakaistan herä-20 tettä käytetään uudelleen yläkaistalla siirtämällä se yläkaistalle. Toinen . i>( menetelmä on muodostaa yläkaistaa varten satunnainen heräte- i:V signaali. Syntetisoitu yläkaistan signaali muodostetaan uudelleen suo- : ·* dattamalla mittakaavaan muutettu herätesignaali yläkaistan LPC-mallin läpi.
25
Laajennetussa AMR-WB (AMR-WB+) -koodekissa sovelletaan jaettua kaistarakennetta, jossa äänikaistanleveys on jaettu kahteen osaan ennen koodausprosessia. Kumpikin kaista koodataan erikseen.
: .·. Kuitenkin bittinopeuden minimoimiseksi yläkaista koodataan käyttä- !*··! 30 mällä edellä mainittuja kaistanleveyden laajennustekniikoita, jolloin osa ‘‘‘ yläkaistan koodauksesta riippuu alakaistan koodauksesta. Tässä v.: tapauksessa yläkaistan herätesignaali kopioidaan alakaistan kooderilta ··« lineaarista ennakoivaa koodaus (LPC) -synteesiä varten AMR-WB+ .·! : -koodekissa alakaistan leveys on 0-6,4 kHz, kun taas yläkaistan leveys 35 on 6,4-8 kHz, kun näytteistystaajuus on 16 kHz, ja 6,4-12 kHz, kun näytteistystaajuus on 24 kHz.
• · 6 119633 AMR-WB+ -koodekki pystyy vaihtamaan tilasta toiseen myös audio-virran aikana, jos näytteistystaajuus ei muutu. Näin ollen on mahdollista vaihtaa AMR-WB-tilojen ja laajennustilojen välillä käyttäen 16 kHz näytteistystaajuutta. Tätä toiminnallisuutta voidaan käyttää esimerkiksi 5 silloin, kun siirto-olosuhteet vaativat vaihtamista ylemmän bittinopeu-den tilasta (laajennustilasta) alemman bittinopeuden tilaan (AMR-WB-tila) verkon ruuhkautumisen vähentämiseksi. Samoin jos muutos verkko-olosuhteissa sallii vaihdon aiemman bittinopeuden tilasta ylempään paremman kuuluvuuden mahdollistamiseksi, AMR-WB+ voi 10 vaihtaa AMR-WB-tilasta johonkin laajennustiloista. Vaihto yläkaistan laajennuskoodausta käyttävästä tilasta tilaan, jossa käytetään vain ydinkaistan koodausta, voidaan toteuttaa yksinkertaisesti kytkemällä pois yläkaistan laajennus välittömästi, kun tällainen tilanvaihto tapahtuu. Vastaavasti vaihdettaessa vain ydinkaistaa käyttävästä tilasta ti-15 laan, jossa käytetään yläkaistalaajennusta, yläkaista otetaan täysimittaisena käyttöön välittömästi kytkemällä yläkaistan laajennus päälle. Kaistanleveyslaajennuskoodauksesta johtuen AMR-WB+ -laajennustiloilla saavutettava äänikaistanleveys on suurempi kuin AMR-WB-tilojen äänikaistanleveys, mikä aiheuttaa todennäköisesti häi-20 ritsevästi kuuluvan vaikutuksen, jos siirtymä tapahtuu liian nopeasti. . t. Käyttäjästä tämä vaihto kuuluvalla äänikaistanleveydellä voi olla erityi- ;;v sen häiritsevä vaihdettaessa laajemmasta äänikaistasta kapeampaan : ·) eli laajennustilasta AMR-WB-tilaan.
• t··· t * • · : 25 Keksinnön yhteenveto ··
Nyt esillä olevan keksinnön yhtenä tarkoituksena on saada aikaan parannettu menetelmä audiosignaalien koodaamiseksi kooderissa häirit-: .*. sevinä kuultavien vaikutusten vähentämiseksi siirryttäessä tilojen vä- !*··.* 30 Iillä, joissa tiloissa on eri kaistanleveydet.
··· • * v.: Keksintö perustuu siihen ajatukseen, että kun muutos tapahtuu kapea- :...: kaistaisesta (AMR-WB-tila) leveäkaistaiseen toimintatilaan .·!.* (AMR-WB+), yläkaistalaajennusta ei kytketä päälle välittömästi, vaan 35 amplitudia kasvatetaan vain vähitellen lopulliseen arvoon liian nopean muutoksen välttämiseksi. Samoin siirryttäessä leveäkaistaisesta tilasta kapeakaistaiseen tilaan yläkaistalaajennuksen kontribuutiota ei kytketä 7 119533 pois päältä välittömästi, vaan se skaalataan alas vähitellen häiritsevien vaikutusten välttämiseksi.
Keksinnön mukaan tällaisen vähittäisen yläkaistalaajennussignaalin 5 aikaansaaminen toteutetaan parametritasolla kertomalla yläkaista-synteesiin käytetyt herätevahvistukset skaalauskertoimella, jota kasvatetaan pienin askelin nollasta yhteen valitussa aikaikkunassa. Esimerkiksi AMR-WB+ -koodekissa 320 ms pituisen ikkunan (4 AMR-WB+ -kehystä, joiden pituus on 80 ms) voidaan odottaa tuottavan riittävän 10 hitaan yläkaistan äänitaajuuksien lisäyksen. Samalla tavoin kuin ylä-kaistan äänitaajuuksia lisättäessä voidaan myös yläkaistan signaalin asteittainen häviäminen toteuttaa parametritasolla, tässä tapauksessa kertomalla yläkaistasynteesiin käytetyt herätevahvistukset skaalauskertoimella, jota pienennetään pienin askelin yhdestä nollaan valitulla 15 aikavälillä. Tässä tapauksessa ei yläkaistalaajennukseen ole kuitenkaan käytettävissä päivitettyjä parametrejä sen jälkeen, kun varsinainen siirtyminen pelkästään ydinkaistalle on tapahtunut. Yläkaista-synteesi voidaan kuitenkin toteuttaa käyttämällä yläkaistalaajennus-parametrejä, jotka on saatu viimeistä kehystä varten ennen siirtymistä 20 pelkästään ydintoimintatilaan, ja herätesignaalia, joka on saatu kehyk-. . sistä, jotka on vastaanotettu pelkässä ydintoimintatavassa. Tämän ::γ menetelmän jonkin verran muunnettu versio olisi muuntaa yläkaistan : ·[ synteesiin käytettyjä LPC-parametreja siirtymisen jälkeen siten, että LPC-suodattimen taajuusvaste pakotetaan vähitellen tasaisemmalle • · · 25 spektrille. Tämä voidaan toteuttaa esim. laskemalla painotettu keski- arvo todella vastaanotetusta LPC-suodattimesta ja LPC-suodattimesta, joka saa aikaan tasaisen spektrin ISP-tasolla. Tällä lähestymistavalla voidaan saada parempi äänen laatu tapauksissa, joissa viimeinen ke-ihys, jossa oli yläkaistan laajennusparametrejä, sattui sisältämään sel-30 vän spektrihuipun (selviä spektrihuippuja).
··· • · v.: Nyt esillä olevan keksinnön mukaisella menetelmällä saadaan saman- kaltainen vaikutus kuin suoraskaalauksella aikatasolla, mutta skaala-./. t uksen suorittaminen parametritasolla on laskennallisesti tehokkaampi 35 ratkaisu.
• · 119533 8
Nyt esillä olevan keksinnön mukaiselle kooderille on pääasiassa tunnusomaista se, että kooderi käsittää lisäksi skaalaajan, jolla ohjataan toista koodauslohkoa vaihtamaan koodauslohkon koodausominai-suuksia vähitellen kooderin toimintatilan vaihdon yhteydessä.
5
Nyt esillä olevan keksinnön mukaiselle laitteelle on pääasiassa tunnusomaista se, että kooderi käsittää lisäksi skaalaajan, jolla ohjataan toista koodauslohkoa vaihtamaan koodauslohkon koodausominaisuuksia vähitellen kooderin toimintatilan vaihdon yhteydessä.
10
Nyt esillä olevan keksinnön mukaiselle järjestelmälle on pääasiassa tunnusomaista se, että järjestelmä käsittää lisäksi skaalaajan, jolla ohjataan toista koodauslohkoa vaihtamaan koodauslohkon koodausominaisuuksia vähitellen kooderin toimintatilan vaihdon yhteydessä.
15
Nyt esillä olevan keksinnön mukaiselle menetelmälle on pääasiassa tunnusomaista se, että toisen koodauslohkon koodausominaisuuksia vaihdetaan vähitellen toimintatavan vaihdon yhteydessä.
20 Nyt esillä olevan keksinnön mukaiselle moduulille on pääasiassa tun-, . nusomaista se, että moduuli käsittää lisäksi skaalaajan, jolla ohjataan : toista koodauslohkoa vaihtamaan toisen koodauslohkon koodaus- ·* · • V ominaisuuksia vähitellen kooderin toimintatilan vaihdon yhteydessä.
• · j.: i 25 Nyt esillä olevan keksinnön mukaiselle tietokoneohjelmatuotteelle on pääasiassa tunnusomaista se, että tietokoneohjelmatuote käsittää li- säksi koneellisesti suoritettavat vaiheet toisen koodauslohkon koodaus- ominaisuuksien vaihtamiseksi vähitellen kooderin toimintatilan vaihdon : .·. yhteydessä.
··· 30 • ·
Nyt esillä olevan keksinnön mukaiselle signaalille on pääasiassa • · \v tunnusomaista se, että tilan vaihdossa mainitun ensimmäisen tilan ja O mainitun toisen tilan välillä ainakin yksi mainittuun ylätaajuuskaistaan .*! · liittyvän signaalin parametreista vaihtuu vähitellen.
* ·· ,;j 35
Verrattuna edellä esitettyyn tekniikan tason mukaiseen lähestymistapaan keksintö tarjoaa ratkaisun erilaisten, kaistanleveystilojen välillä 119533 9 siirtymisestä johtuvien, mahdollisten kuuluvien vaikutusten vähentämiseksi. Näin ollen audiosignaalin laatua voidaan parantaa. Nyt esillä olevan keksinnön mukaisella menetelmällä saadaan samankaltainen toimininnallisuus kuin suoraskaalauksella aikatasolla, mutta skaalauk-5 sen suorittaminen parametritasolla on laskennallisesti tehokkaampi ratkaisu.
Piirustusten kuvaus 10 kuva 1 esittää yksinkertaistettuna kaaviona nyt esillä olevan keksinnön mukaista jaetun kaistan koodaus-dekoodaus -konseptia, jossa on kaksikaistaiset suodatinpankit ja erilliset koodaus- ja dekoodauslohkot kutakin äänikaistaa varten, 15 kuva 2 esittää suoritusesimerkkiä keksinnön mukaisesta koodaus-laitteesta, kuva 3 esittää suoritusesimerkkiä keksinnön mukaisesta dekoo-20 dauslaitteesta, • * • · · ;;V kuva 4a esittää spektrogrammin kaistanvaihdosta kapeasta kais- ·’ V tästä laajakaistaan tunnetun tekniikan tason mukaisessa kooderissa, : 25 kuva 4b esittää spektrogrammin kaistanvaihdostakapeasta kaistasta Γ'": laajakaistaan nyt esillä olevan keksinnön suoritusmuodon mukaisessa kooderissa, 9 9 9 9 9 • · · "·! 30 Kuva 4c esittää koodatun yläkaistan signaalin energiaa aika-akse- • · " lilla, kun kaista on kytketty kapeasta kaistasta laajakaistaan tunnetun tekniikan tason mukaisessa kooderissa ja nyt esillä olevan keksinnön suoritusmuodon mukaisessa koode-.·! ϊ rissa, 9 99 35 • · 119533 10 kuva 5a esittää spektrogrammin kaistanvaihdosta laajakaistasta kapeaan kaistaan tunnetun tekniikan tason mukaisessa kooderissa, 5 kuva 5b esittää spektrogrammin kaistanvaihdosta laajakaistasta kapeaan kaistaan nyt esillä olevan keksinnön suoritusmuodon mukaisessa kooderissa, kuva 5c esittää koodatun yläkaistan signaalin energiaa aika-akse-10 lilla, kun kaista siirretään laajakaistasta kapeaan kaistaan tunnetun tekniikan tason mukaisessa kooderissa ja nyt esillä olevan keksinnön suoritusmuodon mukaisessa kooderissa, 15 kuva 6 esittää esimerkkiä nyt käsillä olevan keksinnön mukaisesta järjestelmästä.
Keksinnön yksityiskohtainen kuvaus 20 Kuva 1 esittää nyt esillä olevan keksinnön yhden suoritusesimerkin . . mukaista jaetun kaistan koodaus-dekoodaus -konseptia, jossa • · » ;;:t: käytetään kahden kaistan suodatinpankkia ja erillisiä koodaus- ja de- : V koodauslohkoja kutakin äänikaistaa varten. Signaalilähteestä 1.2 tu- "**·' leva tuloslgnaali käsitellään ensin analyysisuodattimessa 1.3, jossa 25 äänikaista jaetaan ainakin kahdeksi äänikaistaksi eli alataajuuden ääni- kaistaksi ja ylätaajuuden äänikaistaksi ja alinäytteistetään kriittisesti.
Sen jälkeen alataajuuden äänikaista koodataan ensimmäisessä koo- dauslohkossa 1.4.1 ja vastaavasti ylätaajuuden äänikaista koodataan : toisessa koodauslohkossa 1.4.2. Äänikaistat koodataan oleellisesti toi- • · · "V 30 sistaan riippumatta. Kanavoitu bittivirta siirretään lähetinlaltteesta 1 *:* tiedonsiirtokanavan 2 kautta vastaanotinlaitteeseen 3, jossa ala- ja ylä- • · \v kaista dekoodataan toisistaan riippumatta ensimmäisessä dekoodaus- O lohkossa 3.3.1. ja toisessa dekoodauslohkossa 3.3.2, tässä järjestyk- .*!; sessä. Seuraavaksi dekoodatut signaalit ylösnäytteistetään alkuperä!- • ·· 35 seen näytteistystaajuuteen, minkä jälkeen synteesisuodatinpankissa 3.4 yhdistetään dekoodatut audiosignaalit syntetisoidun audiosignaalin 3.5. muodostamiseksi.
119533 11
Tapauksessa, jossa AMR-WB+ toimii 16 kHz:n näytteistetyllä audiosignaalilla, 8 kHz:n äänikaista jaetaan 0-6,4 ja 6,4-8 kHz:n kaistoiksi. Analyysisuodattimen 1.3 jälkeen käytetään hyväksi kriittistä alinäyt-5 teistystä. Toisin sanoen alakaista alinäytteistetään 12,8 kHz:in (=2 x (0-6,4)) ja yläkaista uudelleennäytteistetään 3.2 kHz:in (-2 x (8 - 6,4)).
Ensimmäinen koodauslohko 1.4.1 (alakaistan kooderi) ja ensimmäinen 10 dekoodauslohko 3.3.1 (alakaistan dekooderi) voivat olla esimerkiksi AMR-WB-standardin kooderi ja dekooderi, kun taas toinen koodaus-lohko 1.4.2 (yläkaistan kooderi) ja toinen dekoodauslohko 3.3.2. (ylä-kaistan dekooderi) voidaan toteuttaa joko itsenäisenä koodausalgorit-minä, kaistanleveyslaajennusalgoritminä tai näiden yhdistelmänä.
15
Seuraavassa nyt esillä olevan keksinnön suoritusesimerkin mukaista laitetta 1 selostetaan yksityiskohtaisemmin viittaamalla kuvaan 2. Koo-dauslaite 1 käsittää tulolohkon 1.2, jossa tulosignaali tarvittaessa digitalisoidaan, suodatetaan ja kehystetään. Tulosignaalin digitalisointi 20 suoritetaan tulonäytteistäjällä 1.2.1 tulonäytteistystaajuudella. Suoritus-: esimerkissä tulonäytteistystaajuus on joko 16 kHz tai 24 kHz, mutta on |rv selvää, että on mahdollista käyttää myös muita näytteistystaajuuksia.
: Tässä yhteydessä tulee huomata, että tulosignaali voi jo olla koodaus- .* / prosessiin soveltuvassa muodossa. Tulosignaali voi esimerkiksi olla : 25 digitalisoitu aikaisemmassa vaiheessa ja tallennettu muistivälineeseen (ei piirustuksissa). Tulosignaalin kehykset syötetään analyysisuodatti-C.*: meen 1.3. Analyysisuodatin 1.3 käsittää suodatinpankin, jossa ääni- kaista jaetaan kahteen tai useampaan äänikaistaan. Tässä suoritus- : muodossa suodatinpankki käsittää ensimmäisen suodattimen 1.3.1 ja * · · ·"*. 30 toisen suodattimen 1.3.2. Ensimmäinen suodatin 1.3.1 on esimerkiksi .·. alipäästösuodatin, jolla on rajataajuus alaäänikaistan ylärajalla. Raja- *;’·* taajuus on esimerkiksi noin 6,4 kHz. Toinen suodatin 1.3.2 on esimer- kiksi kaistanpäästösuodatin, jonka taajuus ulottuu ensimmäisen suo-:*·.· dattimen 1.3.1 rajataajuudesta aina äänikaistan ylärajalle saakka.
35 Kaistanleveys on esimerkiksi 6,4 Khz-8 kHz 16kHz:n näytteistys-taajuudella ja 6,4 kHz - 8 kHz 24 kHz:n näytteistystaajuudella. Toinen suodatin 1.3.2 voi olla myös ylipäästösuodatin, jos kooderin 1.4 tulon 119533 12 luona audiosignaalin taajuuskaista on rajoitettu ylhäältä samaksi kuin näytteistystaajuus tai puolet siitä, eli vain ylärajan alittavat taajuudet ohjataan analyysisuodattimeen. On myös mahdollista jakaa äänikaista useammaksi kuin kahdeksi äänikaistaksi, jolloin analyysisuodatin voi 5 käsittää suodattimen kutakin äänikaistaa varten. Seuraavassa kuitenkin oletetaan käytettävän vain kahta äänikaistaa.
Suodatinpankin lähdöt alinäytteistetään kriittisesti audiosignaalin siirtoon tarvittavan bittinopeuden pienentämiseksi. Ensimmäisen suodat-10 timen 1.3.1 lähtö alinäytteistetään ensimmäisessä näytteistäjässä 1.3.3 ja toisen suodattimen 1.3.2 lähtö alinäytteistetään toisessa näytteistäjässä 1.3.4. Ensimmäisen näytteistäjän 1.3.3 näytteistystaajuus on esimerkiksi puolet ensimmäisen suodattimen 1.3.1 kaistanleveydestä. Vastaavasti toisen näytteistäjän 1.3.4 näytteistystaajuus on esimerkiksi 15 puolet toisen suodattimen 1.3.2 kaistanleveydestä. Tässä suori- tusesimerkissä ensimmäisen näytteistäjän 1.3.3 näytteistystaajuus on 12,8 kHz ja toisen näytteistäjän 1.3.4 näytteistystaajuus on 6,4 kHz tu-loaudiosignaalin näytteistystaajuudella 16 kHz ja 11,2 kHz tulo-audiosignaalin näytteistystaajuudella 24 kHz.
20 : .·. Ensimmäisestä näytteistäjästä 1.3.3 saatavat näytteet johdetaan en- ••V simmäiseen koodauslohkoon 1.4.1 koodausta varten. Vastaavasti toi- ’ *! sesta näytteistäjästä 1.3.4 saatavat näytteet johdetaan toiseen koo- .* .* dauslohkoon 1.4.2 koodausta varten. Ensimmäisessä koodaus- : : : 25 lohkossa 1.4.1 näytteet analysoidaan sen määrittämiseksi, mikä herä- ··.*:* temenetelmä on sopivin tulosignaalin koodaukseen. Valittavina voi olla · · :...; kaksi tai useampia herätemenetelmiä. Esimerkiksi ei-puhesignaaleille (tai ei-puheen kaltaisille signaaleille) (esim. musiikille) valitaan ensim-\ mäinen herätemenetelmä ja puhesignaaleille (tai puheenkaltaisille sig- 30 naaleille) valitaan toinen herätemenetelmä. Ensimmäinen heräte-
• »I
.·. menetelmä tuottaa esimerkiksi TCX-herätesignaalin ja toinen heräte- menetelmä tuottaa esimerkiksi ACELP-herätesignaalin.
• * • t * · ·
Herätemenetelmän valitsemisen jälkeen näytteille suoritetaan ensim-35 mäisessä koodauslohkossa 1.4.1 kehyksittäin LPC-analyysi sellaisen parametrijoukon löytämiseksi, joka parhaiten vastaa tulosignaalia. Tämän tekemiseksi on olemassa joitakin vaihtoehtoisia menetelmiä, jotka 119533 13 alan ammattilainen tuntee, eikä tässä hakemuksessa siksi ole tarpeen kuvailla LPC-analyysin yksityiskohtia.
Tieto valitusta herätemenetelmästä ja LPC-parametrit siirretään toiseen 5 koodauslohkoon 1.4.2. Toisessa koodauslohkossa 1.4.2 käytetään samaa herätettä, joka tuotettiin ensimmäisessä koodauslohkossa 1.4.1. Tässä suoritusesimerkissä herätesignaali tuotetaan toista koo-dauslohkoa 1.4.2 varten ylösnäytteistämällä alataajuuden äänikaistan heräte ylätaajuuden äänikaistalle. Toisin sanoen alakaistan herätettä 10 käytetään uudelleen yläkaistalla siirtämällä se yläkaistalle. Ylätaajuuden audiosignaalin kuvaamiseen käytetyt parametrit AMR-WB+ -koodeissa ovat LPC-synteesisuodatin, joka määrittelee syntetisoidun signaalin spektriominalsuudet, ja joukko herätyssignaalia varten olevia vahvistusparametreja, jotka ohjaavat syntetisoidun audiosignaalin voi- 15 makkuutta.
Ensimmäisen koodauslohkon 1.4.1 ja toisen koodauslohkon 1.4.2 muodostamat LPC-parametrit ja heräteparametrit esimerkiksi kvanti- soidaan ja kanavakoodataan kvantisointi- ja kanavakoodauslohkossa 20 1.5 ja yhdistetään (kanavoidaan) samaan lähetysvirtaan virran- : .·. muodostuslohkolla 1.6 ennen lähettämistä esimerkiksi lähetyskana- ♦ · · j.‘Y vaan, kuten tietoliikenneverkkoon 604 (kuva 6). Ei kuitenkaan ole : \ välttämätöntä lähettää parametreja, vaan ne voidaan esimerkiksi tal- ,* lentää muistivälineeseen ja hakea myöhemmässä vaiheessa lähettä- :*i: 25 mistä ja/tai dekoodausta varten.
·· «···
Seuraavassa selostetaan tarkemmin nyt esillä olevan menetelmän yhden suoritusesimerkin mukaista menetelmää, kun suoritetaan vaihto : :*; ensimmäisen koodaustilan ja toisen koodaustilan välillä. Ensimmäinen ··· · 30 koodaustila on esimerkiksi kapean kaistan koodaustila ja toinen koo- .·. daustila on esimerkiksi laajakaistan koodaustila.
* · • * ♦ • · * · · Määritellään aikaparametri T, joka osoittaa, kuinka pitkän ajan tilan muuttaminen kestää. Alkaparametriä T käytetään koodaustilan vähit-35 täiseen vaihtamiseen. Aikaparametrin arvo on esimerkiksi 320 ms, mikä vastaa neljää kehyksen pituutta F (80 ms AMR-WB+ -kooderissa). On selvää, että voidaan käyttää myös muita 119533 14 arvoja kuin aikaparametria T. Määritellään myös kertoja M ja askelarvo S käytettäviksi toisessa koodauslohkossa tilan vaihdon aikana. Askel-arvo määritellään niin, että se osoittaa, miten suuria askeleita tilaa vaihdettaessa käytetään. Esimerkiksi jos aikaparametri T vastaa neljää 5 kehystä (4xFL), askelarvo on yhtä kuin 0,25 (=1/4), eli askelarvo voidaan laskea jakamalla kehyksen pituus aikaparametrilla (=F/T).
Ensin oletetaan, että kooderissa 1 on käytössä ensimmäinen koodaus-tilaa, ja aiotaan suorittaa vaihto toiseen koodaustilaan. Alataajuuden 10 audiosignaalin koodaus jatkuu ensimmäisessä koodauslohkossa 1.4.1, kuten edellä on kuvattu. Tilanilmaisin (ei esitetty) asetetaan tilaan, joka ilmaisee, että toinen koodaustila on valittu. Lisäksi tieto koodaustilasta ja LPC-parametrit sekä tarvittaessa muita parametreja ensimmäisestä koodauslohkosta 1.4.1 siirretään toiseen koodauslohkoon 1.4.2. Toi-15 sessa koodauslohkossa 1.4.2 vastaanotettuja LPC-parametreja ei oteta käyttöön sellaisenaan, vaan ainakin jotakin parametria muunnetaan. Kertoja M asetetaan nollaksi. Sen jälkeen joukko LPC-vahvistus-parametreja muunnetaan kertomalla LPC-vahvistusparametrien joukko kertojalla M. Toisessa koodauslohkossa 1.4.2 muunnettuja LPC-para-20 metrejä käytetään senhetkisen kehyksen (näytejoukon) koodauspro- : ... sessissa. Tämän jälkeen, seuraavaa kehystä varten, kertoja M:ään li- • · · »V sätään askelarvo S, ja LPC-vahvistusparametrien joukko muunnetaan, : \ kuten edellä mainittiin. Edellä kuvattu menettely toistetaan jokaisen seuraavan kehyksen kohdalla, kunnes kertoja M saavuttaa arvon 1, 25 josta eteenpäin käytetään arvoa 1 ja jatketaan kooderin 1 toiminnan ...T toista koodaustilaa (laajakaistatpa).
• · · • * • ·
Seuraavaksi oletetaan, että kooderissa 1 on käytössä toinen koodaus- : :*.· tila, ja aiotaan suorittaa vaihto ensimmäiseen koodaustilaan. Alataa- ··· · ·***; 30 juuden audiosignaalin koodaus jatkuu ensimmäisessä koodausloh- Λ kossa 1.4.1, kuten edellä on kuvattu. Toimintavan ilmaisin asetetaan • · * tilaan, joka ilmaisee, että ensimmäinen koodaustila on valittu. Tässä vaiheessa tietoa koodaustoimintatavasta ja LPC-parametreja ei nor-maalisti siirretä ensimmäisestä koodauslohkosta 1.4.1 toiseen koo- « * 35 dauslohkoon 1.4.2. Siksi jotkin järjestelyt ovat tarpeen, jotta vähittäinen koodaushan muuttaminen toimisi. Ensimmäisessä vaihtoehdossa toiseen koodauslohkoon 1.4.2 on talletettu tilan muutosta edeltäneen vii- 119533 15 meisen kehyksen koodauksessa käytetyt LPC-parametrit. Tämän jälkeen kertoja M asetetaan arvoon yksi ja LPC-vahvistusparametrit kerrotaan kertojalla M, ja muunnettua LPC-vahvistusparametrien joukkoa käytetään tilanvaihtoa seuraavan ensimmäisen kehyksen koodauk-5 sessa. Seuraavaa kehystä varten kertojan M arvoa vähennetään as-kelarvolla S, LPC-parametrijoukko kerrotaan kertojalla M, ja kyseinen kehys koodataan. Edellä mainittuja vaiheita (kertojan arvon muuttaminen, LPC-parametrijoukon muuntaminen ja kehyksen koodaaminen) toistetaan, kunnes kertoja saavuttaa arvon nolla. Tämän jälkeen koo-10 dausprosessia jatketaan vain ensimmäisessä koodauslohkossa 1.4.1.
Esimerkiksi ylös- ja alasskaalaukseen käytetty vektori voi olla seuraavanlainen. Vektori sisältää 64 elementtiä, mikä merkitsee sitä, että yhtä elementtiä käytetään 5 ms:n alikehykseen. Tämä merkitsee sitä, että 15 ylös/alasskaalaus tehdään 320 ms:n aikana.
gain_hf_ramp [64] = {0.01538461538462, 0.03076923076923, 0.04615384615385, 0.06153846153846, 20 0.07692307692308, 0.09230769230769, . . 0.10769230769231, 0.12307692307692, • · · * ' i:V 0.13846153846154, 0.15384615384615, • « · : ** 0.16923076923077, 0.18461538461538, 0.20000000000000, 0.21538461538462, : 25 0.23076923076923, 0.24615384615385, ..li* 0.26153846153846, 0.27692307692308, ··*".* 0.29230769230769, 0.30769230769231, 0.32307692307692, 0.33846153846154, • :*; 0.35384615384615, 0.36923076923077, .···.* 30 0.38461538461538, 0.40000000000000, /* 0.41538461538462, 0.43076923076923, Σ·ν 0.44615384615385, 0.46153846153846, ··· 0.47692307692308, 0,49230769230769, 0.50769230769231, 0.52307692307692, 35 0.53846153846154, 0.55384615384615, 0.56923076923077, 0.58461538461538, 0.60000000000000, 0.61538461538462, 119533 16 0.63076923076923, 0.64615384615385, 0.66153846153846, 0.67692307692308, 0.69230769230769, 0.70769230769231, 0.72307692307692, 0.73846153846154, 5 0.75384615384615, 0.76923076923077, 0.78461538461538, 0.80000000000000, 0.81538461538462, 0.83076923076923, 0.84615384615385, 0.86153846153 846, 0.876923 076923 08, 0.8 923 076923 0769, 10 0.90769230769231, 0.92307692307692, 0.93846153846154, 0.95384615384615, 0.96923076923077, 0.98461538461538}
Kun ylätaajuuden kaistaa skaalataan ylös toisessa koodauslohkossa 15 1.4.2, toisen koodauslohkon 1.4.2 herätevahvistus kerrotaan yhdellä arvoista, joissa indeksi osoittaa skaalausvektoria. Indeksin arvo on 5 ms koodattujen alikehysten määrä. Tästä syystä tilanvaihdon jälkeen ensimmäisessä alikehyksessä (5 ms) kerrotaan toisen koodauslohkon 1.4.2 herätevahvistus skaalausvektorin ensimmäisellä elementillä. Toi-20 sessa alikehyksessä (5 ms) toisen koodauslohkon 1.4.2 herätevahvis- ;tus kerrotaan skaalausvektorin toisella elementillä jne.
• · · ··· · M · • · · : \ Kun ylätaajuuden kaistaa skaalataan ylös toisessa koodauslohkossa 1.4.2, toisen koodauslohkon 1.4.2 herätevahvistus kerrotaan myös yh-! 25 dellä arvoista, joissa indeksi osoittaa skaalausvektoria. Indeksiarvo on ...T 5 ms koodattujen alikehysten määrä, mutta indeksiosoitin on päin- vastainen. Tästä syystä tilanvaihdon jälkeen ensimmäisessä alikehyksessä (5 ms) kerrotaan toisen koodauslohkon 1.4.2 herätevahvistus • skaalausvektorin viimeisellä elementillä. Toisessa alikehyksessä (5 ms) .···. 30 toisen koodauslohkon 1.4.2 herätevahvistus kerrotaan skaalausvekto- • · rin toiseksi viimeisellä elementillä jne.
* » t • · ® • · ···
Ylätaajuuden kaistaa alasskaalattaessa (esim. vaihdettaessa AMR-WB+-tilasta AMR-WB -tilaan) toisen koodauslohkon 1.4.2 viimeisiä 35 koodattuja puheparametreja (LPC-parametreja, herätettä ja heräte- • * vahvistusta) käytetään ylätaajuuden kaistan tuottamiseen ensimmäis- 119533 17 ten 320 ms:n aikana, kun käytetään toimintatilaa, jossa ei ole mukana toista koodauslohkoa 1.4.2.
Esimerkkipseudokoodi voi olla seuraavanlainen: 5
ExcGain2 = ExcGain2 * gain_hf_ramp(ind)
Excjhf(1:n) - ExcGain2 * Exc_lf(1:n)
Outputjhf = synth(LPC_hf, excjhf, mem), 10 jossa
ExcGain2 = Herätevahvistus_toisessa_koodauslohkossa gain_hf_ramp = Skaalausvektori
Excjf - Ensimmäisestä koodauslohkosta saatava heräte- vektori (kaistanleveys 0-6,4 kHz) 15 Excjhf = Toisesta koodauslohkosta saatava herätevektori (kaistanleveys 6,4-8,0 kHz)
Outputjhf = Ylätaajuuskaistan syntetisoitu signaali
Synth = Funktio, joka muodostaa syntetisoidun signaalin LPC = LP-suodatinkertoimet 20 Mem = LP-suodattimen muisti • · « φ * ;;v Tämän menetelmän jonkin verran muunnettu versio olisi muuntaa ylä- : ·' taajuuden äänikaistan synteesiin käytetyt LPC-parametrit vaihdon jäl- : keen siten, että LPC-suodattimen taajuusvaste pakotetaan vähitellen : 25 tasaisemmalle spektrille. Tämä voidaan toteuttaa esim. laskemalla pai- notettu keskiarvo todella vastaanotetusta LPC-suodattimesta ja LPC-suodattimesta, joka saa aikaan tasaisen spektrin ISP-tasolla. Tällä lähestymistavalla voidaan saada parempi äänen laatu tapauksissa, : joissa viimeinen kehys, jossa oli yläkaistan laajennusparametrejä, sat- 30 tui sisältämään selvän spektrihuipun (selviä spektrihuippuja).
·· φ • · : Ylös/alasskaalaus voidaan myös tehdä mukautuvasti audiosignaalin ··· ominaisuuksien perusteella, jotka taas perustuvat esim. LPC-para-: metreihin tai muihin parametreihin. Lineaarisen skaalausvektorin sijaan 35 skaalausvektori voi olla myös epälineaarinen. Ylös- ja alasskaalausta • · varten voi myös olla olemassa erilaiset skaalausvektorit.
119533 18
Seuraavassa nyt esillä olevan keksinnön suoritusesimerkin mukaista dekoodauslaitetta 3 selostetaan yksityiskohtaisemmin viittaamalla kuvaan 3. Koodattu audiosignaali vastaanotetaan lähetyskanavasta 2. Demultiplekseri 3.1 purkaa alataajuuden äänikaistaan kuuluvan para-5 metritiedon ensimmäiseksi bittivirraksi ja ylätaajuuden äänikaistaan kuuluvan parametritiedon toiseksi bittivirraksi. Tämän jälkeen bittivirrat tarvittaessa kanavadekoodataan ja dekvantisoidaan kanavadekoo-daus- ja dekvantisointilohkossa 3.2.
10 Ensimmäinen kanavadekoodattu bittivirta sisältää ensimmäisen koo-dauslohkon 1.4.1 tuottamat LPC-parametrit ja heräteparametrit, ja kun laajakaistatilaa on käytetty, toinen kanavadekoodattu bittivirta sisältää toisen koodauslohkon 1.4.2 tuottaman joukon LPC-vahvistusparamet-reja ja muita parametreja (LPC-suodattimen ominaisuuksia kuvaavia 15 parametreja).
Ensimmäinen bittivirta syötetään ensimmäiseen dekoodauslohkoon 3.3, joka suorittaa LPC-suodatuksen (alakaistan LPC-synteesisuoda- tuksen) vastaanottamiensa LPC-vahvistusparametrien ja muiden pa- 20 rametrien mukaisesti muodostaakseen syntetisoidun alataajuus- : ,·, äänikaistasignaalin. Suodattimen 3.3.1 jälkeen on ensimmäinen ylös- näytteistäjä 3.3.2 dekoodatun ja suodatetun signaalin näytteistämiseksi ** \ alkuperäiseen näytteistystaajuuteen.
# • · : 25 Toinen bittivirta, kun se on olemassa bittivirrassa, syötetään toiseen dekoodauslohkoon 3.4, jossa suoritetaan LPC-suodatus (yläkaistan : LPC-synteesisuodatus) vastaanotettujen LPC-vahvistusparametrien ja muiden parametrien mukaisesti syntetisoidun ylätaajuusäänikaista- : signaalin muodostamiseksi. Ensimmäisen bittivirran heräteparametrit ··· · .***. 30 kerrotaan LPC-vahvistusparametrijoukolla kertojassa 3.4.1. Kerrotut /.* heräteparametrit syötetään suodattimeen 3.4.2, johon myös muut toi- sen bittivirran LPC-parametrit syötetään. Suodatin 3.4.2 rekonstruoi ylätaajuusäänikaistasignaalin suodattimeen 3.4.2 syötettyjen paramet-:**.· rien perusteella. Suodattimen 3.4.2 jälkeen on toinen ylösnäytteistäjä 35 3.4.3 dekoodatun ja suodatetun signaalin näytteistämiseksi alkuperäi seen näytteistystaajuuteen.
119533 19
Ensimmäisen ylösnäytteistäjän 3.3.2 lähtö on kytketty synteesisuodatinpankin 3.5 ensimmäiseen suodattimeen 3.5.1. Vastaavasti toisen ylösnäytteistäjän 3.4.3 lähtö on kytketty synteesisuodatinpankin 3.5 toiseen suodattimeen 3.5.2. Ensimmäisen 5 3.5.1 ja toisen suodattimen 3.5.2 lähdöt on kytketty synteesisuodatin pankin 3.5 lähdöksi, missä lähtösignaali on rekonstruoitu audiosignaali, joko laajakaistainen tai kapeakaistainen riippuen audiosignaalin koodauksessa käytetystä tilasta.
10 On selvää, ettei koodattua audiosignaalia välttämättä vastaanoteta tiedonsiirtokanavasta 2 kuten kuvassa 1, vaan se voi olla myös koodattu bittivirta, joka on aikaisemmin tallennettu muistivälineeseen.
Kuten edellä on kuvattu, nyt esillä oleva keksintö tarjoaa menetelmän 15 yläkaistanlaajennuksen kytkemiseksi pois päältä vähitellen vaihdettaessa yläkaistanlaajennuskoodausta käyttävästä koodaustilasta vain ydinkaistakoodausta käyttävään koodaustilaan. Yläkaistalisän amplitudin vaihtaminen vaiheittain maksimiarvosta nollaan suhteellisen lyhyessä ajassa, esimerkiksi muutamassa sadassa millisekunnissa, 20 tekee äänikaistanleveyden vaihdosta pehmeämmän ja kuulijalle vä-:... hemmän ilmeisen ja saa aikaan paremman äänenlaadun. Samoin kun suoritetaan vaihto vain ydinkaistaa käyttävästä tilasta : ·; yläkaistanlaajennuskoodausta käyttävään tilaan, yläkaistan kontribuu tiota ei oteta käyttöön heti maksimiarvolla, vaan sen suuruus skaala-: 25 taan nollasta maksimiarvoon pienin askelin suhteellisen lyhyessä aika- ikkunassa, jotta saadaan aikaan pehmeä vaihto ja parempi äänenlaatu.
• •t • · • · ···
Vaikka keksintöä käytetään lähinnä 16 kHz:n näytteistetylle audio- : signaalille, kuvien 4a-5c vaihtoesimerkeissä käytettiin 24 kHz:n näyt- !···! 30 teistettyä audiosignaalia. Siksi AMR-WB+ toimii 24 kHz:n näytteistetyllä *·] audiosignaalilla. 12 kHz:n äänikaista jaetaan 0-6,4 ja 6,4-12 kHz:n :»v kaistoihin. Kriittistä alinäytteistystä hyödynnetään suodatinpankin jäi- ·*· keen. Toisin sanoen matalampi kaista alinäytteistetään 12,8 kHz:iin ja ylempi kaista uudelleennäytteistetään 11,2 kHz:iin (=2 x (12 - 6,4)).
• ·
Kuva 4a esittää tapausta, jossa suoritetaan tunnetun tekniikan tason mukainen vaihto kapeasta kaistasta laajakaistaan ja kuva 4b vastaa- 35 119533 20 vasti esittää tapausta, jossa vaihto suoritetaan nyt esillä olevan keksinnön mukaisesti. Kuva 4c esittää koodatun yläkaistan signaalin kokonaisenergiaa tunnetussa tekniikan tasossa ja nyt esillä olevan keksinnön mukaisessa vaihdossa.
5
Kuva 5a esittää tapausta, jossa suoritetaan tunnetun tekniikan tason mukainen vaihto laajakaistasta kapeaan kaistaan, ja kuva 5b esittää vastaavasti tapausta, jossa vaihto suoritetaan nyt esillä olevan keksinnön mukaisesti. Kuva 5c esittää koodatun yläkaistan signaalin 10 kokonaisenergiaa tunnetun tekniikan tason tapauksessa ja nyt esillä olevan keksinnön mukaisessa vaihdossa.
Kuva 6 esittää esimerkkiä keksinnön mukaisesta järjestelmästä, jossa voidaan soveltaa jaetun kaistan koodaus- ja dekoodausprosessia. 15 Järjestelmä käsittää yhden tai useamman audiolähteen 601, joka tuottaa puhe- ja/tai ei-puhe-audiosignaaleja. Tarvittaessa audiosignaalit muutetaan digitaalisiksi signaaleiksi A/D-muuntimella 602. Digitalisoidut signaalit syötetään lähetinlaitteen 600 kooderiin 603, jossa koodaus suoritetaan nyt esillä olevan keksinnön mukaisesti. Koodatut signaalit 20 myös kvantisoidaan ja koodataan tarvittaessa lähetystä varten koode- . . rissa 603. Lähetin 604, esimerkiksi matkaviestimen 600 lähetin, lähet- · · |:V tää pakatut ja koodatut signaalit viestintäverkkoon 605. Vastaanotto- • laitteen 606 vastaanotin 607 ottaa signaalit vastaan viestintäverkosta 605. Vastaanotetut signaalit siirretään vastaanottimesta 607 dekooderi I 25 riin 608 tietojen dekoodausta, dekvantisointia ja purkamista varten. De- kooderi 608 suorittaa vastaanotetun bittivirran purkamisen syntetisoi-tujen audiosignaalien muodostamiseksi. Syntetisoidut audiosignaalit voidaan sitten muuttaa ääneksi esimerkiksi kaiuttimessa 609.
• φ • · φ • · !-·! 30 Nyt käsillä olevaa keksintöä voidaan soveltaa erilaisissa järjestelmissä, • · erityisesti matalataajuuksisessa lähettämisessä, tehokkaamman pak-\v kaamisen saavuttamiseksi kuin tekniikan tason mukaisissa järjestelee missä. Nyt käsillä olevan keksinnön mukaista kooderia 1 voidaan so- .·!: veltaa tietoliikennejärjestelmien eri osissa. Kooderi 1 voidaan toteuttaa 35 esimerkiksi matkaviestimessä, jonka signaalinprosessointikyky voi olla rajallinen.
119533 21
Keksintö voidaan toteuttaa ainakin osittain tietokoneohjelmatuotteena, joka käsittää koneellisesti suoritettavia vaiheita ainakin joidenkin keksinnön mukaisen menetelmän osien suorittamiseksi. Koodauslaite 1 ja dekoodauslaite 3 käsittävät ohjauslohkon, esimerkiksi digitaalisen sig-5 naaliprosessorin ja/tai mikroprosessorin, jossa tietokoneohjelmaa voidaan hyödyntää.
On selvää, että nyt esillä oleva keksintö ei rajoitu pelkästään edellä kuvailtuihin suoritusmuotoihin, vaan sitä voidaan muunnella oheisten pa-10 tenttivaatimusten puitteissa.
• · • · · • · · • · · · φ · · • · · • m • · • · Φ · * · · • · · • · · m m « · · • · · · Φ · · • Φ • · Φ · · • · • · · * Φ · * · Φ · • •t * · • m « · · • · • · · Φ · · Φ · Φ Φ · f · Φ m Φ · · • # · • # · Φ · Φ Φ · Φ ·

Claims (30)

119533
1. Kooderi(1), joka käsittää tulon (1.2) taajuuskaistalla olevan audiosignaalia sisältävien kehysten syöttämiseksi, suodattimen (1.3) taa- 5 juuskaistan jakamiseksi ainakin alataajuuskaistaksi ja ylätaajuus-kaistaksi, ensimmäisen koodauslohkon (1.4.1) alataajuuskaistan audiosignaalien koodaamiseksi, toisen koodauslohkon (1.4.2) ylätaajuus-kaistan audiosignaalien koodaamiseksi ja tilanvalitsimen kooderin toimintatilan valitsemiseksi ainakin ensimmäisen tilan ja toisen tilan 10 joukosta, jossa ensimmäisessä tilassa koodataan ainoastaan ala-kaistalla olevia signaaleja ja jossa toisessa tilassa koodataan sekä ala-että ylätaajuuskaistalla olevat signaaleja, tunnettu siitä, että koode-ri(1) käsittää lisäksi skaalaajan, jolla ohjataan toista koodauslohkoa (1.4.2) vaihtamaan toisen koodauslohkon (1.4.2) koodausominaisuuk-15 siä vähitellen kooderin toimintatilaa vaihdettaessa.
2. Patenttivaatimuksen 1 mukainen kooderi(1), tunnettu siitä, että mainittuihin koodausominaisuuksiin kuuluu vahvistusparametri, jolloin mainittu skaalaaja käsittää laskentaelementin, jolla muutetaan 20 vahvistusparametria vähitellen kooderin toimintatilan vaihdon yhteydessä.
• · · 3. Patenttivaatimuksen 2 mukainen kooderi (1), tunnettu siitä, että ·· · ' ' : heräte on järjestetty määriteltäväksi mainitussa ensimmäisessä koo- 25 dauslohkossa (1.4.1) ja herätettä koskeva tieto on järjestetty lähetettä-väksi mainittuun toiseen koodauslohkoon (1.4.2) mainitun ylätaajuus-·:· kaistan signaalien koodaamista varten, ja että mainittu toinen koo- dauslohko (1.4.2) käsittää välineet vahvistusparametrin liittämiseksi ·«· mainitun ylätaajuuskaistan signaalien koodaukseen, jolloin mainittu 30 laskentaväline on järjestetty vähitellen vaihtamaan vahvistusparametria • ♦ * mainitun toisen koodauslohkon (1.4.2) käyttöön. ♦ ♦ «··
4. Patenttivaatimuksen 1, 2 tai 3 mukainen kooderi (1), tunnettu siitä, että aikaparametri (T) on määritelty osoittamaan, kuinka pitkän ajan 35 tilanvaihto kestää. • · »« · • · · • · • · 119533
5. Patenttivaatimuksen 4 mukainen kooderi(1), tunnettu siitä, että mainitulle aikaparametrille (T) määritelty arvo on 320 ms.
6. Patenttivaatimuksen 4 tai 5 mukainen kooderi (1), tunnettu siitä, 5 että askelarvo (S) on määritelty osoittamaan, kuinka suuria askeleita koodausominaisuuksien vähittäisessä vaihtamisessa käytetään.
7. Patenttivaatimuksen 6 mukainen kooderi (1), tunnettu siitä, että mainittu askelarvo (S) on määritelty osoittamaan, että koodausominai- 10 suuksien vaihtaminen suoritetaan vähitellen 64 askeleessa.
8. Patenttivaatimuksen 6 mukainen kooderi (1), tunnettu siitä, että määritellään vektori, joka sisältää skaalauskertoimen jokaisen koodausominaisuuksien vaihtamisaskelen vahvistukselle. 15
9. Jonkin patenttivaatmuksen 1-8 mukainen kooderi (1), tunnettu siitä, että se käsittää näytteistäjän (1.2) audiosignaalin näytteistämiseksi ja näytteistetyn audiosignaalin kehysten muodostamiseksi.
10. Patenttivaatimuksen 4 mukainen kooderi (1), tunnettu siitä, että mainittu aikaparametri (T) on määritelty osoittamaan, kuinka monta ke- . . hystä toimintatilan vaihto kestää. • · · • · · • M · f · I
: *.*' 11. Jonkin patenttivaatimuksen 1-10 mukainen kooderi (1), tunnettu '"*** 25 siitä, että se on AMR-WB-kooderi. • « • tl
• · · «·· » ·:· 12. Patenttivaatimuksen 11 mukainen kooderi (1), tunnettu siitä, että :***: vähitellen vaihdettuihin koodauslohkon (1.4.2) koodausominaisuuksiin * · · kuuluvat heräte-, LPC- ja vahvistusparametrit. 30 • * .M.
13. Laite (600), joka käsittää kooderin (1), joka käsittää tulon (1.2) .*’* taajuuskaistalla olevan audiosignaalin kehysten syöttämiseksi, ana- lyysisuodattimen (1.3) taajuuskaistan jakamiseksi ainakin alataajuus-ί]]*: kaistaksi ja ylätaajuuskaistaksi, ensimmäisen koodauslohkon (1.4.1) 35 alataajuuskaistan audiosignaalien koodaamiseksi, toisen koodausloh- • I :Vt kon (1.4.2) ylätaajuuskaistan audiosignaalien koodaamiseksi ja tilan- : ·* valitsimen kooderin tilan valitsemiseksi ainakin ensimmäisen tilan ja 119533 toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan ainoastaan alakaistalla olevia signaaleja ja jossa toisessa tilassa koodataan sekä ala- että ylätaajuuskaistalla olevia signaaleja, tunnettu siitä, että kooderi (1) käsittää lisäksi skaalaajan, jolla ohjataan toista koodaus-5 lohkoa (1.4.2) vaihtamaan toisen koodauslohkon (1.4.2) koodausomi-naisuuksia vähitellen kooderin toimintatilaa vaihdettaessa.
14. Patenttivaatimuksen 13 mukainen laite (600), tunnettu siitä, että mainittuihin koodausominaisuuksiin kuuluu vahvistusparametri, jolloin 10 mainittu skaalaaja käsittää laskentaelementin, jolla vaihdetaan vahvistusparametria vähitellen kooderin toimintatilan vaihtamisen yhteydessä.
15. Järjestelmä, joka käsittää kooderin (1), joka käsittää tulon (1.2) 15 taajuuskaistalla olevan audiosignaalin kehysten syöttämiseksi, suodattimen (1.3) taajuuskaistan jakamiseksi ainakin alataajuuskaistaksi ja ylätaajuuskaistaksi, ensimmäisen koodauslohkon (1.4.1) alataajuus-kaistan audiosignaalien koodaamiseksi, toisen koodauslohkon (1.4.2) ylätaajuuskaistan audiosignaalien koodaamiseksi ja tilanvalitsimen 20 kooderin toimintatilan valitsemiseksi ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan ainoastaan . , alakaistalla olevia signaaleja ja jossa toisessa tilassa koodataan sekä · · : ala- että ylätaajuuskaistalla olevia signaaleja, tunnettu siitä, että jär- : .· jestelmä käsittää lisäksi skaalaajan, jolla ohjataan toista koodausloh- 25 koa (1.4.2) vaihtamaan toisen koodauslohkon (1.4.2) koodausominai-suuksia vähitellen kooderin toimintatilaa vaihdettaessa. • · · ·*··
16. Patenttivaatimuksen 15 mukainen järjestelmä, tunnettu siitä, että • φ · mainittuihin koodausominaisuuksiin kuuluu vahvistusparametri, jolloin ;y. 30 mainittu skaalaaja käsittää laskentaelementin, jolla vaihdetaan .·*··*. vahvistusparametria vähitellen kooderin toimintatilan vaihtamisen yh- *:*] teydessä. • ·
17. Menetelmä taajuuskaistalla olevien audiosignaalien pakkaamiseksi, 35 jolloin taajuuskaista on jaettu ainakin alataajuuskaistaksi ja ylätaajuus- kaistaksi, alataajuuskaistan audiosignaalit koodaa ensimmäinen koo-' ** dauslohko (1.4.1), ylätaajuuskaistan audiosignaalit koodaa toinen koo- 119533 dauslohko (1.4.2), ja koodausta varten valitaan tila ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan signaaleja ja jossa toisessa tilassa koodataan sekä ala- että ylätaajuuskaistan signaaleja, tunnettu siitä, että 5 toisen koodauslohkon (1.4.2) koodausominaisuuksia vaihdetaan vähitellen toimintatilan vaihtamisen yhteydessä.
18. Patenttivaatimuksen 17 mukainen menetelmä, tunnettu siitä, että mainittuihin koodausominaisuuksiin kuuluu vahvistusparametri, jolloin 10 vahvistusparametria vaihdetaan vähitellen toimintatilan vaihtamisen yhteydessä.
19. Patenttivaatimuksen 18 mukainen menetelmä, tunnettu siitä, että mainittu vahvistusparametri määritellään mainitussa ensimmäisessä 15 koodauslohkossa (1.4.1) mainitulla alemmalla taajuuskaistalla olevien signaalien koodauksen ohjaamiseksi, mainittu vahvistusparametri johdetaan toiseen koodauslohkoon (1.4.2), jolloin vahvistusparametriä vaihdetaan vähitellen käytettäväksi mainitussa toisessa koodauslohkossa (1.4.2). 20
20. Patenttivaatimuksen 17, 18 tai 19 mukainen menetelmä, tunnettu . . siitä, että määritellään aikaparametri (T) osoittamaan, kuinka pitkän • · · "!e: ajan tilan vaihtaminen kestää. • * · • a • a •
21. Patenttivaatimuksen 20 mukainen menetelmä, tunnettu siitä, että määritellään askelarvo (S) osoittamaan, kuinka suuria askeleita *:· koodausominaisuuksien vähittäisessä vaihtamisessa käytetään. ··* • a a a W#a
22. Jonkin patenttivaatimuksen 17-21 mukainen menetelmä, tunnettu 30 siitä, että audiosignaali näytteistetään ja näytteistetystä audiosignaa- .···. lista muodostetaan kehyksiä. • a a#a * a
23. Patenttivaatimuksen 22 mukainen menetelmä, tunnettu siitä, että C!: määritellään aikaparametri (T) osoittamaan, kuinka monta kehystä tilan 35 vaihtaminen kestää. • a aa a a a a a a a a 119533
24. Jonkin patenttivaatimuksen 17-23 mukainen menetelmä, tunnettu siitä, että koodauksessa käytetään LPC-herätettä, jolloin tuotetaan joukko LPC-parametreja, jolloin ainakin yksi LPC-parametreista vaihdetaan vähitellen. 5
25. Moduuli taajuuskaistalla olevien audiosignaalien koodaamiseksi, joka taajuuskaista jaetaan ainakin alataajuuskaistaksi ja ylätaajuus-kaistaksi, joka moduuli käsittää ensimmäisen koodauslohkon (1.4.1) alataajuuskaistan audiosignaalien koodaamiseksi, toisen koodausloh- 10 kon (1.4.2) ylätaajuuskaistan audiosignaalien koodaamiseksi ja tilan-valitsimen moduulin toimintatilan valitsemiseksi ainakin ensimmäisen tilan ja toisen tilan joukosta, jossa ensimmäisessä tilassa koodataan ainoastaan alakaistalla olevia signaaleja ja jossa toisessa tilassa koodataan sekä ala- että ylätaajuuskaistalla olevia signaaleja, tunnettu 15 siitä, että moduuli käsittää lisäksi skaalaajan, jolla ohjataan toista koo-dauslohkoa (1.4.2) vaihtamaan toisen koodauslohkon (1.4.2) koo-dausominaisuuksia vähitellen kooderin toimintatilaa vaihdettaessa.
26. Patenttivaatimuksen 25 mukainen järjestelmä, tunnettu siitä, että 20 mainittuihin koodausominaisuuksiin kuuluu vahvistusparametri, ja mainittu skaalaaja käsittää laskentaelementin, jolla vaihdetaan vahvistus- . . parametria vähitellen kooderin toimintatilan vaihtamisen yhteydessä. • · · • # · • M · *t m •! V
27. Tietokoneohjelmatuote, joka käsittää koneellisesti suoritettavia vai- 25 heitä taajuuskaistalla olevien audiosignaalien pakkaamiseksi, joka taajuuskaista on jaettu ainakin alataajuuskaistaksi ja ylätaajuus- tt;:· kaistaksi, alataajuuskaistan audiosignaalien koodaamiseksi ensimmäi- :***: sessä koodauslohkossa (1.4.1), ylätaajuuskaistan audiosignaalin koo- *· · daamiseksi toisessa koodauslohkossa (1.4.2), ja tilan valitsemiseksi 30 koodausta varten ainakin ensimmäisen tilan ja toisen tilan joukosta, • i · .···, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan sig- *.** naaleja ja jossa toisessa toimintatavassa koodataan sekä ala- että *;"! ylätaajuuskaistan signaaleja, tunnettu siitä, että tietokoneohjelmatuote käsittää lisäksi koneellisesti suoritettavia vaiheita mainitun toisen 35 koodauslohkon (1.4.2) koodausominaisuuksien vaihtamiseksi vähitel-Ien toimintatilan vaihtamisen yhteydessä. • · • · 119533
28. Patenttivaatimuksen 27 mukainen tietokoneohjelmatuote, tunnettu siitä, että mainittuihin koodausominaisuuksiin kuuluu vahvistuspara-metri, ja mainittu tietokoneohjelmatuote käsittää koneellisesti suoritettavia vaiheita vahvistusparametrin vaihtamiseksi vähitellen kooderin 5 toimintatilan vaihtamisen yhteydessä.
29. Signaali, joka käsittää bittivirran, jossa on parametreja dekooderia varten mainitun bittivirran purkamiseksi, joka bittivirta on koodattu taajuuskaistalla olevan audiosignaalin kehyksistä, joka taajuuskaista on 10 jaettu ainakin alataajuuskaistaksi ja ylätaajuuskaistaksi, ja signaalille on määritelty ainakin ensimmäinen tila ja toinen tila, jossa ensimmäisessä tilassa koodataan vain alataajuuskaistan signaaleja ja jossa toisessa toimintatilassa koodataan sekä ala- että ylätaajuuskaistan signaaleja, tunnettu siitä, että tilan vaihtamisessa ensimmäisen tilan ja 15 toisen tilan välillä vaihdetaan vähitellen ainakin yhtä mainittuun ylätaa-juuskaistaan liittyvän signaalin parametria.
30. Patenttivaatimuksen 29 mukainen signaali, tunnettu siitä, että mainittuihin koodausominaisuuksiin kuuluu vahvistusparametri, jolloin 20 mainittu signaali käsittää mainitun parametrin, jota vaihdetaan vähitellen kooderin toimintatavan vaihtamisen yhteydessä. • · • I t • « · «·· · ·· I • · · · * · * 1 • · • « · • · · «»· · * • » · *··· ·»· • · • · ··· • · • · · • f « • « • •t • t • · ·2 • · *»· • · • · *·1 · 2 M · • · · • · • · 119533
FI20045135A 2004-04-15 2004-04-15 Audiosignaalien koodaus FI119533B (fi)

Priority Applications (14)

Application Number Priority Date Filing Date Title
FI20045135A FI119533B (fi) 2004-04-15 2004-04-15 Audiosignaalien koodaus
RU2006139790/09A RU2383943C2 (ru) 2004-04-15 2005-04-14 Кодирование звуковых сигналов
MXPA06010825A MXPA06010825A (es) 2004-04-15 2005-04-14 Codificacion de senales de audio.
BRPI0509963-3A BRPI0509963A (pt) 2004-04-15 2005-04-14 módulo para processar um fluxo de bit incluindo parámetros para decodificador o fluxo de bit, dispositivo e codec compreendendo o módulo, método para processar os sinais de áudio em uma banda de freqüência, produto de programa de computador, e, sinal compreendendo um fluxo de bit
PCT/FI2005/050121 WO2005101372A1 (en) 2004-04-15 2005-04-14 Coding of audio signals
CN2005800114923A CN1942928B (zh) 2004-04-15 2005-04-14 用于处理音频信号的模块和方法
JP2007507809A JP4838235B2 (ja) 2004-04-15 2005-04-14 音声信号の符号化
KR1020067022237A KR100859881B1 (ko) 2004-04-15 2005-04-14 음성 신호 코딩
CA2562916A CA2562916C (en) 2004-04-15 2005-04-14 Coding of audio signals
AU2005234181A AU2005234181B2 (en) 2004-04-15 2005-04-14 Coding of audio signals
EP05735286A EP1735776A4 (en) 2004-04-15 2005-04-14 AUDIO SIGNAL CODING
US11/107,334 US20050246164A1 (en) 2004-04-15 2005-04-15 Coding of audio signals
ZA2006/07661A ZA200607661B (en) 2004-04-15 2006-09-13 Coding of audio signals
HK07110120.5A HK1102036A1 (en) 2004-04-15 2007-09-17 A module and a method for processing audio signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20045135 2004-04-15
FI20045135A FI119533B (fi) 2004-04-15 2004-04-15 Audiosignaalien koodaus

Publications (3)

Publication Number Publication Date
FI20045135A0 FI20045135A0 (fi) 2004-04-15
FI20045135A FI20045135A (fi) 2005-10-16
FI119533B true FI119533B (fi) 2008-12-15

Family

ID=32104263

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20045135A FI119533B (fi) 2004-04-15 2004-04-15 Audiosignaalien koodaus

Country Status (14)

Country Link
US (1) US20050246164A1 (fi)
EP (1) EP1735776A4 (fi)
JP (1) JP4838235B2 (fi)
KR (1) KR100859881B1 (fi)
CN (1) CN1942928B (fi)
AU (1) AU2005234181B2 (fi)
BR (1) BRPI0509963A (fi)
CA (1) CA2562916C (fi)
FI (1) FI119533B (fi)
HK (1) HK1102036A1 (fi)
MX (1) MXPA06010825A (fi)
RU (1) RU2383943C2 (fi)
WO (1) WO2005101372A1 (fi)
ZA (1) ZA200607661B (fi)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1872364B1 (en) * 2005-03-30 2010-11-24 Nokia Corporation Source coding and/or decoding
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
EP2009623A1 (en) * 2007-06-27 2008-12-31 Nokia Siemens Networks Oy Speech coding
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
JP4935329B2 (ja) * 2006-12-01 2012-05-23 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR101290622B1 (ko) 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
CN101868821B (zh) 2007-11-21 2015-09-23 Lg电子株式会社 用于处理信号的方法和装置
KR20100086000A (ko) * 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN101499278B (zh) * 2008-02-01 2011-12-28 华为技术有限公司 音频信号切换处理方法和装置
CN101609679B (zh) * 2008-06-20 2012-10-17 华为技术有限公司 嵌入式编解码方法和装置
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
AU2009267525B2 (en) 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
GB2473267A (en) * 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
GB2476041B (en) * 2009-12-08 2017-03-01 Skype Encoding and decoding speech signals
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
CN101964189B (zh) * 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
EP2590164B1 (en) * 2010-07-01 2016-12-21 LG Electronics Inc. Audio signal processing
EP3079154B1 (en) 2010-07-02 2018-06-06 Dolby International AB Audio decoding with selective post filtering
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN103493131B (zh) 2010-12-29 2016-11-16 三星电子株式会社 用于针对高频带宽扩展进行编码/解码的设备和方法
ES2812123T3 (es) 2011-06-09 2021-03-16 Panasonic Ip Corp America Terminal de comunicación y procedimiento de comunicación
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
EP3611728A1 (en) * 2012-03-21 2020-02-19 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
BR112015018021B1 (pt) * 2013-01-29 2022-10-11 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V Aparelho e método para selecionar um dentre um primeiro algoritmo de codificação e um segundo algoritmo de codificação
KR101766802B1 (ko) 2013-01-29 2017-08-09 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 코딩 모드 스위칭 보상을 위한 개념
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
KR101940464B1 (ko) * 2013-10-18 2019-01-18 텔레폰악티에볼라겟엘엠에릭슨(펍) 스펙트럼의 피크 위치의 코딩 및 디코딩
EP3182412B1 (en) * 2014-08-15 2023-06-07 Samsung Electronics Co., Ltd. Sound quality improving method and device, sound decoding method and device, and multimedia device employing same
KR20210003507A (ko) * 2019-07-02 2021-01-12 한국전자통신연구원 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08166800A (ja) * 1994-12-13 1996-06-25 Hitachi Ltd 複数種類の符号化方法を備える音声符号器および復号器
DE19804581C2 (de) * 1998-02-05 2000-08-17 Siemens Ag Verfahren und Funk-Kommunikationssystem zur Übertragung von Sprachinformation
FI113571B (fi) * 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3344962B2 (ja) * 1998-03-11 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置、及びオーディオ信号復号化装置
JP3307875B2 (ja) * 1998-03-16 2002-07-24 松下電送システム株式会社 符号化音声再生装置および符号化音声再生方法
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
JP2000322096A (ja) * 1999-05-13 2000-11-24 Mitsubishi Electric Corp 音声伝送装置
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
GB2357682B (en) * 1999-12-23 2004-09-08 Motorola Ltd Audio circuit and method for wideband to narrowband transition in a communication device
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US20020163908A1 (en) * 2001-05-07 2002-11-07 Ari Lakaniemi Apparatus, and associated method, for synchronizing operation of codecs operable pursuant to a communicaton session
ATE320651T1 (de) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv Kodieren eines audiosignals
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
KR100587517B1 (ko) * 2001-11-14 2006-06-08 마쯔시다덴기산교 가부시키가이샤 오디오 부호화 및 복호화
FI20021936A (fi) * 2002-10-31 2004-05-01 Nokia Corp Vaihtuvanopeuksinen puhekoodekki
US20040243404A1 (en) * 2003-05-30 2004-12-02 Juergen Cezanne Method and apparatus for improving voice quality of encoded speech signals in a network
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7542899B2 (en) * 2003-09-30 2009-06-02 Alcatel-Lucent Usa Inc. Method and apparatus for adjusting the level of a speech signal in its encoded format

Also Published As

Publication number Publication date
MXPA06010825A (es) 2006-12-15
CA2562916A1 (en) 2005-10-27
RU2383943C2 (ru) 2010-03-10
JP2007532963A (ja) 2007-11-15
EP1735776A4 (en) 2007-11-07
BRPI0509963A (pt) 2007-09-25
US20050246164A1 (en) 2005-11-03
FI20045135A0 (fi) 2004-04-15
AU2005234181B2 (en) 2011-06-23
CA2562916C (en) 2012-10-02
JP4838235B2 (ja) 2011-12-14
FI20045135A (fi) 2005-10-16
HK1102036A1 (en) 2007-11-02
CN1942928A (zh) 2007-04-04
CN1942928B (zh) 2011-05-18
KR100859881B1 (ko) 2008-09-24
ZA200607661B (en) 2010-11-24
RU2006139790A (ru) 2008-05-20
WO2005101372A1 (en) 2005-10-27
EP1735776A1 (en) 2006-12-27
KR20070002068A (ko) 2007-01-04
AU2005234181A1 (en) 2005-10-27

Similar Documents

Publication Publication Date Title
FI119533B (fi) Audiosignaalien koodaus
US8019599B2 (en) Speech codecs
JP2007532963A5 (fi)
US6615169B1 (en) High frequency enhancement layer coding in wideband speech codec
JP4870313B2 (ja) 可変レート音声符号器におけるフレーム消去補償方法
CN110827842B (zh) 高频带激励信号生成
EP3338282B1 (en) High-band target signal control
KR101797033B1 (ko) 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
KR100798668B1 (ko) 무성 음성의 코딩 방법 및 장치
JP6980871B2 (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
JP2003532149A (ja) 音声発話を予測的に量子化するための方法および装置
WO2008104463A1 (en) Split-band encoding and decoding of an audio signal
WO2006021849A1 (en) Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (aac) system
EP2202726B1 (en) Method and apparatus for judging dtx
CN105745703B (zh) 信号编码方法和装置以及信号解码方法和装置
WO2004015689A1 (en) Bandwidth-adaptive quantization
JP2003501675A (ja) 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置
MXPA03007229A (es) Metodo y aparato para reducir la generacion indeseada de paquetes.
CN106133832B (zh) 在装置处切换译码技术的设备及方法
US7584096B2 (en) Method and apparatus for encoding speech
Choudhary et al. Study and performance of amr codecs for gsm
Bhatt Implementation and Overall Performance Evaluation of CELP based GSM AMR NB coder over ABE
KR101798084B1 (ko) 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
KR101770301B1 (ko) 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 119533

Country of ref document: FI

MM Patent lapsed