FI120327B - Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi - Google Patents
Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi Download PDFInfo
- Publication number
- FI120327B FI120327B FI961445A FI961445A FI120327B FI 120327 B FI120327 B FI 120327B FI 961445 A FI961445 A FI 961445A FI 961445 A FI961445 A FI 961445A FI 120327 B FI120327 B FI 120327B
- Authority
- FI
- Finland
- Prior art keywords
- rate
- speech
- frame
- coding
- speech samples
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000005259 measurement Methods 0.000 claims description 37
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 description 15
- 101150049692 THR4 gene Proteins 0.000 description 11
- 230000009467 reduction Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 4
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000005923 long-lasting effect Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 241000975394 Evechinus chloroticus Species 0.000 description 1
- 206010019133 Hangover Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
MENETELMÄ JA LAITE ALENNETUN NOPEUDEN MUUTTUVANOPEUK-SISEN VOKOODAUKSEN SUORITTAMISEKSI
Esillä olevan keksinnön kohteena on tietoliikennejärjestelmät. Erityisesti esillä oleva keksintö 5 liittyy uuteen ja kehittyneeseen menetelmään ja laitteeseen muuttuvanopeuksisen lineaarisen ennustavan koodipainotteisen koodauksen suorittamiseksi.
Äänen lähettäminen digitaalisilla menetelmillä on levinnyt laajalle, erityisesti kaukoetäisyyksil-10 lä ja radiopuhelinsovelluksissa. Tämä vuorostaan on lisännyt mielenkiintoa määrittää pienin informaatiomäärä, joka voidaan lähettää kanavalla ja joka ylläpitää halutun laadun uudelleen muodostetussa puheessa. Jos puhetta lähetetään yksinkertaisesti näytteistämäl-15 lä ja digitoimalla, vaaditaan datanopeus luokkaa 64 kilobittiä sekuntia kohden (kbps), jotta saavutetaan analogisten puhelimien puheenlaatua vastaava laatu. Kuitenkin käyttämällä puheen analysointia, sitä seu-raavaa sopivaa koodausta, lähetystä ja syntetisointia 20 vastaanottimessa, voidaan saavuttaa merkittävä datano-peuden pudotus.
Laitteita, jotka suorittavat äänitetyn puheen kompressoinnin parametreillä, jotka liittyvät ihmispu-heen mallin muodostamiseen, kutsutaan tyypillisesti 25 vokoodereiksi. Sellaiset laitteet käsittävät kooderin, joka analysoi tulevan puheen palauttaakseen relevantit parametrit, ja dekooderi, joka uudelleensyntetisoi puheen käyttäen parametreja, jotka se saa lähetyskanavalla. Ollakseen tarkka, mallin on oltava vakiollises-30 ti muuttuva. Näin ollen puhe jaetaan aikalohkoihin tai analyysikehyksiin, jonka aikana parametrit lasketaan. Parametrit päivitetään kutakin uutta kehystä varten.
Useista puhekooderiluokista ?(Code Excited Linear Predicitive Coding, CELP), tilastollinen koo-35 daus (Stochastic Coding) tai vektoripainotteinen puhe-koodaus (Vector Excited Speech Coding) ovat yksi luokka. Tämän tietyn luokan koodausalgoritmi esitetään 2 julkaisussa "A 4.8 kbps Code Excited Linear Predictive Coder", Thomas E Tremain et al. , Proceedings of the Mobile Satellite Conference. 1988.
Vokooderi toimii kompressoimalla digitoitua 5 puhesignaalia alemman bittinopeuden signaaliksi poistamalla kaikki puheeseen kuulumattomat luonnolliset redundanssit. Puheessa on tyypillisesti lyhyitä redundansseja johtuen pääasiassa äänitraktaatin suodatuksesta ja pitkiä redundansseja johtuen äänijänteiden 10 kiihottamista äänitraktaateista. CELP kooderissa näitä toimintoja mallinnetaan kahdella suodattimena, for-manttisuodattimella ja pitkäkestoisella astesuodatti-mella. Koska nämä redundanssit poistetaan, saatu resi-duaalisignaali voidaan kuvata valkoisena Gaussin kohi-15 nana, joka myös on koodattava. Tämän menetelmän taustalla on laskea parametrit suodattimelle, jota kutsutaan LPC-suodattimeksi ja joka suorittaa lyhytaikaisen puheen aaltomuotojen ennustamisen käyttäen ihmisen ää-nitraktaattimallia. Lisäksi pitkäkestoiset vaikutuk-20 set, liittyen puheen asteeseen, mallinnetaan laskemalla parametrit suodattimelle, joka olennaisesti mallintaa ihmisen äänijänteitä. Lopulta suodattimet on käynnistettävä, ja se tehdään määrittämällä mikä satun-naiskäynnistyksen aaltomuoto koodikirjassa johtaa al-25 kuperäisen puheen lähimpään approksimaatioon, kun aaltomuoto käynnistää kaksi ylläkuvattua suodatinta. Näin ollen lähetetyt parametrit liittyvät kolmeen kohtaan (1) LPC-suodatin, (2) astesuodatin ja (3) koodikirja-käynnistys .
30 Vaikka vokoodaustekniikoiden käytön kohteena on yrittää vähentää kanavalla lähetetyn informaation määrää ylläpitäen palautetun puheen laatu, tarvitaan muita tekniikoita lisävähennyksen aikaansaamiseksi. Eräs aikaisemmin käytetty tekniikka lähetetyn infor-35 maation vähentämiseksi on ääniaktiviteetin portitus.
Tässä menetelmässä ei lähetetä informaatiota puheessa olevien taukojen aikana. Vaikka tällä menetelmällä 3 saavutetaan haluttu tulos datan vähentämisessä, siinä on useita haittapuolia.
Useissa tapauksissa puheen laatu heikkenee johtuen sanojen alkuperäisten osien leikkautumisesta.
5 Toinen kanavan kiinniportitukseen epäaktiivisuuden aikana liittyvä ongelma on, että järjestelmän käyttäjät huomaavat taustakohinan puuttumisen, mikä yleensä liittyy puheeseen, ja pitävät kanavan laatua heikompana kuin normaalissa puhelussa. Aktiivisen portituksen 10 lisäongelma on, että satunnaiset äkilliset kohinat taustalla saattava liipaista lähettimen vaikka puhetta ei ole, mikä johtaa epämiellyttäviin purskeisiin vas-taanottimessa.
Yritettäessä parantaa syntetisoidun puheen 15 laatua puheaktiivisuuden portitusjärjestelmissä, syn tetisoitu huojentava kohina lisätään dekoodausproses-sin aikana. Vaikka huojentavan kohinan lisäämisellä saavutetaan hieman laadun parantumista, se ei olennaisesti kehitä koko laatua, koska huojentava kohina ei 20 mallinna todellista taustakohinaa kooderissa.
Edullinen menetelmä datakompression suorittamiseksi lähetettävän tiedon vähentämiseksi, on suorittaa muuttuvanopeuksinen vokoodaus. Koska puhe luonnostaan sisältää hiljaisia jaksoja eli taukoja, voidaan 25 näitä jaksoja edustavan datan määrää pienentää. Muut tuvanopeuksinen vokoodaus hyödyntää kaikkein tehokkaimmin tätä tosiasiaa vähentämällä datanopeutta hiljaisilla jaksoilla. Datanopeuden alentaminen, vastakohtana täydelliselle katkolle lähetyksessä, hiljai-30 silla jaksoilla poistaa puheaktiviteetin portitukseen liittyviä ongelmia toteuttaen samalla vähennystä lähetetyssä informaatiossa.
Patenttijulkaisussa US 08/00,484, jätetty 14.1.1993, "Muuttuvanopeuksinen vokooderi", jossa ha-35 kijana on sama kuin tässä hakemuksessa ja joka liite tään tähän viittauksella, esitetään yksityiskohtaisemmin aikaisemmin mainittujen puheluokkien, ?(Code Exci- 4 ted Linear Predicitive Coding, CELP), tilastollinen koodaus tai vektoripainotteinen puhekoodaus, vokoode-rin vokoodausalgoritmi. CELP tekniikka itsessään ei aikaansaa merkittävää vähennystä puhetta edustavan 5 tarpeellisen datan määrään tavalla, joka uudelleensyn-tetisoinnin yhteydessä johtaa korkeaan laatuun. Kuten aiemmin mainittiin, vokooderiparametrit päivitetään kullekin kehykselle. Patenttijulkaisussa esitetty vo-kooderi aikaansaa muuttuvanopeuksisen lähtödatan vaih-10 tamalla mallin parametrien taajuutta ja tarkkuutta.
Yllä mainitun patenttijulkaisun vokoodausalgoritmi eroaa merkittävimmin perinteisistä CELP tekniikoista tuottamalla muuttuvanopeuksisen lähtödatan perustuen puheen aktiivisuuteen. Rakenne määritetään 15 siten, että parametrit määritetään harvemmin tai pienemmällä tarkkuudella, puheen taukojen aikana. Tämä tekniikka mahdollistaa jopa vielä suuremman vähentymisen tiedon tarpeeseen. Ilmiö, jota hyödynnetään da-tanopeuden pienentämiseksi, on puheaktiviteettiker-20 roin, joka keskimääräinen aikaprosentti, minkä puhuja puhuu keskustelun aikana. Tyypillisissä kaksisuuntais-sa puhelinkeskusteluissa keskimääräistä datanopeutta pienennetään kertoimella 2 tai enemmän. Puheen taukojen aikana, vokooderilla koodataan vain taustakohina. 25 Näillä hetkillä, joitain ihmisen äänitraktiin liitty viä parametrejä ei tarvitse lähettää.
Kuten aiemmin mainittiin ennalta tapahtuvaa rajoittamista hiljaisuuden aikana lähetettävän informaation vähentämiseksi kutsutaan puheaktiviteetin por-30 tittamiseksi, tekniikka, jossa informaatiota ei lähe tetä hiljaisten hetkien aikana. Vastaanottopuolella jakso voidaan täyttää syntetisoidulla "huojentavalla kohinalla". Sitä vastoin muuttuvanopeuksinen vokooderi lähettää jatkuvasti dataa, joka hakemuksen esimerkki-35 sovellutuksessa on nopeuksilla, jotka vaihtelevat vä lillä noin 8 kbps ja 1 kbps. Vokooderi, joka aikaansaa jatkuvaa datalähetystä, eliminoi "huojentavan kohinan" 5 tarpeen koodaamalla taustakohinaa ja tarjoamalla luonnollisemman laadun syntetisoidulle puheelle. Edellä mainitun patenttihakemuksen keksintö näin ollen aikaansaa merkittävän kehityksen syntetisoidun puheen 5 laadussa puheaktiviteetin portitukseen nähden sallimalla tasaisen siirtymän puheen ja taustan välillä.
Edellä mainitun patenttihakemuksen vokoo-dausalgoritmi mahdollistaa lyhyiden taukojen tunnistamisen puheessa, vähennys puheaktiviteetin tehollisessa 10 kertoimessa realisoidaan. Nopeuspäättelyt voidaan tehdä kehys kehykseltä periaatteella ilman kanavanvaihtoa (hangover), jolloin datanopeutta voidaan pienentää pu-hetauoilla kehyksen keston mittaiseksi, tyypillisesti 20 millisekunniksi. Näin tauot, kuten tavujen väliset, 15 voidaan siepata. Tämä tekniikka vähentää puheaktivi- teettikerrointa perinteisen ajattelun edelle, koska ei enää ainoastaa pitkiä lauseiden välisiä taukoja, vaan myös lyhyempiä taukoja voidaan koodata pienemmällä nopeudella .
20 Koska nopeuspäättelyt tehdään kehyspohjalta, ei sanan alkuperäisen osan osalta esiinny leikkautumista, kuten ääniaktiviteetin portitusjärjestelmässä. Tämän tyyppinen leikkautuminen esiintyy ääniaktiviteetin portitusjärjestelmässä johtuen viiveestä puheen 25 tunnistuksen ja datan lähetyksen uudelleenkäynnistyksen välillä. Nopeuspäättelyn käyttö perustuen kuhunkin kehykseen johtaa puheeseen, jossa kaikilla siirtymillä on luonnollinen kuulo. Aina lähettävän vokooderin yhteydessä puhujaa ympäröivä taustakohina kuuluu jatku-30 vasti vastaanottopäässä ja johtaa siten luonnollisempaan ääneen puhetaukojen aikana. Näin ollen esillä oleva keksintö aikaansaa pehmeän siirtymän taustakohinaan. Se mitä kuuntelija kuulee taustalla puheen aikana ei äkkinäisesti muutu syntetisoiduksi täytekohinak-35 si taukojen aikana, kuten ääniaktiviteetin portitus-j ärj estelmässä.
6
Koska taustakohinaa vokoodataan jatkuvatoimi-sesti lähetystä varten, mielenkiintoiset tapahtumat taustalla voidaan lähettää täysin selvästi. Tietyissä tapauksissa mielenkiintoinen taustakohina voidaan jopa 5 koodata suurimmalla nopeudella. Maksminopeuden koodaus saattaa esiintyä esimerkiksi silloin kun joku puhuu taustalla äänekkäästi, tai jos ambulanssi ajaa kadunkulmassa seisovan käyttäjän ohi. Vakio- tai hitaasti muuttuva taustakohina koodataan kuitenkin pienillä no-10 peuksilla.
Muuttuvanopeuksisen koodauksen käyttö enteilee koodijakomonipääsyyn (CDMA) perustuvan digitaalisen matkaviestinjärjestelmän kapasiteetin lisäystä enemmän kuin kaksinkertaisesti. CDMA ja muuttuvanope-15 uksinen vokoodaus sovitetaan tapauskohtaisesti, koska CDMA:n yhteydessö kanavien välinen häiriö vähenee automaattisesti lähetysdatan nopeuden vähentyessä jollain kanavalla. Sitä vastoin, ajatellaan järjestelmiä, joissa lähetysaikavälit ovat osoitettuja, kuten TDMA 20 tai FDMA. Sellaisissa järjestelmissä hyödyn saamiseen datanopeuden vähenemisestä vaaditaan käyttämättömien aikavälien uudelleenosoittamisen muille käyttäjille. Luonnollinen viive sellaisessa toteutuksessa johtaa siihen, että kanavaa voidaan uudelleenosoittaa ainoas-25 taa pitkien taukojen aikana. Näin ollen täyttä hyötyä ei saada puheaktiviteettikertoimesta. Kuitenkin ulkoisella koordinoinnilla muuttuvanopeuksinen koodaus on käyttökelpoinen muissa kuin CDMArssa muista mainituista syistä.
30 CDMA järjestelmässä puheen laatu voi hieman heiketä silloin kun ylimääräistä kapasiteettia halu-taa. Abstraktisti puhuen vokooderi voidaan ajatella useiksi vokoodereiksi, jotka kaikki toimivat eri nopeudella, mikä johtaa eri puhelaatuihin. Näin ollen puhe-35 laadut voidaan sekoittaa datalaähetyksen keskimääräisen nopeuden edelleen pienentämiseksi. Alkuperäiset kokeet osoittavat, että sekoittamalla täydellä ja puo- 7 linopeudella koodattu puhe, ts. maksimi sallittu da-tanopeus vaihtelee kehys kehykseltä 8 kbps:n ja 4 kbps:n välillä, saadun puheen laatu on parempi kuin puolen nopeuden muuttuvalla, 4 kbps maksimina, mutta 5 ei yhtä hyvä kuin täyden nopeuden, 8 kbps, muuttuvalla .
On tunnettua, että useimmiten puhelinkeskustelussa vain yksi ihminen puhuu kerrallaan. Kaksisuuntaisten linkkien lisäominaisuutena voidaan aikaansaada 10 nopeuksien välinen lukitus. Jos linkin toiseen suuntaan ollaan lähettämässä suurimmalla lähetysnopeudella, niin linkin toinen lähetyssuunta pakotetaan alhaisimpaan nopeuteen. Kahden suunnan välinen lukituksella taataan enintään 50 % keskimääräinen käyttö kummalle-15 kin linkille. Kuitenkin, kun kanava on kiinniportitet-tu, kuten on tilanne nopeuslukituksessa aktiviteetti-portituksessa, ei kuuntelijalla ole mitään mahdollisuutta keskeyttää puhujaa ottaakseen puhujan roolin keskustelussa. Yllä mainitun patenttihakemuksen mukai-20 nen vokoodausmenetelmä helposti aikaansaa muuntuvan nopeuslukituksen ohjaussignaaleilla, jotka asettavat vokoodausnopeuden.
Yllä kuvatussa patenttihakemuksessa vokooderi toimii joko puheen läsnäollessa täydellä nopeudella 25 tai kun puhe ei ole läsnä kahdeksasosanopeudella. Vo-koodusalgoritmin toiminta puolella ja neljäsosanopeu-della varataan kapasiteettipiikeille tai kun muuta dataa on lähetettävänä puheen rinnalla.
US patenttihakemus 08/118,473, jätetty 30 8.9.1993, "Menetelmä ja laite lähetysdatanopeuden mää rittämiseksi monen käyttäjän tietoliikennejärjestelmässä", jossa hakijana on sama kun tässä hakemuksessa ja joka liitetään tähän, esittää yksityiskohtaisemmin menetelmän, jolla tietoliikennejärjestelmä järjestel-35 män kapasiteettimittauksen perusteella rajoittaa muut-tuvanopeuksisella vokooderilla vokoodattujen kehysten keskimääräistä datanopeutta. Järjestelmä vähentää kes- 8 kimääräistä datanopeutta pakottamalla ennalta määrätyt kehykset sarjaan täyden nopeuden kehyksiä koodattavaksi alemmalla nopeudella eli puolella nopeudella. Ongelma tämän tyyppisessä koodausnopeuden alentamisessa 5 aktiivisilla puhekehyksillä on, että rajoittaminen ei vastaa mitään tulopuheen ominaisuutta eikä näin ole optimoitu puheen kompressointilaadulle.
Lisäksi US patenttihakemuksessa 07/984,602, jätetty 2.12.1992, "Parannettu menetelmä puheen koo-10 dausnopeuden määrittämiseksi muuttuvanopeuksisessa vo-kooderissa", jossa hakijana on sama kun tässä hakemuksessa ja joka liitetään tähän, esitetään menetelmä ei-kuuluvan puheen erottamiseksi kuuluvasta puheesta. Esitetty menetelmä tutkii puheen tehoa ja spektraalis-15 ta kallistusta erottaakseen ei-kuuluvan puheen taustasta .
Muuttuvanopeuksiset kooderit, joiden koodaus-nopeus vaihtelee, perustuvat kokonaan tulopuheen ääni-aktiviteettiin laiminlyöden kompressointitehokkuuden 20 muuttuvanopeuksisessa vokooderissa, joka vaihtaa koo-dausnopeutta perustuen sisällön monimutkaisuuteen tai tietoon, joka vaihtelee dynaamisesti aktiivisen puheen aikana. Sovittamalla koodausnopeudet tuloaaltomuotoon, voidaan rakentaa tehokkaampia koodereita. Edelleen 25 järjestelmien, jotka pyrkivät dynaamisesti säätämään muuttuvanopeuksisen vokooderin lähdön datanopeutta, pitäisi vaihtaa datanopeuksia tulopuheen ominaisuuksien mukaan saavuttaakseen optimaalisen puhelaadun halutulla keskimääräisellä datanopeudella.
30
Esillä oleva keksintö on uusi ja kehittynyt menetelmä ja laite aktiivisten puhekehysten koodaamiseksi alennetulla datanopeudella koodaamalla puheke-hykset nopeuksilla väliltä ennalta määrätty maksimino-35 peus ja ennalta määrätty miniminopeus. Esillä oleva keksintö nimeää aktiivisen puheen toimintatilajoukon. Esillä olevan keksinnön esimerkkisovellutuksessa on 9 neljä aktiivisen puheen toimintatilaa, täyden nopeuden puhe, puolen nopeuden puhe, ei-kuuluva neljännesnopeu-den puhe ja kuuluva neljännesnopeuden puhe.
Esillä olevan keksinnön tarkoituksena on tuo-5 da esiin optimoitu menetelmä koodaustilan valitsemi seksi, mikä aikaansaa tulopuheen nopeudeltaan tehokkaan koodauksen. Esillä olevan keksinnön toisena tarkoituksena on identifioida parametrijoukko, joka sopii ihanteellisesti tällaiseen toiminnallisen tilan valin-10 taan ja antaa välineet tämän parametrijoukon generoimiseksi. Kolmanneksi esillä olevan keksinnön tarkoituksena on aikaansaada kahden erillisen toiminnan tunnistaminen, mikä sallii pieninopeuksisen koodauksen laadun minimiuhrauksin. Kaksi toimintaa ovat ei-15 kuuluvan puheen läsnäolo ja väliaikaisesti maskatun puheen läsnäolo. Esillä olevan keksinnön neljäntenä tarkoituksena on aikaansaada menetelmä puhekooderin keskimääräisen datalähdön nopeuden dynaaminen säätö minimaalisin vaikutuksin puheen laatuun.
20 Esillä oleva keksintö aikaansaa joukon no- peuspäättelykriteereitä, joita pidetään tilamittoina. Ensimmäinen tilamitta on kohdesovituksen signaali-kohinasuhde (TMSNR) edellisestä koodauskehyksestä, joka antaa tiedon kuinka hyvin syntetisoitu puhe vastaa 25 tulopuhetta, tai toisinsanoen kuinka hyvin koodausmal- li toimii. Toinen tilamitta on normalisoitu autokorre-laatiofunktion (NACF), joka mittaa puheen jaksollisuutta. Kolmas tilamitta on nollan ylitysten parametri, joka on laskennallisesti yksinkertainen menetelmä 30 tulopuheen korkeiden taajuuksien selvittämiseen. Nel jäs mitta on ennustevahvistuksen ero (PGD) , joka määrittää ylläpitääkö LPC-malli ennustetehokkuutensa. Viides mitta on tehoero (ED), joka vertaa nykyisen kehyksen tehoa keskimääräiseen tehoon.
35 Esillä olevan keksinnön mukaisen vokoodausal- goritmin esimerkkisovellutus käyttää viittä yllä lueteltua tilamittaa valitakseen koodaustilan aktiivisel- 10 le puhekehykselle. Esillä olevan keksinnön mukainen nopeuspäättelylogiikka vertaa NAFC:tä ensimmäiseen kynnysarvoon ja ZC:tä toiseen kynnysarvoon määrittääkseen, onko puhe koodattava ei-kuuluvana neljännesnope-5 udella.
Jos määritetään, että aktiivinen puhekehys sisältää kuuluvaa puhetta, vokooderi tutkii parametrin ED määrittääkseen pitäisikö puhekehys koodata neljän-nesnopeuden kuuluvana puheena. Jos selviää, että pu-10 hetta ei saa koodata neljännesnopeudella, niin vokooderi testaa voidaanko puhe koodata puolella nopeudella. Vokooderi testaa arvon TMSNR:n, PGD:n ja NACF:n arvot määrittääkseen voidaanko puhekehys koodata puolella nopeudella. Jos selviää, että aktiivista puheke-15 hystä ei voi koodata neljännes- tai puolella nopeudella, niin kehys koodataan täydellä nopeudella.
Vielä keksinnön kohteena on tuoda esiin menetelmä kynnysarvojen dynaamiseksi muuttamiseksi nopeus-vaatimusten sovittamiseksi. Vaihtamalla yhtä tai use-20 ampaa tilanvalintakynnystä on mahdollista lisätä tai vähentää keskimääräistä lähetysnopeutta. Näin ollen säätämällä kynnysarvoja dynaamisesti, lähtönopeutta voidaan muuttaa.
Esillä olevan keksinnön muodot, tarkoitukset 25 ja edut tulevat selvemmiksi seuraavasta yksityiskohtaisesta kuvauksesta viitaten oheisiin piirustuksiin, joissa on samat viitenumerot kauttaaltaan ja joissa: kuvio 1 on lohkokaavio, joka esittää esillä olevan keksinnön mukaista koodausnopeuden määrityslai-30 tetta; ja kuvio 2 on vuokaavio, joka esittää nopeus-päättelylogiikan koodausnopeuden valintaprosessia.
Esimerkkisovellutuksessa koodataan 160 puhe-näytteen puhekehyksiä. Esillä olevan keksinnön esi-35 merkkisovellutuksessa on neljä datanopeutta; täysino-peus, puolinopeus, neljäsosanopeus ja kahdeksasosano-peus. Täysinopeus vastaa lähtödatan nopeutta 14.4 11 kbps. Puolinopeus vastaa lähtödatan nopeutta 7.2 kbps. Neljäsosanopeus vastaa lähtödatan nopeutta 3.6 kbps. Kahdeksasosanopeus vastaa lähtödatan nopeutta 1.8 kbps, ja se varataan hiljaisuuden aikana tapahtuviin 5 lähetyksiin.
On huomattava, että esillä oleva keksintö liittyy ainoastaan aktiivisten kehysten, kehysten, joissa on tunnistettu puhetta, koodaamiseen. Puheen tunnistaminen kehyksessä suoritetaan menetelmällä, jo-10 ka on kuvattu yksityiskohtaisemmin yllä mainituissa patenttijulkaisuissa US 08/004,484 ja 07/948,602.
Viitaten kuvaan l, tilamittauselementti 12 määrittää päättelylogiikan 14 aktiivisen kehyksen koodaamiseen käytettävän koodausnopeuden määrittämiseen 15 käyttämien viiden parametrin arvot. Esimerkkisovellu-tuksessa tilamittauselementti 12 määrittää viisi parametria, jotka se antaa päättelylogiikalle 14. Perustuen tilamittauselementin 12 antamiin parametreihin, päättelylogiikka 14 valitsee koodausnopeudeksi täyden-20 , puoli- tai neljäsosanopeuden.
Nopeuden päättelylogiikka 14 valitsee yhden neljästä koodaustilasta viiden muodostetun parametrin mukaan. Neljä koodaustilaa käsittää täyden nopeuden tilan, puolen nopeuden tilan ei-kuuluvan neljäsosano-25 peuden tilan ja kuuluvan neljäsosanopeuden tilan. Kuuluva neljäsosanopeuden tila ja ei-kuuluva neljäsosanopeuden tila antavat dataa samalla nopeudella, mutta erilaisilla koodaustavoilla. Puolen nopeuden tilaa käytetään pysyvän, jaksollisen hyvin mallinnetun pu-30 heen koodaamiseen. Sekä kuuluva neljäsosanopeuden, ei- kuuluva neljäsosanopeuden ja puolen nopeuden koodaus käyttävät hyväkseen puhealueita, jotka eivät vaadi suurta tarkkuutta kehyksen koodaamisessa.
Neljäsosanopeuden ei-kuuluvaa tilaa käytetään 35 ei-kuuluvan puheen koodaamiseen. Neljäsosanopeuden kuuluvaa tilaa käytetään väliaikaisesti maskattujen puhekehyksien koodaamiseen. Useimmat CELP puhekooderit 12 käyttävät hyväkseen samanaikaista maskausta, jossa pu-heteho annetulla taajuudella maskaa pois kohinatehon samalla taajuudella ja hetkellä tehden kohinan kuulumattomaksi. Muuttuvanopeuksiset puhekooderit voivat 5 käyttää hyväkseen väliaikaista maskausta, missä pienitehoiset aktiiviset puhekehykset maskataan edeltävällä saman taajuuden sisältävällä suuritehoisella puheke-hyksellä. Koska ihmiskorva integroi tehoa ajan suhteen eri taajuuskaistoilla, pienitehoiset kehykset keskiar-10 voistetaan suuritehoisten kehysten kanssa vähentäen siten koodaustarvetta pienitehoisille kehyksille. Tämän väliaikaisen kuulomaskausilmiön hyväksikäyttö mahdollistaa muuttuvanopeuksisen puhekooderin vähentää koodausnopeutta tämän puhetilan aikana. Tämä fysioa-15 kustinen ilmiö kuvataan yksityiskohtaisemmin artikke lissa Psvchoacoustics by E. Zwicker and H. Fasti, pp. 56 - 101.
Tilamittauselementti 12 vastaanottaa neljä tulosignaalia, joilla se generoi viisi tilaparametria. 20 Ensimmäinen signaali, jonka tilamittauselementti 12 vastaanottaa on S(n), joka on koodaamaton tulopuhenäy-te. Esimerkkisovellutuksessa puhenäytteet annetaan kehyksissä, jotka sisältävät 160 puhenäytettä. Puhekehykset, jotka annetaan tilamittauselementtiin 12 si-25 sältävät kaikki aktiivista puhetta. Hiljaisuuden aika na keksinnön mukainen aktiivinen puhenopeustunnistus-järjestelmä on epäaktiivinen.
Toinen signaali, jonka tilamittauselementti 12 vastaanottaa on syntetisoitu puhenäytesignaali 30 (AS), joka on dekoodattua puhetta muuttuvanopeuksisen CELP kooderin dekooderilta. Kooderin dekooderi dekoo-daa koodatun puhekehyksen suodattimen ja muistin parametrien päivittämistä varten synteesipohjaisen CELP kooderin analyysissä. Sellaisten dekoodereiden suun-35 nittelu on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484.
13
Kolmas signaali, jonka tilamittauselementti 12 vastaanottaa on formanttiresiduaalisignaali e (n). Formanttiresiduaalisignaali on CELP kooderin lineaarisen ennustavan koodauksen (LPC) suodattimena suoda-5 tettu puhesignaali. LPC-suodattimien suunnittelu ja signaalien suodattaminen niillä on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484. Neljäs tulo tilamittausele-menttiin 12 on A(z), jotka ovat suodattimen kerroin-10 arvoja havainnollisesti painottavassa suodattimessa CELP kooderissa. Kerroinarvojen generointi ja havainnollisesti painottavan suodattimen toiminta on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484.
15 Kohdesovituksen signaali-kohinasuhteen(SNR)- laskentaelementti 2 vastaanottaa syntetisoidun puhe-signaalin, AS(n), puhenäytteet S (n) ja joukon havainnollisesti painottavan suodattimen kerroinarvoja A(z) . Kohdesovituksen SNR laskentaelementti 2 antaa paramet-20 rin, jota pidetään parametrina TMSNR ja joka osoittaa miten hyvin mallinnettu puhe seuraa tulopuhetta. Kohdesovituksen SNR laskentaelementti 2 generoi TMSNR:n alla olevan yhtälön 1 mukaan: 159 Z§w2(n) TMSNR = 10-log ^- (1) Z(S W(n)-SW(R»2 _ n=0 25 missä alaindeksi w tarkoittaa, että signaali on suodatettu havainnollisesti painottavalla suodattimena.
Huomaa, että tämä mitta lasketaan edelliselle puheke-hykselle, kun taas NACF, PGD, ED, ZC lasketaan nykyi-30 selle puhekehykselle. TSMNR lasketaan edelliselle pu-hekehykselle, koska se on valitun koodausnopeuden funktio ja siten laskennan monimutkaisuuden vuoksi se lasketaan edelliselle kehykselle koodattavana olevasta kehyksestä.
14
Havainnollisesti painottavien suodattimien suunnittelu ja toteutus on tunnettua ja esitetään yksityiskohtaisemmin edellä mainitussa patenttijulkaisussa US 08/004,484. On huomattava, että havainnol-5 lista painotusta (perceptual weighting) pidetään puhe-kehyksen havainnollisesti merkittävien osien painottamisena. Kuitenkin on havaittu, että mittaus voidaan tehdä ilman signaalien havainnollista painottamista.
Normalisoidun autokorrelaation laskentaele-10 mentti 4 vastaanottaa formanttijäännössignaalin, e(n). Normalisoidun autokorrelaation laskentaelementti 4 antaa tiedon puheen jaksollisuudesta puhekehyksessä. Normalisoidun autokorrelaation laskentaelementti 4 generoi parametrin NACF alla olevan yhtälön 2 mukaan: 159 X e(n) · e(n - T) NACF = max n=0 ,.9........
15 Σ*») <2) n=0 T e [20,120]
On huomattava, että tämän parametrin generointi vaatii edellisen kehyksen koodauksen formanttiresiduaalisig-naalin muistamisen. Tämä mahdollistaa ei ainoastaan jaksollisuuden testaamisen vaan myös nykyisen kehyksen 20 jaksollisuuden testaamisen edelliseen kehykseen näh den .
Syy, että esimerkkisovellutuksessa käytetään formanttiresiduaalisignaalia e(n) puhenäytteiden S (n), joita voitaisiin käyttää NACF:n muodostamisessa, si-25 jaan, on eliminoida formanttien vuorovaikutus puhesignaaliin. Puhesignaalin siirtäminen formanttisuodatti-men lävitse auttaa puheen verhokäyrän alentamisessa ja vaalentaa siten saatavaa signaalia. On huomattava, että viiveen T arvot esimerkkisovellutuksessa vastaavat 30 astetaajuuksia 66 Hz:n ja 400 Hz:n välillä näytteis-tystaajuudella 8000 näytettä sekunnissa. Astetaajuus annetulle viivearvolle lasketaan yhtälöllä 3 alla: f faste = —, missä fon nä yttestystaajuus. (3) 15
On huomattava, että taajuusaluetta voidaan laajentaa tai supistaa yksinkertaisesti valitsemalla eri viive arvo j oukko . Lisäksi on huomattava, että esillä oleva keksintö soveltuu samalla tavoin mille tahansa näyt-5 teistystaajuudelle.
Nollan ylitysten lukumäärän laskin 6 vastaanottaa puhenäytteet S(n) ja laskee puhenäytteen merkin-vaihdon kertojen määrän. Tämä on laskennallisesti helppo menetelmä korkeataajuisten komponenttien tun-10 nistamiseksi puhesignaalissa. Tämä laskin voidaan toteuttaa ohjelmallisesti seuraavanlaisella silmukalla:
Cllt=0 (4) for n=0,158 (5) if ( S(n)· S(n+1 )<0) cnt++ (6) 15 Yhtälöiden 4-6 muodostama silmukka kertoo peräkkäiset puhenäytteet ja testaa onko tulo pienempi kuin nolla, mikä osoittaa, että kahden peräkkäisen näytteen merkki on eri. Tämä olettaa, että puhesignaalissa ei ole DC-komponenttia. DC-komponentin poistaminen on sinänsä 20 tunnettua.
Ennustevahvistuksen eroelementti 8 vastaanottaa puhesignaalin ja formanttiresiduaalisignaalin e(n). Ennustevahvistuksen eroelementti 8 generoi parametrin PGD, joka määrittää ylläpitääkö LPC-malli en-25 nustustehokkuutensa. Ennustevahvistuksen eroelementti 8 generoi ennustevahvistuksen, Pg, alla olevan yhtälön 7 mukaan: 159 2>2(n) P.=·^- (7) Σ») n=0
Nykyisen kehyksen ennustevahvistusta verrataan edelli-30 sen kehyksen ennustevahvistukseen generoitaessa lähtö-parametri PGD alla olevalla yhtälöllä 8: f P (i) ^ PDG= 10-log —-- , missä i vittaa kekysmimeroon (8) 16
Edullisessa sovellutuksessa ennustevahvistuksen eroe-lementti 8 ei generoi ennustevahvistuksen Pg arvoja. LPC vakioiden generoinnissa Durbinin rekursion oheis-tulo on ennustevahvistus Pg, joten laskennan toistami-5 nen ei ole tarpeen.
Kehystehon eroelementti 10 vastaanottaa nykyisen kehyksen puhenäytteet s (n) ja laskee puhesignaalin tehon nykyisessä kehyksessä alla olevan yhtälön 9 mukaan: 159 10 E, = 2 S2 (n) (9) u=0
Nykyisen kehyksen tehoa verrataan edellisten kehysten keskimääräiseen tehoon, Eave. Esimerkkisovellutuksessa keskimääräinen teho generoidaan vuotointegraattorilla, joka on muotoa: 15 Eave = a*Eave + (1-a)»Ei, missä 0<α<1 (10)
Kerroin a määrittää kehykset, jotka ovat relevantteja laskennassa. Esimerkkisovellutuksessa a asetaan arvoon 0.8825, joka antaa kahdeksan kehyksen aikavakion. Kehystehon eroelementti 10 generoi seuraavaksi paramet-20 rin ED alla olevan yhtälön 11 mukaan: E.
ED = 10-log—— (11) ^ave
Viisi parametria, TSMNR, NACF, ZC, PGD ja Ed annetaan nopeuden päättelylogiikalle 14. Nopeuden päättelylogiikka 14 valitsee koodausnopeuden seuraa-25 valle näytekehykselle parametrien ja ennalta määrätyn valintasäännöstön mukaan. Viitaten nyt kuvaan 2 esitetään vuokaavio, joka esittää nopeuden päättelylogiikan 14 nopeusvalintaprosessia.
Nopeuden valintaprosessi alkaa lohkosta 18. 30 Lohkossa 20 normalisoidun autokorrelaatioelementin 4 lähtöä NAFC verrataan ennalta määrättyyn kynnysarvoon THR1 ja nollan ylitysten laskentaelementin lähtöä verrataan toiseen ennalta määrättyyn kynnysarvoon THR2. Jos NAFC on pienempi kuin THR1 ja ZC on suurempi kuin 35 THR2, niin edetään lohkoon 22, joka koodaa puheen nel- 17 j äsosanopeuden ei-kuuluvana. Se että NACF on alle ennalta määrätyn kynnyksen indikoi jaksollisuuden puuttumista puheesta ja että ZC on suurempi kuin ennalta määrätty kynnys indikoi suurta taajuuskomponenttia pu-5 heessa. Näiden kahden tilan yhdistelmä indikoi, että kehys sisältää ei-kuuluvaa puhetta. Esimerkkisovellu-tuksessa THR1 on 0.35 ja THR2 on 50 nollan ylitystä. Jos NACF ei ole pienempi kuin THR1 tai ZC ei ole suurempi kuin THR2, niin edetään lohkoon 24.
10 Lohkossa 24 kehystehon eroelementin 10 lähtöä ED verrataan kolmanteen kynnysarvoon THR3. Mikäli ED on pienempi kuin THR3, niin nykyinen kehys koodataan neljäsosanopeuden kuuluvana puheena lohkossa 26. Mikäli tehoero nykyisen kehyksen välillä on pienempi kuin 15 keskimäärin enemmän kuin yhden kynnyksen verran, niin tunnistetaan väliaikaisesti maskatun puheen tila. Esi-merkkisovellutuksessa THR3 on -14 dB. Mikäli ED ei ylitä THR3:a, niin edetään lohkoon 28. Lohkossa 28 kohdesovituksen SNR:n laskentaelementin 2 lähtöä TMSNR 20 verrataan neljänteen kynnysarvoon THR4; ennustevahvis-tuksen eroelementin lähtöä PGD verrataan viidenteen kynny s a rvo on THR5; ja normalisoidun autokorrelaation laskentaelementin lähtöä verrataan kuudenteen kynnysarvoon THR6. Jos TMSNR ylittää THR4:n; PGD on pienempi 25 kuin THR5; ja NACF ylittää THR6:n, niin edetään lohkoon 30 ja puhe koodataan puolella nopeudella. Se että TMSNR ylittää kynnyksen indikoi, että malli ja mallinnettava puhe vastasivat toisiaan hyvin edellisessä kehyksessä. Se että parametri PGD on pienempi kuin en-30 naita määrätty kynnys indikoi, että LPC malli ylläpitää ennustetehokkuutensa. Se että parametri NACF ylittää sen ennalta määrätyn kynnyksen indikoi, että kehys sisältää jaksollista puhetta, joka on jaksollista edelliseen kehykseen nähden.
35 Esimerkkisovellutuksessa THR4 asetetaan alus
sa 10 dB:iin, THR5 asetaan -5 dB:iin ja THR6 asetetaan 0.4. Lohkossa 28, jos TMSNR ei ylitä THR4: ää tai PGD
18 ei ylitä THR5:tä tai NACF ei ylitä THR6: ta, niin edetään lohkoon 32 ja nykyinen puhekehys koodataan täydellä nopeudella.
Säätämällä dynaamisesti kynnysarvoja, voidaan 5 saavuttaa mielivaltaisesti kaiken kattava data. Kaiken kattava keskimääräinen aktiivisen puheen datanopeus R voidaan määrittää analyysia varten ikkunan W aktiivisina puhekehyksinä seuraavasti:
Rf -#Rj kehykset + Rhkehykset + Rq ·#Rq - kehykset w (12) 10 missä Rf on täydellä nopeudella koodattujen kehysten datanopeus,
Rh on puolella nopeudella koodattujen kehysten datanopeus ,
Rq, on neljäsosanopeudella koodattujen kehysten da-15 tanopeus, ja W=#Rf-kehysten+#Rh-kehysten+#Rq-kehysten Kertomalla kukin koodausnopeus sillä nopeudella koodattujen kehysten lukumäärällä ja tulos jakamalla kehysten kokonaismäärällä näytteessä, voidaan laskea ak-20 tiivisen puheen keskimääräinen datanopeus. On tärkeää, että kehysnäytteen koko, W, on riittävän suuri pitkien ei-kuuluvien puhejaksojen ehkäisemiseksi, kuten esimerkiksi venytetty "s" kuulostaa häiriöltä keskimääräisessä puhetilastossa. Esimerkkisovellutuksessa ke-25 hysnäytteen koko W laskentaa varten keskimääräisellä nopeudella on 400 kehystä.
Keskimääräistä datanopeutta voidaan vähentää lisäämällä täydellä nopeudella koodattujen kehysten määrää koodattavaksi puolella nopeudella, ja päinvas-30 toin keskimääräistä datanopeutta voidaan kasvattaa li säämällä puolella nopeudella koodattavien datakehysten määrää koodattavaksi täydellä nopeudella. Edullisessa sovellutuksessa kynnys, jota säädetään tämän vaikutuksen aikaansaamiseksi on THR4. Esimerkkisovellutuksessa 35 TSNR:n arvojen histogrammi talletetaan. Esimerkkiso vellutuksessa tallennetut TMSNR arvot kvantisoidaan 19 kokonaislukudesibeliarvoiksi THR: n nykyisistä arvoista. Ylläpitämällä tämän kaltaista histogrammia, voidaan helposti arvioida montako kehystä olisi muuttunut edellisessä analyysissä koodattavaksi puolella nopeu-5 della täyden nopeuden koodauksesta jos THR4:ä olisi pienennetty kokonaisluvulla desibeleinä. Päinvastoin, voidaan helposti arvioida montako kehystä olisi muuttunut edellisessä analyysissä koodattavaksi täydellä nopeudella puolen nopeuden koodauksesta jos THR4:ä 10 olisi kasvatettu kokonaisluvulla desibeleinä.
Kaava, jolla määritetään nopeudesta täyteen nopeuteen muuttuneiden määrä, määritetään yhtälöllä 13 :
^ _ [kohdenopeus - keskim. nopeus]-W
VÄ 13 15 missä Δ on puolella nopeudella olevien kehysten määrä, jotka pitäisi koodata täydellä nopeudella kohdenopeu-den ylläpitämiseksi, ja W=#Rf-kehysten+#Rh-kehysten+#Rq-kehysten.
TMSNRne,, = TMSNRold + (dB: ien määrä 2 0 TMSNRold:ista Δ kehyserojen saavuttamiseksi määritettynä yhtälöllä 13 yllä)
Huomaa, että TMSNRrn alkuarvo on halutun kohdenopeuden funktio. Esimerkkisovellutuksen kohdenopeudella 8.7 kbps, järjestelmässä arvoilla Rf = 14.4 kbps, Rf = 7.2 25 kbps, Rq = 3.6 kbps, TMSNR:n alkuarvo on 10 dB. On huomattava, että kvantisoimalla TMSNR arvot kokonaislukuihin etäisyydelle kynnyksestä THR4 voidaan helposti muodostaa hienompi jaotus, kuten puoli- tai neljäs-osadesibelejä tai voidaan tehdä karkeammaksi, kuten 30 puolitoista tai kaksi desibeliä.
On havaittu, että kohdenopeus voidaan joko tallettaa päättelylogiikkaelementin 14 muistiin, jolloin kohdenopeus olisi staattinen arvo, jonka mukaan THR4 arvo dynaamisesti määritettäisiin. Lisäksi tälle 35 kohdenopeudelle on havaittu, että tietoliikennejärjestelmä voi lähettää nopeuskomentosignaalin koodausno- 20 peuden valitsinlaitteelle perustuen järjestelmän kapasiteetin nykyiseen tilaan.
Nopeuskomentosignaali voi joko spesifioida kohdenopeuden tai se voi yksinkertaisesti vaatia lisä-5 ystä tai pienennystä keskimääräiseen nopeuteen. Jos järjestelmä määrittäisi kohdenopeuden, sitä voitaisiin käyttää määritettäessä THR4:n arvoa yhtälöillä tila-mittauselementti 12 ja 13. Jos järjestelmä spesifioisi vain sen, että käyttäjän pitäisi lähettää suuremmalla 10 tai pienemmällä lähetysnopeudella, nopeuden päättely-logiikka 14 voisi vastata vaihtamalla THR4 arvoa ennalta määrätyllä lisäyksellä tai laskea muutoksen ennalta määrätyn lisäävän lisäyksen tai vähennyksen mukaan nopeudessa.
15 Lohkot 22 ja 26 indikoivat eroa puheen koo dausmenetelmässä perustuen joko puhenäytteisiin, jotka edustavat kuuluvaa tai ei-kuuluvaa puhetta. Ei-kuuluva puhe on hankausäänteen ja konsonanttiäänteen muodossa olevaa puhetta, kuten "f", "s", "sh", "t" ja "z". Nel-20 jäsosanopeuden kuuluva puhe on väliaikaisesti maskat-tua puhetta, missä hiljaa kuuluva puhekehys seuraa suhteellisen voimakasta puhekehystä samalla taajuussi-sällöllä. Ihmiskorva ei kykene kuulemaan puheen hienopisteitä alhaisella voimakkuudella, joka seuraa 25 korkeavoimakkuuksista kehystä, joten bittejä voidaan säästää koodaamalla tämä puhe neljännesnopeudella. Ei-kuuluvan neljäsosanopeuden koodauksen esimerkkisovel-lutuksessa puhekehys jaetaan neljään alikehykseen. Kaikki mikä lähetetään kullekin neljästä alikehyksestä 3 0 on vahvistusarvo G ja LPC-suodattimen kertoimet A(z) . Esimerkkisovellutuksessa lähetetään viisi bittiä edustaen vahvistusta kussakin alikehyksessä. Dekooderissa kullekin alikehykselle valitaan koodikirjaindeksi satunnaisesti. Satunnaisesti valittu koodikirjavektori 35 kerrotaan lähetetyllä vahvistusarvolla ja annetaan LPC-suodattimen läpi, A(z), syntetisoiden ei-kuuluvan puheen generoimiseksi.
21
Kuuluvan neljäsosanopeuden koodauksessa puhe-kehys jaetaan kahteen alikehykseen ja CELP kooderi määrittää koodikirjaindeksin ja vahvistuksen kullekin alikehykselle. Esimerkkisovellutuksessa viisi bittiä 5 allokoidaan koodikirjaindeksin spesifioimiseksi ja toiset viisi bittiä allokoidaan vastaavan vahvistusar-von spesifioimiseksi. Esimerkkisovellutuksessa kuuluvan neljäsosanopeuden koodauksessa käytetty koodikirja on puolen ja täyden nopeuden koodauksen käytetyn koo-10 dikirjan vektorialijoukko. Esimerkkisovellutuksessa seitsemää bittiä käytetään koodikirjaindeksin spesifi-oimiseksi täyden ja puolen nopeuden koodaustiloissa.
Kuvassa 1 lohkot voidaan toteuttaa rakenteellisina lohkoina haluttujen toimintojen suorittamiseen 15 tai lohkot voivat edustaa funktioita, jotka on suoritettu digitaalisten signaaliprosessorien (DSP) tai sovelluskohtaisten integroitujen piirien ohjelmoimiseksi. Esillä olevan keksinnön toiminnan kuvaus antaa ammattimiehelle edellytykset toteuttaa esillä oleva kek-20 sintö DSP:lie tai ASICille ilman kohtuutonta kokemusta .
Edellä oleva edullisten sovellutusten kuvaus annetaan, jotta ammattimies voisi käyttää tai valmistaa esillä olevan keksinnön mukaista laitetta. Näiden sovel-25 lutusten eri modifikaatiot ovat ammattimiehille ilmeisiä ja tässä kuvatut yleiset periaatteet ovat sovellettavissa muihin sovellutuksiin keksimättä mitään uutta. Näin ollen esillä olevaa keksintöä ei rajata tässä esitettyihin sovellutuksiin vaan tässä esitettyjen periaatteiden 30 ja uusien hahmojen käsittämään suojapiirin.
Claims (39)
1. Laite valitsemaan koodausnopeus ennalta määrätystä joukosta koodausnopeuk-sia puhekehyksen koodaamiseksi sisältäen useita puhenäytteitä, tunnettu siitä, 5 että käsittää: moodimittausvälineet (12), jotka toimivat vasteena mainittuihin puhenäytteisiin ja ainakin yhteen signaaliin, joka on johdettu mainituista puhenäytteistä, generoimaan joukko parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia; ja 10 nopeuden määräämislogiikan (14) välineet vastaanottamaan mainittu j oukko pa- rametreja, määräämään mainittujen puhenäytteiden psykoakustinen merkitys mainitun parametri]’oukon mukaisesti ja valitsemaan koodausnopeus mainitusta ennalta määrätystä joukosta koodausnopeuksia mainitun määrätyn psykoakusti-sen merkityksen mukaisesti käyttäen ennalta määrättyjä nopeusvalintasääntöjä. 15
2. Patenttivaatimuksen 1 laite, tunnettu siitä, että mainitut nopeusvalintasäännöt valitsevat mainitun koodausnopeuden, joka varaa ensimmäisen lukumäärän bittejä mainittujen puhenäytteiden koodaamiseksi, kun mainitut puhenäytteet on määrätty psykoakustiselta merkitykseltään suuremmiksi j a j ossa mainitut nopeusva- 20 lintasäännöt valitsevat mainitun koodausnopeuden, joka varaa toisen lukumäärän bittejä mainittujen puhenäytteiden koodaamiseksi, kun mainitut puhenäytteet määrätään psykoakustiselta merkitykseltään vähäisemmiksi, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä. 25
3. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä.
4. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko paramet reja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä.
5. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäolon mainitussa puhekehyksessä. 5
6. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formant-tien kehyksestä-kehykseen -stabiliteetin.
7. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko paramet reja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksista energiassa mainitun puhekehyksen energian ja keskimääräisen kehysenergian välillä.
8. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko paramet reja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksia energiassa mainittujen puhenäytteiden energian ja keskimääräisen kehysenergian välillä, ja jossa, kun mainittu kehysenergiadifferentiaalimittaus (10) on alle ennalta määrätyn kynnyksen, mainitut nopeuden määräämisen logiikkavälineet (14) 20 valitsevat neljäsosanopeuksisen soinnillisen koodauksen (26) koodausmoodin.
9. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuudesta mainituissa puhenäytteissä ja nollaylitysten lukeman (6), joka 25 ilmaisee korkeataajuisten komponenttien läsnäolon mainitussa puhekehyksessä, ja jossa, kun mainittu normalisoidun autokorrelaation mittaus (4) on alle ensimmäisen ennalta määrätyn kynnyksen ja mainittu nollaylitysten lukema (6) ylittää toisen ennalta määrätyn kynnyksen, mainitut nopeuden määräämisen logiikkavälineet (14) valitsevat neljäsosanopeuksisen soinnittoman koodauksen 30 (22) koodausmoodin.
10. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu ennalta määrätty joukko koodausnopeuksia käsittää täysinopeuden, puolinopeuden ja nelj äsosanopeuden.
11. Patenttivaatimuksen 1 tai 2 laite, tunnettu siitä, että mainittu joukko parametreja käsittää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, ja koodauslaatusuhteen (2), joka ilmaisee vastaavuutta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä, ja ennustevahvistusdifferentiaalimittauksen (8), joka 10 ilmaisee formanttiparametrien j oukon kehyksestä-kehykseen -stabiliteetin, j a jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) ylittää ennalta määrätyn ensimmäisen kynnyksen, mainittu ennustevahvistusdifferentiaali (8) on alle toisen ennalta määrätyn kynnyksen ja mainittu koodauslaatusuhde (2) ylittää ennalta määrätyn kolmannen kynnyksen, mainitut nopeuden määräämisen 15 logiikkavälineet (14) valitsevat puolinopeuksisen koodauksen koodausmoodin.
12. Alijärjestelmä dynaamisesti muuttamaan puhekehyksen lähetysnopeutta, joka lähettää etäasemalta kommunikaatiojärjestelmää varten, jossa mainittu etäasema kommunikoi keskikommunikaatiokeskuksen kanssa, joka mainittu alijäijestelmä 20 käsittää patenttivaatimuksen 1 mainitun laitteen, tunnettu siitä, että: moodimittausvälineet (12) toimivat vasteena mainittuun puhekehykseen j a mainitusta puhekehyksestä johdettuun signaaliin, generoimaan joukko parametrej a, j otka ilmaisevat mainitun puhekehyksen ominaisuuksia; j a nopeuden määräämisen logiikkavälineet (14) on sovitettu vastaanottamaan 25 nopeuskomentosignaali generoimaan ainakin yksi kynnysarvo mainitun nopeuskomentosignaalin mukaisesti, ja vertaamaan parametrien mainitun joukon ainakin yhtä parametria mainitun ainakin yhden kynnysarvon kanssa ja valitsemaan koodausnopeus mainitun vertailun mukaisesti.
13. Patenttivaatimuksen 12 alijärjestelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä valitaan mainittujen puhenäytteiden koodaamiseksi kun mainitut puhenäytteet on määrätty psykoakustiselta merkitykseltään suuremmiksi, ja jossa mainittu koodausnopeus, joka varaa toisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamiseksi kun mainitut puhenäytteet on määrätty psykoakustiselta merkitykseltään vähäisemmiksi, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurem-5 pi kuin mainittu toinen lukumäärä bittejä.
14. Patenttivaatimuksen 1 laite, tunnettu siitä, että moodimittausvälineet käsittävät moodimittauslaskimen, joka generoi joukon parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia mainittujen puhenäytteiden ja maini- 10 tusta puhenäytteistä johdetun signaalin mukaisesti; ja jossa nopeuden määräämis-logiikka käsittää nopeuden määräämislogiikan (14) vastaanottamaan mainitun joukon parametreja, määräämään mainittujen puhenäytteiden psykoakustinen merkitys parametrien mainitun joukon mukaisesti, ja valiten koodausnopeuden mainitusta ennalta määrätystä joukosta koodausnopeuksia. 15
15. Patenttivaatimuksen 14 laite, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamiseksi, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia, ja jossa mainittu koodausnopeus, joka varaa toisen 20 lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä.
16. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko para metreja sisältää koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä.
17. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko para-30 metrejä sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuudesta mainituissa puhenäytteissä.
18. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko parametreja sisältää nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäolon mainitussa puhekehyksessä.
19. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko parametreja sisältää ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formanttien kehyksestä-kehykseen -stabiliteettia.
20. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko 10 parametrej a sisältää kehysenergiadifferentiaalimittauksen (10), j oka ilmaisee muutoksia energiassa mainitun puhekehyksen energian ja keskimääräisen kehysenergian välillä.
21. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko 15 parametreja käsittää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä, ja ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formanttiparametrien joukon kehyksestä-kehykseen -stabiliteettia, ja jossa, kun 20 mainittu normalisoitu autokorrelaation mittaus (4) ylittää ennalta määrätyn ensimmäisen kynnyksen, mainittu ennustevahvistusdifferentiaali (8) on alle toisen ennalta määrätyn kynnyksen ja mainittu koodauslaatusuhde (2) ylittää ennalta määrätyn kolmannen kynnyksen, mainittu nopeuden määräämislogiikka (14) valitsee puolinopeuksisen koodauksen (30) koodausmoodin. 25
22. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, ja nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäoloa mainitussa puhekehyksessä, 30 ja jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) on alle ensimmäisen ennalta määrätyn kynnyksen ja mainittu nollaylitysten lukema (6) ylittää toisen ennalta määrätyn kynnyksen, mainittu nopeuden määräämislogiikka (14) valitsee neljäsosanopeuksisen soinnittoman koodauksen (22) koodausmoodin.
23. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu joukko 5 parametreja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksia energiassa mainittujen puhenäytteiden energian ja keskimääräisen kehysenergian välillä, ja jossa, kun mainittu kehysenergiadifferentiaalimittaus (10) on alle ennalta määrätyn kynnyksen, mainitut nopeuden määräämislogiikan (14) välineet valitsevat nelj äsosanopeuksisen soinnillisen koodauksen (26) 10 koodausmoodin.
24. Patenttivaatimuksen 14 tai 15 laite, tunnettu siitä, että mainittu ennalta määrätty joukko koodausnopeuksia käsittää täysinopeuden, puolinopeuden ja nelj äsosanopeuden. 15
25. Patenttivaatimuksen 12 alijärjestelmä dynaamisesti muuttamaan puheen kehyksen lähetysnopeutta, joka lähettää mainitulta etäasemalta, tunnettu siitä, että moodimittausväline käsittää moodimittauslaskimen, joka generoi joukon parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia 20 mainittuj en puhenäytteiden mukaisesti j a signaalin, j oka on j ohdettu mainituista puhenäytteistä; ja jossa nopeuden määräämislogiikka käsittää nopeuden määräämislogiikan (14), joka vastaanottaa mainitun joukon parametreja määräämään mainittujen puhenäytteiden psykoakustinen merkitys parametrien mainitun joukon mukaisesti, ja vastaanottamaan nopeuskomentosignaali 25 generoimaan ainakin yksi kynnysarvo mainitun nopeuskomentosignaalin mukaisesti, verraten parametrien mainitun joukon ainakin yhtä parametria mainittuun ainakin yhteen kynnysarvoon ja valiten koodausnopeuden mainitun vertailun mukaisesti.
26. Patenttivaatimuksen 25 alijärjestelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia ja jossa mainittu koodausnopeus, joka varaa toisen lukumäärän bittejä, valitaan mainittujen puheen näytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen 5 lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä.
27. Menetelmä valitsemaan koodausnopeuksien ennalta määrätyn joukon koodausnopeus puhekehyksen, joka sisältää useita puhenäytteitä, koodaamiseksi, tunnettu siitä, että käsittää vaiheet: 10 generoidaan joukko parametreja, jotka ilmaisevat mainitun puhekehyksen ominaisuuksia, mainittujen puhenäytteiden ja mainituista puhenäytteistä johdetun signaalin mukaisesti; ja valitaan koodausnopeus mainitusta ennalta määrätystä joukosta koodausnopeuksia mainittujen puhenäytteiden määrätyn psykoakustisen 15 merkityksen mukaisesti, mainittujen puhenäytteiden mainitun psykoakustisen merkityksen ollessa määrätty mainitusta joukosta parametreja.
28. Patenttivaatimuksen 27 menetelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen 20 puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia, ja jossa valitaan mainittu koodausnopeus, joka varaa toisen lukumäärän bittejä mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen 25 lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä.
29. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen ja siitä johdetun syntetisoidun puheen välillä. 30
30. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä.
31. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäoloa mainitussa puhekehyksessä.
32. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko 10 parametrej a sisältää ennustevahvistusdifferentiaalimittauksen (8), j oka ilmaisee formanttien kehyksestä-kehykseen -stabiliteettia.
33. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee 15 muutoksia energiassa mainitun puhekehyksen energian j a keskimääräisen kehysenergian välillä.
34. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja käsittää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee 20 jaksollisuutta mainituissa puhenäytteissä, koodauslaatusuhteen (2), joka ilmaisee vastaavuudesta puheen aikaisemman kehyksen j a siitä j ohdetun syntetisoidun puheen välillä, ja ennustevahvistusdifferentiaalimittauksen (8), joka ilmaisee formanttiparametrien joukon kehyksestä-kehykseen -stabiliteettia, ja jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) ylittää ennalta määrätyn 25 ensimmäisen kynnyksen, mainittu ennustevahvistusdifferentiaali (8) on alle toisen ennalta määrätyn kynnyksen ja mainittu koodauslaatusub.de (2) ylittää ennalta määrätyn kolmannen kynnyksen, mainittu vaihe koodausmoodin valitsemiksi valitsee puolinopeuksisen koodauksen (30).
35. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää normalisoidun autokorrelaation mittauksen (4), joka ilmaisee jaksollisuutta mainituissa puhenäytteissä, ja nollaylitysten lukeman (6), joka ilmaisee korkeataajuisten komponenttien läsnäoloa mainitussa puhekehyksessä, ja jossa, kun mainittu normalisoitu autokorrelaation mittaus (4) on alle ensimmäisen ennalta määrätyn kynnyksen ja mainittu nollaylitysten lukema (6) ylittää toisen ennalta määrätyn kynnyksen, mainittu vaihe koodausmoodin 5 valitsemiseksi valitsee neljäsosanopeuksisen soinnittoman koodauksen.
36. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu joukko parametreja sisältää kehysenergiadifferentiaalimittauksen (10), joka ilmaisee muutoksia energiassa mainittujen puhenäytteiden energian ja keskimääräisen 10 kehysenergian välillä, ja jossa, kun mainittu kehysenergiadifferentiaalimittaus (10) on alle ennalta määrätyn kynnyksen, mainittu vaihe koodausmoodin valitsemiseksi valitsee neljäsosanopeuksisen soinnillisen koodauksen.
37. Patenttivaatimuksen 27 tai 28 menetelmä, tunnettu siitä, että mainittu ennalta 15 määrätty joukko koodausnopeuksia käsittää täysinopeuden, puolinopeuden j a neljäsosanopeuden.
38. Patenttivaatimuksen 27 menetelmä dynaamisesti muuttamaan puheen kehyksen lähetysnopeutta, joka lähettää mainitulta etäasemalta 20 kommunikaatiojärjestelmälle, tunnettu siitä, että mainittu etäasema kommunikoi keskikommunikaatiokeskuksen kanssa, joka mainittu menetelmä käsittää vaiheet: generoidaan joukko parametreja, jotka ilmaisevat puheen mainitun kehyksen ominaisuuksia mainitun puhekehyksen ja mainitusta puhekehyksestä johdetun signaalin mukaisesti, mainittu joukko parametreja määräämään mainittujen 25 puhenäytteiden psykoakustinen merkitys-vastaanotetaan nopeuskomentosignaali; generoidaan ainakin yksi kynnysarvo mainitun nopeuskomentosignaalin mukaisesti; verrataan parametrien mainitun joukon ainakin yhtä parametria mainittuun 30 ainakin yhteen kynnysarvoon; ja valitaan koodausnopeus mainitun vertailun mukaisesti.
39. Patenttivaatimuksen 38 menetelmä, tunnettu siitä, että mainittu koodausnopeus, joka varaa ensimmäisen lukumäärän bittejä, valitaan mainittujen puhenäytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään suurempia, ja jossa valitaan mainittu 5 koodausnopeus, joka varaa toisen lukumäärän bittejä, mainittujen puheen näytteiden koodaamista varten, kun mainitut puhenäytteet määrätään olemaan psykoakustiselta merkitykseltään vähäisempiä, ja jossa mainittu ensimmäinen lukumäärä bittejä on suurempi kuin mainittu toinen lukumäärä bittejä. 10
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28684294A | 1994-08-05 | 1994-08-05 | |
US28684294 | 1994-08-05 | ||
US9509780 | 1995-08-01 | ||
PCT/US1995/009780 WO1996004646A1 (en) | 1994-08-05 | 1995-08-01 | Method and apparatus for performing reduced rate variable rate vocoding |
Publications (3)
Publication Number | Publication Date |
---|---|
FI961445A0 FI961445A0 (fi) | 1996-03-29 |
FI961445A FI961445A (fi) | 1996-04-02 |
FI120327B true FI120327B (fi) | 2009-09-15 |
Family
ID=23100400
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI961445A FI120327B (fi) | 1994-08-05 | 1996-03-29 | Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi |
FI20070642A FI122726B (fi) | 1994-08-05 | 2007-08-24 | Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20070642A FI122726B (fi) | 1994-08-05 | 2007-08-24 | Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi |
Country Status (19)
Country | Link |
---|---|
US (3) | US5911128A (fi) |
EP (2) | EP1339044B1 (fi) |
JP (4) | JP3611858B2 (fi) |
KR (1) | KR100399648B1 (fi) |
CN (1) | CN1144180C (fi) |
AT (2) | ATE470932T1 (fi) |
AU (1) | AU689628B2 (fi) |
BR (1) | BR9506307B1 (fi) |
CA (1) | CA2172062C (fi) |
DE (2) | DE69536082D1 (fi) |
ES (2) | ES2343948T3 (fi) |
FI (2) | FI120327B (fi) |
HK (1) | HK1015184A1 (fi) |
IL (1) | IL114819A (fi) |
MY (3) | MY114777A (fi) |
RU (1) | RU2146394C1 (fi) |
TW (1) | TW271524B (fi) |
WO (1) | WO1996004646A1 (fi) |
ZA (1) | ZA956078B (fi) |
Families Citing this family (152)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW271524B (fi) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
EP0886927B1 (en) * | 1996-03-27 | 2006-06-07 | Motorola, Inc. | Method and apparatus for providing a multi-party speech connection for use in a wireless communication system |
US6765904B1 (en) | 1999-08-10 | 2004-07-20 | Texas Instruments Incorporated | Packet networks |
US7024355B2 (en) * | 1997-01-27 | 2006-04-04 | Nec Corporation | Speech coder/decoder |
US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
DE69831991T2 (de) * | 1997-03-25 | 2006-07-27 | Koninklijke Philips Electronics N.V. | Verfahren und Vorrichtung zur Sprachdetektion |
US6466912B1 (en) * | 1997-09-25 | 2002-10-15 | At&T Corp. | Perceptual coding of audio signals employing envelope uncertainty |
US6366704B1 (en) * | 1997-12-01 | 2002-04-02 | Sharp Laboratories Of America, Inc. | Method and apparatus for a delay-adaptive rate control scheme for the frame layer |
KR100269216B1 (ko) * | 1998-04-16 | 2000-10-16 | 윤종용 | 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 |
US6912637B1 (en) * | 1998-07-08 | 2005-06-28 | Broadcom Corporation | Apparatus and method for managing memory in a network switch |
US6226618B1 (en) * | 1998-08-13 | 2001-05-01 | International Business Machines Corporation | Electronic content delivery system |
JP3893763B2 (ja) * | 1998-08-17 | 2007-03-14 | 富士ゼロックス株式会社 | 音声検出装置 |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6574334B1 (en) | 1998-09-25 | 2003-06-03 | Legerity, Inc. | Efficient dynamic energy thresholding in multiple-tone multiple frequency detectors |
US6711540B1 (en) * | 1998-09-25 | 2004-03-23 | Legerity, Inc. | Tone detector with noise detection and dynamic thresholding for robust performance |
JP3152217B2 (ja) * | 1998-10-09 | 2001-04-03 | 日本電気株式会社 | 有線伝送装置及び有線伝送方法 |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
KR100391935B1 (ko) * | 1998-12-28 | 2003-07-16 | 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. | 오디오 신호를 코딩 또는 디코딩하는 방법 및 디바이스 |
JP4503853B2 (ja) * | 1999-02-08 | 2010-07-14 | クゥアルコム・インコーポレイテッド | 可変率音声符号化に基づいた音声合成装置 |
US6226607B1 (en) * | 1999-02-08 | 2001-05-01 | Qualcomm Incorporated | Method and apparatus for eighth-rate random number generation for speech coders |
US6519259B1 (en) * | 1999-02-18 | 2003-02-11 | Avaya Technology Corp. | Methods and apparatus for improved transmission of voice information in packet-based communication systems |
US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
US6954727B1 (en) * | 1999-05-28 | 2005-10-11 | Koninklijke Philips Electronics N.V. | Reducing artifact generation in a vocoder |
US6766291B2 (en) * | 1999-06-18 | 2004-07-20 | Nortel Networks Limited | Method and apparatus for controlling the transition of an audio signal converter between two operative modes based on a certain characteristic of the audio input signal |
JP4438127B2 (ja) * | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
CN1196373C (zh) * | 1999-07-05 | 2005-04-06 | 诺基亚公司 | 选择编码方法的方法 |
IL141636A0 (en) * | 1999-07-08 | 2002-03-10 | Samsung Electronics Co Ltd | Data rate detection device and method for a mobile communication system |
US6397175B1 (en) | 1999-07-19 | 2002-05-28 | Qualcomm Incorporated | Method and apparatus for subsampling phase spectrum information |
US6330532B1 (en) | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
US6324503B1 (en) | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions |
US6393394B1 (en) | 1999-07-19 | 2002-05-21 | Qualcomm Incorporated | Method and apparatus for interleaving line spectral information quantization methods in a speech coder |
US6801499B1 (en) | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Diversity schemes for packet communications |
US6678267B1 (en) | 1999-08-10 | 2004-01-13 | Texas Instruments Incorporated | Wireless telephone with excitation reconstruction of lost packet |
US6804244B1 (en) | 1999-08-10 | 2004-10-12 | Texas Instruments Incorporated | Integrated circuits for packet communications |
US6801532B1 (en) | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Packet reconstruction processes for packet communications |
US6757256B1 (en) | 1999-08-10 | 2004-06-29 | Texas Instruments Incorporated | Process of sending packets of real-time information |
US6744757B1 (en) | 1999-08-10 | 2004-06-01 | Texas Instruments Incorporated | Private branch exchange systems for packet communications |
US6505152B1 (en) * | 1999-09-03 | 2003-01-07 | Microsoft Corporation | Method and apparatus for using formant models in speech systems |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
AU2003262451B2 (en) * | 1999-09-22 | 2006-01-19 | Macom Technology Solutions Holdings, Inc. | Multimode speech encoder |
US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US7315815B1 (en) | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6772126B1 (en) * | 1999-09-30 | 2004-08-03 | Motorola, Inc. | Method and apparatus for transferring low bit rate digital voice messages using incremental messages |
US6438518B1 (en) * | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US7127390B1 (en) * | 2000-02-08 | 2006-10-24 | Mindspeed Technologies, Inc. | Rate determination coding |
US6757301B1 (en) * | 2000-03-14 | 2004-06-29 | Cisco Technology, Inc. | Detection of ending of fax/modem communication between a telephone line and a network for switching router to compressed mode |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
ATE420432T1 (de) * | 2000-04-24 | 2009-01-15 | Qualcomm Inc | Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen |
US6584438B1 (en) | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
JP4221537B2 (ja) * | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6477502B1 (en) | 2000-08-22 | 2002-11-05 | Qualcomm Incorporated | Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
DE60029453T2 (de) * | 2000-11-09 | 2007-04-12 | Koninklijke Kpn N.V. | Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US7505594B2 (en) * | 2000-12-19 | 2009-03-17 | Qualcomm Incorporated | Discontinuous transmission (DTX) controller system and method |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US7072908B2 (en) * | 2001-03-26 | 2006-07-04 | Microsoft Corporation | Methods and systems for synchronizing visualizations with audio streams |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
WO2003021573A1 (fr) * | 2001-08-31 | 2003-03-13 | Fujitsu Limited | Codec |
WO2003042648A1 (fr) * | 2001-11-16 | 2003-05-22 | Matsushita Electric Industrial Co., Ltd. | Codeur de signal vocal, decodeur de signal vocal, procede de codage de signal vocal et procede de decodage de signal vocal |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US6647366B2 (en) * | 2001-12-28 | 2003-11-11 | Microsoft Corporation | Rate control strategies for speech and music coding |
US7321559B2 (en) * | 2002-06-28 | 2008-01-22 | Lucent Technologies Inc | System and method of noise reduction in receiving wireless transmission of packetized audio signals |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
CN1703736A (zh) * | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
US7657427B2 (en) | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
FI20021936A (fi) * | 2002-10-31 | 2004-05-01 | Nokia Corp | Vaihtuvanopeuksinen puhekoodekki |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
GB0321093D0 (en) * | 2003-09-09 | 2003-10-08 | Nokia Corp | Multi-rate coding |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
US7277031B1 (en) * | 2003-12-15 | 2007-10-02 | Marvell International Ltd. | 100Base-FX serializer/deserializer using 10000Base-X serializer/deserializer |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7412378B2 (en) * | 2004-04-01 | 2008-08-12 | International Business Machines Corporation | Method and system of dynamically adjusting a speech output rate to match a speech input rate |
EP1775718A4 (en) * | 2004-07-22 | 2008-05-07 | Fujitsu Ltd | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
GB0416720D0 (en) * | 2004-07-27 | 2004-09-01 | British Telecomm | Method and system for voice over IP streaming optimisation |
WO2006041055A1 (ja) * | 2004-10-13 | 2006-04-20 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 |
US8102872B2 (en) * | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
US20060200368A1 (en) * | 2005-03-04 | 2006-09-07 | Health Capital Management, Inc. | Healthcare Coordination, Mentoring, and Coaching Services |
US20070160154A1 (en) * | 2005-03-28 | 2007-07-12 | Sukkar Rafid A | Method and apparatus for injecting comfort noise in a communications signal |
TWI279774B (en) * | 2005-04-14 | 2007-04-21 | Ind Tech Res Inst | Adaptive pulse allocation mechanism for multi-pulse CELP coder |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US8743909B2 (en) * | 2008-02-20 | 2014-06-03 | Qualcomm Incorporated | Frame termination |
US8630602B2 (en) * | 2005-08-22 | 2014-01-14 | Qualcomm Incorporated | Pilot interference cancellation |
US9071344B2 (en) * | 2005-08-22 | 2015-06-30 | Qualcomm Incorporated | Reverse link interference cancellation |
US8594252B2 (en) * | 2005-08-22 | 2013-11-26 | Qualcomm Incorporated | Interference cancellation for wireless communications |
US9014152B2 (en) * | 2008-06-09 | 2015-04-21 | Qualcomm Incorporated | Increasing capacity in wireless communications |
US8611305B2 (en) * | 2005-08-22 | 2013-12-17 | Qualcomm Incorporated | Interference cancellation for wireless communications |
KR101019936B1 (ko) | 2005-12-02 | 2011-03-09 | 퀄컴 인코포레이티드 | 음성 파형의 정렬을 위한 시스템, 방법, 및 장치 |
US8219392B2 (en) | 2005-12-05 | 2012-07-10 | Qualcomm Incorporated | Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
KR100770895B1 (ko) * | 2006-03-18 | 2007-10-26 | 삼성전자주식회사 | 음성 신호 분리 시스템 및 그 방법 |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
EP2092517B1 (en) * | 2006-10-10 | 2012-07-18 | QUALCOMM Incorporated | Method and apparatus for encoding and decoding audio signals |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
DE602006015328D1 (de) * | 2006-11-03 | 2010-08-19 | Psytechnics Ltd | Abtastfehlerkompensation |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
JP5171842B2 (ja) | 2006-12-12 | 2013-03-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法 |
KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) * | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
CN101217037B (zh) * | 2007-01-05 | 2011-09-14 | 华为技术有限公司 | 对音频信号的编码速率进行源控的方法和系统 |
US8553757B2 (en) * | 2007-02-14 | 2013-10-08 | Microsoft Corporation | Forward error correction for media transmission |
JP2008263543A (ja) * | 2007-04-13 | 2008-10-30 | Funai Electric Co Ltd | 記録再生装置 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
US8321222B2 (en) * | 2007-08-14 | 2012-11-27 | Nuance Communications, Inc. | Synthesis by generation and concatenation of multi-form segments |
CN101889306A (zh) | 2007-10-15 | 2010-11-17 | Lg电子株式会社 | 用于处理信号的方法和装置 |
US8326617B2 (en) * | 2007-10-24 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement with minimum gating |
US8015002B2 (en) | 2007-10-24 | 2011-09-06 | Qnx Software Systems Co. | Dynamic noise reduction using linear model fitting |
US8606566B2 (en) * | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
US9237515B2 (en) | 2008-08-01 | 2016-01-12 | Qualcomm Incorporated | Successive detection and cancellation for cell pilot detection |
US9277487B2 (en) | 2008-08-01 | 2016-03-01 | Qualcomm Incorporated | Cell detection with interference cancellation |
KR101797033B1 (ko) | 2008-12-05 | 2017-11-14 | 삼성전자주식회사 | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 |
EP2237269B1 (en) | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
US9160577B2 (en) * | 2009-04-30 | 2015-10-13 | Qualcomm Incorporated | Hybrid SAIC receiver |
CN101615910B (zh) * | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
US8787509B2 (en) | 2009-06-04 | 2014-07-22 | Qualcomm Incorporated | Iterative interference cancellation receiver |
CN102483926B (zh) | 2009-07-27 | 2013-07-24 | Scti控股公司 | 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法 |
US9269366B2 (en) * | 2009-08-03 | 2016-02-23 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
US8831149B2 (en) | 2009-09-03 | 2014-09-09 | Qualcomm Incorporated | Symbol estimation methods and apparatuses |
CN102668612B (zh) | 2009-11-27 | 2016-03-02 | 高通股份有限公司 | 增加无线通信中的容量 |
US9673837B2 (en) | 2009-11-27 | 2017-06-06 | Qualcomm Incorporated | Increasing capacity in wireless communications |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
TWI759223B (zh) * | 2010-12-03 | 2022-03-21 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
KR20120116137A (ko) * | 2011-04-12 | 2012-10-22 | 한국전자통신연구원 | 음성 통신 장치 및 그 방법 |
TWI606441B (zh) | 2011-05-13 | 2017-11-21 | 三星電子股份有限公司 | 解碼裝置 |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
JP6265903B2 (ja) * | 2011-10-19 | 2018-01-24 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 信号雑音減衰 |
US9047863B2 (en) * | 2012-01-12 | 2015-06-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for criticality threshold control |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
US9570095B1 (en) * | 2014-01-17 | 2017-02-14 | Marvell International Ltd. | Systems and methods for instantaneous noise estimation |
US9793879B2 (en) * | 2014-09-17 | 2017-10-17 | Avnera Corporation | Rate convertor |
US10061554B2 (en) * | 2015-03-10 | 2018-08-28 | GM Global Technology Operations LLC | Adjusting audio sampling used with wideband audio |
JP2017009663A (ja) * | 2015-06-17 | 2017-01-12 | ソニー株式会社 | 録音装置、録音システム、および、録音方法 |
US10269375B2 (en) * | 2016-04-22 | 2019-04-23 | Conduent Business Services, Llc | Methods and systems for classifying audio segments of an audio signal |
CN113314133A (zh) * | 2020-02-11 | 2021-08-27 | 华为技术有限公司 | 音频传输方法及电子设备 |
CN112767953B (zh) * | 2020-06-24 | 2024-01-23 | 腾讯科技(深圳)有限公司 | 语音编码方法、装置、计算机设备和存储介质 |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US32580A (en) * | 1861-06-18 | Water-elevatok | ||
US3633107A (en) * | 1970-06-04 | 1972-01-04 | Bell Telephone Labor Inc | Adaptive signal processor for diversity radio receivers |
JPS5017711A (fi) * | 1973-06-15 | 1975-02-25 | ||
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
DE3023375C1 (fi) * | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
US4379949A (en) * | 1981-08-10 | 1983-04-12 | Motorola, Inc. | Method of and means for variable-rate coding of LPC parameters |
DE3266204D1 (en) * | 1981-09-24 | 1985-10-17 | Gretag Ag | Method and apparatus for redundancy-reducing digital speech processing |
USRE32580E (en) | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
DE3276651D1 (en) * | 1982-11-26 | 1987-07-30 | Ibm | Speech signal coding method and apparatus |
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
US4672670A (en) * | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
US4856068A (en) * | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US4797929A (en) * | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
EP0331858B1 (en) * | 1988-03-08 | 1993-08-25 | International Business Machines Corporation | Multi-rate voice encoding method and device |
EP0331857B1 (en) * | 1988-03-08 | 1992-05-20 | International Business Machines Corporation | Improved low bit rate voice coding method and system |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4864561A (en) * | 1988-06-20 | 1989-09-05 | American Telephone And Telegraph Company | Technique for improved subjective performance in a communication system using attenuated noise-fill |
US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
EP0392126B1 (en) * | 1989-04-11 | 1994-07-20 | International Business Machines Corporation | Fast pitch tracking process for LTP-based speech coders |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
JPH03181232A (ja) * | 1989-12-11 | 1991-08-07 | Toshiba Corp | 可変レート符号化方式 |
US5103459B1 (en) * | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH0580799A (ja) * | 1991-09-19 | 1993-04-02 | Fujitsu Ltd | 可変レート音声符号化器 |
JP3327936B2 (ja) * | 1991-09-25 | 2002-09-24 | 日本放送協会 | 話速制御型補聴装置 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5513297A (en) * | 1992-07-10 | 1996-04-30 | At&T Corp. | Selective application of speech coding techniques to input signal segments |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5774496A (en) * | 1994-04-26 | 1998-06-30 | Qualcomm Incorporated | Method and apparatus for determining data rate of transmitted variable rate data in a communications receiver |
TW271524B (fi) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US5974079A (en) * | 1998-01-26 | 1999-10-26 | Motorola, Inc. | Method and apparatus for encoding rate determination in a communication system |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
-
1995
- 1995-07-08 TW TW084107077A patent/TW271524B/zh not_active IP Right Cessation
- 1995-07-20 ZA ZA956078A patent/ZA956078B/xx unknown
- 1995-07-31 MY MYPI95002226A patent/MY114777A/en unknown
- 1995-07-31 MY MYPI20070660A patent/MY137264A/en unknown
- 1995-07-31 MY MYPI20021851A patent/MY129887A/en unknown
- 1995-08-01 EP EP03005273A patent/EP1339044B1/en not_active Expired - Lifetime
- 1995-08-01 ES ES03005273T patent/ES2343948T3/es not_active Expired - Lifetime
- 1995-08-01 CN CNB951907239A patent/CN1144180C/zh not_active Expired - Lifetime
- 1995-08-01 CA CA2172062A patent/CA2172062C/en not_active Expired - Lifetime
- 1995-08-01 AT AT03005273T patent/ATE470932T1/de not_active IP Right Cessation
- 1995-08-01 AU AU32095/95A patent/AU689628B2/en not_active Expired
- 1995-08-01 AT AT95928266T patent/ATE388464T1/de not_active IP Right Cessation
- 1995-08-01 RU RU96110286A patent/RU2146394C1/ru active
- 1995-08-01 EP EP95928266A patent/EP0722603B1/en not_active Expired - Lifetime
- 1995-08-01 JP JP50672896A patent/JP3611858B2/ja not_active Expired - Lifetime
- 1995-08-01 WO PCT/US1995/009780 patent/WO1996004646A1/en active Application Filing
- 1995-08-01 DE DE69536082T patent/DE69536082D1/de not_active Expired - Lifetime
- 1995-08-01 DE DE69535723T patent/DE69535723T2/de not_active Expired - Lifetime
- 1995-08-01 KR KR1019960701753A patent/KR100399648B1/ko not_active IP Right Cessation
- 1995-08-01 ES ES95928266T patent/ES2299175T3/es not_active Expired - Lifetime
- 1995-08-01 BR BRPI9506307-2A patent/BR9506307B1/pt not_active IP Right Cessation
- 1995-08-03 IL IL11481995A patent/IL114819A/xx not_active IP Right Cessation
-
1996
- 1996-03-29 FI FI961445A patent/FI120327B/fi not_active IP Right Cessation
-
1997
- 1997-03-11 US US08/815,354 patent/US5911128A/en not_active Expired - Lifetime
-
1998
- 1998-12-28 HK HK98116180A patent/HK1015184A1/xx not_active IP Right Cessation
-
1999
- 1999-02-12 US US09/252,595 patent/US6240387B1/en not_active Expired - Lifetime
-
2001
- 2001-04-12 US US09/835,258 patent/US6484138B2/en not_active Expired - Lifetime
-
2004
- 2004-07-27 JP JP2004219254A patent/JP4444749B2/ja not_active Expired - Lifetime
-
2007
- 2007-08-24 FI FI20070642A patent/FI122726B/fi not_active IP Right Cessation
-
2008
- 2008-02-14 JP JP2008033680A patent/JP4778010B2/ja not_active Expired - Lifetime
-
2009
- 2009-11-18 JP JP2009262773A patent/JP4851578B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI120327B (fi) | Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi | |
EP1340223B1 (en) | Method and apparatus for robust speech classification | |
US7203638B2 (en) | Method for interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs | |
US6584438B1 (en) | Frame erasure compensation method in a variable rate speech coder | |
EP1214705B1 (en) | Method and apparatus for maintaining a target bit rate in a speech coder | |
JP2011237809A (ja) | フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ | |
EP1808852A1 (en) | Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs | |
Chen | Adaptive variable bit-rate speech coder for wireless applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Ref document number: 120327 Country of ref document: FI |
|
MA | Patent expired |