FI112004B - Menetelmä ja laite spektriparametrien kvantisointiin digitaalisissa puhekoodereissa - Google Patents

Menetelmä ja laite spektriparametrien kvantisointiin digitaalisissa puhekoodereissa Download PDF

Info

Publication number
FI112004B
FI112004B FI942762A FI942762A FI112004B FI 112004 B FI112004 B FI 112004B FI 942762 A FI942762 A FI 942762A FI 942762 A FI942762 A FI 942762A FI 112004 B FI112004 B FI 112004B
Authority
FI
Finland
Prior art keywords
indexes
signal
parameters
frame
value
Prior art date
Application number
FI942762A
Other languages
English (en)
Swedish (sv)
Other versions
FI942762A (fi
FI942762A0 (fi
Inventor
Daniele Sereno
Original Assignee
Telecom Italia Spa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telecom Italia Spa filed Critical Telecom Italia Spa
Publication of FI942762A0 publication Critical patent/FI942762A0/fi
Publication of FI942762A publication Critical patent/FI942762A/fi
Application granted granted Critical
Publication of FI112004B publication Critical patent/FI112004B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Spectrometry And Color Measurement (AREA)

Description

112004
Menetelmä ja laite spektriparametrien kvantisointiin digitaalisissa puhekoodereissa
Esillä oleva keksintö liittyy digitaalisiin puhekoodereihin ja tarkemmin 5 se kohdistuu menetelmään ja laitteeseen spektriparametrien kvantisointiin näissä koodereissa.
Puhekoodausjärjestelmät, jotka sallivat korkealaatuisen koodatun puheen saamisen alhaisella bittitiheydellä ovat tulossa yhä vain kiinnostavammiksi. Bittitiheyden pienennys esimerkiksi sallii suuremman määrän resursseja 10 antamisen redundanssille, jota informaation suojaaminen kiinteänopeuksisissa lähetyksissä tai keskimääräisen nopeuden pienentäminen vaihtelevan nopeuden lähetyksissä edellyttää.
Tekniikat, jotka mahdollistavat tämän tarkoituksen saavuttamisen, ovat lineaarinen ennustekoodaus (LPC) -tekniikka, joka käyttää puheen 15 spektriominaisuuksia.
Bittitiheyden pienentämiseksi on jo ehdotettu käytettäväksi korrelaatiota, jota esiintyy tiettyjen spektriparametrien välillä signaalikehyksen sisällä tai peräkkäisten signaalikehyksien välillä, jotta vältettäisiin vastaanottimessa helposti ennustettavan ja siten rekonstruoitavissa olevan informaation 20 lähettäminen. Esimerkkejä näistä ehdotuksista on esitetty paperissa "Low bit-, . : rate quantization of LSP parameters using two-dimensional differential ’ coding", Chih-Chung Kuo et ai., ICASSP-92, San Francisco, USA, 23. - 26.
," maaliskuuta 1992, sivut I-97 -1-100, ja "A long history quantization approach to " scalar and vector quantization of LSP coefficients", by C.S. Xideas ja K.K.M.
*· 25 So, ICASSP-93, Minneapolis, USA, 27. - 30. huhtikuuta 1993, sivut 11-1 - II-4.
• * · ··>: Ensimmäinen paperi perustuu viivaspektriparien lineaariseen v : ennustamiseen saman kehyksen sisällä ja peräkkäisten kehyksien välillä siten, että vain ennustejäännökset kvantisoidaan ja koodataan. Tarjotaan mahdolli-suus näiden jäännösten skalaari- tai vektorikvantisointiin. Kvantisointilaki on 30 kiinteä ja niinpä se voi ottaa huomioon ainoastaan "keskimääräisen" korrelaa-. \ tion, mikä antaa rajallisen parannuksen tavanomaiseen tekniikkaan nähden.
Toinen paperi esittää tiettyyn kehykseen liittyvän parametriryhmän • · *;·’ kvantisoinnin käyttäen koodikirjaa, joka muodostuu N:stä ryhmästä ; dekoodattuja parametrejä, jotka liittyvät N:ään edeltävään kehykseen tai 35 aikaisemmista kehyksistä erotettuun N:n kehyksen joukkoon, siten, että ainoastaan nimenomainen ryhmäindeksi tulee lähettää. Tässä tapauksessa myös käytetään skalaari- tai vektorikvantisointia. Tämän tekniikan haittana on, 112004 2 että adaptiivisen koodikirjan, joka perustuu signaalin dekoodauksissa saatuihin tuloksiin, käyttö tekee kooderin erityisen herkäksi kanavavirheille.
Keksinnön päämääränä on kvantisointitekniikka, joka perustuu erityiselle signaaliluokittelulle, joka käyttää efektiivistä korrelaatiota eikä ainoastaan 5 keskimääräistä korrelaatiota, ja joka tuskin on herkkä kanavavirheille.
Keksintö antaa menetelmän puhesignaalin digitaaliseen koodaukseen, jossa signaali muunnetaan digitaalisten näytteiden sekvenssiksi jaettuna kehyksiin ennalta asetetulla määrällä näytteitä, ja jossa signaalille suoritetaan spektrianalyysi, jotta synnytettäisiin ainakin yksi ryhmä spektriparametreja, 10 jotka kvantisoidaan ja muunnetaan ensimmäiseksi indeksijoukoksi, ja jossa lisäksi, koodausvaiheen aikana, suuren korrelaation puhejaksot tunnistetaan kussakin kehyksessä alkaen ensimmäisen joukon indekseistä, ja näille jaksoille ensimmäinen indeksijoukko muunnetaan toiseksi joukoksi, joka voidaan koodata pienemmällä lukumäärällä bittejä kuin on tarpeen ensimmäi-15 sen joukon koodaamiseen, ja toinen indeksijoukko sijoitetaan koodattuun signaaliin yhdessä signaloinnin kanssa, joka ilmaisee, että muunnos on tapahtunut, samalla kun muille jaksoille ensimmäinen indeksijoukko sijoitetaan koodattuun signaaliin.
Keksintö antaa myös menetelmän toteuttamiseksi laitteen, joka 20 sisältää koodauspuolella: välineet, joilla: tunnistetaan alkaen ensimmäisen joukon indekseistä kehykset, joissa puhesignaali edustaa suurta korrelaatiota, muunnetaan, näille : kehyksille, ensimmäinen indeksijoukko toiseksi indeksijoukoksi, joka voidaan koodata alhaisemmalla lukumäärällä bittejä kuin on välttämätöntä : 25 ensimmäisen joukon indeksien koodaamiseen; ja synnytetään ja lähetetään .dekooderiin signalointi, joka ilmaisee, että muunnos on tapahtunut; ja ‘välineet, joilla syötetään näissä kehyksissä koodatun signaalin synnyttäville välineille toinen indeksijoukko ensimmäisen indeksijoukon sijasta.
.. , Keksinnön ensisijainen toteutus kuvataan nyt viitaten oheisiin • # · 30 piirroksiin, joissa: ’ · ·: kuvio 1 on kaavamainen esitys keksintöä käyttävän kooderin lähettimestä; ' kuvio 2 on lohkokaavio esillä olevan keksinnön mukaisesta kvantisointi- * » * » ; ’ ”: piiristä; ja kuvio 3 on vastaanottimen kaavio.
> : " 35 Kuvioi esittää LPC-kooderin lähetintä yleisemmässä tapauksessa, ' jossa käytetään puhesignaalin lyhyen aikavälin ja pitkän aikavälin spek- triominaisuuksia. Puhesignaali, jonka synnyttää esim. mikrofoni MF, 112004 3 muunnetaan analogia-digitaali-muuntimella AN digitaalisten näytteiden x(n) sekvenssiksi, joka sitten jaetaan ennalta asetetun pituisiin kehyksiin puskurissa TR. Nämä kehykset lähetetään lyhyen aikavälin analyysipiireihin, kaavamaisesti esitetty lohkolla ABT, jotka sisältävät yksiköitä lyhyen aikavälin 5 spektriparametrien estimointiin ja kvantisointiin, ja lineaarisen ennustesuodatti-men, joka synnyttää lyhyen aikavälin ennustejäännössignaalin. Spek-triparametrit voivat olla lineaarisia ennustekertoimia, viivaspektripareja (LSP) tai mikä tahansa muu muuttujajoukko, joka edustaa puhesignaalin spek-triominaisuuksia. Käytettyjen parametrien tyyppi ja niille suoritettavan 10 kvantisoinnin tyyppi, ei ole esillä olevan keksinnön kannalta kiinnostavaa; esimerkin vuoksi kuitenkin viittaamme viivaspektripareihin olettaen, että 9 tai 10 kerrointa synnytetään 20 ms kehykselle, ja että ne kvantisoidaan skalaarisesti. Liitoskohdassa 1 tapahtuneen kvantisoinnin seurauksena saadaan ensimmäinen indeksiryhmä ji, joka voidaan suoraan viedä koodausyksiköihin CV 15 tai alistaa jatkoprosessoinnille, kuten myöhemmin nähdään.
Lyhyen aikavälin ennustusjäännös r(n), joka on ABT:n lähdössä 2, viedään pitkän aikavälin analyysipiireihin ALT, jotka laskevat ja kvantisoivat toisen parametriryhmän (tarkemmin viive d, joka liittyy äänijaksoon, ja pitkän aikavälin ennusteen kerroin b) ja synnyttävät toisen indeksiryhmän j2, joka 20 viedään yksiköihin CV liitoskohdan 3 kautta. Lopuksi viritysgeneraattori GE lähettää yksiköihin CV liitoskohdan 4 kautta kolmannen indeksiryhmän j3, joka
» I
edustaa informaatiota, joka liittyy vallitsevaan kehykseen käytettävään . virityssignaaliin. Yksiköt CV lähettävät liitoskohdassa 5 koodatun signaalin x(n), joka sisältää informaatiota lyhyen aikavälin ja pitkän aikavälin analyysi-\: 25 parametreista ja virityksestä.
On tunnettua, että tietyissä olosuhteissa, tarkemmin sanottuna erittäin soinnillisilla äänillä, puheen spektriominaisuudet muuttuvat nopeudella, * » · joka on alhaisempi kuin kehystaajuus ja spektrin muoto vaihtelee hyvin vähän . . useiden vierekkäisten kehyksien aikana. Tämä aiheuttaa muutaman :is;‘ 30 viivaspektrikertoimen pienen modifioinnin.
'··* Keksinnön mukaan tätä seikkaa käytetään hyväksi sijoittamalla ; lyhyen aikavälin analyysipiirien ja koodausyksiköiden CV väliin laite DQ, joka
> I t I
tunnistaa korrelaation ja kvantisoi spektriparametreja, mikä sallii kooderin toimia eri toimintamuodossa riippuen siitä, esiintyykö puhesegmentissä suurta • _ 35 lyhyen aikavälin korrelaatiota. Laite DQ käyttää indeksejä ji suuresti ‘ · * ·: korreloituneita osia ja antaa lähdössä 6 lipun C, joka on esimerkiksi 1 korreloi- tuneen signaalin tapauksessa, ja joka myös lähetetään vastaanottimeen.
112004 4
Korreloitaneen signaalin tapauksessa indeksit ji muunnetaan indeksiryhmäksi j4, joka voidaan koodata alhaisemmalla bittimäärällä kuin vaaditaan indeksien ji koodaamiseen, ja jotka viedään liitoskohtaan 7. Multiplekseri MX, jota ohjaa lippu C, siirtää yksiköihin CV indeksit ji, jos signaali ei ole korreloitunut, tai 5 indeksit j4, jos signaali on korreloitunut.
Tarkemmin sanoen, kussakin kehyksessä piiri DQ laskee eron kunkin indeksin ji ja arvon, joka sillä oli edellisessä kehyksessä, välillä ja asettaa lipun C arvoon 1, jos kaikkien erojen δ, absoluuttiarvo on pienempi kuin ennalta asetettu kynnys s. Ensisijaisessa toteutuksessa | s | =2. Jos C on 10 1, suoritetaan arvojen δ\, ryhmiteltyinä sopivasti alijoukkoihin, vektorikvanti- sointi. Jos P on arvojen lukumäärä alijoukossa, esiintyy N = (2s + 1)p arvo-yhdistelmää, ja kullekin alijoukolle nimenomaista yhdistelmää vastaava indeksi lähetetään koodausyksiköihin CV. On todettava, että saman kokoisten alijoukkojen tapauksessa, indeksi, joka vastaa suurimman sarjanumeron viiva-15 spektriparikomponenttia, voidaan jättää huomiotta eroja laskettaessa. Esimerkiksi jos käytetään 10 indeksiä ji, erot lasketaan ainoastaan 9:lle ensimmäiselle. On kuitenkin mahdollista käyttää eri kokoisia alijoukkoja.
Tarkasteltavan esimerkin tapauksessa indeksit ji jaetaan kolmeen alijoukkoon, jossa kussakin on 3 indeksiä ja kutakin näistä alijoukosta edustaa 20 vastaava indeksi j(4,0), j(4,1), j(4,2). Koska tarkasteltava väli sisältää 5 eroarvoa, 53 = 125 arvokolmikkoa on mahdollista ja kukin indeksi j4 voidaan f koodata CV.ssä 7:llä bitillä, kaiken kaikkiaan 21 bitillä. Voidaan myös todeta, että 7 bittiä sallisi 128 arvokombinaation koodaamisen: kolmea kombinaatiota, ».
•,, jotka eivät vastaa mitään mahdollista eroarvojen kolmikkoa, voidaan käyttää ; : 25 vastaanottimessa lähetysvirheiden tunnistamiseen.
Vertailun vuoksi mainittakoon, että alhaisen bittitiheyden kooderi, joka ei käytä keksintöä, kuvattu paperissa "A 5.85 kb/s CELP algorithm for > * · cellular applications", keksijän et ai. esittämä ICASSP 93:ssa, esittää lyhyen , , aikavälin analyysiparametrit 10 kertoimella, kukin koodattuna 3 bitillä, ja : 30 edellyttää siten 30 bittiä per kehys. Kun otetaan huomioon, että keksintö ;·*’ edellyttää 1 bitin lähettämistä lipun C koodaamiseksi puhejaksoille, joilla signaalia voidaan pitää korreloituneena (tässä kuvatun arviointikriteerin
’ i · I
; ’11. mukaan), ja jotka muodostavat noin 40 % keskustelusta, keksintö sallii I * 4 spektriparametrien bittitiheyden pienentämisen enemmän kuin 25 %. Keski-
I I
: 35 määräinen bittitiheyden pienennys on näin ollen merkittävä. 9 spekt- riparametrin käyttö 10 spektriparametrin sijasta näillä jaksoilla ei merkitse koodatun signaalin merkittävää heikkenemistä.
112004 5
Kuvio 2 esittää DQ:n mahdollisen piiritoteutuksen viitaten aina yllä mainittuun numeeriseen esimerkkiin. Indeksit j(1,0) - j(1,8), jotka ovat linjoilla 10 - 18 (muodostaen kaikki yhdessä liitoskohdan 1) viedään vastaaviin positiivisiin tuloihin vähentäjissä S0...S8, jotka vastaanottavat negatiivisessa 5 tulossaan edelliseen kehykseen liittyvät indeksit, jotka ovat muistielinten M0...M8 lähdöissä. S0...S8:ien laskemat erot δο.,.δβ viedään kynnyspiireihin CS0...CS8, jotka suorittavat vertailut kynnysten +s ja -s kanssa ja synnyttävät lähtösignaalin, jonka looginen arvo ilmaisee, osuuko tuloarvo kynnysvälille. Esimerkiksi, signaali on 1, jos tuloarvo osuu välille. CS0...CS8:n lähtösignaalit 10 viedään sitten lipun C synnyttävään piiriin, jota kuvaa AND-veräjä AN, jonka lähtö on liitoskohta 6.
Erot δ\ lähetetään vektorikvantisointipiireihin QV0...QV2, joista kukin vastaanottaa kolme arvoa 6\ ja lähettää lähdössään 70...72 yhden indekseistä j(4,0)...j(4,2). Piirit QV voidaan toteuttaa lukumuisteilla, joita osoitetaan 15 syöttöarvokolmikoilla. Jotta vältettäisiin arvotaulukoiden tallettaminen, voidaan käyttää eroarvojakaumaa ja piirit QV voidaan toteuttaa käyttämällä vain yhtä aritmeettista yksikköä, joka laskee indeksit yksinkertaisella algoritmilla. Yksinkertaisuuden vuoksi tarkastellaan ensimmäiseen kolmeen eroon liittyvää arvokolmikkojen taulukkoa: 20 δο <5i ($2 j(4,0) -2 -2 -2 0 i -2 -2 -1 1 ; -2-2 0 2 ; .. -2 -2 +1 3 !· : 25 -2 -2 +2 4 -2 -1 -2 5 +2 +2 +2 124
• I I
·’ ** 30 Ottaen huomioon että arvot 62 ovat erilaiset rivi riviltä (lukuunotta- :: matta jaksollisuutta 5 rivin ryhmin), arvot <Ji muuttuvat joka 5. rivi ja arvot δο » • :*: muuttuvat joka 25. rivi, geneerisen arvokolmikon indeksi j(4,0) tyydyttää » * I » . · · ·. relaation •» · : 35 j(4,0) = 25(<$0+2) + 5(<$i+2) + (<S2+2) (1) » » « * ·
Arvo +2 (ts. positiivinen kynnysarvo) lisätään kaikkiin arvoihin δ, 112004 6 vain jotta saataisiin kaikki arvot positiivisiksi, sillä tämä helpottaa laskentaa. Yleisesti, jos w = 0,1,2 ilmaisee geneerisen eroalijoukon, esiintyy relaatio j(4,w) = 25[<5(0+3w)+2] + 5[rf(1+3w)+2] + [<5(2+3w)+2] (2) 5 joka lasketaan kussakin kehyksessä kolmella w:n arvolla. (1) ja (2) ovat välittömästi laajennettavissa alijoukkojen tapaukseen, missä P on mikä tahansa erojen lukumäärä ja | s | :llä mikä tahansa arvo.
On myös huomattava, että tietyt erokonfiguraatiot, jos tuskin mah-10 dollisia, voidaan jättää huomiotta, jolloin lähetysvirheiden tunnistuskyky lisääntyy.
Kuvio 3 esittää vastaanottimen lohkokaavion. Vastaanotin sisältää suodatusjärjestelmän eli syntesoijan FS, joka lisää virityssignaalin päälle pitkän aikavälin ja lyhyen aikavälin spektriominaisuuksia ja synnyttää dekoodatun 15 digitaalisen signaalin y(n). Lyhyen aikavälin ja pitkän aikavälin spektriominaisuuksia ja viritystä edustavat parametrit syötetään FS:ään vastaavien dekooderien DJ1, DJ2, DJ3 toimesta, jotka dekoodaavat koodatun signaalin oikeat bittiryhmät, jotka ovat liitoskohdan 5 lankaryhmissä 5a, 5b, 5c.
Lyhyen aikavälin synteesiparametrien rekonstruoimiseksi täytyy 20 ottaa huomioon, että kooderin lähettämä informaatio on erilaista riippuen siitä, liittyykö se suuresti korreloituneeseen puhejaksoon vai ei. Dekooderin DJ1 j tulee sen vuoksi vastaanottaa joko suoraan CV:stä tuleva informaatio (ei- korreloituneen signaalin tapauksessa) tai informaatio, jota on prosessoitu ottamaan huomioon kooderissa tapahtunut lisäkvantisointi korreloituneen
; : 25 signaalin tapauksessa. Tätä varten lipun C ohjaama demultiplekseri DM
» :. syöttää langoilla 5a olevat signaalit joko DJ1 :een kytkettyyn lähtöön 50 (jos C = ·, 0), tai yksiköihin DJ4 kytkettyyn lähtöön 51 (j°s C = 1), jotka suorittavat * * käänteisen kvantisoinnin yksiköiden QV0 - QV2 suorittamalle kvantisoinnille ., . (kuvio 2) ja sitten rekonstruoivat erot δ\. Riippuen yksiköiden QV, rakenteesta, 30 DJ4 lukee arvot sopiviin taulukoihin ja suorittaa edellä kuvatulle algoritmille ; ’ käänteisen algoritmin. Tässä toisessa tapauksessa nähdään välittömästi, että ; geneerinen erokolmikko saadaan indeksistä j(4,w) käyttämällä relaatioita ; <S(0+3w) = int[j(4,w). 0,04] 35 <$(1+3w) = int(ö(4,w) - 25 . <$(0+3w)] - 0,2} (3) : <i(2+3w) = j(4,w) - 25 - J(0+3w) - 5 - <5(1 +3w) 112004 7 missä "int" merkitsee suluissa olevan suureen kokonaislukuosaa ja kertomiset suoritetaan 0,04 ja 0,2, jotta vältettäisiin jakamiset 25:llä ja 5:llä. Myös relaatiot (3) tulee laskea kussakin kehyksessä kaikille arvokolmikoille. (3):n antamiin arvoihin on lisättävä -2 (ts. -s), jotta huomioitaisiin kooderissa tapahtunut 5 skaalaus. Rekonstruoidut erot summataan summaajissa SD edelliseen kehykseen liittyvien indeksien ji arvoihin, jotka ovat viive-elinten RT lähdössä, jolloin saadaan vallitsevaan kehykseen liittyvät indeksit ji. Summaajien SD lähdöt kytketään DJ1:een OR-veräjän PO kautta, joka myös on kytketty lankoihin 50.
10 On ilmeistä, että kuvatut seikat on annettu ainoastaan ei-rajoitta- vana esimerkkinä, ja että muunnelmat ja modifikaatiot ovat mahdollisia poikkeamatta keksinnön suoja-alueesta. Täten, vaikka edellä onkin viitattu lyhyen aikavälin analyysiparametrien kvantisointiin, keksintöä voidaan vaihtoehtoisesti tai lisäksi soveltaa muun tyyppisiin parametreihin, erityisesti 15 pitkän aikavälin parametreihin, vaikka näissä korrelaatio on vähemmän tärkeää ja edut sen vuoksi vähemmän näkyviä. Edelleen erokvantisointitaulu-kot voivat olla erilaisia erojen erinäisille ryhmille. Suuren korrelaation puhejaksojen nimenomaista kvantisointia voidaan käyttää myös koodereissa, joissa käytetään eri koodausstrategioita sen mukaan, onko ääni soinnillista vai 20 soinnitonta.
·
' I

Claims (11)

112004
1. Menetelmä puhesignaalin digitaaliseen koodaukseen, jossa signaali muunnetaan digitaalisten näytteiden sekvenssiksi jaettuna kehyksiin 5 ennalta asetetulla määrällä näytteitä, ja jossa signaalille suoritetaan spektri-analyysi, jotta synnytettäisiin ainakin yksi ryhmä spektriparametreista, jotka kvantisoidaan ja muunnetaan ensimmäiseksi indeksijoukoksi (ji), tunnettu siitä, että koodausvaiheen aikana suuren korrelaation puhejaksot tunnistetaan kussakin kehyksessä alkaen ensimmäisen joukon indekseistä, ja näille 10 jaksoille ensimmäinen indeksijoukko (ji) muunnetaan toiseksi joukoksi (j4), joka voidaan koodata pienemmällä lukumäärällä bittejä kuin on tarpeen ensimmäisen joukon koodaamiseen, ja toinen indeksijoukko (j^) sijoitetaan koodattuun signaaliin yhdessä signaloinnin kanssa, joka ilmaisee, että muunnos on tapahtunut, samalla kun muille jaksoille ensimmäinen indeksijoukko 15 sijoitetaan koodattuun signaaliin.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että erot lasketaan vallitsevalle kehykselle synnytettyjen ensimmäisen joukon indeksien (ji) ja edelliselle kehykselle synnytettyjen indeksien välillä; kyseisten erojen absoluuttiarvoja verrataan kynnykseen; synnytetään lippu (C), joka 20 muodostaa signaloinnin, ja jolla on ennalta asetettu looginen arvo, joka ilmaisee suuren korrelaation jaksoja, kun kaikki absoluuttiarvot ovat kynnyksen .*·; rajoittamalla arvoalueella; ja suuren korrelaation jaksoille nämä erot jaetaan : .· ryhmiin ja suoritetaan yksittäisten ryhmien vektorikvantisointi synnyttäen toinen ' ., indeksijoukko (j4). : 25
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että spektriparametrit ovat vähintäänkin puhesignaalin lyhyen aikavälin ' i!. korrelaatiota edustavia parametreja. » I
4. Minkä tahansa edeltävän patenttivaatimuksen mukainen mene-.. , telmä, tunnettu siitä, että toisen joukon indeksit (j4) lasketaan suoraan \30 kussakin kehyksessä alkaen kussakin ryhmässä olevista eroarvoista, ilman ’ · · ·: kvantisointitaulukoiden tallettamista.
• 5. Patenttivaatimuksen 2 tai patenttivaatimuksesta 2 riippuvasti patenttivaatimuksen 3 tai 4 mukainen menetelmä, käsittää dekoodaus-vaiheen, jossa spektriparametrit rekonstruoidaan ja rekonstruoidut parametrit : ‘ 35 syötetään dekoodatun signaalin syntesoiviin yksiköihin, tunnettu siitä, että ' ·. · ’ spektriparametrit rekonstruoidaan suoraan alkaen vastaanotetusta koodatusta signaalista, jos lipulla (C) on ennalta asetetulle arvolle komplementaarinen 112004 looginen arvo, ja jos lipulla (C) on ennalta asetettu looginen arvo, vastaanotetulle signaalille suoritetaan käänteinen kvantisointi, jotta saataisiin rekonstruoitua erot vallitsevaan kehykseen ja edelliseen kehykseen liittyviä parametrejä edustavien indeksien välillä, ja ensimmäinen indeksijoukko 5 rekonstruoidaan lähtien näistä eroista.
6. Laite puhesignaalin digitaaliseen koodaukseen, sisältää välineet (AN, TR), joilla puhesignaali muunnetaan digitaalisten näytteiden sekvenssiksi, ja joilla jaetaan sekvenssi kehyksiin, jotka sisältävät ennalta asetetun määrän näytteitä, välineet (ABT, ALT) koodattavan puhesignaalin spektrianalyysiin ja 10 analyysin tuloksena saatavien parametrien kvantisointiin, jotka välineet synnyttävät kussakin kehyksessä ainakin ensimmäisen indeksijoukon (ji), joka edustaa parametrien arvoa tässä kehyksessä, ja välineet (CV), joilla synnytetään koodattu signaali, joka sisältää kyseisiin parametreihin liittyvää informaatiota, tunnettu siitä, että laite sisältää, koodauspuolella: 15 välineet (DQ), joilla tunnistetaan alkaen ensimmäisen joukon indek seistä (ji) kehykset, joissa puhesignaali edustaa suurta korrelaatiota; muunnetaan näille kehyksille ensimmäinen indeksijoukko (j-ι) toiseksi indeksijoukoksi (j4), joka voidaan koodata alhaisemmalla lukumäärällä bittejä kuin on välttämätöntä ensimmäisen joukon indeksien koodaamiseen; ja synnytetään ja 20 lähetetään dekooderiin signalointi, joka ilmaisee, että muunnos on tapahtunut; ja ; välineet (MX), joilla syötetään näissä kehyksissä koodatun signaa lin synnyttäville välineille (CV) toinen indeksijoukko ensimmäisen indeksijoukon sijasta. : 25
7. Patenttivaatimuksen 6 mukainen laite, tunnettu siitä, että suuren korrelaation kehykset tunnistavat välineet (DQ) sisältävät: ^ välineet (S0...S8), joilla lasketaan erot ensimmäisen joukon (ji) kun kin indeksin arvon ja saman indeksin edellisessä kehyksessä saaman arvon . , välillä; 30 välineet (CS0...CS8), joilla verrataan kunkin eron absoluuttiarvoa ··' kynnykseen ja synnytetään signaaleja, joiden looginen arvo ilmaisee, onko ; ; absoluuttiarvo ylittänyt kynnyksen vai ei; * > I ; välineet (AN), joilla vastaanotetaan vertailuvälineiden synnyttämät signaalit, ja jotka antavat lipun, jolla on ennalta asetettu looginen arvo, kun kai- I I : 35 kiila vertailuvälineiden lähtösignaaleilla on sama looginen arvo, joka ilmaisee, ’ .·· että kynnystä ei ole ylitetty, jolloin kyseinen lippu sijoitetaan koodattuun signaaliin sen muodostaessa mainitun signaloinnin; 112004 välineet (QV0...QV2), jotka kyseinen lippu aktivoi, kun sillä on ennalta asetettu looginen arvo, eroryhmien vektorikvantisointiin synnyttäen edellä mainittu toinen indeksijoukko.
8. Patenttivaatimuksen 7 mukainen laite, tunnettu siitä, että 5 vektorikvantisointivälineet (QV0...QV2) muodostuvat yhdestä laskentayksiköstä, joka suoraan laskee yksittäisiä eroryhmiä edustavan indeksin alkaen syöttöarvoista ilman kvantisointitaulukoiden tallettamista.
9. Minkä tahansa patenttivaatimuksen 6 - 8 mukainen laite, t u n-n e 11 u siitä, että se sisältää dekoodauspuolella lipun ohjaamat välineet (DM), 10 jotka syöttävät parametreihin liittyvän koodatun informaation joko yksiköihin (DJ4, RT, SD), joilla rekonstruoidaan ensimmäinen indeksijoukko (ji) ja syötetään rekonstruoitu joukko parametrit rekonstruoiviin yksiköihin (DJ1), jos lippu edustaa ennalta asetettua loogista arvoa, tai suoraan parametrit rekonstruoiviin yksiköihin (DJ1), jos lippu edustaa ennalta asetetulle arvolle 15 komplementaarista loogista arvoa.
10. Patenttivaatimuksen 9 mukainen laite, tunnettu siitä, että yksiköt (DJ4, RT, SD), jotka rekonstruoivat ensimmäisen indeksijoukon, sisältävät välineet (DJ4), jotka rekonstruoivat erot vallitsevaan kehykseen liittyvien ensimmäisen joukon indeksien ja edellisen kehyksen indeksien välillä, ja väli- 20 neet (SD, RT), joilla talletetaan edelliseen kehykseen liittyvät indeksit ja summataan ne rekonstruoituihin eroihin, jotta saataisiin rekonstruoitua vallitsevaan • | kehykseen liittyvän ensimmäisen joukon indeksit.
11. Minkä tahansa patenttivaatimuksen 6-10 mukainen laite, ; . tunnettu siitä, että spektrianalyysivälineet ovat välineitä, joilla suoritetaan . ’ : 25 lineaarisen ennustekooderin lyhyen aikavälin analyysi. > · • I * 1 » » » > t „ 112004
FI942762A 1993-06-10 1994-06-10 Menetelmä ja laite spektriparametrien kvantisointiin digitaalisissa puhekoodereissa FI112004B (fi)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ITTO930420A IT1270439B (it) 1993-06-10 1993-06-10 Procedimento e dispositivo per la quantizzazione dei parametri spettrali in codificatori numerici della voce
ITTO930420 1993-06-10

Publications (3)

Publication Number Publication Date
FI942762A0 FI942762A0 (fi) 1994-06-10
FI942762A FI942762A (fi) 1994-12-11
FI112004B true FI112004B (fi) 2003-10-15

Family

ID=11411550

Family Applications (1)

Application Number Title Priority Date Filing Date
FI942762A FI112004B (fi) 1993-06-10 1994-06-10 Menetelmä ja laite spektriparametrien kvantisointiin digitaalisissa puhekoodereissa

Country Status (10)

Country Link
US (1) US5546498A (fi)
EP (1) EP0628946B1 (fi)
JP (1) JP3197156B2 (fi)
AT (1) ATE172046T1 (fi)
CA (1) CA2124645C (fi)
DE (2) DE628946T1 (fi)
ES (1) ES2065872T3 (fi)
FI (1) FI112004B (fi)
GR (1) GR950300012T1 (fi)
IT (1) IT1270439B (fi)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3237089B2 (ja) * 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
DE69615227T2 (de) * 1995-01-17 2002-04-25 Nec Corp Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
ATE420432T1 (de) * 2000-04-24 2009-01-15 Qualcomm Inc Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
CN107452391B (zh) 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
EP3125108A1 (en) * 2015-07-31 2017-02-01 ARM Limited Vector processing using loops of dynamic vector length

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
EP0331858B1 (en) * 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
EP0443548B1 (en) * 1990-02-22 2003-07-23 Nec Corporation Speech coder
US5351338A (en) * 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding

Also Published As

Publication number Publication date
ITTO930420A0 (it) 1993-06-10
FI942762A (fi) 1994-12-11
US5546498A (en) 1996-08-13
ITTO930420A1 (it) 1994-12-10
GR950300012T1 (en) 1995-03-31
IT1270439B (it) 1997-05-05
EP0628946A1 (en) 1994-12-14
DE628946T1 (de) 1995-08-03
DE69413747T2 (de) 1999-04-15
CA2124645A1 (en) 1994-12-11
DE69413747D1 (de) 1998-11-12
JPH0720897A (ja) 1995-01-24
FI942762A0 (fi) 1994-06-10
EP0628946B1 (en) 1998-10-07
ES2065872T3 (es) 1998-12-16
CA2124645C (en) 1998-07-21
ATE172046T1 (de) 1998-10-15
JP3197156B2 (ja) 2001-08-13
ES2065872T1 (es) 1995-03-01

Similar Documents

Publication Publication Date Title
KR101592968B1 (ko) 수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법
EP0976126B1 (en) Method and apparatus in coding digital information
US20110270608A1 (en) Method and apparatus for receiving an encoded speech signal
EP0957472B1 (en) Speech coding apparatus and speech decoding apparatus
US20110161087A1 (en) Embedded Speech and Audio Coding Using a Switchable Model Core
JPH0683400A (ja) 音声メッセージ処理方法
AU767450B2 (en) Method and system for avoiding saturation of a quantizer during VBD communication
US7302387B2 (en) Modification of fixed codebook search in G.729 Annex E audio coding
FI112004B (fi) Menetelmä ja laite spektriparametrien kvantisointiin digitaalisissa puhekoodereissa
US6484139B2 (en) Voice frequency-band encoder having separate quantizing units for voice and non-voice encoding
CN1303508A (zh) 语音编码的方法和装置
WO1993005502A1 (en) Error protection for multimode speech coders
CA2090205C (en) Speech coding system
US8502706B2 (en) Bit allocation for encoding track information
EP2215630B1 (en) A method and an apparatus for processing an audio signal
EP0971338A1 (en) Method and device for coding lag parameter and code book preparing method
JPH0651799A (ja) 音声メッセージ符号化装置と復号化装置とを同期化させる方法
KR100221186B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
JP2000020099A (ja) 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器
JPH04312000A (ja) ベクトル量子化方法
JPH0682280B2 (ja) 音声符号化方式
JPH0969000A (ja) 音声パラメータ量子化装置
JP2001100797A (ja) 音声符号化復号装置
JPS6222489B2 (fi)
JPH0851368A (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
GB Transfer or assigment of application

Owner name: TELECOM ITALIA S.P.A.

MA Patent expired