FI116597B - Menetelmä etenkin puhesignaalien vektorikvantisointia varten - Google Patents
Menetelmä etenkin puhesignaalien vektorikvantisointia varten Download PDFInfo
- Publication number
- FI116597B FI116597B FI955325A FI955325A FI116597B FI 116597 B FI116597 B FI 116597B FI 955325 A FI955325 A FI 955325A FI 955325 A FI955325 A FI 955325A FI 116597 B FI116597 B FI 116597B
- Authority
- FI
- Finland
- Prior art keywords
- codebook
- vectors
- vector
- speech
- excitation
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims description 45
- 238000000034 method Methods 0.000 title claims description 16
- 238000013139 quantization Methods 0.000 title claims description 5
- 230000005284 excitation Effects 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 8
- 238000005457 optimization Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
- G10L2019/0014—Selection criteria for distances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
116597
Menetelmä etenkin puhesignaalien vektorikvantisointia varten
Keksintönä on menetelmä signaalien näytteitysarvoj en 5 koodaamiseksi käyttämällä vektorikvantisointia.
Julkaisusta Speech Communication 8 (1989), sivut 363 - 369, tunnetaan CELP-puheenkoodausmenetelmä, jossa koodimuuttujat optimoidaan yhteisesti. Verrattuna peräkkäiseen optimointiin voi herätekoodikirjan pituus lyhentyä 10 huomattavasti.
Julkaisusta W0 91/01 545 tunnetaan digitaalinen pu-hekooderi, jossa haetaan koodikirjaan tallennettuja herä-tevektoreita sellaisen herätevektorin valitsemiseksi, joka parhaiten edustaa alkuperäistä puheen näytteitysarvoa. Jul-15 kaisun W0 91/01 545 mukaisessa puhekooderissa käytetään kahta herätevektoria kulloinkin aina yhdessä kahdesta koodikirjasta jonkin puheen näytteitysarvon selittämiseen. Ensiksi valitaan ensimmäinen herätevektori äänenkorkeustie-dosta riippumatta ja se ortogonalisoidaan. Toinen heräte-20 vektori valitaan vastaavalla tavalla. Toisen herätevektorin ortogonalisoinnissa toisesta koodikirjasta otetaan huomioon • sekä tuloksena oleva vektori että myös valittu ensimmäinen » · t * . , : herätevektori ensimmäisestä koodikirjasta. Tämä valintapro- * · · « · sessi toistetaan sitten toisesta koodikirjasta otetun or- • · J 25 togonalisoidun herätesignaalin kohdalla, jotta lopulta tun- • < · i",* nistetaan ne herätevektorit, jotka parhaiten vastaavat ai- • i · kuperäisen puheen näyttei tysarvoa.
' Keksinnön tehtävänä on parantaa luotettavuutta op timoidun näytteitysarvon valinnassa ilman, että käsittely j.j * 30 monimutkaistuu liiaksi. Tämä tehtävä ratkaistaan patentti- vaatimuksen 1 toimenpiteiden avulla. Vaihtoehtoiset suori-; tusmuodot ilmenevät muista vaatimuksista.
• * t
Keksintö perustuu seuraaville tiedoille: Kun päin- • · vastoin kuin tunnetuissa menetelmissä (Speech Communication :.,V 35 8 (1989), sivut 363 - 369 tai W0 91/01 545) adaptiivisesta { t I t | * t 116597 2 (toisesta) koodikirjasta käytetään useampaa kuin yhtä minimaalisen virheen käsittävää vektoria yhdistettäväksi kaikkien ensimmäisen (kiinteän) koodikirjan vektoreiden kanssa, käsittelyn vaatima työmäärä tosin kasvaa, mutta luotetta-5 vuus pienimmän virheen käsittävän näytteitysarvon optimoinnissa samalla kasvaa. Tämä luotettavuuden paraneminen merkitsee puheen näytteitysarvojen käsittelyssä parempaa puheen laatua. Koska käsittelyyn käytetty työmäärä, kun huomioon otetaan useampi kuin yksi vektori adaptiivisesta koo-10 dikirjasta, kasvaa vähemmän kuin lineaarisesti, saadaan kiinteää koodikirjaa kohtuullisesti pienentämällä esim. koodikirjan ohentamisen (kehyksen ohentamisen) välityksellä hakijan patenttihakemuksen "Verfahren zur Aufbreitung von Daten, insbesondere von codierten Sprachsignalparametern" 15 (sama hakemuspäivämäärä) mukaisesti käsittelyyn käytetty työmäärä pidettyä suunnilleen vakiona, jolloin vertailupohjaksi on asetettu alkuperäinen koodikirjapituus ilman ke-hysohennusta. Käsittelymäärän säilyessä suunnilleen samana kuin perinteisessä menetelmässä voidaan keksinnön mukaisin 20 toimenpitein saavuttaa oleellisesti parempi puheen laatu.
Keksinnön yhtä suoritusmuotoesimerkkiä tarkastellaan • seuraavassa yksityiskohtaisemmin piirustusten pohjalta.
• 1 1 · : Kuvio 1 kuvaa CELP-kooderin rakennetta.
• ·
Kuvio 2 kuvaa muunnellun CELP-kooderin rakennetta.
1 25 Keksinnön tarkastelun selventämiseksi viitataan en- * i · » » · I1',’ siksi julkaisuun "Improving Performance of Code Excidet LPC-Coders by Joint Optimization" (Speech Communication 8 : (1989), sivut 363 - 369).
CELP (Code-excited linear prediction) -kooderit kuu- • 1 · 30 luvat RELP (Residual Excited Linear Prediction) -kooderien ·., luokkaan, jossa puhearvojen päivitys jonot synnytetään suo- ; ,·, dattimen avulla, joka edustaa puheenmuodostusta. Päivitys- jono saadaan koodikirjan avulla, josta valitaan paras koo-T dikirjavektori "synteesiin perustuvan analyysin" menetel- *,!,· 35 mällä. Paras koodikirjavektori tarkoittaa tässä vektoria, 116597 3 jonka samankaltaisuus alkuperäisen puheen näytteitysarvon kanssa on suurin. Tämä samankaltaisuus arvioidaan ennalta asetellun virhekriteerin, esim. keskimääräisen neliövirheen pohjalta. Koodikirja täytetään ensin normaalijakaumaa vas-5 taavilla satunnaisarvoilla. CELP-kooderin rakenne näkyy kuviosta 1. Ensimmäisessä vaiheessa lineaarisen ennakoin-tisuodattimen, jota kuviossa 1 on merkitty siirtofunktion H (Z) avulla, muistin osuus vähennetään tulopuolen puheen
Ob näytteitysarvosta ja tuloksena oleva signaali painote- 10 taan siirtofunktion W(Z) käsittävän suodattimen välityksellä. Toisessa vaiheessa äänenkorkeuden ennakointisuodattimen (jota on luonnehdittu siirtofunktioiden H T(Z) ja H (Z) avulla) painotetun muistiarvon osuus vähennetään. Lopuksi painotettu virhesignaali e (n) syntyy muodostamalla erotus w 15 suodatetun koodikirjavektorin (suodatinfunktiot H (Z) ja
L
H (Z)) ja aiemmin määritellyn signaalin s (n) välille. Vir- V» w hesignaalin e (n) energia on kaikkien koodimuuttujien funk-w tio, esim.
20 E = ffa^ M, b±, j, Cj), jossa a. silloin, kun i = 1,2,..., P ilmaisee LP-suodat-
IM · 1 O
: timen kertoimet, :·,·! M äänenkorkeusjakson, ^ ! 25 b. silloin, kun i = 1,2,..., P, äänenkorkeuden ennakointi-
: : : i L
kertoimet, j = 1,2,...K koodikirjamerkinnät sekä • > · b
Cj vastaavan skaalaustekijän.
Paras mahdollinen puheenlaatu saavutetaan, kun kaik- • t i 30 ki nämä signaalimuuttujät optimoidaan yhteisesti. Seuraavan optimoinnin yhteydessä ei LP-muuttujaa ai tarkastella, sil- : lä sen ottaminen huomioon merkitsee tuskin toteutettavissa ’ olevaa laskennallista työtä.
» I
T Minimoimalla funktio E = f(M, j, ) saavutetaan 35 alioptimaalinen likiarvo.
116597 4
Lineaarinen ennakointisynteesisuodatin p i -1 H (Z) - (1- E s a. z ) 5 S i=l 1 kuvaa puhespektrin formanttirakennetta. Painotussuodatin W(Z) = Hgi Ζ/γ) HS(Z) -1 10 jolloin 0 < γ < 1, aikaansaa spektraalisen kohinarajoituk-sen epätäydellisen herätyksen seurauksena. HW(Z) tuottaa LP-suodattimen ja painotussuodattimen ketjutuksen 15 HW(Z) = Hg(Z) . W(Z) .
Äänenkorkeuden ennakointisynteesisuodatinta, jossa on vain
yksi väliotto p = 1 kohdalla, kuvataan siirtofunktion L
20 H (Z) = (1 - bZ_M ) _1
L
avulla.
: Suodattimien H (Z), H (Z) ja W(Z) muistikennot ovat · W Li kuviossa 1 nollassa. Äänenkorkeusprediktorin muuttujat päi-| * : 25 vitetään aina N :n näytteitysarvon jälkeen (alikehyksen : sisältö) ja LP-suodattimen vastaavat päivitetään joka I N:nnen näytteitysarvon jälkeen. Oletuksella N > N voidaan
«M I S
äänenkorkeuden ennakointisuodatin poistaa kuvion 1 herätys- « haarasta, sillä se ei vaikuta suodattimen H (Z) tuloon ar- w . . 30 voon n < N pääsemiseksi.
* * · b
Jotta äänenkorkeusprediktorin muistin vaikutusta > t voidaan tarkastella lähemmin, on kuvioon 1 kuvattu yksi-;tj .* tyiskohtaisesti muistin muistikennot sekä niiden liitännät.
; Muistikennojen arvoja on merkitty l(k) :11a. Jokainen äänen- 35 korkeusjakson muuttuja M = k tuottaa toisen signaalin d (n) muistikennoista muodostetun viive johdon lähtöön. K riippuu
* * * * * L
116597 5 äänenkorkeusjakson M sallitusta alueesta. Hyvä valinta M:n arvoksi on välillä 40 ja 103. Tämän alueen kattamiseksi K =64.
L
Nämä edellytykset johtavat suoraan kuvion 2 mukai- 5 seen lohkokaaviokuvaan.
K :n erilaista signaalia d (n) voidaan tarkastella L K
ikään kuin ne olisi koottu yhteen koodikirjaan. Tässä esityksessä ei ole mitään eroa herätekoodikirjan CB1 käsittävän haaran sekä koodikirjan CB2 käsittävän haaran rakentei-10 den välillä, mikä ilmenee äänenkorkeusprediktorin suodatin-muistista. Ainoastaan koodikirjojen CB1 ja CB2 ominaiskäy-rät eroavat toisistaan: herätekoodikirja CBl on kiinteä -siihen kirjataan kiinteät vektorit - kun taas koodikirja CB2 on äänenkorkeusmuuttujia varten ajasta riippuvainen 15 (adaptiivinen), sillä suodatinmuistia muunnellaan kunkin alikehyksen jälkeen. Näiden muuttujien optimoimiseksi täytyy tutkia suuri määrä (K K ) erilaisia yhdistelmiä, jotta
L S
löydetään minimaalinen virhe-energia E. Kaikki nämä yhdistelmät vastaavat koodikirjapituutta K K kun taas peräk-
L S
20 käinen optimointi kaksivaiheista vektorikvantisointia varten vastaa kahta koodikirjaa pituuksiltaan tai K^.
• Kuvion 2 lohkokaavion mukaisesti virhe-energia E on : koodikirjamerkintöjen j ja k sekä skaalaustekijoiden ja b funktio:
• » K
. . 25 Ns 2 !.: ! E(j,k,b , c ) = Σ [S (h) - [(b d.(n) + c. T (n) 1 h (hj|] l K J Π=1 ^ Λ Λ J J w 1 1 jolloin h (n) ilmaisee painotetun LP-suodattimen pulssivas-. , 30 tausta ja 1 levityssymbolia.
Virhe-energian E minimiin pääsy edellyttää skaalaus- * t tekijöiden suhteen seuraavan lineaaristen yhtälöiden : : : järjestelmän täyttymistä: • » , 35 f<pk(n)' pk(n)> <pk(n)/ qj(n)>\ f bk ) \<Pk(n), q . (n) > <q (n), q (n)> / (d j.
| , J J J J
116597 6 |Sc(n)' sw(n)>\ \qj(n)' sw(n)>/ jolloin Pk(n) = <*k(n) * ^(n), 5 q (n) = r (n) * h (n), j J w
N
ja <^/ \ r b >- Σδ a(n) b(n) .
(n) (n) n=1 10 Käyttämällä näitä suhteita syntyy minimaalista virhe-energiaa varten 15 Emin = <sW(n), sw(n)> - T( j,k,c_.,bk) .
Koska energia alikehystä varten on vakio, täytyy ilmaisu 20 T(j,k,Cj,bk) = bk <pk(n), sw(n)> + <q^(n), sw(n)> maksimoida. Tämä maksimointi toteutetaan kahdessa vaihees- • · :.; · sa: - lineaarisen yhtälöjärjestelmän ratkaisu ί : 25 - T(j,k,c.,b ):n laskeminen.
* Nämä vaiheet täytyy toteuttaa K K kertaa. Muita me-
* · > · L S
: netelmää yksinkertaistavia toimia ovat, että esim. n. 90 %
* * * I
vektoreista asetetaan arvoon nolla, julkaisun DE 3 834 871 I i i
Cl mukainen käänteissuodatus, vain sellaisten vektorien , , 30 salliminen, jotka esim. sisältävät ainaostaan kolme arvosta ’.‘l,· nolla eriävää autokorrelaatiokerrointa.
• *
Keksinnön mukaisesti ja toisin kuin tähän saakka : : : tunnetuissa menetelmissä valitaan nyt toisesta koodikirjas- ta CB2 n > 2, esimerkissä n = 2 parhaat vektorit (parhaat \ 35 vektorit tarkoittaa, että nämä vektorit antavat tietyn vir- t I i hekriteerin, esim. kesikimääräisen neliövirheen suhteen 116597 7 pienimmät poikkeamat, ts. parhaat ennakoidut arvot). Nämä kaksi parasta vektoria yhdistetään sitten kaikkien kiinteitä vektoreita sisältävävän ensimmäisen koodikirjan CB1 vektoreiden kanssa edellä mainitun lineaaristen yhtälöiden 5 järjestelmän mukaisesti. Yhdistetystä joukosta valitaan minimaalisen virhe-energian (sama tai muu virhekriteeri) puolesta alkuperäistä näytteitysarvoa parhaiten vastaavat arvot ja ne valmistellaan esim. siirrettäväksi alhaisemman bittinopeuden käsittävää siirtokanavaa pitkin.
10 Jos käsittelyä monimutkaistetaan siten, että käsi tellään enemmän kuin kaksi parasta vektoria toisesta koodikirjasta, on tuloksena parempi puheen laatu. Ilman että tätä parannettua puheen laatua joudutaan heikentämään, voidaan käsittelyä yksinkertaistaa edelleen siten, että 15 ensimmäiseen koodikirjaan CB1 tehtäviä merkintöjä ohennetaan. Lisäksi käsittelyyn käytettävä työmäärä ei nouse lineaarisesti käsittelyyn valittujen vektoorien määrän kasvaessa, sillä monia jo ensimmäisessä vaiheessa laskettuja yhdistelmätuloksia voidaan käyttää hyväksi.
20 Koodikirjan ohennus suoritetaan edullisesti puheen laatua heikentämättä siten, että ohennettavan joukon perus- j taksi määritellään kahden kehys jakson (alikehyksen) vekto- i i i | : rien summabitit, joista sitten edullisesti vaimennetaan * ‘ · y juuri niin monta bittiä, että käsittetyö on juuri yhtä suu- ! ! 25 ri kuin käsiteltäessä ainoastaan yhtä valittua parasta vek- toria toisesta koodikirjasta CB2. Koodikirjan ohennusta : selitetään yksityiskohtaisesti edellä mainitussa hakijan • · · ’ hakemuksessa, joissa on samat päivämäärät.
Claims (7)
1. Menetelmä signaalien näytteitysarvoj en, etenkin puheen näytteitysarvojen, vektorikvantisointia varten kä-5 sittäen seuraavat vaiheet: - ensimmäiseen koodikirjaan (CB1) kirjataan kiinteät vektorit, - toiseen koodikirjaan (CB2) kirjataan vektorit, jotka päivitetään aina yhden aikajakson välein, 10. toisesta koodikirjasta (CB2) valitaan ainakin kak si vektoria, jotka ennalta asetellun ensimmäisen virhekri-teerin mukaisesti antavat parhaat ennakoidut arvot, - vähintään kaksi toisesta koodikirjasta (CB2) valittua vektoria yhdistetään kumpikin ensimmäisestä koodi- 15 kirjasta (CB1) peräisin oleviin vektoreihin, - vektorien yhdistelmien joukosta valitaan sellainen vektori edustamaan optimoitua näytteitysarvoa, joka ensimmäisen tai jonkin muun virhekriteerin perusteella on pienimmällä etäisyydellä alkuperäisestä näytteitysarvosta.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että ensimmäiseen koodikirjaan ' (CB1) on kirjattu herätevektoreita LPC-suodatinta varten : puheen ennakoimiseksi.
;· [ 3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, I ; 25 tunnettu siitä, että toiseen koodikirjaan (CB2) )",* kirjataan herätevektoreita äänenkorkeussynteesisuodatinta ';; · varten.
’* ' 4. Jonkin patenttivaatimuksen 1-3 mukainen mene telmä, tunnettu siitä, että ensimmäiseen koodikir-·,· j 30 jaan (CBl) tehtäviä merkintöjä ohennetaan.
: : 5. Jonkin patenttivaatimuksen 1-4 mukainen mene- ; telmä, tunnettu siitä, että jokaista ensimmäisen '!!/ koodikirjan (CBl) herätevektoria varten määritellään sei- lainen virhemitta alkuperäiseen näytteitysarvoon verrattu-'/·/· 35 na, joka ottaa huomioon vähintään kaksi toisesta koodikir- 9 116597 jasta (CB2) valittua ennakoitua arvoa/äänenkorkeuspredik-toria.
6. Patenttivaatimuksen 4 tai 5 mukainen menetelmä, tunnettu siitä, että ensimmäisen koodikirjan (CB1) 5 ohentamiseksi vaimennetaan sellaisia vektorikomponentteja, jotka poistetaan edullisesti kahden kehysjakson summabi-teistä, joihin puhesignaali on jaettu.
7. Jonkin patenttivaatimuksen 4-6 mukainen menetelmä, tunnettu siitä, että ensimmäiseen koodikir- 10 jaan (CBl) tehtyjen merkintöjen ohennus suoritetaan sellaisessa mitassa, että käsittelyyn käytetty työ on juuri yhtä suuri kuin käsiteltäessä ainoastaan yhtä toisesta koodikirjasta (CB2) valittua vektoria. • » * 1 · * I » » 116597 10
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4315315 | 1993-05-07 | ||
DE4315315A DE4315315A1 (de) | 1993-05-07 | 1993-05-07 | Verfahren zur Vektorquantisierung insbesondere von Sprachsignalen |
DE9400435 | 1994-04-20 | ||
PCT/DE1994/000435 WO1994027286A1 (de) | 1993-05-07 | 1994-04-20 | Verfahren zur vektorquantisierung, insbesondere von sprachsignalen |
Publications (3)
Publication Number | Publication Date |
---|---|
FI955325A FI955325A (fi) | 1995-11-06 |
FI955325A0 FI955325A0 (fi) | 1995-11-06 |
FI116597B true FI116597B (fi) | 2005-12-30 |
Family
ID=6487539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI955325A FI116597B (fi) | 1993-05-07 | 1995-11-06 | Menetelmä etenkin puhesignaalien vektorikvantisointia varten |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP0697125B1 (fi) |
AU (1) | AU681137B2 (fi) |
DE (2) | DE4315315A1 (fi) |
DK (1) | DK0697125T3 (fi) |
ES (1) | ES2136732T3 (fi) |
FI (1) | FI116597B (fi) |
HU (1) | HU216223B (fi) |
WO (1) | WO1994027286A1 (fi) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19538852A1 (de) * | 1995-06-30 | 1997-01-02 | Deutsche Telekom Ag | Verfahren und Anordnung zur Klassifizierung von Sprachsignalen |
US5781881A (en) * | 1995-10-19 | 1998-07-14 | Deutsche Telekom Ag | Variable-subframe-length speech-coding classes derived from wavelet-transform parameters |
US5867814A (en) * | 1995-11-17 | 1999-02-02 | National Semiconductor Corporation | Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method |
GB2312360B (en) | 1996-04-12 | 2001-01-24 | Olympus Optical Co | Voice signal coding apparatus |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL94119A (en) * | 1989-06-23 | 1996-06-18 | Motorola Inc | Digital voice recorder |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
-
1993
- 1993-05-07 DE DE4315315A patent/DE4315315A1/de not_active Withdrawn
-
1994
- 1994-04-20 WO PCT/DE1994/000435 patent/WO1994027286A1/de active IP Right Grant
- 1994-04-20 EP EP94912472A patent/EP0697125B1/de not_active Expired - Lifetime
- 1994-04-20 AU AU65025/94A patent/AU681137B2/en not_active Expired
- 1994-04-20 DE DE59408495T patent/DE59408495D1/de not_active Expired - Lifetime
- 1994-04-20 DK DK94912472T patent/DK0697125T3/da active
- 1994-04-20 HU HU9503179A patent/HU216223B/hu unknown
- 1994-04-20 ES ES94912472T patent/ES2136732T3/es not_active Expired - Lifetime
-
1995
- 1995-11-06 FI FI955325A patent/FI116597B/fi not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
HU9503179D0 (en) | 1995-12-28 |
AU681137B2 (en) | 1997-08-21 |
EP0697125B1 (de) | 1999-07-14 |
FI955325A (fi) | 1995-11-06 |
ES2136732T3 (es) | 1999-12-01 |
HUT73545A (en) | 1996-08-28 |
HU216223B (hu) | 1999-05-28 |
FI955325A0 (fi) | 1995-11-06 |
DE4315315A1 (de) | 1994-11-10 |
AU6502594A (en) | 1994-12-12 |
EP0697125A1 (de) | 1996-02-21 |
DE59408495D1 (de) | 1999-08-19 |
WO1994027286A1 (de) | 1994-11-24 |
DK0697125T3 (da) | 2000-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1735927B (zh) | 用于高质量语音编码转换的方法和装置 | |
CA1336455C (en) | Code excited linear predictive vocoder using virtual searching | |
KR100417634B1 (ko) | 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법 | |
US8543392B2 (en) | Encoding device, decoding device, and method thereof for specifying a band of a great error | |
JP5400701B2 (ja) | 音声符号化のための方法と装置 | |
EP0731449B1 (en) | Method for the modification of LPC coefficients of acoustic signals | |
US5553191A (en) | Double mode long term prediction in speech coding | |
RU2005137320A (ru) | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи | |
EP0657874B1 (en) | Voice coder and a method for searching codebooks | |
US5426718A (en) | Speech signal coding using correlation valves between subframes | |
JP2007537494A (ja) | 遠隔通信のためのマルチレート音声コーダにおける音声レート変換の方法及び装置 | |
CA1213059A (en) | Multi-pulse excited linear predictive speech coder | |
MX2013004673A (es) | Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo. | |
FI116597B (fi) | Menetelmä etenkin puhesignaalien vektorikvantisointia varten | |
KR100756207B1 (ko) | 정보 신호 코딩 방법 및 장치 | |
EP0602826B1 (en) | Time shifting for analysis-by-synthesis coding | |
EP1114415B1 (en) | Linear predictive analysis-by-synthesis encoding method and encoder | |
KR100465316B1 (ko) | 음성 부호화기 및 이를 이용한 음성 부호화 방법 | |
JP3168238B2 (ja) | 再構成音声信号の周期性を増大させる方法および装置 | |
US6078881A (en) | Speech encoding and decoding method and speech encoding and decoding apparatus | |
EP1355298A2 (en) | Code Excitation linear prediction encoder and decoder | |
KR970009747B1 (ko) | Qcelp 음성부호화기의 복잡도 감소 알고리즘 | |
Shoham | On the use of direct vector quantization in LPC-based analysis-by-synthesis coding systems | |
EP0662682A2 (en) | Speech signal coding | |
KR100389898B1 (ko) | 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GB | Transfer or assigment of application |
Owner name: ROBERT BOSCH GMBH |
|
FG | Patent granted |
Ref document number: 116597 Country of ref document: FI |
|
PC | Transfer of assignment of patent |
Owner name: IPCOM GMBH & CO.KG Free format text: IPCOM GMBH & CO.KG |
|
MA | Patent expired |