HU216557B - Vektorkódolási eljárás, különösen beszédhangjelek kódolására - Google Patents

Vektorkódolási eljárás, különösen beszédhangjelek kódolására Download PDF

Info

Publication number
HU216557B
HU216557B HU9503180A HU9503180A HU216557B HU 216557 B HU216557 B HU 216557B HU 9503180 A HU9503180 A HU 9503180A HU 9503180 A HU9503180 A HU 9503180A HU 216557 B HU216557 B HU 216557B
Authority
HU
Hungary
Prior art keywords
codebook
sub
codebooks
vector
combination
Prior art date
Application number
HU9503180A
Other languages
English (en)
Other versions
HUT73533A (en
HU9503180D0 (en
Inventor
Jörg-Martin Müller
Bertram Wächter
Original Assignee
Robert Bosch Gmbh.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=6487537&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=HU216557(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Robert Bosch Gmbh. filed Critical Robert Bosch Gmbh.
Publication of HU9503180D0 publication Critical patent/HU9503180D0/hu
Publication of HUT73533A publication Critical patent/HUT73533A/hu
Publication of HU216557B publication Critical patent/HU216557B/hu

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

A találmány tárgya vektőrkódőlási eljárás, különösen beszédhangjelekkódőlására. Az eljárás sőrán a kódkönyvben aűtőkőrrelációsegyütthatókat tárőlnak, amelyek egy gerjesztőszűrő impűlzűsvál szánakaűtőkőrrelációs függvényével összekapcsőlva a szűrt gerjesztőjelenergiáját adják meg. Tővábbi adatcsökkentés végett a kódkönyvbe csakőlyan értékeket visznek be, amelyeknek hárőm, a nűllától különbözőaűtőkőrrelációs együtthatójűk van. Az ezekből az együtthatókbólképezhető kőmbináció minták a kódkönyvben azőnős gyakőrisággalfőrdűlnak elő. Ezekkel az intézkedésekkel csökkentett tárfelhasználásés jelfeldőlgőzási ráfőrdítás mellett lehetséges a kódőlt adatőkzavarőkra messzemenően érzéketlen átvitele. ŕ

Description

A találmány tárgya vektorkódolási eljárás, különösen beszédhangjelek kódolására, amelyben predikciós kódoláshoz kódkönyvet alkalmaznak.
Beszédhangjelek kódolása végett - különösen mobil rádiótelefonos alkalmazásokra - a beszédhangjelet letapogatják, és szakaszokra (időszakaszokra) osztják fel. Mindegyik szakaszhoz a különböző fajta jelparaméterek számára predikciós értékeket képeznek. Ilyen jelparaméterek például, a beszédhangjel formánsszerkezetének (a beszédsáv rezonanciáinak) jellemzésére szolgáló rövid idejű paraméterek, és a beszédhangjel pitchszerkezetének (hangmagasságának) jellemzésére szolgáló hosszú idejű paraméterek (ANT Nachrichtentechnische Berichte, Heti 5, Nov.1988, 93-105. oldal). „Analízis szintézis útján” módszerrel végzett beszédhangkódoláskor a modell-paramétereket és gerjesztési paramétereket kvantálják, kódolják és a vevőhöz átviszik. A bitátviteli sebesség további csökkentésére vektorkvantálást alkalmaznak (lásd fentebb; DE/EP 0266620 Ti; EP 504627A2; EP 294020 A2).
Az ANT Nachrichtentechnische Berichte, Heflt 5, Nov.1988, 93-105. oldalából, és különösen a 102. oldal 2.oszlopa és a 103. oldal 2. oszlopa közötti részből ismeretes, hogy a kódkönywektor komponenseinek akár 90%-át is nullává lehet tenni anélkül, hogy a beszédminőség romlana. Ugyanott azt is javasolják, hogy a gerjesztési szekvenciák számát a beszédszintetizáláshoz szolgáló szűrőnél még erősebben korlátozzák oly módon, hogy az impulzusoknak (együtthatóknak) nemcsak a helyzetét, hanem kiegészítőleg az amplitúdóját is rögzített értékűnek válasszák. Eszerint rögzített gerjesztési kódkönyvet választanak, amelynek a vektorai négy, a nullától különböző elemet (vektorösszetevőt) tartalmaznak.
Találmányunk célja a bevezetőleg leírt jellegű eljárás olyan továbbfejlesztése, hogy csökkentett tárolási és jelfeldolgozási ráfordítás mellett olyan kódkönyvparaméterek álljanak rendelkezésre, amelyeknek kisebb a hibaérzékenysége, különösen zavart csatornákon történő átviteli célokra.
Ezt a feladatot a találmány értelmében úgy oldjuk meg, hogy egy első kódkönyvben szintetikus jeleket, különösen n számú, elsősorban 4, nullától különböző, az érték tekintetében egyenlő, és csak az előjelben eltérő amplitudóértékű beszédhangjeleket előállító geijesztőszűrő geijesztőjeleihez (vektoraihoz) szolgáló kombinációs minták, illetőleg az ezeknek az amplitúdóértékeknek a tárolásához szükséges címek kombinációs mintáit tároljuk el, és egy további kódkönyvben az ezekhez tartozó autokorrelációs együtthatókat tároljuk a következő lépésekben:
- a további kódkönyvben autokorrelációs együtthatókat tárolunk, amelyek a szintetikus jeleket, különösen beszédhangjeleket előállító gerjesztőszűrő impulzusválaszának autokorrelációs függvényével összekapcsolva, a szűrt gerjesztőjel energiáját adják meg,
- csak olyan kombinációs mintákat engedünk meg, amelyeknek három, a nullától különböző autokorrelációs együtthatójuk van,
- az AKF (0) korrelációs maximumon kívüli autokorrelációs együtthatók nullától különböző amplitúdóértékei csak előjelükben térnek el egymástól.
Előnyös módon csak azokat a nullától különböző autokorrelációs együtthatókat (AKF) tároljuk az első kódkönyvben, amelyek az AKF (0) korrelációs maximumon kívül vannak.
Minden lehetséges kombinációs mintához előnyös módon képezünk egy részkódkönyvet, és egy részkódkönyvbe csak a mindegyik részkódkönyvnél azonos kombinációs mintának az adott helyzetét vezetjük be.
A részkódkönyvek a kölcsönös megkülönböztetés végett előnyös módon egy kódszóval vannak jelölve.
A kombinációs mintákat előnyös módon négy, +1 és -1 amplitúdóértékű együtthatóból képezzük.
256 vektoros kódkönyvhossz esetén előnyös módon összesen 16 részkódkönyvet hozunk létre, amelyekbe 16 vektorra vonatkozó kombinációs mintát, soronként vezetünk be.
részkódkönyv helyett előnyös módon, csak 8 részkódkönyvet hozunk létre, és a többi 8 részkódkönyvet a 8 korábban létrehozott részkódkönyvből a bevezetett értékek előjelváltásával állítjuk elő.
A találmány szerinti eljárás a következő felismeréseken alapszik:
Az autokorrelációs együtthatókból képzett kombinációs mintákat nem kell tárolni. Elegendő, ha címüket, vagyis helyzetüket tároljuk. Ez jelentősen csökkenti a tárfelhasználást és a jelfeldolgozást. A kombinációs mintákat és ezek eloszlását elválasztva lehet átvinni. Mivel a beszédkódok érzékenyebben reagálnak az impulzusmintákra (az autokorrelációs együtthatókból kapott kombinációs mintákra), mint azok eloszlására (a vektorösszetevők elrendezésére), ezért zavart átvitel esetén jobb beszédminőséget kapunk. Ennek megfelelően a találmány szerinti eljárás, különösen rádiótelefonban alkalmazható előnyösen.
Találmányunkat annak példaképpeni foganatosítási módja kapcsán ismertetjük részletesebben ábráink segítségével, amelyek közül az
1. ábra a RELP-beszédhangjel-kódolás elvét ismertető vázlat, a
2. ábra az „analízis szintézis útján” módszerrel végzett beszédhangjel-kódolás elvi vázlata, a
3. ábra példa az autokorrelációs együttható, találmány szerinti kiválasztására, és a
4. ábra az impulzusminta eloszlását tároló részkódkönyvek példája.
Beszédhangjelek kis bitsebességű, például 2,4 kbit/s és 9,6 kbit/s közötti bitsebességű átviteléhez például, egy „analízis szintézis útján” elv szerinti RELP-beszédhangjel-kódokat alkalmazunk. A például a RELP (Residual Exciting Linear Prediction) elv szerinti beszédhangjelkódolást (ANT Nachrichtentechnische Berichte, Heft 5, Nov. 1988, 93-105. oldal) a találmány további megértése végett az 1. ábra kapcsán röviden ismertetjük. Egy időtartománybeli s(t) beszédhangjelet egy analóg/digitális átalakítóval digitalizálunk, majd analizálunk.
Ez az analízis a predikció funkcionális blokkban és a gerjesztésanalízis funkcionális blokkban megy végbe.
HU 216 557 Β
A beszéd redundanciájának megszüntetésére lineáris adaptív modellt alkalmazunk, amelyet alkalmas módon gerjesztünk. Csak a beszédszintézishez szükséges modell- és geijesztésparamétereket kvantáljuk, kódoljuk és visszük át a vevőhöz. A modellparaméterek meghatározásához az adóban a beszéd mintavételi értékek statisztikai függőségeit analizáljuk, és lineáris rövid idejű és adott esetben hosszú idejű predikcióval kiküszöböljük. A rövid idejű predikcióval a közvetlenül egymást követő mintavételi értékek közötti korrelációkat küszöböljük ki. Az egymástól távol lévő mintavételi értékek közötti korrelációkat (pitchszerkezet vagy hangmagasság) egy ezután következő hosszú idejű prediktor csökkenti. Az eredmény olyan digitális s(n) kimenőjel, amelyben lényegében már csak nemlineáris függőségek vannak, és amelynek az energiája az eredeti digitalizált s(n) beszédhangjel energiájához képest erősen csökkent. Az „analízis szintézis útján” módszernél a gerjesztőjel számítására az eredeti s(n) beszédhangjel és a szintetizált beszédhangjel, az s(n) kimenőjel közötti különbséget, az e(n) hibajelet alkalmazzuk (1. ábra).
Rövid, körülbelül 10...30 ms tartamú beszédszakaszokon belül a beszédet kvázistacionárius folyamatnak lehet tekinteni. Ez a kvázistacionáriusság lehetővé teszi prediktorok számítását, amelyeknek a paraméterei a beszédszakasz tartamára állandó értékeket vesznek fel. Egy 20 ms tartamú beszédszakaszt például kerettartamként rögzítünk. Ekkor 8 kHz mintavételi frekvencia esetén a prediktoregyütthatók adaptálásához keretenként 160 mintavételi érték áll rendelkezésre. A predikciós hibákat a predikciós hiba keretenként! energiájának minimálásával állapítjuk meg. Ezeknek a predikciós együtthatóknak a meghatározására, a számítási munka egyszerűsítése végett, a korrelációs módszert alkalmazzuk.
Az s(n) beszédhangjel analízise rövid idejű predikciós átviteli HK _I(Z) függvény és hosszú idejű predikciós átviteli HL-»(Z) függvény segítségével történik, melynek során eK(n) rövid idejű predikciós hibajel, és eL(n) hosszú idejű predikciós hibajel keletkezik. Az analízis során meghatározzuk a beszédszintézisszűrő a, és bj együtthatóit, valamint az M keresési tartományt, amelyeket a 2. ábrán a HL(Z) HK(Z) átviteli függvény tartalmaz. A szintézisszűrőhöz vezetett r(n) gerjesztőjelet vagy számítjuk, vagy a találmány értelmében egy kódkönyvből kiolvassuk. A szintézisszűrő s(n) kimenőjele a becsült beszédhangjel. Az eredeti s(n) beszédhangjellel összehasonlítva kapjuk az e(n) hibajelet, amit a W(Z) átviteli függvénnyel hallásfiziológiailag súlyozunk. A súlyozott ew(n) hibajel energiáját ezután javított r(n) geijesztőjel megállapítására alkalmazzuk.
Az átviteli bitsebesség további csökkentésére vektorkvantálást alkalmazunk. A geijesztőjel kiszámítását L számú D dimenziójú geijesztővektorral helyettesítjük. Egy skálázási tényező segítségével mindegyik vektor energiáját a beszédhangjel energiájához illesztjük. Ezután a legkisebb hibaenergiájú vektor címét átviszik a vevőre. Minthogy a predikciós hibajel eloszlása jó közelítésben normális eloszlás, ezért a kódkönyvet normális eloszlású véletlen számokkal lehet kitölteni. Ennek az úgynevezett CELP-eljárásnak (Codebook
Excited Linear Prediction) az előnye többek között az, hogy a kódkönyvet nem kell „tanítani”. A ráfordítás tovább csökkenthető nullavektorokat tartalmazó kódkönywektorok alkalmazásával. A geijesztővektor számításához ekkor kevesebb számítási művelet szükséges. Az ANT Nachrichtentechnische Berichte, Heft 5, Nov.1988, 93-105. oldalán javasolták, hogy a kódkönywektorok minél több komponensét, például 90%át tegyük nullává (103. oldal, bal hasáb, utolsó bekezdés), és a geijesztési szekvenciák számát még erősebben korlátozzuk oly módon, hogy az együtthatók (impulzusok) helyzeteit rögzítjük és amplitúdóját állandó értéken tartjuk. Ott a kódkönyvhöz olyan vektorokat alkalmaznak, amelyek négy, nullától különböző elemet tartalmaznak.
A találmány értelmében ezeket a követelményeket a tárigény és a jelfeldolgozási ráfordítás javára tovább szigorítottuk: csak olyan vektorokat alkalmazunk, amelyeknek három, nullától különböző AKF autokorrelációs együtthatójuk van. Az AKF (0) korrelációs maximumon kívül lévő AKF autokorrelációs együtthatókat úgy választjuk meg, hogy csak előjelükben különbözzenek egymástól, vagyis amplitúdójuk egyenlő.
A 3. ábrán látható példa az ily módon kiválasztott AKF autokorrelációs együtthatókra n=4 impulzussal, vagyis amplitúdóbittel egy, például 40 mintavételi értéket tartalmazó kereten belül. Az AKF (0) korrelációs maximumnál a 4 amplitúdóérték adódik. Mivel ez az érték minden n-impulzusú impulzusmintánál állandó, nem kell tárolni. A nullától különböző többi impulzus amplitúdója 1. Az 5. mintavételi érték például +1, és a 15. mintavételi érték -1.
Az itt alkalmazott AKF autokorrelációs együtthatók úgy vannak definiálva, hogy egy szintetikus jeleket (beszédhangjeleket) előállító geijesztőszűrő impulzusválaszának autokorrelációs függvényével való összekapcsoláskor a szűrt geijesztőjel energiáját kapjuk.
Ezenkívül minden kombinációs mintára, amelyet ilyen AKF autokorrelációs együtthatókból képezünk, fennáll a követelmény, hogy a kódkönyvben azonos gyakorisággal szerepeljenek. Az utóbbi követelmény által egy 2L teijedelmű kódkönyv n számú részkódkönyvre bontható, ha a geijesztőjelben n számú nullától különböző impulzus van megengedve, ami 2n lehetséges kombinációs mintának felel meg. Az n számú részkódkönyv mindegyikének teqedelme 2L-n és csak azonos fajta impulzusmintákat tartalmaz. A 4. ábrán látható néhány a 2n= 16 (n=4) lehetséges részkódkönyv közül. Az impulzusminták (a +1 és -1 értékek sorrendjei) mindegyik részkódkönyvben egyenlők, csak az egyes impulzusok helyzete különböző. Az első részkódkönyvben az impulzusminta csak négy pozitív impulzusból, a második részkódkönyvben három pozitív és egy negatív impulzusból áll, stb. A kombinációs minták (impulzusminták) azonos gyakorisága lehetővé teszi, hogy a kombinációs mintákat az impulzusok eloszlásától (helyzetétől) elválasztva vigyük át. Magukat a kombinációs mintákat nem kell tárolni és átvinni. Elegendő, ha mind a tizenhat részkódkönyv az ismert kombinációs mintákkal a többi részkódkönyvtől megkülönböztethető. Ez a legegyszerűbben
HU 216 557 Β úgy valósítható meg, hogy mindegyik részkódkönyvhöz és ezzel az impulzusmintához más címet rendelünk hozzá, például az első részkódkönyvhöz a 0000 címet és a második részkódkönyvhöz a 0001 címet stb. (4 ábra). Az impulzusoknak a részkódkönyvekben elfoglalt helyzetéről is csak egy címet kell tárolni és átvinni.
részkódkönyv létrehozása helyett elegendő csak 8 részkódkönyvet - különböző kombinációs mintákkal - létrehozni (1-8. részkódkönyv). A 9-16. részkódkönyv a kombinációs mintákból egyszerű előjelváltással létrehozható. Például a 11 -1 -1 mintából a -1 -111 minta lesz.
Azzal, hogy az impulzusmintákat az impulzuseloszlástól elválasztjuk, a beszédátvitel-hibákra - különösen átviteli zavarok esetén - lényegében érzéketlenné válik, mivel a kodekek az impulzusmintákra érzékenyebben reagálnak, mint azok eloszlására. Az impulzusokat ezért, például csatornakódolás esetén, az átvitelhez magasabb hibavédelemmel lehet ellátni, mint az impulzusaik speciális helyzetére vonatkozó információt.

Claims (7)

SZABADALMI IGÉNYPONTOK
1. Vektorkódolási eljárás, különösen beszédhangjelek kódolására, amelyben kódkönyveket alkalmazunk, és egy első kódkönyvben szintetikus jeleket, és különösen n számú, elsősorban 4, nullától különböző, az érték tekintetében egyenlő, és csak az előjelben eltérő amplitüdóértékű beszédhangjeleket előállító geijesztőszűrő geijesztőjeleihez (vektoraihoz) szolgáló kombinációs minták, illetőleg az ezeknek az amplitúdóértékeknek a tárolásához szükséges címek kombinációs mintái vannak tárolva, azzal jellemezve, hogy egy további kódkönyvben az ezekhez tartozó autokorrelációs együtthatókat tároljuk a következő lépésekben:
- a további kódkönyvben autokorrelációs együtthatókat tárolunk, amelyek a szintetikus jeleket, különösen beszédhangjeleket előállító geijesztőszűrő impulzusválaszának autokorrelációs függvényével összekapcsolva a szűrt geqesztő jelenergiáját adják meg,
- csak olyan kombinációs mintákat engedünk meg, amelyeknek három, a nullától különböző autokorrelációs együtthatójuk van,
- az AKF (0) korrelációs maximumon kívüli autokorrelációs együtthatók nullától különböző amplitudóértékei csak előjelükben térnek el egymástól.
2. Az 1. igénypont szerinti vektorkódolási eljárás, azzal jellemezve, hogy csak azokat a nullától különböző autokorrelációs együtthatókat tároljuk az első kódkönyvben, amelyek az AKF (0) korrelációs maximumon kívül vannak.
3. Az 1. vagy 2. igénypont szerinti vektorkódolási eljárás, azzal jellemezve, hogy minden lehetséges kombinációs mintához képezünk egy részkódkönyvet, és egy részkódkönyvbe csak a mindegyik részkódkönyvnél azonos kombinációs mintának az adott helyzetét vezetjük be.
4. A 3. igénypont szerinti vektorkódolási eljárás, azzaljellemezve, hogy a részkódkönyvek a kölcsönös megkülönböztetés végett egy kódszóval vannak jelölve.
5. A 3. vagy 4. igénypont egyike szerinti vektorkódolási eljárás, azzal jellemezve, hogy a kombinációs mintákat négy, +1 és -1 amplitúdóértékű együtthatóból képezzük.
6. A 3-5. igénypontok bármelyike szerinti vektorkódolási eljárás, azzal jellemezve, hogy 256 vektoros kódkönyvhossz esetén összesen 16 részkódkönyvet hozunk létre, amelyekbe 16 vektorra vonatkozó kombinációs mintát soronként vezetünk be.
7. A 6. igénypont szerinti vektorkódolási eljárás, azzal jellemezve, hogy 16 részkódkönyv helyett csak 8 részkódkönyvet hozunk létre, és a többi 8 részkódkönyvet a 8 korábban létrehozott részkódkönyvból a bevezetett értékek előjelváltásával állítjuk elő.
HU9503180A 1993-05-07 1994-04-20 Vektorkódolási eljárás, különösen beszédhangjelek kódolására HU216557B (hu)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE4315313A DE4315313C2 (de) 1993-05-07 1993-05-07 Vektorcodierverfahren insbesondere für Sprachsignale

Publications (3)

Publication Number Publication Date
HU9503180D0 HU9503180D0 (en) 1995-12-28
HUT73533A HUT73533A (en) 1996-08-28
HU216557B true HU216557B (hu) 1999-07-28

Family

ID=6487537

Family Applications (1)

Application Number Title Priority Date Filing Date
HU9503180A HU216557B (hu) 1993-05-07 1994-04-20 Vektorkódolási eljárás, különösen beszédhangjelek kódolására

Country Status (10)

Country Link
US (1) US5729654A (hu)
EP (1) EP0697124B1 (hu)
AU (1) AU682505B2 (hu)
DE (2) DE4315313C2 (hu)
DK (1) DK0697124T3 (hu)
ES (1) ES2140533T3 (hu)
FI (1) FI116596B (hu)
HU (1) HU216557B (hu)
PT (1) PT697124E (hu)
WO (1) WO1994027285A1 (hu)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
DE19538852A1 (de) * 1995-06-30 1997-01-02 Deutsche Telekom Ag Verfahren und Anordnung zur Klassifizierung von Sprachsignalen
US5781881A (en) * 1995-10-19 1998-07-14 Deutsche Telekom Ag Variable-subframe-length speech-coding classes derived from wavelet-transform parameters
GB2312360B (en) 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1164569A (en) * 1981-03-17 1984-03-27 Katsunobu Fushikida System for extraction of pole/zero parameter values
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4907276A (en) * 1988-04-05 1990-03-06 The Dsp Group (Israel) Ltd. Fast search method for vector quantizer communication and pattern recognition systems
US5010574A (en) * 1989-06-13 1991-04-23 At&T Bell Laboratories Vector quantizer search arrangement
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
US5339164A (en) * 1991-12-24 1994-08-16 Massachusetts Institute Of Technology Method and apparatus for encoding of data using both vector quantization and runlength encoding and using adaptive runlength encoding
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding

Also Published As

Publication number Publication date
DE59408863D1 (de) 1999-12-02
FI955324A0 (fi) 1995-11-06
WO1994027285A1 (de) 1994-11-24
PT697124E (pt) 2000-04-28
DE4315313C2 (de) 2001-11-08
FI955324A (fi) 1995-11-06
ES2140533T3 (es) 2000-03-01
HUT73533A (en) 1996-08-28
US5729654A (en) 1998-03-17
FI116596B (fi) 2005-12-30
HU9503180D0 (en) 1995-12-28
AU682505B2 (en) 1997-10-09
DK0697124T3 (da) 2000-04-25
DE4315313A1 (de) 1994-11-10
EP0697124A1 (de) 1996-02-21
AU6502694A (en) 1994-12-12
EP0697124B1 (de) 1999-10-27

Similar Documents

Publication Publication Date Title
AU648479B2 (en) Speech coding system and a method of encoding speech
US5778334A (en) Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion
CA2202825C (en) Speech coder
EP1225568B1 (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
EP0307122B1 (en) Speech coding
CA2186433C (en) Speech coding apparatus having amplitude information set to correspond with position information
EP0409239A2 (en) Speech coding/decoding method
EP0957472B1 (en) Speech coding apparatus and speech decoding apparatus
KR20010024935A (ko) 음성 코딩
EP1162603B1 (en) High quality speech coder at low bit rates
RU2223555C2 (ru) Адаптивный критерий кодирования речи
US5970444A (en) Speech coding method
EP0401452B1 (en) Low-delay low-bit-rate speech coder
KR100561018B1 (ko) 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
US5873060A (en) Signal coder for wide-band signals
HU216557B (hu) Vektorkódolási eljárás, különösen beszédhangjelek kódolására
FI98481C (fi) Menetelmä ja laite analogisen sisääntulosignaalin muuttamiseksi ohjauskoodeiksi ja vastaavan ulostulosignaalin syntetisoimiseksi näiden ohjauskoodien ohjauksen alaisena
EP1154407A2 (en) Position information encoding in a multipulse speech coder
US8502706B2 (en) Bit allocation for encoding track information
JP3214249B2 (ja) ベクトル量子化による符号化復号化方式
USRE35057E (en) Speech coding using sparse vector codebook and cyclic shift techniques
CA2618002C (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置
JPH04312000A (ja) ベクトル量子化方法
KR100389898B1 (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법

Legal Events

Date Code Title Description
DGB9 Succession in title of applicant

Owner name: ROBERT BOSCH GMBH., DE