HU216557B - Vektorkódolási eljárás, különösen beszédhangjelek kódolására - Google Patents
Vektorkódolási eljárás, különösen beszédhangjelek kódolására Download PDFInfo
- Publication number
- HU216557B HU216557B HU9503180A HU9503180A HU216557B HU 216557 B HU216557 B HU 216557B HU 9503180 A HU9503180 A HU 9503180A HU 9503180 A HU9503180 A HU 9503180A HU 216557 B HU216557 B HU 216557B
- Authority
- HU
- Hungary
- Prior art keywords
- codebook
- sub
- codebooks
- vector
- combination
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000005311 autocorrelation function Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000004069 differentiation Effects 0.000 claims 1
- 230000005284 excitation Effects 0.000 abstract description 10
- 230000011664 signaling Effects 0.000 abstract 1
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 7
- 230000007774 longterm Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
A találmány tárgya vektőrkódőlási eljárás, különösen beszédhangjelekkódőlására. Az eljárás sőrán a kódkönyvben aűtőkőrrelációsegyütthatókat tárőlnak, amelyek egy gerjesztőszűrő impűlzűsvál szánakaűtőkőrrelációs függvényével összekapcsőlva a szűrt gerjesztőjelenergiáját adják meg. Tővábbi adatcsökkentés végett a kódkönyvbe csakőlyan értékeket visznek be, amelyeknek hárőm, a nűllától különbözőaűtőkőrrelációs együtthatójűk van. Az ezekből az együtthatókbólképezhető kőmbináció minták a kódkönyvben azőnős gyakőrisággalfőrdűlnak elő. Ezekkel az intézkedésekkel csökkentett tárfelhasználásés jelfeldőlgőzási ráfőrdítás mellett lehetséges a kódőlt adatőkzavarőkra messzemenően érzéketlen átvitele. ŕ
Description
A találmány tárgya vektorkódolási eljárás, különösen beszédhangjelek kódolására, amelyben predikciós kódoláshoz kódkönyvet alkalmaznak.
Beszédhangjelek kódolása végett - különösen mobil rádiótelefonos alkalmazásokra - a beszédhangjelet letapogatják, és szakaszokra (időszakaszokra) osztják fel. Mindegyik szakaszhoz a különböző fajta jelparaméterek számára predikciós értékeket képeznek. Ilyen jelparaméterek például, a beszédhangjel formánsszerkezetének (a beszédsáv rezonanciáinak) jellemzésére szolgáló rövid idejű paraméterek, és a beszédhangjel pitchszerkezetének (hangmagasságának) jellemzésére szolgáló hosszú idejű paraméterek (ANT Nachrichtentechnische Berichte, Heti 5, Nov.1988, 93-105. oldal). „Analízis szintézis útján” módszerrel végzett beszédhangkódoláskor a modell-paramétereket és gerjesztési paramétereket kvantálják, kódolják és a vevőhöz átviszik. A bitátviteli sebesség további csökkentésére vektorkvantálást alkalmaznak (lásd fentebb; DE/EP 0266620 Ti; EP 504627A2; EP 294020 A2).
Az ANT Nachrichtentechnische Berichte, Heflt 5, Nov.1988, 93-105. oldalából, és különösen a 102. oldal 2.oszlopa és a 103. oldal 2. oszlopa közötti részből ismeretes, hogy a kódkönywektor komponenseinek akár 90%-át is nullává lehet tenni anélkül, hogy a beszédminőség romlana. Ugyanott azt is javasolják, hogy a gerjesztési szekvenciák számát a beszédszintetizáláshoz szolgáló szűrőnél még erősebben korlátozzák oly módon, hogy az impulzusoknak (együtthatóknak) nemcsak a helyzetét, hanem kiegészítőleg az amplitúdóját is rögzített értékűnek válasszák. Eszerint rögzített gerjesztési kódkönyvet választanak, amelynek a vektorai négy, a nullától különböző elemet (vektorösszetevőt) tartalmaznak.
Találmányunk célja a bevezetőleg leírt jellegű eljárás olyan továbbfejlesztése, hogy csökkentett tárolási és jelfeldolgozási ráfordítás mellett olyan kódkönyvparaméterek álljanak rendelkezésre, amelyeknek kisebb a hibaérzékenysége, különösen zavart csatornákon történő átviteli célokra.
Ezt a feladatot a találmány értelmében úgy oldjuk meg, hogy egy első kódkönyvben szintetikus jeleket, különösen n számú, elsősorban 4, nullától különböző, az érték tekintetében egyenlő, és csak az előjelben eltérő amplitudóértékű beszédhangjeleket előállító geijesztőszűrő geijesztőjeleihez (vektoraihoz) szolgáló kombinációs minták, illetőleg az ezeknek az amplitúdóértékeknek a tárolásához szükséges címek kombinációs mintáit tároljuk el, és egy további kódkönyvben az ezekhez tartozó autokorrelációs együtthatókat tároljuk a következő lépésekben:
- a további kódkönyvben autokorrelációs együtthatókat tárolunk, amelyek a szintetikus jeleket, különösen beszédhangjeleket előállító gerjesztőszűrő impulzusválaszának autokorrelációs függvényével összekapcsolva, a szűrt gerjesztőjel energiáját adják meg,
- csak olyan kombinációs mintákat engedünk meg, amelyeknek három, a nullától különböző autokorrelációs együtthatójuk van,
- az AKF (0) korrelációs maximumon kívüli autokorrelációs együtthatók nullától különböző amplitúdóértékei csak előjelükben térnek el egymástól.
Előnyös módon csak azokat a nullától különböző autokorrelációs együtthatókat (AKF) tároljuk az első kódkönyvben, amelyek az AKF (0) korrelációs maximumon kívül vannak.
Minden lehetséges kombinációs mintához előnyös módon képezünk egy részkódkönyvet, és egy részkódkönyvbe csak a mindegyik részkódkönyvnél azonos kombinációs mintának az adott helyzetét vezetjük be.
A részkódkönyvek a kölcsönös megkülönböztetés végett előnyös módon egy kódszóval vannak jelölve.
A kombinációs mintákat előnyös módon négy, +1 és -1 amplitúdóértékű együtthatóból képezzük.
256 vektoros kódkönyvhossz esetén előnyös módon összesen 16 részkódkönyvet hozunk létre, amelyekbe 16 vektorra vonatkozó kombinációs mintát, soronként vezetünk be.
részkódkönyv helyett előnyös módon, csak 8 részkódkönyvet hozunk létre, és a többi 8 részkódkönyvet a 8 korábban létrehozott részkódkönyvből a bevezetett értékek előjelváltásával állítjuk elő.
A találmány szerinti eljárás a következő felismeréseken alapszik:
Az autokorrelációs együtthatókból képzett kombinációs mintákat nem kell tárolni. Elegendő, ha címüket, vagyis helyzetüket tároljuk. Ez jelentősen csökkenti a tárfelhasználást és a jelfeldolgozást. A kombinációs mintákat és ezek eloszlását elválasztva lehet átvinni. Mivel a beszédkódok érzékenyebben reagálnak az impulzusmintákra (az autokorrelációs együtthatókból kapott kombinációs mintákra), mint azok eloszlására (a vektorösszetevők elrendezésére), ezért zavart átvitel esetén jobb beszédminőséget kapunk. Ennek megfelelően a találmány szerinti eljárás, különösen rádiótelefonban alkalmazható előnyösen.
Találmányunkat annak példaképpeni foganatosítási módja kapcsán ismertetjük részletesebben ábráink segítségével, amelyek közül az
1. ábra a RELP-beszédhangjel-kódolás elvét ismertető vázlat, a
2. ábra az „analízis szintézis útján” módszerrel végzett beszédhangjel-kódolás elvi vázlata, a
3. ábra példa az autokorrelációs együttható, találmány szerinti kiválasztására, és a
4. ábra az impulzusminta eloszlását tároló részkódkönyvek példája.
Beszédhangjelek kis bitsebességű, például 2,4 kbit/s és 9,6 kbit/s közötti bitsebességű átviteléhez például, egy „analízis szintézis útján” elv szerinti RELP-beszédhangjel-kódokat alkalmazunk. A például a RELP (Residual Exciting Linear Prediction) elv szerinti beszédhangjelkódolást (ANT Nachrichtentechnische Berichte, Heft 5, Nov. 1988, 93-105. oldal) a találmány további megértése végett az 1. ábra kapcsán röviden ismertetjük. Egy időtartománybeli s(t) beszédhangjelet egy analóg/digitális átalakítóval digitalizálunk, majd analizálunk.
Ez az analízis a predikció funkcionális blokkban és a gerjesztésanalízis funkcionális blokkban megy végbe.
HU 216 557 Β
A beszéd redundanciájának megszüntetésére lineáris adaptív modellt alkalmazunk, amelyet alkalmas módon gerjesztünk. Csak a beszédszintézishez szükséges modell- és geijesztésparamétereket kvantáljuk, kódoljuk és visszük át a vevőhöz. A modellparaméterek meghatározásához az adóban a beszéd mintavételi értékek statisztikai függőségeit analizáljuk, és lineáris rövid idejű és adott esetben hosszú idejű predikcióval kiküszöböljük. A rövid idejű predikcióval a közvetlenül egymást követő mintavételi értékek közötti korrelációkat küszöböljük ki. Az egymástól távol lévő mintavételi értékek közötti korrelációkat (pitchszerkezet vagy hangmagasság) egy ezután következő hosszú idejű prediktor csökkenti. Az eredmény olyan digitális s(n) kimenőjel, amelyben lényegében már csak nemlineáris függőségek vannak, és amelynek az energiája az eredeti digitalizált s(n) beszédhangjel energiájához képest erősen csökkent. Az „analízis szintézis útján” módszernél a gerjesztőjel számítására az eredeti s(n) beszédhangjel és a szintetizált beszédhangjel, az s(n) kimenőjel közötti különbséget, az e(n) hibajelet alkalmazzuk (1. ábra).
Rövid, körülbelül 10...30 ms tartamú beszédszakaszokon belül a beszédet kvázistacionárius folyamatnak lehet tekinteni. Ez a kvázistacionáriusság lehetővé teszi prediktorok számítását, amelyeknek a paraméterei a beszédszakasz tartamára állandó értékeket vesznek fel. Egy 20 ms tartamú beszédszakaszt például kerettartamként rögzítünk. Ekkor 8 kHz mintavételi frekvencia esetén a prediktoregyütthatók adaptálásához keretenként 160 mintavételi érték áll rendelkezésre. A predikciós hibákat a predikciós hiba keretenként! energiájának minimálásával állapítjuk meg. Ezeknek a predikciós együtthatóknak a meghatározására, a számítási munka egyszerűsítése végett, a korrelációs módszert alkalmazzuk.
Az s(n) beszédhangjel analízise rövid idejű predikciós átviteli HK _I(Z) függvény és hosszú idejű predikciós átviteli HL-»(Z) függvény segítségével történik, melynek során eK(n) rövid idejű predikciós hibajel, és eL(n) hosszú idejű predikciós hibajel keletkezik. Az analízis során meghatározzuk a beszédszintézisszűrő a, és bj együtthatóit, valamint az M keresési tartományt, amelyeket a 2. ábrán a HL(Z) HK(Z) átviteli függvény tartalmaz. A szintézisszűrőhöz vezetett r(n) gerjesztőjelet vagy számítjuk, vagy a találmány értelmében egy kódkönyvből kiolvassuk. A szintézisszűrő s(n) kimenőjele a becsült beszédhangjel. Az eredeti s(n) beszédhangjellel összehasonlítva kapjuk az e(n) hibajelet, amit a W(Z) átviteli függvénnyel hallásfiziológiailag súlyozunk. A súlyozott ew(n) hibajel energiáját ezután javított r(n) geijesztőjel megállapítására alkalmazzuk.
Az átviteli bitsebesség további csökkentésére vektorkvantálást alkalmazunk. A geijesztőjel kiszámítását L számú D dimenziójú geijesztővektorral helyettesítjük. Egy skálázási tényező segítségével mindegyik vektor energiáját a beszédhangjel energiájához illesztjük. Ezután a legkisebb hibaenergiájú vektor címét átviszik a vevőre. Minthogy a predikciós hibajel eloszlása jó közelítésben normális eloszlás, ezért a kódkönyvet normális eloszlású véletlen számokkal lehet kitölteni. Ennek az úgynevezett CELP-eljárásnak (Codebook
Excited Linear Prediction) az előnye többek között az, hogy a kódkönyvet nem kell „tanítani”. A ráfordítás tovább csökkenthető nullavektorokat tartalmazó kódkönywektorok alkalmazásával. A geijesztővektor számításához ekkor kevesebb számítási művelet szükséges. Az ANT Nachrichtentechnische Berichte, Heft 5, Nov.1988, 93-105. oldalán javasolták, hogy a kódkönywektorok minél több komponensét, például 90%át tegyük nullává (103. oldal, bal hasáb, utolsó bekezdés), és a geijesztési szekvenciák számát még erősebben korlátozzuk oly módon, hogy az együtthatók (impulzusok) helyzeteit rögzítjük és amplitúdóját állandó értéken tartjuk. Ott a kódkönyvhöz olyan vektorokat alkalmaznak, amelyek négy, nullától különböző elemet tartalmaznak.
A találmány értelmében ezeket a követelményeket a tárigény és a jelfeldolgozási ráfordítás javára tovább szigorítottuk: csak olyan vektorokat alkalmazunk, amelyeknek három, nullától különböző AKF autokorrelációs együtthatójuk van. Az AKF (0) korrelációs maximumon kívül lévő AKF autokorrelációs együtthatókat úgy választjuk meg, hogy csak előjelükben különbözzenek egymástól, vagyis amplitúdójuk egyenlő.
A 3. ábrán látható példa az ily módon kiválasztott AKF autokorrelációs együtthatókra n=4 impulzussal, vagyis amplitúdóbittel egy, például 40 mintavételi értéket tartalmazó kereten belül. Az AKF (0) korrelációs maximumnál a 4 amplitúdóérték adódik. Mivel ez az érték minden n-impulzusú impulzusmintánál állandó, nem kell tárolni. A nullától különböző többi impulzus amplitúdója 1. Az 5. mintavételi érték például +1, és a 15. mintavételi érték -1.
Az itt alkalmazott AKF autokorrelációs együtthatók úgy vannak definiálva, hogy egy szintetikus jeleket (beszédhangjeleket) előállító geijesztőszűrő impulzusválaszának autokorrelációs függvényével való összekapcsoláskor a szűrt geijesztőjel energiáját kapjuk.
Ezenkívül minden kombinációs mintára, amelyet ilyen AKF autokorrelációs együtthatókból képezünk, fennáll a követelmény, hogy a kódkönyvben azonos gyakorisággal szerepeljenek. Az utóbbi követelmény által egy 2L teijedelmű kódkönyv n számú részkódkönyvre bontható, ha a geijesztőjelben n számú nullától különböző impulzus van megengedve, ami 2n lehetséges kombinációs mintának felel meg. Az n számú részkódkönyv mindegyikének teqedelme 2L-n és csak azonos fajta impulzusmintákat tartalmaz. A 4. ábrán látható néhány a 2n= 16 (n=4) lehetséges részkódkönyv közül. Az impulzusminták (a +1 és -1 értékek sorrendjei) mindegyik részkódkönyvben egyenlők, csak az egyes impulzusok helyzete különböző. Az első részkódkönyvben az impulzusminta csak négy pozitív impulzusból, a második részkódkönyvben három pozitív és egy negatív impulzusból áll, stb. A kombinációs minták (impulzusminták) azonos gyakorisága lehetővé teszi, hogy a kombinációs mintákat az impulzusok eloszlásától (helyzetétől) elválasztva vigyük át. Magukat a kombinációs mintákat nem kell tárolni és átvinni. Elegendő, ha mind a tizenhat részkódkönyv az ismert kombinációs mintákkal a többi részkódkönyvtől megkülönböztethető. Ez a legegyszerűbben
HU 216 557 Β úgy valósítható meg, hogy mindegyik részkódkönyvhöz és ezzel az impulzusmintához más címet rendelünk hozzá, például az első részkódkönyvhöz a 0000 címet és a második részkódkönyvhöz a 0001 címet stb. (4 ábra). Az impulzusoknak a részkódkönyvekben elfoglalt helyzetéről is csak egy címet kell tárolni és átvinni.
részkódkönyv létrehozása helyett elegendő csak 8 részkódkönyvet - különböző kombinációs mintákkal - létrehozni (1-8. részkódkönyv). A 9-16. részkódkönyv a kombinációs mintákból egyszerű előjelváltással létrehozható. Például a 11 -1 -1 mintából a -1 -111 minta lesz.
Azzal, hogy az impulzusmintákat az impulzuseloszlástól elválasztjuk, a beszédátvitel-hibákra - különösen átviteli zavarok esetén - lényegében érzéketlenné válik, mivel a kodekek az impulzusmintákra érzékenyebben reagálnak, mint azok eloszlására. Az impulzusokat ezért, például csatornakódolás esetén, az átvitelhez magasabb hibavédelemmel lehet ellátni, mint az impulzusaik speciális helyzetére vonatkozó információt.
Claims (7)
1. Vektorkódolási eljárás, különösen beszédhangjelek kódolására, amelyben kódkönyveket alkalmazunk, és egy első kódkönyvben szintetikus jeleket, és különösen n számú, elsősorban 4, nullától különböző, az érték tekintetében egyenlő, és csak az előjelben eltérő amplitüdóértékű beszédhangjeleket előállító geijesztőszűrő geijesztőjeleihez (vektoraihoz) szolgáló kombinációs minták, illetőleg az ezeknek az amplitúdóértékeknek a tárolásához szükséges címek kombinációs mintái vannak tárolva, azzal jellemezve, hogy egy további kódkönyvben az ezekhez tartozó autokorrelációs együtthatókat tároljuk a következő lépésekben:
- a további kódkönyvben autokorrelációs együtthatókat tárolunk, amelyek a szintetikus jeleket, különösen beszédhangjeleket előállító geijesztőszűrő impulzusválaszának autokorrelációs függvényével összekapcsolva a szűrt geqesztő jelenergiáját adják meg,
- csak olyan kombinációs mintákat engedünk meg, amelyeknek három, a nullától különböző autokorrelációs együtthatójuk van,
- az AKF (0) korrelációs maximumon kívüli autokorrelációs együtthatók nullától különböző amplitudóértékei csak előjelükben térnek el egymástól.
2. Az 1. igénypont szerinti vektorkódolási eljárás, azzal jellemezve, hogy csak azokat a nullától különböző autokorrelációs együtthatókat tároljuk az első kódkönyvben, amelyek az AKF (0) korrelációs maximumon kívül vannak.
3. Az 1. vagy 2. igénypont szerinti vektorkódolási eljárás, azzal jellemezve, hogy minden lehetséges kombinációs mintához képezünk egy részkódkönyvet, és egy részkódkönyvbe csak a mindegyik részkódkönyvnél azonos kombinációs mintának az adott helyzetét vezetjük be.
4. A 3. igénypont szerinti vektorkódolási eljárás, azzaljellemezve, hogy a részkódkönyvek a kölcsönös megkülönböztetés végett egy kódszóval vannak jelölve.
5. A 3. vagy 4. igénypont egyike szerinti vektorkódolási eljárás, azzal jellemezve, hogy a kombinációs mintákat négy, +1 és -1 amplitúdóértékű együtthatóból képezzük.
6. A 3-5. igénypontok bármelyike szerinti vektorkódolási eljárás, azzal jellemezve, hogy 256 vektoros kódkönyvhossz esetén összesen 16 részkódkönyvet hozunk létre, amelyekbe 16 vektorra vonatkozó kombinációs mintát soronként vezetünk be.
7. A 6. igénypont szerinti vektorkódolási eljárás, azzal jellemezve, hogy 16 részkódkönyv helyett csak 8 részkódkönyvet hozunk létre, és a többi 8 részkódkönyvet a 8 korábban létrehozott részkódkönyvból a bevezetett értékek előjelváltásával állítjuk elő.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4315313A DE4315313C2 (de) | 1993-05-07 | 1993-05-07 | Vektorcodierverfahren insbesondere für Sprachsignale |
Publications (3)
Publication Number | Publication Date |
---|---|
HU9503180D0 HU9503180D0 (en) | 1995-12-28 |
HUT73533A HUT73533A (en) | 1996-08-28 |
HU216557B true HU216557B (hu) | 1999-07-28 |
Family
ID=6487537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
HU9503180A HU216557B (hu) | 1993-05-07 | 1994-04-20 | Vektorkódolási eljárás, különösen beszédhangjelek kódolására |
Country Status (10)
Country | Link |
---|---|
US (1) | US5729654A (hu) |
EP (1) | EP0697124B1 (hu) |
AU (1) | AU682505B2 (hu) |
DE (2) | DE4315313C2 (hu) |
DK (1) | DK0697124T3 (hu) |
ES (1) | ES2140533T3 (hu) |
FI (1) | FI116596B (hu) |
HU (1) | HU216557B (hu) |
PT (1) | PT697124E (hu) |
WO (1) | WO1994027285A1 (hu) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
DE19538852A1 (de) * | 1995-06-30 | 1997-01-02 | Deutsche Telekom Ag | Verfahren und Anordnung zur Klassifizierung von Sprachsignalen |
US5781881A (en) * | 1995-10-19 | 1998-07-14 | Deutsche Telekom Ag | Variable-subframe-length speech-coding classes derived from wavelet-transform parameters |
GB2312360B (en) | 1996-04-12 | 2001-01-24 | Olympus Optical Co | Voice signal coding apparatus |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1164569A (en) * | 1981-03-17 | 1984-03-27 | Katsunobu Fushikida | System for extraction of pole/zero parameter values |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4907276A (en) * | 1988-04-05 | 1990-03-06 | The Dsp Group (Israel) Ltd. | Fast search method for vector quantizer communication and pattern recognition systems |
US5010574A (en) * | 1989-06-13 | 1991-04-23 | At&T Bell Laboratories | Vector quantizer search arrangement |
JP3151874B2 (ja) * | 1991-02-26 | 2001-04-03 | 日本電気株式会社 | 音声パラメータ符号化方式および装置 |
US5339164A (en) * | 1991-12-24 | 1994-08-16 | Massachusetts Institute Of Technology | Method and apparatus for encoding of data using both vector quantization and runlength encoding and using adaptive runlength encoding |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
-
1993
- 1993-05-07 DE DE4315313A patent/DE4315313C2/de not_active Expired - Fee Related
-
1994
- 1994-04-20 ES ES94912473T patent/ES2140533T3/es not_active Expired - Lifetime
- 1994-04-20 AU AU65026/94A patent/AU682505B2/en not_active Expired
- 1994-04-20 US US08/535,107 patent/US5729654A/en not_active Expired - Lifetime
- 1994-04-20 DK DK94912473T patent/DK0697124T3/da active
- 1994-04-20 DE DE59408863T patent/DE59408863D1/de not_active Expired - Lifetime
- 1994-04-20 WO PCT/DE1994/000436 patent/WO1994027285A1/de active IP Right Grant
- 1994-04-20 HU HU9503180A patent/HU216557B/hu unknown
- 1994-04-20 PT PT94912473T patent/PT697124E/pt unknown
- 1994-04-20 EP EP94912473A patent/EP0697124B1/de not_active Expired - Lifetime
-
1995
- 1995-11-06 FI FI955324A patent/FI116596B/fi not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE59408863D1 (de) | 1999-12-02 |
FI955324A0 (fi) | 1995-11-06 |
WO1994027285A1 (de) | 1994-11-24 |
PT697124E (pt) | 2000-04-28 |
DE4315313C2 (de) | 2001-11-08 |
FI955324A (fi) | 1995-11-06 |
ES2140533T3 (es) | 2000-03-01 |
HUT73533A (en) | 1996-08-28 |
US5729654A (en) | 1998-03-17 |
FI116596B (fi) | 2005-12-30 |
HU9503180D0 (en) | 1995-12-28 |
AU682505B2 (en) | 1997-10-09 |
DK0697124T3 (da) | 2000-04-25 |
DE4315313A1 (de) | 1994-11-10 |
EP0697124A1 (de) | 1996-02-21 |
AU6502694A (en) | 1994-12-12 |
EP0697124B1 (de) | 1999-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU648479B2 (en) | Speech coding system and a method of encoding speech | |
US5778334A (en) | Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion | |
CA2202825C (en) | Speech coder | |
EP1225568B1 (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
EP0307122B1 (en) | Speech coding | |
CA2186433C (en) | Speech coding apparatus having amplitude information set to correspond with position information | |
EP0409239A2 (en) | Speech coding/decoding method | |
EP0957472B1 (en) | Speech coding apparatus and speech decoding apparatus | |
KR20010024935A (ko) | 음성 코딩 | |
EP1162603B1 (en) | High quality speech coder at low bit rates | |
RU2223555C2 (ru) | Адаптивный критерий кодирования речи | |
US5970444A (en) | Speech coding method | |
EP0401452B1 (en) | Low-delay low-bit-rate speech coder | |
KR100561018B1 (ko) | 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법 | |
US5873060A (en) | Signal coder for wide-band signals | |
HU216557B (hu) | Vektorkódolási eljárás, különösen beszédhangjelek kódolására | |
FI98481C (fi) | Menetelmä ja laite analogisen sisääntulosignaalin muuttamiseksi ohjauskoodeiksi ja vastaavan ulostulosignaalin syntetisoimiseksi näiden ohjauskoodien ohjauksen alaisena | |
EP1154407A2 (en) | Position information encoding in a multipulse speech coder | |
US8502706B2 (en) | Bit allocation for encoding track information | |
JP3214249B2 (ja) | ベクトル量子化による符号化復号化方式 | |
USRE35057E (en) | Speech coding using sparse vector codebook and cyclic shift techniques | |
CA2618002C (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
JP3984021B2 (ja) | 音声/音響信号の符号化方法及び電子装置 | |
JPH04312000A (ja) | ベクトル量子化方法 | |
KR100389898B1 (ko) | 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
DGB9 | Succession in title of applicant |
Owner name: ROBERT BOSCH GMBH., DE |