HU215620B

HU215620B - Eljárás adatok, különösen kódolt beszédhangjelek paramétereinek feldolgozására

Info

Publication number: HU215620B
Application number: HU9503181A
Authority: HU
Inventors: Jörg-Martin Müller; Bertram Wächter
Original assignee: Ant Nachrichtentechnik Gmbh.
Priority date: 1993-05-07
Filing date: 1994-04-20
Publication date: 1999-01-28
Also published as: DE4315319A1; DE59408494D1; FI955323A0; FI955323A; ES2136193T3; HU9503181D0; DK0697123T3; US5794183A; EP0697123B1; FI116598B; EP0697123A1; WO1994027284A1; AU6502494A; DE4315319C2; AU679980B2; HUT73532A

Abstract

A találmány tárgya eljárás adatők, különösen kódőlt beszédhangjel-paraméterek feldőlgőzására, átviteli célőkra. Adatőknak, különösenkódőlt beszédhangjel-paramétereknek kis bitsebességű átvi elhez valófeldőlgőzása végett az azőnős jellegű jelparamétereket kvantáltalakban szakaszőnként összefőglaljűk. Tővábbi bitcsökkentés végettlegalább két szakasz bitjeinek teljes számából biteket nyőműnk el. Azelnyőmandó bitkülönbséget a nem csökkentett bitek teljes számábólkiindűlva kettő következő nagyőbb atványáig képezzük. Ez a módszerjőbb minőségű beszédhangőt szőlgáltat, mint az a módszer, ami szerinta kvantálási főkőzatők számát 2 többszörösével váltőztatják. ŕ

Description

A találmány tárgya eljárás adatok, különösen kódolt beszédhangjelek paramétereinek feldolgozására, átviteli célokra.

Beszédhangjelek kódolása végett - különösen mobil rádiótelefonos alkalmazásokra - a beszédhangjelet letapogatják, és szakaszokra (időszakaszokra) osztják fel. Mindegyik szakaszhoz a különböző fajta jelparaméterekhez predikciós értékeket képeznek. Ilyen jelparaméterek például a beszédhangjel formánsszerkezetének (a beszédsáv rezonanciáinak) jellemzésére szolgáló rövid idejű paraméterek és a beszédhangjel pitchszerkezetének (hangmagasságának) jellemzésére szolgáló hosszú idejű paraméterek (ANT Nachrichtentechnische Berichte, Heft 5, Nov. 1988, 93-105. oldal). „Analízis szintézis útján” módszerrel végzett beszédhangkódoláskor a modelparamétereket és gerjesztési paramétereket kvantálják, kódolják és a vevőhöz átviszik. A bitátviteli sebesség további csökkentésére vektorkvantálást alkalmaznak (lásd fentebb; DE/EP0 266 620 TI; EP 504 627 A2; EP 294 020 A2).

Találmányunk célja a bevezetőleg leírt jellegű eljárás olyan továbbfejlesztése, hogy a bitátviteli sebesség további csökkentése mellett a kimeneti adatokat kielégítően lehessen visszaállítani.

Ezt a feladatot a találmány értelmében úgy oldjuk meg, hogy a kimeneti adatokat azonos jellegű jelparaméterek szempontjából elemezzük, az azonos jellegű jelparamétereket kvantált alakban szakaszonként összefoglaljuk, és a bitek teljes számát legalább kétfajta összefoglalt jelparaméterre úgy csökkentjük, hogy a kvantálási fokozatok nagyjából egyformán vannak elosztva az egyes szakaszokra, és a nem csökkentett bitek teljes számából kiindulva a bitkülönbséget kettő következő nagyobb hatványáig elnyomjuk.

Előnyös módon azokat a biteket nyomjuk el, amik a statisztikailag legkevésbé valószínű kvantálási fokozatoknak felelnek meg.

A bitek eredeti g teljes száma és előre adott n bitcsökkentés esetén az ekkor keletkező 2g ⁿ kvantálási fokozatot előnyös módon úgy osztjuk el, hogy minden szakaszra nagyjából ^tsl2s-ⁿ kvantálási fokozat jut, ahol m mindenkor az azonos fajta jelparaméterek száma.

Az adatok előnyös módon keretszerkezetbe vannak elrendezve, amiben mindenkor különböző fajta jelparaméterek képeznek keretszakaszokat.

Előnyös módon mindenkor különböző fajta jelparamétereket tartalmazó két keretszakaszt foglalunk össze és ezekben csökkentjük a bitek számát.

A beszédhangjel-paramétereknek 7 bit/vektorral és 8x12 vektoros szerkezettel végzett vektorkvantálása esetén a bitelnyomáshoz előnyös módon az alábbi összefüggéseket választjuk:

ha SÍ <7, akkor 0<S2< 10, és haSl>7, akkorO<S2<9, ahol SÍ és S2 a két keretszakasz vektorösszetevője.

A találmány szerinti eljárás fő előnye az átviteli hibákkal szembeni robusztussága. A találmány szerinti eljárás lehetővé teszi olyan beszédhangkódolók felépítését, amiknek a beszédhangminősége jobb, mint azoké a beszédhangkódolóké, amelyek a kvantálási fokozatokat 2 többszörösével csökkentik. Mivel az átviteli hibák általában halmozottan lépnek fel, ezért csökkentett ráfordítás mellett a hibajavítás nem romlik.

Találmányunkat annak példaképpeni kiviteli alakja kapcsán ismertetjük részletesebben ábráink segítségével, amelyek közül az

1. ábra a találmány szerinti eljárásnak megfelelően működő beszédhangkódoló kapcsolási blokksémája, a

2. ábra két, különböző fajta jelparaméterhez szolgáló keretszakasz keretfelépítése.

Ahogyan ez az 1. ábrán látható, egy beszédhangjelforrás beszédhangjeleit egy A/D analóg/digitális átalakító letapogatja, és egy A analizáló egység azonos fajta beszédhangjel-paraméterek szempontjából elemzi. Az A analizáló egység mindig egy csoport önmagában azonos fajta beszédhangjel-paramétert, például egy csoport, a formánsszerkezetre vonatkozó KP rövid idejű paramétert (geqesztési paramétert), egy csoport, a pitchszerkezetre vonatkozó LP hosszúidejű paramétert és egy csoport FP szűrősúlyozási paramétert szolgáltat. Ezekkel a paramétercsoportokkal a PRK, PRL, PRF prediktorban a szokványos módon, például az EP 364 647 számú európai szabadalmi leírás szerint predikciós értékeket kapunk, amiket VQ vektorkvantálásnak vetünk alá. A kvantált jelparamétereket az RA keretképző egységben összefoglaljuk, mégpedig úgy, hogy egy például 20 msec kerettartamú keret négy 5 msec tartamú keretszakaszból áll. Mindegyik keretszakaszban azonos fajta jelparaméterek vannak elhelyezve. Ezután legalább két ilyen keretszakaszból (a következőkben két keretszakasz kezelését íijuk le, de természetesen kettőnél több keretszakaszt is lehet együtt kezelni) biteket nyomunk el a BÜ bitelnyomó egységgel. A bitelnyomást a találmány értelmében nem egyenként végezzük mindegyik keretszakaszra, hanem összefoglalt, azonos fajta keretszakaszok legalább két fajtájából kapott bitek teljes számára, vagyis például egy 20 msec tartamú keretben lévő rövid idejű és hosszú idejű paraméterek bitjeinek teljes számára végezzük el. A bitelnyomáskor ügyelünk arra, hogy a kvantálási fokozatok egyenletesen legyenek elosztva a keretszakaszokra. Az ebtyomandó bitek n számát előnyös módon a ™^!2'έ~^η összefüggés szerint osztjuk el a keretszakaszokra, ahol m az azonos fajta jelparaméterek száma és g az eredeti bitek teljes száma. Ezzel kettő következő magasabb hatványáig nyomjuk el a nem csökkentett bitek g teljes számából kiindulva a bitkülönbséget.

A bitelnyomáshoz előnyös módon azokat a biteket választjuk ki, amik a statisztikailag legkevésbé valószínű kvantálási fokozatoknak felelnek meg. Ez a követelmény például úgy teljesíthető, hogy a kevésbé valószínű kvantálási fokozatokat előre tároljuk egy SP tárban, ami a BÜ bitelnyomó egységet vezérli. Mivel a kvantálási fokozatok valószínűsége általában feltételes, vagyis egy keretszakaszból választott jelparaméterhez a következő keretszakaszban van olyan jelparaméter, aminek a fellépése a választott jelparaméterhez csatlakozva valószínűbb, mint más jelparaméterek fellépése, ezért a bitelnyomás kiválasztásakor a 2. ábra szerint já2

HU 215 620 Β runk el, vagyis az ábrázolt szerkezetben elnyomunk minden bitet, aminek a mezőjében kereszt van.

A 2. ábrán 12 χ 12 vektorból álló szerkezet látható. Az SÍ keretszakasz tartalma 4 bittel van kvantálva azonos fajta amplitúdóértékekre. Ugyanez vonatkozik az S2 keretszakaszra is. A vektorra 7 bit adódik. A bitelnyomás az alábbi összefüggések szerint történik:

ha SÍ <7, akkor 0<S2< 10, és ha Sl>7, akkorO<S2<9, ahol SÍ és S2 a két keretszakasz vektorösszetevője. A jelen példára fennáll, hogy index=S2x 12 + SÍ < 127

A 2. ábrán ábrázolt sémát természetesen megfelelően más szerkezetekre, például a kvantálandó amplitúdóértékek más számára is át lehet vinni.

Eddig azonos fajta jelparaméterek keretszakaszokba való összefoglalását írtuk le. Azonos fajta jelparamétereket természetesen keretszakaszok helyett más módon is össze lehet foglalni. Mindössze arról kell gondoskodni, hogy a továbbfeldolgozáshoz összetartozókként felismerhetők legyenek.

Claims

SZABADALMI IGÉNYPONTOK

1. Eljárás adatok, különösen kódolt beszédhangjelek paramétereinek feldolgozására, átviteli célokra, azzal jellemezve, hogy a kimeneti adatokat azonos jellegű jelparaméterek szempontjából elemezzük, az azonos jellegű jelparamétereket kvantált alakban szakaszonként összefoglaljuk, és a bitek teljes számát legalább kétfajta összefoglalt jelparaméterre úgy csökkentjük, hogy a kvantálási fokozatok nagyjából egyformán vannak elosztva az egyes szakaszokra, és a nem csökkentett bitek teljes számából kiindulva a bitkülönbséget kettő következő nagyobb hatványáig elnyomjuk.

2. Az 1. igénypont szerinti eljárás, azzal jellemezve, hogy azokat a biteket nyomjuk el, amik a statisztikailag legkevésbé valószínű kvantálási fokozatoknak felelnek meg.

3. Az 1. vagy 2. igénypont szerinti eljárás, azzal jellemezve, hogy a bitek eredeti g teljes száma és előre adott n bitcsökkentés esetén az ekkor keletkező 2® ⁿkvantálási fokozatot úgy osztjuk el, hogy minden szakaszra nagyjából ^2^ kvantálási fokozat jut, ahol m mindenkor az azonos fajta jelparaméterek száma.

4. Az 1-3. igénypontok bármelyike szerinti eljárás, azzal jellemezve, hogy az adatok keret szerkezetbe vannak elrendezve, amiben mindenkor különböző fajta jelparaméterek képeznek keretszakaszokat.

5. A 4. igénypont szerinti eljárás, azzal jellemezve, hogy mindenkor különböző fajta jelparamétereket tartalmazó két keretszakaszt foglalunk össze és ezekben csökkentjük a bitek számát.

6. Az 5. igénypont szerinti eljárás, azzal jellemezve, hogy a beszédhangjel-paramétereknek 7 bit/vektorral és 8x12 vektoros szerkezettel végzett vektorkvantálása esetén a bitelnyomáshoz az alábbi összefüggéseket választjuk :

ha SÍ <7, akkor 0<S2< 10, és ha Sl>7, akkor 0<S2<9, ahol SÍ és S2 a két keretszakasz vektorösszetevője.