HU213592B - Coding methods for digital audio signals - Google Patents

Coding methods for digital audio signals Download PDF

Info

Publication number
HU213592B
HU213592B HU9203759A HU9203759A HU213592B HU 213592 B HU213592 B HU 213592B HU 9203759 A HU9203759 A HU 9203759A HU 9203759 A HU9203759 A HU 9203759A HU 213592 B HU213592 B HU 213592B
Authority
HU
Hungary
Prior art keywords
signal components
critical
block
bits
noise level
Prior art date
Application number
HU9203759A
Other languages
English (en)
Other versions
HU9203759D0 (en
HUT63278A (en
Inventor
Kenzo Akagiri
Akira Koike
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP3091187A external-priority patent/JP3060576B2/ja
Priority claimed from JP3091188A external-priority patent/JP3060577B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Publication of HU9203759D0 publication Critical patent/HU9203759D0/hu
Publication of HUT63278A publication Critical patent/HUT63278A/hu
Publication of HU213592B publication Critical patent/HU213592B/hu

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Description

A találmány tárgya kódolási eljárás digitális audiojelekhez, komprimált jel előállítására, aminek során egy bemenő digitális jelből spektrális jelösszetevőket származtatunk, és a spektrális jelösszetevőket kritikus sávokba osztjuk.
Az audiojelek hatékony kódolására ismert olyan kódolási technika, ami bithozzárendelésen alapszik. Az audiojelet több csatornába, jelösszetevőkre osztják, időalapon vagy frekvencia alapon, és minden csatornához adaptív módon egy bizonyos bitszámot rendelnek hozzá. Egy a fent említett bithozzárendelésen alapuló kódolási technika az jólismert sávra osztó kódolás (részsávos kódolás, SBC), aminek során az időalapú audiojelet több frekvenciasávba, jelösszetevökre osztják kódolás végett; az adaptív transzformációs kódolás (ATC), aminek során az időalapú jelet frekvencialapú jellé transzformálják (ortogonálisán transzformálják), több frekvenciasávba jelösszetevőkre osztják a megfelelő sávok adaptív kódolása végett; az úgynevezett adaptív bithozzárendeléses adaptív prediktív kódolás (APC-AB), aminek során a részsávos kódolást (SBC) és az úgynevezett adaptív prediktív kódolást (APC) kombinálva az időalapú jelet frekvenciaalapú jelösszetevőkre osztják, a megfelelő sávokban lévő jelösszetevőket alapsávokban (alacsony frekvenciasávokban) lévő jelösszetevőkké alakítják át, majd a prediktív kódolás kiszámítása végett egynél magasabb fokszámú lineáris predikciót alkalmaznak.
A fent említett hatékony kódolás során egy időalapú audiojelet az időalaptól lineárisan független bázisú, elterjedt matematikai megnevezéssel ortogonális - frekvenciaalapú jellé transzformálják ún. ortogonális transzformációval, például gyors Fourier-transzformációval (FFT) vagy diszkrét koszinusz transzformációval (DCT) stb. és egy előre meghatározott időegységgel később a frekvenciaalapú jelet több sávba, jelösszetevőkre osztják, majd a megfelelő osztott sávokban lévő együttható adatokat adaptív bithozzárendeléssel kódolják, és ezek a kódolt adatok kerülnek átvitelre.
A megfelelő sávok együttható adatainak a fent említett adaptív bithozzárendeléssel történő kódolásakor gyakran alkalmazzák azt a módszert, ami szerint például a frekvenciaalapú együttható adatokat adatblokkokba osztják, hogy minden blokknál úgynevezett lebegőblokkos vagy más szóval blokklebegtető feldolgozást végezzenek további tömörítés végett. Evégett - ugyanúgy, mint az ezt követő dekódoláskor - a rendszer úgy van felépítve, hogy az együttható adatokat sávokra osztja, minden blokkot és a megfelelő blokkok lebegő együtthatóiból álló segédinformációt blokklebegtetéssel feldolgozza, és a lebegő együtthatóknak megfelelő szóhossz-információt, valamint a megfelelő blokkok bithozzárendelési számát átviszi.
A fentebb említett hatékony kódolásnál azonban kívánatos a tömörítés hatékonyságának további növelése.
Találmányunk célja - a jelenlegi, fentebb leírt körülmények figyelembevételével - olyan kódolási eljárás digitális jelekhez, ami nagyobb mértékű bitsürítést, tömörítést tesz lehetővé.
Ezt a feladatot a találmány értelmében úgy oldjuk meg, hogy a spektrális jelösszetevőket kritikus sávokba osztjuk; az egyes kritikus sávokban lévő jelösszetevőket az a kritikus sáv sávszélességénél kisebb sávszélességű blokkokra osztjuk; az egyes blokkok lebegő-együtthatóit előállító lebegő-feldolgozást végzünk minden blokkon; a spektrális jelösszetevőket minden blokkban, a kritikus sáv megengedett zaj szintje szerint a blokkhoz rendelt bizonyos számú bittel kvantáljuk, a blokkhoz rendelt bitszámot szóhosszúság-információként azonosítjuk; és a komprimált jelnek a blokkokhoz rendelt szóhosszúság-információt, valamint a lebegö-együtthatók helyett a kritikus sáv megengedett zaj szintj éré vonatkozó információt tekintjük.
A találmányunk ad egy további eljárási módot, amennyiben annak feltételei teljesülnek. Eszerint a spektrális jelösszetevők kritikus sávokba osztása után a jelösszetevőket egyetlen, több kritikus sáv sávszélességével azonos sávszélességű blokkba osztjuk; a blokk lebegő-együtthatóját előállító lebegő feldolgozást végzünk a blokkon;
és a spektrális jelösszetevőket a kritikus sávokban adaptívan hozzárendelt számú bittel kvantáljuk.
Itt a hozzárendelt bitek számának meghatározásakor kívánatos egy olyan módszer alkalmazása, ami szerint meghatározunk egy úgynevezett maszkolási mennyiséget a megfelelő kritikus sávok energiáiból, fígyelembevéve az emberi hallóérzék jellemzőit és így a megfelelő kritikus sávokhoz hozzárendelt bitek számát a maszkolási mennyiségén alapuló megengedett szintek felhasználásával határozzuk meg.
Abban a fázisban, amikor a bemenő digitális jelből spektrális jelösszetevőket származtatunk, ezt célszerűen egy ortogonális transzformációval, tipikusan egy diszkrét koszinusz transzformációval (DCT) végezzük el.
Egy előnyös felosztási mód akként áll elő, hogy a spektrális jelösszetevőket kritikus sávokba osztjuk, a kritikus sávot a 0 és 22 kHz közötti frekvenciasávban 25 sávra osztjuk, amelyeknek a sávszélessége a magasabb frekvenciák felé növekszik.
Miután a spektrális jelösszetevőket minden blokkban kvantáljuk, célszerűen a következő lépéseket hajtjuk végre: a megengedett zajszintet a spektrális jelösszetevőkből számítjuk;
minden egyes blokkhoz egy magnitúdó együtthatót számítunk ki a blokkban levő spektrális jelösszetevőkből; és a spektrális jelösszetevők kvantálásánál a bitszámot az adott blokk magnitúdó együtthatója és a megengedett zajszint közötti különbség alapján állapítjuk meg.
Ha a bemenő digitális jelből spektrális jelösszetevőket származtatunk, a spektrális jelösszetevők egy kézenfekvő kezelési formátumban amplitúdó és fázis értékekből állnak. Amikor minden egyes blokkhoz egy magnitúdó együtthatót számítunk ki, akkor a blokkban levő spektrális jelösszetevők amplitúdó értékeit összegezzük.
Találmányunkat annak egy példaképpeni foganatosítási módja kapcsán ismertetjük részletesebben, ábráink segítségével, amelyek közül az
A. ábra azt az esetet ábrázolja, amelyben a találmány szerinti lebegő feldolgozást végzünk minden blokkon, aminek a sávszélessége kisebb, mint a kritikus sávé, az
HU 213 592 Β
1B. ábra azt az esetet ábrázolja, amelyben a találmány szerinti lebegő-feldolgozást végzünk minden blokkon, aminek a sávszélessége nagyobb, mint a kritikus sávé, a
2. ábra a találmány szerinti eljárás egyik foganatosítási módjának folyamatábrája, a
3. ábra a megengedett zajszint beállítására szolgáló áramkör tömbvázlata, a
4. ábra egy burkoló spektrum, az
5. ábra egy maszkolási spektrum, a
6. ábra egy minimális hallhatósági görbe és egy maszkolási spektrum szintézisét mutatja, a
7. ábra az adott foganatosítási mód megfelelő blokkjainak átvitt megengedett zajszintjeit magyarázza.
A találmány értelmében, mint azt a továbbiakban részleteiben is bemutatjuk, a megfelelő digitális audiojeleket kódoló eljárások szerint, amint ez az 1A. és 1B. ábrán látható, a bemenő digitális jelet ortogonálisán például gyors Fourier-transzformációval vagy DCT-val - ortogonálisán transzformáljuk. Az ortogonálisán transzformált jelet egy Β (B1-B4) kritikus sávba, jelösszetevőkre osztjuk úgy, hogy a frekvencia magasabb értékek felé való eltolódásával a sávszélesség az emberi hallóérzéknek megfelelően szélesebbé válik. A megfelelő kritikus sávokban lévő jelösszetevőket olyan bitszámmal kódoljuk, ami a kritikus sáv oknak a kritikus sávok energiái alapján beállított, megengedett NL zajszintje és a megfelelő kritikus sávok energiái közötti különbség szintjének felel meg. Az ortogonálisán transzformált jelösszetevőket blokkokba osztjuk, elvégezzük minden b blokk lebegő feldolgozását és átvisszük minden b blokk Fc lebegő-együtthatóit.
Más szavakkal: ennél a foganatosítási módnál a
2. ábrán látható folyamatábra szerinti feldolgozást végezzük el. Először, az SÍ lépésben blokkokba osztjuk az ortogonálisán transzformált jelösszetevőket, elvégezzük a blokkok lebegő-feloldozgásait és így meghatározzuk minden blokk lebegő-együtthatóit (lebegőszintjeit). Az S2 lépésben beállítjuk a megfelelő kritikus sávoknak a kritikus sávok energiái alapján beállított, megengedett zajszintjeit, amit a később leírt módon határozunk meg. Az S3 lépésben a kritikus sávok megengedett zajszintjei és a megfelelő kritikus sávok energiái közötti különbségeknek megfelelő szintek alapján beállított, hozzárendelt bitszámoknak megfelelő szóhosszúság-információkat határozzuk meg. Az 2. ábrán még szereplő S4, S5, S6 lépésekről később lesz szó.
Itt például, mint ez az 1A. ábrán látható, a B kritikus sáv sávszélességénél kisebb sávszélességű kis blokkok (bl-b4 kis blokk) lebegő-feldolgozása esetén alkalmazott módszer szerint a B kritikus sávok lebegő együtthatóinak átvitele helyett egy megengedett NL zajszintre vonatkozó információt és W1-W4 szóhosszúság-információt viszünk át, ami a kis, bl-b4 blokkokhoz hozzárendelt bitek számának felel meg.
Továbbá, mint ez az 1B. ábrán látható, a B1-B4 kritikus sávok sávszélességénél nagyobb sávszélességű, nagy blokkok (b nagy blokk) lebegő-feldolgozása esetén alkalmazott módszer szerint minden b nagy blokk lebegőegyütthatóira vonatkozó információt viszünk át és W1-W4 szóhosszúság-információt viszünk át, ami a B1-B4 kritikus sávhoz hozzárendelt bitek számának felel meg.
Megjegyzendő, hogy az 1 A. ábrán látható példában a kritikus sáv nagy sávszélességének magasabb frekvenciájú oldalán lévő, egy B kritikus sáv van kiemelve és ábrázolva. Az 1B. ábrán látható példában egy kis sávszélesség alacsonyabb frekvenciájú oldalán lévő megfelelő sávok szerepelnek. Emellett az 1A. ábrán az áttekinthetőség kedvéért csak a W1-W4 szóhosszúságokat ábrázoltok, mivel a hozzárendelt bitszám és a W-W4 szóhosszúságok meghatározásánál a szintkülönbségek megegyeznek egymással.
Mint ezt már említettük, ennél a foganatosítási módnál az FFT együttható-adatoknál a kódolást adaptív bithozzárendeléssel végezzük. Itt az adaptív bithozzárendeléssel végzett kódoló-feldolgozás meghatároz - az emberi hallóérzék jellemzőinek figyelembevételével, mint ezt később leírjuk - a megfelelő kritikus sávok energiái alapján egy úgynevezett maszkolási mennyiséget, és így meghatározza a maszkolási mennyiség alapján beállított, megengedett zaj szint (vagyis lényegében az egyes kritikus sávok rögzített megengedett zaj szintje) és a megfelelő kritikus sávok energiája közötti különbséget megadó szintnek megfelelő, hozzárendelt bitszámot. Ezáltal a kódolás az egyes kritikus sávokhoz hozzárendelt bitszámtól függően történik.
A megfelelő kritikus sávokban lévő több együtthatóadat blokkokat képez rögzített számú együtthatóadattal mindegyik blokk úgynevezett blokklebegtető feldolgozásához, bitsűrítés végrehajtása végett. Ennek megfelelően úgy, mint az 1A. ábra szerinti példában, egy B kritikus sávban a magasabb frekvenciájú oldalon, vagyis a kritikus sáv széles sávszélességén több blokk lesz (például négy, bl-b4 kis blokk). Abban az esetben, ha a sávszélesség kicsi (a kritikus sáv alacsonyabb frekvenciájú oldala) egy nagy b blokkban több kritikus sáv lesz (például négy, B1-B4 kritikus sáv).
Ha a blokklebegtető-feldolgozást ily módon szabályszerűen végezzük, akkor a későbbi dekódolási feldolgozásnál lebegőegyütthatókra van szükség a lebegtető-feldolgozáshoz és a hozzárendelési bitszámoknak megfelelő szóhosszúság-információra van szükség. A későbbi dekódoláshoz szolgáló elrendezésben olyan rendszerre van szükség, ami átviszi minden blokk lebegőegyüttható információit és a hozzárendelt bitszámnak megfelelő szóhosszúság-információt, ami a lebegöegyütthatók szintjei és a kritikus sávok megengedett zaj szintjei közötti szintkülönbségeken alapszik.
Más szavakkal: a későbbi dekódoláskor a legszignifikánsabb (MSB = most significant bit) a blokk-lebegtető feldolgozásban a lebegőegyüttható információból határozzuk meg. Hasonlóképpen, a legkevésbbé szignifikáns bitet (LSB = least significant bit) a szóhosszúságinformációból határozzuk meg. így határozzuk meg a megengedett zajszintet. Ezenkívül a jel nagyságát a megfelelő blokkok együttható adataiból (főadataiból) határozzuk meg. Itt a lebegőegyüttható információt általában 6 bit ábrázolja és a szóhosszúság-információt 4 bit ábrázolja. Megjegyzendő, hogy abban az esetben, amelyben
HU 213 592 Β az ortogonális transzformáció DFT (diszkrét Fourier-transzformáció), a fent említett szóinformáció olyan, hogy a nagyságát (amplitúdót) és a fázist, vagy a valós részt és a képzetes részt 4 bit ábrázolja. Ezért például abban az esetben, amelyben egy kritikus sáv több lebegő blokkal van osztva, a blokk-lebegtető feldolgozásban a blokkok számának (vagyis a sávok osztási számának) megfelelő teljes kritikus sáv átvitt bitszámát az 1. táblázat adja meg.
1. táblázat
A kritikus sáv
újraosztásának száma 1 2 3 4
Lebegőegyüttható-
információ 6 6x2 6x3 6x4
Szóhosszúság-információ 4 4x2 4x3 4x4
Összesen: 10 20 30 40
Ebben az 1. táblázatban, ha a kritikus sávot egyetlen blokk ábrázolja (egy osztás: az osztás száma 1), akkor az összes 10 bitből 6-ot a lebegőegyüttható számára és 4 bitet a szóhosszúság számára viszünk át. Ha a kritikus sávot két blokk ábrázolja (két osztás), akkor összesen 20 bitet, a lebegő-együttható számára 6*2 (=12) bitet és a szóhosszúság számára 4x2 (=8) bitet viszünk át. Hasonlóképpen, három osztás esetén összesen 30 bitet, a lebegő-együttható számára (6x3 (=18) bitet és a szóhosszúság számára 4x3 (=12) bitet viszünk át. Négy osztás esetén pedig az (1A. ábra szerinti példa) összesen 40 bitet, a lebegő-együttható számára 6x4 (=24) bitet és a szóhosszúság számára 4x4 (=16) bitet viszünk át. Amint ezt fentebb leírtuk, ahogyan az egyetlen kritikus sávban lévő blokkok száma növekszik, úgy nö az átvitt bitszám is.
Ezzel szemben a találmánynak az 1A. ábra szerinti foganatosítási módjánál azt a módszert alkalmazzuk, hogy csak a B kritikus sávhoz képest beállított, megengedett NL zaj szintre vonatkozó információt és a hozzárendelt bitszámnak megfelelő W1 - W4 szóhosszúságinformációt visszük át és nem visszük át a B kritikus sávban lévő megfelelő kis blokkok Fcl-Fc4 lebegőegyütthatóira vonatkozó információt. A későbbi dekódolási feldolgozásban ugyanis, ha a B kritikus sáv megengedett NL zajszintjére vonatkozó információt átvisszük, akkor a megfelelő bl-b4 kis blokkok Fcl-Fc4 lebegő-együtthatóira vonatkozó információ meghatározható a megengedett NL zajszintre vonatkozó információ és a megfelelő, bl—b4 kisblokkok W1 -W4 szóhosszúságaira vonatkozó információ alapján. Ezen ok miatt ebben az esetben az Fcl-Fc4 lebegőegyüttható információt nem visszük át. így a négy szükséges Fcl-Fc4 lebegő-együttható átvitelénél a bitszám a B kritikus sávhoz képest csökkenthető.
Itt a megengedett NL zaj szintet a kritikus sávoknál az emberi hallóérzék sajátosságainak figyelembevételével határozzuk meg. A kritikus sávban figyelembe vehető, hogy a megengedett NL zaj szint egy kritikus sávban lényegében állandó. Ennek megfelelően hasonlóképpen figyelembe vehető, hogy a megengedett NL zaj szint szintje azonos az 1A. ábra szerinti B kritikus sávon belüli megfelelő bl-b4 blokkban is. Megjegyzendő, hogy ha az egész dinamikus tartomány például 120 dB és a lebegőegyütthatót 6 bit ábrázolja, akkor a lebegő-együttható pontossága körülbelül 2 dB és ha a szóhosszúság-információt 4 bit ábrázolja, akkor a szóhoszszúság-információ pontossága körülbelül 6 dB. Emiatt az ok miatt a későbbi dekódoláskor az Fcl-Fc4 lebegőegyüttható-információ és a W1 - W4 szóhosszúság-információ által meghatározott megengedett zaj szintnek körülbelül 2 dB eltérése vagy eltolódása van, amint ez a 7. ábrán látható. A megengedett NL zaj szint azonban rendszerint lényegében a+3 B tartományba esik. Erre való tekintettel az ennél a foganatosítási módnál alkalmazott módszer szerint a megengedett NL zaj szint ábrázolásához kétlépcsős kvantálást alkalmazunk: egy közös durva kvantálást a kritikus sávokban és egy finom kvantálást a kritikus blokkokban lévő lebegő-feldolgozás megfelelő kis blokkjainál. így a megengedett NL zajszintet egy közös értékként nagy pontossággal állítjuk be. Mégpedig ennél a foganatosítási módnál - minthogy a megengedett NL zajszint a 4 bit lóg szint - a megengedett NL zajszintet, amit a 4 bit lóg nem tud ábrázolni, végül is 2 bit lóg ábrázolja. Ennek megfelelően itt a kb. 6 dB-t elosztjuk néggyel és így a megengedett zajszint pontossága 1,5 dB lehet. A fentiek szerint felhívjuk a figyelmet arra a tényre, hogy a megfelelő megengedett NL zajszintek, lényegében egyenlőek több kis blokkban, hogy ki lehessen választani egy nagypontosságú paramétert a lebegő-együtthatókból és a megengedett szintből, lehetővé téve azáltal a bitszám csökkentését. Az 1A. ábra szerinti bitszámcsökkentés módja - az 1. táblázattal öszehasonlítva a 2. táblázatban található.
2. táblázat
A kritikus sáv újra-
osztásának száma 1 2 3 4
Megengedett zaj szint 4+2 4+2x2 4+2x3 4+2x4
Szóhosszúság- információ 4 4x2 4x3 4x4
Összesen: 10 16 22 28
Az 1. táblázat szerinti példa adatait 100%-nak véve 100 80 73 70
A 2. táblázatban, abban az esetben, amelyben a B kritikus sávot egy blokk ábrázolja (egy osztás), 4 bitet viszünk át a megengedett NL zaj szint számára és 4 bit a W szóhosszúság számára. Megjegyezzük, hogy a megengedett NL zajszintnél, mint fentebb említettük, a 2 dB eltérés kompenzálása végett 2 bitet hozzáadunk (4x2 bit). Emiatt egy osztás esetében összesen 10 bitet viszünk át. Hasonlóképpen, abban az esetben, amelyben a B kritikus sávot két kis blokk ábrázolja (két osztás). Összesen 16 bitet, a megengedett zajszint számára 4+2x2 = 8 bitet és a W szóhosszúság számára 4x2 = 8 bitet viszünk át. Hasonlóképpen három osztás esetén összesen 22 bitet, a megengedett NL zaj szint számára 4+2x 3 = 10 bitet és a W szóhosszúság számára 4x3 = 12 bitet viszünk át. Négy osztás esetén (az 1A. ábra szerinti példa) összesen 28 bitet, a megengedett NL zajszint számára 4+2x4 = 12 és a
HU 213 592 Β kony, egyszerűsített rendszert lehet alkalmazni, amiben a többi W2-W4 szóhosszúságra vonatkozó információt nem visszük át. Eszerint az átvitt bitek számát három
W2-W4 szóhosszúságra vonatkozó információval csökkenteni lehet a B kritikus sávhoz képest.
Az 1B. ábra szerinti példában a bitszám csökkentésének módja - az 1. táblázattal összehasonlítva - a 3. táblázatban látható.
3. táblázat szóhosszúság számára 4*4 = 16 bitet viszünk át. Ezért ha az 1. táblázat szerinti példában átvitt bitszámot 100%nak vesszük és ezt összehasonlítjuk a 2. táblázattal, akkor a 2. táblázat szerinti példa esetében egy osztás esetén a bitszám 100% és ahogyan az osztások száma (a blokkok száma) növekszik, ügy javul a bitsűrítési arány, így két osztás esetén az átvitt bitszám 80%, három osztás esetén 73% és négy osztás esetén 70%. Látható tehát hogy ez a módszer nagyon hatékony.
Megjegyzendő, hogy a W1-W4 szóhosszúság-információ kvantálása természetszerűleg nem adaptív, hanem egyforma.
Összehasonlítva azt az esetet, amelyben a lebegőfeldolgozást a kritikus sáv sávszélességénél kisebb sávszélességű, kis blokkokban végezzük, mint az 1A. ábra szerint, azzal az esettel, amelyben a lebegő-feldolgozást például a kritikus sáv sávszélességénél nagyobb sávszélességű, nagy blokkokban végezzük, ugyancsak a későbbi dekódoláskor rendszerint a megfelelő kritikus sávok blokk lebegő-együtthatóra vonatkozó információ és a megfelelő kritikus sávok szóhosszúságai szükségesek. Ezzel szemben a jelen foganatosítási módnál a kritikus sáv sávszélességénél nagyobb sávszélességű nagy b blokkok lebegő-feldolgozásakor, ami az 1B. ábrán látható, az egy nagy blokk Fc lebegő-együtthatójára vonatkozó információt és az egyes, B1-B4 kritikus sávokban meghatározott W1-W4 szóhosszúságra vonatkozó információt visszük át, mint a lebegő-együtthatóra vonatkozó információt. Megjegyezzük, hogy a megfelelő B1-B4 kritikus sávok megengedett NL1-NL4 zajszintjeire vonatkozó információt nem visszük át. Minthogy ugyanis az Fc lebegő-együtthatók a megfelelő, B1-B4 kritikus sávokban egymással egyenlők, ezért a megengedett NL1-NL4 zaj szinteket meg lehet határozni, az egyes kritikus sávok egy Fc lebegő-együtthatójára vonatkozó információból és W1-W4 szóhosszúságára vonatkozó információból. Eszerint ha segédinformációként csak az Fc lebegő-együtthatóra vonatkozó információt és a megfelelő, W1-W4 szóhosszúságokra vonatkozó információt visszük át, akkor egy szokványos esethez képest a segédinformációhoz szükséges bitszám tovább csökkenthető.
Az 1A. ábra szerinti példában továbbá alkalmazható egy olyan módszer, ami szerint egy B kritikus sávban a megfelelő W1-W4 szóhosszúságok közül csak a W1 szóhosszúságra vonatkozó információt visszük át és a többi, W2-W4 szóhosszúságra vonatkozó információt nem visszük át. így csak a B kritikus sávban lévő Fcl-Fc4 lebegő-együtthatókra vonatkozó információt és a W1 szóhosszúságra vonatkozó információt visszük át. Más szavakkal: ha a későbbi dekódolási feldolgozás során egy szóhosszúságra vonatkozó információt viszünk át, akkor a többi, W2-W4 szóhosszúságra vonatkozó információt meg lehet határozni a megfelelő Fcl-Fc4 lebegő-együtthatókra vonatkozó információból. Konkrétan: ha a megengedett NL zajszint az Fel lebegő-együttható által és a W1 szóhosszúság által meghatározható, akkor a többi, W2-W4 szóhosszúságot a megengedett NL zajszintböl és az Fc2-Fc4 lebegő-együtthatóból meg lehet állapítani. Ezáltal egy hatéKritikus sáv
egységszáma 1 sáv 2 sáv 3 sáv 4 sáv
Lebegőegyüttható- információ 6 6 6 6
Szóhosszúság- információ 4 4*2 4*3 4*4
Összesen: 10 14 18 22
Az 1. táblázat szerinti példa adatait 100%-nak véve 100 70 60 55
A 3. táblázathoz a magyarázatot az egy b blokkban egyesített vagy összekapcsolt kritikus sávok számát (egységszám) használva adjuk meg. Ha az egy b blokkban egyesített sávok száma 1 (1 sáv), akkor összesen 10 bitet, az Fc lebegő-együttható szintjére vonatkozó információ számára 6 bitet és a W szóhosszúság számára 4 bitet viszünk át. Hasonlóképpen, ha a kritikus sávok száma 2 (két sáv), akkor összesen 14 bitet, az Fc lebegő-együttható számára 6 bitet és a W szóhosszúság számára 4*2 = 8 bitet viszünk át. Hasonlóképpen, három sáv esetében összesen 18 bitet, az Fc lebegő-együttható számára 6 bitet és a W szóhosszúság számára 4*3 = 12 bitet viszünk át. Végül négy sáv esetén (lB.ábra szerinti példa) összesen 22 bitet, az Fc lebegő-együttható számára 6 bitet és a szóhosszúság számára 4*4 =16 bitet viszünk át. így - ha az 1. táblázat szerinti bitszámot 100%-nak vesszük és ezt a 3. táblázattal összehasonlítjuk — egy sáv esetén az átvitt bitszám megegyezik az 1. táblázat szerinti példával, vagyis 100% és ha a sávok száma nő, akkor a bitcsökkentési arány ennek megfelelően növekszik, így két sávnál 70%, három sávnál 60% és négy sávnál 55%. Látható tehát, hogy ez a módszer nagyon hatékony.
Ha a találmánynak a jelen foganatosítási módjánál a lebegő-feldolgozást a kritikus sáv sávszélességénél kisebb sávszélességű, kis blokkokban végezzük, akkor az S4 lépésben meghatározzuk és átvisszük a kis blokkokhoz hozzárendelt bitszámnak megfelelő szóhosszúságinformációt. Az S5 és S6 lépésben - a kritikus sávok lebegő-együtthatói helyett - meghatározzuk és átvisszük arra a megengedett zajszintre vonatkozó információt, aminek a rendeltetési tartománya a kritikus tartományban lévő jelszinttartományból az alacsonyabb szint irányában van eltolva egy előre meghatározott szinttel, (ami a később leírandó maszkolási mennyiségén alapszik). Gyakorlatiasabban kifejezve: az S2 lépésben meghatározott megengedett zajszintnek megfelelő érték kiadásához és átviteléhez egy kvantálási táblázatot használunk, amiben tárolva vannak azok az értékek, amik
HU 213 592 Β szerint a rendeltetési tartományt az előbb említett meghatározott szinttel eltoljuk az alacsonyabb szint irányában a kritikus sávban lévő jelszinttartománytól.
Amint ezt fentebb leírtuk, a megengedett zaj szint rendeltetési tartományát a következők miatt toljuk el. Először is az S2 lépésben meghatározott megengedett zajszintre vonatkozó információ átvitele esetében hatástalan vagy értelmetlen a megengedett zaj szintre ugyanazt az indexet használni, mint arra a dinamikus tartományra, amiben egy tényleges jel beleesik. A megengedett zaj szintet ugyanis egy maszkolási mennyiség alapján határozzuk meg, ami - mint később leírjuk - figyelembe veszi az emberi hallóérzék jellemzőit és ezért egy olyan értékkel válik egyenlővé, ami egy előre meghatározott szinttel alacsonyabb, mint a fent említett tényleges jelszint maximális értéke. A megengedett zajszintet például úgy állapítjuk meg, hogy körülbelül 26 dB-lel alacsonyabb, mint a jelszint. Mint az előbb említettük, rendkívül hatástalan vagy értelmetlen a jelszint által felvehető dinamikus tartományt használni a megengedett zajszintként, mivel egy bizonyos rögzített szinttel szükségképpen alacsonyabb, mint a jelszint. Ez a bitszám csökkentése szempontjából sem előnyös. Ezért ennél a foganatosítási módnál egy kvantálási táblázatot használunk, ami szerint a rendeltetési tartomány a kritikus sávban lévő jelszinttartományból egy előre meghatározott szinttel el van tolva az alacsonyabb szint irányában. így a megengedett zajszintet kevesebb számú bittel is ábrázolni lehet. Másképpen kifejezve: a megengedett zaj szintet kisebb bitszámmal is ugyanakkora felbontással (pontossággal) lehet ábrázolni, mint akkor, ha nem lenne eltolás. Eszerint csökkenteni lehet a megengedett zaj szint átviteléhez szükséges bitszámát.
A későbbi dekódoló feldolgozáshoz a W1 szóhosszúságot megadó bl kis blokkátviteli zaj szintje és a megengedett NL zaj szinthez legközelebb eső szint közötti különbséget együtt visszük át. A megengedett NL zaj szint és az ehhez legközelebb eső szint közötti különbséget megadó információként döntési bitinformáció - például 2 bit - átvitelével átvihető az az információ, ami megadja, hogy a megfelelő kis blokkok átviteli zajszintjei hol esnek a lényegében +3 dB-es tartományba. Megadjuk például, hogy ha a 2 bit döntési bitinformáció „00”, akkor az átviteli zaj szintet a + (plusz) oldal felé toljuk el (+1) ; ha ez az információ „01”, akkor a zaj szintnek nincs eltolása; ha ez az információ „10”, akkor a zajszintet a - (mínusz) oldal felé toljuk el (-1). Megjegyezzük, hogy a „11 ”-et nem használjuk vagy azt jelzi, hogy az átviteli zajszint nem változott.
így a bl kis blokkátviteli zajszintjét az Fel lebegő-együtthatóra és a W1 szóhosszúságra vonatkozó információból határozzuk meg. Továbbá a megengedett zajszint és az ehhez legközelebb eső szint közötti különbséget (a döntési bittel jelzett szintkülönbséget) hozzáadjuk a megengedett NL zajszinthez és igy lehetővé teszszük a megengedett zajszinthez legközelebb eső szint előállítását. Ekkor a megfelelő, Fc2 - Fc4 lebegő-együtthatókból meg lehet határozni a megfelelő, W2 - W4 szóhosszúságokat, mivel a megfelelő b 1 _ b4 kis blokkok átvitt zajszintjei nincsenek a megengedett NL zajszinthez legközelebb eső szinttel szomszédos szinten túl eltolva.
Az 1. ábra szerinti példában a bitszám csökkentésének módja - az 1. táblázattal összehasonlítva - a 4. táblázatban látható.
4. táblázat
A kritikus sáv
újraosztásainak száma 1 2 3 4
Lebegö-együttható- információ 6 6x2 6x3 6x4
Szóhosszúság- információ 4 4 4 4
Döntési bit (2) 2 2 2
Összesen: 10 18 24 30
Az 1. táblázat szerinti példa adatait 100%-nak véve 100 90 80 75
A 4. táblázat szerint, ha a B kritikus sávot egy kis
blokk (osztás) ábrázolja, akkor a lebegő-együttható számára 6 bitet és a W szóhosszúság számára 4 bitet viszünk át. Megjegyezzük, hogy a fentebb említett döntési bitet (2 bit) ebben az esetben nem használjuk. Ezért egy osztás esetén összesen 10 bitet viszünk át. Hasonlóképpen, ha a B kritikus sávot két b kis blokk ábrázolja (két osztás), akkor összesen 18 bitet, a lebegő-együttható számára 6x2= = 12 bitet, a W szóhosszúság számára 4 bitet és a döntési bitinformáció számára 2 bitet viszünk át. Hasonlóképpen, három osztás esetén összesen 24 bitet, a lebegő-együttható számára 6><3 = 18 bitet, a W szóhosszúság számára 4 bitet és a döntési bitinformáció számára 2 bitet viszünk át. Végül négy osztás esetén (1. ábra szerinti példa) összesen 30 bitet a lebegő-együttható számára 6x4 = 24 bitet, a W szóhosszúság számára 4 bitet és a döntés bitinformáció számára 2 bitet viszünk át. így az 1. táblázat szerinti átvitt bitszámot 100%-nak véve és a
4. táblázat szerinti példával összehasonlítva, ha az osztások száma 1, akkor az átvitt bitszám ugyanannyi, mint az 1. táblázatban, vagyis 100% míg az osztások számának (a kis blokkok számának) növekedésekor a bitcsökkentési arány javul, olyan mértékben, hogy ha az osztások száma 2, akkor az átvitt bitszám 90%; ha az osztások száma 3, akkor 80% és ha osztások száma 4, akkor 75 %. Eszerint ez a módszer rendkívül hatékony.
Megjegyezzük, hogy a fent említett foganatosítási módoknál az a szint, amit a megengedett NL zajszint felvehet, kisebb, mint a dinamikus tartomány. Minthogy S/N minimális értéke körülbelül 30 dB, ezért nincs lehetőség arra, hogy a megengedett zaj szint a dinamikus tartomány csúcsértékéből (0 dB) a körülbelül 30 dB-es részbe lépjen. így ilyen beállítás végezhető a kódolásban.
A 3. ábrán látható egy rendszer, amiben a jelen kódolási eljárást alkalmazzuk. Eszerint meghatározzuk a fentebb leírt, megengedett zaj szinteket és a megengedett zajszinteken alapuló hozzárendelt bitszámmal kódoljuk a jeleket.
A 3. ábrán látható, hogy az 1 bemenetre adott, időalapú digitális audioadatot átvisszük egy 11 ortogonális transzformáló áramkörbe. Ez a 11 ortogonális transzfor6
HU 213 592 Β máló áramkör az időalapú audioadatot egységidőnként (egységblokkonként) frekvenciaalapú adatokká alakítja át. Ily módon egy Re valós értékű összetevőből és egy lm képzetes értékű összetevőből álló együttható adatok jönnek létre. Ezeket az együttható adatokat átvisszük egy 12 amplitúdó-fázisinformáció generátorba. A 12 amplitúdó-fázisinformáció generátor az Re valós összetevőből és lm képzetes összetevőből Am amplitúdóinformációt és Ph fázisinformációt állít elő. Innen csak az Am amplitúdóinformációt adjuk ki. Az emberi hallóérzék ugyanis általában a frekvenciaterület amplitúdójára (teljesítményére) érzékeny és meglehetősen érzéketlen a fázisra, ezért ennél a foganatosítási módnál a hozzárendelt bitszám-információ előállításához csak az Am amplitúdóinformációt használjuk.
Az Am amplitúdóinformációt először egy 13 sávosztóra adjuk. Ez a 13 sávosztó az Am amplitúdóinformációval ábrázolt bemenőjelet úgynevezett kritikus sávokra osztja szét. A kritikus sávokat az emberi hallóérzék jellemzői (frekvenciaelemzési képesség) alapján határozzuk meg. A 0...22 kHz frekvenciaáramú jelet például 25 sávra osztjuk úgy, hogy a frekvenciának a magasabb frekvenciájú oldal felé való eltolódásával a sáv szélesebbé válik. Az emberi hallóérzék ugyanis olyan mint egy sávszűrő és a megfelelő szűrők által osztott sávokat kritikus sávoknak nevezzük.
Az egyes sávoknak a 13 sávosztó által kritikus sávokra szétosztott Am amplitúdóját a teljes összeget észlelő 14 összegészlelőre adjuk. Ez a 14 összegészlelő meghatározza az egyes sávok energiáit (a spektrumintenzitásokat az egyes sávokban) úgy, hogy képezi a megfelelő sávokban lévő Am amplitúdóinformáció teljes összegét (az Am amplitúdóinformáció csúcsainak, átlagainak vagy energiáinak teljes összegét). A kimenőjelet, vagyis a megfelelő sávok teljes összegének a 14 összegészlelőről kapott spektrumát általában burkoló spektrumnak nevezik. A megfelelő sávokban lévő SB burkoló spektrumot példaként a 4. ábrán mutatjuk be.
Megjegyezzük, hogy a 4. ábra egyszerűsítése végett a kritikus sávok sávszáma tizenkettő (B 1-től B 12-ig).
Itt az SB burkoló spektrum úgynevezett maszkolásának hatását úgy vesszük figyelembe, hogy az SB burkoló spektrumra egy előre meghatározott súlyozó függvényt konvolválunk (konvolució). Ennek megvalósítása végett a 14 összegészlelöröl egy kimenőjelet, vagyis az SB burkoló spektrum megfelelő értékeit egy 15 szűrő áramkörre adjuk. A 15 szűrőáramkör tartalmaz például több késleltető elemet a bemenőadatok szekvenciális késleltetésére, több szorzó áramkört (például a megfelelő sávok szerint 25 szorzóáramkört) a késleltető elemek kimenőjeleinek szürőtényezőkkel (súlyozó függvény) való szorzására és teljes-összeg összeadóáramkört a szorzóáramkörök kimenőjelei teljes összegének képzésére. A 15 szűrőáramkör szorzóáramköreiben a szorzási művelet a következőképpen megy végbe. Például egy tetszőleges sávnak megfelelő M szorzóáramkörben a szürötényezőt megszorozzuk a megfelelő késleltető elemek kimenőjeleivel; az M-l szorzóáramkörben a 0,15 szürötényezőt megszorozzuk ezekkel a kimenőjelekkel, az M-2 szorzóáramkörben a 0,0019 szűrőtényezőt megszorozzuk ezekkel a kimenőjelekkel, az M-3 szorzóáramkörben a 0,000086 szürötényezőt megszorozzuk ezekkel a kimenőjelekkel; az M+l szorzóáramkörben a 0,4 szűrőtényezőt megszorozzuk ezekkel a kimenőjelekkel; az M+2 szorzóáramkörben a 0,06 szürötényezőt megszorozzuk ezekkel a kimenőjelekkel és az M+3 szorzóáramkörben a 0,007 szürötényezőt megszorozzuk ezekkel a kimenőjelekkel. így hajtjuk végre az SB burkoló spektrum konvoluciós feldolgozását. Megjegyezzük, hogy M egy tetszőleges, 1 és 25 közötti egész szám. Ezzel a konvoluciós feldolgozással a szaggatott vonallal jelölt terület teljes összegét veszszük. Megjegyezzük, hogy az előbb említett maszkolás azt a jelenséget jelenti, hogy egy jelet egy másik jel maszkol és nem hallható. Az audiojelnél a maszkolási hatás lehet vagy időalapú vagy frekvenciaalapú. A maszkolási effektus révén még ha van is zaj a maszkolt részben ez a zaj nem hallható. Ezért az adott audiojelben a maszkolásnak kitett részben lévő zajt megengedett zajnak tekintjük.
Ezután a szűrőáramkör kimenőjelét a 16 kivonóáramkörre adjuk. Ez a 16 kivonóáramkör egy megengedett zaj szintnek megfelelő a szint meghatározására szolgál, amit később a konvolvált résznél írunk le. Megjegyezzük, hogy a megengedett zajszintnek megfelelő a szint olyan szint, amelyik a később leírandó dekonvoluciós feldolgozáskor a kritikus sáv minden sávjának megengedett zajszintjével megegyezővé válik. Itt az a. szintet meghatározó megengedett függvényt (a maszkolási szintet ábrázoló függvényt) adunk a 16 kivonó áramkörre. Ennek a megengedett függvénynek a növelésével vagy csökkentésével szabályozzuk az ot szintet. Ezt a megengedett függvényt egy később leírandó 29 függvénygenerátor szolgáltatja.
Ha egy sáv alacsony frekvenciájú sávjából adott sorszámot i-nek vesszük, akkor a megengedett zajszintnek megfelelő a szintet az alábbi egyenlet határozza meg:
a = S - (n - ai), ahol n és a - állandók
S - a konvolucióval feldolgozott burkoló spektrum intenzitása.
A fenti egyenletben (n-ai) egy megengedett függvényt ad meg. A jelen foganatosítási módnál n értékét 38-nak és a értékét 1-nek vesszük. Ekkor a hangminőség nem romlik. így kielégítő kódolást végzünk.
így határozzuk meg az a szintet. Ezt az adatot egy osztó áramkörre visszük át. A 17 osztóáramkör dekonvoluciót végez a konvolvált részben lévő a szinten. Eszerint ezt a dekonvoluciót elvégezve az a szintből egy maszkolási spektrumot kapunk. Ez a maszkolási spektrum egy megengedett zajspektrummá válik. Megjegyezzük, hogy a fent említett dekonvoluciós feldolgozás bonyolult műveletet igényel, de a jelen foganatosításmódnál a dekonvoluciót egy egyszerűsített 17 osztóáramkör végzi.
Ezután a fent említett maszkolási spektrumot egy szintetizáló áramkörön át egy 19 kivonóáramkörre visszük át. A 14 összegészlelö kimenőjelét, vagyis a 14 összegészlelőről az előbb leirt SB burkoló spektrumot egy 21 késleltető áramkörön át a 19 kivonóáramkörre
HU 213 592 Β adjuk. A 19 kivonóáramkör kivonási műveletet végez a maszkolási spektrummal és az SB burkoló spektrummal. így, amint ez az 5. ábrán látható, az SB burkoló spektrumnak az a része kerül maszkolásra, aminek a szintje alacsonyabb, mint az MS maszkolási spektrum szintje által jelzett szint.
A 19 kivonóáramkör kimenőjelét a megengedett zajszintet helyesbítő 20 zaj szint-helyesbítő áramkörön át egy 30 ROM-tárra adjuk. A 30 ROM-tár az Am amplitúdóinformáció kvantálásához használt több hozzárendelési bitszám-információt tárol. Ez a 30 ROM-tár olyan hozzárendelt bitszám-információ kiadására szolgál, ami a 19 kivonóáramkör kimenőjelének felel meg (a megfelelő sávokban lévő energia- és a zaj szintbeállító egység kimenőjele közötti különbség szintjének). Ennek megfelelően a 24 kvantáló az Am amplitúdóinformációt a hozzárendelt bitszám információ alapján kvantálja. A 24 kvantáló kimenőjele a 2 kimeneten lép ki. Megjegyezzük, hogy a 21 késleltető áramkör rendeltetése a 14 öszszegészlelőtől jövő SB burkoló spektrum késleltetése a 18 szintetizáló áramkör előtti áramkörökben fellépő késleltetések figyelembevételével. Ezenkívül van egy 23 késleltető áramkör, ami az Am amplitúdóinformációt késlelteti a 30 ROM-tér előtti áramkörökben fellépő késleltetések figyelembevételével.
A korábban leírt 18 szintetizáló áramkörben szintetizálni lehet a 6. ábra szerint az emberi hallóérzék jellemzőinek megfelelő, a 22 generátor által szolgáltatott, úgynevezett RC minimális hallhatósági görbét és az MS maszkolási spektrumot. Ha egy zaj abszolút szintje a minimális hallhatósági görbe alatt van, akkor ezt a zajt nem lehet hallani. A minimális hallhatósági görbe lejátszáskor a lejátszási hangerő változásától függően változik akkor is, ha a kódolás azonos. Megjegyezzük, hogy a zene belépési módja nem nagyon változik, például 16 bit dinamikus tartomány a jelenlegi digitális rendszerekben, ezért ha feltételezzük, hogy például a fül számára legjobban hallható, 4 kHz körüli frekvenciasáv kvantálási zaja, a minimális hallhatósági görbe szintjénél kisebb kvantálási zajt úgy tekintjük, hogy más frekvenciasávokban nem hallható. Ennek megfelelően, ha feltételezünk egy olyan alkalmazási módot, amiben a rendszer szóhosszúságának például 4 kHz közelében lévő zaj nem hallható és a megengedett zaj szintet az RC minimális hallhatósági görbe és az MS maszkolási spektrum szintézisével állítjuk elő, akkor ebben az esetben a megengedett zaj szint az ábrán ferde vonalakkal jelölt résznek megfelelő szint lehet. Megjegyezzük, hogy a jelen foganatosítási módnál a minimális hallhatósági görbe 4 kHz-es szintje úgy van beállítva, hogy megfeleljen a például 20 bitnek megfelelő minimális szintnek. A 6. ábrán az SS jelspektrum együtt látható.
A 20 zajszinthelyesbítő áramkör a 19 kivonóáramkörtől kapott megengedett zaj szintet helyesbíti a 28 helyesbítési értéket meghatározó áramkörtől kapott úgynevezett egyenhangossági görbe információja alapján. A 28 helyesbítési értéket meghatározó áramkör tehát az úgynevezett egyenhangossági görbe alapján helyesbítési értékinformációt ad ki a 19 kivonóáramkörtöl kapott megengedett zajszint helyesbítéséhez. Ez a helyesbítési értékadat a 20 zajszinthelyesbítő áramkörre jut. így helyesbítést hajtunk végre, aminél figyelembevesszük a 19 kivonóáramkörtől kapott megengedett zaj szint egyenhangossági görbéjét. Megjegyezzük, hogy az egyenhangossági görbe az emberi hallóérzékkel kapcsolatos. Ezt a görbét úgy kapjuk, hogy különböző frekvenciákon meghatározzuk azokat a hangnyomásokat, amiknél a hangot ugyanolyan erősséggel lehet hallani, mint például az 1 kHz-es tiszta hangot. Az így kapott pontokat összekötjük. Ezt a görbét a hangosság egyenérzékenységi görbéjének is nevezzük. Az egyenhangossági görbe lényegében megegyezik az RC minimális hallhatósági görbével, ami a 6. ábrán látható. Eszerint az egyenhangossági görbe szerint például a 4 kHz közelében lévő hangot akkor is ugyanolyan erősséggel halljuk, mint az 1 kHz-es hangot, ha annak hangnyomása az 1 kHz-es hanghoz képest 8...10 dB-lel alacsonyabb. Ezzel szemben 50 kHz közelében a hangot akkor sem halljuk, ha a hangnyomás az 1 kHz-es hangéhoz képest körülbelül 15 dB-lel nagyobb. Ebből belátható, hogy célszerű, ha a minimális hallhatósági görbe szintje (megengedett zajszint) felett zaj frekvenciáját az egyenhangossági görbének megfelelő görbe adja meg. Ezért látható, hogy az emberi hallóérzék jellemzőinek megfelel, ha a megengedett zaj szintet az egyenhangossági görbe figyelembevételével helyesbítjük.
Megjegyezzük, hogy ennél a foganatosítási módnál alkalmazható egy olyan felépítés is, amiben a minimális hallhatósági görbének a fentebb leírt szintetizáló feldolgozását nem végezzük el. Ebben az esetben a minimális hallhatósági görbét szolgáltató 22 generátor és a 18 szintetizáló áramkör feleslegessé válik. A 16 kivonóáramkör kimenőjelén az osztóáramkör dekonvoluciót végez, majd a jelet közvetlenül a 19 kivonóáramkörre visszük át.
A digitális jel kódolására szolgáló eljárás során alkalmazott módszer szerint a bemenő digitális jelet ortogonálisán transzformáljuk. Az ortogonálisán transzformált jelet kritikus sávokba jelösszetevőkre osztjuk. Az egyes kritikus sávok megengedett zaj szintjei alapján adaptívan hozzárendelt bitszámokkal kódoljuk. Az ortogonálisán transzformált jelösszetevőkre alkalmazott blokklebegtető feldolgozás útján kapott lebegő-együtthatókat átvisszük.
A kritikus sáv sávszélességénél kisebb sávszélességű kis blokkok lebegő feldolgozása esetén alkalmazott módszer szerint az egyes kritikus sávok lebegő-együtthatóinak átvitele helyett az egyes kritikus sávok megengedett zaj szintjére vonatkozó információt és a megfelelő kis blokkok szóhosszúság-információját visszük át. Ezzel lehetővé válik a lebegő-együtthatókhoz hozzárendelt bitszám csökkentése.
A kritikus sáv sávszélességénél kisebb sávszélességű kis blokkok lebegő feldolgozása esetén alkalmazott módszer szerint a megfelelő kritikus sávokban lévő kis blokkok közül egy kis blokk szóhosszúság információját visszük át. Ezzel lehetővé válik a szóhosszúság-információ számának csökkentése. Ennek megfelelően nagyobb mértékű bitsűrítést lehet megvalósítani.
A kritikus sáv sávszélességénél kisebb sávszélességű
HU 213 592 Β kis blokkok lebegő feldolgozása esetén alkalmazott módszer szerint az egyes kis blokkokhoz hozzárendelt bitszámnak megfelelő szóhosszúság-információt visszük át és az egyes kritikus sávok lebegöegyütthatói helyett azokra a megengedett zaj szintekre vonatkozó információt visszük át, amiknek a kijelölési tartománya a kritikus sávban lévő jelszinttartománytól egy előre meghatározott szinttel el van tolva az alacsonyabb szint irányában. Ezzel lehetővé válik a megengedett zajszintre vonatkozó információ átviteléhez szükséges bitszám csökkentése. Ez azt jelenti, hogy nagyobb mértékű bit-

Claims (18)

  1. SZABADALMI IGÉNYPONTOK
    1. Kódolási eljárás digitális audiojelekhez, komprimált jel előállítására, aminek során egy bemenő digitális jelből spektrális jelösszetevőket származtatunk;
    és a spektrális jelösszetevőket kritikus sávokba (B) osztjuk; azzal jellemezve, hogy az egyes kritikus sávokban (B) lévő jelösszetevőket a kritikus sáv (B) sávszélességénél kisebb sávszélességű blokkokra (b) osztjuk;
    az egyes blokkok (b) lebegő-együtthatóit (Fc) előállító lebegő-feldolgozást végzünk minden blokkon (b);
    a spektrális jelösszetevőket minden blokkban (b), a kritikus sáv (B) megengedett zaj szintje (NL) szerint a blokkhoz (b) rendelt bizonyos számú bittel kvantáljuk, a blokkhoz (b) rendelt bitszámot szóhosszúság-információként (W) azonosítjuk; és a komprimált jelnek a blokkokhoz (b) rendelt szóhosszúság-információt (W), valamint a lebegő-együtthatók (Fc) helyett a kritikus sáv (B) megengedett zajszintjére (NL) vonatkozó információt tekintjük.
  2. 2. Kódolási eljárás digitális audiojelekhez, komprimáltjel előállítására, aminek során egy bemenő digitális jelből spektrális jelösszetevőket származtatunk;
    és a spektrális jelösszetevőket kritikus sávokba (B) osztjuk; azzal jellemezve, hogy a jelösszetevőket egy több kritikus sáv (B) sávszélességével azonos sávszélességű blokkra (b) osztjuk;
    a blokk (b) lebegőegyütthatóját (Fc) előállító lebegő feldolgozást végzünk a blokkon (b); és a spektrális jelösszetevőket a kritikus sávokban (B) adaptívan hozzárendelt számú bittel kvantáljuk.
  3. 3. Az 1. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a bemenő digitális jelből spektrális jelösszetevőket származtatunk, ezt egy ortogonális transzformációval, egy diszkrét koszinusz transzformációval (DCT) végezzük.
  4. 4. Az 1. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a spektrális jelösszetevőket kritikus sávokba (B) osztjuk, a kritikus sávot (B) a 0 és 22 kHz közötti frekvenciasávban 25 sávra osztjuk, amelyeknek a sávszélessége a magasabb frekvenciák felé növekszik.
  5. 5. Az 1. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a spektrális jelösszetevőket minden blokkban (b) kvantáljuk, a következő lépéseket hajtjuk végre:
    a megengedett zaj szintet (NL) a spektrális jelösszetevőkből számítjuk;
    minden egyes blokkhoz (b) egy magnitúdó együtthatót számítunk ki a blokkban (b) levő spektrális jelösszetevőkből; és a spektrális jelösszetevők kvantálásánál a bitszámot az adott blokk (b) magnitúdó együtthatója és a megengedett zajszint (NL) közötti különbség alapján állapítjuk meg.
  6. 6. Az 5. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a bemenő digitális jelből spektrális jelösszetevőket származtatunk, a spektrális jelösszetevők amplitúdó- és fázisértékekből állnak; és amikor minden egyes blokkhoz (b) egy magnitúdó együtthatót számítunk ki, akkor a blokkban (b) levő spektrális jelösszetevők amplitúdó értékeit összegezzük.
  7. 7. A 6. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy a megengedett zajszint (NL) számításához:
    minden egyes kritikus sávhoz (B) egy magnitúdó együtthatót számítunk ki a kritikus sávban (B) levő spektrális jelösszetevők amplitúdó értékeinek összegzésével; és ezen magnitúdó együtthatón kritikus sávonként (B) konvoluciót végzünk egy előre meghatározott súlyozó függvénnyel, ami által maszkolási spektrummal (MS) való jelleggörbe korrekciót hajtunk végre.
  8. 8. Az 1. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy:
    a komprimált jelben levő megengedett zajszint (NL) információt durva kvantálással nyerjük; és a komprimált jelbe blokkonként (b) a megengedett zajszint (NL) finom kvantálásával nyert járulékos biteket iktatunk.
  9. 9. A 8. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy:
    a komprimált jelben levő megengedett zaj szint (NL) információt első bitszámú durva kvantálással nyerjük; és a komprimált jelbe blokkonként (b) további bitszámban a megengedett zaj szint (NL) finom kvantálásával nyert járulékos biteket iktatunk.
  10. 10. A 9. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy a durva kvantálási első bitszám 4, és a finom kvantálási további bitszám 2.
  11. 11. A 8. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy a megengedett zaj szintre (NL) vonatkozó durva kvantálás és finom kvantálás logaritmikus.
  12. 12. A 2. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a bemenő digitális jelből spektrális jelösszetevőket származtatunk, ezt egy ortogonális transzformációval, egy diszkrét koszinusz transzformációval (DCT) végezzük.
  13. 13. A 2. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a spektrális jelösszetevőket kritikus sávokba (B) osztjuk, a kritikus sávot (B) a 0 és 22 kHz közötti frekvenciasávban 25 sávra osztjuk, amelyeknek a sávszélessége a magasabb frekvenciák felé növekszik.
  14. 14. A 13. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a spektrális jelösszetevőket egy több kritikus sáv (B) sávszélességével azonos sávszélességű blokkra (b) osztjuk,
    HU 213 592 Β a blokkbeli (b) spektrális jelösszetevők a frekvenciatartomány alacsony frekveciájú részében vannak.
  15. 15. A 2. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a spektrális jelösszetevöket a kritikus sávokban adaptívan hozzárendelt számú bittel kvantáljuk, az adaptívan hozzárendelt bitszámot szóhosszúság-információként (W) azonosítjuk; és a a komprimált jelbe behelyezzük a blokk (b) lebegő-együtthatóját (Fc), mint az egyetlen lebegőegyütthatót (Fc) a blokkhoz (b) tartozó kritikus sávokra (B) nézve, valamint behelyezzük a blokkhoz (b) tartozó kritikus sávokra (B) vonatkozó szóhosszúság-információt (W).
  16. 16. A 15. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a spektrális jelösszetevőket kvantáljuk, a következő lépéseket hajtjuk végre:
    minden kritikus sávhoz (B) egy magnitúdó együtthatót számítunk ki a kritikus sávban (B) levő spektrális jelösszetevőkből;
    a spektrális jelösszetevőkből megengedett zaj szintet (NL) számítunk minden egyes kritikus sávra (B) ; és az adaptívan hozzárendelt bitszámot az egyes kritikus sávok (B) magnitúdó együtthatója és az adott kritikus sávra (B) megengedett zaj szint (NL) közötti különbség alapján állapítjuk meg.
  17. 17. A 15. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy abban a lépésben, amelyben a bemenő digitális jelből spektrális jelösszetevőket származtatunk, a spektrális jelösszetevők amplitúdó- és fázisértékekből állnak; és amikor minden egyes kritikus sávhoz (B) egy magnitúdó együtthatót számítunk ki, akkor a kritikus sávban (B) levő spektrális jelösszetevők amplitúdóértékeit összegezzük.
  18. 18. A 17. igénypont szerinti kódolási eljárás, azzal jellemezve, hogy a spektrális jelösszetevők kvantálásakor a magnitúdó együtthatón kritikus sávonként (B) konvoluciót végzünk egy előre meghatározott súlyozó függvénnyel, ami által maszkolási spektrummal (MS) való jelleggörbe korrekciót hajtunk végre.
HU9203759A 1991-03-29 1992-02-28 Coding methods for digital audio signals HU213592B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP3091187A JP3060576B2 (ja) 1991-03-29 1991-03-29 ディジタル信号符号化方法
JP3091188A JP3060577B2 (ja) 1991-03-29 1991-03-29 ディジタル信号符号化方法

Publications (3)

Publication Number Publication Date
HU9203759D0 HU9203759D0 (en) 1993-04-28
HUT63278A HUT63278A (en) 1993-07-28
HU213592B true HU213592B (en) 1997-08-28

Family

ID=26432649

Family Applications (1)

Application Number Title Priority Date Filing Date
HU9203759A HU213592B (en) 1991-03-29 1992-02-28 Coding methods for digital audio signals

Country Status (17)

Country Link
US (1) US5311561A (hu)
EP (1) EP0531538B1 (hu)
KR (1) KR100312664B1 (hu)
CN (1) CN1032102C (hu)
AT (1) ATE165198T1 (hu)
AU (1) AU654533B2 (hu)
BR (1) BR9204799A (hu)
CA (1) CA2083709A1 (hu)
CS (1) CS92692A3 (hu)
DE (1) DE69225100T2 (hu)
DK (1) DK0531538T3 (hu)
FI (1) FI109627B (hu)
HU (1) HU213592B (hu)
NO (1) NO924552L (hu)
PL (1) PL168474B1 (hu)
RU (1) RU2090973C1 (hu)
WO (1) WO1992017942A1 (hu)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
DE69227570T2 (de) * 1991-09-30 1999-04-22 Sony Corp Verfahren und Anordnung zur Audiodatenkompression
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3278900B2 (ja) * 1992-05-07 2002-04-30 ソニー株式会社 データ符号化装置及び方法
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JPH06180948A (ja) * 1992-12-11 1994-06-28 Sony Corp ディジタル信号処理装置又は方法、及び記録媒体
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
CA2140779C (en) * 1993-05-31 2005-09-20 Kyoya Tsutsui Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal
CN1099777C (zh) * 1993-06-30 2003-01-22 索尼公司 数字信号的编码装置、解码装置和编码方法
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
JP3200851B2 (ja) * 1993-10-08 2001-08-20 ソニー株式会社 ディジタル信号処理装置,ディジタル信号処理方法及びデータ記録媒体
WO1995012920A1 (fr) * 1993-11-04 1995-05-11 Sony Corporation Codeur de signaux, decodeur de signaux, support d'enregistrement et procede de codage de signaux
WO1995013660A1 (fr) * 1993-11-09 1995-05-18 Sony Corporation Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JPH07261797A (ja) * 1994-03-18 1995-10-13 Mitsubishi Electric Corp 信号符号化装置及び信号復号化装置
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
CA2163371C (en) * 1994-04-01 2005-09-20 Kyoya Tsutsui Information encoding method and apparatus, information decoding method and apparatus, information transmission method, and information recording medium
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
DE69529222T2 (de) * 1994-05-02 2003-10-09 Koninkl Philips Electronics Nv Einrichtung und verfahren zum kodieren eines digitalen signals mit mindestens einer ersten und einer zweiten digitalen signalkomponente
TW295747B (hu) * 1994-06-13 1997-01-11 Sony Co Ltd
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
US5787387A (en) * 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
US5940437A (en) * 1995-01-03 1999-08-17 Intel Corporation System and method for reducing the peak load on the processor of a block processing modem
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5734677A (en) * 1995-03-15 1998-03-31 The Chinese University Of Hong Kong Method for compression of loss-tolerant video image data from multiple sources
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3580444B2 (ja) * 1995-06-14 2004-10-20 ソニー株式会社 信号伝送方法および装置、並びに信号再生方法
JP3082625B2 (ja) * 1995-07-15 2000-08-28 日本電気株式会社 音声信号処理回路
JPH0969781A (ja) * 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
DE69620967T2 (de) * 1995-09-19 2002-11-07 At & T Corp Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US6026348A (en) * 1997-10-14 2000-02-15 Bently Nevada Corporation Apparatus and method for compressing measurement data correlative to machine status
US6507804B1 (en) 1997-10-14 2003-01-14 Bently Nevada Corporation Apparatus and method for compressing measurement data corelative to machine status
KR100548891B1 (ko) * 1998-06-15 2006-02-02 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US20020009000A1 (en) * 2000-01-18 2002-01-24 Qdesign Usa, Inc. Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
CA2552881A1 (en) * 2004-01-20 2005-08-04 Dolby Laboratories Licensing Corporation Audio coding based on block grouping
WO2006134077A1 (de) 2005-06-14 2006-12-21 Basell Polyolefine Gmbh Mehrlagige kunststoff-korrosionsschutzbeschichtung mit verbesserten eigenschaften
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
GB201004667D0 (en) 2010-03-22 2010-05-05 Optimized Systems And Solution Method and apparatus for compression and de-compression of spectral data
RU2517356C2 (ru) * 2012-09-10 2014-05-27 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Мордовский государственный университет им. Н.П. Огарёва" Способ снижения нелинейных искажений тока в нелинейной комплексной нагрузке и устройство для его осуществления
CN104703093B (zh) * 2013-12-09 2018-07-17 中国移动通信集团公司 一种音频输出方法及装置
CN112019220B (zh) * 2020-08-21 2023-07-04 广东省新一代通信与网络创新研究院 一种基于差值偏置检测的块浮点数据压缩方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0064119B1 (fr) * 1981-04-30 1985-08-28 International Business Machines Corporation Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
JPS60237738A (ja) * 1984-05-11 1985-11-26 Sony Corp デイジタル信号伝送装置
JP3010637B2 (ja) * 1989-07-29 2000-02-21 ソニー株式会社 量子化装置及び量子化方法
JP2913696B2 (ja) * 1989-09-30 1999-06-28 ソニー株式会社 ディジタル信号符号化方法
JP2811810B2 (ja) * 1989-10-05 1998-10-15 ソニー株式会社 信号符号化装置
JPH03132218A (ja) * 1989-10-18 1991-06-05 Sony Corp ディジタルデータの高能率符号化装置
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder

Also Published As

Publication number Publication date
BR9204799A (pt) 1993-07-13
EP0531538B1 (en) 1998-04-15
DK0531538T3 (da) 1998-10-19
AU1338392A (en) 1992-11-02
CA2083709A1 (en) 1992-09-30
EP0531538A4 (en) 1994-09-21
FI925400A (fi) 1992-11-27
CS92692A3 (en) 1992-10-14
PL294003A2 (en) 1992-11-30
ATE165198T1 (de) 1998-05-15
HU9203759D0 (en) 1993-04-28
CN1065565A (zh) 1992-10-21
EP0531538A1 (en) 1993-03-17
AU654533B2 (en) 1994-11-10
KR100312664B1 (ko) 2002-12-26
NO924552D0 (no) 1992-11-25
NO924552L (no) 1993-01-22
DE69225100D1 (de) 1998-05-20
RU2090973C1 (ru) 1997-09-20
DE69225100T2 (de) 1998-08-06
FI109627B (fi) 2002-09-13
HUT63278A (en) 1993-07-28
US5311561A (en) 1994-05-10
PL168474B1 (pl) 1996-02-29
FI925400A0 (fi) 1992-11-27
CN1032102C (zh) 1996-06-19
WO1992017942A1 (fr) 1992-10-15

Similar Documents

Publication Publication Date Title
HU213592B (en) Coding methods for digital audio signals
US5264846A (en) Coding apparatus for digital signal
US5414795A (en) High efficiency digital data encoding and decoding apparatus
US5260980A (en) Digital signal encoder
US5268685A (en) Apparatus with transient-dependent bit allocation for compressing a digital signal
US5490170A (en) Coding apparatus for digital signal
US5535300A (en) Perceptual coding of audio signals using entropy coding and/or multiple power spectra
EP0453282B1 (en) Digital subband encoding apparatus
JPH066236A (ja) 高能率符号化及び/又は復号化装置
JPH05248972A (ja) 音声信号処理方法
EP0825725A1 (en) Subband coding with adaptive bit allocation
JP3041967B2 (ja) ディジタル信号符号化装置
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
JP3336619B2 (ja) 信号処理装置
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3060578B2 (ja) ディジタル信号符号化方法
JP3060576B2 (ja) ディジタル信号符号化方法
JP3060577B2 (ja) ディジタル信号符号化方法
JP3010663B2 (ja) ノイズシェーピング回路
KR100233762B1 (ko) 디지탈 신호 부호화 장치
JP3132031B2 (ja) ディジタル信号の高能率符号化方法
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JPH03117920A (ja) ディジタル信号符号化方法
JPH04104618A (ja) ディジタル信号符号化装置

Legal Events

Date Code Title Description
HMM4 Cancellation of final prot. due to non-payment of fee