FI112979B - Digitaalisen datan erittäin tehokas koodauslaite - Google Patents

Digitaalisen datan erittäin tehokas koodauslaite Download PDF

Info

Publication number
FI112979B
FI112979B FI925401A FI925401A FI112979B FI 112979 B FI112979 B FI 112979B FI 925401 A FI925401 A FI 925401A FI 925401 A FI925401 A FI 925401A FI 112979 B FI112979 B FI 112979B
Authority
FI
Finland
Prior art keywords
block
circuit
bits
data
band
Prior art date
Application number
FI925401A
Other languages
English (en)
Swedish (sv)
Other versions
FI925401A0 (fi
FI925401A (fi
Inventor
Kyoya Tsutsui
Osamu Shimoyoshi
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP03091185A external-priority patent/JP3089691B2/ja
Priority claimed from JP03091183A external-priority patent/JP3089690B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Publication of FI925401A0 publication Critical patent/FI925401A0/fi
Publication of FI925401A publication Critical patent/FI925401A/fi
Application granted granted Critical
Publication of FI112979B publication Critical patent/FI112979B/fi

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Complex Calculations (AREA)
  • Selective Calling Equipment (AREA)
  • Emergency Protection Circuit Devices (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

112979
Digitaalisen datan erittäin tehokas koodauslaite - Högeffektiv apparat för kodning av digitala data
Esillä oleva keksintö liittyy digitaalisen datan erittäin tehokkaaseen koodauslaittee-5 seen, jossa tuleva digitaalinen data koodataan niin sanotulla tehokoodauksella.
On olemassa monia erittäin tehokkaita audio- eli äänisignaalien koodausmenetelmiä, kuten esimerkiksi kaistanjakokoodaus (sub-band coding, SBC), jossa aika-akselin audiosignaalit jne. jaetaan useampiin taajuuskaistoihin koodausta varten; muunnos-koodaus (ATC), jossa aika-akselin signaalit muunnetaan taajuusakselin signaaleiksi 10 ortogonaalisella muunnoksella, niin että ne jaetaan useammalle taajuuskaistalle ja koodataan jokainen kaista; bittien adaptiivisen jakamisen koodaus (adaptive bit allocation, APC-AB), jossa SBC-koodaus ja ns. adaptiivinen ennustava koodaus (adaptive predictive coding, APC) yhdistetään, ja jossa aika-akselin signaalit jaetaan useammalle kaistalle, muunnetaan kaistojen signaalit kantataajuisiksi signaaleiksi ja 15 suoritetaan korkeamman asteen lineaarinen ennustava analyysi ennustavan koodauksen toteuttamiseksi.
Esimerkiksi sen jälkeen kun signaalit on jaettu usealle kaistalle kaistanjakokoo-dauksessa jokaisen kaistan signaalit muunnetaan taajuusakselin signaaleiksi ortogo-naalisella muunnoksella, jonka jälkeen koodaus suoritetaan jokaisella kaistalla. 20 Ortogonaalista muunnosta suoritettaessa tulevat audiosignaalit voidaan ryhmitellä lohkoihin ennalta määrätyn aikayksikön (kehyksen) välein, ja diskreetti kosinimuun-nos tehdään jokaiselle lohkolle aika-akselin signaalien muuntamiseksi taajuusakse-: Iin signaaleiksi. Kun tehdään jako useampaan kaistaan, voidaan ottaa huomioon ’ ’ ihmisen kuuloaistin määrätyt ominaisuudet. Siten audiosignaalit voidaan jakaa ·, ·' 25 useampaan, esimerkiksi 25:een kaistaan, niin että kaistanleveys kasvaa ylemmillä kaistoilla, jotka tunnetaan kriittisinä kaistoina. Kaistanjakokoodauksessa jokaiseen : .· kaistaan liittyvää bittien lukumäärää muutetaan dynaamisesti tai adaptiivisesti : ” ‘: kompression hyötysuhteen nostamiseksi, pitäen samalla aikayksikkölohkon bittien lukumäärä vakiona.
* I
: i 30 Kun esimerkiksi koodataan DCT-käsittelyn DCT-kerroindata bittien jakamisen : !·. avulla, niin DCT-käsittelystä tuleva jokaisen lohkon kulloinenkin DCT-kerroindata » » »
Il| ! koodataan dynaamisesti jaetulla bittimäärällä.
• · 112979 2
Tehokoodauksessa käytetään reippaasti tehokkaan koodauksen menetelmää, joka hyödyntää niin sanottua maskivaikutusta, ottaen huomioon ihmisen kuuloaistin määrätyt ominaisuudet. Maskivaikutus tarkoittaa ilmiötä, jossa määrätyt signaalit peitetään muilla signaaleilla, jolloin niistä tulee kuulumattomia. Siten maskin tason 5 alla oleva kohina on hyväksyttävissä. Maskivaikutus voidaan ottaa huomioon niin, että jaettujen bittien lukumäärää vähennetään niillä signaalikomponenteilla, jotka ovat hyväksyttävän kohinatason alapuolella, jotta voitaisiin alentaa bittinopeutta.
Jos edellä mainitussa koodauksessa audiosignaalit jaetaan useisiin kaistoihin, ja jokaiselle kaistalle tehdään ortogonaalinen muunnos, kuten DCT, jos ts. jokaiselle 10 kaistalle tehdään taajuusanalyysit, niin jokaisen kaistan signaalit jaetaan lohkoiksi ennalta määrätyn yksikköaikavälin välein, ts. kehyksittäin, ja ortogonaalinen muunnos suoritetaan jokaisessa kaistassa olevalle jokaiselle lohkolle.
Toisaalta ortogonaalisen muunnoksen tuottama kerroindata (DCT-kerroindata) koodataan, ja koodauksen aikana jaettu bittimäärä osoitetaan jokaiselle lohkolle 15 kehyksittäin.
Toisaalta audiosignaalit eivät välttämättä ole pysyviä signaaleja, jotka olisivat ilman tasonvaihtelua, joten signaalitaso muuttuu vaihtelevasti. Signaalit voivat esimerkiksi olla transienttisignaaleja, kuten signaaleja, joiden huipputaso muuttuu merkittävästi kehyksen puitteissa. Jos esimerkiksi signaalit ovat lyömäsoittimen tuottamia isku-20 äänen audiosignaaleja, niin iskuäänen signaaleista tulee transienttisignaaleja.
. . Jos ominaisuuksiltaan vakiosta transientiksi tai päin vastoin muuttuvat audiosignaa- ; ,'. lit ortogonaalisella muunnoksella käsitellään samalla tavalla kun jokaisessa lohkossa , ·, ; kehyskohtainen, ja muunnettu data koodataan, niin koodauksen ei voida sanoa sopi- ♦ i i t' / van signaalin ominaisuuksiin, niin ettei voi sanoa äänenlaadun olevan dekoodauksen 25 jälkeen optimaalinen kuuloaistin kannalta.
i ’ · ’: Kun koodaus on tehtävä käyttäen sallittua kohinatasoa, niin koodausta varten osoi- :' ’'; tettu bittimäärä määritetään lohkon energian ja lohkon energian perusteella määräy- ./ tyvän peittomäärän (maskin) mukaisen hyväksyttävän kohinatason suhteen (tai ero- ,, ’' tuksen) perusteella.
,···, 30 On kuitenkin olemassa signaaleja, joilla audiosignaalien joukossa on sointiominai- suuksia (signaaleja, joilla on voimakas tonaliteetti). Jos signaaleilla on voimakas ' ’ tonaliteetti, lohkokohtaiseen energiaan perustuvaa bittien jakamista ei voi laskea tarkasti. Toisin sanoen, annetussa lohkossa oleva energia voi olla yhtä suuri kuin muutoinkin, myös silloin, kun jokaisen lohkon datalla on voimakas tonaliteetti. Sei- 112979 3 laisessa tapauksessa on toivottavaa, ettei bittien jakamisen laskentaa tehdä samaan energiaan perustuen, ottamatta huomioon että datan ominaisuudet poikkeavat eri lohkoissa. Ennen kaikkea voimakkaan tonaliteetin signaaleille ei voi tehdä tarkkaa bittien jakamista, joka siten johtaa äänenlaadun heikkenemiseen. Toisin sanoen, 5 vaikka voimakkaan tonaliteetin signaaleille tarvitaan suuri bittimäärä, niin vaadittua bittimäärää ei voi osoittaa näille signaaleille, jos laskettu bittimäärä perustuu edellä mainittuun energiaan, joka jälleen johtaa signaalin laadun heikkenemiseen.
Kun otetaan huomioon edellä kuvattu tekniikan taso, esillä olevan keksinnön tavoitteena on aikaansaada erittäin tehokas digitaalisen datan koodauslaite, jossa voidaan 10 saavuttaa erittäin tulevien audiosignaalien ominaisuuksiin tai ominaiskäyrään paremmin sopiva tehokkaan kompression koodaus, ja jossa voidaan tuottaa ihmisen kuuloaistille miellyttävämpiä dekoodattuja signaaleja.
Esillä olevan keksinnön toisena tavoitteena on aikaansaada digitaalisen datan erittäin tehokas koodaus- ja dekoodauslaite, jossa äänenlaadun parantamiseksi voidaan 15 saavuttaa tyydyttävä bittien jakaminen myös voimakkaan tonaliteetin signaaleilla.
Esillä olevan keksinnön mukaisesti aikaansaadaan erittäin tehokas digitaalisen datan koodauslaite, jossa tuleva digitaalinen data jaetaan moneen kaistaan, jolloin jokaisessa kaistassa muodostetaan monesta näytteestä koostuvat lohkot ja jokaiselle kaistan lohkolle tehdään ortogonaalinen muunnos kerroindatan tuottamiseksi, joka ker-: 20 roindata koodataan, ja jolle laitteelle on tunnusomaista, että se sisältää lohkon ’: pituuden päätöspiirin lohkon pituuden määrittämiseksi kunkin kaistan ortogonaalista muunnosta varten perustuen lohkon datan ominaisuuksiin ennen kunkin kaistan ; ortogonaalista muunnosta, ja mainittu kunkin kaistan ortogonaalinen muunnos ’ * ’ tehdään mainitun lohkon pituuden päätöspiirin määrittämällä lohkon pituudella.
v : 25 Kulloiseenkin ortogonaalisen muunnoksen välineeseen syötetty tuleva digitaalinen data voi olla jokaisen kriittisen kaistan dataa. Ortogonaalinen muunnos voi esimer-kiksi olla diskreetti kosinimuunnos (discrete cosine transmform, DCT) tai nopea ; ": Fourier-muunnos (fast Fourier transform, FFT). Tässä tapauksessa koodataan ker- .;, roindata.
•: · *: 30 Kun valitaan lähtö eli asetetaan lohkon pituus, niin käsittely tehdään niin, että vali- ; ‘ ·, taan vain se ortogonaalisen muunnoksen välineen lähtö, joka minimoi ortogonaali- ! sen muunnoksen välineen lähtöjen koodaukseen tarvittavien jaettavien bittien luku määrän (ts. bittimäärän, joka tarvitaan ennalta määrätyn äänenlaadun toteuttamiseksi). On huomattava, että sen jälkeen kun ortogonaalisen muunnoksen data on koo- i 4 112979 dattu, ortogonaalisen muunnoksen välineen kehyskohtaisesti tuottama bittimäärä on ennalta määrätty luku. Koska koodauksen aikana kuitenkin aikaansaadaan adaptiivinen bittien jakaminen, niin koodausta varten tarvittavien bittien lukumäärä voi olla erilainen kuin kehyskohtainen ennalta määrätty bittimäärä.
5 Jos koodausta varten tarvittava bittimäärä on pienempi kuin ennalta määrätty bittimäärä, niin tämän johdosta jäljelle jääneitä redundantteja bittejä voidaan käyttää vielä tyydyttävämmän koodauksen toteuttamiseen, niin että optimaalinen koodaus-lähtö voidaan aikaansaada valitsemalla se ortogonaalisen muunnoksen välineen lähtö, joka tuottaa pienimmän bittimäärän. Vaikka toisaalta koodausta varten tarvit-10 tava bittimäärä tulisi suuremmaksi kuin kehyskohtainen ennalta määrätty bittimäärä, niin valitsemalla pienimmän bittimäärän tuottava ortogonaalisen muunnoksen välineen lähtö, voidaan saavuttaa koodattu lähtö mahdollisimman pienellä huononnuksella.
Lohkodatan, eli ennen ortogonaalista muunnosta olevan kehyksen, ominaisuuksien 15 joukossa ovat kehyksen signaalien transientit tai pysyvät ominaisuudet. Signaalien transientit tai pysyvät ominaisuudet tarkistetaan kehyksen näytearvojen, tai ennen ortogonaalista muunnosta olevan kehyksen näytearvojen, ylärajan ajallisten muutosten laskettujen arvojen perusteella. Näin ollen esillä olevalla laitteella muutetaan ortogonaalisen muunnoksen lohkopituuksia jokaisella alueella tai kaistalla, pysyvien , 20 tai transienttisignaalien perusteella saaduista arvoista riippuen. Kaistoihin jako • _ voidaan tehdä niin sanottujen kriittisten kaistojen mukaisesti.
. i' Ortogonaalisen muunnoksen menetelmien joukossa ovat diskreetti kosinimuunnos : (DCT) tulevan digitaalisen datan muuntamiseksi ortogonaalisella muunnoksella :spektridataksi, tai nopea Fourier-muunnos (FFT).
25 Kohinatason asetus välineessä pidetään edullisena taajuuden jakamista niin, että kaistanleveys on suurempi suuremmilla taajuuksilla, ja muodostetaan datalohkoja : ' jokaista kaistaa varten ja etsitään hyväksyttävissä oleva kohinataso lohkokohtaiseen energiaan perustuen niin sanottu maskivaikutus huomioon ottaen. Tässä maskivai-;· kutus tarkoittaa sekä maskivaikutusta aika-akselilla että taajuusakselilla.
‘ ‘ 30 Liukukertoimen laskentavälineessä voidaan liukukertoimena käyttää skaalauskertoi- mia, jotka perustuvat taajuusanalyysivälineen useamman lähtödatan lohkosta koos- *; tuvan datan maksimiarvoon. Vaihtoehtoisesti voidaan itse maksimiarvon dataa käyt tää lohkon liukukertoimen likiarvona. Siten jaetun bittimäärän päätösvälineessä voidaan löytää bittimäärän jako liukukertoimen ja hyväksyttävään kohinatason perus- , 1121> 7 9 teella, jolloin tämä kohinataso löydetään jokaiselle kriittiselle kaistalle maskin vaikutus huomioon ottaen. Tässä tapauksessa yhden lohkon datamäärä liukukertoimen laskentavälineessä sovitetaan tai saatetaan yhtä suureksi kuin kohinatason asetus-välineessä.
5 Esillä olevan keksinnön mukaisesti tuleva digitaalinen data käsitellään ortogonaali-sella muunnoksella useammalla lohkopituudella, ja valitaan ortogonaalisen muunnoksen välineen yksi lähtö ortogonaalisen muunnoksen välineen lähtöjen perusteella. Optimi koodauslähtö voidaan saada valitsemalla se lähtö, jolla tarvitaan pienin bittimäärä koodausta varten.
10 Esillä olevan keksinnön mukaisesti asetetaan jokaisen kaistan ortogonaalisen muunnoksen lohkopituus jokaisen kaistan ortogonaalista muunnosta ennen olevan lohko-datan tai kehyksen ominaisuuksien perusteella, niin että voidaan saada ortogonaali-nen muunnos lohkonpituudella, joka sopii signaalin ominaisuuksiin, ja siten voidaan saavuttaa kompressiokoodaus, jossa bittimäärä on sovitettu signaalin ominaisuuk-15 siin.
Jaettu bittimäärä asetetaan, ei vain hyväksyttävää kohinatasoa hyväksi käyttäen, vaan myös jokaisen lohkon maksimiarvon dataan perustuvaa liukukerrointa hyväksi käyttäen, niin että voidaan jakaa voimakkaan tonaliteetin signaaleille riittävän suuri bittimäärä, myös silloin kun lohkon puitteissa energiat pysyvät yhtä suurina.
20 Koska ei tuoteta ihmisen kuuloaistille haitallisia vaikutuksia, kun vaiheinformaatiol-le jaettu bittimäärä asetetaan niin että se on pienempi kuin amplitudi-informaatiolle f; jaettu bittimäärä, niin voidaan kasvattaa bittikompression kerrointa vähentämällä y : vaiheinformaatiolle jaettua bittimäärää.
* * I
;’·; Äänenlaadun heikkenemistä voidaan vähentää, koska kaista, jossa on vaiheinfor- 25 maatiolle jaettu bittimäärän tieto, on asetettu pienemmäksi kuin kaista, jossa on : v. amplitudi-informaatiolle jaettu tieto, joka on asetettu suuremmaksi.
\ >. · Jos vaiheinformaation bittimäärä on ennalta asetettu pienemmäksi kuin amplitu- . '. di-informaation, niin esillä olevan keksinnön mukaisesti riittää joko amplitudi-infor- .maation tai vaiheinformaation lähettäminen samanaikaisesti vaiheinformaation tai 30 amplitudi-informaation datan kanssa, niin että edelleen voidaan vähentää jaetun :.: : bittimäärän informaation lähettämiseen tarvittavia bittejä.
6 ΐ j 112279
Koska jaettu bittimäärä jokaista kaistaa varten asetetaan käyttäen hyväksyttävää kohinatasoa ja perustuen ns. maskisuureeseen, joka löydetään jokaisen kaistan amplitudi-informaation energian perusteella, niin esillä olevan keksinnön mukaisesti voidaan saavuttaa bittimäärän vähentäminen pienemmällä äänenlaadun heikkenemi-5 sellä.
Piirustuksissa:
Kuvio 1 on lohkokaavio, jossa esitetään kaaviollisesti digitaalisen datan esillä olevan keksinnön ensimmäisen suoritusmuodon mukaisen erittäin tehokkaan koo-dauslaitteen rakenne.
10 Kuvio 2 on lohkokaavio, joka esittää esimerkinomaisen kooderin rakenteen kaaviollisesti.
Kuvio 3 on kaaviollinen esitys, jossa esitetään DCT-käsittelylohko tapauksessa, jossa lohkon pituus on sama jokaisella kaistalla.
Kuvio 4 on kaaviollinen esitys, jossa esitetään DCT-käsittely lohko tapauksessa, 15 jossa lohkon pituus suurtaajuusalueella on puolet kehyksen pituudesta.
Kuvio 5 on kaaviollinen esitys, jossa esitetään DCT-käsittelylohko tapauksessa, jossa lohkon pituus suurtaajuusalueella on neljännes kehyksen pituudesta ja jossa • > ► « · lohkon pituus keskitaajuusalueella on puolet kehyksen pituudesta.
• I
·>· Kuvio 6 on kaaviollinen esitys, jossa esitetään DCT-käsittelylohko tapauksessa, * * ·» : 20 jossa lohkon pituus suurtaajuusalueella on neljännes kehyksen pituudesta ja jossa • f · · ; lohkon pituus keskitaajuusalueella on neljännes kehyksen pituudesta.
* * ·
• I
v · Kuvio 7 on vuokaavio, jolla havainnollistetaan ensimmäisen kertaluokan bittimää rän jakamista ja bittimäärän korjausta.
I · ·
I t I I I
]··*_ Kuvio 8 on lohkokaavio, jolla havainnollistetaan digitaalisen datan esillä olevan » · 25 keksinnön toisen suoritusmuodon mukaista erittäin tehokkaan koodauslaitteen : ’ · · rakennetta.
* » ; Kuvio 9A on käyrä, joka esittää tyypillistä transienttisignaalia.
• · : ‘ : Kuvio 9B on käyrä, joka esittää tyypillistä pysyvää signaalia.
Kuvio 10 on kaaviollinen esitys, jossa esitetään tyypillinen lohko DCT-käsittelyssä.
Kuvio 11 on lohkokaavio, joka esittää erittäin tehokkaan koodauslaitteen vastineena olevan dekoodauslaitteen kaaviollisen rakenteen.
112979
Kuvio 12 on lohkokaavio, joka esittää esillä olevan keksinnön kolmannen suoritusmuodon mukaisen digitaalisen datan erittäin tehokkaan koodauslaitteen rakenteen.
5 Kuvio 13 on kaaviollinen esitys lohkojen liukukertoimien ja sallitun kohinatason selittämistä varten.
Kuvio 14 on lohkokaavio, jossa esitetään yksityiskohtainen rakenne hyväksyttävän kohinatason asettamista varten.
Kuvio 15 on käyrä, joka esittää Burken spektrin.
10 Kuvio 16 on käyrä, joka esittää maskispektrin.
Kuvio 17 on käyrä, joka esittää kuuluvuuden minimikäyrän ja maskispektrin synteesin.
Piirustuksiin viitaten esitetään yksityiskohtaisesti esillä olevan keksinnön määrättyjä suoritusmuotoj a.
15 Kuvio 1 esittää erittäin tehokkaan digitaalisen datan koodauslaitteen, jossa tuleva digitaalinen data, kuten audiodata, jaetaan useampaan kaistaan, niin että kaistan-... leveys on tulee suuremmaksi taajuuden kasvaessa, muodostetaan jokaisella kaistalla lohkoja, joista jokainen käsittää useita näytteitä, suoritetaan jokaisen kaistan ;*·; jokaiselle lohkolle ortogonaalinen muunnos esim. diskreetillä kosinimuunnoksella ·'··* : 20 kerroindatan (DCT-kerroindatan) tuottamiseksi, ja koodataan kerroindata adaptiivi- sesti jaetulla bittimäärällä. Esillä olevassa erittäin tehokkaassa koodauslaitteessa on v *’ useita koodereita, kuten neljä kooderia 2-5, joista jokainen on varustettu ortogo- naalisen muunnoksen välineellä tulevan digitaalisen data ortogonaalisen muunnoksiv: sen suorittamiseksi jokaisella kaistalla lohkon pituudella, joka on erilainen eri kais- 25 töillä, ja vain yksi ortogonaalisen muunnoksen välineiden lähdöistä valitaan koo-derien 2-5 ortogonaalisten muunnoksen välineiden lähtöjen perusteella. Toisin sa-* noen DCT-käsiteltyjen lohkojen lohkopituudet vaihtelevat eri koodereilla, ja valinta- *·;·' piirillä 6 valitaan vain yksi koodereiden 2-5 lähdöistä koodereiden 2-5 lähtöjen pe- rusteella. Toisin sanoen, vaihtokytkimen 7 tila muuttuu valintapiirin 6 signaalin pe-* ‘ · *: 30 rusteella, niin että valitaan vain yksi koodereiden 2-5 lähdöistä.
Huomataan, että valintapiirin 6 valinta tehdään niin, että vain sen kooderin lähtö valitaan, jolla on koodereiden koodaustoimintaan tarvittava pienin bittimäärä. Toisin 112979 8 ! j sanoen, vaikka koodereiden 2-5 tuottamien kehysten bittimäärä on ennalta määrätty luku, niin annetun kehyksen koodauksessa varsinaisesti tarvittava bittimäärä määritetään adaptiivisella bittien jakamisella, ottaen huomioon maskivaikutus, kuten alempana selitetään. Edellä mainittu valinta tehdään niin, että valitaan vain sen koo-5 derin lähtö, jolla on pienin bittimäärä, joka varsinaisesti tarvitaan koodausta varten.
Jos siten koodausta varten tarvittu bittimäärä on pienempi kuin se bittimäärä, joka on kehyskohtaisesti ennalta määrätty, niin ylimääräisiä bittejä voidaan käyttää tyydyttävämmän koodauksen toteuttamiseen. Toisaalta, kun valitaan sen kooderin lähtö, jolla on pienin bittimäärä, voidaan tuottaa tyydyttävin koodattu lähtö. Jos 10 kooderien 2-5 vaatima bittimäärä ylittää bittimäärän, joka on kehyskohtaisesti ennal ta määrätty, niin voidaan tuottaa koodauksen lähtö, joka on koodauksen takia vähiten huonontunut, valitsemalla koodereiden 2-5 lähdöistä se, jolla on koodausta varten tarvittu pienin bittimäärä.
Toisin sanoen, kuvion 2 esittämässä esillä olevan keksinnön erittäin tehokkaan 15 digitaalisen datan koodauslaitteen jokaisessa kooderissa 2-5 jaetaan tuloliitännän 1 kautta syötetty tuleva digitaalinen data, kuten audio- tai äänidata, taajuuden suhteen karkeasti kolmeen taajuuskaistaan kvadratuuri-peilisuodattimilla 41 ja 42 niin, että kaistanleveys kasvaa taajuuden kasvaessa niin sanottujen kriittisten kaistojen mukaisen taajuuskaistajaon mukaisesti. DCT-piireissä 43, 44 ja 45 muodostetaan 20 jakamisen jälkeen jokaista kaistaa varten useammista näytteistä koostuvat lohkot, ja ' ' jokaiselle lohkolle tehdään ortogonaalinen muunnos (muunnos aika-akselilta taa- juusakselille) kerroindatan (DCT-kerroindatan) tuottamiseksi. Toisaalta DCT-piirien 43, 44 ja 45 lähdöt vastaavat kriittisten kaistojen mukaisesti esim. kahta korkean | f: taajuuden kaistaa, kolmea keskitaajuuden kaistaa ja vastaavasti esim. 20:a matalan 25 taajuuden kaistaa. DCT-piirien 43-45 kulloistenkin kaistojen DCT-kerroindata koodataan adaptiivisesti jaetulla bittimäärällä koodauspiireissä 46, 47 ja 48. Toisin sanoen tehdään esillä olevan suoritusmuodon kolmen kaistan DCT-kerroindatan : ·, ·. koodaus koodauspiireissä 46, 47 ja 48 bittimäärän adaptiivisella jakamisella ihmisen • t *..! kuuloaistin määrättyjen ominaisuuksien perusteella.
• · * * ► :\i# 30 Edellä mainitun kaistoihin jakamisen suorittamiseksi analogisista audiosignaaleista φ ,···. jne. näytteitä ottamalla saatu digitaalinen data (0...22,1 kHz), esim. 1024 näytettä, • · T syötetään jokaisen kooderin 2-5 tuloliitäntään 1. Tämä digitaalinen data jaetaan *...' QMF-suodattimilla 41 ja 42 karkeasti kolmeen kaistaan (0...5,5 kHz, 5,5...11,0 kHz : ja 11,0...22,1 kHz), niin että kaistanleveys on suurempi suuremmilla taajuuksilla.
35 QMF:ssä 41 digitaalinen data 0...22,1 kHz jaetaan kahtia lähdön 11,0...22,1 kHz ja lähdön 0...11,0 kHz tuottamiseksi, jotka syötetään DCT-piirille 43 ja vastaavasti 112979 9 QMF:ään 42. Sitten QMF:ään 42 syötetty lähtö 0...11,0 kHz vielä jaetaan kahtia QMF.ssä 42, niin että tuotetaan lähdöt 0...5,5 kHz ja 5,5...11,0 kHz, jotka syötetään DCT-piireihin 43 ja vastaavasti 44.
Jokaisessa DCT-piirissä 43, 44 ja 45 joukko syötetyn kaistan datan näytteitä, esim. 5 1024 näytettä, muodostaa kehyksen B, ja jokaiselle kehyksen B muodostamalle ke hykselle suoritetaan Fourier-muunnos DCT-kerroindatan tuottamiseksi. On huomattava, että DCT-käsittelyn lohkopituudella on kulloisessakin DCT-piirissä 43, 44 ja 45 eri arvo kutakin kooderia 2-5 varten.
Esimerkiksi kooderissa 2 DCT-käsittelyn lohkopituudet ovat yhtä suuret, kuten ku-10 viossa 3 on esitetty. Toisin sanoen, kooderissa 2 DCT-käsittelyn lohkopituus bn DCT-piirin 43 yläaluetta 11,0...22,1 kHz varten, DCT-käsittelyn lohkopituus Öm DCT-piirin 44 keskialuetta 5,5...11,0 kHz varten, ja DCT-käsittelyn lohkopituus 1>l DCT-piirin 45 ala-aluetta 0...5,5 kHz varten, valitaan niin että ne ovat samat kuin lohko B, jolla on edellä mainittu ennalta määrätty aikayksikkö-pituus.
15 Kooderissa 3 DCT-käsittelyn lohkopituus valitaan lyhyemmäksi ylätaajuuden alueella, kuten on esitetty kuviossa 4. Toisin sanoen kooderissa 3 yläalueen DCT-piirin 43 lohkopituus on puolet ala-alueen DCT-piirin 45 lohkopituudesta bija keskialueen DCT-piirin 44 lohkopituudesta b\i· Esillä olevassa esimerkissä ylätaajuuden lohko on jaettu lohkoiksi bm, bm.
M M I • · 20 Kooderissa 4 valitaan DCT-käsittelyn lohkopituus lyhyemmäksi keski- ja ylätaajuu- « I · .den alueilla, kuten on esitetty kuviossa 5. Toisin sanoen, kun ala-alueen lohkopituus
»IM
; ,·, on H, niin keskialueella lohkopituudet bMi, b\i2 ovat esim. puolet ala-alueen lohkoni | pituudesta, ja yläalueen lohkopituudet bm, bH2, bH3 ja bH4 ovat neljännes ala-alueen • * · !.. ’ lohkopituudesta tai puolet keskialueen lohkopituudesta.
25 Kooderissa 5 valitaan DCT-käsittelyn lohkopituus lyhyemmäksi keski- ja ylätaa-Γ’’: juuden alueilla ja pidemmäksi alataajuuden alueilla, kuten on esitetty kuviossa 6.
Toisin sanoen, kun ala-alueen lohkopituus on bL, niin yläalueella lohkopituudet bm, • t · ..· bH2. bj-f3 ja bj44 ovat neljännes ala-alueen lohkopituudesta, kun taas keskialueen loh- • · kopituudet brm, bM2, bM3 ja bM4 ovat esim. neljännes ala-alueen lohkopituudesta.
• · 30 Ylä- ja keskialueen lohkopituudet valitaan alla esitetystä syystä lyhyemmiksi kuin ala-alueen lohkopituus, kuten edellä on selitetty kuvioiden 4-6 yhteydessä. Toisin ‘ ’ ’ sanoen, ihmisen kuuloaistin taajuuden erottelutarkkuus ei ole yläalueella niin suuri kuin ala-alueella, niin että taajuuden erottelutarkkuus on säilytettävä ala-alueella, ja siten DCT-käsittelyn lohkopituutta ei voi liikaa lyhentää ala-alueella. Tästä syystä 112979 10 lohkopituus valitaan suuremmaksi ala-alueella. Koska toisaalta pysyvä jakso on ala-alueen signaaleilla pidempi kuin yläalueen signaaleilla, voidaan tehokkaasti lyhentää lohkopituutta ylä-ja keskialueella (ts. ajallisen erottelutarkkuuden nostamiseksi). Tässä tarkastelussa ylä- ja keskialueen lohkopituudet valitaan lyhyemmiksi ja 5 ala-alueen lohkopituus pidemmäksi.
Jotta siten esillä olevassa suoritusmuodossa samanaikaisesti täytettäisiin ihmisen kuuloaistin huomioon ottaen vaatimukset taajuusakselin erottelutarkkuudelle ja vaatimukset taajuusakselin erottelutarkkuudelle, ala-alueella (0...5,5 kHz) lisätään näytteiden määrää taajuuden erottelutarkkuuden nostamiseksi, kun taas ajallista 10 erottelutarkkuutta lisätään yläalueella (11,0...22,1 kHz) ja joskus keskialueella (5,5...11,0 kHz).
Tulevien audiosignaalien ominaisuudet huomioon ottaen on tehokasta lyhentää DCT-käsittelyn lohkopituutta ylä- ja keskialueella.
DCT-käsittelyn lohkopituuksia voidaan toisin sanoen tehokkaasti vaihdella, riippuen 15 siitä ovatko tulevat audiosignaalit transienttisignaaleja tai pysyviä signaaleja. Pysyvien signaalien tapauksessa on tehokasta asettaa lohkopituudet kulloisessakin kaistassa yhtä suuriksi, kuten on esitetty kuviossa 3, kun taas transienttisignaalien tapauksessa on tehokasta asettaa lohkopituudet keski- ja yläalueella lyhyemmiksi, kuten on esitetty kuviossa 6. Lyhentämällä tällä tavalla DCT-käsittelyn lohkoja ·;·: 20 transienttisignaaleilla, voidaan korkean huipputason (transienttisignaali-osuuden) sisältävässä kehyksessä B oleville lohkoille jakaa enemmän bittejä koodauksen • * < aikana, kun taas muille lohkoille voidaan bittimäärää pienentää. Tällä tavalla t« » * : voidaan bittejä jakaa lohkoille kehyksen B kulloisenkin kaistan bittitarpeen mukai- t · »
\ sesti niin, että noudatetaan spektrin ajallisia muutoksia. Toisaalta kehyksen B
• * I
25 samanlaisten spektrien signaalien redundantti koodaus voidaan välttää pysyvien • signaalien tapauksessa.
Toisaalta DCT-käsittelyn kulloistenkin kaistojen lohkopituudet eivät rajoitu kuviois-sa 3-6 esitettyihin esimerkkeihin. Siten voidaan kuvitella useita lohkopituus-yhdis- » · » ,, * telmiä, kuten lohkopituuden lyhentäminen yläalueella, tai samanaikainen ala-alueen • · : " 30 lohkopituuden lyhentäminen.
• · • >
Jokaisessa kooderissa 2-5 tehdään DCT-käsittely kuvion 2 jokaisessa DCT-piirissä
• I
43-45 niin, että saadaan erilaiset lohkopituudet jokaisella kaistalla, ja muodostetaan * · * DCT-kerroindata, j oka johdetaan koodauspiireille 46-48.
ί 11 112979
Toisaalla jokainen kooderi 2-5 suorittaa koodauksen jakamalla adaptiivisesti bittejä koodauspiireissä 46-48, joilla on seuraava järjestely.
Jokainen koodereistä 2-5 on toisin sanoen varustettu primäärisellä bittimäärän jako-piirillä 60, jolla määritetään todella tarvittava bittimäärä DCT-piireiltä 43, 44 ja 45 5 tulevan kehyksen B DCT-kerroindatan koodaamiseksi, eli bittimäärä, joka tarvitaan ennalta määrätyn äänenlaadun toteuttamiseksi, ja bittimäärän korjauspiirillä 61, jolla toteutetaan bittien jakelu tai bittien vähentäminen, niin että sovitetaan piirillä 60 määritetty primäärinen bittimäärä kehyksen B ennalta määrätyksi bittien rajamää-räksi. Siten DCT-kerroindatan koodaus jokaisessa koodauspiirissä 46-48 suoritetaan 10 sillä bittimäärällä, joka saadaan bittimäärän korjauspiiristä 61, ts. edellä mainitulla rajana olevalla bittien lukumäärällä.
Toisaalta primäärinen bittimäärä määritetään primäärisen jaetun bittimäärän päätös-piirissä 60 ottaen huomioon niin sanottu maskivaikutus, jota selitetään seuraavassa.
Maskin käyttö liittyy ihmisen kuuloaistin määrättyihin ominaisuuksiin. Toisin 15 sanoen ihmisen kuuloaistin ominaisuuksien joukossa on äänten suhteen olemassa niin sanottu maskivaikutus, joka jaetaan ajalliseen maski vaikutukseen ja rinnakkaiseen maskivaikutukseen. Rinnakkainen maskivaikutus tarkoittaa sellaista vaikutusta, jossa heikko ääni tai kohina peittyy rinnakkaisesti tuotettuun voimakkaampaan ääneen ja tulee näin kuulumattomaksi. Ajallinen maskivaikutus on sellainen vaikutus, ’: : 20 jossa heikko ääni tai kohina peittyy voimakkaampaan ääneen, joka on tuotettu ajalta : lisesti ennen heikkoa ääntä (eteenpäin peittäminen), tai voimakkaampaan ääneen, ; * joka on tuotettu heikon äänen jälkeen (taaksepäin peittäminen), jolloin heikko ääni • : ; tulee kuulumattomaksi. Ihmisen kuuloaistin ominaisuuksien johdosta eteenpäin ««· * ;\ : peittäminen kestää kauan, esimerkiksi noin 100 ms, kun taas taaksepäin peittäminen ,·;»! 25 kestää lyhyemmän ajan, suuruusluokkaa 5 ms. Maskivaikutuksen taso (maskisuure) « · · on suuruusluokkaa 20 dB eteenpäin peittämiselle ja 30 dB taaksepäin peittämiselle.
i t » • Jos siten maskivaikutus otetaan huomioon kun kehyksessä B jaetaan bittejä, niin voidaan saavuttaa optimaalinen bittien jako. Toisin sanoen, koska bittimäärää ;·’ voidaan vähentää peitetyllä signaaliosuudelle ilman haitallisia vaikutuksia kuulo- • « * 30 aistin osalta, bittimäärää voidaan vähentää peitetyn signaaliosuuden osalta tehok-* ’; · ’ kaan koodauksen aikaansaamiseksi pienellä bittimäärällä. Maskivaikutuksen taso eli I « · maskisuure voidaan löytää kulloisenkin kriittisen kaistan energioiden summan i ‘ * [: perusteella. Maskisuureen löytämiseksi voidaan myös etsiä annetun kriittisen kaistan signaalien muiden kriittisten kaistojen alle peittymisen maskisuure. Hyväksyttävissä 35 oleva kohinataso kutakin kaistaa varten määritetään maskisuureen avulla ja jaettu 12 Λ Ί r. , * r» λ-, I f/y/9 I bittimäärä koodausta varten voidaan löytää kulloisenkin kaistan hyväksyttävän kohinatason avulla.
Primäärinen bittimäärä, joka siten on määritetty jaettavan primäärisen bittimäärän päätöspiirillä 60, johdetaan bittimäärän korjauspiirille 61, joka suorittaa bittien 5 jakelun tai bittien vähentämisen, niin että piirin 60 määrittämä bittimäärä sopii edellä mainittuun lopulliseen bittimäärään joka on ennalta määrätty kehykselle B.
Primäärisen bittimäärän määrittämisen toimintajärjestys piireillä 60 ja 61 sekä bittien jakelu ja vähentäminen on esitetty vuokaaviona kuviossa 7.
Tähän vuokaavioon viitaten vaiheessa SI asetetaan muuttujalle nsumO jaettava 10 primäärinen bittimäärä, joka on määritetty primäärisen jaettavan bittimäärän päätös-piirillä 60, ts. primäärinen bittimäärä joka todella tarvitaan koodausta varten koo-dauspiireissä 46, 47 ja 48, ja joka on saatu maskisuureen laskennan avulla. Vaiheessa S2 tämä muuttuja nsumO johdetaan bittimäärän korjauspiirille 61, joka sitten asettaa muuttujan nsumO muuttujaan nsum.
15 Vaiheessa S3 tarkistetaan onko muuttuja nsum pienempi, vai eikö se ole pienempi kuin luku nlmimit, joka osoittaa kehykselle ennalta asetetun bittien rajamäärän. Jos muuttuja nsum on pienempi kuin arvo nlmimit, ohjelma jatkaa vaiheeseen S4, ja ellei muuttuja nsum ole pienempi kuin arvo nlmimit, ohjelma jatkaa vaiheeseen S5.
Ellei muuttuja nsum ole pienempi kuin arvo nlmimit, joka osoittaa bittien raja-20 määrän, bittimäärä on liian suuri. Siten vaiheessa S4 ylimääräiset bitit (bittimäärä, joka vastaa muuttujan nsum ja arvon nlimit erotusta) jaetaan edelleen kehyksessä B.
• * :,· · Ylimääräiset bitit jaetaan kaistoille tai lohkoille, jolloin äänenlaatua parannetaan i\\ vielä enemmän. Bittien jakelun jälkeen bittimäärä palautetaan vaiheeseen S3.
•«· > « « • · · ’ Vaiheessa S5 tarkistetaan onko muuttuja nsum suurempi, vai eikö se ole suurempi 25 kuin arvo nlimit, joka osoittaa bittien rajamäärän. Jos muuttuja nsum ei ole suurempi : ·’ kuin arvo nlimit, muuttuja nsum tulee yhtä suureksi kuin arvo nlimit, jolloin otetaan huomioon vaihe S3 käsittelyn lopettamiseksi. Jos muuttuja nsum on suurempi kuin • * ·,, arvo nlimit, ohjelma jatkaa vaiheeseen S6.
» »«* • t
Jos muuttuja nsum on suurempi kuin arvo nlimit, bittimäärä on piian pieni. Siten 30 vaiheessa S6 puuttuva bittimäärä vähennetään bittimäärästä, joka vastaa muuttujaa nsum. Bittien vähentäminen tehdään alueelta tai lohkosta, joka ei vaikuta äänen- > · laatuun. Vähentämisen jälkeen bittimäärä palautetaan vaiheeseen S5.
13 112 5>' 7 9
Kuvion 7 vuokaaviossa esitetyllä toimintajärjestyksellä korjataan bittimäärä, ja koodauspiireissä 46-48 suoritetaan koodaus siten tällä tavalla korjatun bittimäärä perusteella.
Koodauspiireistä 46-48 johdetaan koodattu data synteesipiirille 50. Primääristä 5 bittimäärää koskeva tieto määritetään primäärisen jaetun bittimäärän päätöspiirissä 60 (tieto, joka osoittaa ennalta määrätyn äänenlaadun toteuttamiseksi tarvittavan bittimäärän) ja lähetetään myös synteesipiirille 50. Kulloistenkin kaistojen data yhdistetään synteesipiirissä 50, ja näin yhdistetyn datan joukosta lähtöliitäntään 52 tuotetaan koodattu data, samalla kun primääristä bittimäärää vastaava tieto tulostetaan 10 lähtöliitäntään 53.
1 Kuviossa 2 olevien lähtöliitäntöjen 52 ja 53 lähdöt tulevat kuviossa 1 esitetyistä j koodereista 2-5. Koodereiden 2-5 koodattu data johdetaan vaihtokytkimelle 7, kun taas primääristä bittimäärää koskeva tieto johdetaan valintapiirille 6.
Valintapiirillä 6 valitaan, kuten aikaisemmin mainittiin, koodereilta 2-5 tulevien 15 primäärisiä bittimääriä koskevan tiedon perusteella vain sen kooderin 2-5 lähtö, jossa koodausta varten välttämätön bittimäärä, ts. ennalta määrätyn äänenlaadun toteuttamiseksi tarvittava bittimäärä, on minimoitu, ja näin valitut signaalit johdetaan vaihtokytkimelle 7. Vaihtokytkin 7 suorittaa sitten vaihtokytkennän ja tuottaa edellä mainitun valintasignaalin perusteella lähtöön vain yhden koodatun lähdön · 20 niiden lähtöjen joukosta, jotka sille on syötetty koodereilta 2-5. Tällä tavalla vain . ". siten valittu koodattu lähtö tuotetaan lähtöliitäntään 8.
* » •••j Kun koodattu lähtö dekoodataan dekooderilla (ei esitetty) edellä mainittua primää- i.i : ristä bittien jakoa koskevan tiedon avulla, tuotetulla äänellä on optimaalinen äänen- laatu.
I I » • I » • · > 25 Kuten edellä selitettiin valitaan tällä erittäin tehokkaalla digitaalisen datan koodaus- ,t laitteessa vain optimaalisen kooderin lähtö koodereiden 2-5 lähtöjen joukosta koo- » » datun datan tuottamiseksi, jolloin koodattu data voidaan dekoodata ja muuntaa • » ääneksi optimaalisen äänenlaadun tuottamiseksi. Koska valitaan varsinaisesti koo-i dattu lähtö, niin myös DCT-käsittelyä varten valitulla lohkolla on optimipituus, 30 samalla kun lohkopituuden valinta käy helpommaksi. Esillä olevan suoritusmuodon t I » ,!, laite voidaan myös sovittaa pakkausvälineelle, kuten digitaalilevylle (CD) taltioidun ,; ’; * datan koodauslaitteeseen. Koska tässä tapauksessa käyttäjän on omistettava vain i » * ’* ·’ dekooderi (soitin), niin koodauslaitteella voi olla toivottu koko.
11 L>79 14
Edellä selitetyssä suoritusmuodossa jokaiseen kooderiin 2-5 on järjestetty erilaisin käsittelylohkoin varustetut DCT-piirit 43-45. Vaihtoehtoisesti voidaan järjestää vain yksi kooderi ja jokaista kaistaa varten voidaan järjestää DCT-piiri DCT-käsittelyn toteuttamiseksi erilaisin DCT-käsittelyn lohkopituuksin. Tässä tapauksessa valitaan 5 useamman DCT-piirin joukosta vain sellaisen DCT-piirin lähtö, joka liittyy kulloiseenkin kaistaan, jolla on koodausta varten tarvittava minimimäärä bittejä.
Sellaisessa erittäin tehokkaassa koodauslaitteessa on järjestetty vain yksi kooderi useamman kooderin sijasta, kuten kuvion 1 tapauksessa. Kun verrataan kooderin rakennetta kuviossa 2 esitettyyn rakenteeseen, niin DCT-piirit 43-45 eivät liity 10 yksi-yhteen suhteessa, kuten kuviossa 2, vaan on järjestetty useampia DCT-piirejä vastaten kulloisenkin kuvioissa 3-6 olevan kaistan lohkopituuksia. Esimerkiksi yläaluetta varten on järjestetty kolme DCT-piiriä, joilla on erilaiset lohkopituudet, kun taas keskialuetta varten on järjestetty kolme DCT-piiriä, joilla on erilaiset lohkopituudet, ja ala-aluetta varten on järjestetty vain yksi DCT-piiri. Toisin sanoen, 15 yläaluetta varten on järjestetty kolme DCT-piiriä yläalueen datan DCT-käsittelemi-seksi kolmella erilaisella lohkopituudella, vastaten kuvion 3 lohkopituutta bn, kuvion 4 lohkopituuksia bm, bH2,ja kuvioiden 5 ja 6 lohkopituuksia bm, bH2, bH3 ja bH4· Samalla tavalla keskialuetta varten on jäljestetty kolme DCT-piiriä keskialueen datan DCT-käsittelemiseksi kolmella erilaisella lohkopituudella, vastaten kuvioiden 20 3 ja 4 lohkopituutta b\i, kuvion 5 lohkopituuksia bMi, bM2 ja kuvion 6 lohkopituuksia bMi, bM2, bM3 ja bivM, kun taas ala-alueen datan DCT-käsittelyä varten on järjestetty * » · · ’ * yksi DCT-piiri yhdellä ainoalla lohkopituudella, vastaten kuvioissa 3-6 esitettyä ,.. lohkopituutta K. Johtamalla DCT-piirien lähdöt valintapiiriin 6, ja valitsemalla vain .; ·* yks DCT-piirien lähdöistä jokaista aluetta varten, voidaan saavuttaa samantapainen : : : 25 käsittely kuin kuvion 1 järjestelyllä. Tällä tavalla voidaan saavuttaa samantapainen :' : vaikutus kuin kuvion 1 järjestelyllä, vaikka rakenne yksinkertaistuukin.
* · * » » ‘ ’ Kuviossa 8 on esitetty muunnetun suoritusmuodon erittäin tehokas digitaalisen datand koodauslaite. Laite sisältää lohkopituuden päätöspiirit 49, 50 ja 51, joilla : määritetään jokaisen kaistan ortogonaalisen muunnoksen lohkopituudet perustuen 30 lohkodatan ominaisuuksiin (esim. transientti tai pysyvä) ennen kulloisenkin kaistan :·. ortogonaalista muunnosta (dataa kehyksittäin ennalta määrätyn ajan kuluessa).
. · * ·. Ortogonaalisen muunnoksen toimenpiteet toteutetaan näillä piireillä 49-51 kulloista- * kin aluetta varten määritetyn lohkopituuden mukaan. Toisaalla DCT-piireihin 46-48 ’. .: sisältyy järjestely lohkopituuden muuttamiseksi.
35 Kuvioon 8 viitaten lähdöt siirretään myös lohkopituuden päätöspiireille 49-51. Näissä piireissä tarkistetaan onko tulevan audiodatan kehyksessä 4 oleva data tran- 15 11_.-79 siettisignaaleja tai pysyviä signaaleja, ja ilmaistun tuloksen perusteella tulostetaan lohkopituuden päätössignaali. Lohkopituuden päätössignaali tekee DCT-piirien 43-45 DCT-käsittelyn lohkopituuden muuttuvaksi.
Lohkopituuden päätöspiireissä 49-51, jotka liittyvät näihin kaistoihin, etsitään jokai-5 sen näytteen huipputaso kutakin lohkoa bi, b2, b3 ja b4 kohti, jotka on saatu jakamalla kehyksen B pituus neljään osaan, ja näitä lohkoja bi, b2, b3 ja b4 varten etsitään näytteiden huipputason ajalliset vaihtelut. Esimerkiksi maksimi huipputaso Maxpk ja minimi huipputaso MinPk, etsitään lohkojen bi, b2, b3 ja b4 huipputasojen PKi, PK2, PK3 ja PK4 joukosta, suhdetta MaxPk/MinPk verrataan referenssialueella 10 olevaan arvoon, ja jos suhde on suurempi kuin referenssiarvo, niin kehyksessä B oleva signaali määritetään transienttisignaaliksi, mutta jos suhde on pienempi kuin referenssiarvo, niin kehyksessä B oleva signaali määritetään pysyväksi signaaliksi. Jos suhde on referenssialueella, niin signaali määritetään transientti- ja pysyvän signaalin väliseksi välisignaaliksi. Kuviot 9A ja 9B esittävät transienttisignaalin ja 15 vastaavasti pysyvän signaalin esimerkkejä.
Piirit 49-51 voidaan myös suunnitella niin, että suoritetaan lohkopituuden päätös lohkoissa bi, b2, b3 ja b4 olevan signaalienergian perusteella. Tässä tapauksessa etsitään kulloisenkin lohkon energia, etsitään maksimi- ja minimienergian välinen suhde, ja suhdetta verrataan signaalienergian referenssialueeseen toteuttamalla 20 ilmaisutoiminta edellä mainitulla tavalla.
φ > · t
Edellä mainittu ilmaisutoiminta suoritetaan lohkopituuden päätöspiireissä 49-51, joissa määritetään ilmaisuja tuloksia vastaavat lohkopituudet. DCT-piireissä 43-45 tehdään DCT-käsittely lohkopituuksien päätöspiireissä 49-51 näin määritettyjen : ·’ lohkopituuksien mukaan.
* I
; ' ; 25 Jos piireillä 49-51 signaalit havaitaan pysyviksi signaaleiksi, niin jokaisen kaistan lohkopituus asetetaan yhtä suureksi, kuten kehyksen B pituiseksi. Siten lohkopituuk-;v, sille asetetaan arvot bn, bM ja bL yläalueelle 11,0...22,1 kHz, keskialueelle 5,5...11,0 ’..! kHz, ja ala-alueelle 0...5,5 kHz.
: ’, Jos signaali sitä vastoin havaitaan transienttisignaaliksi, lohkopituus asetetaan siten, , - , 30 että lohkopituus on pienempi ylä- ja keskialueella ja suurempi ala-alueella, kuten kuviossa 6 on esitetty. Toisin sanoen asetetaan ala-alueelle lohkopituus bL, vastaten * kehystä B, ja keski- ja yläalueelle lohkopituudet niin, että ne ovat neljännes lohko- » I i : ’.; pituudesta bL. Kuvion 6 esimerkissä yläalueen lohkojen pituudet ovat bni, bH2, bH3 ja bH4, kun taas keskialueen lohkopituudet ovat bMi, bM2, bM3 ja bivw.
16 112^79
Jos signaali on välialueella pysyvän ja transienttisignaalin välillä, niin lohkopituudet ovat sellaiset, että ala-alueella lohkopituus on Öl, keskialueella lohkopituus on bM ja yhtä suuri kuin ala-alueella tai bMi, b\i2 eli yhtä suuri kuin puolet ala-alueen lohko-pituudesta, kun taas yläalueella lohkopituudet ovat bm, bn2, bH3 ja bH4 eli puolet tai 5 neljännes ala-alueen lohkopituudesta.
Vaikka ala-alueen lohkopituus bi. on vakio kuvioiden 3-6 suoritusmuodoissa, niin sellaista ala-alueen lohkopituutta voidaan myös vaihdella signaalien mukaisesti. Alueiden lohkopituudet voidaan jakaa osiin kehyksen puolta tai neljännestä pienemmiksi osiksi.
10 Kehyksen B puitteissa kulloistakin aluetta varten oleva, useammasta näytteestä koostuva data DCT-käsitellään DCT-piireillä 43-45 lohkopituuksilla, jotka perustuvat piirien 49-51 lohkopituuden päätössignaaleihin. Jokaisen kaistan DCT-käsittely tehdään toisin sanoen lohkopituudella, joka kulloinkin vastaa kehyksessä B olevan signaalin ominaisuuksia.
15 Toisaalta DCT-piireissä 43-45 tapahtuvan DCT-käsittelyn kehyksen pituus valitaan niin, että se on 1024 näytettä vähennettynä limityksellä OL, kuten kuviossa 10 on esitetty, joka esittää tapauksen, jossa signaali on kuvion 5 yhteydessä olevien tran-sienttisignaalien ja pysyvien signaalien välissä. Ortogonaalinen muunnos voi DCT:n sijasta myös olla diskreetti kosinimuunnos.
I M I
20 Lohkopituuden päätöspiirien 49-51 lähdöt välitetään myös koodauspiireille 46-48, . * jotka on sovitettu koodaamaan DCT-piireiltä 43-45 tulevaa DCT-kerroindataa.
j * ; ,·. Jos kehyksessä B oleva data ilmaistaan transienttisignaaliksi ja DCT-käsittelyn ,·, | lohkopituutta pienennetään DCT-piireissä 43-45, DCT-kerroindatan koodaus teh- ’.. dään adaptiivisella bittien jakamisella kehyksen B puitteissa koodauspiireissä 35-38 25 alavirtaan DCT-piireistä 43-45. Kuvion 9A esimerkissä annetaan enemmän bittejä ,, , lohkolle b3, jolla on maksimi huipputaso lohkojen bi, b2, b3 ja b4 joukossa. Tällä : ·' tavalla voidaan bittejä jakaa enemmän bittejä todella tarvitsevalle lohkolle, tässä ‘‘ lohkolle b3, niin että noudatetaan aikaspektrin muutoksia. Bittien jakaminen voidaan > • ’ ·,. tässä tapauksessa tehdä maskivaikutus huomioonottaen.
’ ·; · * 30 Jos kehyksessä oleva data ilmaistaan pysyviksi signaaleiksi, ja DCT-käsittelyn loh- : ’ : kopituus valitaan pidemmäksi DCT-piireissä 43-45, niin koodauspiireissä 46-48 i ’ ·'; tapahtuva koodaus suoritetaan kehyksen B pituuden ollessa yksikköpituutena. Ku vion 9B esimerkissä koodaus tehdään kehyskohtaisesti neljään lohkoon bi, b2, b3 ja 17 112>79 b4 jakamisen sijasta. Tällä vältetään limittyvä koodaus sellaisille signaaleille, joilla kehyksessä B on samanlaiset spektrit.
Pysyvien signaalien tapauksessa voidaan lisäksi parantaa spektrianalyysin tarkkuutta DCT-piireissä 43-45. Maskilaskutoimitusten, mikäli niitä tehdään, tarkkuus paranee 5 myös niin, että voidaan vähentää koodauspiireissä 46-48 koodaukseen käytettyä bittimäärää.
Näiden koodauspiirien 46-48 lähdöt saadaan lähtöliitännöistä 52, 54 ja 56. Lohko-pituuden päätöspiirien 49-51 lähdöt saadaan myös lähtöliitännöistä 53, 55 ja 57 lisä-datana. Toisaalta pysyvien signaalien tapauksessa lisädatan bittimäärä voi olla pie-10 nempi kuin transienttisignaalien tapauksessa. Transienttisignaalien tapauksessa näistä lähtöliitännöistä 53, 55, 57 tuotetaan neljään lohkoon liittyvä lisädata. Pysyvien signaalien tapauksessa voidaan lisädatan bittimäärää vähentää, koska lisädata voi olla kehykseen B pohjautuvaa.
Edellä mainitussa erittäin tehokkaassa digitaalisen datan koodauslaitteessa voidaan 15 koodaus tehdä signaalin ominaisuuksien, kuten transienttien tai pysyvien signaalien mukaisesti, koska kulloisenkin alueen lohkopituus ortogonaalista muunnosta varten määritetään päätöspiireillä 49-51 kulloisenkin alueen kehysdatan ominaisuuksien, kuten transienttien tai pysyvien signaalien mukaisesti ennen ortogonaalista muunnosta, ja kulloisenkin alueen DCT-käsittely tehdään DCT-piireissä 43-45 kaistakoh-20 taisesti määritelyllä lohkopituudella.
1 ♦ ; Kuvio 11 esittää kaaviollisena lohkokaaviona dekoodauslaitteen, joka on esillä olevan suoritusmuodon erittäin tehokkaan koodauslaitteen vastine. Kuvioon 11 : : viitaten koodauslaitteen lähtöliitäntöjen 52, 54 ja 56 koodattu data syötetään tulolii- täntöihin 152, 154 ja 156, ja koodauslaitteen lähtöliitäntöjen 53, 55 ja 57 lisädata • ; ’: ’. 25 syötetään tuloliitäntöihin 153, 155 ja 157. Koodattu data ja lisädata syötetään dekoo- dauspiireille 146, 147 ja 148, jotka on sovitettu dekoodaamaan koodattua dataa lisädatan perusteella. Dekoodattu data syötetään IDTC-piireille 143, 144 ja 145, » · ‘! jotka on sovitettu suorittamaan toimenpiteen, joka on käänteinen DCT-piirien 43-45 ‘’ käsittelylle (käänteinen diskreetti kosinimuunnos). Edellä mainittu lisädata syötetään • ·· 30 myös IDCT-piireille 143-145, niin että käsittely piireissä tehdään tämän lisädatan ; perusteella. IDCT-piirin 143 lähtö johdetaan IQMF-piirille 141, joka on sovitettu suorittamaan suodatustoimintaa, joka on käänteinen QMF-piirin 41 suorittamalle I t toiminnalle. IDCT-piirien 144 ja 145 lähdöt johdetaan IQMF-piirille 142, joka on : ·’ sovitettu suorittamaan suodatustoimintaa, joka on käänteinen QMF-piirin 42 suorit- 35 tamalle toiminnalle. Koska IQMF-piirin 142 lähtö johdetaan IQMF-piiriin 141, 18 Ί '1 ; : ‘ r7 Π i \δ>/9 saadaan IQMF-piiriltä 141 digitaalinen audiosignaali, joka on kulloisiinkin kaistoihin jaettujen signaalien yhdistelmä. Tämä audiosignaali saadaan lähtöliitännästä 140.
Bittien jakamisen suoritusmuotoa selitetään kuvioon 12 viitaten.
5 Kuviossa 12 esitetty laite sisältää taajuusanalyysipiirin 102 tulevan digitaalisen signaalin datan taajuusanalyysiä varten, energiaa laskevan piirin 104 ja maskin lasken-tapiirin 105 kohinatason asetusvälineenä kehyskohtaisen hyväksyttävän kohinatason asettamiseksi taajuusanalyysipiirin 102 lähtödatan kehyskohtaisen energian perusteella, lohkon liukulaskentapiirin 107 lohkon liukukertoimien laskentaa varten taa-10 juusanalyysipiirin 102 lähtödatan useamman lohkon maksimiarvon datan perusteella, koodauspiirin 103 taajuusanalyysipiirin 102 lähdön koodausta varten, ja jaettavan bittimäärän päätöspiirin 106 koodauspiirissä 103 koodaushetkellä käytettävän jaettavan bittimäärän löytämiseksi kohinatason asetusvälineen ja lohkon liukukertoimen laskentapiirin 107 lähtöjen perusteella.
15 Taajuusanalyysipiiri 102 voi olla riippumaton piiri, tai sitä voidaan käyttää yhdessä kuvion 2 DCT-piirin kanssa. Koodauspiiri 103 on kuvion 2 koodauspiirien 46 - 48 vastine.
Esillä olevassa koodauslaitteessa, joka on esitetty kuviossa 12, tuleva digitaalinen data, kuten audiodata, syötetään tuloliitäntään 100. Tämä tuleva audiodata syötetään * 20 taajuusanalyysipiiriin 102 audiodatan analyysiä varten. Taajuusanalyysipiirissä 102 ·. tehdään taajuusanalyysi muuntamalla useammasta näytteestä koostuva digitaalinen , ;' audiodata spektri dataksi (DCT-kerroindataksi) ortogonaalisella muunnoksella, kuten : : : DCT:llä.
« · » » « *
Piirin 102 lähtödata johdetaan koodauspiirille 103, jossa data koodataan adaptiivi- • * · *·* 25 sella bittien jakamisella ennen sen syöttämistä lähtöliitäntään 108.
Tehokasta koodausta varten adaptiivisesti jaetulla bittimäärällä käytetään seuraavaa järjestelyä koodauspiirissä 103.
j Taajuusanalyysipiiristä 102 tuleva spektridata johdetaan sitten energian laskenta- piiriin 104, joka toimii kohinatason asetusvälineenä, sekä lohkon liukulaskentapii-30 riin 107.
• ‘,: Energian laskentapiirissä 104 muodostetaan useammasta analyysipiiristä 102 tule vasta spektridatasta kulloinkin muodostuvat lohkot. Esillä olevassa suoritusmuo- 19 1Ί 2 ·> 7 9 dossa taajuusalue jaetaan esim. 25 :een kaistaan, niin että kaistanleveys kasvaa taajuuden kasvaessa, kriittisten kaistojen mukaisesti, jotka ottavat huomioon ihmisen kuuloaistin määrätyt ominaisuudet. Etsitään energiat eri kriittisillä kaistoilla, ts. kaistakohtaiset spektridatan energiasummat.
5 Energialaskentapiirin 104 ja alavirran puoleisten piirien yksityiskohtia selitetään seuraavassa kuvioon 14 viitaten.
Kulloisenkin kaistan energianlaskentapiiristä 104 tuleva energiadata johdetaan maskin laskentapiiriin 105, joka laskee maskivaikutuksen huomioon ottaen maskisuu-reen kulloisenkin alueen energiadatan perusteella. Toisaalta voidaan maskin lasken-10 nan yhteydessä löytää kuvion 14 esittämällä tavalla hyväksyttävä kohinataso, ottaen huomioon ihmisen kuuloaistin ominaisuuksien ns. tasaäänekkyyskäyrä.
Kuten edellä selitettiin, kulloisenkin kaistan sallittua kohinatasoa koskeva tieto, jossa on otettu ihmisen kuuloaistin ominaisuuksien ns. tasaäänekkyyskäyrä kulloisellakin kriittisellä kaistalla oleva energia huomioon ottaen, johdetaan jaettavan 15 bittimäärän päätöspiiriin 106. Lohkon liukulaskentapiirin lähdöt johdetaan myös jaettavan bittimäärän päätöspiiriin 106.
Lohkon liukulaskentapiirissä 107 tehdään ns. lohkon liputtaminen jokaiselle lohkolle, joka kulloinkin käsittää monta spektridataa, jotka on syötetty taajuusanalyysi-piiristä 102. Lohkon liukulaskennassa valitaan kulloisenkin lohkon spektridatasta 20 maksimiarvo, ja maksimiarvon dataa vastaava skaalauskerroin tai sen likiarvo saa-daan lohkon skaalauskertoimena. Lohkon liukukerrointa koskeva tieto johdetaan . · jaettavan bittimäärän päätöspiiriin 106. Lohkon liukukertoimen likiarvona jaettavan : : bittimäärän päätöspiiriin 106 voidaan syöttää myös maksimiarvon data.
I I f
Jaettavan bittimäärän päätöspiirissä 106 tehdään päätös jaettavasta bittimäärästä •' ‘ 25 hyväksyttävän kohinatasoa koskevan tiedon, joka on löydetty jokaista kaistaa varten maskin laskentapiirillä 105, ja lohkon liukukertoimen perusteella.
Jaettavan bittimäärän päätöspiiri 106 jakaa maskin laskentapiiriltä 105 saadun ,. * kulloisenkin kaistan hyväksyttävän kohinatason kulloisenkin kaistan datan lukumää- : " rällä, nimittäin kaistan spektridatan määrällä, niin että löydetään hyväksyttävä 30 kohinataso jokaisen kaistan spektridataa varten. Piiri 106 etsii myös tietoa, joka koskee jaettavaa bittimäärää, dataa kohti olevan hyväksyttävän kohinatason ja I I » : \ . lohkon liukukertoimen perusteella.
112979 20
Jaettavaa bittimäärää määritettäessä spektridatan lukumäärä liukukertoimen lasken-tahetkellä lohkon liukulaskentapiirissä 107 sovitetaan spektridatan lukumäärään hyväksyttävän kohinatason laskentahetkellä energian laskentapiirissä 104 ja maskin laskentapiirin 105 toimiessa kohinatason asetusvälineenä. Toisin sanoen, kun pääte-5 tään jaettava bittimäärä, niin käsittely-yksiköiden eli lohkojen lukumäärä lohkon liukulaskentapiirissä 107 sovitetaan yhteen ainoaan käsittely-yksikköön tai kaistaan kohinatason asetusvälineellä spektridatan lukumäärän sovittamiseksi, tai käsittely-yksiköiden tai kaistojen lukumäärä hyväksyttävän kohinatason laskemiseksi sovitetaan käsittely-yksikköön tai lohkoon lohkon liukukertoimen laskemiseksi. Edellä 10 mainittu toimenpide on suoritettava, sillä kun kriittisten kaistojen kaistanleveydet tulevat suuremmiksi taajuuden kasvaessa, niin datamäärä on erilainen eri alueilla, niin että laskenta jaettavan bittimäärän löytämiseksi ei ehkä ole mahdollinen, ellei datamäärä lohkon liukukerrointa laskettaessa sovitetaan alueen datamäärään.
Edellä olevassa jaettavan bittimäärän päätöspiirissä 106 löydetään taso AD (E2 - E3), 15 kuten kuviossa 13 on esitetty, jossa E3 on spektridataa kohti hyväksyttävä kohina-taso, joka saadaan jakamalla lohkossa h (lohko, jossa datamäärä on sovitettu edellä selitetyllä tavalla) olevan useamman spektridatan S kokonaisenergiataso Eo lohkon h datamäärällä, ja E2 on spektridatan S joukossa olevaa maksimiarvon dataa Smax vastaava skaalauskertoimen taso tai lohkon liukukerroin, kuten on esitetty kuviossa 20 13. Kuviossa 13 esitetty taso on merkitty kuudella bitillä, ja dB-taso, joka saadaan erotuksesta (E2-E3) lasketaan bitteinä ((E2-E3)/6,0 bittiä), tuloksena olevaa dataa * käytetään tietona, joka koskee lohkolle h jaettua bittimäärää.
Toisaalta on tarkoituksenmukaista löytää taso ad (E0-E1), jossa Eo merkitsee lohkon h kokonaisenergiatasoa, ja Ei saadaan kokonaisenergiatason Eo perusteella, sekä » ' 25 laskea taso ad dB-arvona, joka saadaan erotuksesta (E2-E3) bitteinä ((E2-E3)/6,0 ,,: bittiä), jolloin tuloksena oleva dataa tietona, joka koskee lohkolle h jaettua bitti- * · määrää.
! · ’; Jaetun bittimäärän tieto, siten kuin se saatiin edellä selitetyllä tavalla, johdetaan • koodauspiiriin 103, jossa koodaus toteutetaan jaetun bittimäärän tiedon perusteella.
• ’30 Edellä selitetyssä suoritusmuodossa jokaisen lohkon tai kaistan kohinatasoa voidaan vaimentaa hyväksyttävälle kohinatasolle, ja vaikka signaalilla on voimakas tonali-.'. teetti, niin voidaan saada sellainen bittimäärä, joka on sovitettu signaalin luontee- ,;'; seen.
» I
21 112 > 7 9
Jaettua bittimäärää koskeva tieto jaetun bittimäärän päätöspiiristä 106 tulostetaan lähtöliitännästä 109, jotta sitä käytettäisiin dekoodausyksikön alavirran puolella (ei esitetty) koodatun datan dekoodausta varten. Lohkon liukukertoimen tieto lohkon liukulaskentapiiristä 107 tulostetaan lähtöliitännästä 110, jotta sitä käytettäisiin 5 dekoodaukseen dekoodausyksikössä.
Kuvioon 14 viitaten selitetään rakennetta hyväksyttävän kohinatason asettamiseksi, ottaen huomioon kriittiset kaistat ja maskivaikutus energian laskentapiirissä 104 ja alavirran puoleisissa piireissä.
Kuviossa 14 esitetty järjestely muodostuu erilaisista piireistä, kuten kohinatason 10 asetusvälineestä, jolla asetetaan hyväksyttävä kohinataso jokaista kaistaa varten kulloisenkin kriittisen kaista energian (tai huippu- tai keskiarvon) perusteella.
Kuviossa 14 tuloliitäntään 100 johdettu aika-akselilla oleva digitaalinen audiodata välitetään taajuusanalyysipiirin 102 DCT-piirille 111, jolloin analyysipiiri myös on varustettu amplitudin vaiheinformaatiota kehittävällä piirillä 112. DCT-piirissä 15 aika-akselilla oleva audiodata muunnetaan taajuusakselilla olevaksi dataksi aikayk-sikkövälein eli lohkoittain DCT-kerroindatan tuottamiseksi, joka muodostuu reaalisesta numerokomponentista Re ja imaginaarisesta numerokomponentista Im. Tämä DCT-kerroindata välitetään amplitudi- ja vaiheinformaation muodostamispiirille 112, jossa komponenteista Re ja Im tuotetaan ja tulostetaan lähtöön amplitu-. 20 di-informaatio Am ja vaiheinformaatio Ph.
Amplitudi-informaation Am ja vaiheinformaation Ph osalta amplitudi-informaatio
Am johdetaan jaetun bittimäärän päätöspiirille 106 ja sitä käytetään adaptiivisesti : jaetun bittimäärän tiedon aikaansaamiseksi amplitudi-informaation koodauspiirissä : 160 ja vaiheinformaation koodauspiirissä 170. Koska ihmisen kuuloaisti yleensä on * . 25 herkkä taajuusalueella olevalle amplitudille eli teholle, kun se taas on äärimmäisen epäherkkä vaiheelle, esillä olevassa suoritusmuodossa käytetään vain amplitudi-informaatiota Am jaetun bittimäärän tiedon aikaansaamiseksi.
• Taajuusanalyysipiiriltä 102 amplitudi-informaatio Am johdetaan amplitudi-infor maation koodauspiiriin 160 koodausta varten, kun taas vaiheinformaatio Ph samaten • i » 30 johdetaan vaiheinformaation koodauspiiriin 170 koodausta varten. Koodauspiirieillä 160, 170 koodattaessa vaiheinformaatiolle Ph jaettua bittimäärää vähennetään, niin * , * että se on pienempi kuin se joka jaetaan amplitudi-informaatiolle Am koodausta I · i • varten, taajuusanalyysipiirin 102 lähdön ennalta määrätyllä kaistalla, kuten myöhemmin selitetään. Amplitudi-informaatio johdetaan myös jaetun bittimäärän pää- v::,,70 22 töspiiriin 106. Jaetun bittimäärän päätöspiiri 106 päättelee jaetun bittimäärän tiedon lohkon liukukertoimen ja hyväksyttävän kohinatason tiedon datan perusteella, kuten myöhemmin selitetään. Jaetun bittimäärän päätöspiiri 106 päättää myös jaetun bittimäärän tiedon amplitudi-informaation Am koodausta varten ja jaetun bittimää-5 rän tiedon vaiheinformaation Ph koodausta varten, amplitudi-informaation Am perusteella, kuten myöhemmin selitetään, siirrettäviksi vastaaviin koodauspiireihin 160,170.
Huomataan, että jaetun bittimäärän päätöspiirissä 106 amplitudi-informaatio Am voidaan jakaa kriittisten kaistojen mukaisesti ottaen huomioon ihmisen kuuloaistin 10 ominaisuudet, ja maskisuure voidaan saada amplitudi-informaation Am energioiden perusteella kulloistakin kaistaa varten niin, että jaettu bittimäärä kulloisenkin kaistan amplitudi-informaation Am koodausta varten ja vaiheinformaation Ph koodausta varten voidaan määrittää käyttäen maskisuureeseen perustuen hyväksyttävää kohina-tasoa. Määritettäessä jaettua bittimäärää kutakin kaistaa varten vaiheinformaatiolle 15 Ph jaettu bittimäärä valitaan pienemmäksi kuin amplitudi-informaatiolle Am jaettu bittimäärä, niin että otetaan huomioon ihmisen kuuloaistin ominaisuudet. Vähentämällä vaiheinformaatiolle Ph tällä tavalla jaettua bittimäärää, voidaan vaiheinformaation koodauspiirin 170 lähtöön tuottamaa vaiheinformaation koodatun datan bittimäärää pienentää. Vaikka vaiheinformaatiolle Ph jaettua bittimäärää pienenne-20 täänkin, niin sellainen vähentäminen ei tunnu aiheuttavat äänenlaadun heikkenemis-: ‘tä ihmisen korvin kuullen.
• ·, Kuviossa 14 johdetaan taajuusanalyysipiirin 102 amplitudi-informaation digitaali- ! nen data kaistanjakopiiriin 113, joka jakaa digitaalisen datan kriittisiin kaistoihin.
; Kriittisillä kaistoilla otetaan huomioon ihmisen kuuloaistin määrätyt ominaisuudet • 25 eli taajuusanalyysikyky. Taajuusalue jaetaan esimerkiksi 25 :ksi kaistaksi, niin että ‘ ’ kaistanleveys kasvaa taajuuden kasvaessa. Toisin sanoen on ihmisen kuuloaistilla kaistanpäästösuodatinta muistuttavat ominaisuudet. Kulloisellakin suodattimena : \· jaettua kulloistakin kaistaa sanotaan kriittiseksi kaistaksi.
Kaistanjakopiirillä 113 jaetun kulloisenkin kriittisen kaistan digitaalinen data johde- ’· 30 taan kokonaissumman ilmaisinpiiriin 114, jossa etsitään jokaisen kaistan energia ,: (kulloisenkin kaistan spektrin voimakkuus) muodostamalla kokonaissumma kulloi- *, senkin spektridatan voimakkuudesta kulloisellakin kaistalla. Kokonaissumman ; ·, ilmaisinpiirin 114 lähtöä, eli spektrisummaa jokaisella kaistalla, sanotaan Burken » spektriksi. Burken spektri SB kullakin kaistalla on esitetty esimerkinomaisesti 35 kuviossa 15. Tässä kuviossa kriittisten kaistojen lukumääräksi valitaan 12 (B1-B12).
112979 23
Jotta otettaisiin huomioon Burke-spektrin SB vaikutus ns. maskiin (peittämiseen), yhdistetään Burke-spektriin ennalta määrätty painotusfunktio. Tätä varten kokonaissumman ilmaisupiirin 114 lähtö, eli Burke-spektrien SB arvot, johdetaan suodatin-piiriin 115. Suodatinpiiri 115 käsittää useita viivelaitteita, joilla peräkkäin viiväs-5 tetään tulevaa dataa, useita kertojia, joilla kerrotaan viivelaitteiden lähdöt suodatus-kertoimilla (painotusfunktiot), kaistoihin liittyen esim. 25 kertojaa, ja summauslaite kertojien lähtöjen summaamiseksi. Burke-spektrien SB konvoluutio tehdään suoda-tinpiirissä 115 kertomalla suodatinkertoimilla 1; 0,15; 0,0019; 0,0000086; 0,4; 0,06; ja 0,007 kertojissa; M-l; M-2; M-3; M+l; M+2; ja vastaavasti M+3. Tällä konvo-10 luutiolla lasketaan kuviossa 15 katkoviivoin esitetyn alan kokonaissumma.
Suodatinpiirin 115 lähtö johdetaan vähennyslaskuelimelle 116, joka on sovitettu sellaisen tason etsimiseen, joka vastaa yhdistetyllä alueella olevaa hyväksyttävää kohinatasoa. Hyväksyttävää kohinatasoa vastaava taso a on sellainen taso, joka tuottaa hyväksyttävän kohinatason jokaista kriittistä kaistaa varten konvoluutiota 15 purettaessa, kuten myöhemmin selitetään. Hyväksyttävä funktio (maskitasoa edustava funktio), jolla etsitään taso a, syötetään vähennyslaskuelimelle 116. Tasoa a säädetään lisäämällä tai vähentämällä hyväksyttävää funktiota. Hyväksyttävä funktio johdetaan funktiogeneraattorista 129, kuten myöhemmin selitetään.
Jos kriittisten kaistojen lukumäärä matalamman taajuuden alueelta korkeamman ,20 taajuuden alueelle on i, niin hyväksyttävää kohinatasoa vastaava taso a saadaan yhtälöstä • ‘ a = S - (n - ai) : jossa n ja a ovat vakioita, jolloin a > 0, ja S on yhdistetyn Burke-spektrin voimak- / kuus, ja jolloin termi (n - ai) edellisessä kaavassa edustaa hyväksyttävää funktiota.
25 Kuvion 14 esimerkissä ovat n = 38 ja a = 1, jolloin voidaan saavuttaa optimikoodaus äänenlaatua heikentämättä.
: Tällä tavalla löydetään taso a ja vastaava data johdetaan jakajalle 117, joka on sovitettu tason a konvoluution purkamiseen yhdistetyllä alueella. Konvoluution purkamisessa voidaan sitten tasosta a saada maskispektri. Maskispektristä tulee ' ’ 30 toisin sanoen hyväksyttävä kohinataso. Vaikka konvoluution purkamisessa tarvitaan : mutkikasta käsittelyä, se suoritetaan kuvion 14 esimerkissä yksinkertaistetulla jakajalla 117.
Maskispektri johdetaan synteesipiirin 118 kautta vähennyslaskuelimelle 119, jolle viivepiirin 121 kautta tuodaan summan ilmaisupiirin 114 lähtö, eli Burke-spektri SB
112979 24 edellä mainitusta kokonaissumman ilmaisupiiristä 114. Kun vähennyslaskuelimessä 119 suoritetaan maski spektrin ja Burkes-pektrin SB vähennyslasku, niin maskitason MS alla oleva Burke-spektrin SB osa peittyy, kuten on esitetty kuviossa 16.
Synteesipiirillä 118 suoritettavassa synteesissä kuuluvuuden minimikäyrän generaat-5 torilta 122 saatava ja ihmisen kuuloaistin ominaisuuksia edustava ns. kuuluvuuden minimikäyrä RC voidaan kuvion 17 mukaisesti yhdistää edellä mainittuun maski-spektriin. Kuuluvuuden minimikäyrän osalta pätee, että kohina ei kuulu, jos sen absoluuttinen taso on alempi kuin kuuluvuuden minimikäyrä. Kuuluvuuden minimi-käyrä tulee erilaiseksi, kun esim. volyymi toistossa on erilainen, vaikkakin koodaus 10 on sama. Koska 16-bitin dynaamisella alueella musiikissa ei ole mitään merkittävää eroa, niin jos ihmisen korvin herkimmin kuultava, lähellä 4 kHz taajuusaluetta oleva kvantisointikohina ei kuulu, niin käytännön digitaalisessa järjestelmässä kuuluvuuden minimikäyrän alapuolella oleva kvantisointikohina ei kuitenkaan kuulu, ja hyväksyttävä kohinataso saadaan syntesoimalla kuuluvuuden minimikäyrä RC ja 15 maskispektri MS, jolloin tässä tapauksessa voidaan ottaa kohinataso vinoviivoituk-seen saakka. Toisaalta kuvion 14 esimerkissä sovitetaan kuuluvuuden minimikäyrän taso 4 kHz:llä minimitasoon, joka vastaa esim. 20 bittiä. Kuviossa 17 on myös esitetty signaalispektri SS.
On huomattava, että hyväksyttävän kohinatason korjauspiirissä 120 vähennyslasku-,20 elimeltä 119 tuleva hyväksyttävä kohinataso korjataan ns. tasaäänekkyyskäyrän ,··*, perusteella. Hyväksyttävän kohinatason korjauspiiriin 120 syötetään korjausarvon ’! # päätöspiirin 128 lähtö.
f ,· 1 Korjausarvon päätöspiiri 128 tuottaa korjausarvon datan vähennyslaskuelimeltä 119 : \i tulevan hyväksyttävän kohinatason korjaamiseksi ennalta asetetun tasaäänekkyys- ; ;‘j 25 käyrän informaation datan perusteella. Vähennyslaskuelimeltä 119 tuleva hyväksyt tävä kohinataso korjataan korjausarvolla, joka johdetaan hyväksyttävän kohinatason v. koijauspiiriin 120.
·’ Toisaalta tasaäänekkyyskäyrä liittyy ihmisen kuuloaistin määrättyihin ominaisuuk- ,. siin, ja se saadaan liittämällä kulloistenkin taajuuksien äänenpaineet, jotka kuullaan *. 30 yhtä voimakkaina kuin 1 kHz puhdas ääni. Tasaäänekkyyskäyrä noudattaa oleelli sesti samaa käyrää kuin kuviossa 17 esitetty kuuluvuuden minimikäyrä. Tasaäänek-‘ kyyskäyrällä kuuluu ääni, jonka äänenpaine on 8-10 dB alempi alueella 1-4 kHz : yhtä voimakkaana kuin 1 kHz ääni, kun taas 50 kHz läheisyydessä ääntä ei kuulla, ellei äänenpaine ole noin 15 dB suurempi kuin 1 kHz äänenpaine. Tässä mielessä 112979 25 voidaan nähdä, että hyväksyttävän kohinatason tasaäänekkyyden käyrän huomioon ottava korjaus soveltuu ihmisen kuuloaistin ominaisuuksiin.
Tällä tavalla määritetty hyväksyttävää kohinatasoa koskeva tieto johdetaan ROM:iin 130, johon on talletettu useita jaettavan bittimäärän tietoja amplitudi-informaation 5 Am ja vaiheinformaation Ph koodausta varten. ROM:sta 130 saadaan vähennys-piirin 119 lähtöä vastaava jaettavan bittimäärän data (kulloisenkin kaistan energian ja kohinatason asetusvälineen lähdön erotuksen taso). Vaiheinformaatiolle jaettava bittimäärä on pienempi kuin amplitudi-informaatiolle jaettava bittimäärä, kuten edellä selitettiin. ROM:n 130 lähtö johdetaan amplitudi-informaation koodauspiiriin 10 160 ja vaiheinformaation koodauspiiriin 170. Piirissä 160 koodataan viivepiirin 123 kautta syötetty amplitudi-informaatio Am ROM:n 130 antamalla jaetulla bittimäärällä, kun taas piirissä 170 koodataan viivepiirin 124 kautta syötetty vaiheinformaa-tio Ph. Näissä piireissä 160, 170 koodataan toisin sanoen aluekomponentit bittimäärällä, joka on jaettu kriittisten kaistojen energioiden ja hyväksyttävän kohinatason 15 välisen erotuksen mukaisesti niin, että vaiheinformaatiolle Ph jaettu bittimäärä on pienempi kuin amplitudi-informaatiolle Am jaettu bittimäärä. Toisaalta on järjestetty viivepiiri 121, jolla viivästetään summan ilmaisupiiriltä 114 tulevaa Burke-spekt-riä SB, ottaen huomioon synteesipiirin 118 ylävirran puolella olevien piirien aiheuttamat viiveet, ja samoin viivästetään amplitudi-informaatiota Am tai vaiheinformaa-20 tiota Ph ottaen huomioon ROM:n 130 ylävirran puoleisten piirien tai viivepiirien •: 123,124 aiheuttamat viiveet.
Vaikka jaetun bittimäärän tieto vaiheinformaatiota Ph ja amplitudi-informaatiota ; Am varten voidaan syöttää suoraan päätöspiiristä 106 koodauspiiriin, niin jaettavan * bittimäärän tieto bittimäärästä kompressoidaan esillä olevassa suoritusmuodossa.
« * ; 25 Päätöspiirissä 106 on ts. aiemmin määritetty vaiheinformaation Ph pienempi bitti- määrä amplitudi-informaatiosta Am. Esimerkiksi jaettavien bittien määrä vaiheinformaatiota Ph ja amplitudi-informaatiota Am varten asetetaan edeltä käsin siten, ’ ; että yläalueen (esim. 10 kHz tai sen yli) vaiheinformaatiolle Ph jaettava bittimäärä on pienempi kuin amplitudi-informaatiolle Am annettu määrä. Tällä tavalla voidaan : '·· 30 koodatun datan rinnalla siirtää vain joko jaetun bittimäärän tieto vaiheinformaatiota :' i ’: Ph tai amplitudi-informaatio Am varten.
' · .: Jos ts. alavirran puolella oleva kooderi tietää bittien vähentämisen ennalta määrätyn : ehdot, niin kooderi voi löytää muun jaettavan bittimäärän tiedon jäljellä olevasta bittimäärän tiedosta. Siten viimeksi mainittua tietoa ei tarvitse siirtää, koska jaetun 35 bittimäärän tieto koskee vaiheinformaatiota Ph, jolloin siirrettyjen bittien määrää 26 112,79 voidaan vähentää verrattuna tapaukseen, jossa siirretään jaetun bittimäärän tieto amplitudi-informaatiota Am varten.
Amplitudi-informaation koodauspiirin 160 koodaama amplitudi-informaation Am | data tulostetaan lähtöliitännän 161 kautta, kun taas vaiheinformaation Ph koodattu 5 data tulostetaan lähtöliitännän 171 kautta. Jaetun bittimäärän tieto, joka tulostetaan päätöspiiristä 106, johdetaan lähtöliitäntään 151. Amplitudi-informaation Am ja vaiheinformaation Ph koodattu data on koodattu käyttäen jaetun bittimäärän tietoa.
Edellä selitetyssä laitteessa tuleva digitaalinen data muunnetaan amplitudi-informaatioksi Am ja vaiheinformaatioksi Ph taajuusanalyysin avulla, ja vaiheinformaatiolle 10 Ph jaettu bittimäärä on pienempi kuin amplitudi-informaatiolle Am jaettu bittimäärä vaiheinformaatiota Ph ja amplitudi-informaatiota Am koodattaessa, niin että voidaan vähentää koodatun datan määrää.
Jos lisäksi vaiheinformaation Ph pienennettyä bittimäärää verrataan amplitudi-informaatioon Am jokaisen ennalta määrätyn kaistan osalta, on lähetettävä vain toinen 15 jaetun bittimäärän tiedoista, joko amplitudi-informaation Am tai vaiheinformaation Ph, jolloin jaettavan bittimäärän tietoa varten siirrettävää bittimäärää voidaan vähentää vielä enemmän. Lisäksi, koska kulloisellekin alueelle jaettu bittimäärä on asetettu käyttäen kulloisessakin kaistassa olevien energioiden avulla saatuun maski-suureeseen perustuvaa hyväksyttävää kohinatasoa, voidaan saavuttaa bittikompres-’ 20 sio sellaisella tavalla, joka kuuloaistin kannalta ei huonone niin helposti.
Toisaalta voidaan edellä mainitun kuuluvuuden minimikäyrän synteesi jättää pois, jolloin kuuluvuuden minimikäyrän generaattori 122 ja synteesipiiri 118 voidaan jättää pois, ja vähennyselimen 116 lähtö välitetään suoraan vähennyselimelle 119 jakajalla 117 tehdyn konvoluution purkamisen jälkeen.
25 Esillä olevaa keksintöä voidaan soveltaa adaptiivisen muunnoksen koodaukseen, jossa tulevat digitaaliset signaalit käsitellään ortogonaalisella muunnoksella, kuten : kuvion 12 suoritusmuodossa, mutta myös laitteessa, joka on sovitettu suorittamaan kaistanjakokoodauksen (SBC), jolloin signaalit jaetaan moneen kaistaan kaistan-' ’ päästösuodattimilla jne. ja määritetään jokaiselle kaistalle jaettava bittimäärä.
30 Esillä olevassa erittäin tehokkaassa digitaalisen datan koodauslaitteessa voidaan koodaus toteuttaa signaalin ominaisuuksien kuten transienttisen tai pysyvän signaalin mukaisesti ja myös tehdä bittikompressio, koska kulloisenkin alueen ortogonaa-lisen muunnoksen lohkopituus määritetään lohkopituuden päätöspiirissä lohkon datan ominaisuuksien (transientti tai pysyvä jne.) perusteella ennen kulloisenkin 112979 27 kaistan ortogonaalista muunnosta, ja jokaisen kaistan ortogonaalinen muunnos tehdään näin määritetyllä lohkopituudella.
Esillä olevassa erittäin tehokkaassa digitaalisen datan koodauslaitteessa voidaan saada optimaalinen koodattu lähtö tulevan digitaalisen datan ominaisuuksien sekä 5 ihmisen kuuloaistin mukaisesti, koska valitaan vain yksi kulloisenkin ortogonaalisen muunnosvälineen lähtö useamman ortogonaalisen muunnosvälineen lähdön perusteella, valitsemalla sen ortogonaalisen muunnosvälineen lähtö, jolla on koodauksen aikana pienin jaettu bittimäärä, niin että voidaan tuottaa optimaalinen äänenlaatu dekoodaamalla ja muuntamalla koodattu lähtö ääneksi.
10 Esillä olevassa erittäin tehokkaassa digitaalisen datan koodauslaitteessa voidaan lisäksi saavuttaa optimaalinen bittien jakaminen vaikka signaalit ovat voimakkaasti tonaalisia signaaleja, koska jaettu bittimäärä koodauksen aikana määritetään liuku-kertoimen avulla, joka kerroin perustuu tulevan digitaalisen datan taajuusanalyysin 1 kautta saadun datan lohkon maksimiarvon dataan ja lohkokohtaiseen energiaan 15 perustuvan hyväksyttävään kohinatasoon.
Kun tuleva digitaalinen data muunnetaan taajuusanalyysin avulla amplitudi-informaatioksi ja vaiheinformaatioksi ja amplitudi-informaatio ja vaiheinformaatio koodataan, esillä olevassa erittäin tehokkaassa digitaalisen datan koodauslaitteessa voidaan lisäksi ennalta määrätyn alueen vaiheinformaatiolle jaettua bittimäärää pie-20 nentää niin että se on pienempi kuin amplitudi-informaatiolle jaettu bittimäärä, niin . * että bittikompression suhdetta voidaan nostaa ja siirron bittinopeutta voidaan pie- , ; ’ nentää.
•, j Esillä olevassa erittäin tehokkaassa digitaalisen datan koodauslaitteessa voidaan '.. * lisäksi rajoittaa äänenlaadun heikkenemistä kuuloaistin kannalta, koska kaista jossa ’ * 25 jaettu bittimäärän tieto supistetaan vaiheinformaation Ph osalta on erittäin kriittinen kaista jossa otetaan huomioon ihmisen kuuloaistin ominaisuudet.
Esillä olevan keksinnön laitetta voidaan tehokkaasti soveltaa datan koodauslait-teeseen pakkausvälineelle, kuten ns. digitaalilevylle (DC) tallettamista varten.

Claims (6)

1. Digitaalisen datan erittäin tehokas koodauslaite, jossa tuleva digitaalinen data jaetaan (41, 42) moneen kaistaan, jolloin jokaisessa kaistassa muodostetaan monesta näytteestä koostuvat lohkot ja jokaiselle kaistan lohkolle tehdään ortogonaalinen 5 muunnos (43-45) kerroindatan tuottamiseksi, joka kerroindata koodataan (46-48), tunnettu siitä, että - se sisältää lohkon pituuden päätöspiirin (49, 50, 51) lohkon pituuden määrittämiseksi kunkin kaistan ortogonaalista muunnosta varten perustuen lohkon datan ominaisuuksiin ennen kunkin kaistan ortogonaalista muunnosta, ja 10. mainittu kunkin kaistan ortogonaalinen muunnos tehdään mainitun lohkon pituu den päätöspiirin (49-51) määrittämällä lohkon pituudella.
2. Patenttivaatimuksen 1 mukainen erittäin tehokas digitaalisen datan koodaus-laite, tunnettu siitä, että jokaisen kaistan kaistanleveys valitaan suuremmaksi suuremmilla taajuuksilla.
3. Patenttivaatimuksen 2 mukainen erittäin tehokas digitaalisen datan koodaus- laite, tunnettu siitä, että mainittuja lohkopituuksia lyhennetään jakamalla suuremmilla taajuuksilla.
• 4. Patenttivaatimuksen 2 mukainen erittäin tehokas digitaalisen datan koodaus-laite, tunnettu siitä, että mainitut lohkopituudet ovat eri suuret taajuuden keski- ja 20 yläalueella.
• 5. Jonkin edellisen patenttivaatimuksen 1-4 mukainen erittäin tehokas digitaali- ’ sen datan koodauslaite, tunnettu siitä, että mainittu ortogonaalinen muunnos on : diskreetti kosinimuunnos (DCT).
6. Jonkin edellisen patenttivaatimuksen 1-4 mukainen erittäin tehokas digitaali-! 25 sen datan koodauslaite, tunnettu siitä, että mainittu ortogonaalinen muunnos on nopea Fourier-muunnos (FFT). ί 29. iz>/y
FI925401A 1991-03-29 1992-11-27 Digitaalisen datan erittäin tehokas koodauslaite FI112979B (fi)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP9118391 1991-03-29
JP03091185A JP3089691B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法
JP9118591 1991-03-29
JP03091183A JP3089690B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法
JP9200387 1992-03-27
PCT/JP1992/000387 WO1992017884A1 (en) 1991-03-29 1992-03-27 High efficiency digital data encoding and decoding apparatus

Publications (3)

Publication Number Publication Date
FI925401A0 FI925401A0 (fi) 1992-11-27
FI925401A FI925401A (fi) 1992-11-27
FI112979B true FI112979B (fi) 2004-02-13

Family

ID=26432643

Family Applications (1)

Application Number Title Priority Date Filing Date
FI925401A FI112979B (fi) 1991-03-29 1992-11-27 Digitaalisen datan erittäin tehokas koodauslaite

Country Status (18)

Country Link
US (1) US5414795A (fi)
EP (1) EP0537361B1 (fi)
KR (1) KR100293855B1 (fi)
CN (1) CN1030129C (fi)
AT (1) ATE153165T1 (fi)
AU (2) AU648656B2 (fi)
BR (1) BR9204820A (fi)
CA (1) CA2083713C (fi)
DE (1) DE69219718T2 (fi)
DK (1) DK0537361T3 (fi)
EG (1) EG20351A (fi)
FI (1) FI112979B (fi)
HU (1) HU213963B (fi)
NO (1) NO306007B1 (fi)
PT (1) PT100309B (fi)
TR (1) TR25961A (fi)
WO (1) WO1992017884A1 (fi)
ZA (1) ZA921988B (fi)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
DE69231369T2 (de) * 1991-09-30 2001-03-29 Sony Corp., Tokio/Tokyo Verfahren und Einrichtung zur Audiodatenkompression
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法
JP3188013B2 (ja) * 1993-02-19 2001-07-16 松下電器産業株式会社 変換符号化装置のビット配分方法
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
KR100287494B1 (ko) * 1993-06-30 2001-04-16 이데이 노부유끼 디지탈신호의부호화방법및장치,복호화방법및장치와부호화시킨신호의기록매체
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5415979A (en) * 1993-07-28 1995-05-16 Konica Corporation Stabilizer composition for processing silver halide photographic light-sensitive material and a method of processing silver halide light-sensitive material using the same
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
EP0692880B1 (en) * 1993-11-04 2001-09-26 Sony Corporation Signal encoder, signal decoder, recording medium and signal encoding method
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JPH07205496A (ja) * 1994-01-14 1995-08-08 Oki Electric Ind Co Ltd ページプリンタ及びデータ圧縮方法
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH09506478A (ja) * 1994-10-06 1997-06-24 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 光放射半導体ダイオード及びこのようなダイオードの製造方法
KR0183328B1 (ko) * 1994-10-28 1999-04-15 다나까 미노루 부호화 데이터 복호 장치와 그것을 이용한 화상 오디오다중화 데이터 복호 장치
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
EP0721257B1 (en) * 1995-01-09 2005-03-30 Daewoo Electronics Corporation Bit allocation for multichannel audio coder based on perceptual entropy
CN1110955C (zh) * 1995-02-13 2003-06-04 大宇电子株式会社 自适应地编码来自多条通道的输入数字音频信号的装置
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP3189660B2 (ja) 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
KR100223169B1 (ko) * 1996-06-14 1999-10-15 윤종용 펄스부호변조된 디지털 오디오신호의 기록 및 재생을 위한 시스템
US5892746A (en) * 1996-06-15 1999-04-06 Samsung Electronics Co., Ltd. System for recording and/or reproducing a pulse code modulation digital audio signal
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6654189B1 (en) * 1998-04-16 2003-11-25 Sony Corporation Digital-signal processing apparatus capable of adjusting the amplitude of a digital signal
US6353584B1 (en) * 1998-05-14 2002-03-05 Sony Corporation Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
CN1413344A (zh) 1999-12-21 2003-04-23 罗伯特-博希股份公司 放音设备和存储介质
ATE420432T1 (de) * 2000-04-24 2009-01-15 Qualcomm Inc Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
ATE537536T1 (de) * 2004-10-26 2011-12-15 Panasonic Corp Sprachkodierungsvorrichtung und sprachkodierungsverfahren
KR20100079121A (ko) * 2008-12-30 2010-07-08 주식회사 동부하이텍 이미지 인코더 및 이미지 인코딩 방법
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
US8428381B2 (en) * 2010-06-04 2013-04-23 Altek Corporation Image compression method with variable quantization parameter
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
CN102741831B (zh) 2010-11-12 2015-10-07 宝利通公司 多点环境中的可伸缩音频
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
US10699721B2 (en) * 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CA1292071C (en) * 1985-06-28 1991-11-12 Tomohiko Taniguchi Coding transmission equipment for carrying out coding with adaptive quantization
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4815068A (en) * 1987-08-07 1989-03-21 Dolby Ray Milton Audio encoder for use with more than one decoder each having different characteristics
JPH01276980A (ja) * 1988-04-28 1989-11-07 Sharp Corp 画像データ直交変換符号化方式
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JP2811369B2 (ja) * 1989-01-27 1998-10-15 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高品質オーディオ用短時間遅延変換コーダ、デコーダ、及びエンコーダ・デコーダ
JPH0366228A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ブロック符号化装置と復号化装置
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置

Also Published As

Publication number Publication date
EP0537361A1 (en) 1993-04-21
DK0537361T3 (da) 1997-06-09
HUT63269A (en) 1993-07-28
EP0537361B1 (en) 1997-05-14
BR9204820A (pt) 1993-07-13
EG20351A (en) 1999-01-31
PT100309B (pt) 1999-04-30
AU670655B2 (en) 1996-07-25
AU648656B2 (en) 1994-04-28
NO306007B1 (no) 1999-08-30
HU213963B (en) 1997-11-28
WO1992017884A1 (en) 1992-10-15
FI925401A0 (fi) 1992-11-27
KR930700945A (ko) 1993-03-16
US5414795A (en) 1995-05-09
TR25961A (tr) 1993-11-01
AU1448992A (en) 1992-11-02
CN1030129C (zh) 1995-10-18
NO924551L (no) 1993-01-25
KR100293855B1 (ko) 2001-09-17
FI925401A (fi) 1992-11-27
CN1068689A (zh) 1993-02-03
PT100309A (pt) 1994-04-29
DE69219718D1 (de) 1997-06-19
AU5516894A (en) 1994-04-28
ZA921988B (en) 1993-02-24
NO924551D0 (no) 1992-11-25
DE69219718T2 (de) 1997-10-02
CA2083713A1 (en) 1992-09-30
ATE153165T1 (de) 1997-05-15
CA2083713C (en) 2003-08-19
HU9203758D0 (en) 1993-04-28

Similar Documents

Publication Publication Date Title
FI112979B (fi) Digitaalisen datan erittäin tehokas koodauslaite
KR100279094B1 (ko) 디지털신호부호화장치
KR970007663B1 (ko) 신호 양자화 장치 및 방법
FI109627B (fi) Menetelmä digitaalisten signaalien koodausta varten
US7003448B1 (en) Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal
US7630902B2 (en) Apparatus and methods for digital audio coding using codebook application ranges
US5115240A (en) Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US6115689A (en) Scalable audio coder and decoder
JP3878952B2 (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
CA2090159C (en) Method and apparatus for coding audio signals based on perceptual model
US6502069B1 (en) Method and a device for coding audio signals and a method and a device for decoding a bit stream
EP1701452B1 (en) System and method for masking quantization noise of audio signals
US9361894B2 (en) Audio encoding using adaptive codebook application ranges
PL182240B1 (pl) Koder akustyczny wielokanalowy PL PL PL PL PL PL PL PL PL
KR20000022435A (ko) 스테레오포닉 스펙트럼값의 부호화 및 복호화프로세스
WO1998042083A1 (en) Audio coding method and apparatus
US8644526B2 (en) Audio signal decoding device and balance adjustment method for audio signal decoding device
KR0137472B1 (ko) 오디오 신호 코딩 방법
US8665914B2 (en) Signal analysis/control system and method, signal control apparatus and method, and program
Davidson Digital audio coding: Dolby AC-3
US6765930B1 (en) Decoding apparatus and method, and providing medium
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
GB2322776A (en) Backward adaptive prediction of audio signals
JPH04302531A (ja) ディジタルデータの高能率符号化方法

Legal Events

Date Code Title Description
MA Patent expired