NO340674B1

NO340674B1 - Koding av informasjonssignal

Info

Publication number: NO340674B1
Application number: NO20084786A
Authority: NO
Inventors: Manfred Lutzky; Gerald Schuller; Ulrich Krämer; Stefan Wabnik; Jens Hirschfeld
Original assignee: Fraunhofer Ges Forschung
Priority date: 2006-05-12
Filing date: 2008-11-12
Publication date: 2017-05-29
Also published as: ES2380591T3; WO2007131564A1; ATE542217T1; US20180012608A1; IL193784A; DE102006022346B4; US10446162B2; CN101443842A; JP2009537033A; PL2022043T3; MX2008014222A; KR100986924B1; EP2022043A1; EP2022043B1; DE102006022346A1; JP5297373B2; BRPI0709450A2; CA2651745C; RU2008148961A; US20090254783A1

Description

Fagfelt

Oppfinnelsen angår koding av informasjonssignal, f.eks. audio- eller videokoding.

Bakgrunn

Bruk av digital audiokoding i nye kommunikasjonsnett samt i profesjonelle audioproduksjoner for toveis sanntids kommunikasjon krever en svært rimelig algoritmekoding samt svært kort kodingsforsinkelse. Et typisk scenario hvor anvendelse av digital audiokoding blir kritisk i betydning av forsinkelsestid, finnes når direkte dvs. ikke kodede og overførte, dvs. kodede og dekodede signaler, blir brukt samtidig. Eksempler på dette er produksjoner hvor det brukes trådløse mikrofoner og samtidige (på øret) overvåkede eller "spredte" produksjoner hvor artistene spiller samtidig i forskjellige studioer. Den tolererbare, totale forsinkelsestid i slike tilfeller er mindre enn 10 ms. Hvis det f.eks. brukes asymmetriske deltagerledninger for kommunikasjon, kan bitraten bh en ekstra begrensende faktor.

Den algoritmiske forsinkelse i standard audiokodere, f.eks. MPEG-1 3 (MP3), MPEG-2 AAC og MPEG-2/4 med mindre forsinkelsesområder fra 20 ms til flere hundre ms, henvises det f.eks. til artikkelen M. Lutzky, G. Schuller, M. Gayer; U. Kraemer, S. Wabnik; "A guideline to audio codec delay" som ble presentert ved den 116. AES-konvensjon i Berlin i mai 2004. Talekodere virker ved lavere bitrater og med mindre algoritmeforsinkelse, men har bare en begrenset audiokvalitet.

Ovennevnte avstander mellom standard audiokodere på den ene side og talekodere på den annen side blir f.eks. lukket av en type kodesystem som beskrevet i artikkelen av B. Edler, C. Faller og G. Schuller, "Perceptual Audio Coding Using a Time-Varying Linear Pre- and Postfilter", som presentert ved den 109. AES-konvensjon i Los Angeles i september 2000 hvor signalet som skal kodes blir filtrert med inversen av maskeringsterskelen på kodersiden og deretter kvantisert for å utføre irrelevansreduksjon og hvor det kvantiserte signal blir levert for entropikoding for å utføre redundansreduksjon separat fra irrelevansreduksjonen mens det kvantiserte forfiltrerte signal blir rekonstruert på kodersiden og filtrert i et postfilter med maskeringsterskelen som overførings eller sendefunksjon. Et slikt kodesystem, kalt ULD-kodesystem nedenfor, fører til en oppfatningskvalitet som kan sammenlignes med standard audiokodere, f.eks. MP3, for bitrater med omtrent 80 kBit/s per kanal og høyere. En koder av denne type er f.eks. også beskrevet i WO 2005/078703 Al.

Især bruker de beskrevne ULD dekodere psykoakustisk kontrollerte, lineære filtre for å forme kvantiseringsstøyen. På grunn av deres struktur, blir kvantiserings-støyen alltid på den gitte terskel selv når det ikke er noe signal i det gitte frekvensdomenet. Støyen forblir uhørlig så lenge den ikke tilsvarer den psykoakustiske maskeringsterskel. For å oppnå en bitrate som er mindre enn bitraten som bestemt av denne terskel, må kvantiseringsstøyen økes, og derved blir støyen hørbar. Især blir støyen hørbar i domener uten signaldeler. Eksempler er svært lave og svært høye audiofrekvenser. Normalt fins det bare svært lave signaldeler i disse domener mens maskeringsterskelen er høy. Hvis maskeringsterskelen økes jevnt over hele frekvensdomenet, blir kvantiseringsstøyen ved den økte terskel selv når det ikke er noe signal, slik at kvantiseringsstøyen blir hørbar som et signal som høres tilfeldig. Delbånds-baserte kodere har ikke dette problem siden de samme enkle kvantiseringsdelbånd har mindre signaler enn terskelen til null.

Ovennevnte problem som oppstår når den tillatte bitrate faller under minimumsbitraten som ikke frembringer noen tilfeldig kvantiseringsstøy og som bestemmes av maskeringsterskelen, er ikke den eneste. Videre lider ULD-koderne i ovennevnte referanser av en kompleks fremgangsmåte for å oppnå en konstant datarate, især siden det brukes en gjentagelsessløyfe som må passeres for å bestemme, per samplingsblokk, en forsterloiingsfaktorverdi som justerer en dekvantisermgstrinn-størrelse.

Av tidligere kjent teknikk nevnes patentdokument WO 2005078703 Al som angir en fremgangsmåte for å kvantisere et datasignal av en sekvens med dataverdier, som omfatter frekvensselektivt filtrering av sekvensen med dataverdiene for å skaffe til veie en sekvens med filtrerte dataverdier, samt å kvantisere de filtrerte dataverdiene for å fremskaffe en sekvens med kvantiserte dataverdier ved hjelp av en kvantiserings-trinnfunksjon som kopierer de filtrerte dataverdiene på de kvantiserte dataverdiene og hvor kurven av dem er brattere under en terskeldataverdi enn den er på oversiden av denne terskeldataverdien.

Det nevnes også seksjon 3 av Schuller G et al: "Low delay audio compression using predictive coding" (2002 IEEE INTERNATIONAL CONFERENCE ON

ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, PROCEEDINGS. (ICASSP).

ORLANDO, FL, MAY 13-17, 2002, IEEE INTERNATIONAL CONFERENCE ON

ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), NEW YOUK,

NY: ieee, US, VOL. 4 OF 4, 13 May 2002 (2002.05.13), pages 11-1853, XP01084256, ISSBN: 0-7803-7402-9)

Oppsummering

Det er et formål med oppfinnelsen å tilveiebringe et informasjonskodings-system som gjør det mulig å bruke den korte forsinkelsestid som er typisk for ULD-koder med lav bitrate og likevel oppnå en høy kodingskvalitet.

Formålet oppnås av apparatene ifølge krav 1 eller 24, fremgangsmåten ifølge krav 44 eller 45 samt en koder ifølge krav 47 og en koder ifølge krav 48.

Den sentrale ide ved oppfinnelsen er det funn at en ytterst grov kvantisering som overskrider målet bestemt av maskeringsterskelen blir gjort mulig uten eller bare med svært små kvalitetstap ved ikke direkte å kvantisere det forfiltrede signal, men ved en prediksjonsfeil som oppnås ved en forovertilpasset prediksjon av det forfiltrerte signal. På grunn av forovertilpasningen, vil kvantiseringsfeilen ikke ha noen negativ virkning på prediksjonskoeffisienten.

Ifølge en annen utførelse blir det forfiltrerte signal også kvantisert på en ikke-lineær måte eller klippet, dvs. kvantisert via en kvantiseringsfunksjon som tilordner de ikke-kvantiserte verdier av prediksjonsfeilen til kvantiseringsindekser i kvantiserings-trinnene og hvis forløp er brattere under en terskel enn over denne. Følgelig blir støyen PSD øket i forhold til en maskeringsterskel på grunn av den lite tilgjengelige bitrate som er justert til signal-PSD, slik at overskridelsen av maskeringsterskelen ikke oppstår ved spektrale deler uten signaldel, hvilket ytterligere forbedrer lyttekvaliteten eller opprettholder denne til tross for avtagende bitrate.

Ifølge en annen utførelse av oppfinnelsen blir kvantiseringen kvantisert eller begrenset ved klipping, nemlig ved kvantisering til et begrenset og fast antall kvantiseringsmvåer eller trinn. Med en prediksjon eller forutsigelse av det forfiltrerte signal via en forovertilpasset prediksjon, vil den grove kvantisering ikke få noen negativ virkning på selve prediksjonskoeffisientene. Ved kvantifiseringen til et fast antall kvantiseringsmvåer, vil det oppnås Mndring av en gjentagelse for å oppnå en konstant bitrate.

Ifølge en annen utførelse av oppfinnelsen blir en kvantiseringstrinnstørrelse eller trinnhøyde mellom det faste antall kvantiseringsmvåer bestemt på en bakover-tilpasset måte fra tidligere kvantiseringsmvåindekser som oppnås ved kvantisering, slik at en bedre eller i det minste best mulig kvantisering av prediksjonsfeilen eller restsignalet kan oppnås på den ene side til tross for et svært lavt antall kvantiseringsmvåer, uten å måtte tilveiebringe ytterligere sideinformasjon på dekodersiden. På den annen side er det mulig å sikre at overføringsfeil under overføringen av det kvantiserte restsignal til dekodersiden bare har en korttidsvkkning på dekodersiden med passende konfigurering av den bakoveritlpassede trinnstørrelse.

Kort omtale av figurene

Oppfinnelsen skal beskrives nærmere i det følgende under henvisning til tegningene, der:

fig. 1 er et blokkskjema av en koder ifølge en utførelse av oppfinnelsen,

fig. 2a-b er grafer som viser eksempler på forløpet av støyspekteret i forhold til maskeringsterskelen og signaleffektspektrumstettheten for koderen ifølge krav 1 (graf a) eller for et sammenlignbart tilfelle av en koder med en

bakover-tilpasset prediksjon av det forfiltrerte signal og gjentagende og

maskeringsterskel med blokkvis kvantisermgstrinnstørrelsesjustering (graf b), fig. 3a-c viser grafer av signaleffektspektrumstettheten i forhold til støyen eller feileffektspektrumstettheten for forskjellige klippforlengelser eller ulike antall kvantiseringsmvåer for det tilfellet at, som for koderen på fig. 1, det utføres en forover-tilpasset prediksjon av det forfiltrerte signal, men hvor det

fremdeles foretas en gjentatt kvantisermgstrinnstørrelsesjustering,

fig. 4 er et blokkskjema av en oppbygning av koeffisientkoderen i koderen på fig. 1

ifølge en utførelse av oppfinnelsen,

fig. 5 er et blokkskjema av en dekoder for dekoding av et informasjonssignal kodet

av koderen på fig. 1 ifølge en utførelse av oppfinnelsen,

fig. 6 er et blokkskjema av en struktur av koeffisientkoderne i koderen på fig. 1

eller dekoderen på fig. 5 ifølge en utførelse av oppfinnelsen,

fig. 7 er en graf for å vise lyttprøveresultater, og

fig. 8a-c er grafer av kvantiseringsfunksjoner som kan brukes ved kvantisering og

kvantisermgMippeanordningen på fig. 1, 4, 5 og 6.

Detaljert beskrivelse

Før utførelsene av oppfinnelsen vil bli omtalt i detalj under henvisning til tegningene, vil det først, for å oppnå en bedre forståelse av fordelene og prinsippene av disse utførelsene, bli omtalt en mulig implementering av et ULD-kodingssystem som et sammenlignende eksempel basert på de vesentlige fordeler og underliggende vurderinger av de etterfølgende utførelser som til slutt har ført til disse for å gi en tydeligere forståelse.

Som allerede beskrevet i innledningen av beskrivelsen, er det behov for en ULD-versjon for lavere bitrater av f.eks. 64 k bit/s med sammenlignbar oppfatningskvalitet samt et enklere system for å oppnå en konstant bitrate, især for de tenkte lavere bitrater. I tillegg vil det være fordelaktig at gjenvinningstiden etter en overføringsfeil vil holde seg lav eller ved et minimum.

For redundansreduksjon av det psykoakustiske forbehandlede signal, bruker den sammenlignbare ULD-koder en sampelvis, bakovertilpasset lukket prediksjon. Dette innebærer at beregningen av prediksjonskoeffisienter i koderen og dekoderen bare blir basert på tidligere eller allerede kvantiserte og rekonstruerte signalsampler. For å oppnå en adopsjon til signalet eller det forfiltrerte signal, blir et nytt sett av prediktorkoeffisienter beregnet igjen for hver sampel. Dette fører til den fordel at lange prediktorer eller prediksjonsverdibestemmende formler, dvs. især prediktorer med et høyt antall prediktorkoeffisienter kan brukes, siden det ikke vil være behov for å overføre prediktorkoeffisienter fra kodersiden til dekodersiden. På den annen side innebærer dette at den kvantiserte prediksjonsfeil må overføres til dekoderen uten nøyaktighetstap for å oppnå prediksjonskoeffisienter som er identisk med de som ligger under kodingsprosessen. Forøvrig vil den eller de predikterte verdier i koderen og dekoderen ikke være identisk med hverandre og forårsake en ustabil kodingsprosess. I den sammenlignende ULD-koder, blir det nødvendig å foreta en periodisk tilbakestilling av prediktoren både på koder- og dekodersiden for å få selektiv adgang til den kodede bitstrøm samt stoppe en propagering av overføringsfeil. Imidlertid forårsaker den periodiske tilbakestilling bitratetopper som ikke vil representere noe problem i en kanal med variabel bitrate, men i kanaler med en fast bitrate hvor bitratetoppene begrenser den nedre grense av en konstant bitratejustering.

Som resultat av den etterfølgende mer detaljerte beskrivelse av det sammenlignbare ULD-kodingssystem med oppfinnelsens utførelser, vil disse utførelsene skille seg fra det sammenlignbare kodingssystem ved bruken av en blokkvis, forovertilpasset prediksjon med en bakover-tilpasset kvantisermgstrirmstørrelsesjustering i stedet for en sampelvis, bakovertilpasset prediksjon. På den ene side har dette den ulempe at prediktorene blir kortere for å begrense mengden av den nødvendige sideinformasjon for overføring av de nødvendige prediksjonskoeffisienter mot kodersiden men som igjen kan føre til redusert kodereffektivitet og på en annen side føre til den fordel at fremgangsmåtene ved de etterfølgende utførelser fremdeles vil fungere effektivt for høyere kvantiseringsfeil som resultat av en redusert bitrate, slik at prediktoren på dekodersiden kan brukes for kvantisering av støyforming.

Som resultat av den etterfølgende sammenligning sammenlignet med den sammenlignbare ULD-koder, blir bitraten minsket ved å begrense området av verdier av prediksjonsresten før overføringen. Dette fører til en modifisert støyforming sammenlignet med den sammenlignbare ULD-koding og også til andre og mindre tilfeldig lytteforvrengninger. Videre blir en konstant bitrate generert uten å bruke gjentatte sløyfer. Videre blir "tilbakestilling" brukt internt for hver sampelblokk som resultat av den blokkvise forovertilpasning. I utførelsene beskrevet nedenfor blir i tillegg et kodesystem brukt for forfilterkoeffisienter og foroverprediksjonskoeffisienter som bruker (hfferansekoding med bakovertilpasset kvantisermgstrinnstørrelseskontroll for en LSF (linjespektral frekvens)-gjengivelse av koeffisientene. Systemet tilveie-bringer blokkvis adgang til koeffisientene og genererer en konstant sideinforma-sjonsbitrate og er i tillegg stabil mot overføringsfeil, som beskrevet nedenfor.

I det følgende vil den sammenlignbare ULD-koder- og dekoderstruktur bli beskrevet i detalj etterfulgt av beskrivelsen av utførelsen ifølge oppfinnelsen og illustrasjonen av dens fordeler ved overføring fra høyere konstante bitrater til lavere bitrater.

I det sammenlignbare ULD-kodesystem, blir inngangssignalet fra koderen analysert på kodersiden av en oppfatningsmodell eller lyttemodell for å oppnå informasjon om oppfatningen av ikke-relevante deler av signalet. Denne informasjon blir brukt for å kontrollere et forfilter via tidsvarierende filterkoeffisienter. Derved normaliserer forfilteret inngangssignalet i forbindelse med dens maskeringsterskel. Filterkoeffisientene blir beregnet en gang for hver blokk hver på 128 sampler og kvantisert og overført til kodersiden som sideinformasjon.

Etter multiplisering av det forfiltrerte signalet med en forsterkningsfaktor ved å subtrahere det bakovertilpassede, predikterte signal, blir prediksjonsfeilen kvantisert av en enhetlig kvantiserer, dvs. en kvantiseringsenhet med en jevn trinnstørrelse. Som allerede nevnt ovenfor, blir det predikterte signal oppnådd ved en sampelvis, bakover-tilpasset og lukket prediksjon. Følgelig blir det ikke nødvendig med noen overføring av prediksjonskoeffisienter til dekoderen. Følgelig blir det kvantiserte prediksjonsrestsignal entropisk kodet. For å oppnå en konstant bitrate, er en sløyfe tilveiebrakt som gjentar trinnene med multiplisering, prediksjon, kvantisering og entropikoding av hver blokk av forfiltrerte sampler. Etter gjentagelsen blir den høyeste forsterloiingsfaktor av et sett av forbestemte forsterkningsverdier bestemt og som fremdeles oppfyller tilstanden med konstant bitrate. Denne forsterkningsverdi blir overført til dekoderen. Hvis en forsterkningsverdi imidlertid er mindre enn en, blir kvantiseringsstøyen oppfatningsbar etter dekoding, dvs. at dens spektrum blir formet tilsvarende maskeringsterskelen, men dens totale effekt blir høyere enn den som bestemmes av prediksjonsmodellen. For deler av inngangssignalspektrumet, kan kvantiseringsstøyen bli enda høyere enn inngangssignalspektrumet og dette vil igjen generere hørbare forvrengninger i deler av spektrumet hvor det ellers ikke vil være noe hørbart signal på grunn av bruken av den prediktive koder. Effektene forårsaket av kvantiseringsstøyen representerer en begrensende faktor ved bruk av lavere konstante bitrater.

For filterkoeffisientene i forbindelse med det sammenlignbare ULD-systemet, blir bare overført som intraramme, LSF-forskjeller og ikke bare så snart denne overskrider en bestemt grense. For å unngå overføringsfeilpropagering i en ubegrenset periode, blir systemet tilbakestilt fra tid til annen. Flere teknikker kan brukes for å minimere en minskning i oppfattelsen av det dekodede signal ved overføringsfeil. Overføringssystemet genererer en variabel bitrate for sideinformasjon som blir utjevnet i ovennevnte sløyfe ved å justere ovennevnte forsterkningsfaktor tilsvarende.

Entropikoding av det kvantiserte prediksjonsrestsignalet i tilfellet med den sammenlignbare ULD-koder, omfatter fremgangsmåter, f.eks. en Golomb-, Huffman-eller aritmetisk kodemetode. Entropikodingen må tilbakestilles fra tid til annen og genererer selv en variabel bitrate som igjen utjevnes ved hjelp av den ovennevnte sløyfe.

I forbindelse med det sammenlignbare ULD-kodesystem, blir det kvantiserte prediksjonsrestsignal i dekoderen hentet fra entropikodingen hvoretter prediksjonsresten og det predikerte signal blir lagt til og summen multiplisert med inversen av den overførte forsterloiingsfaktor og derfra blir det rekonstruerte utgangssignal generert via postfilteret med en frekvensrespons som er invers med forfilteret, der forfilteret bruker de overførte forfilterkoeffisienter.

En sammenlignbar ULD-koder av ovennevnte type oppnår f.eks. en total koder/dekoderforsinkelse på 5,33 til 8 ms ved samplingsfrekvenser på 32 kHz til 48 kHz. Uten (spredte sløyfe) gjentagelser, genererer samme bitrate i området 80 til 96 kBit/s. Som beskrevet ovenfor vill<y>ttekvahteten ved lavere konstante bitrater avta i denne koder på grunn av det jevnt økede støyspektrum. På grunn av repetisjonene eller gjentagelsene, blir i tillegg anstrengelsen for å oppnå en jevn bitrate, høy. Utførelsene nedenfor løser eller minimerer disse ulemper. Ved en konstant overføringsdatarate, bevirker kodingssystemet i utførelsene nedenfor en endret støyforming av den kvantiserte støy og krever ingen gjentagelser. Især i det ovennevnte sammenlignbare ULD-kodingssystem i tilfellet en konstant overføringsdatarate i en gjentagende prosess, en multiplikator, ved hjelp av hvilken signalet som kommer fra forfilteret blir multiplisert før kvantisering, der kvantiseringsstøyen blir spektralt hvit og forårsaker en kvantiseringsstøy i dekoderen som er formet som lytteterskel men som ligger litt under eller litt over denne, avhengig av den valgte multiplikator som kan, som beskrevet nedenfor, også fortolkes som en forskyvning av den bestemte lytteterskel. I forbindelse med dette kan kvantiseringsstøyresultatene etter dekoding, hvis effekt i det enkelte frekvensdomenet, også overskrider effekten av inngangssignalet i det respektive frekvensdomenet. De resulterende kodingssignaler blir tydelig hørbare. Utførelsene beskrevet nedenfor former kvantiseringsstøyen slik at den spektrale effekttetthet ikke lenger er spektralt hvit. Den grove kvantisering/begrensning eller klipping av forfiltersignalet former snarere den resulterende kvantiseringsstøy tilsvarende den spektrale effekttetthet av forfiltersignalet. Følgelig blir kvantiseringsstøyen i dekoderen formet slik at den holder seg under den spektrale effekttetthet av inngangssignalet. Dette kan fortolkes som deformering av den bestemte lytteterskel. De resulterende kodeforvrengninger blir mindre tilfeldig enn i det sammenlignbare ULD-kodesystem. Følgelig krever de etterfølgende utførelser ingen gjentagelse med redusert kompleksitet.

Siden en tilstrekkelig base ved å sammenligne det sammenlignbare ULD-kodesystem ovenfor, har blitt tilveiebrakt for å vende oppmerksomheten på de underliggende fordeler og vurderinger av utførelsene vil beskrivelsen av disse først vende seg mot en struktur av en koder ifølge en utførelse av oppfinnelsen.

Koderen på fig. 1, generelt vist av 10, omfatter en inngang 12 for innforma-sjonssignalet som skal kodes, samt en utgang 14 for det kodede informasjonssignal, der det f.eks. forutsettes nedenfor at dette er et audiosignal og et især allerede samplet audiosignal, selv om sampling i koderen til inngangen 12 også vil være mulig. Sampler av det innkommende utgangssignal er vist av x(n) på fig. 1.

Som vist på fig. 1 kan koderen 10 deles i en bestemmelsesanordning 16 for maskeringsterskel, en forfilteranordning 18, en foroverprediktiv prediksjonsanordning 20 og en kvantisermgsMippanordning 22 samt en bitstrømsgenererm<g>sanorclning 24. Bestenimelsesanordningen 16 for maskering av terskel, virker ifølge en oppfatningsmodell eller lyttemodell for å bestemme en fremstilling av maskeringen eller lytteterskelen av audiosignalet som ankommer ved inngangen 12 ved å bruke oppfatningsmodellen som indikerer en del av audiosignalet som er urelevant for oppfatningen eller hørbarheten eller som representerer en spektral terskel for frekvensen ved hvilken spektralenergi forblir uhørbar på grunn av psykoakustisk dekningseffekter eller som ikke oppfattes av mennesker. Som beskrevet ovenfor bestemmer bestenimelsesanordningen maskeringsterskelen på en blokkvis måte, dvs. at den bestemmer en maskeringsterskel per blokk av etterfølgende blokker av sampler av audiosignalet. Andre fremgangsmåter er også mulig. Fremstillingen av maskeringsterskelen når den oppstår fra bestemmelsesanordningen 16, kan, i motsetning til den etterfølgende beskrivelse, især i forbindelse med fig. 4, også være en fremstilling av spektrale sampler av den spektrale maskeringsterskel.

Forfilter- eller forestimermgsanordningen 18 er koblet til både maskeringsterskelens bestemmelsesanordning 16 og inngangen 12 og filtrerer utgangssignalet for å normalisere dette under hensyntagen til maskeringsterskelen for å oppnå et forfiltrert signal f(n). Forfilteranordningen 18 er f.eks. basert på et lineært filter og blir implementert for å justere filterkoeffisientene avhengig av fremstillingen av maskeringsterskelen tilveiebrakt av maskeringsterskelen av besteinmelsesanordningen 16, slik at overføringsfunksjonen av det lineære filter tilsvarer vesentlig inversen av maskeringsterskelen. Justering av filterkoeffisientene kan utføres blokkvis, halvt blokkvist, f.eks. som beskrevet nedenfor av blokkene overlappes av halvparten i maskeringsterskelen eller sampelvist, f.eks. ved interpolering av filterkoeffisientene oppnådd av den blokkvise bestemte maskeringsterskel eller av filterkoeffisientene oppnådd derfra over interblokkmellomrommene.

Foroverprecliksjonsanordningen 20 er koblet til forfilteranordningen 18 for å utsette samplene f(n) av det forfiltrerte signalet som blir filtrert tilpasningsvist i tids-domenet ved å bruke den psykoakustiske maskeringsterskel til en forovertilpasset prediksjon for å oppnå et predikert signal f(n), et restsignal r(n) som representerer en prediksjonsfeil, til det forfiltrerte signal f(n) og en fremstilling av prediksjonsiflterkoef- fisientene som det predikerte signal kan rekonstrueres på. Især blir den foroveradaptive prediksjonsanordning 20 implementert for å bestemme fremstillingen av prediksjonsfilterkoeffisientene umiddelbart fra det forfiltrerte signal f og ikke bare basert på en etterfølgende kvantisering av restsignalet r. Som nevnt i detalj nedenfor under henvisning til fig. 4, blir prediksjonsfilterkoeffisientene vist i LFS-domenet, især i form av en LFS-prediksjonsrest, idet andre fremstillinger, f.eks. en mellomfremstilling i form av lineære filterkoeffisienter også mulig. Videre utfører anordningen 20 prediksjonsfilterkoeffisientens bestemmelse ifølge den etterfølgende beskrivelse, blokkvist, dvs. per blokk i etterfølgende blokk av sampler f(n) av det forfiltrerte signal, der imidlertid også andre fremgangsmåter er mulig. Anordningen 20 implementeres så for å bestemme det predikerte signal f via disse bestemte prediksjonsfilterkoeffisienter og subtrahere samme fra det forfiltrerte signal f, der bestemmelsen av det predikerte signal utføres f.eks. via et lineært filter, hvis filterkoeffisienter blir justert ifølge de forovertilpassede, bestemte prediksjonskoeffisientfremstillinger. Restsignalet tilgjengelig på dekodersiden, dvs. det kvantiserte og klipte restsignal ic(n), lagt til de tidligere utgangsfiltersignalverdier, kan tjene som filterinngangssignal som beskrevet nedenfor i detalj.

KvantisermgsMippanordningen 22 ble koblet til precliksjonsanordningen 20 for kvantisering eller klipping av restsignalet via en kvantiseringsfunksjon som tilordner verdiene r(n) av restsignalet til et konstant og begrenset antall kvantiseringsmvåer og for overføring av det kvantiserte restsignal oppnådd på denne måte, oppnådd i form av kvantiseringsindekser ic(n), som allerede nevnt, til den forovertilpassede precliksjonsanordning 20.

Det kvantiserte restsignal ic(n), fremstillingen av prediksjonskoeffisientene bestemt av anordningen 20, samt fremstillingen av maskeringsterskelen bestemt av anordningen 16 utgjør informasjonen levert til dekodersiden via det kodede signal 14, og derfor er bitstrømsgenerermgsanordningen 24 tilveiebrakt på fig. 1 for å samle informasjonen i samsvar med en seriebitstrøm eller en pakkeoverføring, eventuelt ved å bruke ytterligere tapløs koding.

Før den detaljerte oppbygning av koderen på fig. 1 beskrives, vil virkemåten av koderen 1 bli beskrevet nedenfor basert på ovennevnte oppbygning av koderen 10. Ved å filtrere audiosignalet av forfilteranordningen 14 med en overføringsfunksjon tilsvarende invsersen av maskeringsterskelen, vil det oppstå et forfiltrert signal f(n) som oppnår en spektral effekttetthet av feilen ved ensartet kvantisering som hovedsakelig tilsvarerer hvit støy og som fører til et støyspektrum tilsvarende maskeringsterskelen ved å filtrerer i postfilteret på dekodersiden. Imidlertid blir først restsignalet f redusert til en prediksjonsfeil r ved hjelp av den forovertilpassede prediksjonsanordning 20 med et forovertilpasset prediksjonssignal f og subtraksjon. Den etterfølgende grove kvantisering av denne prediksjonsfeil r ved hjelp av kvantisermgsMippeanordningen 22, har ingen effekt på prediksjonskoeffisientene av prediksjonsanordningen 20 eller på koderen eller dekodersiden siden beregningen av prediksjonskoeffisientene utføres på en forovertilpasset måte og således basert på de ikke-kvantiserte verdier f(n). Kvantisering blir ikke bare utført på en grov måte i betydningen at en grov kvantisermgstrinnstørrelse blir brukt, men også utført på en grov måte i betydning at selve kvantiseringen utføres bare til et konstant og begrenset antall kvantiseringsmvåer, for å fremstille hvert kvantiserte restsignal ic(n) eller hver kvantiserte indeks i det kodede audiosignal 14 med bare et fast antall biter som gir innebygget en konstant bitrate i forbindelse med restverdiene ic(n). Som beskrevet nedenfor, utføres kvantiseringen hovedsakelig ved kvantisering til ensartet anbrakte kvantiseringsmvåer med fast antall og under til et antall bare tre kvantiseringsmvåer, der kvantiseringen blir utført f.eks. slik at et ikke-kvantisert restsignal r(n) blir kvantisert til det neste kvantiseringsmvå for å oppnå kvantiseringsindeksen ic(n) av det tilsvarende kvantiseringsmvå for samme. Ytterst høye og lave verdier av det ikke-kvantiserte restsignal r(n) blir således tilordnet det respektive høyeste eller laveste kvantiseringsmvå, eller den respektive kvantiseringsnivåindeks eller når de kan tilordnes et høyere kvantiseringsmvå med en ensartet kvantisering med samme trinnstørrelse. Så langt blir restsignalet r også "klippet" eller begrenset av anordningen 22. Imidlertid har sistnevnte effekten, som beskrevet nedenfor, at feilen PSD (PSD = effektspektraltetthet) av det forfiltrerte signal ikke lenger er hvit støy men blir approksimert til signal-PSD av det forfiltrerte signal avhengig av klippegraden. På dekodersiden har dette den effekt at støy-PSD forblir under signal-PSD selv ved bitrater som er lavere enn det som er bestemt av maskeringsterskelen.

I det følgende vil strukturen av koderen på fig. lbli beskrevet i detalj. Især omfatter maskerm<g>sterskelbesternmelsesanordningen 16 en maskeringsterskelbestem-mer eller en oppfatningsmodell 26 som virker i samsvar med oppfatningsmodellen, en forfilterkoeffisientberegningsmodul 28 og en koeffisientkoder 30 som er koblet i nevnte område mellom inngangen 12 og forfilteranordningen 18 samt bitstrøms-generatoren 24. Forfilteranordningen 18 omfatter en koeffisientdekoder 32 hvis inngang er koblet til utgangen av koeffisientkoderen 30 samt forfilteret 34 som f.eks. er et adaptivt, lineært filter og som er koblet med sin datainngang til inngangen 12 og med sin datautgang til anordningen 20 mens dens tilpasningsinngang for tilpasning av filterkoefifsientene er koblet til en utgang av koeffisientkoderen 32. Prediksjonsanordningen 20 omfatter en precliksjonskoeffisientberegningsmodul 36, en koeffisientkoder 38, en koeffisientdekoder 40, en subtraktor 42, et prediksjonsfilter 44, et forsinkelseselement 46, en ytterligere adderer 48 og en dekvantiserer 50. Prediksjonskoeffisient-beregningsmodulen 46 og koeffisientkoderen 38 er koblet i serie i denne rekkefølge mellom utgangen av forfilteret 34 og inngangen av koeffisientdekoderen 40 eller en ytterligere inngang av bitstrømsgeneratoren 24 og samvirker for å bestemme en fremstilling av prediksjonskoeffisientene blokkvist på en foroveradaptiv måte. Koeffisientdekoderen 40 er koblet mellom koeffisientkoderen 38 og prediksjonsfilteret 44 som f.eks. er et lineært prediksjonsfilter. Bortsett fra prediksjonskoeffisient-inngangen koblet til koeffisientdekoderen 40, omfatter filteret 44 en datainngang og en datautgang til hvilken denne er forbundet i en lukket sløyfe som omfatter, bortsett fra filteret 44, addereren 48 og forsinkelseselementet 46. Især er forsinkelseselementet 46 koblet mellom addereren 48 og filteret 44 mens datautgangen av filteret 44 er koblet til en første inngang av addereren 48. Over dette er datautgangen av filteret 44 også koblet til en inverteringsinngang av subtraktoren 42. En ikke-inverterende inngang av subtraktoren 42 er koblet til utgangen av forfilteret 34 mens den andre inngang av addereren 48 er koblet til en utgang av dekvantisereren 50. En datainngang av dekvantisereren 50 er koblet til kvantiserings/klippeanordningen 22 samt til en trmnstørrelsereguleringsinngang av dekvantisereren 50. Kvantiserings/klippe-anordningen 22 omfatter en kvantiseringsmodul 52 samt en trinnstørrelseadapsjons-blokk 54 der kvantiseringsmodulen 52 igjen består av en ensartet kvantiserer 56 med en ensartet og regulerbar trinnstørrelse og en begrenser 58 som er koblet i serie i nevnte rekkefølge mellom en utgang av subtraktoren 42 og den ytterligere inngang av bitstrømsgeneratoren 24 og der trinnstørrelseadapsjonsblokken 54 igjen omfatter en trinnstørrelseadapsjonsmodul 60 og et forsinkelseselement 62 som er koblet i serie i nevnte rekkefølge mellom utgangen av begrenseren 58 og en trinnstørrelseregulerings-inngang av kvantisereren 56. I tillegg er utgangen av begrenseren 58 koblet til datainngangen av dekvantisereren 50, der trirmstørrelsereguleringsinngangen av dekvantisereren 50 også er koblet til trinnstørrelseadapsjonsblokken 60. En utgang av bitstrømsgeneratoren 24 danner igjen utgangen 14 av koderen 10.

Etter den detaljerte oppbygning av koderen på fig. 1 har blitt beskrevet i detalj ovenfor, vil nå dens virkemåte bli beskrevet nedenfor. Oppfatningsmodellmodulen 26 bestemmer eller estimerer maskeringsterskelen på en blokkvis måte fra audiosignalet. Følgelig bruker oppfatningsmodellmodulen 26 f.eks. en DFT med lengde 256, dvs. en blokklengde på 256 sampler x(n) med 50 % overlapping mellom blokkene som fører til en forsinkelse av koderen 10 på 128 sampler av audiosignalet. Estimeringen av maskeringsterskelens utgang ved hjelp av oppfatningsmodellmodulen 26 er f.eks. fremstilt i en spektralt samplet form i et Bark-bånd eller i en lineær frekvensskala. Maskeringsterskelutgangen per blokk ved hjelp av oppfatningsmodellmodulen 26 blir brukt i koeffisientberegningsmodulen 24 for å beregne filterkoeffisientene av et bestemt filter, nemlig filteret 34. Koeffisienten beregnet av modulen 28 kan f.eks. være LPC-koeffisienter, som modellerer maskeringsterskelen. Forfilterkoeffisientene for hver blokk blir igjen kodet av koeffisientkoderen 30 som beskrevet under henvisning til fig. 4. Koeffisientdekoderen 34 dekoder de kodede forfilterkoeffisientene for å gjen-vinne forfilterkoeffisientene fra modulen 28 der forfilteret 34 igjen henter disse parametrene eller forfilterkoeffisientene og bruker disse, slik at det normaliserer inngangssignalet x(n) i samsvar med dens maskeringsterskel eller filtrerer disse med en overførmgsfunksjon som vesentlig tilsvarer inversen av maskeringsterskelen. Sammenlignet med inngangssignalet blir det resulterende forfiltrerte signal f(n) vesentlig mindre i størrelse.

I precliksjonskoeffisientberegningsmodulen 36 blir samplene f(n) av det forfiltrerte signal behandlet på en blokkvis måte, der den blokkvise deling kan f.eks. tilsvare audiosignalet 12 fra oppfatningsmodellmodulen 26 men behøver ikke å gjøre dette. For hver blokk av de forfiltrerte sampler beregner koeffisientberegningsmodulen 36 prediksjonskoeffisientene for bruk av prediksjonsfilteret 44. Følgelig utfører koeffisientberegningsmodulen 36 f.eks. LPC (LPC = lineær prediktiv koding)-analyse per blokk av det forfiltrerte signal for å oppnå prediksjonskoeffisientene. Koeffisientkoderen 38 koder deretter prediksjonskoeffisientene tilsvarende koeffisientkoderen 30 som beskrevet i detalj nedenfor og sender denne fremstilling av prediksjonskoeffisientene til bitstrømsgeneratoren 24 og især koeffisientkoderen 40, der sistnevnte bruker den hentede precliksjonskoeffisientfremstilling for å bruke disse oppnådd i LPC-analysen ved hjelp av koeffisientberegningsmodulen 36 til det lineære filteret 44, slik at den lukkede sløyfeprediktor som består av den lukkede sløyfe av filteret 44, forsinkelseselementet 46 og addereren 48 genererer det predikerte signal f(n) som igjen blir subtrahert fra det forfiltrerte signal f(n) ved hjelp av subtraktoren 42. Det lineære filter 44 er f.eks. et lineær prediksjonsfilter av typen A(z)= ^.z-1' av lengde N, der koeffisientkoderen 40 justerer verdiene a; avhengig av prediksjonskoeffisientene beregnet av koeffisientberegningsmodulen 36, dvs. vektingene ved hvilke de tidligere predikerte verdier f(n) pluss de dekvantiserte restsignalverdier blir vektet og deretter summert for å oppnå den nye eller gjeldende predikerte verdi f.

Prediksjonsresten r(n) frembrakt av subtraktoren 42 utsettes for ensartet kvantisering, dvs. kvantisering med ensartet kvantisermgstrinnstørrelse i kvantisereren 56, der trinnstørrelsen A(n) er tidsvariabel og blir beregnet eller bestemt av trinnstørrelsens adapsjonsmodul på en bakovertilpasset måte, dvs. fra de kvantiserte restverdier til de foregående restverdier r(m<n). Mer nøyaktig sender den ensartede kvantiserer 56 en kvantisert restverdi q(n) per restverdi r(n) som kan uttrykkes som q(n) = i(n) • A(n) og kan kalles et provisorisk kvantisermgstrinn med indeks. Den provisoriske kvantiseringsindeks i(n) blir igjen klippet av begrenseren 58 til størrelsen C = [-c;c] der c er en konstant c e {1,2,...}. Især blir begrenseren 58 implementert slik at alle provisoriske indeksverdier i(n) med I i(n) I >c enten blir satt til -c eller c avhengig av den som er nærmest. Bare den klippede eller begrensede indekssekvens eller serie ic(n) blir sendt av begrenseren 58 til bitstrømsgeneratoren 24, dekvantisereren 50 og trinnstørrelsesadapsjonsblokken 54 eller forsinkelseselementet 62 siden forsinkelseselementet 62 samt alle andre forsinkelseselementer i utførelsene forsinker de innkommende verdier med et sampel.

Nå blir den bakovertilpassede trinnstørrelsesstyring realisert via trinnstørrelses-adapsjonsblokken 54 ved at denne bruker tidligere indekssekvensverdier ic(n) forsinket av forsinkelseselementet 62 for konstant å tilpasse trinnstørrelsen A(n), slik at området begrenset av begrenseren 58, dvs. området satt av de "tillatte" kvantiseringsindekser eller tilsvarende kvantiseringsmvåer blir plassert slik til den statistiske probabilitet av forekomst av ikke-kvantiserte restverdier r(n) at de tillatte kvantiseringsmvåer oppstår så ensartet som mulig i den genererte, klippede kvantiseringsindekssekvensstrøm ic(n). Især beregner trinnstørrelsesadapsjonsmodulen 60 f.eks. gjeldende trinnstørrelse A(n) f.eks. ved å bruke de to umiddelbart foregående klippekvantiseringsindekser ic(n-l) og i2(n-2) samt den umiddelbart foregående bestemte trinnstørrelsesverdi A(n-1) til A(n) =

(3A(n-l) + 8(n), med p e[0,0; 1,0 [,8(n) = 80for I ic(n-l) + ic(n-2)l<<>I og 8(n) = ^ for |ic(n-l) + ic(n-2)| >I,der 80, 8i og I er passende justerte konstanter, samt (3.

Som nevnt i detalj nedenfor under henvisning til fig. 5, bruker dekoderen den oppnådde kvantiseringsindekssekvens ic(n) og trinnstørrelsessekvensen A(n) som også blir beregnet på en bakoveradaptiv måte for å rekonstruere den kvantiserte restverdisekvens qc(n) ved å beregne ic(n) • A(n) som også blir utført i koderen 10 på fig. 1, nemlig av dekvantisereren 50 i pre(liksjonsanor(lningen 20. Som på dekodersiden, blir restverdisekvensen qc(n) konstruert på denne måte utsatt for et tillegg med prediksjonsverdier f/ y(n) på en sampelvis måte, der tillegget utføres i koderen 10 via addereren 48. Mens det rekonstruerte eller dekvantiserte forfiltersignal oppnådd på denne måte ikke lenger blir brukt i koderen 10, unntatt for beregning av de etterfølgende predikerte verdier f/ y(n), genererer postfilteret den dekodede audiosampel-sekvens y(n) derfra på dekodersiden, hvilket utjevner normaliseringen fra forfilteret 34.

Kvantiseringsstøyen innført i kvantiseringsindekssekvensen qc(n) er ikke lenger hvit på grunn av klipping. Snarere kopierer dens spektrale form det forfiltrerte signals form. For å illustrere dette skal det henvises kort til fig. 3 som viser grafer a, b og c, PSD av det forfiltrerte signal (øvre graf) og PSD av kvantiseringsfeilen (henholdsvis nedre graf) for forskjellig antall kvantiseringsmvå eller trinn, nemlig for C = [-15;15] i graf a for et begrenset område på [-7;7] i graf b og et klippeområde [-1;1] i graf c. For tydelighets skyld skal det videre bemerkes at PSD-forløpet av feilen PSD i grafene A-C hver har blitt plottet med en forskyvning på -lOdB. Som det fremgår tilsvarer det forfiltrerte signal en farget støy med en effekt på a<2>= 34. Ved en kvantisering med en trinnstørrelse A = 1, ligger signalet innenfor [-21;21], dvs. at samplene av det forfiltrerte signal har en forekomstfordeling eller form av et histogram som ligger innenfor dette domenet. For grafene a-c på fig. 3, har kvantiseringsområdet blitt begrenset som nevnt til [-15;15] i a), [-7;7] i b) og [-1;1] i c). Kvantiseringsfeilen har blitt målt som forskjellen mellom det ikke-kvantiserte, forfiltrerte signal og det dekodede, forfiltrerte signal. Som det fremgår blir kvantiseringsstøyen lagt til det forfiltrerte signal ved å øke klippingen eller med en økt begrensning av antall kvantiseringsmvåer som kopierer PSD av det forfiltrerte signal, der graden av kopiering avhenger av hardheten eller omfanget av klippingen. Etter postfiltrering kopierer følgelig kvantiseringsstøyspektrumet på dekodersiden mer PSD av audio-inngangssignalet. Dette innebærer at kvantiseringsstøyen forblir under signalspekteret etter dekodingen. Denne effekt er vist på fig. 2 som viser grafen a, for tilfellet med bakoveradaptiv prediksjon, dvs. prediksjon ifølge ovennevnte sammenligning med ULD-systemet og i grafen b, for tilfellet med foroveradaptiv prediksjon med bruk av klipping ifølge fig. 1, tre forløp i et normalisert frekvensdomene, nemlig fra øverst til nederst, signalet PSD, dvs. PSD av audiosignalet, kvantiseringsfeilen PSD eller kvantiseringsstøyen etter dekoding (rett linje) og maskeringsterskelen (stiplet linje). Som det fremgår blir kvantiseringsstøyen for sammenlignings-ULD-koderen (fig. 2a) formet som maskeringsterskel og overskrider signalspektrumet i deler av signalet. Effekten av den forovertilpassede prediksjon av det forfiltrerte signal kombinert med etterfølgende klipping eller begrensning av kvantiseringsmvået vil nå tydelig fremgå som vist på fig. 2b hvor det er vist at kvantiseringsstøyen alltid er lavere enn signalspektrumet og dens form representerer en blanding av signalspektrumet og maskeringsterskelen. Under lytteprøver har det blitt funnet at kodingsproblemer ifølge fig. 2b er mindre tilfeldig, dvs. at den oppfattede lydkvalitet blir forbedret.

Ovennevnte beskrivelse av koderens virkemåte på fig. 1 er konsentrert og etterbehandling av det forfiltrerte signalet f(n) for å oppnå de klippede kvantiseringsindekser ic(n) for overføring til dekodersiden. Siden de oppstår fra en mengde med et konstant og begrenset antall indekser, kan hver av dem fremstilles med samme antall biter innenfor den kodede datastrøm ved utgangen 14. Følgelig bruker f.eks. bitstrømsindikatoren 24 f.eks. en injektiv tilordning av kvantiseringsindeksene til m bitord som kan fremstilles ved hjelp av et bestemt antall biter m.

Følgende beskrivelse behandler overføringen av forfilteret eller prediksjonskoeffisienter som beregnet av koeffisientberegningsmodulene 28 og 36 til dekodersiden, dvs. især i en utførelse for oppbygning av koeffisientkodere 30 og 38.

Som vist omfatter koeffisientkoderne ifølge utførelsen på fig. 4 en LSF-konverteringsmodul 102, en første subtraktor 104, en andre subtraktor 106, en ensartet kvantiserer 108 med en ensartet og justerbar kvantisermgstrinnstørrelse, en begrenser 110, en dekvantiserer 112, en tredje adderer 114, to forsinkelseselementer 116 og 118, et prediksjonsfilter 120 med faste filterkoeffisienter eller konstante filterkoeffisienter samt en trinnstørrelseadapsjonsmodul 122. Filterkoeffisientene som kodes kommer inn hvor en inngang 124 på en utgang 125 er tilveiebrakt for å sende ut den kodede fremstilling.

En inngang av LSF-konverteringsmodulen 102 følger direkte etter inngangen 124. Subtraktoren 104 med sin ikke-inverterende inngang og dens utgang er forbundet mellom utgangen av LSF-konverteringsmodulen 102 og en første inngang av subtraktoren 106, der en konstant lcblir tilført inngangen av subtraktoren 104. Subtraktoren 106 er koblet til sin ikke-inverterende inngang og dens utgang mellom den første subtraktor 104 og kvantisereren 108, der dens inverterende inngang er koblet til en utgang av prediksjonsfilteret 120. Sammen med forsinkelseselementet 118 og addereren 114, danner prediksjonsfilteret 120 en lukket prediktor som er koblet i serie i en sløyfe med en tilbakekobling, slik at forsinkelseselementet 118 blir koblet mellom utgangen av addereren 114 og inngangen av prediksjonsfilteret 120 og utgangen av prediksjonsfilteret 120 blir koblet til en første inngang av addereren 114. Reststrukturen tilsvarer igjen hovedsakelig anordningen 22 av koderen 10, dvs. kvantisereren 108 er koblet mellom utgangen av subtraktoren 106 og inngangen av begrenseren 110 hvis utgang igjen er koblet til utgangen 126, en inngang av forsinkelseselementet 116 og en inngang av dekvantisereren 112. Utgangen av forsinkelseselementet 116 er koblet til en inngang av trinnstørrelsesadapsjonsmodulen 122 som således sammen former en trinnstørrelsesadapsjonsblokk. En utgang av trinnstørrelsesadapsjonsmodulen 122 er koblet til trirmstørrelsesstyreinngangene av kvantisereren 108 og dekvantisereren 112. Utgangen fra dekvantisereren 112 er koblet til den andre inngang av addereren 114.

Etter at oppbygningen av koeffisientkoderen har blitt beskrevet ovenfor, vil dens virkemåte nå bli beskrevet nedenfor hvor det igjen henvises til fig. 1. Overføringen av både prefiltrene og prediksjonen eller prediktorkoeffisientene eller deres koding, blir utført ved å bruke et kodesystem med konstant bitrate som realiseres av strukturen ifølge fig. 4. Deretter blir filterkoeffisientene i LSF-konverteringsmodulen, dvs. forfilteret eller prediksjonskoeffisientene først konvertert til LSF-verdier l(n) eller overført til LSF-domenet. Hver spektrallinjefrekvens l(n) blir så behandlet av restelementene på fig. 4 som følger. Dette innebærer at den følgende beskrivelse bare ville angå den spektrale linjefrekvens der behandlingen naturligvis utføres for alle spektrale linjefrekvenser. F.eks. genererer modulen 102 LSF-verdier for hvert sett av forfilterkoeffisienter som representerer en maskeringsterskel eller en blokk av prediksjonskoeffisienter som predikerer eller forutsier det forfiltrerte signalet. Subtraktoren 104 subtraherer en konstant referanseverdi lcfra den beregnede verdi l(n), der et tilstrekkelig område for lcvarierer f.eks. fra 0 til ti. Fra den resulterende differanse la(n), subtraherer subtraktoren 106 en predikert verdi ld(n) som blir beregnett av den lukkede prediktor 120, 118 og 114 i prediksjonsfilteret 120, f.eks. et lineært filter, med faste koeffisienter A(z). Det som står igjen, dvs. restverdien, blir kvantisert av den adaptive trinnstørrelsekvantiserer 108, der kvantiseringsindekser fra kvantisereren 108 blir klippet av begrenseren 110 til et delsett av kvantiseringsindeksene mottatt av samme, f.eks. for alle klippede kvantiseringsindekser le(n), idet, etter hvert som de sendes av begrenseren 110 følgende gjelder: V : le(n) e {-1,0,1}. For kvantisermgstrinnstørrelsens tilpasning av A(n) av LSF-restkvantisereren 108, samvirker trinnstørrelsesadapsjonsmodulen 122 og forsinkelseselementet 116 f.eks. på måten som beskrevet i forbindelse med trinnstørrelsesadapsjonsblokken 54 under henvisning til fig. 1 men eventuelt med en forskjellig adapsjonsfunksjon eller med andre konstanter f3, I, 80, 5!og I. Mens kvantisereren 108 bruker gjeldende trinn-størrelse for kvantisering av gjeldende restverdi til le(n), bruker kvantisereren 112 trinnstørrelsen A^n) for dekvantisering av denne indeksverdi le(n) igjen og for å levere den resulterende rekonstruerte verdi for LSF-restverdien som har blitt sendt av subtraktoren 106 til addereren 114 som legger denne verdi til den tilsvarende predikerte verdi ld(n) og leverer samme via forsinkelseselementet 118 forsinket med et sampel til filteret 120 for å beregne den predikerte LSF-verdi ld(n) for den neste LSF-verdi la(n).

Hvis de to koeffisientkodere 30 og 38 blir implementert på måten som beskrevet i forbindelse med fig. 4, oppfyller koderen 10 på fig. 1 et konstant bitrate-forhold uten å bruke sløyfe. På grunn av den blokkvise forovertilpasning av LPC-koeffisientene og kodingssystemet, vil det ikke kreves tilbakestilling av prediktoren.

Før resultatene av lytteprøvene, som har blitt oppnådd av koderen ifølge fig. 1 og 4, vil bli omtalt nedenfor, vil oppbygningen av en dekoder ifølge en utførelse av oppfinnelsen bli beskrevet nedenfor som egner seg for dekoding av en kodet datastrøm fra denne koder, idet det henvises til fig. 5 og 6. Fig. 6 viser også oppbygningen av koeffisientkoderen på fig. 1.

Dekoderen som generelt er vist av 200 på fig. 5, omfatter en inngang 202 for å motta den kodede datastrøm, en utgang 204 for å sende den dekodede audiostrøm y(n) samt en dekvantisermgsanordning 206 med begrensede og konstante antall kvantiseringsmvåer, en precliksjonsanordning 208, en rekonstruksjonsanordning 210 samt en postfilteranordning 212. I tillegg er det tilveiebrakt en ekstraktor 214 som er koblet til inngangen 202 og implementert for å hente ut fra den innkommende kodede bitstrøm, det kvantiserte og klippede forfilterrestsignal ic(n), den kodede informasjon om forfilterkoeffisientene og den kodede informasjon om prediksjonskoeffisientene etter hvert som de genereres fra koeffisientkoderne 30 og 38 (fig. 1) og sende disse ved de respektive utganger. Dekvantisermgsanordningen 206 er koblet til ekstraktoren 214 for å hente kvantiseringsindeksene ic(n) fra samme og for å utføre dekvantisering av disse indeksene til et begrenset og konstant antall kvantiseringsnivåer, nemlig, som nevnt ovenfor, {-c • A(n); c • A(n)} for å oppnå et dekvantisert eller rekonstruert forfiltersignal qc(n). Precliksjonsanordningen 208 er koblet til ekstraktoren 214 for å hente et prediktert signal for det forfiltrerte signal, nemlig f/ yc (n) fra informasjonen om prediksjonskoeffisientene. Precliksjonsanordningen 208 er koblet til ekstraktoren 214 for å bestemme et predikert signal for det forfiltrerte signal, nemlig f/ y(n)fra informasjonen om prediksjonskoeffisienter, der pre(liksjonsanor(lningen 208 ifølge utførelsen på fig. 5, også er koblet til en utgang av rekonstruksjonsanordningen 210. Rekonstruksjonsanordningen 210 er tilveiebrakt for å rekonstruere det forfiltrerte signal basert på det predikerte signal f/ y(n) og de dekvantiserte restsignaler qc(n). Denne rekonstruksjon blir så brukt av den etterfølgende postfilteranorclning 212 for å filtrere det forfiltrerte signal basert på forfilterkoeffisientinformasjonen mottatt fra ekstraktoren 214, slik at normaliseringen i forbindelse med maskeringsterskelen blir utjevnet for å oppnå det dekodede audiosignal y(n).

Etter at den grunnleggende oppbygning av dekoderen på fig. 5 har blitt beskrevet ovenfor, vil nå oppbygningen av dekoderen 200 bli omtalt i mer detalj. Især omfatter dekvantisereren 206 en trinnstørrelsesadapsjonsblokk av et forsinkelseselement 216 og en trinnstørrelsesadapsjonsmodul 218 samt en ensartet dekvantiserer 220. Dekvantisereren 220 er koblet til utgangen av ekstraktoren 214 med sin datainngang for å hente kvantiseringsindekser ic(n). Videre er trinnstørrelsesadapsjonsmodulen 218 koblet til denne utgang av ekstraktoren 214 via forsinkelseselementet 216 hvis utgang igjen er koblet til en trirmstørrelsesstyreinngang av dekvantisereren 220. Utgangen av dekvantisereren 220 er koblet til en første inngang av addereren 222 som danner rekonstruksjonsanordningen 210. Precliksjonsanordningen 208 omfatter en koeffisientdekoder 224, et prediksjonsfilter 226 samt et forsinkelseselement 228. Koeffisientdekoderen 224, addereren 222, prediksjonsfilteret 226 og forsinkelseselementet 228 tilsvarer elementene 40, 44, 46 og 48 av koderen 10 ved deres virkemåte og deres tilkoblingsevne. Især er utgangen av prediksjonsfilteret 226 koblet til den andre inngang av addereren 222 hvis utgang igjen er ført tilbake til datainngangen av prediksjonsfilteret 226 via forsinkelseselementet 228 samt koblet til postfilter-anordningen 212. Koeffisientdekoderen 224 er koblet mellom en ytterligere utgang av ekstraktoren 214 og tilpasningsinngangen av prediksjonsfilteret 226. Postfilteranord-ningen omfatter en koeffisientdekoder 230 og et postfilter 232 der datainngangen av postfilteret 232 er koblet til utgangen av addereren 222 og en datautgang av postfilteret 232 er koblet til utgangen 204 mens adapterinngangen av postfilteret 232 er koblet til utgangen av koeffisientdekoderen 230 for å tilpasse postfilteret 232, hvis inngang igjen er koblet til ytterligere en utgang av ekstraktoren 214.

Som allerede nevnt henter ekstraktoren 214 kvantiseringsindekser ic(n) som representerer det kvantiserte prefilterrestsignal fra den kodede datastrøm ved inngangen 202. I den ensartede dekvantisereren 220, blir disse kvantiseringsindekser dekvantisert til de kvantiserte restverdier qc(n). Denne dekvantisering holdes innenfor de tillate kvantiseringsmvåer siden kvantiseringsindeksene ic(n) allerede har blitt klippet på kodersiden. Trinnstørrelsesadapsjonen utføres på en bakoveradaptiv måte på samme måte som i trinnstørrelsesadapsjonsblokken 54 av koderen på fig. 1. Uten overføringsfeil genererer dekvantisereren 220 samme verdier som dekvantisereren 50 av koderen på fig. 1. Følgelig oppnår elementene 222, 226, 228 og 224, basert på de kodede prediksjonskoeffisienter, samme resultat som oppnås i koderen 10 på fig. 1 ved utgangen av addereren 48, dvs. et dekvantisert eller rekonstruert prefiltersignal. Sistnevnte blir filtrert i postfilteret 232 med en overførmgsfunksjon tilsvarende maskeringsterskelen der postfilteret 232 blir justert adaptivt av koeffisientkoderen 230 som passende justerer postfilteret 230 eller dets filterkoeffisienter basert på prefilterkoeffisientinformasjonen.

Forutsatt at koderen 10 er forsynt med koeffisientkodere 30 og 38 som blir implementert som beskrevet på fig. 4, blir koeffisientdekoderen 224 og 230 av koderen 200, men også koeffisientkoderen 40 av koderen 10 strukturert som vist på fig. 6. Som det fremgår omfatter koeffisientkoderen to forsinkelseselementer 302, 304, en trinnstørrelsesadapsjonsmodul 306 som danner en trinnstørrelsesadapsjonsblokk sammen med forsinkelseselementet 302, en ensartet dekvantiserer 308 med en ensartet trinnstørrelse, et prediksjonsfilter 310, to adderere 312 og 314, en LSF-om-konverteringsmodul 316 samt en inngang 318 for å motta de kvantiserte LSF-restverdier le(n) med en konstant forskyvning -lcog en utgang 320 for å sende den rekonstruerte prediksjon eller prefilterkoeffisientene. Derved blir forsinkelseselementet 302 koblet mellom en inngang av trinnstørrelsesadapsjonsmodellen 306 og inngangen 318, idet en inngang av dekvantisereren 308 også er koblet til inngangen 318 og en trinnstørrelsesadapsjonsinngang av dekvantisereren 308 blir koblet til en utgang av trinnstørrelsesadapsjonsmodulen 306. Virkemåten og tilkoblingsevne av elementene 302, 306 og 308 tilsvarer 112, 116 og 122 på fig. 4. En prediktor med lukket sløyfe av forsinkelseselementet 304, prediksjonsfilteret 310 og addereren 312 som er koblet i en felles sløyfe ved å koble forsinkelseselementet 304 mellom en utgang av addereren 312 og en inngang av prediksjonsfilteret 310 og ved å koble en første inngang av addereren 312 til utgangen av dekvantisereren 308 og ved å koble en andre inngang av addereren 312 til en utgang av prediksjonsfilteret 310, blir koblet til en utgang av dekvantisereren 308. Elementene 304, 310 og 312 tilsvarer elementene 120, 118 og 114 på fig. 4 i deres virkemåte og tilkoblingsevne. I tillegg er utgangen av addereren 312 koblet til en første inngang av addereren 314, idet den andre inngang av denne får tilført den konstante verdi lc, der ifølge utførelsen konstanten lcer en avtalt størrelse som finnes både i koderen og dekoderen og således ikke må overføres som en del av sideinformasjonen selv om sistnevnte også kan være mulig. LSF-omkonverteringsmodulen 316 er koblet mellom en utgang av addereren 314 og utgangen 320.

LSF-restsignalindeksene le(n) som ankommer ved inngangen 318 blir devkantisert av dekvantisereren 308, der dekvantisereren 308 bruker bakoveradaptive trinnstørrelsesverdier A(n) som har blitt bestemt på en bakoveradaptiv måte av trinnstørrelsesadapsjonsmodulen 306 fra allerede dekvantiserte kvantiseringsindekser, nemlig de som har blitt forsinket av et sampel av forsinkelseselementet 302. Addereren 312 legger til det predikerte signal til de dekvantiserte LSF-restverdier som beregner kombinasjonen av forsinkelseselementet 304 og prediksjonsfilteret 210 fra summer som addereren 312 allerede har beregnet tidligere og som således representerer de rekonstruerte LSF-verdier som bare er forsynt med en konstant forskyvning av den konstante forskyvning lc. Sistnevnte blir korrigert av addereren 314 ved å legge til verdien lctil LSF-verdiene som addereren 312 sender ut. Ved utgangen av addereren 314, vil det oppstå de rekonstruerte LSF-verdier som blir konvertert av modulen 316 fra LSF-domenet tilbake til den rekonstruerte prediksjon eller prefilterkoeffisientene. Følgelig vurderer LSF-omkonverteringsmodulen 316 alle spektrale linjefrekvenser mens diskusjonen av de andre elementene på fig. 6 blir begrenset til beskrivelsen av en spektrallinjefrekvens. Imidlertid utfører elementene 302-314 ovennevnte mål også ved andre spektrahinjefrekvenser.

Etter å ha tilveiebrakt både koder- og dekoderutførelsen ovenfor, vil lytteprøveresultater bli presentert nedenfor basert på fig. 7 som har blitt oppnådd via et kodingssystem ifølge fig. 1, 4, 5 og 6.1 de utførte prøver har både en koder ifølge fig. 1, 4 og 6 og en koder ifølge det sammenlignbare ULD-kodesystem som omtalt i begynnelsen av beskrivelsen av figuren, blitt prøvet i en lytteprøve i samsvar med MUSHRA-standarden hvor moderatorer har blitt utelatt. MUSHRA-prøven har blitt utført på en bærbar datamaskin med en ekstern digital-til-analog konverter og STAX-forsterker/hodetelefoner i et stille kontormiljø. Gruppen av åtte prøvelyttere bestod av profesjonelle og ikke-profesjonelle lyttere. Før deltagerne begynte lytteprøven hadde de anledning til å lytte til et prøvesett. Prøvene har blitt utført med 12 monoaudiofiler av MPEG-prøvesettet der alle hadde en sampelfrekvens på 32 kHz, nemlig esOl (Suzanne Vega), es02 (mannlig tale), tysk), es03 (kvinnelig tale, engelsk), scOl (trompet), sc02 (orkester), sc03 (popmusikk), siOl (cembalo), si02 (kastanjetter), si03 (stemmefløyte), smOl (sekkepipe), sm02 (klokkespill), sm03 (klimprede strenger).

For det sammenlignede ULD-kodesystem, har en bakoveradaptiv prediksjon med en lengde på 64 blitt brukt ved implementeringen sammen med en bakoveradaptiv Golomb-koder for entropikoding med en konstant bitrate på 64 kBit/s. For implementering av koderen ifølge fig. 1, 4 og 6, har på den annen side en foroveradaptiv prediktor med en lengde på 12 blitt brukt, der antallet av forskjellige kvantiseringsmvåer har blitt begrenset til tre, nemlig slik at Vn : ic(n) e {-1,0,1}. Dette resulterte i, sammen med den kodede sideinformasjon, til en konstant bitrate på 64 kBit/s, hvilket innebærer samme bitrate.

Resultatene av MUSHRA-lytteprøvene er vist på fig. 7, der både gjennom-snittsverdiene og 95 % fortrolighetsintervall er vist for de tolv prøvestykkene individuelt og for det totale resultat for alle stykkene. Så lenge fortrolighetsintervallene overlapper vil det ikke være noen statistisk betydning i forskjell mellom kodemetodene.

Stykket esOl (Suzanne Vega) er et godt eksempel for kodesystemets overlegenhet ifølge fig. 1, 4, 5 og 6 ved lavere bitrater. De høyere delene av det kodede signalspektrum viser mindre hørbare forvrengninger sammenlignet med det sammenlignbare ULD-kodesystem. Dette fører til en vesentlig høyere vurdering av systemet ifølge fig. 1, 4, 5 og 6.

Signaltransientene av stykket sm02 (klokkespill) har et høyere bitratekrav for det sammenlignbare ULD-kodesystem. I den brukte 64 kBit/s, genererer det sammenlignbare ULD-kodesystem tilfeldige kodeforvrengninger over fullstendige samplings-blokker. På den annen side gir koderen som virker i samsvar med fig. 1, 4 og 6 en betydelig forbedret lyttekvalitet eller oppfatningskvalitet. Den totale vurdering som er vist i grafen på fig. 7 til høyre, av kodingssystemet formet i samsvar med fig. 1, 4 og 6 oppnådde en betydelig bedre rating enn det sammenlignbare ULD-kodesystem. Totalt fikk kodesystemet en total rating med "god lydkvalitet" under de gitte prøveforhold.

Oppsummert ut fra ovennevnte utførelser, oppstår et audiokodesystem med lav forsinkelse som bruker blokkvis foroveradaptiv prediksjon sammen med klipping/- begrensning i stedet for en bakoveradaptiv sampelvis prediksjon. Støyformingen skiller seg fra det sammenlignbare ULD-kodesystem. Lytteprøvene har vist at ovennevnte utførelse er overlegen i forhold til den bakoveradaptive fremgangsmåte ifølge det sammenlignbare ULD-kodesystem ved lavere bitrater. Følgelig er samme en kandidat for å lukke bitratemellomrommet mellom høykvalitetstalekodere og audiokodere med liten forsinkelse. Totalt gir ovennevnte utførelser en mulighet for audiokodesystemer med svært liten forsinkelse på 6-8 ms for reduserte bitrater som har følgende fordeler sammenlignet med den sammenlignbare ULD-koder. Samme er mer robust mot høye kvantiseringsfeil og har tilleggsstøyforrningsmuligheter og en bedre evne til å oppnå en konstant bitrate og viser en bedre feilgjenvinningsadferd. Problemet med hørbar kvantiseringsstøy ved posisjoner uten signal som i tilfellet i det sammenlignbare ULD-kodesystem, løses av utførelsen ved en modifisert måte å øke kvantiseringsstøyen over maskeringsterskelen og ved å legge til signalspektrumet til maskeringsterskelen i stedet for jevnt å øke maskeringsterskelen til en bestemt grad. På denne måte vil det ikke være noen hørbar kvantiseringsstøy ved posisjoner uten signal.

Med andre ord skiller ovennevnte utførelse seg fra det sammenlignbare ULD-kodesystem på følgende måte. I det sammenlignbare ULD-kodesystem, blir en bakoveradaptiv prediksjon brukt, hvilket innebærer at koeffisientene for prediksjonsfilteret A(z) blir oppdatert på en sampel-etter-sampel basis fra de tidligere kodede signalverdier. En kvantiserer med en variabel trinnstørrelse blir brukt, der trinn-størrelsen tilpasser alle 128 sampler ved å bruke informasjonen fra entropikodere og samme blir overført som sideinformasjon til dekodersiden. Med dette blir kvantisermgstrinnstørrelsen økt og legger mer hvit støy til det forhåndsfiltrerte signal og øker således jevnt maskeringsterskelen. Hvis den bakoveradaptive prediksjon erstattes av en foroveradaptiv blokkvis produksjon i det sammenlignbare ULD-kodesystem, hvilket innebærer at koeffisientene for prediksjonsfilteret A(z) blir beregnet en gang for 128 sampler fra de ikke-kvantiserte forfiltrerte sampler og er oppført som sideinformasjon, og hvis kvantisermgstrinnstørrelsen blir tilpasset for de 128 sampler ved å bruke informasjonen fra entropikoderen og overført som sideinformasjon til dekodersiden, vil kvantiseringstrinnstørrelsen fremdeles økes som i det sammenlignbare ULD-kodesystem, men prediktoroppdateringen blir upåvirket av kvantiseringen. Ovennevnte utførelser bruker bare en forovertilpasset, blokkvis prediksjon der i tillegg kvantisereren bare har et gitt antall 2N+1 av kvantisermgstrinn med en fast trinn-størrelse. For de forhåndsfiltrerte signaler x(n) med amplituder utenfor kvantiseringsområdet [-NA;NA] blir kvantiseringssignalet begrenset til [-NA;NA]. Dette fører til en kvantiseringsstøy med en PSD som ikke lenger er hvit men som kopierer PSD av inngangssignalet, dvs. det forhåndsfiltrerte audiosignal.

Som konklusjon skal følgende bemerkes om ovennevnte utførelser. Først skal det bemerkes at det finnes forskjellige muligheter for å overføre informasjon om fremstillingen av maskeringsterskelen ettersom denne blir oppnådd av den tenkte modellmodul 26 innenfor koderen til prefilteret 34 eller prediksjonsfilteret 44 og til dekoderen og der især til postfilteret 232 og prediksjonsfilteret 226. Især skal det bemerkes at det ikke er nødvendig at koeffisientdekoderne 32 og 40 i koderen mottar nøyaktig samme informasjon om maskeringsterskelen ettersom denne blir sendt ved utgangen 14 av koderen og mottatt ved utgangen 202 av dekoderen. Snarere blir det mulig, f.eks. i en oppbygning av koeffisientkoderen 30 ifølge fig. 4, at de oppnådde indekser le(n) samt forfilterrestsignalet kvantiseringsindekser ic(n) også oppstår bare fra en størrelse av tre verdier, nemlig -1, 0, 1 og at bitstrømsgeneratoren 24 tilordner disse indekser like godt til tilsvarende n bit ord. Ifølge en utførelse i samsvar med fig. 1, 4 eller 5, 6, blir forfilterkvantiseringsindeksene, precliksjonskoeffisientkvanitserings-indeksene og/eller for filterkvantiseringsindeksene som hver oppstår fra størrelsen -1, 0, 1, tilordnet i grupper på fem til et 8-bit ord som tilsvarer en tilordning av 3<5>muligheter til 2 bit ord. Siden tilordningen ikke er surjektiv, forblir flere 8-bit ord ubrukt og kan brukes på annen måte, f.eks. for synkronisering eller tilsvarende.

Ved denne anledning skal følgende bemerkes. Ovenfor har det blitt beskrevet i forbindelse med fig. 6, at oppbygningen av koeffisientdekoderne 32 og 230 er identiske. I dette tilfellet blir prefilteret 34 og postfilteret 232 implementert slik at når samme filterkoeffisienter har blitt tilført, får de en overføringsfunksjon som er invers i forhold til hverandre. Omvendt er det naturligvis også mulig at koeffisientkoderen 32 f.eks. utfører en tilleggskonvertering av filterkoeffisientene, slik at forfilteret får en overførmgsfunksjon som hovedsakelig tilsvarer inversen av maskeringsterskelen mens postfilteret har en overføringsfunksjon som hovedsakelig tilsvarer maskeringsterskelen.

I ovennevnte utførelser har det blitt forutsatt at maskeringsterskelen beregnes i modulen 26. Imidlertid skal det bemerkes at den beregnede terskel ikke behøver nøyaktig å tilsvare den psykoakustiske terskel men kan representere en mer eller mindre nøyaktig beregning av samme, hvilket ikke behøver å tilsvare alle psykoakustiske effekter, men bare noen av dem. Især kan terskelen representere en psykoakustisk motivert terskel som har blitt bevisst utsatt for en modifikasjon i motsetning til en estimering av den psykoakustiske maskeringsterskel.

Videre skal det bemerkes at den bakovertilpassede adapsjon av trinnstørrelsen ved kvantisering av prefilterrestsignalverdier ikke nødvendigvis behøver å være til stede. Snarere kan en fast trinnstørrelse i enkelte tilfeller være tilstrekkelig.

Videre skal det bemerkes at oppfinnelsen ikke er begrenset til audiokoding. Snarere kan signalet som skal kodes også være et signal som blir brukt for å stimulere en fingerspiss i en cyberromhanske, der oppfatningsmodellen 26 i dette tilfellet vurderer bestemte taktile egenskaper som den menneskelige berøring ikke lenger kan oppfatte. Et annet eksempel på et informasjonssignal for koding kan f.eks. være et videosignal. Især kan informasjonssignalet som skal kodes være en lys informasjon av et billedelement eller billedpunkt, der oppfatningsmodellen 26 også kan vurdere forskjellige tidsbestemte, lokale og frekvenspsykovisuelle dekningseffekter, dvs. en visuell maskeringsterskel.

I tillegg skal det bemerkes at kvantisereren 56 og begrenseren 58 eller kvantisereren 108 og begrenseren 110 ikke behøver å være separate komponenter snarere kan tilordningen av ikke-kvantiserte verdier til de kvantiserte/klippede verdier også utføres ved en enkelt tilordning. På den annen side kan kvantisereren 56 eller kvantisereren 108 også realiseres av en serieforbindelse av en splitter etterfulgt av en kvantiserer med en ensartet og konstant trinnstørrelse, der deleren kan bruke trinnstørrelsesverdien A(n) hentet fra den respektive trinnstørrelsesadapsjonsmodul som divisor mens restsignalet som kodes danner dividenden. Kvantisereren med konstant og ensartet trinnstørrelse kan tilveiebringes som en enkelt avnmdingsmodul som avrunder divisjonsresultatet til neste integer hvoretter begrenseren deretter kan begrense integeren som beskrevet ovenfor til en integer med tillatt størrelse C. I den respektive dekvantiserer, vil en ensartet dekvantisering ganske enkelt utføres med A(n) som multiplikator.

Videre skal det bemerkes at ovennevnte utførelser ble begrenset til anvendelser med konstant bitrate. Imidlertid er oppfinnelsen ikke begrenset til dette og således kvantisering ved klipping av f.eks. det prefiltrerte signal brukt i utførelsene bare være et mulig alternativ. I stedet for klipping kan en kvantiseringsfunksjon med en ikke-lineær karakteristikkurve brukes. For å illustrere dette henvises det til fig. 8a-8c. fig. 8a viser ovennevnte kvantiseringsfunksjon som fører til klipping i tre kvantisermgstrinn, dvs. en trinnfunksjon med tre trinn 402a, b, c som tilordner ikke-kvantiserte verdier (x-aksen) til kvantiseringsindekser (y-aksen), der kvantisermgstrinnhøyden eller kvantisermgstrinnstørrelsen A(n) også blir markert. Som det fremgår blir ikke-kvantiserte verdier som er høyere enn A(n)/2 klippet til det respektive neste trinn 402a eller c. Fig. 8b viser generelt en kvantiseringsfunksjon som fører til klipping til 2n+l kvantisermgstrinn. Kvantisermgstrinnstørrelsen A(n) blir igjen vist. Kvantiserings-funksjonene på fig. 8a og 8b representerer kvantisermgsfunksjoner der kvantiseringen mellom tersklene -A(n) og A(n) eller -NA(n) og NA(n) finner sted på en ensartet måte, dvs. med samme trinnhøyde, hvoretter kvantisermgstrinnfunksjonen fortsetter på en flat måte som tilsvarer klipping. Fig. 8c viser en ikke-lineær kvantiseringsfunksjon der kvantiseringsfunksjonen fremskrider over området mellom -NA(n) og NA(n) ikke helt flat, med en lavere helning, dvs. med en større trinnstørrelse eller trinnhøyde sammenlignet med det første området. Denne ikke-lineære kvantisering fører ikke til en konstant bitrate som tilfellet var i ovennevnte utførelser men genererer også ovennevnte deformering av kvantiseringsstøy, slik at samme justeres til signalet PSD. Som et tiltak skal det bemerkes under henvisning til fig. 8a-c, at i stedet for de ensartede kvantiseringsområder, kan en ikke-ensartet kvantisering brukes, der f.eks. trinnhøyden øker kontinuerlig, idet trinnhøydene kan være skalerbar via trinnhøydejusteringsverdien A(n) samtidig som deres gjensidige forhold opprettholdes. Derfor kan f.eks. den ikke-kvantiserte verdi tilordnes via en ikke-lineær funksjon til en mellomverdi i den respektive kvantiserer, der enten før eller etter multiplisering med A(n) blir utført og til slutt blir den resulterende verdi jevnt kvantisert. I den respektive dekvantiserer, kan det omvendte utføres, hvilket innebærer en ensartet dekvantisering via A(n) etterfulgt av en invers, ikke-lineær tUordning eller omvendt en første ikke-lineær konvertering etterfulgt av dekvantisering med A(n). Endelig skal det bemerkes at en kontinuerlig ensartet, dvs. lineær kvantisering ved å innhente ovennevnte effekt av deformeringen av feilen PSD også vil være mulig når trinnhøyden blir justert så høyt eller kvantiseringen så grov at denne kvantisering effektivt virker som en ikke-lineær kvantisering i forbindelse med signalstatistikken av signalet for kvantisering, slik at det forhåndsfiltrerte signal, der denne trinnhøydejustering igjen gjøres mulig av prediksjonens forovertilpasning.

Videre kan ovennevnte utførelser også varieres når det gjelder behandling av den kodede bitstrøm. Især kan bitstrømsgeneratoren og ekstraktoren 214 også utelates.

De forskjellige kvantiseringsindekser, nemlig restverdiene av de prefiltrerte signaler, restverdiene av prefilterkoeffisientene og restverdiene av prediksjonskoeffisientene også overføres parallelt med hverandre og oppbevares eller gjort tilgjengelig på annen måte for dekoding separat via de enkelte kanaler. På den annen side er ikke en konstant bitrate nødvendig siden disse dataene også kan være entropikodet.

Især kan ovennevnte funksjoner i blokkene på fig. 1, 4, 5 og 6 implementeres enkeltvis eller i kombinasjon av delprogramrutiner. Alternativt er en implementering av et nytt apparat i form av en integrert krets også mulig, der disse blokkene blir implementert f.eks. som individuelle kretsdeler av en ASIC.

Især skal det bemerkes at, avhengig av omstendighetene, at det nye system også kan implementeres i programvaren. Implementeringen kan utføres i et digitalt minne, især en disk eller en CD med elektronisk lesbare styresignaler som kan sam-virke med et programmerbart datasystem, slik at fremgangsmåten kan utføres. Generelt består oppfinnelsen således også av et dataprogramprodukt med en programkode lagret i en maskinlesbar bærer for å utføre den nye fremgangsmåte når datamaskinprogram-produktet kjøres på datamaskinen. Med andre ord kan oppfinnelsen også realiseres som et dataprogram med en programkode for å utføre fremgangsmåten når datamaskin-programmet kjøres på en datamaskin.

Claims

1 Apparat for koding av et informasjonssignal til et kodet informasjonssignalkarakterisert ved: o et middel (16) for å bestemme en fremstilling av en psykooppfatningsmotivert terskel som indikerer en del av informasjonssignalet likegyldig med hensyn til oppfatningsbarheten, ved å bruke en oppfatningsmodell, o et middel (18) for filtrering av informasjonssignalet for å normalisere informasjonssignalet med hensyn til psykooppfatningsmotivert terskel for å oppnå et prefiltrert signal, o et middel (20) for å predikere det prefiltrerte signal på en forover adaptiv måte for å oppnå et predikert signal, en prediksjonsfeil for det prefiltrerte signal og en fremstilling av prediksjonskoeffisienter basert på hvilke, det prefiltrerte signal kan rekonstrueres, og o et middel (22) for kvantisering av prediksjonsfeilen for å oppnå en kvantisert prediksjonsfeil, der det kodede informasjonssignal omfatter informasjon om fremstillingen av den psykooppfatningsmotiverte terskel, fremstillingen av prediksjonskoeffisientene og den kvantiserte prediksjonsfeil.

2 Apparat ifølge krav 1,karakterisert vedat middelet (22) for kvantisering implementeres for å kvantisere prediksjonsfeilen via en kvantisermgsfunksjon som tilordner ikke-kvantiserte verdier av prediksjonsfeilen til kvantiseringsindekser av kvantisermgstrinnene og hvis forløp under en terskel er brattere enn over en terskel.

3 Apparat ifølge krav 1 eller 2,karakterisert vedat middelet (22) for kvantisering implementeres for å oppnå en kvantisermgstrinnhøyde (A(n)) av lo^antiseringsfunksjonen på en bakover adaptiv måte fra kvantiserings-prediksjonsfeilen.

4 Apparat ifølge ett av de foregående krav,karakterisert vedat middelet (22) for kvantisering av prediksjonsfeilen implementeres slik at de ikke-kvantiserte verdier av prediksjonsfeilen blir kvantisert via klipping av kvantisermgsfunksjonen som tilordner de ikke-kvantiserte verdier av prediksjonsfeilen til kvantiseringsindekser av et konstant og begrenset første antall av kvantisermgstrinn for å oppnå kvantisert prediksjonsfeil.

5 Apparat ifølge krav 4,karakterisert vedat middelet (22) for kvantisering implementeres for å oppnå en kvantisermgstrinnnøyde A(n) av kvantiseringsfunksjonen for kvantisering av en verdi (r(n)) av prediksjonsfeilen på en bakover adaptiv måte av to tidligere kvantiseringsindekser ic(n-1) og ic(n-2) av den kvantiserte prediksjonsfeil ifølge A(n) = f3A(n-l) + 8(n), med P e[0,0; 1,0 ], 6(n) = 60for I ic(n-l) + i^n-2)!<<>I og 8(n) = 6!for I ic(n-l) + ic(n-2)l > I med konstante parametere 80, 6i, I, der A(n-1) representerer en kvantiserings-trinnhøyde oppnådd for kvantisering av en tidligere verdi av prediksjonsfeilen.

6 Apparat ifølge krav 4 eller 5,karakterisert vedat anordningen for kvantisering implementeres for å kvantisere prediksjonsfeilen på en ikke-lineær måte.

7 Apparat ifølge ett av kravene 4-6,karakterisert vedat det konstante og begrensede første antall er 3.

8 Apparat ifølge ett av de foregående krav,karakterisert vedat middelet (16) for å bestemme implementeres for å bestemme den psykooppfatningsmotiverte terskel på en blokkvis måte fra informasjonssignalet.

9 Apparat ifølge ett av de foregående krav,karakterisert vedat middelet (16) for å bestemme implementeres for å fremstille den psykooppfatningsmotiverte terskel i LSF-domenet.

10 Apparat ifølge ett av de foregående krav,karakterisert vedat middelet (16) for å bestemme implementeres for å bestemme den psykooppfatningsmotiverte terskel på en blokkvis måte og fremstille samme i filtrerte koeffisienter for å utsette filterkoeffisientene for en prediksjon og utsette filterkoeffisientrestsignalet fra prediksjonen til en kvantisering via ytterligere en kvantiseringsfunksjon som tilordner de ikke-kvantiserte verdier av filterkoeffisientrestsignalet til kvantiseringsindekser av kvantisermgstrinnene og hvis forløp under ytterligere en terskel er brattere enn over den ytterligere terskel for å oppnå et kvantisert filterkoeffisientrestsignal, der det kodede informasjonssignal også omfatter informasjon om det kvantiserte filterkoeffisientrestsignal.

11 Apparat ifølge krav 10,karakterisert vedat middelet (16) for å bestemme implementeres slik at de ikke-kvantiserte verdier av filterkoeffisientrestsignalet blir kvantisert via klipping av den ytterligere kvantiseringsfunksjon som tilordner de ikke-kvantiserte verdier av filterkoeffisientrest signalet til la^antiseringsindekser med et konstant og begrenset andre antall kvantisermgstrinn.

12 Apparat ifølge krav 11,karakterisert vedat middelet (16) for å bestemme implementeres slik at prediksjonen utføres på en bakover adaptiv måte basert på kvantiseringsindekser av det kvantiserte filterkoeffisientrestsignal.

13 Apparat ifølge ett av kravene 10-12,karakterisert vedat middelet (16) for å bestemme implementeres slik at prediksjonen av filterkoeffisientene utføres ved å bruke et prediksjonsfilter med konstante koeffisienter.

14 Apparat ifølge ett av kravene 9-13,karakterisert vedat middelet (16) for å bestemme ytterligere implementeres for å utsette filterkoeffisientene for fremstilling av den psykooppfatningsmotiverte terskel for en subtraksjon med en konstant verdi forut for samme utsettes for prediksjon.

15 Apparat ifølge ett av de foregående krav,karakterisert vedat middelet (20) for å predikere det prefiltrerte signal på en forover adaptiv måte videre omfatter: o et middel (36) for å bestemme prediksjonsfilterkoeffisientene fra det prefiltrerte signal og o et middel (44, 46, 48) for å predikere det prefiltrerte signal via et filter (44) regulert av prediksjonsfilterkoeffisientene.

16 Apparat ifølge krav 15,karakterisert vedat middelet (36) for å bestemme blir implementert for å bestemme prediksjonsfilterkoeffisienter på en blokkvis måte fra det prefiltrerte signal.

17 Apparat ifølge krav 15 eller 16,karakterisert vedat middelet (36) for å bestemme implementeres for å fremstille prediksjonsfilterkoeffisienter i LSF-domenet.

18 Apparat ifølge ett av kravene 15-17,karakterisert vedat middelet (36) for å bestemme blir implementert for å bestemme prediksjonsfilterkoeffisientene på en blokkvis måte for å utsette prediksjonsfilterkoeffisientene for en prediksjon og utsette et prediksjonsfilterkoeffisientrestsignal fra prediksjonen for kvantisering av en tredje kvantiseringsfunksjon som tilordner de ikke-kvantiserte verdier av precliksjonsfilterkoeffisientrestsignalet for kvantiseringsindekser av kvantisermgstrinnene og hvis forløp under en tredje terskel er brattere enn over den tredje terskel for å oppnå et kvantisert prediksjonsfilterkoeffisientrestsignal, der det kodede informasjonssignal også omfatter informasjon om det kvantiserte precliksjonsfilterkoeffisientrestsignal.

19 Apparat ifølge krav 18,karakterisert vedat middelet (36) for å bestemme blir implementert slik at de ikke-kvantiserte verdier av prediksjonsfilterkoeffisientrestsignalet blir kvantisert via klipping til kvantiseringsindekser av det tredje antall kvantisermgstrinn av den tredje kvantiseringsfunksjon som tilordner de ikke-kvantiserte verdier av prediksjonsfilterkoeffisientrestsignalet for å kvantisere indekser av et konstant og begrenset tredje antall kvantisermgstrinn.

20 Apparat ifølge krav 18,karakterisert vedat middelet (36) for å bestemme blir implementert slik at prediksjonen blir utført på en bakover adaptiv måte basert på kvantiseringsindekser av det kvantiserte prediksjonsfilterkoeffisientrestsignal for en eller flere tidligere blokker av det prefiltrerte signal.

21 Apparat ifølge ett av kravene 18-19,karakterisert vedat middelet (36) for å bestemme blir implementert slik at prediksjonen av prediksjonsfilterkoeffisientene utføres ved å bruke et prediksjonsfilter med konstante koeffisienter.

22 Apparat ifølge ett av kravene 18-21,karakterisert vedat middelet (36) for å bestemme videre implementeres for å utsette prediksjonsfilterkoeffisientene for en subtraksjon med en konstant verdi før samme utsettes for prediksjon.

23 Apparat ifølge ett av de foregående krav, som implementeres for å kode et audiosignal eller et videosignal som informasjonssignal,karakterisert vedat oppfatningsmodellen er psykoakustisk modell og den psykooppfatningsmotiverte terskel, en psykoakustisk motivert terskel eller oppfatningsmodellen er en psykovisuell modell og den psykooppfatningsmotiverte terskel er en psykovisuelt motivert terskel.

24 Apparat for dekoding av et kodet informasjonssignal omfattende informasjon om en fremstilling av en psykooppfatningsmotivert terskel, en fremstilling av prediksjonskoeffisienter og en kvantisert prediksjonsfeil til et dekodet informasjonssignal, karakteriseres ved: o et middel (206) for dekvantisering av den kvantiserte prediksjonsfeil for å oppnå en dekvantisert prediksjonsfeil, o et middel (208) for å bestemme et predikert signal basert på prediksjonskoeffisientene, som har blitt oppnådd ved fremover-adaptiv prediksjon; o et middel (210) for å rekonstruere et prefiltrert signal basert på det predikerte signal og den dekvantiserte prediksjonsfeil og o et middel (212) for filtrering av det prefiltrerte signal for å omkonvertere en normalisering i forbindelse med den psykooppfatningsmotiverte terskel for å oppnå det dekodede informasjonssignal.

25 Apparat ifølge krav 24,karakterisert vedat middelet (206) for dekvantisering blir implementert for å dekvantisere den kvantiserte prediksjonsfeil til et begrenset og konstant antall kvantisermgstrinn.

26 Apparat ifølge krav 25,karakterisert vedat middelet (206) for dekvantisering blir implementert for å oppnå en kvantiserings-trinnhøyde (A(n)) mellom kvantisermgstrinnene på en bakover adaptiv måte fra allerede dekvantiserte kvantiseringsindekser av den kvantiserte prediksjonsfeil.

27 Apparat ifølge krav 25 eller 26,karakterisert vedat middelet (260) for dekvantisering blir implementert for å oppnå en kvantisermgstrinnhøyde (A(n)) mellom kvantisermgstrinnene for dekvantisering av en kvantiseringsindeks av den kvantiserte prediksjonsfeil på en bakover adaptiv måte fra to tidligere kvantiseringsindekser ic(n-l) og ic(n-2) av den kvantiserte prediksjonsfeil i samsvar med A(n) = ØA(n-l) + 5(n) hvor Øe [0,0; 1,0 ], 6(n) = 60for I ic(n-l) + ic(n-2)| < I og 6(n) = 6i for I ic(n-l) + ic(n-2)| > I som har konstante parametere 8o, 5i, I, der A(n-1) representerer en kvantisermgstrinnhøyde oppnådd for dekvantisering ic(n-l).

28 Apparat ifølge ett av kravene 25-27,karakterisert vedat det konstante og begrensende antall er mindre eller lik 32.

29 Apparat ifølge ett av kravene 25-28,karakterisert vedat det konstante og begrensende antall er 3.

30 Apparat ifølge ett av kravene 24-29,karakterisert vedat middelet (212) for filtrering omfatter: o et middel (230) for å bestemme oppfatningsterskelfilterkoeffisienter fra informasjonen om fremstillingen av den psykooppfatningsmotiverte terskel på en blokkvis måte for blokker av en sekvens av blokker av det prefiltrerte signal og o et postfilter (232) for filtrering av det prefiltrerte signal ved å bruke oppfatnings-terskelfilterkoeffisientene.

31 Apparat ifølge ett av kravene 24-30,karakterisert vedat middelet (230) for å bestemme blir implementert for å oppnå oppfatningsterskelfilter-koeffisientene ved omkonvertering fra et LSF-domene.

32 Apparat ifølge ett av kravene 24-31,karakterisert vedat middelet (230) for å bestemme er implementert for å tilveiebringe kvantiseringsindekser av en kvantisert filterkoeffisients restsignal fra fremstillingen av den psykooppfatningsmotiverte terskel for å dekvantisere samme til et begrenset og konstant andre antall kvantiseirngsmvåer for å oppnå en dekvantisert filterkoeffisientrestsignal for å predikere filterkoeffisientene som fremstiller den psykooppfatningsmotiverte terskel og legge til samme til den dekvantiserte filterkoeffisients restsignal og konvertere den rekonstruerte filterkoeffisients restsignal som oppstår ved å legge til omkonverteringen til oppfatning sterskelfilterkoeffisientene.

33 Apparat ifølge krav 32,karakterisert vedat middelet (230) for å bestemme blir implementert slik at prediksjonen utføres på en bakover adaptiv måte basert på allerede predikerte filterkoeffisienter som representerer psykooppfatningsmotiverte terskler.

34 Apparat ifølge krav 32 eller 33,karakterisert vedat middelet (230) for å bestemme blir implementert slik at prediksjonen av filterkoeffisientene som representerer den psykooppfatningsmotiverte terskel blir utført ved å bruke et prediksjonsfilter med konstante koeffisienter.

35 Apparat ifølge ett av kravene 32-34,karakterisert vedat middelet (230) for å bestemme videre blir implementert for å utsette den rekonstruerte filterkoeffisients restsignal som oppstår fra addisjonen for en addisjon med en konstant verdi før omkonverteringen.

36 Apparat ifølge ett av kravene 24-37,karakterisert vedat middelet (208) for å bestemme et predikert signal videre omfatter: o et middel (224) for å bestemme prediksjonsfilterkoeffisienter fra fremstillingen av prediksjonskoeffisienter omfattet i det kodede informasjonssignal og o et middel (226, 228) for å predikere det prefiltrerte signal via et filter (226) regulert av prediksjonsfilterkoeffisienter.

37 Apparat ifølge krav 36,karakterisert vedat middelet (224) for å bestemme prediksjonsfilterkoeffisienter blir implementert for å bestemme samme på en blokkvis måte for blokker av en sekvens av blokker av det prefiltrerte signal.

38 Apparat ifølge ett av kravene 36 eller 37,karakterisert vedat middelet (224) for å bestemme blir implementert for å tilveiebringe prediksjonsfilterkoeffisienter ved omkonvertering fra et LSF-domene.

39 Apparat ifølge ett av kravene 36-38,karakterisert vedat middelet (224) for å bestemme blir implementert for å tilveiebringe kvantiserte indekser av en kvantisert prediksjonskoeffisients restsignal fra fremstillingen av prediksjonskoeffisienter for å dekvantisere samme til et begrenset og konstant tredje antall kvantiseringsmvåer for å oppnå en dekvantisert prediksjonskoeffisients restsignal for å predikere prediksjonsfilterkoeffisienter og legge til samme til den dekvantiserte prediksjonskoeffisients restsignal og konvertere en rekonstruert prediksjonskoeffisients restsignal som oppstår fra addisjonen ved å omkonvertere til prediksjonsfilterkoeffisienter.

40 Apparat ifølge krav 39,karakterisert vedat middelet (224) for å bestemme blir implementert slik at prediksjonen utføres på en bakover adaptiv måte basert på de allerede predikerte prediksjonskoeffisienter.

41 Apparat ifølge krav 39 eller 40,karakterisert vedat middelet (224) for å bestemme blir implementert slik at prediksjonen av prediksjonskoeffisienter blir utført ved å bruke et prediksjonsfilter med konstante koeffisienter.

42 Apparat ifølge ett av kravene 39-41,karakterisert vedat middelet (224) for å bestemme videre blir implementert for å utsette den rekonstruerte prediksjonskoeffisients restsignal som oppstår fra addisjonen, for en addisjon med en konstant verdi før omkonverteringen.

43 Apparat ifølge ett av kravene 24-42, som blir implementert for å dekode et audiosignal eller et videosignal som et informasjonssignal og der den psykooppfatningsmotiverte terskel er en akustisk maskeringsterskel eller en visuell maskeringsterskel.

44 Fremgangsmåte for koding av et informasjonssignal til et kodet informasjonssignal,karakterisert ved: o å bruke en oppfatningsmodell, bestemme en fremstilling av den psykooppfatningsmotiverte terskel som indikerer en del av informasjonssignalet likegyldig med hensyn til oppfatningsbarheten, o å filtrere informasjonssignalet for å normalisere informasjonssignalet med henblikk på den psykooppfatningsmotiverte terskel for å oppnå et prefiltrert signal, o å predikere det prefiltrerte signal på en forover adaptiv måte for å tilveiebringe et prefiltrert signal, en prediksjonsfeil til det prefiltrerte signal og en fremstilling av prediksjonskoeffisienter basert på hvilket det prefiltrerte signal kan rekonstrueres og o å kvantisere prediksjonsfeilen for å tilveiebringe en kvantisert prediksjonsfeil, der det kodede informasjonssignal omfatter informasjon om fremstilling av den psykooppfatningsmotiverte terskel, fremstillingen av prediksjonskoeffisienter og kvantiserte prediksjonsfeil.

45 Fremgangsmåte for dekoding av et kodet informasjonssignal som omfatter informasjon om fremstillingen av en psykooppfatningsmotivert terskel, en fremstilling av prediksjonskoeffisienter og en kvantisert prediksjonsfeil til et kodet informasjonssignal,karakterisert ved: o å dekvantisere den kvantiserte prediksjonsfeil for å tilveiebringe en kvantisert prediksjonsfeil; o å bestemme et predikert signal basert på prediksjonskoeffisientene, som har blitt oppnådd ved fremover-adaptiv prediksjon; o å rekonstruere et prefiltrert signal basert på det predikerte signal og den dekvantiserte prediksjonsfeil og o å filtrere det prefiltrerte signal for å konvertere en normalisering med henblikk på den psykooppfatningsmotiverte terskel for å tilveiebringe det dekodede informasjonssignal.

46 Dataprogram med en programkode for å utføre fremgangsmåten ifølge krav 44 eller 44 når dataprogrammet kjøres på en datamaskin.