NO338725B1 - Generering av et flerkanals utgangssignal - Google Patents

Generering av et flerkanals utgangssignal Download PDF

Info

Publication number
NO338725B1
NO338725B1 NO20070034A NO20070034A NO338725B1 NO 338725 B1 NO338725 B1 NO 338725B1 NO 20070034 A NO20070034 A NO 20070034A NO 20070034 A NO20070034 A NO 20070034A NO 338725 B1 NO338725 B1 NO 338725B1
Authority
NO
Norway
Prior art keywords
channel
input
channels
transmission
cancellation
Prior art date
Application number
NO20070034A
Other languages
English (en)
Other versions
NO20070034L (no
Inventor
Jürgen Herre
Johannes Hilpert
Christof Faller
Sascha Disch
Original Assignee
Fraunhofer Ges Forschung
Agere Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34966842&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=NO338725(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung, Agere Systems Inc filed Critical Fraunhofer Ges Forschung
Publication of NO20070034L publication Critical patent/NO20070034L/no
Publication of NO338725B1 publication Critical patent/NO338725B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Logic Circuits (AREA)

Description

Fagfelt
Oppfinnelsen angår flerkanals dekoding og især flerkanals dekoding hvor det fins minst to overføringskanaler, dvs. som er stereokompatible.
Bakgrunn
I senere tid har flerkanals lydgjengivelse blitt stadig mer vanlig. Dette på grunn av at lydkomprimering/koding som f.eks. den kjente mp3-teknikk har gjort mulig å distribuere lydinnspillinger via internett eller andre overføringskanaler med en begrenset båndbredde. mp3-kodingsteknikken har blitt så kjent på grunn av at den gjør det mulig å distribuere alle innspillingene i et stereoformat, dvs. en digital gjengivelse av lydinnspillingen i en første eller venstre stereokanal og en andre eller høyre stereokanal.
Uansett fins det grunnleggende ulemper med de vanlige tokanals lyd-systemene. Av denne grunn har surround eller omgivelsesteknikken blitt utviklet. En anbefalt, flerkanals surroundgjengivelse omfatter, i tillegg til de to stereokanaler L og R, en midtre kanal C og to surround-kanaler Ls, Rs. Dette referanselydformatet kalles også tre/to-stereo som innebærer tre frontkanaler og to surroundkanaler. Generelt kreves fem overføringskanaler. I et avspillingsmiljø trengs det minst fem høytalere på fem forskjellige steder for å oppnå et optimalt lytteområde i en bestemt avstand fra de fem omhyggelig utplasserte høytalere.
Flere teknikker er kjent for å redusere mengden av data som kreves for over-føring av et flerkanals audiosignal. Slike teknikker kalles felles stereoteknikker. I denne forbindelse henvises det til fig. 10 som viser en felles stereoinnretning 60. Denne innretning kan være en innretning som feks. implementerer intensiv stereokoding (IS) eller binaural cue coding (BCC). En slik innretning mottar generelt, som et inngangssignal, minst de to kanalene (CH1, CH2, ... CHn), og sender en enkelt bærerkanal og parametriske data. De parametriske data defineres slik at en approksimasjon av en opprinnelig kanal (CH1, CH2,... CHn), i en dekoder, kan beregnes.
Normalt vil bærerkanalen omfatte delbåndsampler, spektralkoeffisienter, tids-domenesampler osv. som leverer en relativt fin gjengivelse av det underliggende signal mens de parametriske data ikke har slike sampler av spektralkoeffisienter, men omfatter styreparametere for å regulere en bestemt rekonstruksjonsalgoritme, feks. vekting ved multiplisering, tidsforskyvning, frekvensforskyvning osv. De parametriske data omfatter følgelig bare en relativ grov gjengivelse av signalet eller den tilhørende kanal. Mengden av data som kreves av en bærerkanal vil være i størrelsesorden 60-70 kbit/s mens mengden av data som kreves av den parametriske sideinformasjon for en kanal vil være i området 1,5-2,5 kbit/s. Et eksempel på parametriske data er de velkjente skaleringsfaktorer, mtensitetsstereoinformasjon eller binaural cue-parametere som beskrevet nedenfor.
Intensitetsstereokoding er beskrevet i AES-utkastet 3799, "Intensity Stereo Coding", J. Herre, K. H. Brandenburg, D. Lederer, februar 1994, Amsterdam. Generelt blir konseptet med intensitetsstereo basert på en hovedaksetransformering som tilføres dataene i begge stereokanalene. Hvis de fleste datapunktene blir konsentrert rundt den første hovedakse, kan kodingsgevinsten oppnås ved å dreie begge signalene i en viss vinkel før koding. Det vil imidlertid ikke alltid være tilfellet for virkelig stereofonisk produksjonsteknikk. Følgelig blir denne teknikk modifisert ved å utelukke den andre ortogonale komponent fra overføringen i bitstrømmen. Således består de rekonstruerte signaler for venstre og høyre kanal av forskjellige vektede eller skalerte versjoner av det samme overførte signal. Uansett skiller de rekonstruerte signaler seg ved deres amplitude, men er identiske når det gjelder deres faseinformasjon. Energitidsenve-lopene av begge de opprinnelige lydkanalene blir imidlertid opprettholdt ved hjelp av den selektive skaleringsoperasjon som typisk virker på en frekvensselektiv måte. Dette samsvarer med ørets oppfattelse av lyd ved høye frekvenser hvor de dominerende romspatialfrekvenser bestemmes av energienvelopene.
I praksis blir i tillegg det overførte signal, dvs. bærerkanalen generert fra sumsignalet av venstre og høyre kanal i stedet for å dreie begge komponenter. Videre blir denne behandling, dvs. generering av intensitetsstereoparametere for å utføre skaleringen, utført frekvensselektivt, dvs. uavhengig for hvert skaleringsfaktorbånd, dvs. koderfrekvenspartisjonen. Fortrinnsvis blir begge kanaler kombinert til en kombinert eller "bærer"-kanal og i tillegg til den kombinerte kanal blir intensitets-stereoinformasjonen bestemt avhengig av energien av den første kanal, energien av den andre kanal eller energien av den kombinerte eller bærerkanalen.
BCC-teknikken er beskrevet i AES-dokumentet 5574, "Binaural cue coding applied to stereo and multichannel audio compression", C. Faller, F. Baumgarte, mai 2002, Munchen. Ved BCC-koding blir et antall audioinngangskanaler konvertert til en spektralgjengivelse ved å bruke en DFT-basert omvandling med overlappende vinduer. Det resulterende, ensartede spektrum blir delt i ikke-overlappende partisjoner som hver har en indeks. Hver partisjon har en båndbredde som er proporsjonal med den ekvivalente, rektangulære båndbredde (ERB). Interkanalnivåforskjellene (ICLD) og interkanaltidsforskjellene (ICDT) blir estimert for hver partisjon av hver signalpulje k. ICLD og ICTD blir kvantisert og kodet til en BCC-bitstrøm. Interkanalnivåforskjellene og interkanaltidsforskjellene blir gitt for hver kanal i forhold til en referansekanal. Deretter blir parametrene beregnet i samsvar med foreskrevne formler som avhenger av de bestemte partisjoner av signalet som skal behandles.
På en dekoderside mottar dekoderen et monosignal og B CC-bitstrømmen. Monosignalet blir overført til frekvensdomenet og sendt til en spatial synteseblokk som også mottar dekodede ICLD- og ICTD-verdier. I spatialsynteseblokken blir BCC-parametrene (ICLD og ICTD)-verdiene brukt for å utføre en vektingsoperasjon av monosignalet for å syntesere flerkanalssignalene som etter en frekvens/tids-konvergering gjengir en rekonstruksjon av det opprinnelige flerkanals audiosignalet.
Når det gjelder BCC kan den samlede stereomodul 60 sende signalside-informasjon, slik at parameterkanaldataene blir kvantisert og kodet til ICLD- eller ICTD-parametere hvor en av de opprinnelige kanaler blir brukt som referansekanal for koding av kanalsideinformasjonen.
Normalt formes bærerkanalen av summen av de aktuelle, opprinnelige kanaler.
Naturligvis vil ovennevnte teknikker bare gi en monogjengivelse for en dekoder som bare kan behandle bærerkanalen, men som ikke kan behandle parametriske data for å generere en eller flere approksimasjoner av mer enn en inngangskanal.
Audiokodeteknikken som er kjent som binaural cue coding (BCC) er også beskrevet i US patentskrift 2003, 0219130 Al, 2003/0026441 Al og 2003/0035553 Al. I tillegg refereres det også til "Binaural Cue Coding. Part II: Schemes and Applications", C. Faller og F. Baumgarte, IEEE Trans. On Audio and Speech Proe, Vol. 11, No. 6, Nov. 2993. Det henvises til ovennevnte publikasjoner i sin helhet.
I det følgende blir et typisk generisk BCC-opplegg for flerkanal audiokoding beskrevet i detalj under henvisning til fig. 11-13. Fig. 11 viser et slikt generisk binaural cue coding-arrangement for koding/overføring av flerkanals audiosignaler. Flerkanals audioinngangssignalet ved en inngang 110 av en BCC-koder 112 blir blandet ned i en nedblandingsboks 114. I eksempelet er det opprinnelige flerkanals signal ved inngangen 110 et 5-kanals surround-signal med en fremre, venstre kanal, en fremre, høyre kanal, en venstre, surround-kanal, en høyre surround-kanal og en midtkanal. F.eks. produserer nedblandingsblokken 114 et sumsignal av en enkelt tilføyelse av disse fem kanalene til et monosignal. Andre nedblandingsarrangementer er kjent, feks. ved å bruke et flerkanals inngangssignal, et nedblandingssignal med en enkelt kanal. Denne ene kanal blir sendt på en sumsignalledning 115. En sideinformasjon oppnådd ved en BCC-analyseblokk 116 blir sendt på sideinformasjonsledningen 117. I BCC-analyseblokken, blir interkanalnivåforskjellene (ICLD) og interkanaltidsforskjellene (ICTD) beregnet som skissert ovenfor. Nylig har BCC-analyseblokken 116 blitt forbedret til også å beregne interkanalkorreleringsverdier (ICC-verdier). Sumsignalet og sideinformasjonen blir overført, fortrinnsvis i en kvantisert og kodet form, til en BCC-dekoder 120. BCC-dekoderen nedbryter det overførte sumsignal til et antall delbånd og bruker skalering, forsinkelse og andre behandlinger for å generere delbånd av de sendte flerkanals audiosignaler. Denne behandling utføres slik at parametrene (frekvensene) av et rekonstruert flerkanals signal ved en utgang 121 blir lik de respektive parametere for det opprinnelige flerkanals signal ved inngangen 110 til BCC-koderen 112. For dette formål omfatter BCC-dekoderen 120 en BCC-synteseblokk 122 og en sideinformasjonsbehandlingsblokk 123.
I det følgende blir den innvendige konstruksjon av BCC-synteseblokken 122 forklart under henvisning til fig. 12. Sumsignalet på ledningen 115 blir sendt til en tids/frekvenskonverteringsenhet eller filterblokk FB 125. Ved utgangen av blokken 125 fins det et antall N av delbåndsignaler eller i et utrert tilfelle, en blokk av spektralkoeffisienter når audiofilterblokken 125 utfører en 1:1-omvandling, dvs. en omvandling som produserer N-spektralkoeffisienter fra N-tidsdomene sampler.
BCC-synteseblokken 122 omfatter videre et forsinkelsestrinn 126, et nivåmodifikasjonstrinn 127, et korrelermgsbehandlingstrinn 128 og et omvendt filterblokktrinn IFB 129. Ved utgangen av trinnet 129 kan det rekonstruerte flerkanals audiosignal med feks. fem kanaler i et 5-kanals surround-system sendes til et sett av høytalere 124 som vist på fig. 11.
Som vist på fig. 12 blir inngangssignalet s(n) konvertert til frekvensdomene eller filterblokkdomenet ved hjelp av elementet 125. Signalet fra elementet 125 blir multiplisert slik at flere versjoner av samme signal oppnås som vist av multiplikasjonsnoden 130. Antallet versjoner av det opprinnelige signal er likt antallet utgangssignaler i utgangssignalet som skal rekonstrueres. Når hver versjon av det opprinnelige signal ved noden 130 blir utsatt for en bestemt forsinkelse di, d2, ..., cL, ..., dN, blir forsinkelsesparametrene beregnet av sideinformasjonsbehandlingsblokken 123 på fig. 11 og blir avledet fra interkanalstidsforskjellene som bestemt av BCC-analyseblokken 116.
Som er tilfellet for multiplikasjonsparametrene ai, a2,ai,aN som også blir beregnet av sideinformasjonsbehandlingsblokken 123 basert på interkanals nivåforskjellene som beregnet av BCC-analyseblokken 116. ICC-parametrene beregnet av BCC-analyseblokken 116 blir brukt for å regulere funksjonaliteten av blokken 128 slik at enkelte korreleringer mellom de forsinkede og nivåmanipulerte signaler oppnås ved utgangene av blokken 128. Det skal også bemerkes at rekkefølgen mellom trinnene 126, 127, 128 kan være forskjellig fra det som er vist på fig. 12.
Det skal bemerkes at når det gjelder puljevis behandling av et audiosignal, blir BCC-analysen utført på samme måte, dvs. tidsvarierende og også frekvensvarierende. Dette innebærer at BCC-paremetrene blir oppnådd for hvert spektralbånd. Dette innebærer at audiofilterblokken 125 nedbryter inngangssignalet til feks. 32 bånd pass signaler og at BCC-analyseblokken oppnår et sett av BCC-parametere for hvert av de 32 bånd. Naturligvis utfører BCC-synteseblokken 122 på fig. 11, som er vist i detalj på fig. 12, en gjengivelse som også er basert på de 32 båndene i eksempelet.
I det følgende henvises til fig. 13 som viser et oppsett for å bestemme enkelte BCC-parametere. Normalt kan ICLD-, ICTD- og ICC-parametere defineres mellom kanalparene. Imidlertid er det foretrukket å bestemme ICLD- og ICTD-parametre mellom en referansekanal og hver av de andre kanalene. Dette er vist på fig. 13A. ICC-parametrene kan defineres på forskjellige måter. Generelt vil man kunne estimere ICC-parametere i koderen mellom alle mulige kanalpar som vist på fig. 13B. I dette tilfellet vil en dekoder syntesere ICC, slik at det vil bli omtrent likt det opprinnelige flerkanals signal mellom alle mulige kanalpar. Det blir imidlertid foreslått å bare beregne ICC-parametere mellom de sterkeste to kanaler hver gang. Dette arrangement er vist på fig. 13C som et eksempel hvor en ICC-parameter ved hvert tilfelle, blir estimert mellom kanalene 1 og 2 og hvor en annen ICC-parameter, på et annet tidspunkt blir beregnet mellom kanalene 1 og 5. Dekoderen synteserer deretter interkanalkorreleringen mellom de sterkeste kanalene i dekoderen og bruker en heuristisk regel for å beregne og syntesere interkanalsammenhengen for de gjenværende kanalpar.
Når det gjelder beregning av feks. flerkanals parametere ai, au, basert på overførte ICLD-parametere, henvises det til AES-dokumentet 5574, nevnt ovenfor. ICLD-parametrene representerer en energifordeling i et opprinnelig flerkanals signal. Uten tap av generalitet fins det, som vist på fig. 13A fire ICLD-parametere som viser energiforskjellen mellom alle andre kanaler og den fremre, venstre kanal. I sideinformasjonsbehandlingsblokken 123, blir multiplikasjonsparametere ai, ..., aN avledet fra ICLD-parametrene, slik at den totale energi av alle rekonstruerte utgangssignaler er den samme som (eller proporsjonal med) energien av det overførte sumsignal. En enkel måte for å bestemme disse parametrene på er en 2-trinns prosess hvor multiplikasjonsfaktoren for den venstre, fremre kanal, i et første trinn, blir satt til en, mens multiplikasjonsf aktorene for de andre kanalene på fig. 13A blir satt til de overførte ICLD-verdier. Deretter blir energien av alle fem kanaler i et andre trinn, beregnet og sammenlignet med energien av det overførte sumsignal. Deretter blir alle kanalene nedskalert ved å bruke en nedskaleringsfaktor som er lik for alle kanaler, idet nedskaleringsfaktoren velges slik at den totale energi av alle rekonstruerte utgangssignaler, etter nedskaleringen, blir lik den totale energi av det overførte sumsignal.
Naturligvis fins det andre fremgangsmåter for å beregne multiplikasjonsfaktorene som ikke bruker 2-trinns prosessen, men som bare trenger en prosess i ett trinn.
Når det gjelder forsinkelsesparametrene skal det bemerkes at forsinkelsesparametrene ICTD som blir overført fra en BCC-koder kan brukes direkte når forsinkelsesparameteren di for den venstre, fremre kanal blir satt til null. Ingen reskalering må utføres her siden en forsinkelse ikke endrer signalets energi.
Når det gjelder sammenhengsmålet ICC mellom kanalene, overført fra BCC-koderen til BCC-dekoderen, skal det bemerkes at en sammenhengsmanipulering kan utføres ved å modifisere multiplikasjonsfaktorene ai, ..., aN feks. ved å multiplisere vektingsfaktorene av alle delbåndene med vilkårlige tall med et område på [20log 10(-6) og 20log 10(6)]. Kvasivilkårlighetssekvensen blir fortrinnsvis valgt slik at variansen blir omtrent konstant for alle kritiske bånd og gjennomsnittet er null innenfor hvert kritisk bånd. Samme sekvens brukes for spektralkoeffisientene for hver forskjellig signalpulje. Således reguleres lydbildebredden ved å modifisere variansen av kvasivilkårlighetssekvensen. En større varians krever en større billedbredde. Variansmodi-fikasjonen kan utføres i de enkelte bånd som har en kritisk båndbredde. Dette gjør det mulig å oppnå en samtidig tilstedeværelse av flere objekter i en lydscene som har forskjellig billedbredde. En passende amplitudefordeling av en kvasivilkårlighetssekvensen er en ensartet distribusjon på en logaritmisk skala som skissert i US patentskrift 2003/0219130 Al. Uansett er all BCC-syntesebehandling knyttet til en enkelt inngangskanal overført som sumsignalet fra BCC-koderen til BCC-dekoderen som vist på fig. 11.
For å overføre de fem kanalene på en kompatibel måte, dvs. i et bitstrømsformat som også kan forstås av en normal stereodekoder, må den såkalte matriseteknikk brukes som beskrevet i "MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3", G. Theile og G. Stoll, AES dokument 3403, oktober 1992, San Francisco. De fem inngangskanaler L, R, C, Ls og Rs blir matet til en matriseinnretning som utfører en matriseoperasjon for å beregne grunn- eller kompatible stereokanaler Lo, Ro fra de fem inngangskanaler. Især blir disse grunnstereokanaler Lo/Ro beregnet som nevnt nedenfor:
hvor x og y er konstanter. De andre tre kanalene C, Ls, Rs blir overført som de er i et forlengelseslag, i tillegg til grunnstereolaget som omfatter en kodet versjon av grunnstereosignalene Lo/Ro. Når det gjelder bitstrøm, omfatter dette Lo/Ro-grunnstereolaget en tittelinformasjon, feks. skaleringsfaktorer og delbåndssampler. Flerkanalsforlengelseslaget, dvs. sentralkanalen og de to surroundkanaler er omfattet i flerkanalsforlengelsesfeltet som også kalles hjelpedatafelt.
På dekodersiden blir en omvendt matriseoperasjon utført for å forme rekonstruksjoner av venstre og høyre kanal i fem-kanals gjengivelsen ved å bruke grunnstereokanaler Lo, Ro og de tre tilleggskanaler. I tillegg blir de tre tilleggskanaler dekodet fra hjelpeinformasjonen for å oppnå en dekodet fem-kanals- eller surroundgjengivelse av det opprinnelige flerkanals audiosignal.
En annen fremgangsmåte for flerkanalskoding er beskrevet i publikasjonen "Improved MPEG-2 audio multi-channel encoding", B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES-dokument 3865, februar 1994, Amsterdam, hvor bakoverkompatible moduser, for å oppnå bakoverkompatibilitet, blir vurdert. For dette formål blir en kompabilitetsmatrise brukt for å oppnå de såkalte nedblandkanaler Lc, Rc fra de opprinnelige fem inngangskanaler. Videre er det mulig dynamisk å velge de tre hjelpekanaler overført som hjelpedata.
For å utnytte stereo-irrelevansen, blir en samlet stereoteknikk brukt for kanal-gruppene, dvs. de tre frontkanalene, den venstre kanal, den høyre kanal og midtkanalen. For dette formål blir disse tre kanalene kombinert for å oppnå en samlet kanal. Denne kombinerte kanal blir kvantisert og pakket til bitstrøm. Deretter blir den kombinerte kanal sammen med tilsvarende samlet stereoinformasjon sendt til en samlet stereodekodingsmodul for å oppnå samlede stereodekodede signaler, dvs. en samlet stereodekodet, venstre kanal, en samlet stereodekodet, høyre kanal og en samlet stereodekodet, midtre kanal. Disse samlede stereodekodede kanaler blir sammen med den venstre surroundkanal og den høyre surroundkanal sendt til en kompatibilitets-matriseblokk for å frembringe første og andre nedblandekanaler Lc, Rc. Deretter blir kvantiserte versjoner av begge nedblandekanaler og en kvantisert versjon av den kombinerte kanal pakket til bitstrøm sammen med samlede stereokodeparametere.
Ved å bruke intensitetsstereokoding vil derfor en gruppe uavhengige, opprinnelige kanalsignaler følgelig bli overført innenfor en enkelt del av "bærer"-dataene. Dekoderen vil deretter rekonstruere de aktuelle signaler som identiske data som blir reskalert ifølge deres opprinnelige energi/tidsenveloper. Følgelig vil en lineær kombinasjon av de overførte kanaler føre til resultater som er helt forskjellig fra den opprinnelige nedblanding. Dette gjelder enhver type samlet stereokoding basert på intensitetsstereokonseptet. For et kodesystem som leverer kompatible nedblandekanaler vil dette innebære en direkte konsekvens: rekonstrueringen ved dematrisering som beskrevet i den tidligere publikasjon, lide av ulemper forårsaket av den ikke-perfekte rekonstruksjon. Ved å bruke et såkalt samlet stereoforvrengningsarrangement hvor en samlet stereokoding av venstre, høyre og midtkanal utføres før matrisebehandling i koderen, vil dette problemet kunne minskes. På denne måte vil dematriserings arrangementet for rekonstruksjonen medføre færre forvrengninger siden de samlede stereodekodede signaler på kodesiden, har blitt brukt for å generere nedblandekanalen. Således blir den ikke-perfekte rekonstruksjon forflyttet til de kompatible nedblandekanaler Lc og Rc hvor den mer sannsynlig vil bli maskert av selve lydsignalet.
Selv om et slikt system har ført til færre ulemper på grunn av dematriseringen på dekodersiden, har den uansett enkelte ulemper. En ulempe er at de stereokompatible nedblandekanaler Lc og Rc ikke bare avledes fra de opprinnelige kanaler, men også fra intensitetsstereokodede/dekodede versjoner av de opprinnelige kanaler. Følgelig blir datatap på grunn av intensitetsstereokodesystemet tatt med i de kompatible nedblandekanaler. En enkelt stereodekoder som bare dekoder de kompatible kanaler snarere enn de forbedrede intensitetsstereokodede signaler vil følgelig levere et utgangssignal som ikke påvirkes av intensitetsstereoforårsakede datatap.
I tillegg må en fullstendig tilleggskanal overføres ved siden av de to nedblandekanaler. Denne kanal er den kombinerte kanal som formes ved hjelp av samlet stereokoding av den venstre, høyre og senterkanal. I tillegg må intensitets-stereoinformasjonen for å rekonstruere de opprinnelige kanaler L, R, C fra den kombinerte kanal også overføres til dekoderen. Ved dekoderen blir en omvendt matrisebehandling, dvs. en dematriseringsoperasjon utført for å avlede surround-kanalene fra de to nedblandekanaler. I tillegg blir den opprinnelige venstre, høyre og midtkanal approksimert ved samlet stereodekoding ved å bruke den overførte, kombinerte kanal over de overførte samlede stereoparametere. Det skal bemerkes at den opprinnelige venstre, høyre og midtkanal avledes av den samlede stereodekoding av den kombinerte kanal.
En forbedring av BCC-arrangementet på fig. 11, er et BCC-arrangement med minst to audiooverføringskanaler, slik at det oppnås stereokompatibel behandling. I koderen blir C-inngangskanalene nedblandet til E-overføringsaudiokanaler. ICTD-, ICLD- og ICC-signaler mellom enkelte par av inngangskanaler blir estimert som en funksjon av frekvens og tid. Disse estimerte frekvenser blir overført til dekoderen som sideinformasjon. BCC-arrangementet med C-inngangskanaler og E-overføringskanaler er benevnt C-2-E BCC.
Generelt er BCC-behandling en frekvensselektiv og tidsvariant etterbehandling av de overførte kanaler. I det følgende vil en frekvensbåndindeks ikke bli innført. I stedet forutsettes variabler som xn, sn, yn, an osv. å være vektorer med dimensjon (1, f) hvor f benevner antallet frekvensbånd.
Det såkalte vanlige BCC-arrangement er beskrevet i C. Faller og F. Baumgarte, "Binaural Cue Coding applied to stereo and multi-channel audio compression", i Preprint 112th Conv. Aud. Engl. Soc, Mai 2002, F. Baumgarte og C. Faller, "Binaural Cue Coding - Part I: Psychoacoustic fundamentals and design principles," IEEE Trans. On Speech and Audio Proe, vol. 11, no. 6, nov. 2003, og C. Faller og F. Baumgarte, "Binaural Cue Coding - Part II; Schemes and applications," IEEE Trans. On Speech and Audio Proe, vol. 11, no. 6, nov. 2003. Her fins det en enkelt overført audiokanal som vist på fig. 11 som en bakoverkompatibel forlengelse av eksisterende monosystemer for stereo- eller flerkanals audioavspilling. Siden den overførte, ene audiokanal er et gyldig monosignal, egner det seg for avspilling av tradisjonelle mottakere.
Imidlertid er det meste av den installerte audiolo-mgkastmgsinfrastruktur (analog og digital radio, tv osv.) og audiolagringssystemer (vinylplater, kompakt-kassett, kompaktplate, VHS video, MP3-lydlager osv.) basert på tokanals stereo. På den annen side blir "hjemmekinosystemer" som i samsvar med 5.1-standarden (Ree. ITU-R BS.775, Multi- Channel Stereophonic Sound System with or without Accompanying Picture, ITU, 1993, http:// www. itu. org) stadig mer populær. Således blir BCC med to overføringskanaler (C-to-2 BCC) som beskrevet i J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer og C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio" i Preprint 116th Conv. Aud. Eng. Soc, mai 2004 stadig mer interessant for utvidelse av eksisterende systemer for flerkanals surround. I denne forbindelse henvises det også til US patentskrift "Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal", US serienummer 10/762 100, innlevert 20. januar 2004.
I det analoge domenet, har matrisealgoritmer, feks. "Dolby Surround", "Dolby Pro Logic" og "Dolby Pro Logic II" (J. Hull, "Surround sound past, present, and future", Techn. Rep., Dolby Laboratories, 1999 www. dolby. com/ tech/ ; R. Dressler, "Dolby Surround Prologic II Decoder - Principles of operation", Tech Rep., Dolby Laboratories, 2000, www, dolby, com/ tech/) blitt stadig mer populært. Slike algoritmer bruker "matrisering" for å mappe 5.1-audiokanaler til et stereokompatibelt kanalpar. Imidlertid gir matrisealgoritmer en betydelig redusert fleksibilitet og kvalitet sammenlignet med diskrete audiokanaler som skissert i J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer og C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio", i Preprint 116th Conv. Aud. Eng. Soc, mai 2004. Hvis begrensningene ved matrisealgoritmer allerede er tatt hensyn til under blanding av audiosignaler for 5.1-surround, kan noen av disse ufullkommenheter reduseres som skissert i J. Hilson, "Mixing with Dolby Pro Logic II Technology", Tech. Rep., Dolby Laboratories, 2004, www, dolby. com/ tech/ PLII. Mixing. JimHilson. html. C-to-2 BCC kan betraktes som et arrangement med tilsvarende funksjonalitet som en matrisealgoritme med tilleggshjelpeinformasjon. Den er imidlertid mer generell siden den støtter mapping av ethvert antall opprinnelige kanaler til ethvert antall overførte kanaler. C-to-E BCC er tenkt for det digitale domene og dens lave bitrate tilleggssideinformasjon kan vanligvis omfattes i den eksisterende dataoverføring på en bakoverkompatibel måte. Dette innebærer at tradisjonelle mottakere vil ignorere tilleggsinformasjonen og spille av de to kanalene direkte som skissert i J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer og C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio", i Preprint 116th Conv. Aud. Eng. Soc, mai 2004. Det evige mål er å kunne oppnå en lydkvalitet som tilsvarer en diskret overføring av alle de opprinnelige audiokanaler, dvs. som er betydelig bedre enn det som kan forventes fra en konvensjonell matrisealgoritme.
I det følgende henvises det til fig. 6a for å vise den konvensjonelle koder nedblandeoperasjon for å generere to overføringskanaler ut fra fem inngangskanaler som er en venstre kanal L eller xls en høyre kanal R eller x2, en midtkanal C eller x3, en venstre surroundkanal sL ellerX4og en høyre surroundkanal sR eller x5. Nedblandesituasjonen er vist skjematisk på fig. 6a. Det vil fremgå at den første overføringskanal yi formes ved å bruke en venstre kanal xi, en midtkanal x3og den venstre surroundkanalX4.1 tillegg gjør fig. 6a det tydelig at den høyre overføringskanal y2 formes ved å bruke den høyre kanal x2, midtkanal x3 og den høyre surroundkanal x5.
Den generelt foretrukne nedblanderegel eller nedblandematrise er vist på fig. 6c. Det vil fremgå at senterkanalen x3er vektet ved en vektfaktor 1/V2, som innebærer at den første halvdel av energien av senterkanalen x3blir lagt inn i den venstre overføringskanal eller den første overføringskanal Lt mens den andre halvdel av energien i midtkanalen blir innført i den andre overføringskanal eller høyre overføringskanal Rt. Således mapper nedblandingen inngangskanalene til de overførte kanaler. Nedblandingen blir passende beskrevet av en (m, n)-matrise som mapper n inngangssignaler til m utgangssampler. Innlegging av denne matrise blir vektende tilført de tilsvarende kanaler før oppsummeringen for å forme den relaterte utgangskanal.
Det fins forskjellige nedblandefremgangsmåter i ITU-anbefalinger (Ree. ITU-R BS.775, Multi-Channel Stereophonic Sound System with or without Accompanying Picture, ITU, 1993 http://www.itu.org). I tillegg henvises det til J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer og C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio", i Preprint 116th Conv. Aud. Eng. Soc, mai 2004, avsnitt 4.2 når det gjelder forskjellige nedblandemetoder. Nedblandingen kan utføres enten i tids- eller frekvens-domenet. Det kan være tidsvarierende på en signaltilpasset måte eller frekvens (bånd)-avhengig. Kanaltildelingen er vist av matrisen på høyre side av fig. 6 og er som følger:
Så for det viktige tilfellet av 5-to-2 BCC, blir en omføringskanal beregnet fra høyre, bak høyre og senter og den andre overførte kanal fra venstre, bak venstre og senter tilsvarende nedblandingsmatrisen for feks.
som også er vist på fig. 6c.
I denne nedblandematrise kan vektingsfaktorene velges slik at summen av kvadratet av verdiene i hver kolonne er 1, slik at potensen av hvert inngangssignal bidrar likt til nedblandesignalene. Naturligvis kan også andre nedblandearrangement brukes.
Det refereres især til fig. 6b eller 7b som viser en spesifikk implementering av et kodernedblandearrangement. Behandlingen av hvert delbånd er vist. I hvert delbånd blir skaleringsfaktorene ei og e2regulert for å "utjevne" størrelsen av signalkom-ponentene i nedblandesignalet. I dette tilfellet utføres nedblandingen i frekvensdomenet med den variable n (fig. 7b) som benevner en delbåndtidsindeks fra frekvensdomenet og k er indeksen av den omdannede tidsdomenesignalblokk. Især henvises det til vektmgsinnretningen for å vekte senterkanalen før den vektede versjon av senterkanalen blir innført i den venstre overføringskanal og den høyre overføringskanal av de respektive summermgsinnretninger.
Den tilsvarende oppblandeoperasjonen i dekoderen er vist under henvisning til fig. 7a, 7b og 7c. I dekoderen må en oppblanding beregnes som mapper overførings-kanalen til utgangskanalen. Oppblandingen beskrives passende av en (i, j)-matrise (i-rekker, j-kolonner) som mapper i overførte sampler til j utgangssampler. Enda en gang er registreringen av denne matrise vektene som tilføres tilsvarende kanaler før oppsummeringen for å danne den relaterte utgangskanal. Oppblandingen kan utføres enten i tids- eller frekvensdomenet. I tillegg kan den være tidsvarierende på en signaltilpasset måte eller frekvens (bånd)-avhengig. I motsetning til nedblandematrisen representerer de absolutte verdier av matriseregistreringene ikke de endelige vekter av utgangskanalene siden disse oppblandede kanaler videre blir modifisert ved BCC-behandling. Især finner modifikasjonen sted ved å bruke informasjonen levert av spatialsignalene som ICLD osv. I dette eksempelet blir alle registreringene enten satt til 0 eller 1.
Fig. 7a viser oppblandesituasjonen for et surround-system med 5 høytalere. Ved siden av hver høytaler er basiskanalen brukt for BCC-syntese, vist. Når det gjelder den venstre surround utgangskanal, blir en første overført kanal yi brukt. Det samme er tilfellet for venstre kanal. Denne kanal brukes som basiskanal, også benevnt "venstre overførte kanal".
Når det gjelder den høyre utgangskanal og den høyre surround utgangskanal, bruker de også samme kanal, dvs. den andre eller høyre overførte kanal y2. Når det gjelder midtkanalen skal det bemerkes at basiskanalen for BCC-senterkanalsyntesen formes i samsvar med oppblandematrisen vist på fig. 7c, dvs. ved å tilføye begge overførte kanaler.
Prosessen med å generere 5 kanals utgangssignal med de to overførte kanaler, er vist på fig. 7b. Her blir oppblandingen utført i frekvensdomenet med variabel n som benevner en delbåndtidsindeks for et frekvensdomene og k er indeksen av den omdannede tidsdomenes signalblokk. Det skal bemerkes her at ICTD- og ICC-syntese blir brukt mellom kanalparene som samme basiskanal blir brukt for, dvs. mellom venstre og bakre venstre og mellom høyre og bakre høyre. De to blokkene benevnt A på fig. 7b omfatter arrangementet for 2-kanals ICC-syntese.
Sideinformasjonen beregnet ved koderen, er nødvendig for å beregne alle parametrene for dekoderens utgangssignalsyntese, herunder følgende signaler: ALi2, AZ43, AZ44, AZ45, Z14,T25, C14og c25(ALy er nivåforskjellen mellom kanal i og j, er tidsforskjellen mellom kanal i og j ogCy er en korreleringskoeffisient mellom kanal i og j). Det skal bemerkes her at også andre nivåforskjeller kan brukes. Kravet er bare at tilstrekkelig informasjon blir tilgjengelig ved dekoderen for å beregne feks. skaleringsfaktorer, forsinkelser osv. for BCC-syntesen.
I det følgende henvises det til fig. 7d for videre å illustrere nivåmodifikasjonen for hver kanal, dvs. beregningen av ai og den etterfølgende totale normalisering som ikke er vist på fig. 7b. Fortrinnsvis blir interkanalnivåforskjellene AL; overført som sideinformasjon, dvs. som ICLD. For et kanalsignal må eksponentialforholdet mellom referansekanalen Frefog en kanal beregnes, dvs. F;. Dette er vist øverst på fig. 7d.
Det som ikke er vist på fig. 7b er den etterfølgende eller endelige totale normalisering som kan finne sted før korreleringsblokkene A eller etter korreleringsblokkene A. Når korreleringsblokkene påviser energien av kanalene som vektes av a;, bør den totale normalisering finne sted etter korreleringsblokkene A. For å sikre at energiene av alle utgangskanaler blir lik energien av alle senderkanaler, blir referansekanalen skalert som vist på fig. 7d. Fortrinnsvis er referansekanalen roten av summen av de kvadrerte overførte kanaler.
I det følgende blir problemer tilknyttet disse nedblande/oppblande arrange-menter beskrevet. Når 5-to-2-BCC-arrangementet som vist på fig. 6 og fig. 7 blir vurdert, vil det følgende fremgå tydelig.
Den opprinnelige senterkanal blir ført i begge overførte kanaler og følgelig også inn i de rekonstruerte venstre og høyre utgangskanaler.
I tillegg har det felles senterbidrag i dette arrangement samme amplitude i begge de rekonstruerte utgangssignaler.
Videre blir det opprinnelige sentersignal erstattet under dekoding av en senterkanal som avledet fra de overførte venstre og høyre kanaler og kan således ikke være avhengig av (dvs. ikke korrelert til) de rekonstruerte venstre og høyre kanaler.
Denne effekt har gunstige følger for den oppfattede lydkvalitet for signaler med et svært bredt lydbilde som karakteriseres av en stor grad av dekorrelering (dvs. lav sammenheng) mellom alle audiokanaler. Et eksempel på slike signaler er lyden av et applauderende publikum og forskjellige mikrofoner med et tilstrekkelig bredt mellomrom for å generere de opprinnelige flerkanals signaler. For slike signaler blir lydbildet av den dekodede lyd smalere og dens naturlige bredde blir redusert.
Oppsummering
Det er formål med oppfinnelsen å tilveiebringe et høykvalitets, flerkanals konstruksjonskonsept som fører til et flerkanals utgangssignal med forbedret lydopp-fatning.
Ifølge det første aspekt ved oppfinnelsen oppnås dette formål av et apparat for å generere et flerkanals utgangssignal med K utgangskanaler, idet flerkanals utgangssignalet tilsvarer et flerkanals inngangssignal med C inngangssignaler og bruk av E overføringskanaler, idet E-overføringskanalene representerer et resultat av nedblandeoperasjonen med C-inngangskanaler som et inngangssignal og bruk av parametrisk sideinformasjon knyttet til inngangskanalene, idet E > 2, C er > E og K er > 1 og < C og hvor nedblandeoperasjonen utføres for å innføre en første inngangskanal i en første overføringskanal og inn i en andre overføringskanal og i tillegg innføre en andre inngangskanal i den første overføringskanal, omfattende en kanselleringskanalkalkulator for å beregne en kanselleringskanal som bruker informasjon tilknyttet den første inngangskanal i den første overføringskanal, den andre overføringskanal eller den parametriske sideinformasjon, en kombineringsenhet for å kombinere kanselleringskanalen og den første overføringskanal eller en behandlet versjon derav for å oppnå en andre basiskanal hvor en påvirkning fra den første inngangskanal blir redusert sammenlignet med påvirkningen av den første inngangskanal på den første overføringskanal, og en kanal rekonstruktør for å rekonstruere en andre utgangskanal tilsvarende den andre inngangskanal som bruker den andre basiskanal og parametrisk sideinformasjon tilknyttet den andre inngangskanal og for å rekonstruere en første utgangskanal tilsvarende den første inngangskanal ved å bruke en første basiskanal som er forskjellig fra den andre basiskanal ved at påvirkningen fra den første kanal er høyere sammenlignet med den andre basiskanal, og parametrisk sideinformasjon tilknyttet den første inngangskanal.
Ifølge et andre aspekt ved oppfinnelsen oppnås dette formål ved hjelp av en fremgangsmåte for å generere en flerkanals utgangssignal med K utgangskanaler, idet flerkanalens utgangssignal tilsvarer flerkanalens inngangskanal med C inngangskanaler som bruker E overføringskanaler, idet E-overføringskanalene representerer et resultat av en nedblandeoperasjon med C inngangskanaler som et inngangssignal og bruk av parametrisk sideinformasjon tilknyttet inngangskanalene, idet E er > 2, C > E, og K > 1 og < C og hvor nedblandeoperasjonen kan innføre en første inngangskanal i en første overføringskanal og i en andre overføringskanal og i tillegg innføre en andre inngangskanal i den første overføringskanal, omfattende: beregne en kanselleringskanal ved å bruke informasjon tilknyttet den første inngangskanal i den første overføringskanal, den andre overføringskanal eller den parametriske sideinformasjon, kombinere kanselleringskanalen og den første overføringskanal eller en behandlet versjon derav for å oppnå en andre basiskanal hvor en påvirkning fra den første inngangskanal blir redusert sammenlignet med påvirkningen fra den første inngangskanal på den første overføringskanal og rekonstruere en andre utgangskanal tilsvarende den andre inngangskanal ved å bruke den andre basiskanal og parametrisk sideinformasjon tilknyttet den andre inngangskanal og en første utgangskanal tilsvarende den første inngangskanal ved å bruke den første basiskanal som er forskjellig fra den andre basiskanal ved at påvirkningen fra den første kanal er høyere sammenlignet med den andre basiskanal og parametrisk sideinformasjon tilknyttet den første inngangskanal.
Ifølge et tredje aspekt ved oppfinnelsen oppnås dette formål ved et dataprogram med en programkode for å utføre fremgangsmåten for å generere et flerkanals utgangssignal idet programmet kjøres på en datamaskin.
Det skal bemerkes her at K fortrinnsvis er lik C. Ikke desto mindre kan det også rekonstrueres færre utgangskanaler, feks. tre utgangskanaler L,R,C og ikke rekonstruere Ls og Rs. I dette tilfellet tilsvarer K (=3) utgangskanaler tilsvarende de tre opprinnelige C (=5) inngangskanaler L,R,C.
Oppfinnelsen er basert på funnet av at, for å forbedre lydkvaliteten av flerkanalens utgangssignal, en bestemt basiskanal blir beregnet ved å kombinere en overført kanal og en kanselleringskanal som beregnes ved mottakeren eller dekoderen. Kanselleringskanalen blir beregnet slik at den modifiserte basiskanal oppnådd ved å kombinere kanselleringskanalen og den overførte kanal har en redusert påvirkning av senterkanalen, dvs. kanalen som innføres i begge overføringskanaler. Med andre ord blir påvirkningen av senterkanalen, dvs. kanalen som innføres i begge overførings-kanaler som uunngåelig oppstår ved nedblanding og etterfølgende oppblanding, redusert sammenlignet med situasjonen hvor ingen slik kanselleringskanal blir beregnet og kombinert til en overføringskanal.
I motsetning til tidligere teknikk, blir feks. venstre overføringskanal ikke ganske enkelt brukt som basiskanal for å rekonstruere venstre eller venstre surround-kanal. I motsetning til dette blir den venstre overføringskanal modifisert ved å kombinere kanselleringskanalen slik at påvirkningen av den opprinnelige senterinngangskanal i basiskanalen for å rekonstruere venstre eller høyre utgangskanal redusert eller eventuelt fullstendig kansellert.
Som en nyhet blir kanselleringskanalen beregnet ved dekoderen ved å bruke informasjon på den opprinnelige senterkanal som allerede finnes ved dekoderen eller flerkanalsutgangsgeneratoren. Informasjonen på senterkanalen blir tatt med i den venstre overførte kanal, den høyre overførte kanal og den parametriske sideinformasjonen, f.eks. ved nivåforskjeller, tidsforskjeller eller korreleringsparametere for senterkanalen. Avhengig av enkelte utførelser, kan all denne informasjon brukes for å oppnå en høykvalitetssenterkanalkansellering. I andre, mer lavnivå utførelser, blir bare en del av denne informasjon på senterinngangskanalen brukt. Denne informasjon kan være den venstre overføringskanal, den høyre overføringskanal eller den parametriske sideinformasjon. I tillegg kan også informasjon estimert i koderen og overført til dekoderen brukes.
I et 5-to-2-miljø blir den venstre, overførte kanal eller den høyre, overførte kanal ikke brukt direkte for venstre og høyre rekonstruksjon men blir modifisert ved å kombineres med kanselleringskanalen for å oppnå en modifisert basiskanal som er forskjellig fra den tilsvarende, overførte kanal. Fortrinnsvis blir en ekstra vektingsfaktor som vil avhenge av nedblandeoperasjonen utført ved en koder for å generere overføringskanalene også omfattet i kanselleringskanalberegningen. I et 5-to-2-miljø, blir minst to kanselleringskanaler kalkulert, slik at hver overføringskanal kan kombineres med en benevnt kanselleringskanal for å oppnå modifiserte basiskanaler for rekonstruksjon av venstre og venstre surroundutgangskanaler og høyre og høyre surroundutgangskanaler.
Oppfinnelsen kan brukes i forskjellige systemer eller applikasjoner, herunder f. eks. digitale videospillere, digitale audiospillere, datamaskiner, satellittmottakere, kabelmottakere, terrestiale kringkastingsmottakere og hjemmeunderholdningssystemer.
Kort omtale av figurene
Oppfinnelsen skal beskrives nærmere i det følgende, der:
Fig. 1 er et blokkskjema av en flerkanals koder for å produsere overføringskanaler og
parametrisk sideinformasjon på inngangskanalene,
fig. 2 er et skjematisk blokkskjema av det foretrukne apparat for å generere
flerkanals utgangssignal i samsvar med oppfinnelsen,
fig. 3 er et skjematisk riss av det nye apparat i samsvar med den første utførelse av
oppfinnelsen,
fig. 4 er en kretsimplementering av den foretrukne utførelse på fig. 3,
fig. 5a er et blokkskjema av det nye apparat ifølge en andre utførelse av oppfinnelsen, fig. 5b er en matematisk gjengivelse av den dynamiske oppblanding som vist på fig.
5a,
fig. 6a er et generelt riss for å vise nedblandeoperasjonen,
fig. 6b er en krets for å implementere nedblandeoperasjonen på fig. 6a,
fig. 6c er en matematisk gjengivelse av nedblandeoperasjonen,
fig. 7a er et skjematisk riss for å indikere basiskanalen som brukes for oppblanding i
et stereokompatibelt miljø,
fig. 7b er et skjema for å implementere en flerkanals gjengivelse i et stereokompatibelt
miljø,
fig. 7c er en matematisk gjengivelse av oppblandematrisen brukt på fig. 7b,
fig. 7d er et matematisk riss av nivåmodifikasjonen for hver kanal og den
etterfølgende totale normalisering,
fig. 8 viser en koder,
fig. 9 viser en dekoder,
fig. 10 viser en tidligere felles stereokoder,
fig. 11 er et blokkskjema som viser et tidligere BCC-koder/dekodersystem,
fig. 12 er et blokkskjema av en tidligere implementering av en BCC-synteseblokk på
fig. 11, og
fig. 13 er et riss av et kjent arrangement for å bestemme ICLD-, ICTD- og ICC-parametere.
Detaljert beskrivelse av utførelsesformer
Før foretrukne utførelser blir beskrevet, skal problemet som ligger til grunn for oppfinnelsen og løsning på problemet bli beskrevet generelt. Den nye teknikk for å forbedre den lydmessige, spatiale billedbredde for rekonstruerte utgangssignaler gjelder i alle tilfeller hvor en inngangskanal blir blandet til flere enn en av de overførte kanaler i et C til E parametrisk flerkanalssystem. Den foretrukne utførelse er å implementere oppfinnelsen i et "binaural cue"-kode (BCC)-system. For å forenkle beskrivelsen men uten tap av generalitet, blir den nye teknikk beskrevet for et spesifikt tilfelle av et BCC-arrangement for koding/dekoding av 5.1-surroundsignaler på en bakover kompatibel måte.
Ovennevnte problem med lydbildebreddereduksjon oppstår for det meste i forbindelse med audiosignaler som inneholder uavhengige raske gjentagende transienter fra forskjellige retninger, feks. applaussignal fra et publikum ved direkte innspilling. Selv om billedbreddereduksjonen i prinsipp kan løses ved den høyre tidsoppløsning for ICLD-syntese vil dette føre til økt sideinformasjonsrate og også kreve en endring i vindusstørrelsen av den brukte analyse/syntesefilterbank. Det skal bemerkes her at denne mulighet i tillegg fører til negative effekter på tonale komponenter siden en økning av tidsoppløsningen automatisk innebærer en minskning av frekvensoppløsningen.
I stedet er oppfinnelsen et enkelt konsept som ikke har disse ulempene og tar sikte på å redusere påvirkningen av senterkanalens signalkomponent i sidekanalene.
Som nevnt i forbindelse med fig. 7a-7d, er basiskanalene for de fem rekonstruerte utgangssignaler av 5-to-2 BCC:
Det skal bemerkes at den opprinnelige senterkanals signalkomponent x3vises 3 dB forsterket i senterbasiskanalens delbåndS3(faktor 1/V2) og 3 dB dempet i den gjenværende (sidekanals) basiskanal delbånd.
For ytterligere å dempe påvirkningen fra senterkanalens signalkomponent i sidebasiskanalens delbånd ifølge oppfinnelsen, blir følgende generelle ide anvendt som vist på fig. 2.
Et estimat av den endelige dekodede senterkanals signal blir beregnet ved fortrinnsvis å skalere den til ønsket målnivå som beskrevet av den tilsvarende nivåinformasjon, f.eks. en ICLD-verdi i BCC-miljø. Fortrinnsvis blir dette dekodede sentersignal beregnet i det spektrale domenet for å spare beregning, dvs. at ingen syntese filterbank behandling blir brukt.
I tillegg kan dette senterdekodede signal eller senter rekonstruerte signal som tilsvarer kanselleringskanalen vektes og deretter kombineres til begge basiskanal-signalene av de andre utgangskanaler. Denne kombinering er fortrinnsvis en subtraksjon. Når vektingsfaktorene har et forskjellig tegn, vil ikke desto mindre en tilføyelse deretter også føre til reduksjon av påvirkningen av senterkanalen i basiskanalen som blir brukt for rekonstruering av venstre eller høyre utgangskanal. Denne behandling fører til dannelse av en modifisert basiskanal for rekonstruksjon av venstre og venstre surround eller for rekonstruksjon av høyre eller høyre surround. Fortrinnsvis foretrekkes en vektingsfaktor på -3 dB, men også en annen verdi er mulig.
I stedet for de opprinnelige overføringsbasiskanalers signaler som brukt på fig. 7b, blir modifiserte basiskanalsignaler brukt for beregning av den dekodede utgangskanal fra de andre utgangskanaler, dvs. andre kanaler enn senterkanalen.
I det følgende vil et blokkskjema over det nye konsept bli omtalt under henvisning til fig. 2. Fig. 2 viser et apparat for å generere en flerkanals utgangssignal med K utgangskanaler, idet flerkanalens utgangssignal tilsvarer en multikanals inngangssignal med C inngangskanaler og bruk av E-overføringskanaler, dvs. E over-føringskanalene representerer et resultat av en nedblandeoperasjon med C inngangskanaler som et inngangskanal og ved å bruke den parametriske sideinformasjon på inngangskanalene hvor C er > 2, C er > E og K > 1 og < C. I tillegg virker nedblandeoperasjonen for å innføre en første inngangskanal i en første overføringskanal og i en andre overføringskanal. Den nye innretning omfatter kanselleringskanalkalkulatoren 20 for å beregne minst en kanselleringskanal 21 som blir sendt til en kombineringsenhet 22 som mottar, ved en andre inngang 23, den første overføringskanal direkte eller en behandlet versjon av den første overføringskanal. Behandlingen av den første overføringskanal for å oppnå den behandlede versjon av den første overføringskanal, utføres ved hjelp av en prosessor 24 som kan finnes i enkelte utførelser, men som generelt er valgfri. Kombineringsenheten brukt for å oppnå en andre basiskanal 25 for å sendes til en kanalrekonstruktør 26.
Kanalrekonstruktøren bruker den andre basiskanal 25 og den parametriske sideinformasjon på den opprinnelige venstre inngangskanal som blir sendt til kanalrekonstruktøren 26 ved en annen inngang 27, for å generere den andre utgangskanal. Ved utgangen av kanalrekonstruktøren vil det oppnås en andre utgangskanal 28 som kan være den rekonstruerte venstre utgangskanal som, sammenlignet med situasjonen på fig. 7b, blir generert av en basiskanal som har en mindre påvirkning eller til og med en fullstendig kansellert påvirkning av den opprinnelige inngangs senterkanal sammenlignet med situasjonen på fig. 7b.
Mens den venstre utgangskanal generert som vist på fig. 7b omfatter en viss påvirkning som beskrevet ovenfor, blir denne påvirkning redusert i den andre basiskanal som generert på fig. 2 på grunn av kombinasjonen av kanselleringskanalen og den første overføringskanal eller den behandlede, første overføringskanal.
Som vist på fig. 2 beregner kanselleringskanalkalkulatoren 20 kanselleringskanalen som bruker informasjon på den opprinnelige senterkanal som er tilgjengelig som en dekoder, dvs. informasjon for å generere flerkanalsutgangssignalet. Denne informasjon omfatter parametrisk sideinformasjon på den første inngangskanal 30 eller omfatter den første overføringskanal 31 som også omfatter noe informasjon på senterkanalen på grunn av nedblandeoperasjonen eller omfatter den andre overførings-kanal 32 som også omfatter informasjon på senterkanalen på grunn av nedblandeoperasjonen. Fortrinnsvis blir all denne informasjon brukt for den optimale rekonstruksjon av senterkanalen for å oppnå kanselleringskanalen 21.
En slik optimal utførelse vil etter hvert bli beskrevet under henvisning til fig. 3 og 4. I motsetning til fig. 2, viser fig. 3 2-gangs innretningen fra fig. 2, dvs. en innretning for å kansellere senterkanalens påvirkning i den venstre basiskanal sl samt i den høyre basiskanal s2. Kanselleringskanalens kalkulator 20 fra fig. 2 omfatter en senterkanals rekonstruksjonsinnretning 20a og en vektmgsinnretning 20b for å oppnå kanselleringskanalen 21 ved utgangen av vektmgsinnretningen. Kombinasjonsenheten 22 på fig. 2 er en enkelt subtraktor som virker for å subtrahere kanselleringskanalen 21 fra den første overføringskanal 21 for å oppnå, når det gjelder fig. 2, den andre basiskanal 25 for å rekonstruere den andre utgangskanal (f.eks. den venstre utgangskanal) og eventuelt også den venstre surroundutgangskanal. Den rekonstruerte senterkanal x3(k) kan oppnås ved utgangen av senterkanalens rekonstruksjonsinnretning 20a.
Fig. 4 viser en foretrukket utførelse implementert som en krets som bruker teknikken som beskrevet under henvisning til fig. 3. I tillegg viser fig. 4 den frekvensselektive behandling som optimalt egner seg for integrering i en rett frem, frekvensselektiv BCC-rekonstruksjonsinnretning.
Senterkanalens rekonstruksjon 26 finner sted ved å summere de to overførings-kanaler i en summerer 40. Deretter blir parametrisk sideinformasjon for kanalnivå- forskjellene eller faktoren a3avledet fra interkanalnivåforskjellen som omtalt på fig. 7d, brukt for å generere en modifisert versjon av den første basiskanal (når det gjelder fig. 2) som blir sendt til kanalrekonstruktøren 26 ved den første basiskanals inngang 29 på fig. 2. Den rekonstruerte senterkanal ved utgangen av multiplikatoren 41 kan brukes for senterkanalens utgangsrekonstruksjon (etter den generelle normalisering som beskrevet på fig. 7d).
For å erkjenne påvirkningen av senterkanalen i basiskanalen for venstre og høyre rekonstruksjon, blir vektingsfaktoren av l Ni brukt som vist ved hjelp av en multiplikator 42 på fig. 4. Deretter blir den rekonstruerte og gjenvektede senterkanal ført tilbake til summererne 43a og 43b som tilsvarer kombineringsenheten 22 på fig. 2.
Således er den andre basiskanal si ellerS4(eller s2ogS5) forskjellig fra overføringskanalen yi ved at senterkanalens påvirlcning reduseres sammenlignet med fig. 7b.
Den resulterende basiskanals delbånd kan gies matematisk som følger:
Således tilveiebringer innretningen på fig. 4 en subtraksjon av en senterkanals delbåndsestimat fra basiskanalene for sidekanalene for å forbedre uavhengigheten mellom kanalene og følgelig for å oppnå en bedre spatial bredde av det rekonstruerte multikanals signal.
Ifølge en annen utførelse av oppfinnelsen som etter hvert vil bli beskrevet under henvisning til fig. 5a og 5b, blir en kanselleringskanal som er forskjellig fra kanselleringskanalen beregnet på fig. 3, bestemt. I motsetning til fig. 3 / fig. 4, blir kanselleringskanalen 21 for å beregne den andre basiskanal sl(k) ikke avledet fra den første overføringskanal samt den andre overføringskanal, men blir avledet fra den andre overføringskanal y2(k) alene ved å bruke en bestemt vektingsfaktor x_lr som vist av mmtiplikasjonsinnretningen 51 på fig. 5a. Således er kanselleringskanalen 21 på fig. 5a forskjellig fra kanselleringskanalen på fig. 3, men bidrar også til å hindre reduksjon av senterkanalens påvirkning på basiskanalen sl(k) brukt for å rekonstruere den andre utgangskanal, dvs. den venstre utgangskanal xl(k).
I utførelsen på fig. 5a, er det også vist en foretrukket utførelse av prosessoren 24. Især er prosessoren 24 implementert som en annen multiplikasjonsinnretning 52 som bruker en multiplikasjon med en multiplikasjonsfaktor (l-x_lr). Som vist på fig. la, avhenger multiplikasjonsf aktoren levert av prosessoren 24 til den første overføringskanal fortrinnsvis av multiplikasjonsfaktoren 51 som blir brukt for å multiplisere den andre overføringskanal for å oppnå kanselleringskanalen 21. Endelig brukes den behandlede versjon av den første overføringskanal ved en inngang 23 til kombineringsenheten 22 for å kombinere, som består i å subtrahere kanselleringskanalen 21 fra den behandlede versjon av den første overføringskanal. Alt dette fører igjen til den andre basiskanal 25 som har en redusert eller en fullstendig kansellert påvirkning av den opprinnelige senterinngangskanal.
Som vist på fig. 5a blir den samme fremgangsmåte gjentatt for å oppnå den tredje basiskanal s2(k) ved en inngang til den høyre/høyre surround rekonstruksjonsinnretning. Som vist på fig. 5a blir imidlertid den tredje basiskanal s2(k) oppnådd ved å kombinere den behandlede versjon av den andre overføringskanal y(k) og en annen kanselleringskanal 53 som er avledet fra den første overføringskanal yl(k) ved multiplikasjon i en multiplikasjonsinnretning 54 som har en multiplikasjonsfaktor x_rl som kan være identisk med x_lr for en innretning 51, men som også kan være forskjellig fra denne verdi.
Prosessoren for å behandle den andre overføringskanal som vist på fig. 5a, er en multiplikasjonsinnretning 55. Kombineringsenheten for å kombinere den andre kanselleringskanal 53 og den behandlede versjon av den andre overføringskanal y2(k) er vist ved referansenummer 56 på fig. 5a. Kanselleringskanalkalkulatoren fra fig. 2 omfatter videre en innretning for å behandle kanselleringskoeffisienter som vist ved referansenummer 57 på fig. 5a. Innretningen 57 kan oppnå parametrisk sideinformasjon på den originale eller inngangssenterkanalen, feks. interkanalnivåforskjell osv. Det samme er tilfellet for innretningen 20a på fig. 3 hvor senterkanal-rekonstruksjonsinnretningen 20a også omfatter en inngang for å motta parametrisk sideinformasjon, feks. nivåverdier eller interkanalnivåforskj eller osv.
Følgende ligning
viser den matematiske beskrivelse av utførelsen på fig. 5a og viser på høyre side kanselleringsbehandlingen i kanselleringskanalkalkulatoren på den ene side og proses-sorene (21, 24 på fig. 2) på den annen side. I denne spesifikke utførelse som er vist her, er faktorene x_lr og x_rl identiske med hverandre.
Ovennevnte utførelse gjør det klart at oppfinnelsen omfatter en sammensetning av rekonstruksjonsbasiskanaler som en signaltilpasset, lineær kombinasjon av venstre og høyre overførte kanaler. En slik topologi er vist på fig. 5a.
Sett fra en annen vinkel kan den nye innretning også forstås som en dynamisk oppblandingsprosedyre hvor en annen oppblandingsmatrise for hvert delbånd og hvert tidstilfelle k blir brukt. En slik dynamisk oppblandingsmatrise er vist på fig. 5b. Det skal bemerkes at det for hvert delbånd, dvs. for hvert utgangssignal fra filter-bankinnretningen på fig. 4, feks. en oppblandingsmatrise U, er til stede. Når det gjelder den tidsavhengige måte, skal det bemerkes at fig. 5b omfatter tidsindeksen k. Når det fins nivåinformasjon for hver tidsindeks, vil oppblandingsmatrisen endres fra hvert tidstilfelle til det neste. Når samme nivåinformasjon a3blir brukt for en fullført blokk av verdier omdannet til en frekvensgjengivelse av inngangsfilterbanken FB, vil imidlertid da bare en verdi a3være til stede for en fullført blokk av feks. 1024 eller 2048 samplingsverdier. I dette tilfellet vil oppblandematrisen endres i tidsretningen fra blokk til blokk snarere enn fra verdi til verdi. Uansett fins det teknikker for utjevning av parametriske verdier, slik at det kan oppnås forskjellige amplitudemodifi-kasjonsfaktorer a3under oppblanding i et bestemt frekvensbånd.
Generelt kan det også brukes forskjellige faktorer for beregning av signalet fra midtkanaldelbåndene og faktorene for "dynamisk oppblanding" som resulterer i en faktor a3som er en skalert versjon av a3som beregnet ovenfor.
I en foretrukket utførelse blir vektings styrken av senterkomponent-kanselleringen tilpasset regulert ved hjelp av en utrykkelig overføring av sideinformasjon fra koderen til dekoderen. I dette tilfellet vil kanselleringskanalkalkulatoren 20 vist på fig. 2 omfatte en annen styreinngang som mottar et bestemt styresignal som kan beregnes for å indikere en direkte avhengighet mellom venstre og senter eller høyre og senter kanalen. I denne henseende vil dette styresignal være forskjellig fra nivåforskjellene for senterkanalen og den venstre kanal siden disse nivåforskjellene er knyttet til en type virtuell referansekanal som kan være summen av energien i den første overføringskanal og summen av energien i den andre overføringskanal som vist øverst på fig. 7d.
En slik styreparameter kan f. eks. indikere at senterkanalen er under en terskel og nærmer seg null mens det fins et signal i venstre eller høyre kanal som er over terskelen. I dette tilfellet vil en tilstrekkelig reaksjon av kanselleringskanalkalkulatoren til et tilsvarende styresignal være å slå av kanalkanselleringen og bruke et normalt oppblandearrangement som vist på fig. 7b for å unngå "overkansellering" av senterkanalen som ikke fins i inngangssignalet. I denne henseende vil dette være en ekstrem type regulering av vektingsstyrken som skissert ovenfor.
Som det fremgår av fig. 4 utføres fortrinnsvis ingen tidsforsinkelsesbehandling for å beregne rekonstruksjonssenterkanalen. Dette er fordelaktig ved at tilbake- meldingen virker uten å måtte ta i betraktning eventuelle tidsforsinkelser. Uansett kan dette oppnås uten tap av kvalitet når den opprinnelige senterkanal brukes som referansekanal for å beregne tidsdifferansene d;. Det samme er tilfellet for ethvert korreleringstiltak. Det er en fordel ikke å utføre korreleringsbehandling for rekonstruksjonen av senterkanalen. Avhengig av type korreleringskalkulasjon kan dette utføres uten kvalitetstap når den opprinnelige senterkanal brukes som referanse for eventuelle korreleringsparametere.
Det skal bemerkes at oppfinnelsen ikke er avhengig av et bestemt nedblandearrangement. Dette innebærer at det kan brukes automatisk nedblanding eller et manuelt nedblandearrangement utført av en lydingeniør. Det kan også brukes automatisk generert parametrisk informasjon sammen med manuelt genererte nedblandekanaler.
Avhengig av applikasjonsmiljøet, kan de nye fremgangsmåter for å konstruere eller generere implementeres i maskinvare eller i programvare. Implementering kan være et digitalt lagringsmedium, feks. en disk eller en CD med elektronisk lesbare styresignaler som kan samvirke med et programmert datasystem, s lik at de nye fremgangsmåtene kan utføres. Generelt angår også oppfinnelsen et dataprogram med en programkode lagret på en maskinlesbar bærer og som kan tilpasses for å utføre de nye fremgangsmåtene når dataprogramproduktet kjører på en datamaskin. Med andre ord angår oppfinnelsen følgelig et dataprogram med en programkode for å utføre fremgangsmåtene når dataprogrammet kjøres på en datamaskin.
Oppfinnelsen kan brukes i forbindelse med, eller bygges inn i forskjellige applikasjoner eller systemer med systemer for televisjon eller elektronisk musikk-distribusjon, kringkasting, streaming og/eller mottakelse. Disse omfatter systemer for dekoding/kodingsoverføring (via feks. terrestrisk, satellitt, kabel, internett, intranett eller fysiske media, f.eks. kompaktdisk, digital disk, halvleder brikker, drivere, minne-kort og lignende). Oppfinnelsen kan også brukes i spill og spillsystemer, herunder f.eks. interaktive programvareprodukter som virker sammen med en bruker for under-holdningsformål (handling, rollespill, strategi, eventyr, simuleringer, kappkj øring, sport, kort og brettspill) og/eller undervisning som kan utgis for maskiner, plattformer eller media. Videre kan oppfinnelsen innlemmes i avspillingsmaskiner eller CD-ROM/DVD-systemer. Oppfinnelsen kan også brukes i forbindelse med PC-programvare med digital dekoding (f.eks. avspilling dekoder) og programvareapplikasjoner med digitale kodemuligheter (f.eks. koder, ripper, gjenkoder og jukeboks).

Claims (21)

1 Apparat for å generere et flerkanals utgangssignal med K utgangskanaler, idet flerkanalsutgangssignalet tilsvarer et flerkanals inngangssignal med C inngangskanaler som bruker E overføringskanaler, idet E overføringskanalene representerer et resultat av en nedblandingsoperasjon med C inngangskanaler, som et inngangssignal og som bruker parametrisk informasjon knyttet til inngangskanalene, hvor E>2, C>EogK> 1 og < C og hvor nedblandeoperasjonen er innrettet for å innføre en første inngangskanal i en første overføringskanal og i en andre overføringskanal og i tillegg innføre en andre inngangskanal i den første overføringskanal,karakterisert ved: en kanselleringskanalkalkulator (20) for å beregne en kanselleringskanal (21) ved å bruke informasjon tilknyttet den første inngangskanal omfattet i den første overføringskanal, den andre overføringskanal eller den parametriske informasjon, en kombineringsenhet (23) for å kombinere kanselleringskanalen (21) og den første overføringskanal (23) eller en behandlet versjon derav for å oppnå en andre basiskanal (25), hvor en påvirkning av den første inngangskanal blir redusert sammenlignet med påvirkningen av den første inngangskanal på den første overføringskanal, og en kanalrekonstruktør (26) for å rekonstruere en andre utgangskanal tilsvarende den andre inngangskanal ved å bruke den andre basiskanal og den parametriske informasjon knyttet til den andre inngangskanal og for å rekonstruere den første utgangskanal tilsvarende den første inngangskanal ved å bruke den første basiskanal som er forskjellig fra den andre basiskanal ved at påvirkningen av den første kanal er høyere sammenlignet med den andre basiskanal og den parametriske informasjon tilknyttet den første inngangskanal.
2 Apparat ifølge krav 1,karakterisert ved at kombineringsenheten (22) er innrettet for å subtrahere kanselleringskanalen fra den første overføringskanal eller den behandlede versjon derav.
3 Apparat ifølge krav 1 eller 2,karakterisert ved at kanselleringskanalkalkulatoren (20) er innrettet for å beregne et estimat for den første inngangskanal ved å bruke den første overføringskanal og den andre overførings-kanal for å oppnå kanselleringskanalen (21).
4 Apparat ifølge ett av kravene 1-3,karakterisert ved at den parametriske informasjon omfatter en forskjellsparameter mellom den første inngangskanal og en referansekanal og hvor kanselleringskanalkalkulatoren (20) er innrettet for å beregne en sum av den første overføringskanal og den andre over-føringskanal og vekte summen ved å bruke differansepararneteren.
5 Apparat ifølge ett av kravene 1-4,karakterisert ved at nedblandeoperasjonen er slik at den første inngangskanal blir innført i den første overføringskanal etter å ha blitt skalert av nedblandefaktoren og hvor kanselleringskanalkalkulatoren (20) er innrettet for å skalere summen av første og andre over-føringskanaler ved å bruke en skaleringsfaktor som avhenger av nedblandefaktoren.
6 Apparat ifølge krav 5,karakterisert ved at vektingsfaktoren er lik nedblandefaktoren.
7 Apparat ifølge ett av kravene 1 -6,karakterisert ved at kanselleringskanalkalkulatoren (20) er innrettet for å bestemme en sum av første og andre overføringskanaler for å oppnå den første basiskanal.
8 Apparat ifølge ett av kravene 1 -7,karakterisert ved at det videre omfatter en prosessor (24) som er innrettet for å behandle den første overføringskanal ved vekting og bruk av en første vektingsfaktor og hvor kanselleringskanalkalkulatoren (20) er innrettet for å vekte den andre overføringskanal ved å bruke en andre vektingsfaktor.
9 Apparat ifølge krav 8,karakterisert ved at den parametriske informasjon omfatter forskjellsparameteren mellom første inngangskanal og en referansekanal og hvor kanselleringskanalkalkulatoren (20) er innrettet for å bestemme den andre vektingsfaktor basert på en differanseparameter.
10 Apparat ifølge krav 8 eller 9,karakterisert ved at den første vektingsfaktor er lik (1-h) hvor h er en sann verdi og hvor den andre vektingsfaktor er lik h.
11 Apparat ifølge krav 10,karakterisert ved at den parametriske informasjon omfatter en nivåforskjellsverdi og hvor h avledes fra den parametriske nivåforskjellsverdi.
12 Apparat ifølge krav 11,karakterisert ved at h er lik en verdi avledet fra nivåforskjellen dividert med en faktor avhengig av nedblandeoperasj onen.
13 Apparat ifølge krav 10,karakterisert ved at den parametriske informasjon omfatter nivåforskjellen mellom den første kanal og referansekanalen og hvor h er lik 1V2 x io<L/20>, hvor L er nivåforskjellen.
14 Apparat ifølge ett av kravene 1-13,karakterisert ved at den parametriske informasjon videre omfatter et styresignal avhengig av forholdet mellom den første inngangskanal og den andre inngangskanal, og hvor kanselleringskanalkalkulatoren (20) reguleres av styresignalet for aktivt å øke eller minske en energi av kanselleringskanalen eller også deaktivere kansellerings-kanalkalkuleringen fullstendig.
15 Apparat ifølge ett av kravene 1-14,karakterisert ved at nedblandeoperasjonen videre er innrettet for å innføre en tredje inngangskanal til den andre overføringskanal, idet apparatet videre omfatter enda en kombineringsenhet for å kombinere kanselleringskanalen og den andre overføringskanal eller en behandlet versjon derav for å oppnå en tredje basiskanal hvor en påvirkning av den første inngangskanal blir redusert sammenlignet med påvirkningen av den første inngangskanal på den andre overføringskanal, og en kanalrekonstruktør for å rekonstruere den tredje utgangskanal tilsvarende den tredje inngangskanal ved å bruke den tredje basiskanal og den parametriske informasjon tilknyttet den tredje inngangskanal.
16 Apparat ifølge ett av kravene 1-15,karakterisert ved at den parametriske informasjon omfatter interkanalnivåforskjeller, interkanaltids-forskj eller, interkanalfaseforskj eller eller interkanalkorreleringsverdier, og hvor kanalrekonstruktøren (26) er innrettet for å tilføre en av parametrene av ovennevnte gruppe på en basiskanal for å oppnå en rå utgangskanal.
17 Apparat ifølge krav 16,karakterisert ved at kanalrekonstruktøren (26) er innrettet for å skalere den rå utgangskanal slik at den totale energi i den endelige, rekonstruerte utgangskanal er lik den totale energi av E overføringskanaler.
18 Apparat ifølge ett av kravene 1-17,karakterisert ved at den parametriske informasjon gis båndvist og hvor kanselleringskanalkalkulatoren (20), kombineringsenheten (22) og kanalrekonstruktøren (26) er innrettet for å behandle de flere bånd ved å bruke båndvis, gitt parametrisk informasjon, og hvor apparatet videre omfatter en tids/frekvenskonvergeringsenhet (IFB) for å konvertere overføringskanalene til en frekvensgjengivelse med frekvensbånd og en frekvens/tidskonvergeringsenhet for å konvergere rekonstruerte frekvensbånd til tids-domenet.
19 Apparat ifølge ett av kravene 1-18,karakterisert ved at det videre omfatter: et system som velges fra gruppen som består av en digital videospiller, en digital audiospiller, en datamaskin, en satellittmottaker, en kabelmottaker, en terestrial kringkastingsmottaker og et hjemmeunderholdningssystem, og hvor systemet omfatter kanalkalkulatoren, kombineringsenheten og kanal-rekonstruktøren.
20 Fremgangsmåte for å generere et flerkanals utgangssignal med K utgangskanaler, idet flerkanalsutgangssignalet tilsvarer et flerkanals inngangssignal med C inngangskanaler som bruker E overføringskanaler, idet E overføringskanalene representerer et resultat av en nedblandingsoperasjon med C inngangskanaler, som et inngangssignal og som bruker parametrisk informasjon knyttet til inngangskanalene, hvor E > 2, C > E og K > 1 og < C og hvor nedblandeoperasjonen er innrettet for å innføre en første inngangskanal i en første overføringskanal og i en andre overføringskanal og i tillegg innføre en andre inngangskanal i den første overføringskanal,karakterisert ved: beregne (20) en kanselleringskanal ved å bruke informasjon tilknyttet den første inngangskanal omfattet i den første overføringskanal, den andre overføringskanal eller den parametriske informasjon, kombinere (22) kanselleringskanalen og den første overføringskanal eller en behandlet versjon for å oppnå en andre basiskanal hvor en påvirkning av den første inngangskanal blir redusert sammenlignet med påvirkningen av den første inngangskanal på den første overføringskanal, og rekonstruere (26) en andre utgangskanal tilsvarende den andre inngangskanal ved å bruke den andre basiskanal og den parametriske informasjon knyttet til den andre inngangskanal og den første utgangskanal tilsvarende den første inngangskanal ved å bruke den første basiskanal som er forskjellig fra den andre basiskanal ved at påvirkningen av den første kanal er høyere sammenlignet med den andre basiskanal og den parametriske informasjon tilknyttet den første inngangskanal.
21 Dataprogram med en programkode for å implementere under kjøring på en datamaskin en fremgangsmåte for å generere et flerkanals utgangssignal med K utgangskanaler, idet flerkanalsutgangssignalet tilsvarer et flerkanals inngangssignal med C inngangskanaler som bruker E overføringskanaler, idet E overføringskanalene representerer et resultat av en nedblandingsoperasjon med C inngangskanaler, som et inngangssignal og som bruker parametrisk informasjon knyttet til inngangskanalene, hvor E > 2, C > E og K > 1 og < C og hvor nedblandeoperasjonen er innrettet for å innføre en første inngangskanal i en første overføringskanal og i en andre overførings-kanal og i tillegg innføre en andre inngangskanal i den første overføringskanal, idet fremgangsmåten erkarakterisert ved: beregne (20) en kanselleringskanal ved å bruke informasjon tilknyttet den første inngangskanal omfattet i den første overføringskanal, den andre overføringskanal eller den parametriske informasjon, kombinere (22) kanselleringskanalen og den første overføringskanal eller en behandlet versjon for å oppnå en andre basiskanal hvor en påvirkning av den første inngangskanal blir redusert sammenlignet med påvirkningen av den første inngangskanal på den første overføringskanal, og rekonstruere (26) en andre utgangskanal tilsvarende den andre inngangskanal ved å bruke den andre basiskanal og den parametriske informasjon knyttet til den andre inngangskanal og den første utgangskanal tilsvarende den første inngangskanal ved å bruke den første basiskanal som er forskjellig fra den andre basiskanal ved at påvirkningen av den første kanal er høyere sammenlignet med den andre basiskanal og den parametriske informasjon tilknyttet den første inngangskanal.
NO20070034A 2004-07-09 2007-01-02 Generering av et flerkanals utgangssignal NO338725B1 (no)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US58657804P 2004-07-09 2004-07-09
US10/935,061 US7391870B2 (en) 2004-07-09 2004-09-07 Apparatus and method for generating a multi-channel output signal
PCT/EP2005/005199 WO2006005390A1 (en) 2004-07-09 2005-05-12 Apparatus and method for generating a multi-channel output signal

Publications (2)

Publication Number Publication Date
NO20070034L NO20070034L (no) 2007-02-06
NO338725B1 true NO338725B1 (no) 2016-10-10

Family

ID=34966842

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20070034A NO338725B1 (no) 2004-07-09 2007-01-02 Generering av et flerkanals utgangssignal

Country Status (16)

Country Link
US (1) US7391870B2 (no)
EP (1) EP1774515B1 (no)
JP (1) JP4772043B2 (no)
KR (1) KR100908080B1 (no)
CN (1) CN1985303B (no)
AT (1) ATE556406T1 (no)
AU (1) AU2005262025B2 (no)
BR (1) BRPI0512763B1 (no)
CA (1) CA2572989C (no)
ES (1) ES2387248T3 (no)
HK (1) HK1099901A1 (no)
NO (1) NO338725B1 (no)
PT (1) PT1774515E (no)
RU (1) RU2361185C2 (no)
TW (1) TWI305639B (no)
WO (1) WO2006005390A1 (no)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
DE602005005186T2 (de) * 2004-04-16 2009-03-19 Dublin Institute Of Technology Verfahren und system zur schallquellen-trennung
CN1985544B (zh) * 2004-07-14 2010-10-13 皇家飞利浦电子股份有限公司 处理立体声下混合信号的方法、装置、编译码器和系统
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
US7835918B2 (en) * 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
KR101183859B1 (ko) * 2004-11-04 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중채널 오디오 신호들의 인코딩 및 디코딩
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
EP1858006B1 (en) * 2005-03-25 2017-01-25 Panasonic Intellectual Property Corporation of America Sound encoding device and sound encoding method
ATE473502T1 (de) * 2005-03-30 2010-07-15 Koninkl Philips Electronics Nv Mehrkanal-audiocodierung
ATE406651T1 (de) * 2005-03-30 2008-09-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
WO2006126856A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
MX2008000122A (es) * 2005-06-30 2008-03-18 Lg Electronics Inc Metodo y aparato para codificar y descodificar una senal de audio.
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
EP1921606B1 (en) * 2005-09-02 2011-10-19 Panasonic Corporation Energy shaping device and energy shaping method
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
CN101278598B (zh) * 2005-10-07 2011-05-25 松下电器产业株式会社 音频信号处理装置以及音频信号处理方法
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
EP1974348B1 (en) * 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
KR20080093024A (ko) * 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
JP4997781B2 (ja) * 2006-02-14 2012-08-08 沖電気工業株式会社 ミックスダウン方法およびミックスダウン装置
DE602007004451D1 (de) * 2006-02-21 2010-03-11 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
FR2899424A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede de synthese binaurale prenant en compte un effet de salle
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
JP5174027B2 (ja) * 2006-09-29 2013-04-03 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びミックス信号処理方法
JP5232791B2 (ja) * 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
BRPI0715312B1 (pt) * 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
WO2008100100A1 (en) 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
JP5161893B2 (ja) * 2007-03-16 2013-03-13 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
US8032085B2 (en) * 2007-09-10 2011-10-04 Technion Research & Development Foundation Ltd. Spectrum-blind sampling and reconstruction of multi-band signals
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
WO2009135532A1 (en) * 2008-05-09 2009-11-12 Nokia Corporation An apparatus
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
CN102037507B (zh) 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
CN101809656B (zh) * 2008-07-29 2013-03-13 松下电器产业株式会社 音响编码装置、音响解码装置、音响编码解码装置及会议系统
KR20110110093A (ko) * 2008-10-01 2011-10-06 톰슨 라이센싱 디코딩 장치, 디코딩 방법, 인코딩 장치, 인코딩 방법, 및 편집 장치
DE102008056704B4 (de) * 2008-11-11 2010-11-04 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
US8457579B2 (en) 2009-02-18 2013-06-04 Technion Research & Development Foundation Ltd. Efficient sampling and reconstruction of sparse multi-band signals
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP2011002574A (ja) * 2009-06-17 2011-01-06 Nippon Hoso Kyokai <Nhk> 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
EP2367293B1 (en) * 2010-03-14 2014-12-24 Technion Research & Development Foundation Low-rate sampling of pulse streams
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
WO2011135472A2 (en) 2010-04-27 2011-11-03 Technion Research & Development Foundation Ltd. Multi-channel sampling of pulse streams at the rate of innovation
CN103069481B (zh) 2010-07-20 2014-11-05 华为技术有限公司 音频信号合成器
MY156027A (en) 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
CN103460282B (zh) * 2010-08-25 2015-08-19 弗兰霍菲尔运输应用研究公司 用于利用传送的相位信息产生去相关信号的装置
WO2012049591A1 (en) 2010-10-13 2012-04-19 Technion Research & Development Foundation Ltd. Sub-nyquist sampling of short pulses
TWI462087B (zh) * 2010-11-12 2014-11-21 Dolby Lab Licensing Corp 複數音頻信號之降混方法、編解碼方法及混合系統
US20120155650A1 (en) * 2010-12-15 2012-06-21 Harman International Industries, Incorporated Speaker array for virtual surround rendering
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
BR112015028914B1 (pt) * 2013-05-24 2021-12-07 Dolby International Ab Método e aparelho para reconstruir um bloco de tempo/frequência de objetos de áudio n, método e codificador para gerar pelo menos um parâmetro de ponderação, e meio legível por computador
PL3429233T3 (pl) 2013-07-30 2020-11-16 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
US10170125B2 (en) 2013-09-12 2019-01-01 Dolby International Ab Audio decoding system and audio encoding system
US9552819B2 (en) 2013-11-27 2017-01-24 Dts, Inc. Multiplet-based matrix mixing for high-channel count multichannel audio
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN106997768B (zh) * 2016-01-25 2019-12-10 电信科学技术研究院 一种语音出现概率的计算方法、装置及电子设备
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
RU2628198C1 (ru) * 2016-05-23 2017-08-15 Самсунг Электроникс Ко., Лтд. Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения
EP3539127B1 (en) 2016-11-08 2020-09-02 Fraunhofer Gesellschaft zur Förderung der Angewand Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
JP6866679B2 (ja) 2017-02-20 2021-04-28 株式会社Jvcケンウッド 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム
CN115280411A (zh) * 2020-03-09 2022-11-01 日本电信电话株式会社 声音信号缩混方法、声音信号编码方法、声音信号缩混装置、声音信号编码装置、程序及记录介质
JP7385531B2 (ja) * 2020-06-17 2023-11-22 Toa株式会社 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法
CN117476026A (zh) * 2023-12-26 2024-01-30 芯瞳半导体技术(山东)有限公司 一种多路音频数据混音的方法、系统、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583962A (en) * 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
EP1376538A1 (en) * 2002-06-24 2004-01-02 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3577798B2 (ja) * 1995-08-31 2004-10-13 ソニー株式会社 ヘッドホン装置
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6249578B1 (en) * 1998-04-06 2001-06-19 Ameritech Corporation Interactive electronic ordering for telecommunications products and services
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
TW589815B (en) * 2002-01-16 2004-06-01 Winbond Electronics Corp Control method for multi-channel data transmission
ES2273216T3 (es) * 2003-02-11 2007-05-01 Koninklijke Philips Electronics N.V. Codificacion de audio.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583962A (en) * 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
EP1376538A1 (en) * 2002-06-24 2004-01-02 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HERRE J. ET AL: "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio" AES CONVENTION, 8 May 2004 (2004-05-08), Dated: 01.01.0001 *

Also Published As

Publication number Publication date
CN1985303B (zh) 2011-06-15
ES2387248T3 (es) 2012-09-19
WO2006005390A1 (en) 2006-01-19
BRPI0512763A (pt) 2008-04-08
EP1774515B1 (en) 2012-05-02
NO20070034L (no) 2007-02-06
KR20070027692A (ko) 2007-03-09
AU2005262025B2 (en) 2008-10-09
KR100908080B1 (ko) 2009-07-15
US20060009225A1 (en) 2006-01-12
CN1985303A (zh) 2007-06-20
JP2008505368A (ja) 2008-02-21
BRPI0512763B1 (pt) 2018-08-28
CA2572989A1 (en) 2006-01-19
US7391870B2 (en) 2008-06-24
RU2007104933A (ru) 2008-08-20
HK1099901A1 (en) 2007-08-24
ATE556406T1 (de) 2012-05-15
JP4772043B2 (ja) 2011-09-14
EP1774515A1 (en) 2007-04-18
PT1774515E (pt) 2012-08-09
TW200617884A (en) 2006-06-01
AU2005262025A1 (en) 2006-01-19
CA2572989C (en) 2011-08-09
TWI305639B (en) 2009-01-21
RU2361185C2 (ru) 2009-07-10

Similar Documents

Publication Publication Date Title
NO338725B1 (no) Generering av et flerkanals utgangssignal
KR101215872B1 (ko) 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩
CA2593290C (en) Compact side information for parametric coding of spatial audio
US7644003B2 (en) Cue-based audio coding/decoding
US8340306B2 (en) Parametric coding of spatial audio with object-based side information
NO344091B1 (no) Kompatibel flerkanal-koding/dekoding.