NO342804B1 - Kompatibel flerkanal-koding/dekoding - Google Patents
Kompatibel flerkanal-koding/dekoding Download PDFInfo
- Publication number
- NO342804B1 NO342804B1 NO20061898A NO20061898A NO342804B1 NO 342804 B1 NO342804 B1 NO 342804B1 NO 20061898 A NO20061898 A NO 20061898A NO 20061898 A NO20061898 A NO 20061898A NO 342804 B1 NO342804 B1 NO 342804B1
- Authority
- NO
- Norway
- Prior art keywords
- channel
- downmix
- side information
- original
- channels
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims description 35
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 239000002131 composite material Substances 0.000 claims 1
- 239000011159 matrix material Substances 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 7
- 238000005192 partition Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Error Detection And Correction (AREA)
- Executing Machine-Instructions (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Ved behandling av et flerkanals audiosignal med minst tre opprinnelige kanaler, blir en første nedblandekanal og en andre nedblandekanal tilveiebrakt (12) som avledes fra de opprinnelige kanaler. For en valgt, opprinnelig kanal av de opprinnelige kanaler, blir kanalsideinformasjonen beregnet (14) slik at en nedblandekanal eller en kombinert nedblandekanal med første og andre nedblandekanaler under vekting ved å bruke kanalsideinformasjonen, fører til en approksimering av den valgte, opprinnelige kanal. Kanalsideinformasjonen og de første og andre nedblandekanaler danner utgangsdata (20) for overføring til en dekoder som for en lavnivådekoder bare dekoder de første og andre nedblandekanaler, eller i tilfellet av en høynivådekoder, tilveiebringer et fullstendig flerkanals audiosignal basert på nedblandekanalene og kanalsideinformasjonen. Siden kanalsideinformasjonen bare opptar et lite antall biter og siden dekoderen ikke bruker dematrising, oppnås en effektiv og høykvalitativ flerkanals forlengelse for stereospillere og forbedrede flerkanalsspillere.
Description
Fagfelt
Oppfinnelsen angår et apparat og en fremgangsmåte for å behandle et flerkanals audiosignal og især et apparat og en fremgangsmåte for å behandle et flerkanals audiosignal nal på en stereokompatibel måte.
Bakgrunn
Flerkanals audioreproduseringsteknikker er blitt stadig viktigere. Dette kan skyldes at audiokompresjon/kodeteknikker, for eksempel den kjente mp3-teknikken har gjort det mulig å distribuere audioinnspillinger via Internet eller andre overførings-kanaler med en begrenset båndbredde. mp3-kodeteknikken er blitt så kjent på grunn av at denmuliggjør distribusjon av alle innspillinger i et stereoformat, dvs. en digital gjengivelse av audioinnspillingen med en første eller venstre stereokanal og en andre eller høyre stereokanal.
Uansett finnes det en grunnleggende ulempe med konvensjonelle tokanals lyd-systemer. Dette førte til utviklingen av surround-teknikken. En anbefalt, flerkanals-surround-gjengivelse omfatter, i tillegg til de to stereokanaler L og R, en senterkanal C og to surround-kanaler Ls, Rs. Dette referanselydformatet kalles også tre/to-stereo som innebærer tre frontkanaler og to surround-kanaler. Generelt kreves det fem over-føringskanaler. I et avspillingsmiljø trengs det minst fem høyttalere på deres fem forskjellige steder for å få et optimalt lyttested i en bestemt avstand fra de fem, godt plassertehøyttalere.
Flere teknikker er kjent for å redusere mengden av data som kreves for over-føringen av et flerkanals lydsignal. Slike teknikker kalles samlestereoteknikker. For å oppnå dette henvises det til fig. 10 som viser en samlestereoenhet 60. Denne enhet kan være en enhet som implementerer for eksempel intensitetsstereo (IS) eller "binaural cuecoding" (BCC). En slik enhet mottar generelt minst to kanaler (CHI, CH2, ... CHn) og sender ut en enkelt bærerkanal og parametriske data. De parametriske data defineres slik at en approksimering av en opprinnelig kanal (CHI, CH2, ... CHn) kan bli beregnet i en dekoder.
Normalt vil bærerkanalen omfatte delbåndsampler, spektralkoeffisienter, tidsdomenesampler osv., som gir en relativt fin gjengivelse av det underliggende signal, mens parameterdataene ikke omfatter slike sampler av spektralkoeffisienten men snarere styrer parametere for å regulere en bestemt rekonstruksjonsalgoritme, for eksempel veiing ved multiplisering, tidsforskyvning, frekvensforskyvning, ... De parametriske data omfatter derfor bare en relativt grov gjengivelse av signalet eller den tilhørende kanal. Istørrelse vil mengden av data som kreves av en bærerkanal være i området 60-70 kbit/s mens mengden av data som kreves av parametersideinformasjon for en kanal vil være mellom 1,5-2,5 kbit/s. Et eksempel på parameterdata er de kjente skaleringsfaktorer, intensitetsstereoinformasjon eller binaural cue parametere, som beskrevet nedenfor.
Intensitetsstereokoding er beskrevet i AES-utkastet 3799 "Intensity stereo coding", J. Herre, K.H. Brandenburg, D. Lederer, februar 1994, Amsterdam. Generelt er ideen med intensitetsstereo basert på at en hovedakse omdanner tilføres data til begge de stereofoniske lydkanalene. Hvis de fleste datapunkter er konsentrert rundt den førstehovedakse, kan en kodegevinst oppnås ved å dreie begge signalene i en viss vinkel før kodingen. Dette er imidlertid ikke alltid tilfelle for virkelig stereoproduk-sjonsteknikker. Følgelig modifiseres denne teknikk ved å utelukke den andre, orto-gonale komponent fra overføringen i bitstrømmen. Således består de rekonstruerte signalene fra venstre og høyre kanal av forskjellige vektede eller skalerte versjoner av det samme, overførte signal. Uansett skiller de rekonstruerte signalene seg i deres amplitude, men er identiske når det gjelder deres faseinformasjon. Energi-tid-enelop-pene av begge de opprinnelig lydkanaler opprettholdes imidlertid ved hjelp av den selektive skalering som typisk opererer på frekvensselektiv måte. Dette samsvarer med den menneskelige oppfattelsen av lyd ved høyere frekvenser hvor de dominerende, spatiale stikknoter bestemmes avenergienveloppene.
I tillegg, og i praksis, genereres det overførte signalet, dvs. bærerkanalen fra det summerte signal av venstre og høyre kanal i stedet for å dreie begge komponentene. Videre utføres denne behandling, dvs. generering av intensitetsstereoparametere for å utføre skaleringen, frekvensselektivt, dvs. uavhengig av hvert skaleringsfaktorbånd, dvs.koderfrekvenspartisjonen. Fortrinnsvis kombineres begge kanalene for å danne en kombinert eller "bærer"-kanal og i tillegg til den kombinerte kanal blir intensitetsstereoinformasjonen avgjort avhengig av energien av den første kanal, energien av den andre kanal eller energien av den kombinerte kanal.
BCC-teknikken er beskrevet i AES-konvensjonsdokumentet 5574, "Binaural cuecoding applied to stereo and multichannel audio compression", C. Faller, F. Baumgarte, mai 2002, Miinchen. I BCC-koding blir et antall audioinngangskanaler konvertert til en spektral gjengivelse ved å bruke en DFT-basert omforming med overlappende vinduer. Det resulterende, ensartede spektrum blir delt inn i ikke-overlappende partisjoner som hver har en indeks. Hver partisjon har en båndbredde som er proporsjonal med dentilsvarende rektangulære båndbredde (ERB). Mellomkanalnivåforskjellene (ICLD) og mellomkanaltidsforskjellene (ICTD) beregnes for her partisjon for hver pakke k. ICLD og ICTD kvantiseres og kodes til en BCC-bitstrøm. Mellomkanalnivåforskjellene og mellomkanaltidsforskjellene blir gitt for hver kanal i forhold til referansekanalen. Deretter beregnes parametrene i samsvar med foreskrevne formler som avhenger av de enkeltepartisjoner av signalet som skal behandles.
På dekodersiden mottar dekoderen et monosignal og BCC-bitstrømmen. Monosignalet blir omdannet til frekvensdomene og sendt til en spatial synteseblokk som også mottar dekodede ICLD- og ICTD-verdier. I spatialsynteseblokken blir BCC-parameterverdiene (ICLD og ICTD) for å utføre en veiet operasjon av monosignalet for å syntetisere flerkanalssignalene som, etter en frekvens/tidskonvertering gir en rekonstruksjon av det opprinnelige flerkanalslydsignalet.
Når det gjelder BCC kan den samlede stereomodul 60 brukes for å sende kanalsideinformasjon, slik at parameterkanaldataene blir kvantisert og kodet til ICLD-eller ICTD-parametere hvor en av de opprinnelige kanaler brukes som referansekanal for koding av kanalsideinformasjon.
Normalt formes bærerkanalen av summen av de tiltakende, opprinnelige kanaler.
Naturligvis gir de ovennevnte teknikker bare en monogjengivelse for en dekoder som bare kan behandle bærerkanalen men som ikke erstatter behandling av parameterdataene for å generere en eller flere approksimasjoner av mer enn en inngangskanal.
For å overføre de fem kanalene på en kompatibel måte, dvs. i et bitstrømformat som også kan forstås av en normal stereodekoder, har den såkalte matriseteknikk blitt brukt som beskrevet i "MUSICAM-surround: et universalt flerkanals kodesystem kompatibelt med ISO 11172-3", G. Theile og G. Stoll, .AES-utkast 3403, oktober 1992,San Francisco. De fem inngangskanaler L, R, C, Ls og Rs mates inn i matriseenheten som utfører en matriseoperasjon for å beregne grunnstereokanalene eller de kompatible stereokanalene Lo, Ro fra de fem inngangskanaler. Især beregnes disse grunnleggende stereokanaler Lo/Ro som beskrevet nedenfor:
hvor x og y er konstanter. De andre tre kanalene C, Ls, Rs blir overført som de er i et forlengelseslag, i tillegg til et basisstereolag som omfatter en kodet versjon avbasisstereosignalene Lo/Ro. Når det gjelder bitstrømmen omfatter dette Lo/Ro-basisstereolag en tittelinformasjon, for eksempel skaleringsfaktorer og delbåndsampler. Multikanalforlengelseslaget, dvs. sentralkanalen og de to surround-kanalene er omfattet i flerkanalens forlengede felt som også kalles tilleggsdatafelt.
På dekodersiden blir en omvendt matriseoperasjon utført for å danne rekon-struksjoner av venstre og høyre kanal i 5-kanalsgjengivelsen ved å bruke basisstereo- kanalene Lo, Ro og de tre tilleggskanalene. I tillegg blir de tre tilleggskanalene dekodet fra tilleggsinformasjonen for å oppnå en dekodet 5-kanals- eller surround gjengivelse av det opprinnelige flerkanals lydsignalet.
En annen fremgangsmåte for flerkanalskoding; er beskrevet i publikasjonen "Improved MPEG-2 audio multi-channel encoding", B. Grill, J. Herre, K.H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES-utkast 3865, februar 1994, Amsterdam, hvor bakoverkompatible moduser vurderes for å oppnå bakoverkom-patibilitet. For å oppnå dette brukes en kompatibilitetsmatrise for å oppnå to såkalte nedblandekanaler Lc, Rc fra de opprinnelige fem inngangskanaler. Videre er det mulig å velge dynamisk tre hjelpekanaler som overføres som tilleggsdata.
For å utnytte stereoirrelevans, brukes en samlet stereoteknikk til grupper av kanaler, dvs. de tre frontkanalene, dvs. for venstre kanal, høyre kanal og midtkanalen. Forå oppnå dette blir disse tre kanalene kombinert for å oppnå en kombinert kanal. Denne kombinerte kanal kvantiseres og pakkes inn i bitstrømmen. Deretter blir denne kombinerte kanal sammen med tilsvarende samlet stereoinformasjon sendt til en dekodingsmodul for samlet vurdering for å oppnå samlede stereodekodede kanaler, dvs. en samlet stereodekodet venstrekanal, en samlet stereodekodet høyrekanal og en samlet stereodekodet midtkanal. Disse samlede stereodekodede kanaler blir, sammen med venstre surroundkanal og høyre surroundkanal sendt til en kompatibilitetsmat-riseblokk for å danne første og andre nedblandekanaler Lc, Rc. Deretter blir kvantiserte versjoner av begge nedblandekanaler og en kvantisert versjon av den kombinerte kanal pakket inn i bitstrømmen sammen med de sammenføyde stereokodeparametere.Ved å bruke intensitetsstereokoding blir følgelig en gruppe av uavhengige, opprinnelige kanalsignaler sendt i en enkelt porsjon av "bærer"-data. Dekoderen vil så rekonstruere de aktuelle signaler som identiske data som blir omskalert ifølge deres opprinnelige energi-tid-envelopper. Følgelig vil en lineær kombinasjon av de sendte kanaler føre til resultater som er helt forskjellige i forhold til den opprinneligenedblanding. Dette gjelder enhver type av sammenføyd, stereokoding basert på intensitetsstereokonseptet. For et kodesystem som leverer kompatible nedblandekanaler vil dette får en direkte konsekvens. Gjengivelsen ved avmatrising som beskrevet i den foregående publikasjon lider av unaturligheter forårsaket av den utilfredsstillende rekonstruksjon. Ved å bruke et såkalt samlet stereo for-distorsjonsopplegg hvor en sammenføydstereokoding av venstre, høyre og midtkanalene utføres før matrising i koderen, kan dette minske problemet. På denne måte vil avmatriseopplegget for rekonstruksjonen medføre færre kunstgrep siden de samlede stereodekodede signalene på kodesiden har blitt brukt for å generere nedblandekanalen. Således blir den ikke-perfekte rekonstruksjon forflyttet inn i de kompatible nedblandekanalene Lc og Rc hvor den mer sannsynligvis vil bli maskert av selve lydsignalet.
Selv om et slikt system har ført til færre kunstgrep på grunn av dematriseringen av dekodersiden vil det uansett ha enkelte ulemper. En ulempe er at de stereokompatible nedblandekanalene Lc og Rc ikke blir avledet fra de opprinnelige kanalene men fra intensitetsstereokodede/dekodede versjoner av de opprinnelige kanalene. Følgelig blir datatappå grunn av intensitetsstereokodesystemet omfattet i de kompatible nedblandekanalene. En stereodekoder som bare dekoder de kompatible kanalene snarere enn de forbedrede intensitetsstereokodede kanaler vil derfor være et utgangssignal som blir påvirket av intensitetsstereoinduserte datatap. I tillegg må en full tilleggskanal overføres ved siden av de to nedblandekanalene. Denne kanal er den kombinerte kanal som dannes ved hjelp av en sammenføyd stereokoding av venstre, høyre og midtkanalen. I tillegg må også intensitetsstereoinformasjonen for å rekonstruere de opprinnelige kanaler L, R, C fra den kombinerte kanal også overføres til dekoderen. Ved dekoderen utføres en omvendt matrising, det vil si en dematrising utføres for å avlede surround-kanalene fra de to nedblandekanaler. I tillegg blir de opprinnelige venstre, høyre og midtkanaler approksimert ved sammenføyd stereodekoding ved å bruke den overførte kombinerte kanal og de overførte, sammenføyde stereoparametere. Det skal bemerkes at den opprinnelige venstre, høyre og midtkanal avledes av den sammenføyde stereodekoding av den kombinerte kanal.
Oppsummering
Det er et formål med oppfinnelsen å tilveiebringe et konsept for en biteffektiv og kunstgrepreduserende behandling eller omvendt behandling av et flerkanals audiosignal.
Ifølge et første aspekt ved oppfinnelsen oppnås dette formål av apparat for å behandle et flerkanals audiosignal med minst tre opprinnelige kanaler: anordning for å tilveiebringe en første nedblandekanal og en andre nedblandekanal, idet første og andre nedblandekanaler avledes fra de opprinnelige kanaler; anordning for å beregne kanalsideinformasjonen for en valgt, opprinnelig kanal av de opprinnelige signaler, idet anordningen for å beregne kan beregne kanalsideinformasjonen slik at en nedblandekanal eller en kombinert nedblandekanal med første og andre nedblandekanal når den er vektetved å bruke kanalsideinformasjonen, fører til en approksimasjon av den valgte, opprinnelige kanal; og anordning for å generere utgangsdata omfattende kanalsideinformasjon, den første nedblandekanal eller et signal avledet fra den første nedblandekanal og den andre nedblandekanal, eller et signal avledet fra den andre nedblandekanal. Det henvises i denne sammenheng til krav 1 av det tilhørende kravsett.
Ifølge et andre aspekt ved oppfinnelsen oppnås dette formål ved en fremgangsmåte for å behandle et flerkanals audiosignal med minst tre opprinnelige kanaler som omfatter: tilveiebringe en første nedblandekanal og en andre nedblandekanal, idet disse avledes fra de opprinnelige kanaler; beregne kanalsideinformasjonen for en valgt, opprinnelig kanal av de opprinnelige signaler, slik at en nedblandekanal eller en kombinert nedblandekanal med den første og andre nedblandekanal når den er vektet vedå bruke kanalsideinformasjonen, fører til en approksimasjon av den valgte, opprinnelige kanal; og generere utgangsdata med kanalsideinformasjonen, den første nedblandekanal eller et signal avledet fra den første nedblandekanal og den andre nedblandekanal eller et signal avledet fra den andre nedblandekanal. I denne sammenheng henvises til fremgangsmåtekrav 21 av tilhørende kravsett.
Ifølge et tredje aspekt ved oppfinnelsen (se krav 22 av tilhørende kravsett) oppnås dette formål av et apparat for omvendt behandling av inngangsdata med kanalsideinformasjon, en første nedblandekanal eller et signal avledet fra den første nedblandekanal og en andre nedblandekanal eller et signal avledet fra den andre nedblandekanal, idet den første nedblandekanal og en andre nedblandekanal avledes fra minst tre opprinnelige kanaler av et flerkanals audiosignal og hvor kanalsideinformasjon beregnes slik at en nedblandekanal eller en kombinert nedblandekanal med den første nedblandekanal og den andre nedblandekanal, når den er vektet ved å bruke kanalsideinformasjonen, fører til en approksimasjon av den valgte, opprinnelige kanal, idet apparatet omfatter; en inngangsdataleser for å lese inngangsdataene for å oppnå den første nedblandekanal eller et signal avledet fra denførste nedblandekanal og den andre nedblandekanal eller et signal avledet fra den andre nedblandekanal og kanalsideinformasjonen; og en kanalrekonstruktør for å rekonstruere approksimasjonen av den valgte, opprinnelige kanal ved å bruke kanalsideinformasjonen og nedblandekanalen eller den kombinerte nedblandekanal for å oppnå approksimasjonen av den valgte, opprinnelige kanal.
Ifølge et fjerde aspekt ved oppfinnelsen oppnås dette formål ved en fremgangsmåte med omvendt behandling av inngangsdata med kanalsideinformasjon, en første nedblandekanal eller et signal avledet fra den første nedblandekanal og en andre nedblandekanal eller et signal avledet fra den andre nedblandekanal, idet den første nedblandekanal og den andre nedblandekanal avledes fra minst tre opprinnelige kanaler av et flerkanalsaudiosignal og hvor kanalsideinformasjon beregnes slik at en nedblandekanal eller en kombinert nedblandekanal med den første nedblandekanal og den andre nedblandekanal, når den veies, ved å bruke kanalsideinformasjonen, fører til en approksimasjon av den valgte, opprinnelige kanal, idet fremgangsmåten omfatter; lese inngangsdataene for å oppnå den første nedblandekanal eller et signal avledet fra den første nedblandekanal ogden andre nedblandekanal eller et signal avledet fra den andre nedblandekanal og kanalsideinformasjonen; og rekonstruere approksimasjonen av den valgte, opprinnelige kanal ved å bruke kanalsideinformasjonen og nedblandekanalen eller den kombinerte nedblandekanal for å oppnå approksimasjonen av den valgte, opprinnelige kanal. Her henvises det til tilsvarende krav 27 av tilhørende kravsett.
Ifølge et femte aspekt ved oppfinnelsen og et sjette aspekt oppnås dette formål med et dataprogram som omfatter fremgangsmåten med behandling eller fremgangsmåten med omvendt behandling. Her henvises det til krav 28 av tilhørende kravsett.
Oppfinnelsen er basert på å finne at en effektiv og kunstgrepreduserende koding av flerkanals audiosignal oppnås når to nedblandekanaler fortrinnsvis som representerer venstre og høyre stereokanaler, blir pakket inn i utgangsdata.
Ifølge oppfinnelsen blir parameterkanalsideinformasjon for en eller flere av de opprinnelige kanaler avledet slik at de relateres til flere av nedblandekanalene snarere enn, som tidligere, til en ekstra "kombinert" samlet stereokanal. Dette innebærer at parameterkanalsideinformasjon blir beregnet slik at kanalrekonstruktør, på dekodersiden, bruker kanalsideinformasjonen og en av nedblandekanalene eller en kombinasjon av nedblandekanalene for å rekonstruere en approksimasjon av den opprinnelige audiokanal som kanalsideinformasjonen er tildelt.
Det nye konsept er fordelaktig ved at det tilveiebringer en biteffektiv flerkanalforlengelse, slik at et flerkanals audiosignal kan spilles av ved en dekoder.
I tillegg er det nye konsept bakoverkompatibelt siden en lavere skaleringsdekoder som bare er tilpasset for tokanalbehandling ganske enkelt kan ignorere forlengelsesinformasjonen, dvs. kanalsideinformasjonen. Den lavere skaleringsdekoder kan bare spille av de to nedblandekanaler for å oppnå en stereogjengivelse av det opprinnelige, flerkanalsaudiosignal. En høyere skaleringsdekoder, som imidlertid er aktivert for flerkanalsbruk, kan bruke den overførte kanalsideinformasjon for å rekonstruere approksimasjoner av de opprinnelige kanaler.
Oppfinnelsen er fordelaktig ved at den er biteffektiv siden ingen ekstra bærerkanal utenfor de første og andre nedblandekanaler Lc, Rc er nødvendig, i motsetning til tidligere teknikk. I stedet blir kanalsideinformasjonen relatert til en eller begge nedblandekanalene. Dette innebærer at nedblandekanalene selv kun tjener som en bærerkanal som kanalsideinformasjonen kombineres til for å rekonstruere en opprinnelig audiokanal. Dette innebærer at kanalsideinformasjonen fortrinnsvis er parametersideinformasjonen, dvs. informasjon som ikke omfatter eventuelle delbåndsampler eller spektralkoeffisienter. I stedet er parametersideinformasjonen en funksjon som brukes for veiing (i tid og/eller frekvens) av den respektive nedblandekanal eller kombinasjonen av de respektive nedblandekanaler for å oppnå en rekonstruert versjon av en valgt, opprinnelig kanal.
I en foretrukket utførelse av oppfinnelsen oppnås en bakover kompatibel koding av et flerkanalsignal basert på et kompatibelt stereosignal. Fortrinnsvis blir det kompatible stereosignal (nedblandesignalet) generert ved å bruke matrising av de opprinnelige kanalene av flerkanalsaudiosignalet.
I oppfinnelsen oppnås kanalsideinformasjon for en valgt, opprinnelig kanal basert på samlede stereoteknikker, for eksempel intensitetsstereokoding eller "binaural cuecoding". Således er det ikke nødvendig med noen dematrising på dekodersiden. Problemene i forbindelse med dematrising, dvs. enkelte kunstgrep knyttet til uønsket fordeling av kvantiseringsstøy i dematrisingsoperasjoner, unngås. Dette på grunn av at dekoderen bruker en kanalrekonstruktør som rekonstruerer et opprinnelig signal ved å bruke en av nedblandekanalene eller en kombinasjon av nedblandekanaler og den over-førte kanalsideinformasjonen.
Fortrinnsvis brukes det nye konsept på et flerkanals audiosignal fem kanaler. Disse fem kanalene er en venstrekanal L, en høyrekanal R, en senterkanal C, en venstre surroundkanal Ls og en høyre surroundkanal Rs. Fortrinnsvis er nedblandekanalene stereokompatible nedblandekanaler Ls og Rs som leverer en stereogjengivelse av det opprinnelige flerkanal-audiosignal.
Ifølge den foretrukne utførelse av oppfinnelsen blir kanalsideinformasjonen, for hver opprinnelig kanal, beregnet ved en kodeside pakket inn i utgangsdata. Kanalsideinformasjonen for den opprinnelige venstrekanal avledes ved å bruke venstre ned-blandekanal. Kanalsideinformasjonen for den opprinnelige venstre surroundkanal blir avledet ved å bruke den venstre nedblandekanal. Kanalsideinformasjonen for den opprinnelige høyrekanal avledes fra den høyre nedblandekanal. Kanalsideinformasjonen for den opprinnelige høyre surroundkanal blir avledet fra den høyre nedblandekanal.
Ifølge den foretrukne utførelse av oppfinnelsen avledes kanalinformasjonen for den opprinnelig sendte kanal ved å bruke den første nedblandekanal samt den andre nedblandekanal, for eksempel ved å bruke en kombinasjon av de to nedblandekanaler. Fortrinnsvis er denne kombinasjon en summering.
Således er grupperingene, dvs. forholdet mellom kanalsideinformasjonen og bærersignalet, dvs. den brukte nedblandekanal for å tilveiebringe kanalsideinformasjon for en valgt, opprinnelig kanal slik at en bestemt nedblandekanal blir valgt for optimal kvalitet, og som inneholder den høyest mulige relative mengde av det respektive, opprinnelige flerkanalssignalet som representeres av kanalsideinformasjonen. Som sådant brukes et samlet stereobærersignal og første og andre nedblandekanaler. Fortrinnsvis kan også summen av første og andre nedblandekanaler brukes. Naturligvis kan summen av første og andre nedblandekanaler brukes for å beregne kanalsideinformasjonen for hver av de opprinnelige kanaler. Fortrinnsvis brukes imidlertid summen av nedblandekanalene for å beregne kanalsideinformasjonen av den opp rinnelige senterkanal i et surround-miljø, for eksempel 5-kanal-surround, 7-kanal-surround, 5.1-surround eller 7.1-surround. Bruken av summen av første og andre nedblandekanaler er spesielt fordelaktig siden ingen ekstraoverføringstittel må utføres. Dette på grunn av at begge nedblandekanalene er til stede ved dekoderen, slik at summeringen av disse nedblandekanalene lett kan utføres ved dekoderen uten ekstra overføringsbiter.
Fortrinnsvis vil kanalsideinformasjonen som danner flerkanalsforlengelsen sendt til utgangsdatabitstrømmen på en kompatibel måte, slik at en lavere skalerings-dekoderganske enkelt ignorerer flerkanalsforlengelsesdataene og bare leverer en stereogjengivelse av flerkanalaudiosignalet. Uansett vil en høyere skaleringskoder ikke bare bruke to nedblandekanaler, men i tillegg bruke kanalsideinformasjonen for å rekonstruere en full flerkanals gjengivelse av det opprinnelige audiosignal.
En ny dekoder vil først dekode begge nedblandekanaler og avlese kanalsideinformasjonen for de valgte, opprinnelige kanaler. Deretter blir kanalsideinformasjonen og nedblandekanalene brukt for å rekonstruere approksimasjoner av de opprinnelige kanaler. For å oppnå dette vil fortrinnsvis ingen dematrising utføres i det hele tatt. Dette innebærer at hver av de for eksempel fem opprinnelige inngangskanaler i denne utførelse blir rekonstruert ved å bruke for eksempel fem sett av forskjellige kanalsideinformasjon. Idekoderen utføres samme gruppering som i koderen for å beregne den rekonstruerte kanalapproksimasjon. I et 5-kanal surround-miljø innebærer dette for å rekonstruere den opprinnelige venstrekanal, at venstre nedblandekanal og kanalsideinformasjon for den venstre kanal blir brukt. For å rekonstruere den opprinnelige høyrekanal blir den høyre nedblandekanal og kanalsideinformasjonen for høyre kanal, brukt. For å rekonstruere den opprinnelige venstre surroundkanal blir venstre nedblandekanal og kanalsideinformasjonen for den venstre surroundkanal brukt. For å rekonstruere den opprinnelige høyre surroundkanal, blir kanalsideinformasjon for den høyre surroundkanal og den høyre nedblandekanal, brukt. For å rekonstruere den opprinnelige senterkanal, blir en kombinertkanal dannet av den første nedblandekanal og den andre nedblandekanal og senterkanalsideinformasjonen, brukt.
Naturligvis er det også mulig å spille tilbake første og andre nedblandekanaler som venstre og høyre kanal, slik at bare tre sett (av f.eks. fem) av kanalsideinformasjonsparametere behøver å overføres. Dette er imidlertid bare tilrådelig i situasjoner hvor det finnes mindre strenge regler for kvalitet. Dette på grunn av at venstre og høyre nedblandekanal normalt er forskjellig fra den opprinnelige venstre og høyre kanal. Bare i situasjoner hvor man ikke har anledning til å overføre kanalsideinformasjon for å bære de opprinnelige kanalene, er en slik behandling fordelaktig.
Kort omtale av figurene
Oppfinnelsen skal nå beskrives nærmere i det følgende under henvisning til utførelser, hvor: fig. 1 er et blokkskjema over en foretrukket utførelse av den nye koder, fig. 2 er et blokkskjema av en foretrukket utførelse av den nye dekoder,
fig. 3A er et blokkskjema av en foretrukket implementering av anordningen for å beregne for å oppnå frekvensselektiv kanalsideinformasjon,
fig. 3B er en foretrukket utførelse av en kalkulator som implementerer samlet stereobehandling, for eksempel intensitetskoding eller "binaural cue coding",
fig. 4 viser en annen foretrukket utførelse av anordningen for å beregne kanalsideinformasjon hvor kanalsideinformasjonen er forsterkningsfaktorer,
fig. 5 illustrerer en foretrukket utførelse av en implementering av dekoderen når 25 koderen implementeres som vist på fig. 4,
fig. 6 viser en foretrukket implementering av anordningen for å tilveiebringe nedblandekanaler,
fig. 7 viser grupperinger av opprinnelige og nedblandekanaler for å beregne kanalsideinformasjonen for de respektive, opprinnelige kanaler,
fig. 8 viser en annen foretrukket utførelse av en ny koder,
fig. 9 viser en annen implementering av en ny dekoder, og fig. 10 viser en sammenføyd stereodekoder av gjeldende teknikk.
Detaljert beskrivelse
Fig. 1 viser et apparat for å behandle et flerkanals audiosignal 10 ved minst tre opprinnelige kanaler, for eksempel R, L og C. Fortrinnsvis har det opprinnelige audiosignal mer enn tre kanaler, for eksempel fem kanaler i surround-miljøet, som vist på fig. 1. De fem kanalene er venstrekanal L, høyrekanal R, senterkanalen C og venstre surroundkanal Ls og høyre surroundkanal Rs. Det nye apparatet omfatter anordning 12 for å tilveiebringe en første nedblandekanal Lc og en andre nedblandekanal Rc, idet første og kanalene fra de opprinnelige kanaler finnes det flere muligheter. En mulighet er å avlede nedblandekanalene Lc og Rc ved hjelp av matrising av de opprinnelige kanaler ved å bruke matriseoperasjonen som vist på fig. 6. Denne matriseoperasjon utføres i tidsdomenet.
Matriseparametrene a, b og t velges slik at de er lavere eller lik 1. Fortrinnsvis er a og b 0,7 eller 0,5. Den totale vektingsparameter t velges fortrinnsvis slik at kanal-klipping unngås.
Alternativt som vist på fig. 1, kan nedblandekanalene Lc og Rc også leveres eksternt. Dette kan utføres når nedblandekanalene Lc og Rc er resultatet av en "håndblande"-operasjon. I dette tilfellet blander lydteknikeren ned blandekanalene selv snarere enn ved å bruke automatisert matriseoperasjon. Lydteknikeren utfører kreativ blanding for å oppnå optimale nedblandekanaler Lc og Rc som gir best mulig stereogjengivelse av det opprinnelige flerkanals audiosignal.
I tilfellet en ekstern tilførsel av nedblandekanaler, utfører anordningen ikke en 15 matriseoperasjon men videresender ganske enkelt de eksternt tilførte nedblandekanalene til en etterfølgende beregningsanordning 14.
Beregningsanordningen 14 kan beregne kanalsideinformasjonen for eksempel 1, lsi, ri, eller rsi, for valgte, opprinnelige kanaler, så som L, Ls, R eller Rs. Især kan anordningen 14 for beregning beregne kanalsideinformasjon, slik at en nedblandekanal, når den veies ved å bruke kanalsideinformasjon, fører til en approksimasjon av den valgte, opprinnelige kanal.
Alternativt, eller i tillegg, kan anordningen for å beregne kanalsideinformasjonen brukes for å beregne kanalsideinformasjonen for en valgt, opprinnelig kanal, slik at den kombinerte nedblandekanal omfatter en kombinasjon av første og andre nedblandekanaler, som når de veies, ved å bruke den beregnede kanalsideinformasjonen, fører til en approksimasjon av den valgte, opprinnelige kanal. For å vise denne egenskap på figuren, er det vist en tilleggingsenhet 14a og en kombinert kanalsideinformasj onskalkulator 14b.
Det vil fremgå for en fagmann at disse elementene ikke behøver implementeres som atskilte elementer. I stedet kan hele funksjonaliteten av blokkene 14, 14a og 14b implementeres av en prosessor som kan være en generell prosessor eller en annen anordning for å utføre den ønskede funksjonalitet.
I tillegg skal det bemerkes at kanalsignalene er delbåndsampler eller frekvensdomeneverdier som indikert med store bokstaver. Kanalsideinformasjonen er i motsetning til selve kanalene, vist med små bokstaver. Kanalsideinformasjonen c; erfølgelig kanalsideinformasjonen for den opprinnelige senterkanal C.
Kanalsideinformasjonen, samt nedblandekanalene Lc og Rc eller en kodet versjon Lc' og Rc' som produsert av en lydkoder 16, blir sendt til en utgangsdata-formaterer 18. Generelt virker utgangsdataformatereren 18 som anordning for å generere utgangsdata, herunder kanalsideinformasjon for minst en opprinnelig kanal, den første nedblandekanal eller et signal som avledes fra den første nedblandekanal (f.eks. en kodet versjon derav) og den andre nedblandekanal eller signal avledet fra den andre nedblandekanal (f.eks. en kodet versjon derav.)
Utgangsdataene eller utgangsbitstrømmen 20 kan deretter overføres til enbitstrømdekoder eller kan lagres eller distribueres. Fortrinnsvis er utgangsbit-strømmen 20 en kompatibel bitstrøm som også kan leses av en lavere skaleringsdekoder som ikke har en flerkanals forlengelsesmulighet. Slike lavere skaleringskodere, for eksempel de fleste normale, eksisterende mp3-dekodere, vil ganske enkelt ignorere flerkanalsforlengelsesdata, dvs. kanalsideinformasjon. De vil bare dekode første og andre nedblandekanaler for å produsere et stereosignal. Høyre skaleringsdekodere, for eksempel flerkanalsaktiverte dekodere vil avlese kanalsideinformasjonen og vil deretter generere en opprinnelig approksimasjon av de opprinnelige audiokanaler, slik at det oppnås en flerkanals audiogjengivelse. Fig. 8 viser en foretrukket utførelse av oppfinnelsen i miljøet med 5-kanals-surround/mp3. Her er det foretrukket surround-forbedrende data inn i tilleggsdatafeltet i den standardiserte mp3-bitstrømsyntaks, slik at det oppnås en "mp3-surround"-bitstrøm. Fig. 2 viser en illustrasjon av en ny dekoder som virker som et apparat for omvendt behandling av inngangsdata mottatt ved inngangsdataporten 22. Dataene mottatt ved inngangsdataporten 22 er de samme data som ble sendt ved utgangs-dataporten 20 på fig. 1. Når dataene ikke sendes via en fysisk kanal men via en trådløs kanal, blir alternativt dataene mottatt ved datainngangsporten 22 avledet fra de opprinnelige dataene produsert av koderen.
Dekoderinngangsdataene blir sendt inn i en datastrømleser 24 for å avlese inngangsdataene for til slutt å oppnå kanalsideinformasjonen 26 og den venstre ned-blandekanal 28 og den høyre nedblandekanal 30. Når inngangsdataene omfatter kodede versjoner av nedblandedataene som tilsvarer tilfellet hvor audiokoderen 16 på fig. 1 er til stede, vil datastrømleseren 24 også omfatte en audiodekoder som er tilpasset audiokoderen brukt for å kode nedblandekanalen. I dette tilfellet kan audiodekoderen som er en del av datastrømleseren 24 generere den første nedblandekanal Lc og den andre ned-blandekanal Rc, eller mer nøyaktig en dekodet versjon av disse kanalene. For beskrivelsen vil et skille mellom signalene og de dekodede versjoner av disse bare bli foretatt når det er uttrykkelig nevnt.
Kanalsideinformasjonen 26 og venstre og høyre nedblandekanaler 28 og 30 fra datastrømleseren 24 blir matet inn i en flerkanals rekonstruktør 32 for å levere en rekonstruert versjon 34 av de opprinnelige audiosignaler som kan spilles av ved hjelp av en flerkanals spiller 36. Når flerkanalsrekonstruktøren brukes i frekvensdomenet, vil flerkanalsspilleren 36 motta frekvensdomeneinngangsdata som må dekodes på en bestemt måte, for eksempel konverteres til tidsdomene før avspilling. For å oppnå dette kan flerkanalsspilleren også omfatte dekodingsmuligheter.
Det skal bemerkes her at en nedskaleringsdekoder bare vil ha datastrømleseren 24 som bare sender ut venstre og høyre nedblandekanaler 28 og 30 til en stereoutgang 38. En forbedret, ny dekoder vil imidlertid trekke ut kanalsideinformasjonen 26 og bruke denne sideinformasjon og nedblandekanalene 28 og 30 for å rekonstruere de rekonstruerte versjoner 34 av de opprinnelige kanaler ved å bruke flerkanal-rekonstruktøren 32.
Fig. 3A viser en utførelse av den nye kalkulator 14 for å beregne kanalsideinformasjonen som en audiokoder på den ene side og kanalsideinformasjonskalkulatoren på en annen side bevirker på den samme spektrale gjengivelse av flerkanalssignalet. Fig. 1 viser imidlertid det andre alternativ hvor audiokoderen på den ene side og kanalsideinformasjonskalkulatoren på en annen side virker på forskjellige spektralgjengivelser av flerekanalssignalet. Når beregning av ressursene ikke er så viktig som lydkvaliteten kan alternativet på fig. 1 foretrekkes siden filterbanker som er individuelt optimalisert for lydkoding og sideinformasjonsberegning, brukes. Når imidlertid beregningsressurser er viktig, foretrekkes alternativet på fig. 3A siden dette alternativet krever mindre beregningskraft på grunn av en delt utnyttelse av elementene.
Innretningen vist på fig. 3 A kan motta to kanaler A, B. Innretningen vist på fig. 3A kan beregne en sideinformasjon for kanalen B, slik at ved å bruke denne kanalsideinformasjon for den valgte opprinnelige kanal B, kan en rekonstruert versjon av kanalen B beregnes fra kanalsignalet A. I tillegg kan enheten vist på fig. 3A frembringe kanalsideinformasjon fra frekvensdomenet, for eksempel parametere for vekting (ved multiplisering eller tidsbehandling som i BCC-koding) av spektralverdier eller delbåndsampler. For å oppnå dette omfatter den nye kalkulator vindus- og tids/frekvenskonvetreringsanordningen 140a for å oppnå en frekvensgjengivelse av kanal A ved inngangen 140b eller en frekvensdomenegjengivelse av kanalen B ved en utgang 140c.
I den foretrukne utførelse utføres sideinformasjonsbestemmelsen (ved hjelp av sideinformasjonsbestemmelsesanordningen 1400f) ved å bruke kvantiserte spektralverdier. Deretter blir en kvantiserer 140d som også er til stede, brukt i forbindelse med en psyko-akustisk modell med en reguleringsinngang 140e. Uansett er det ikke behov for en kvantiserer når sideinformasjonsbestemmelsesanordningen 140c bruker en ikke-kvantisertgjengivelse av kanalen A for å bestemme kanalsideinformasjonen for kanal
B.
Hvis kanalsideinformasjonen for kanal B beregnes ved hjelp av en frekvensdo menegjengivelse av kanalen A og frekvensdomenegjengivelsen av kanalen B, kan vindus- og tids/frekvenskonvetreringsanordningen 140a være den samme som blir brukt i en filterbankbasert audiokoder. I dette tilfellet, og når AAC (ISO/IEC 13818-3) vurderes, blir anordningen 140a implementert som en MDCT-filterbank (MDCT = modified discrete cosine transform) med 50 % overlapping og tilleggsfunksjonalitet.
I et slikt tilfelle er kvantisereren 140d en periodekvantiserer, for eksempel som brukes når mp3 eller AAC-kodede audiosignaler genereres. Frekvensdomenegjengivelsen av kanal A som fortrinnsvis allerede er kvantisert, kan deretter direkte brukes for entropikoding ved å bruke en entropikoder 140g som kan være en Huffman-basert koder eller en entropikoder som implementerer aritmetisk koding.
Sammenliknet med fig. 1 er signalet fra enheten på fig. 3 A sideinformasjonen, for eksempel 1; for en opprinnelig kanal (tilsvarende sideinformasjonen for B ved signalet fra enheten 140f). Entropikodet bitstrøm for kanalen A tilsvarer for eksempel den kodede, venstre nedblandekanal L& ved utgangen av blokken 16 på fig. 1. Fra fig. 3A vil det fremgå at elementet 14 (fig. 1), for eksempel kalkulatoren for å beregne kanalsideinformasjonen og audiokoderen 16 (fig. 1) kan implementeres som separate anordninger eller implementeres som en delt versjon, slik at begge enhetene deler flere elementer, for eksempel MDCT-filterbanken 140a, kvantisereren 140e og entropikoderen 140g. Hvis det er ønskelig med en annen omvandling osv. for å behandle kanalsideinformasjonen, vil koderen 16 og kalkulatoren 14 (fig. 1) implementeres i andre enheter, slik at begge elementene ikke deler filterbanken osv.
Generelt kan den faktiske determinator for å beregne sideinformasjonen (eller generelt kalkulatoren 14) implementeres som en felles stereomodul som vist på fig. 3B som virker i samsvar med en av de felles stereoteknikkene som for eksempel intensitetsstereokoding eller "binaural cue coding".
I motsetning til tidligere intensitetsstereokodere, behøver den nye beslutnings-anordning 140f ikke å måtte beregne den kombinerte kanal. Den "kombinerte kanal" eller bærerkanalen som allerede finnes og er den venstre kompatible nedblandekanal Lc eller den høyre kompatible nedblandekanal Rc eller en kombinert versjon av disse to nedblandekanaler, for eksempel Lc + Rc. Følgelig må den nye enhet 140f bare måtte beregne skaleringsinformasjonen for skalering av den respektive nedblandekanal, slik at energi/tidsenveloppen av en respektivt valgt, opprinnelig kanal oppnås når nedblandekanalen blir vektet ved å bruke skaleringsinformasjon eller intensitets-retningsinformasj onen.
Følgelig er felles stereomodulen 140f på fig. 3B vist slik at den mottar, som et inngangssignal, den "kombinerte" kanal A som er den første eller andre nedblandekanal eller en kombinasjon av nedblandekanalen og den opprinnelig valgte kanal. Denne modulsender naturligvis ut den "kombinerte" kanal A og de felles stereoparametere som kanalsideinformasjon slik at en approksimasjon av den opprinnelig valgte kanal B kan beregnes ved å bruke den kombinerte kanal A og de felles stereoparametere.
Alternativt kan den felles stereomodul 140f implementeres for å utføre "binaural cue coding".
Når det gjelder BCC, sender den felles stereomodul 140f kanalsideinformasjon, slik at kanalsideinformasjonen blir kvantisert og koder ICLD- eller ICTD-parametere, idet den valgte, opprinnelige kanal tjener som den faktiske behandlede kanal mens den respektive nedblandekanal som brukes for å beregne sideinformasjonen, for eksempel den første, den andre eller en kombinasjon av første og andre nedblandekanaler brukes som referansekanal i BCC-kode/dekodeteknikken.
På fig. 4 er det vist en enkelt energirettet implementering av elementet 140f. Denne enheten omfatter en frekvensbåndvelger 44 som velger et frekvensbånd forkanalen A og det tilsvarende frekvensbånd av kanalen B. Deretter blir en energi i begge frekvensbånd beregnet ved hjelp av en energikalkulator 42 for hver gren. Denne detaljerte implementering av energikalkulatoren 42 vil avhenge av om utgangssignalet fra blokken 40 er et delbåndsignal eller er frekvenskoeffisienter. I andre implementeringer hvor skaleringsfaktorer for skaleringsfaktorbåndene blir beregnet, kan det allerede brukes skaleringsfaktorer av første og andre kanal A, B som energiverdier Ea og Eb eller minst som estimater av energien. I en forsterknings-faktorberegningsinnretning 44, blir en forsterkningsfaktor gB for det valgte frekvensbånd bestemt basert på en bestemt regel, for eksempel forsterkningsbestemmelsesregelen vist i blokk 44 på fig. 4. Her kan forsterkningsfaktoren gB direkte brukes for å vekte tidsdomenesampler eller frekvenskoeffisienter som beskrevet senere under fig. 5. For å oppnå dette blir forsterkningsfaktoren gB som er gyldig for det valgte frekvensbånd brukt som kanalsideinformasjon for kanalen B som den valgte, opprinnelige kanal. Denne valgte, opprinnelige kanal B vil ikke bli sendt til dekoderen men bli representert av parameterkanalsideinformasjonen som beregnet av kalkulatoren 14 på fig. 1.
Det skal bemerkes her at det ikke er nødvendig å sende forsterkningsverdier som kanalsideinformasjon. Det er også tilstrekkelig å sende frekvensavhengige verdier tilknyttet den absolutte energi av den valgte, opprinnelige kanal. Deretter må dekoderen beregne den faktiske verdi av nedblandekanalen og forsterkningsfaktoren basert på nedblandekanalens energi og den overførte energi for kanal B.
Fig. 5 viser en mulig implementering av en dekoder satt opp i forbindelse med en omvandlingsbasert, tenkt audiodekoder. Sammenliknet med fig. 2, vil funksjonaliteten av entropidekoderen og den omvendte kvantiserer 50 (fig. 5) omfattes i blokken 24 på fig. 2. Funksjonaliteten av frekvens/tidskonverteringselementene 52a, 52b (fig. 5) vil imidlertid bli implementert under punkt 36 på fig. 2. Elementet 50 på fig. 5 mottar en kodet versjonav første eller andre nedblande signal Lc' eller Rc'. Ved utgangen av elementet 50 er minst en delvis dekodet versjon av første og andre nedblandekanal til stede som til slutt vil bli kalt kanal A. Kanal A blir sendt til en frekvensbåndvelger 54 for å velge et bestemt frekvensbånd fra kanalen A. Dette valgte frekvensbånd blir vektet ved å bruke en multiplikator 56. Multiplikatoren 56 mottar for multiplisering, en bestemt forsterkningsfaktor gB som blir tildelt det valgte frekvensbånd valgt av frekvensbåndvelgeren 54 som tilsvarer frekvensbåndvelgeren 40 på fig. 4 ved kodersiden. Ved inngangen av frekvenstidskonverteren 52a vil det sammen med andre bånd finnes en frekvensdomenegjengivelse av kanal A. Ved utgangen av multiplikatoren 56 og især ved inngangen av frekvens/tidskonverterings-anordningen 52B vil det være en rekonstruert frekvensdomenegjengivelse av kanal B. Følgelig vil det ved utgangen av elementet 52a være en tidsdomenegjengivelse for kanal A mens det ved utgangen av elementet 52b vil være en tidsdomene-gjengivelse av den rekonstruerte kanal B.
Avhengig av den bestemte implementering skal det bemerkes her at den dekodede nedblandekanal Lc eller Rc ikke spiller tilbake i en flerkanals forbedret dekoder. I en slik flerkanals forbedret dekoder brukes bare de dekodede nedblandekanaler for å rekonstruere de opprinnelige kanaler. De dekodede nedblandekanaler blir bare spilt tilbake i stereodekodere av lavere skala.
For å oppnå dette henvises det til fig. 9 som viser den foretrukne implementering av oppfinnelsen i et surround/mp3-miljø. En mp 3-forbedret surround-bitstrøm blir sendt inn i en standard mp3-dekoder 24 som sender dekodede versjoner av de opprinnelige nedblandekanaler. Disse nedblandekanalene kan så direkte spilles tilbake ved hjelp av en lavnivådekoder. Alternativt blir disse to kanalene sendt til den arrangerte, felles stereodekodingsenhet 32 som også mottar flerkanalsforlengelsesdata som fortrinnsvis sendes til tilleggsdatafelt i en mp3-tilpasset bitstrøm.
Det henvises så til fig. 7 som viser grupperingen av den valgte, opprinnelige kanal og den respektive nedblandekanal eller kombinerte nedblandekanal. I denne henseende tilsvarer den høyre kolonne av tabellen på fig. 7 kanalen A på fig. 3A, 3B, 4 og 5 mens kolonnen i midten tilsvarer kanal 213 på disse figurene. I den venstre kolonne på fig. 7 blirden respektive kanalsideinformasjon uttrykkelig oppgitt. Ifølge tabellen på fig. 7 blir kanalsideinformasjonen 1; for den opprinnelige venstrekanal L beregnet ved å bruke venstre nedblandekanal Lc. Venstre surroundkanalside-informasjon Isi bestemmes ved hjelp av den opprinnelig valgte venstre surroundkanal Ls og den venstre nedblandekanal Lc, er bæreren. Høyrekanalsideinformasjonen r; for den opprinnelige høyrekanal R bestemmes ved å bruke den høyre nedblandekanal Rc, I tillegg blir kanalsideinformasjonen for høyre surroundkanal Rs bestemt ved å bruke den høyre nedblandekanal Rc som bærer. Til slutt blir kanalsideinformasjonenCi for senterkanalen C bestemt ved å bruke den kombinerte nedblandekanal som oppnås ved hjelp av en kombinasjon av første og andre nedblandekanal og som lett kan beregnes både i en koder og i en dekoder som ikke krever ekstra biter for overføringen.
Naturligvis er det også mulig å beregne kanalsideinformasjon for venstre kanal, for eksempel basert på en kombinert nedblandekanal eller også en nedblandekanal som oppnås ved en vektet tillegging av første og andre nedblandekanaler, for eksempel 0,7 Lc og 0,3 Rc så lenge vektparametrene er kjent for en dekoder eller overført tilsvarende. For de fleste anvendelser vil det imidlertid være foretrukket bare å avlede kanalsideinformasjonen for senterkanalen fra den kombinerte nedblandekanal, dvs. fra en kombinasjon av første og andre nedblandekanaler.
For å vise bitbesparelsespotensialet ifølge oppfinnelsen, skal følgende typiske eksempel gis. For et 5-kanals audiosignal trenger en normal koder en bitrate på 64 kbit/s for hver kanal noe som oppgår til en total bitrate på 320 kbit/s for 5-kanalsignalet. Venstre og høyre stereosignaler krever en bitrate på 128 kbit/s. Kanalsideinformasjonen for en kanal er mellom 1,5 og 2 kbit/s. Således vil disse tilleggsdata oppgå til bare 7,5 til 10 kbit/s i et tilfelle hvor kanalsideinformasjon for hver av de fem kanalene blir overført. Således tillater det nye konsept overføring av et 5-kanals audiosignal ved å bruke en bitrate på 38 kbit/s (sammenliknet med 320 (!) kbit/s) med god kvalitet siden dekoderen ikke bruker den problematiske dematriseoperasjonen. Viktigere er det at det nye konsept er helt bakoverkompatibelt siden hver av de eksisterende mp3-spillere kan spille tilbake den første nedblandekanal og den andre nedblandekanal for å produsere et konvensjoneltstereosignal.
Avhengig av applikasjonsmiljøet kan den nye fremgangsmåte for å behandle eller omvendt behandle implementeres i maskinvare eller i programvare. Implementeringen kan være et digitalt lagringsmedium, for eksempel en disk eller en CD med elektronisk lesbare styresignaler som kan samvirke med et programmerbart datasystem, slik at den nye fremgangsmåte for behandling eller omvendt behandling blir utført. Generelt angår oppfinnelsen følgelig også et dataprogram med en programkode lagret på en maskinlesbar bærer, idet programvarekoden er tilpasset for å utføre den nye fremgangsmåte når dataprogrammet kjøres på en datamaskin. Med andre ord angår oppfinnelsen også et dataprogram med programkode for å utføre fremgangsmåten når dataprogrammet kjøres på en datamaskin.
Claims (28)
1 Apparat for å behandle et flerkanal audiosignal med minst tre opprinnelige kanaler,karakterisert ved: anordning (12) for å tilveiebringe en første nedblandekanal som en venstre ned-blandekanal og en andre nedblandekanal som en høyre nedblandekanal, idet første og andre nedblandekanaler avledes fra de opprinnelige kanaler, slik at venstre og høyre nedblandekanal formes slik at et resultat under avspilling blir en stereogjengivelse av flerkanal audio signalet; anordning (14) for å beregne kanalsideinformasjonen for en valgt, opprinnelig kanal av de opprinnelige signaler, idet anordningen for å beregne beregner kanalsideinformasjonen slik at en nedblandekanal eller en kombinert nedblandekanal som omfatter første og andre nedblandekanal når de vektes ved å bruke kanalsideinformasjonen fører til en approksimering av den valgte, opprinnelige kanal; og anordning (18) for å generere utgangsdata som omfatter kanalsideinformasjonen.
2 Apparat ifølge krav 1,karakterisert vedat anordningen (18) for å generere genererer utgangsdata, slik at utgangsdataene i tillegg omfatter den første ned-blandekanal eller et signal avledet fra den første nedblandekanal og den andre nedblandekanal, eller et signal avledet fra den andre nedblandekanal.
3 Apparat ifølge krav 1 eller 2,karakterisert vedat anordningen (14) for å beregne er innrettet for å beregne kanalsideinformasjon som parameterdata.
4 Apparat ifølge ett av kravene 1-3,karakterisert vedat anordningen (14) for å beregne er innrettet for å utføre felles stereokoding ved å bruke en nedblandekanal som bærerkanal og bruke den valgte, opprinnelige kanal som inngangskanal for å generere felles stereoparametere som kanalsideinformasjon fra den valgte, opprinnelige kanal.
5 Apparat ifølge krav 3,karakterisert vedat anordningen (14) for å beregne er innrettet for å utføre intensitetsstereokoding eller "binaural cue coding", slik at kanalsideinformasjonen representerer en energidistribusjon eller binaural cue-parametere fra den valgte, opprinnelige kanal, idet en nedblandekanal eller en kombinert nedblandekanal brukes som en bærerkanal.
6 Apparat ifølge krav 1-5,karakterisert vedat flerkanal-audiosignalet omfatter en venstrekanal, en venstre surroundkanal, en høyre kanal og høyre surroundkanal, hvor
anordningen (12) for å tilveiebringe er innrettet for å tilveiebringe den første nedblandekanal som en venstre nedblandekanal og tilveiebringe den andre nedblandekanal som en høyre nedblandekanal, idet venstre og høyre nedblandekanaler er formet slik at et resultat under avspilling blir en stereogjengivelse av flerkanal audiosignalet og
hvor anordningen (14) for å beregne er innrettet for
å beregne kanalsideinformasjonen for venstre kanal som den valgte opprinnelige kanal ved å bruke venstre nedblandekanal,
å beregne kanalsideinformasjonen for høyre kanal som den valgte, opprinnelige kanal ved å bruke den høyre nedblandekanal,
å beregne kanalsideinformasjonen for venstre surroundkanal som den valgte, opprinnelige kanal ved å bruke den venstre nedblandekanal og
å beregne kanalsideinformasjonen for høyre surroundkanal som den valgte, opprinnelige kanal ved å bruke den høyre nedblandekanal.
7 Apparat ifølge krav 1-6,karakterisert vedat de opprinnelige kanaler omfatter en senterkanal,
som videre omfatter en kombineringsinnretning (14a) for å kombinere den første nedblandekanal og den andre nedblandekanal for å oppnå den kombinerte nedblandekanal; og
idet anordningen for å beregne kanalsideinformasjonen for senterkanalen som den valgte, opprinnelige kanal er innrettet for å beregne (14b) kanalsideinformasjonen, slik at den kombinerte nedblandekanal, når de vektes ved å bruke kanalsideinformasjonen fører til en approksimering av den opprinnelige senterkanal.
8 Apparat ifølge ett av kravene 1-6,karakterisert vedat anordningen (12) for tilveiebringing er innrettet for å avlede den første nedblandekanal og den andre nedblandekanal fra de opprinnelige kanaler ved å bruke en første, bestemt, lineær, vektet kombinasjon for den første nedblandekanal og bruke en andre, bestemt, lineær, vektet kombinasjon for den andre nedblandekanal.
9 Apparat ifølge krav 7,karakterisert vedat den første bestemte, lineære, vektede kombinasjon defineres som følger: Lc = f(L + a*Ls + b»C); eller
hvor den bestemte, andre, lineære, vektede kombinasjon defineres som følger: hvor Lc er den første nedblandekanal, idet Rc er den andre nedblandekanal, idet t, a og b er vektfaktorer som er mindre enn 1, idet L er en opprinnelig venstrekanal, idet C er en opprinnelig senterkanal, idet R er en opprinnelig høyrekanal, idet Ls er en opprinnelig venstre surroundkanal og hvor Rs er en opprinnelig høyre surroundkanal.
10 Apparat ifølge ett av kravene 1-8,karakterisert vedat anordningen (12) for å tilveiebringe er innrettet for å motta eksternt tilførte første og andre nedblandekanaler.
11 Apparat ifølge ett av kravene 1-10,karakterisert vedat den første ned-blandekanal og den andre nedblandekanal er sammensatte kanaler som er sammensatt av de opprinnelige kanaler i varierende grad, idet anordningen for å beregne er innrettet for å bli brukt for å beregne kanalsideinformasjonen og nedblandekanalen blant begge nedblandekanaler som er sterkest påvirket av den valgte, opprinnelige kanal sammenliknet med den andre ned-blandekanal.
12 Apparat ifølge ett av kravene 1-11,karakterisert vedat anordningen (18) for generering er innrettet for å forme utgangsdata, slik at utgangsdataene er i samsvar med utgangsdatasyntaksen som brukes av en lavnivådekoder for behandling av første nedblandekanal eller et signal avledet fra den første nedblandekanal eller den andre ned-blandekanal eller et signal avledet fra den andre nedblandekanal for å oppnå en dekodet stereogj engi velse av flerkanal-audiosignalet.
13 Apparat ifølge krav 12,karakterisert vedat utgangsdatasyntaksen struktureres slik at de omfatter et spesielt datafelt som ignoreres av en lavnivådekoder og hvor anordningen for å generere er innrettet for å sette inn kanalsideinformasjonen i det spesielle datafelt.
14 Apparat ifølge krav 13,karakterisert vedat syntaksen er mp3-syntaks og det spesielle datafelt er et tilleggsdatafelt.
15 Apparat ifølge ett av kravene 12-14,karakterisert vedat anordningen (18) for generering er innrettet for å sette inn kanalsideinformasjon inn i utgangsdataene, slik at kanalsideinformasjonen bare brukes av en høynivådekoder men ignoreres av lavnivå-dekoderen.
16 Apparat ifølge ett av kravene 2-15,karakterisert vedat det videre omfatter en koder (16) for å kode den første nedblandekanal for å oppnå signalet avledet fra den første nedblandekanal eller for koding av den andre nedblandekanal for å oppnå signalet avledet fra den andre nedblandekanal.
17 Apparat ifølge krav 16,karakterisert vedat koderen (16) er en tenkt koder som omfatter anordning for å konvertere et signal som skal kodes i en spektral gjengivelse, anordning for kvantisering av spektralgj engi velsen ved å bruke en psyko-akustisk modell og anordning for entropikoding av en kvantisert spektral gjengivelse for å oppnå entropikodet kvantisert spektral gjengivelse som signalet avledet fra den første nedblandekanal eller signalet avledet fra den andre nedblandekanal.
18 Apparat ifølge krav 17,karakterisert vedat den tenkte koder (16) er en koder i samsvar med MPEG-l/2-lag III (mp3) eller MPEG-2/4 avansert audiokoding (AAC).
19 Apparat ifølge ett av kravene 1-18,karakterisert vedat anordningen (14) for beregning er innrettet for
å beregne nedblandeenergiverdiene for nedblandekanalen eller den kombinerte nedblandekanal,
å beregne en opprinnelig energiverdi for den valgte, opprinnelige kanal, og
å beregne en forsterkningsfaktor som kanalsideinformasjon, idet forsterkningsfaktoren avledes fra nedblandeenergiverdien og den opprinnelige energiverdi.
20 Apparat ifølge ett av kravene 1-19,karakterisert vedat anordningen (14) for å beregne er innrettet for å beregne frekvensavhengig kanalsideinformasjonsparametere, slik at flere forskjellige kanalsideinformasjonsparametere oppnås for flere frekvensbånd.
21 Fremgangsmåte for å behandle et flerkanal audiosignal med minst tre opprinnelige kanaler,karakterisert ved: tilveiebringe (12) en første nedblandekanal som en venstre nedblandekanal og en andre nedblandekanal som en høyre nedblandekanal, idet første og andre nedblandekanaler blir avledet fra de opprinnelige kanaler, slik at venstre og høyre nedblandekanaler fører til under avspilling til en stereogj engivelse av flerkanal audiosignalet; beregne (14) kanalsideinformasjonen for en valgt, opprinnelig kanal av de opprinnelige signaler, slik at en nedblandekanal eller en kombinert nedblandekanal med første og andre nedblandekanaler når de vektes ved å bruke kanalsideinformasjonen fører til en approksimering av den valgte, opprinnelige kanal; og generere (18) utgangsdata med kanalsideinformasjonen.
22 Apparat for omvendt behandling av inngangsdata herunder kanalsideinformasjon, en venstre nedblandekanal eller et signal avledet fra den venstre nedblandekanal og en høyre nedblandekanal eller et signal avledet fra den høyre nedblandekanal, idet den venstre nedblandekanal og den høyre nedblandekanal avledes fra minst tre opprinnelige kanaler av et flerkanal audiosignal og som resultat under avspilling, gir en stereogjengivelse av flerkanal audiosignalet og hvor kanalsideinformasjon beregnes slik at en nedblandekanal eller en kombinert nedblandekanal med venstre nedblandekanal og høyre nedblandekanal når de vektes ved å bruke kanalsideinformasjonen fører til en approksimering av den valgte, opprinnelige kanal, idet apparatet omfatter;
en inngangsdataleser (24) for å avlese inngangsdataene for å oppnå den venstre nedblandekanal eller et signal avledet fra den venstre nedblandekanal og den høyre ned-blandekanal eller et signal avledet fra den høyre nedblandekanal og kanalsideinformasjonen; og
en kanalrekonstruktør (32) for å rekonstruere approksimeringen av den valgte, opprinnelige kanal ved å bruke kanalsideinformasjonen og nedblandekanalen eller den kombinerte nedblandekanal for å oppnå approksimeringen av den valgte, opprinnelige kanal.
23 Apparat ifølge krav 22,karakterisert vedat det videre omfatter en tenkt dekoder (24) for å dekode signalet avledet fra venstre nedblandekanal for å oppnå den dekodede versjon av den venstre nedblandekanal og for å dekode signalet avledet fra den høyre nedblandekanal for å oppnå en dekodet versjon av den høyre nedblandekanal.
24 Apparat ifølge krav 22 eller 23,karakterisert vedat det videre omfatter en kombineringsenhet for å kombinere venstre nedblandekanal og høyre nedblandekanal for å oppnå den kombinerte nedblandekanal.
25 Apparat ifølge ett av kravene 22-24,karakterisert vedat det opprinnelige audiosignal omfatter en venstre kanal, en venstre surroundkanal, en høyre kanal, en høyre surroundkanal og en senterkanal, og
idet inngangsdataene omfatter kanalsideinformasjon for minst tre av en venstrekanal, en venstre surroundkanal, en høyre kanal, en høyre surroundkanal og senterkanalen,
idet kanalrekonstruktøren (32) er innrettet for
å rekonstruere en approksimasjon av den venstre kanal ved å bruke kanalsideinformasjonen for den venstre kanal og den venstre nedblandekanal,
å rekonstruere en approksimasjon for den venstre surroundkanal ved å bruke kanalsideinformasjonen for den venstre surroundkanal og den venstre nedblandekanal,
å rekonstruere en approksimasjon for den høyre kanal ved å bruke kanalsideinformasjonen for den høyre kanal og den høyre nedblandekanal og
å rekonstruere en approksimasjon for den høyre surroundkanal ved å bruke kanalsideinformasjonen for den høyre surroundkanal og den høyre nedblandekanal.
26 Apparat ifølge krav 22-25,karakterisert vedat kanalrekonstruktøren er innrettet for å rekonstruere en approksimasjon for senterkanalen ved å bruke kanalsideinformasjonen for senterkanalen og den kombinerte nedblandekanal.
27 Fremgangsmåte for omvendt behandling av inngangsdata, idet inngangsdataene omfatter kanalsideinformasjon, en venstre nedblandekanal eller et signal avledet fra den venstre nedblandekanal og en høyre nedblandekanal, eller et signal avledet av høyre nedblandekanal, idet den venstre nedblandekanal og den høyre nedblandekanal avledes fra minst tre opprinnelige kanaler av et flerkanal audiosignal og hvor kanalsideinformasjon beregnes slik at en nedblandekanal eller en kombinert nedblandekanal herunder den venstre nedblandekanal og den høyre nedblandekanal når vektet ved å bruke kanalsideinformasjonen fører til en approksimering av den valgte, opprinnelige kanal, idet fremgangsmåten omfatter: å avlese (24) inngangsdataene for å oppnå den venstre nedblandekanal eller et signal avledet fra den venstre nedblandekanal og den høyre nedblandekanal, eller et signal avledet fra den høyre nedblandekanal og kanalsideinformasjonen; og å rekonstruere (32) approksimeringen av den valgte, opprinnelige kanal ved å bruke kanalsideinformasjonen og nedblandekanalen eller den kombinerte nedblandekanal for å oppnå approksimeringen av den valgte, opprinnelige kanal.
28 Dataprogram med en programkode for å utføre en fremgangsmåte ifølge krav 21 eller krav 27 når programmet kjøres på en datamaskin.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/679,085 US7447317B2 (en) | 2003-10-02 | 2003-10-02 | Compatible multi-channel coding/decoding by weighting the downmix channel |
PCT/EP2004/010948 WO2005036925A2 (en) | 2003-10-02 | 2004-09-30 | Compatible multi-channel coding/decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
NO20061898L NO20061898L (no) | 2006-06-30 |
NO342804B1 true NO342804B1 (no) | 2018-08-06 |
Family
ID=34394093
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20191058A NO347074B1 (no) | 2003-10-02 | 2004-09-30 | Kompatibel flerkanalkoding/dekoding |
NO20061898A NO342804B1 (no) | 2003-10-02 | 2006-04-28 | Kompatibel flerkanal-koding/dekoding |
NO20180978A NO344635B1 (no) | 2003-10-02 | 2018-07-12 | Kompatibel flerkanal-koding/dekoding |
NO20180980A NO344483B1 (no) | 2003-10-02 | 2018-07-12 | Kompatibel flerkanal-koding/dekoding |
NO20180991A NO344091B1 (no) | 2003-10-02 | 2018-07-13 | Kompatibel flerkanal-koding/dekoding. |
NO20180990A NO344760B1 (no) | 2003-10-02 | 2018-07-13 | Kompatibel flerkanal-koding/dekoding. |
NO20180993A NO344093B1 (no) | 2003-10-02 | 2018-07-13 | Kompatibel flerkanal-koding/dekoding. |
NO20200106A NO345265B1 (no) | 2003-10-02 | 2020-01-28 | Kompatibel flerkanal-koding/dekoding |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20191058A NO347074B1 (no) | 2003-10-02 | 2004-09-30 | Kompatibel flerkanalkoding/dekoding |
Family Applications After (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20180978A NO344635B1 (no) | 2003-10-02 | 2018-07-12 | Kompatibel flerkanal-koding/dekoding |
NO20180980A NO344483B1 (no) | 2003-10-02 | 2018-07-12 | Kompatibel flerkanal-koding/dekoding |
NO20180991A NO344091B1 (no) | 2003-10-02 | 2018-07-13 | Kompatibel flerkanal-koding/dekoding. |
NO20180990A NO344760B1 (no) | 2003-10-02 | 2018-07-13 | Kompatibel flerkanal-koding/dekoding. |
NO20180993A NO344093B1 (no) | 2003-10-02 | 2018-07-13 | Kompatibel flerkanal-koding/dekoding. |
NO20200106A NO345265B1 (no) | 2003-10-02 | 2020-01-28 | Kompatibel flerkanal-koding/dekoding |
Country Status (18)
Country | Link |
---|---|
US (11) | US7447317B2 (no) |
EP (1) | EP1668959B1 (no) |
JP (1) | JP4547380B2 (no) |
KR (1) | KR100737302B1 (no) |
CN (1) | CN1864436B (no) |
AT (1) | ATE350879T1 (no) |
BR (5) | BR122018069728B1 (no) |
CA (1) | CA2540851C (no) |
DE (1) | DE602004004168T2 (no) |
DK (1) | DK1668959T3 (no) |
ES (1) | ES2278348T3 (no) |
HK (1) | HK1092001A1 (no) |
IL (1) | IL174286A (no) |
MX (1) | MXPA06003627A (no) |
NO (8) | NO347074B1 (no) |
PT (1) | PT1668959E (no) |
RU (1) | RU2327304C2 (no) |
WO (1) | WO2005036925A2 (no) |
Families Citing this family (155)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR20050116828A (ko) * | 2003-03-24 | 2005-12-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다채널 신호를 나타내는 주 및 부 신호의 코딩 |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR20070001139A (ko) * | 2004-02-17 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 |
DE102004009628A1 (de) * | 2004-02-27 | 2005-10-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
US7813513B2 (en) * | 2004-04-05 | 2010-10-12 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
DE602005006777D1 (de) * | 2004-04-05 | 2008-06-26 | Koninkl Philips Electronics Nv | Mehrkanal-codierer |
KR101183862B1 (ko) * | 2004-04-05 | 2012-09-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
EP1914723B1 (en) * | 2004-05-19 | 2010-07-07 | Panasonic Corporation | Audio signal encoder and audio signal decoder |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
CN1922655A (zh) * | 2004-07-06 | 2007-02-28 | 松下电器产业株式会社 | 音频信号编码装置、音频信号解码装置、方法及程序 |
US7751804B2 (en) * | 2004-07-23 | 2010-07-06 | Wideorbit, Inc. | Dynamic creation, selection, and scheduling of radio frequency communications |
TWI393120B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
JP4555299B2 (ja) * | 2004-09-28 | 2010-09-29 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
EP1710799B1 (en) * | 2005-02-01 | 2012-06-20 | Panasonic Corporation | Reproduction apparatus |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
MX2007011915A (es) * | 2005-03-30 | 2007-11-22 | Koninkl Philips Electronics Nv | Codificacion de audio multicanal. |
MX2007011995A (es) * | 2005-03-30 | 2007-12-07 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de audio. |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US8170883B2 (en) * | 2005-05-26 | 2012-05-01 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
MX2007015118A (es) | 2005-06-03 | 2008-02-14 | Dolby Lab Licensing Corp | Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. |
US8494667B2 (en) * | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
CA2613731C (en) * | 2005-06-30 | 2012-09-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
EP1908057B1 (en) * | 2005-06-30 | 2012-06-20 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US8160888B2 (en) | 2005-07-19 | 2012-04-17 | Koninklijke Philips Electronics N.V | Generation of multi-channel audio signals |
JP4568363B2 (ja) * | 2005-08-30 | 2010-10-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
ATE455348T1 (de) * | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
EP1921606B1 (en) * | 2005-09-02 | 2011-10-19 | Panasonic Corporation | Energy shaping device and energy shaping method |
US20080255857A1 (en) * | 2005-09-14 | 2008-10-16 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
TWI462086B (zh) * | 2005-09-14 | 2014-11-21 | Lg Electronics Inc | 音頻訊號之解碼方法及其裝置 |
JP2009518659A (ja) * | 2005-09-27 | 2009-05-07 | エルジー エレクトロニクス インコーポレイティド | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 |
JP5478826B2 (ja) * | 2005-10-03 | 2014-04-23 | シャープ株式会社 | 表示装置 |
CN101283249B (zh) * | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
KR100878833B1 (ko) * | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
KR100644715B1 (ko) * | 2005-12-19 | 2006-11-10 | 삼성전자주식회사 | 능동적 오디오 매트릭스 디코딩 방법 및 장치 |
US8111830B2 (en) * | 2005-12-19 | 2012-02-07 | Samsung Electronics Co., Ltd. | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
KR100803212B1 (ko) | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
US7752053B2 (en) | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
US8411869B2 (en) * | 2006-01-19 | 2013-04-02 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
EP1974344A4 (en) * | 2006-01-19 | 2011-06-08 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING A SIGNAL |
KR100878816B1 (ko) * | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US20090177479A1 (en) * | 2006-02-09 | 2009-07-09 | Lg Electronics Inc. | Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof |
DE602007004451D1 (de) | 2006-02-21 | 2010-03-11 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
KR100904437B1 (ko) * | 2006-02-23 | 2009-06-24 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 장치 |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100773562B1 (ko) * | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
US8626515B2 (en) * | 2006-03-30 | 2014-01-07 | Lg Electronics Inc. | Apparatus for processing media signal and method thereof |
CN101361122B (zh) * | 2006-04-03 | 2012-12-19 | Lg电子株式会社 | 处理媒体信号的装置及其方法 |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
ES2380059T3 (es) * | 2006-07-07 | 2012-05-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para combinar múltiples fuentes de audio codificadas paramétricamente |
KR101438387B1 (ko) | 2006-07-12 | 2014-09-05 | 삼성전자주식회사 | 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치 |
KR100763920B1 (ko) | 2006-08-09 | 2007-10-05 | 삼성전자주식회사 | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치 |
US7907579B2 (en) * | 2006-08-15 | 2011-03-15 | Cisco Technology, Inc. | WiFi geolocation from carrier-managed system geolocation of a dual mode device |
US20080235006A1 (en) * | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US9319741B2 (en) | 2006-09-07 | 2016-04-19 | Rateze Remote Mgmt Llc | Finding devices in an entertainment system |
US8607281B2 (en) | 2006-09-07 | 2013-12-10 | Porto Vinci Ltd. Limited Liability Company | Control of data presentation in multiple zones using a wireless home entertainment hub |
US9386269B2 (en) | 2006-09-07 | 2016-07-05 | Rateze Remote Mgmt Llc | Presentation of data on multiple display devices using a wireless hub |
US9233301B2 (en) | 2006-09-07 | 2016-01-12 | Rateze Remote Mgmt Llc | Control of data presentation from multiple sources using a wireless home entertainment hub |
US20080061578A1 (en) * | 2006-09-07 | 2008-03-13 | Technology, Patents & Licensing, Inc. | Data presentation in multiple zones using a wireless home entertainment hub |
US8966545B2 (en) | 2006-09-07 | 2015-02-24 | Porto Vinci Ltd. Limited Liability Company | Connecting a legacy device into a home entertainment system using a wireless home entertainment hub |
US8935733B2 (en) * | 2006-09-07 | 2015-01-13 | Porto Vinci Ltd. Limited Liability Company | Data presentation using a wireless home entertainment hub |
US8005236B2 (en) * | 2006-09-07 | 2011-08-23 | Porto Vinci Ltd. Limited Liability Company | Control of data presentation using a wireless home entertainment hub |
JP5337941B2 (ja) * | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
KR100847453B1 (ko) * | 2006-11-20 | 2008-07-21 | 주식회사 대우일렉트로닉스 | 입체 음향을 위한 적응 간섭 제거 방법 |
US8265941B2 (en) * | 2006-12-07 | 2012-09-11 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
CN101578656A (zh) * | 2007-01-05 | 2009-11-11 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
JP5291096B2 (ja) * | 2007-06-08 | 2013-09-18 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8170218B2 (en) | 2007-10-04 | 2012-05-01 | Hurtado-Huyssen Antoine-Victor | Multi-channel audio treatment system and method |
CN101578655B (zh) * | 2007-10-16 | 2013-06-05 | 松下电器产业株式会社 | 流合成装置、解码装置、方法 |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
KR101438389B1 (ko) * | 2007-11-15 | 2014-09-05 | 삼성전자주식회사 | 오디오 매트릭스 디코딩 방법 및 장치 |
WO2009066959A1 (en) | 2007-11-21 | 2009-05-28 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
WO2009075510A1 (en) * | 2007-12-09 | 2009-06-18 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
TWI424755B (zh) * | 2008-01-11 | 2014-01-21 | Dolby Lab Licensing Corp | 矩陣解碼器 |
KR100998913B1 (ko) * | 2008-01-23 | 2010-12-08 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 이의 장치 |
EP2083584B1 (en) * | 2008-01-23 | 2010-09-15 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
US8615316B2 (en) * | 2008-01-23 | 2013-12-24 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
WO2009116280A1 (ja) * | 2008-03-19 | 2009-09-24 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
KR101335975B1 (ko) * | 2008-08-14 | 2013-12-04 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 복수의 오디오 입력 신호를 리포맷팅하는 방법 |
EP2351024A1 (en) * | 2008-10-01 | 2011-08-03 | GVBB Holdings S.A.R.L | Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus |
EP2175670A1 (en) | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
WO2010042024A1 (en) * | 2008-10-10 | 2010-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Energy conservative multi-channel audio coding |
KR101513042B1 (ko) * | 2008-12-02 | 2015-04-17 | 엘지전자 주식회사 | 신호 전송 방법 및 전송 장치 |
JP5309944B2 (ja) * | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
US8774417B1 (en) * | 2009-10-05 | 2014-07-08 | Xfrm Incorporated | Surround audio compatibility assessment |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
JP5604933B2 (ja) * | 2010-03-30 | 2014-10-15 | 富士通株式会社 | ダウンミクス装置およびダウンミクス方法 |
PL3779977T3 (pl) * | 2010-04-13 | 2023-11-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji |
DE102010015630B3 (de) * | 2010-04-20 | 2011-06-01 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
MX2013010537A (es) * | 2011-03-18 | 2014-03-21 | Koninkl Philips Nv | Codificador y decodificador de audio con funcionalidad de configuracion. |
RU2618383C2 (ru) * | 2011-11-01 | 2017-05-03 | Конинклейке Филипс Н.В. | Кодирование и декодирование аудиообъектов |
US9131313B1 (en) * | 2012-02-07 | 2015-09-08 | Star Co. | System and method for audio reproduction |
EP2645748A1 (en) | 2012-03-28 | 2013-10-02 | Thomson Licensing | Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal |
CN104364842A (zh) * | 2012-04-18 | 2015-02-18 | 诺基亚公司 | 立体声音频信号编码器 |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
US9516446B2 (en) | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
JP2015529415A (ja) * | 2012-08-16 | 2015-10-05 | タートル ビーチ コーポレーション | 多次元的パラメトリック音声のシステムおよび方法 |
RU2676242C1 (ru) * | 2013-01-29 | 2018-12-26 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора |
US9818412B2 (en) | 2013-05-24 | 2017-11-14 | Dolby International Ab | Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
TWI634547B (zh) | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
KR102160254B1 (ko) | 2014-01-10 | 2020-09-25 | 삼성전자주식회사 | 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치 |
US9344825B2 (en) * | 2014-01-29 | 2016-05-17 | Tls Corp. | At least one of intelligibility or loudness of an audio program |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
CN104486033B (zh) * | 2014-12-03 | 2017-09-29 | 重庆邮电大学 | 一种基于c‑ran平台的下行多模信道编码系统及方法 |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3295687B1 (en) * | 2015-05-14 | 2019-03-13 | Dolby Laboratories Licensing Corporation | Generation and playback of near-field audio content |
PT3539127T (pt) * | 2016-11-08 | 2020-12-04 | Fraunhofer Ges Forschung | Dispositivo de downmix e método para executar o downmix de pelo menos dois canais e codificador multicanal e descodificador multicanal |
CN111034225B (zh) * | 2017-08-17 | 2021-09-24 | 高迪奥实验室公司 | 使用立体混响信号的音频信号处理方法和装置 |
CN111615044B (zh) * | 2019-02-25 | 2021-09-14 | 宏碁股份有限公司 | 声音信号的能量分布修正方法及其系统 |
CN113544774B (zh) * | 2019-03-06 | 2024-08-20 | 弗劳恩霍夫应用研究促进协会 | 降混器及降混方法 |
US10779105B1 (en) | 2019-05-31 | 2020-09-15 | Apple Inc. | Sending notification and multi-channel audio over channel limited link for independent gain control |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0631458A1 (en) * | 1993-06-22 | 1994-12-28 | Deutsche Thomson-Brandt Gmbh | Method for obtaining a multi-channel decoder matrix |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
DE69428939T2 (de) * | 1993-06-22 | 2002-04-04 | Deutsche Thomson-Brandt Gmbh | Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix |
CA2124379C (en) | 1993-06-25 | 1998-10-27 | Thomas F. La Porta | Distributed processing architecture for control of broadband and narrowband communications networks |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3397001B2 (ja) * | 1994-06-13 | 2003-04-14 | ソニー株式会社 | 符号化方法及び装置、復号化装置、並びに記録媒体 |
EP0688113A2 (en) * | 1994-06-13 | 1995-12-20 | Sony Corporation | Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio |
EP1251501B1 (en) | 1995-10-09 | 2004-09-08 | Matsushita Electric Industrial Co., Ltd. | An optical disk with an optical barcode and reproduction apparatus |
JP3790550B2 (ja) | 1996-02-08 | 2006-06-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ | 5チャネル送信及び2チャネル送信に対応可能な7チャネル送信 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
US6449368B1 (en) * | 1997-03-14 | 2002-09-10 | Dolby Laboratories Licensing Corporation | Multidirectional audio decoding |
JP3657120B2 (ja) | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
JP2000214887A (ja) * | 1998-11-16 | 2000-08-04 | Victor Co Of Japan Ltd | 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体 |
US6928169B1 (en) * | 1998-12-24 | 2005-08-09 | Bose Corporation | Audio signal processing |
US6442517B1 (en) * | 2000-02-18 | 2002-08-27 | First International Digital, Inc. | Methods and system for encoding an audio sequence with synchronized data and outputting the same |
JP4304401B2 (ja) * | 2000-06-07 | 2009-07-29 | ソニー株式会社 | マルチチャンネルオーディオ再生装置 |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
JP4062905B2 (ja) * | 2001-10-24 | 2008-03-19 | ヤマハ株式会社 | ディジタル・ミキサ |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
-
2003
- 2003-10-02 US US10/679,085 patent/US7447317B2/en active Active
-
2004
- 2004-09-30 BR BR122018069728-8A patent/BR122018069728B1/pt active IP Right Grant
- 2004-09-30 RU RU2006114742/09A patent/RU2327304C2/ru active
- 2004-09-30 BR BR122018069726-1A patent/BR122018069726B1/pt active IP Right Grant
- 2004-09-30 PT PT04787072T patent/PT1668959E/pt unknown
- 2004-09-30 KR KR1020067006428A patent/KR100737302B1/ko active IP Right Grant
- 2004-09-30 BR BR122018069730-0A patent/BR122018069730B1/pt active IP Right Grant
- 2004-09-30 NO NO20191058A patent/NO347074B1/no unknown
- 2004-09-30 ES ES04787072T patent/ES2278348T3/es not_active Expired - Lifetime
- 2004-09-30 CN CN2004800287769A patent/CN1864436B/zh not_active Expired - Lifetime
- 2004-09-30 BR BR122018069731-8A patent/BR122018069731B1/pt active IP Right Grant
- 2004-09-30 DK DK04787072T patent/DK1668959T3/da active
- 2004-09-30 AT AT04787072T patent/ATE350879T1/de active
- 2004-09-30 EP EP04787072A patent/EP1668959B1/en not_active Expired - Lifetime
- 2004-09-30 CA CA2540851A patent/CA2540851C/en not_active Expired - Lifetime
- 2004-09-30 WO PCT/EP2004/010948 patent/WO2005036925A2/en active IP Right Grant
- 2004-09-30 JP JP2006530060A patent/JP4547380B2/ja not_active Expired - Lifetime
- 2004-09-30 BR BRPI0414757A patent/BRPI0414757B1/pt active IP Right Grant
- 2004-09-30 DE DE602004004168T patent/DE602004004168T2/de not_active Expired - Lifetime
- 2004-09-30 MX MXPA06003627A patent/MXPA06003627A/es active IP Right Grant
-
2006
- 2006-03-13 IL IL174286A patent/IL174286A/en active IP Right Grant
- 2006-04-28 NO NO20061898A patent/NO342804B1/no unknown
- 2006-12-11 HK HK06113564A patent/HK1092001A1/xx not_active IP Right Cessation
-
2008
- 2008-09-09 US US12/206,778 patent/US8270618B2/en active Active
-
2012
- 2012-08-17 US US13/588,139 patent/US9462404B2/en active Active
-
2015
- 2015-11-19 US US14/945,693 patent/US10165383B2/en not_active Expired - Lifetime
-
2018
- 2018-07-12 NO NO20180978A patent/NO344635B1/no unknown
- 2018-07-12 NO NO20180980A patent/NO344483B1/no unknown
- 2018-07-13 NO NO20180991A patent/NO344091B1/no unknown
- 2018-07-13 NO NO20180990A patent/NO344760B1/no unknown
- 2018-07-13 NO NO20180993A patent/NO344093B1/no unknown
- 2018-08-14 US US16/103,298 patent/US10206054B2/en not_active Expired - Lifetime
- 2018-08-14 US US16/103,295 patent/US10237674B2/en not_active Expired - Lifetime
- 2018-12-04 US US16/209,451 patent/US10299058B2/en not_active Expired - Lifetime
-
2019
- 2019-04-05 US US16/376,076 patent/US10425757B2/en not_active Expired - Lifetime
- 2019-04-05 US US16/376,080 patent/US10455344B2/en not_active Expired - Lifetime
- 2019-04-05 US US16/376,084 patent/US10433091B2/en not_active Expired - Lifetime
- 2019-08-23 US US16/548,905 patent/US11343631B2/en not_active Expired - Lifetime
-
2020
- 2020-01-28 NO NO20200106A patent/NO345265B1/no unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0631458A1 (en) * | 1993-06-22 | 1994-12-28 | Deutsche Thomson-Brandt Gmbh | Method for obtaining a multi-channel decoder matrix |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO20191058A1 (no) | Kompatibel flerkanalkoding/dekoding | |
CA2554002C (en) | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal | |
KR101251426B1 (ko) | 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법 | |
AU2004306509B2 (en) | Compatible multi-channel coding/decoding |