NO340421B1 - Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem - Google Patents
Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem Download PDFInfo
- Publication number
- NO340421B1 NO340421B1 NO20064472A NO20064472A NO340421B1 NO 340421 B1 NO340421 B1 NO 340421B1 NO 20064472 A NO20064472 A NO 20064472A NO 20064472 A NO20064472 A NO 20064472A NO 340421 B1 NO340421 B1 NO 340421B1
- Authority
- NO
- Norway
- Prior art keywords
- audio
- subset
- parametric
- frequency range
- frequency
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000005236 sound signal Effects 0.000 claims abstract description 28
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 14
- 238000004458 analytical method Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Fagfelt
Den foreliggende oppfinnelse relateres til kodingen av audiosignaler og den følgende syntese av hørselscener fra de kodede audiodata.
Kryssreferanse til relaterte søknader
Denne oppfinnelse krever fordelen av søkedatoen av U.S foreløpig søknad nr. 60/549,972 innlevert 03/04/04 som fullmaktsresymé nr. Faller 14-2. Innholdet av denne applikasjon er relatert til innholdet av U.S. patentsøknad 09/848,877 innlevert 05/04/2001 som fullmaktsresymé nr. Faller 5 ("'877-søknaden"), U.S. patentsøknad serienummer 10/045,458 innlevert 11/07/2001 som fullmaktsresymé nr. Baumgarte 1-6-8 ('"458-søknaden"), og U.S. patentsøknad serienummer 10/155,437 innlevert 05/04/2002 som fullmaktsresymé nr. Baumgarte 2-10 ('"437-søknaden"), og U.S. patentsøknad 10/815,591 innlevert 04/01/2004 som fullmaktsresymé nr. Baumgarte 7-12 ("'591 -søknaden").
Beskrivelse av den relaterte teknikk
Multikanal surround audiosystemer har vært standard på kinoer i årevis. Ettersom teknologien har utviklet seg, har det blitt rimelig å produsere multikanal surround systemer for hjemmebruk. I dag er slike systemer oftest solgt som "hjemme-kinoanlegg". For å tilpasses en ITU-R anbefaling, gir de fleste av disse systemer fem alminnelige audiokanaler og en lavfrekvent subwoofer-kanal ( woofer: basshøyttaler)
(bemerket de lavfrekvente effekter eller LFE-kanal). Slikt multikanalsystem er betegnet som et 5.1 surround system. Det finnes andre surround systemer, slik som 7.1 (syv vanlige kanaler og en LFE-kanal) og 10.2 (ti vanlige kanaler og to LFE-kanaler).
I C. Faller og F. Baumgarte, "Efficient representation of spatial audio coding using perceptual parametrization;" IEEE Workshop on Appl. of Sig. Proe. to Audio and Acoust., Oktober 2001, og C. Faller og F. Baumgarte, "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression," Preprint 112th Conv. Aud. Eng. Soc, Mai 2002, (samlet, "BCC-fagartiklene") beskrives en parametrisk multikanal audiokodingsteknikk (referert til som BCC-koding).
Figur 1 viser et blokkdiagram av et audio prosesseringssystem 100 som utfører binaural cue koding (BCC) i henhold til BCC-fagatriklene. BCC-system 100 har en koder 102 som mottar C audio inngangskanaler 108, for eksempel, en fra hver av C ulike mikrofoner 106. BCC-koder 102 har en nedmikser 110 som konverterer de C audio inngangskanaler inn i et mono audio sumsignal 112.
I tillegg har BCC-koder 102 en BCC-analysator 114 som genererer BCC cue kodedatastrøm 116 for de C inngangskanaler. BCC cue kodene (også referert til som hørselsceneparametere) omfatter mellomkanal nivåforskjells- (ICLD) og mellomkanal tidsforskjells- (ICTD) data for hver inngangskanal. BCC-analysatoren 114 utfører båndbasert prosessering for å generere ICLD- og ICTD-data for hver av én eller flere ulike frekvenssubbånd (f. eks., ulike kritiske bånd) for audio inngangskanalene.
BCC-koder 102 sender sumsignal 112 og BCC cue kodedatastrøm 116 (f. eks., som enten innenbånds- eller utenbåndsside informasjon med hensyn til sumsignalet) til en BCC-dekoder 104 av BCC-system 100. BCC-dekoder 104 har en sideinformasjonsprosessor 118 som prosesserer datastrøm 116 for å gjenopprette BCC cue koder 120 (f. eks., ICLD- og ICTD-data). BCC-dekoder 104 har også en BCC-syntetiserer 122 som bruker de gjenopprettede BCC cue koder 120 til å syntetisere C audio utgangskanaler 124 fra sumsignal 112 for å gjengis av C høytalere 126, henholdsvis.
Audioprosesseringssystem 100 kan implementeres i sammenhengen av multikanal audiosignaler, slik som 5.1 surround lyd. Spesielt vil nedmikser 110 av BCC-koder 102 konvertere de seks inngangskanaler av vanlig 5.1 surround lyd (dvs., fem vanlige kanaler + én LFE-kanal) inn i sumsignal 112. I tillegg vil BCC-analysator 114 av koder 102 transformere de seks inngangskanaler til frekvensdomenet for å generere de korresponderende BCC cue koder 116. Analogt vil sideinformasjonsprosessor 118 av BCC-dekoder 104 (1) transformere det mottatte sumsignal 112 til frekvensdomenet, (2) anvende de gjenopprettede BCC cue koder 120 til sumsignalet i frekvensdomenet for å generere seks frekvensdomenesignaler, og (3) transformere disse frekvensdomenesignaler inn i seks tidsdomenekanaler av syntetisert 5.1 surround lyd (dvs., fem syntetiserte vanlige kanaler + én syntetisert LFE-kanal) for å gjengis av høyttalere 126.
Ytterlige tidligere kjent teknikk nevnes i patentsøknadsdokument EP1376538 som fremlegger en 3-trinns fremgangsmåte for koding for 2 eller flere innkommende audiosignaler. Den internasjonale publikasjonen WO03090207 fremlegger en fremgangsmåte for å kode flerkanals audiosignaler til et mono-signal pluss informasjon som gjør det mulig å gjenskape flerkanals signalet fra mono-signalet og informasjonen.
O ppsummering av oppfinnelsen
For surroundlyd-applikasjoner omfatter utførelser av den foreliggende oppfinnelse en BCC-basert parametrisk au(hoko(hngsteknikk hvor båndbasert BCC-koding ikke er anvendt på lavfrekvente) subwoofer (LFE) kanal(er) for frekvens subbånd over en grensefrekvens. For eksempel, for 5.1 surroundlyd er BCC-koding anvendt på alle seks kanaler (dvs., fem vanlige kanaler pluss den ene LFE-kanal) for subbånd under grensefrekvensen. Ved å unngå BCC-koding av LFE-kanalen ved "høye" frekvenser, har disse utførelser av den foreliggende oppfinnelse (1) reduserte prosesseringslaster i både koderen og dekoderen (2) mindre BCC-kode bitstrømmer enn korresponderende BCC-baserte systemer som prosesserer alle seks kanaler ved alle frekvenser.
Mer generelt omfatter den foreliggende oppfinnelse anvendelsen med parametriske au(hoko(hngsteloiikker, slik som BCC-koding, men ikke nødvendigvis begrenset til BCC-koding, hvor to eller flere ulike subsett av inngangskanaler er prosessert for to eller flere ulike frekvensområder. Som brukt i denne spesifikasjon, kan frasen "subsett" referere til settet som inneholder alle inngangskanaler så vel som til de passende subsett som omfatter færre enn alle inngangskanalene. Anvendelsen av den foreliggende oppfinnelse for BCC-koding av 5.1 og andre surround lydsignaler er bare ett spesielt eksempel av den foreliggende oppfinnelse.
For øvrig henvises til patentkravene hvor selvstendige krav 1, 8 og 9 fremlegger oppfinnelsens kodingsaspekter som hhv fremgangsmåte, apparat og koder, mens selvstendige krav 13, 19 og 20 fremlegger syntetiseringsaspekter som hhv fremgangsmåte, apparat og dekoder. De tilhørende uselvstendige krav angir fordelaktige utførelsesformer.
Kort beskrivelse av figurene
Andre aspekter, egenskaper, og fordeler av den foreliggende oppfinnelse vil bli gjort klarere fra de følgende detaljerte beskrivelser, de vedlagte krav, og de medfølgende tegninger hvor
Fig. 1 viser et blokkdiagram av et audio prosesseringssystem som utfører binaural cue
koding (BCC); og
Fig. 2 viser et blokkdiagram av et audio prosesseringssystem som utfører BCC-koding i henhold til en utførelse av den foreliggende oppfinnelse.
Detaljert beskrivelse
Fig. 2 viser et blokkdiagram av et audio prosesseringssystem 200 som utfører binaural cue koding (BCC) for 5.1 surround audio, i henhold til en utførelse av den foreliggende oppfinnelse. BCC-system 200 har en BCC-koder 202 som mottar seks audio inngangskanaler 208 (dvs., fem vanlige kanaler og én LFE-kanal). BCC-koderen 202 har en nedmikser 210 som konverterer (f. eks., beregner gjennomsnittet) audio inngangskanalene (omfattende LFE-kanalen) inn i en eller flere, men færre enn seks, kombinerte kanaler 212.
I tillegg har BCC-koderen 202 en BCC-analysator 214 som genererer BCC cue kodedatastrøm 216 for inngangskanalene. Som indikert i Fig. 2, bruker BCC-analysator 214 alle seks 5.1 surroundlyd inngangskanaler (omfattende LFE-kanalen) for frekvens subbånd ved eller under en spesifisert frekvensgrense fc, når BCC cue kodedata genereres. For alle andre (dvs., høyfrekvens) subbånd, bruker BCC-analysator 214 bare de fem vanlige kanaler (og ikke LFE-kanalen) for å generere BCC cue kodedata. Som et resultat bidrar LFE-kanalen med BCC-koder for bare BCC subbånd ved eller under frekvensgrensen heller enn for det fulle BCC-frekvensområde, derved reduseres den samlede størrelse av sideinformasjonsbitstrømmen.
Grensefrekvensen er fortrinnsvis valgt slik at den effektive audiobåndvidde for LFE-kanalen er mindre enn eller lik fc (det vil si, LFE-kanalen har stort sett null energi eller svakt audio-innhold bakenfor grensefrekvensen). Om ikke frekvens subbåndene er rettet inn med grensefrekvensen, faller grensefrekvensen innenfor et spesielt frekvens subbånd. I det tilfelle vil en del av det subbånd overskride grensefrekvensen. For denne spesifikasjons skyld, er et slikt subbånd referert til som å være "ved" grenseverdien. I de foretrukne utførelser er hele det subbånd for LFE-kanalen BCC-kodet, og det neste høyere frekvens subbånd er det første høyfrekvens subbånd som ikke er BCC-kodet.
I en mulig implementasjon omfatter BCC cue koder mellomkanal nivåforskjells- (ICLD), mellomkanal tidsforskjells- (ICTD), og mellomkanal korrelasjons (ICC) data for inngangskanalene. BCC-analysator 214 utfører fortrinnsvis båndbasert prosessering analog til den beskrevet i '877- og '458-søknadene for å generere ICLD-og ICTD-data for ulike frekvens subbånd av audio inngangskanalene. I tillegg genererer BCC-analysatoren 214 fortrinnsvis koherensmålinger som ICC-dataene for de ulike frekvens subbånd. Disse koherensmålinger er beskrevet i nærmere detalj i '437- og '591-søknadene.
BCC-koderen 202 sender den ene eller flere kombinerte kanaler 212 og BCC cue kodedatastrømmer 216 (f. eks., som enten innenbånds- eller utenbåndsside-informasjon med hensyn til de kombinerte kanaler) til en BCC-dekoder 204 av BCC-system 200. BCC-dekoder 204 har en sideinformasjonsprosessor 218 som prosesserer datastrøm 216 for å gjenopprette BCC cue koder 220 (f. eks., ICLD-, ICTD-, og ICC-data). BCC-dekoder 204 har også en BCC-syntetiserer 222 som bruker de gjenopprettede BCC cue koder 220 til å syntetisere seks audio utgangskanaler 224 fra den ene eller flere kombinerte kanaler 212 for å gjengis av seks surroundlydhøyttalere 226, henholdsvis.
Som indikert i Fig. 2, så utfører BCC-syntetiserer 222 sekskanals BCC-syntetisering for subbånd ved eller under grensefrekvensen fc for å generere frekvensinnhold for alle seks 5.1 surround kanaler (dvs., omfattende LFE-kanalen), mens den ufører femkanals BCC-syntetisering for subbånd over grensefrekvensen for å generere frekvensinnhold for bare de fem vanlige kanaler med 5.1 surroundlyd. I særdeleshet spalter BCC-syntetiserer 222 de(n) mottatte kombinerte kanal(er) 212 inn i et antall av frekvenssubbånd (f. eks., kritiske bånd). I disse subbånd er ulik prosessering anvendt for å oppnå de korresponderende subbånd av utgangsaudiokanaler. Resultatet er at, for LFE-kanalen, kun subbånd med frekvenser ved eller under grensefrekvensen oppnådd. Med andre ord, LFE-kanalen har frekvensinnhold kun for subbånd ved eller under grensefrekvensen. De øvre subbånd av LFE-kanalen (dvs. de over grensefrekvensen) kan bli fylt med null signaler (hvis nødvendig).
Avhengig av den spesifikke implementasjon, kan en BCC-koder bli designet for å generere BCC cue koder for alle frekvenser og simpelthen ikke sende disse koder for spesielle subbånd (f. eks., subbånd over grensefrekvensen og/eller subbånd som har stort sett null energi). Likeledes kan den korresponderende BCC-dekoder bli designet til å utføre konvensjonell BCC-syntetisering for alle frekvenser, hvor BCC-dekoderen anvender passende BCC cue kodeverdier for disse subbånd som har ingen eksplisitte sendte koder.
Selv om den foreliggende oppfinnelse har blitt beskrevet i sammenheng med BCC-dekodere som anvender teknikkene til '877- og '458-søknadene for å syntetisere hørselsscener, kan den foreliggende oppfinnelse også bli implementert i sammenheng med BCC-dekodere som anvender andre teknikker for syntetisering av hørselsscener som ikke nødvendigvis er avhengige av teknikkene til '877- og '458-søknadene. For eksempel, BCC-prosesseringen av den foreliggende oppfinnelse kan bli implementert uten ICTD-, ICLD, og/eller ICC-data, med eller uten andre passende cue koder, slik som, for eksempel, de assosiert med topprelaterte overføringsfunksjoner.
I utførelsen av Fig. 2, er 5.1 surroundlyd kodet ved å anvende seks-kanals BCC-analyse på subbånd ved eller under grensefrekvensen og fem-kanals BCC-analyse på subbånd over grensefrekvensen. I en annen utførelse kan den foreliggende oppfinnelse bli anvendt på 7.1 surroundlyd hvor åtte-kanals BCC-analyse er anvendt på subbånd ved eller under en spesifikk grensefreskvens og syv-kanals BCC-analyse (ekskluderende den separate LFE-kanal) er anvendt på subbånd over grensefrekvensen.
Den foreliggende oppfinnelse kan også bli anvendt på surround audio som har flere enn én LFE-kanal. For eksempel, for 10.2 surroundlyd, kan tolv-kanals BCC-analyse bli anvendt på subbånd ved eller under en spesifisert grensefrekvens, mens ti-kanals BCC-analyse (ekskluderende de to LFE-kanaler) kan bli anvendt på subbånd over grensefrekvensen. Alternativt kan det være to ulike grensefrekvenser spesifisert: en første grensefrekvens for en første LFE-kanal av 10.2 surroundlyden og andre grensefrekvens for den andre LFE-kanal. I dette tilfelle og ved å anta at den første grensefrekvens er lavere enn den andre grensefrekvens, kan tolv-kanals BCC-analyse bli anvendt på subbånd ved eller under den første grensefrekvens, elleve-kanals BCC-analyse (ekskluderende den første LFE-kanal) kan bli anvendt på subbånd som er (1) over den første grensefrekvens og (2) ved eller under den andre grensefrekvens, og ti-kanals BCC-analyse (ekskluderende begge LFE-kanaler) kan bli anvendt på subbånd over den andre grensefrekvens.
Likeledes er noen forbruker multikanalsutstyr med hensikt designet med ulike utgangskanaler som har ulike frekvensområder. For eksempel, noen 5.1 surroundlyd-utstyr har to bakkanaler som er designet for å gjengi kun frekvenser under 7kHz. Den foreliggende oppfinnelse kan bli anvendt på slike systemer ved å spesifisere to grensefrekvenser: én for LFE-kanalen og en høyere en for bakkanalene. I dette tilfelle kan seks-kanals BCC-analyse bli anvendt på subbånd ved eller under LFE- grensefrekvensen, fem-kanals BCC-analyse (ekskluderende LFE-kanalen) kan bli anvendt på subbånd som er (1) over LFE-grensefrekvensen og (2) ved eller under bakkanal- grensefrekvensen, og tre-kanals BCC-analyse (ekskluderende LFE-kanalen og de to bakkanaler) kan bli anvendt på subbånd over bakkanal- grensefrekvensen.
Den foreliggende oppfinnelse kan bli generalisert ytterligere til å anvende parametrisk audio koding på to eller flere subsett av inngangskanaler for to eller flere frekvensområder, hvor den parametriske audio kodingen kan være annen enn BCC-koding og de ulike frekvensområder er valgt slik at frekvensinnholdet av de ulike inngangskanaler er reflektert i disse områder. Avhengig den enkelte anvendelse, kan ulike kanaler bli ekskludert fra ulike frekvensområder i hvilke som helst passende kombi-nasjoner. For eksempel, lavfrekvenskanaler kan bli ekskludert fra høyfrekvensområder og/eller høyfrekvenskanaler kan bli ekskludert fra lavfrekvensområder. Det kan til og med være tilfellet at ingen enkelte frekvensområder omfatter alle inngangskanalene.
Som beskrevet tidligere, selv om inngangskanalene 208 kan bli nedmikset til å danne en enkelt kombinert (f. eks., mono) kanal 212, i alternative implementasjoner, kan multiplet av inngangskanalene bli nedmikset til å danne to eller flere "kombinerte" kanaler, avhengig av den enkelte audio prosesseringsapplikasjon. Mer informasjon om slike teknikker kan bli funnet i U.S. patentsøknad nr. 10/762,100, innlevert 01/20/04.
I noen implementasjoner, når nedmiksing genererer flere kombinerte kanaler, kan de kombinerte kanaldata bli sendt ved å bruke konvensjonelle audio-sendings-teknikker. For eksempel, når to kombinerte kanaler er generert, kan konvensjonelle stereo-senchngsteknikker bli i stand til å anvendes. I dette tilfelle kan en BCC-dekoder ekstrahere og bruke BCC-koder for å syntetisere et multikanalsignal (f. eks., 5.1 surroundlyd) fra de to kombinerte kanaler. Enn videre kan disse gi tiibake-kompatibili-tet, hvor de to BCC-kombinerte kanaler er spilt tilbake ved å bruke konvensjonelle (dvs., ikke-BCC-basert) stereodekodere som ignorerer BCC-kodene. Analogt, tilbake-kompatibilitet kan bli oppnådd for en konvensjonell mono-dekoder når en enkelt BCC-kombinert kanal er generert. Legg merke til at, i teorien, når det er multiple "kombinerte" kanaler, så kan en eller flere av de kombinerte kanaler faktisk være basert på individuelle inngangskanaler.
Selv om BCC-system 200 kan ha det samme antall av audio inngangskanaler som audio utgangskanaler, i alternative utførelser, kan antallet av inngangskanaler være enten større enn eller mindre enn antallet utgangskanaler, avhengig av den enkelte anvendelse. For eksempel, inngangsaudioen kan korrespondere med 7.1 surroundlyd og den syntetiserte utgangsaudio kan korrespondere med 5.1 surroundlyd, eller omvendt.
Generelt kan BCC-kodere av den foreliggende oppfinnelse bli implementert i sammenheng med å konvertere M inngangs-audiokanaler inn i N kombinerte audiokanaler og en eller flere korresponderende sett med BCC-koder, hvor M>N>1. Likeledes kan BCC-dekodere av den foreliggende oppfinnelse implementeres i sammenheng med å generere P utgangs-audiokanaler fra de N kombinerte audiokanaler og de korresponderende sett med BCC-koder, hvor P>N, og P kan være den samme som eller ulik M.
Avhengig av den enkelte implementasjon kan de ulike signaler sendt og generert av både BCC-koder 202 og BCC-dekoder 204 i Fig. 2 være en hvilken som helst passende kombinasjon av analoge og/eller digitale signaler, omfattende alle analoge eller alle digitale. Selv om ikke vist i Fig. 2, vil de som har kunnskaper innen det tekniske område sette pris på at den ene eller flere kombinerte kanaler 212 og BCC cue kodedatastrøm 216 kan bli ytterligere kodet av BCC-koder 202 og følgelig dekodet av BCC-dekoder 204, for eksempel, basert på noen passende kompresjonssystemer (f. eks., ADPCM) for ytterlig å redusere størrelsen av de sendte data.
Oppløsningen på sending av data fra BCC-koder 202 til BCC-dekoder 204 vil avhenge av den enkelte bruk av audio prosesseringssystem 200. For eksempel, i noen anvendelser, slik som live-sendinger av musikkonserter, kan sending omfatte sanntids-sending av dataene for øyeblikkelig avspilling på en fjerntliggende lokasjon. I andre anvendelser kan "sending" omfatte lagring av dataene på CDer eller andre passende lagringsmedier for senere (dvs ikke-sanntids) avspilling. Selvsagt kan også andre anvendelser være mulige.
Avhengig av den enkelte implementasjon, kan sendekanalene være via kabler eller være trådløse og kan bruke tilpassede eller standardiserte protokoller (f. eks., IP). Medier som CD, DVD, digitale lydbåndopptakere, og faststoffsminner kan bli brukt til lagring. I tillegg kan sending og/eller lagring, men trenger ikke, omfatte kanalkoding. Likeledes, selv om den foreliggende oppfinnelse har blitt beskrevet i sammenheng med digitale audio-systemer, vil de som har kunnskaper innenfor fagområdet forstå at den foreliggende oppfinnelse også kan bli implementert i sammenheng med analoge audio-systemer, slik som AM-radio, FM-radio, og audio-delen av analog fjernsynssending, hvor hver støtter inkluderingen av en tilleggs innenbånds lav-bitsrate sendekanal.
Den foreliggende oppfinnelse kan bli implementert for mange ulike anvendelser, slik som musikkreproduksjon, kringkasting, og telefoni. For eksempel kan den foreliggende oppfinnelse bli implementert for digital radio-/TV-/internett- (f. eks., Websending) kringkasting slik som Sirius Satellite Radio eller XM. Andre anvendelser omfatter lyd over IP ( voice over IP), PSTN eller andre stemmenettverk, analoge rachokringkasting, og internettradio.
Avhengig av den enkelte anvendelse kan ulike teknikker bli anvendt for å legge settet med BCC-koder inn i en kombinert kanal for å oppnå et BCC-signal av den foreliggende oppfinnelse. Tilgjengeligheten av en hvilken som helst spesifikk teknikk kan avhenge av, i det minste en del, de(t) enkelte sendings-/lagringsmedie(r) brukt for BCC-signalet. For eksempel støtter vanligvis protokollene for digital rachokringkasting innlemming av tilleggsforsterkende bits (f. eks., i toppdelen av datapakker) som er ignorert av konvensjonelle mottakere. Disse tilleggsbits kan bli brukt til å representere settene av hørselssceneparametere for å gi et BCC-signal. Generelt kan den foreliggende oppfinnelse bli implementert ved å bruke en hvilken som helst passende teknikk for å vannmerke audiosignaler hvor data som korresponderer med settet med hørselssceneparametere er satt inn i audiosignalet for å danne et BCC-signal. For eksempel kan disse teknikker omfatte data som gjemmes under sanse-maskerings-kurver eller data som gjemmes i pseudotilfeldig støy. Pseudotilfeldig støy kan bli opp-fattet som komfortstøy. Datainnlemming kan også bli implementert ved å bruke fremgangsmåter lignende bit-stjeling brukt i TDM- (tidsdelt multipleksing) sending for innenbånds signalering. En annen mulig teknikk er mu-lav (u-low) reversering av minst signifikante bit ("LSB-bit-flipping"), hvor i det minste signifikante bits er brukt til å sende data.
Foreliggende oppfinnelse kan implementeres som krets-baserte prosesser, omfattende mulige implementasjoner på en enkelt integrert krets. Som vil være synlig for en med kunnskaper innen fagområdet, kan ulike funksjoner av kretselementer også bli implementert som prosesserende trinn i et softwareprogram. Slik software kan brukes i, for eksempel, en digital signalprosessor, mikrokontroller, eller generell datamaskin.
Foreliggende oppfinnelse kan utføres i form av fremgangsmåter og apparater for å praktisere disse fremgangsmåter. Oppfinnelse kan også utføres i form av programkode utført i virkelige medier, slik som (floppy-) disketter, CD-ROMer, hard-disker, eller et hvilket som helst maskinlesbart lagringsmedium, hvor, når programkoden er lastet inn i og utført av en maskin, slik som en datamaskin, blir maskinen et apparat for å utføre oppfinnelsen. Den foreliggende oppfinnelse kan også utføres i form av programkode, for eksempel, enten lagret i et lagringsmedium, lastet inn i og/eller utført av en maskin, eller sendt over et eller annet sendemedium eller bærer, slik som over elektriske ledninger eller kabler, gjennom optiske fibere, eller via elektro-magnetisk stråling, hvor, når programkoden er lastet inn i og utført av en maskin, slik som en datamaskin, blir maskinen et apparat for å utføre oppfinnelsen. Når implementert i en universalprosessor, kombineres programkode segmentene med prosessoren for å gi en unik anordning som opererer analogt med spesifikke logiske kretser.
Det vil videre bli forstått at ulike endringer i detaljene, materialer, og opp-stillinger av delene som har blitt beskrevet og illustrert for å forklare egenskapen av denne oppfinnelse kan bli gjort av de med kunnskaper innen fagområdet uten å avvike fra omfanget av oppfinnelsen som uttrykt i de følgende krav.
Claims (22)
1 Fremgangsmåte for å kode et multikanal audiosignal som har flere audio inngangskanaler,karakterisert vedat fremgangsmåten innbefatter: • å anvende en parametrisk audiokodingsteknikk for å generere parametriske audiokoder for et første subsett av audio inngangskanalene for et første frekvensområde; og • å anvende den parametriske au(hokodingsteknikk for å generere parametriske audio
koder for et andre subsett av audio inngangskanalene for et andre frekvensområde, hvor
o det andre frekvensområde er forskjellig fra det første frekvensområde; og
o det andre subsett er forskjellig fra det første subsett.
2 Fremgangsmåte i henhold til krav 1,karakterisert vedat den parametriske au(hoko(hngsteloiikk er binaural cue kodings (BCC) koding.
3 Fremgangsmåte i henhold til krav 1,karakterisert vedat: • multikanals audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én lavfrekvens (LFE) kanal; • det første subsett omfatter alle audio inngangskanaler; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
4 Fremgangsmåte i henhold til krav 3,karakterisert vedat den parametriske au(hoko(hngsteloiikk er BCC-koding.
5 Fremgangsmåte i henhold til krav 3,karakterisert vedat grensefrekvensen er i det minste den effektive audio båndvidde for LFE-kanalen.
6 Fremgangsmåte i henhold til krav 3,karakterisert vedat multikanal audiosignalet er et 5.1 surroundlydsignal.
7 Fremgangsmåte i henhold til krav 1,karakterisert vedat den videre innbefatter å sende de parametriske audiokoder for de første og andre subsett av audio inngangskanaler.
8 Apparat for å kode et multikanal audiosignal som har flere audio inngangskanaler,karakterisert vedat apparatet innbefatter: • midler for å anvende en parametrisk au(hoko(hngsteloiikk for å generere parametriske audiokoder for et første subsett av audio inngangskanalene for et første frekvensområde; og • midler for å anvende en parametrisk au(hoko(hngsteloiikk for å generere parametriske audiokoder for et andre subsett av audio inngangskanalene for et andre frekvensområde,
hvor
o det andre frekvensområde er forskjellig fra det første frekvensområde; og
o det andre subsett er forskjellig fra det første subsett.
9 Parametrisk audiokoder,karakterisert vedat den innbefatter: • en nedmikser tilpasset for å generere en eller flere kombinerte kanaler fra flere audio inngangskanaler av et multikanal audiosignal; og • en analysator tilpasset til å generere (1) parametriske audiokoder for et første subsett av audio utgangskanalene i et første frekvensområde; og (2) parametriske audiokoder for et andre subsett av audio utgangskanalene i et andre
frekvensområde,
hvor
o det andre frekvensområde er forskjellig fra det første frekvensområde; og
o det andre subsett er forskjellig fra det første subsett.
10 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat de parametriske audiokoder er BCC-koder.
11 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanalene; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
12 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat den parametriske audiokoder er tilpasset til å sende de parametriske audiokoder for de første og andre subsett av audio inngangskanaler.
13 Fremgangsmåte for å syntetisere et multikanal audiosignal som har flere audio utgangskanaler,karakterisert vedat fremgangsmåten innbefatter: • å anvende en parametrisk au(hodeko(hngsteknikk for å generere et første subsett av audio utgangskanalene for et første frekvensområde; og • å anvende den parametrisk au(hodeko(hngsteloiikk for å generere et andre subsett av
audio utgangskanalene for et andre frekvensområde,
hvor
o det andre frekvensområde er forskjellig fra det første frekvensområde; og
o det andre subsett er forskjellig fra det første subsett.
14 Fremgangsmåte i henhold til krav 13,karakterisert ved
at den parametriske auchodekodmgsteknikk er BCC-dekoding.
15 Fremgangsmåte i henhold til krav 13,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanaler; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
16 Fremgangsmåte i henhold til krav 15,karakterisert vedat den parametriske au(hodeko(hngsteloiikk er BCC-dekoding.
17 Fremgangsmåte i henhold til krav 15,karakterisert vedat grensefrekvensen er i det minste den effektive audio båndvidde for LFE-kanalen.
18 Fremgangsmåte i henhold til krav 15,karakterisert vedat multikanal audiosignalet er et 5.1 surroundlydsignal.
19 Apparat for å syntetisere et multikanal audiosignal som har flere audio utgangskanaler,karakterisert vedat apparatet innbefatter: • midler for å anvende en parametrisk au(hodeko(hngsteknikk for å generere et første subsett av audio utgangskanalene for et første frekvensområde; og • midler for å anvende parametrisk au(hodekodingsteknikk for å generere et andre
subsett av audio utgangskanalene for et andre frekvensområde,
hvor
o det andre frekvensområde er forskjellig fra det første frekvensområde; og
o det andre subsett er forskjellig fra det første subsett.
20 Parametrisk audiodekoder,karakterisert vedat den innbefatter: • en parametrisk kodeprosessor tilpasset for å generere parametriske koder; og • en syntetisator tilpasset for å anvende de parametriske koder på én eller flere kombinerte kanaler for å generere: (1) et første subsett av audio utgangskanaler av et multikanal audiosignal i et første frekvensområde; og (2) et andre subsett av audio utgangskanaler for multikanal audiosignalet i et andre
frekvensområde,
hvor: o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
21 Parametrisk audiodekoder i henhold til krav 20,karakterisert vedat de parametriske koder er BCC-koder.
22 Parametrisk audiodekoder i henhold til krav 20,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanalene; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54997204P | 2004-03-04 | 2004-03-04 | |
US10/827,900 US7805313B2 (en) | 2004-03-04 | 2004-04-20 | Frequency-based coding of channels in parametric multi-channel coding systems |
PCT/US2005/005605 WO2005094125A1 (en) | 2004-03-04 | 2005-02-23 | Frequency-based coding of audio channels in parametric multi-channel coding systems |
Publications (2)
Publication Number | Publication Date |
---|---|
NO20064472L NO20064472L (no) | 2006-10-03 |
NO340421B1 true NO340421B1 (no) | 2017-04-18 |
Family
ID=34915657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20064472A NO340421B1 (no) | 2004-03-04 | 2006-10-03 | Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem |
Country Status (16)
Country | Link |
---|---|
US (1) | US7805313B2 (no) |
EP (1) | EP1721489B1 (no) |
JP (1) | JP4418493B2 (no) |
KR (1) | KR100717598B1 (no) |
AT (1) | ATE373402T1 (no) |
AU (1) | AU2005226536B2 (no) |
BR (1) | BRPI0508146B1 (no) |
CA (1) | CA2557993C (no) |
DE (1) | DE602005002463T2 (no) |
ES (1) | ES2293556T3 (no) |
HK (1) | HK1101634A1 (no) |
MX (1) | MXPA06009931A (no) |
NO (1) | NO340421B1 (no) |
PT (1) | PT1721489E (no) |
TW (1) | TWI376967B (no) |
WO (1) | WO2005094125A1 (no) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2007528025A (ja) * | 2004-02-17 | 2007-10-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法 |
KR101183862B1 (ko) * | 2004-04-05 | 2012-09-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 |
WO2005098821A2 (en) * | 2004-04-05 | 2005-10-20 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
WO2006004048A1 (ja) * | 2004-07-06 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム |
DE602005016931D1 (de) * | 2004-07-14 | 2009-11-12 | Dolby Sweden Ab | Tonkanalkonvertierung |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
EP1905002B1 (en) * | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
WO2007032647A1 (en) * | 2005-09-14 | 2007-03-22 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
US8208641B2 (en) * | 2006-01-19 | 2012-06-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
EP1974344A4 (en) * | 2006-01-19 | 2011-06-08 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING A SIGNAL |
EP1989704B1 (en) * | 2006-02-03 | 2013-10-16 | Electronics and Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
KR100863479B1 (ko) * | 2006-02-07 | 2008-10-16 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US20090177479A1 (en) * | 2006-02-09 | 2009-07-09 | Lg Electronics Inc. | Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof |
US9009057B2 (en) | 2006-02-21 | 2015-04-14 | Koninklijke Philips N.V. | Audio encoding and decoding to generate binaural virtual spatial signals |
JP5390197B2 (ja) | 2006-02-23 | 2014-01-15 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
FR2899423A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
KR20080071971A (ko) * | 2006-03-30 | 2008-08-05 | 엘지전자 주식회사 | 미디어 신호 처리 방법 및 장치 |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
KR100763920B1 (ko) * | 2006-08-09 | 2007-10-05 | 삼성전자주식회사 | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치 |
US20080235006A1 (en) | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US20100040135A1 (en) * | 2006-09-29 | 2010-02-18 | Lg Electronics Inc. | Apparatus for processing mix signal and method thereof |
US8364497B2 (en) * | 2006-09-29 | 2013-01-29 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
KR100891670B1 (ko) | 2006-10-13 | 2009-04-02 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
CN103400583B (zh) * | 2006-10-16 | 2016-01-20 | 杜比国际公司 | 多声道下混对象编码的增强编码和参数表示 |
BRPI0715312B1 (pt) * | 2006-10-16 | 2021-05-04 | Koninklijke Philips Electrnics N. V. | Aparelhagem e método para transformação de parâmetros multicanais |
JP4838361B2 (ja) * | 2006-11-15 | 2011-12-14 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及びその装置 |
JP5463143B2 (ja) * | 2006-12-07 | 2014-04-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及びその装置 |
KR101111520B1 (ko) * | 2006-12-07 | 2012-05-24 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
CN101578656A (zh) * | 2007-01-05 | 2009-11-11 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
JP2010518452A (ja) * | 2007-02-13 | 2010-05-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US20100121470A1 (en) * | 2007-02-13 | 2010-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
JP5328637B2 (ja) * | 2007-02-20 | 2013-10-30 | パナソニック株式会社 | マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8184726B2 (en) * | 2007-09-10 | 2012-05-22 | Industrial Technology Research Institute | Method and apparatus for multi-rate control in a multi-channel communication system |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US20100324708A1 (en) * | 2007-11-27 | 2010-12-23 | Nokia Corporation | encoder |
EP2227804B1 (en) * | 2007-12-09 | 2017-10-25 | LG Electronics Inc. | A method and an apparatus for processing a signal |
KR101441898B1 (ko) * | 2008-02-01 | 2014-09-23 | 삼성전자주식회사 | 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치 |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
WO2009113516A1 (ja) * | 2008-03-14 | 2009-09-17 | 日本電気株式会社 | 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム |
WO2009131066A1 (ja) * | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
US20100223061A1 (en) * | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
EP2513898B1 (en) * | 2009-12-16 | 2014-08-13 | Nokia Corporation | Multi-channel audio processing |
CN104050969A (zh) | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
US10199044B2 (en) | 2013-03-20 | 2019-02-05 | Nokia Technologies Oy | Audio signal encoder comprising a multi-channel parameter selector |
EP3023984A4 (en) * | 2013-07-15 | 2017-03-08 | Electronics and Telecommunications Research Institute | Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal |
US9911423B2 (en) | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
WO2015147434A1 (ko) * | 2014-03-25 | 2015-10-01 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
CN104064194B (zh) * | 2014-06-30 | 2017-04-26 | 武汉大学 | 用于提高三维音频空间感距离感的参数编解码方法及系统 |
WO2016003206A1 (ko) * | 2014-07-01 | 2016-01-07 | 한국전자통신연구원 | 다채널 오디오 신호 처리 방법 및 장치 |
CN106471575B (zh) | 2014-07-01 | 2019-12-10 | 韩国电子通信研究院 | 多信道音频信号处理方法及装置 |
KR20180056032A (ko) * | 2016-11-18 | 2018-05-28 | 삼성전자주식회사 | 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법 |
JP2022511156A (ja) | 2018-11-13 | 2022-01-31 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号及び関連するメタデータによる空間オーディオの表現 |
CN110366752B (zh) * | 2019-05-21 | 2023-10-10 | 深圳市汇顶科技股份有限公司 | 一种语音分频传输方法、源端、播放端、源端电路和播放端电路 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
EP1376538A1 (en) * | 2002-06-24 | 2004-01-02 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
Family Cites Families (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
CA1268546A (en) * | 1985-08-30 | 1990-05-01 | Shigenobu Minami | Stereophonic voice signal transmission system |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
DE3943879B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
US5703999A (en) * | 1992-05-25 | 1997-12-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5371799A (en) * | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3227942B2 (ja) | 1993-10-26 | 2001-11-12 | ソニー株式会社 | 高能率符号化装置 |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5771295A (en) * | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
JP3793235B2 (ja) * | 1996-02-08 | 2006-07-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 2チャネル伝送及び1チャネル伝送に適合するnチャネル伝送 |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
US5825776A (en) * | 1996-02-27 | 1998-10-20 | Ericsson Inc. | Circuitry and method for transmitting voice and data signals upon a wireless communication channel |
US5889843A (en) * | 1996-03-04 | 1999-03-30 | Interval Research Corporation | Methods and systems for creating a spatial auditory environment in an audio conference system |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
KR0175515B1 (ko) * | 1996-04-15 | 1999-04-01 | 김광호 | 테이블 조사 방식의 스테레오 구현 장치와 방법 |
US6987856B1 (en) * | 1996-06-19 | 2006-01-17 | Board Of Trustees Of The University Of Illinois | Binaural signal processing techniques |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6111958A (en) * | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
US6236731B1 (en) * | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
US5860060A (en) * | 1997-05-02 | 1999-01-12 | Texas Instruments Incorporated | Method for left/right channel self-alignment |
US5946352A (en) * | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6021389A (en) * | 1998-03-20 | 2000-02-01 | Scientific Learning Corp. | Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds |
US6016473A (en) | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
TW444511B (en) | 1998-04-14 | 2001-07-01 | Inst Information Industry | Multi-channel sound effect simulation equipment and method |
JP3657120B2 (ja) * | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
JP2000152399A (ja) * | 1998-11-12 | 2000-05-30 | Yamaha Corp | 音場効果制御装置 |
US6408327B1 (en) * | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
US6282631B1 (en) * | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6823018B1 (en) * | 1999-07-28 | 2004-11-23 | At&T Corp. | Multiple description coding communication system |
US6434191B1 (en) * | 1999-09-30 | 2002-08-13 | Telcordia Technologies, Inc. | Adaptive layered coding for voice over wireless IP applications |
US6614936B1 (en) * | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
US6498852B2 (en) * | 1999-12-07 | 2002-12-24 | Anthony Grimani | Automatic LFE audio signal derivation system |
US6845163B1 (en) * | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
EP1208725B1 (en) * | 1999-12-24 | 2009-06-03 | Koninklijke Philips Electronics N.V. | Multichannel audio signal processing device |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
US6850496B1 (en) * | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US7236838B2 (en) * | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
US6885992B2 (en) * | 2001-01-26 | 2005-04-26 | Cirrus Logic, Inc. | Efficient PCM buffer |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
US7668317B2 (en) * | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
KR20040080003A (ko) | 2002-02-18 | 2004-09-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 오디오 코딩 |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
ES2323294T3 (es) | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
EP2879299B1 (en) | 2002-05-03 | 2017-07-26 | Harman International Industries, Incorporated | Multi-channel downmixing device |
US6940540B2 (en) * | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
CN1669358A (zh) | 2002-07-16 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 音频编码 |
ES2278192T3 (es) | 2002-11-28 | 2007-08-01 | Koninklijke Philips Electronics N.V. | Codificacion de una señal de audio. |
CN1748247B (zh) * | 2003-02-11 | 2011-06-15 | 皇家飞利浦电子股份有限公司 | 音频编码 |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
WO2004086817A2 (en) | 2003-03-24 | 2004-10-07 | Koninklijke Philips Electronics N.V. | Coding of main and side signal representing a multichannel signal |
US20050069143A1 (en) * | 2003-09-30 | 2005-03-31 | Budnikov Dmitry N. | Filtering for spatial audio rendering |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7840401B2 (en) * | 2005-10-24 | 2010-11-23 | Lg Electronics Inc. | Removing time delays in signal paths |
-
2004
- 2004-04-20 US US10/827,900 patent/US7805313B2/en active Active
-
2005
- 2005-02-22 TW TW094105257A patent/TWI376967B/zh not_active IP Right Cessation
- 2005-02-23 AU AU2005226536A patent/AU2005226536B2/en active Active
- 2005-02-23 AT AT05723489T patent/ATE373402T1/de active
- 2005-02-23 PT PT05723489T patent/PT1721489E/pt unknown
- 2005-02-23 EP EP05723489A patent/EP1721489B1/en active Active
- 2005-02-23 BR BRPI0508146-7A patent/BRPI0508146B1/pt active IP Right Grant
- 2005-02-23 WO PCT/US2005/005605 patent/WO2005094125A1/en active IP Right Grant
- 2005-02-23 CA CA2557993A patent/CA2557993C/en active Active
- 2005-02-23 JP JP2007501824A patent/JP4418493B2/ja active Active
- 2005-02-23 ES ES05723489T patent/ES2293556T3/es active Active
- 2005-02-23 KR KR1020067017673A patent/KR100717598B1/ko active IP Right Grant
- 2005-02-23 MX MXPA06009931A patent/MXPA06009931A/es active IP Right Grant
- 2005-02-23 DE DE602005002463T patent/DE602005002463T2/de active Active
-
2006
- 2006-10-03 NO NO20064472A patent/NO340421B1/no unknown
-
2007
- 2007-06-12 HK HK07106238.2A patent/HK1101634A1/xx unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
EP1376538A1 (en) * | 2002-06-24 | 2004-01-02 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
Non-Patent Citations (1)
Title |
---|
C. Faller et al., "Binaural Cue Coding applied to stereo and multi-channel audio compression," in Preprint 112th Conv. Aud. Eng. Soc., May 2002., Dated: 01.01.0001 * |
Also Published As
Publication number | Publication date |
---|---|
BRPI0508146B1 (pt) | 2019-04-16 |
US20050195981A1 (en) | 2005-09-08 |
DE602005002463T2 (de) | 2008-06-12 |
KR20060131866A (ko) | 2006-12-20 |
EP1721489B1 (en) | 2007-09-12 |
EP1721489A1 (en) | 2006-11-15 |
HK1101634A1 (en) | 2007-10-18 |
TWI376967B (en) | 2012-11-11 |
KR100717598B1 (ko) | 2007-05-15 |
BRPI0508146A (pt) | 2007-07-31 |
TW200603653A (en) | 2006-01-16 |
WO2005094125A1 (en) | 2005-10-06 |
ES2293556T3 (es) | 2008-03-16 |
ATE373402T1 (de) | 2007-09-15 |
CA2557993A1 (en) | 2005-10-06 |
JP4418493B2 (ja) | 2010-02-17 |
MXPA06009931A (es) | 2007-03-21 |
US7805313B2 (en) | 2010-09-28 |
AU2005226536A1 (en) | 2005-10-06 |
CA2557993C (en) | 2012-11-27 |
AU2005226536B2 (en) | 2008-09-04 |
PT1721489E (pt) | 2007-12-21 |
JP2007526520A (ja) | 2007-09-13 |
DE602005002463D1 (de) | 2007-10-25 |
NO20064472L (no) | 2006-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO340421B1 (no) | Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem | |
KR101158698B1 (ko) | 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더 | |
JP4939933B2 (ja) | オーディオ信号符号化装置及びオーディオ信号復号化装置 | |
KR101283783B1 (ko) | 고품질 다채널 오디오 부호화 및 복호화 장치 | |
RU2323551C1 (ru) | Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования | |
US20200013426A1 (en) | Synchronizing enhanced audio transports with backward compatible audio transports | |
JP2008535014A (ja) | スケーラブルマルチチャネル音声符号化方法 | |
US20140310010A1 (en) | Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same | |
US20050004791A1 (en) | Perceptual noise substitution | |
KR20140093578A (ko) | 사운드 바를 위한 오디오 신호 처리 장치 및 방법 | |
US11081116B2 (en) | Embedding enhanced audio transports in backward compatible audio bitstreams | |
TWI501220B (zh) | 嵌入與擷取輔助資料 | |
JP4809234B2 (ja) | オーディオ符号化装置、復号化装置、方法、及びプログラム | |
KR100891666B1 (ko) | 믹스 신호의 처리 방법 및 장치 | |
KR20130093798A (ko) | 다채널 신호 부호화 및 복호화 장치 및 방법 | |
US11062713B2 (en) | Spatially formatted enhanced audio data for backward compatible audio bitstreams | |
WO2006011367A1 (ja) | オーディオ信号符号化装置および復号化装置 |