NO338934B1 - Generering av kontrollsignal for flerkanals frekvensgeneratorer og flerkanals frekvensgenerering. - Google Patents

Generering av kontrollsignal for flerkanals frekvensgeneratorer og flerkanals frekvensgenerering. Download PDF

Info

Publication number
NO338934B1
NO338934B1 NO20065383A NO20065383A NO338934B1 NO 338934 B1 NO338934 B1 NO 338934B1 NO 20065383 A NO20065383 A NO 20065383A NO 20065383 A NO20065383 A NO 20065383A NO 338934 B1 NO338934 B1 NO 338934B1
Authority
NO
Norway
Prior art keywords
signal
post
control
channel
processed
Prior art date
Application number
NO20065383A
Other languages
English (en)
Other versions
NO20065383L (no
Inventor
Matthias Neusinger
Juergen Herre
Sascha Disch
Heiko Purnhagen
Kristofer Kjoerling
Original Assignee
Fraunhofer Ges Forschung
Koninklijke Philips Electronics Nv
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Koninklijke Philips Electronics Nv, Dolby Int Ab filed Critical Fraunhofer Ges Forschung
Publication of NO20065383L publication Critical patent/NO20065383L/no
Publication of NO338934B1 publication Critical patent/NO338934B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Description

Relaterte US-søknader
Denne patentsøknad krever prioritet i den foreløpige US-søknad 60/671 582 av 15. april 2005.
Teknisk område for oppfinnelsen
Denne foreliggende oppfinnelse gjelder flerkanals audioprosessering, dvs. lyd-behandling, og oppfinnelsen gjelder særlig flerkanals koding og syntese ved bruk av parametrisk sideinformasjon.
Oppfinnelsens bakgrunn og teknikkens stilling
I senere tid har flerkanals lydbehandlingsteknikk blitt mer og mer populær, og dette kan skyldes det faktum at lydkompresj on/koding som teknikk så vel som teknikken vedrørende det velkjente MPEG-1 lag 3 (gjerne kalt mp3) har gjort det mulig å distribuere audioinnhold via Internet eller andre overføringskanaler, via en begrenset båndbredde.
En ytterligere grunn for denne popularitet er den økte tilgjengelighet for fler-kanalsinnholdet og den likeledes økte inntrengning i alle hjem av flerkanalsavspillings-utstyr.
Kodeteknikken mp3 er blitt så kjent fordi den tillater formidling og distribusjon av alle typer innspillinger i stereoformat, dvs. at den etablerer en digital representasjon av lydinnspillingen, innbefattet en første eller venstre stereokanal og en andre eller høyre stereokanal. Videre ga mp3 teknikken nye muligheter for lyddistri-busjon under forutsetningene man hadde med tilgjengelige lagringsmuligheter og gitte overføringsbåndbredder.
Ikke desto mindre har man basisulemper i konvensjonelle tokanals lydsys-temer, og disse ulemper fører til en begrenset romfølelse for lytteren grunnet det faktum at man har bare holdt seg til to høyttalere. Tiden første så til utviklingen av såkalt "surround-teknikk" for større romvirkning, og en rekommandert flerkanal slik surround-representasjon omfatter i tillegg til de to stereokanaler L hhv. R en ytterligere sentral kanal C, to surround-kanaler Ls, Rs, og eventuelt en lavfrekvenskanal for forsterkning av det nedre toneområdet, ofte kalt sub-woofer. Et slikt referanselydformat kalles også 3/2-stereo (eller formatet 5.1), hvilket betyr tre frontkanaler og to surround-kanaler. Generelt vil man altså ha behov for fem overføringskanaler for lyden. I en avspilling vil man måtte ha minst fem høyttalere på tilsvarende fem ulike plasser for å få et optimalt såkalt "sweet spot", her kalt "kjernepunkt" med en viss avstand fra disse fem fortrinnsvis godt plasserte høyttalere.
En rekke teknikker har funnet dagens lys for å redusere den datamengde som trengs for overføring av et flerkanals lydsignal. Slike teknikker kalles gjerne joint-teknikker for stereo, idet man da mener kombinasjonsteknikker. Når det gjelder dette vises til fig. 10 i tegningene som viser en såkalt joint stereo device, dvs. et kombi-nasjonsstereoapparat 60. Apparatet kan være et som implementerer for eksempel intensitetsstereo (IS), parametrisk stereo (PS) eller (en relatert) binaural indikasjonskoding (BCC: det man kan kalle en stikkords- eller indikasjonskoding). Et slikt apparat mottar generelt - som en inngang - minst to kanaler (CH1, CH2,... CHn) og sender ut en enkeltbærerkanal og parametriske data. Disse data er slik definerte at man kan beregne en tilnærmelse til en originalkanal (CH1, Ch2,... CHn) i en dekoder.
Normalt vil bærerkanalen omfatte avlastings- eller samplingsverdier for et subbånd, spektralkoeffisienter, tidsplansamplingsverdier etc, og disse vil gi en komparativt fin representasjon av det underliggende signal. Mens de parametriske data ikke innbefatter slike samplingsverdier for spektralkoeffisienter, men omfatter styreparametere for styring/kontroll av en viss rekonstruksjonsalgoritme så som for veiing ved multiplikasjon, tidsforskyvning, frekvensforskyvning eller fasedreiing. Disse parametriske data omfatter derfor bare en relativt grov representasjon av signalet i den tilhørende kanal. Fastlagt med tall vil den datamengde som trengs for en bærerkanal som er kodet ved hjelp av en konvensjonell tapsbeheftet audiokoder være i størrelsesorden 60-70 kBit/s, mens datamengden som trengs ved parametrisk sideinformasjon for en enkelt kanal vil være i størrelsesorden 1,5 - 2,5 kBit/s. Et eksempel for parametriske data er de velkjente skaleringsfaktorer, intensitetsstereoinformasjon eller de binaurale indikasjonsparametere, beskrevet nærmere nedenfor.
Intensitetsstereokoding er beskrevet i litteraturstedet: "AES preprint 3799, "Intensity Stereo Coding", J. Herre, K. H. Brandenburg, D. Lederer, på det 96. AES, februar 1994, Amsterdam". Generelt er konseptet for intensitetsstereo basert på en hovedaksetransformasjon som anvendes på data for begge de stereofoniske lydkanaler. Hvis flesteparten av de datapunkter som dannes blir konsentrert rundt den første hovedakse kan man få en kodegevinst eller - forsterkning ved å dreie begge signaler en viss vinkel før kodingen og utelukke den andre ortogonale komponent fra overføringen i bitstrømmen. De rekonstruerte signaler for venstre og høyre stereokanal vil da bestå av forskjellig vektlagte eller skalerte versjoner av ett og samme overførte signal. Likevel vil de rekonstruerte signaler avvike i amplitude, men være identisk når det gjelder faseinformasjon. Energi/tidsomslutningene eller - omhylningene for begge opprinnelige lydkanaler vil imidlertid beholdes ved hjelp av den selektive skalerings-operasjon som typisk arbeider på frekvensselektiv måte. Dette tilsvarer den mennes-kelige hørselskurve, persepsjonen, for lyd ved høyere frekvenser, hvor de dominerende romidentiifkasjoner blir bestemt av energiomhylningene.
I tillegg vil det overførte signal i praktiske anvendelser, nemlig bærerkanalen genereres ut fra summesignalet for venstre og høyre kanal i stedet for dreiing av begge komponenter. Videre er slik at denne signalbehandling, dvs. genereringen av intensi-tetsstereoparametere for å utføre skaleringsoperasjonen, utføres frekvensselektivt, dvs. uavhengig for hvert skaleringsfaktorbånd, dvs. kodefrekvensoppdelingen. Fortrinnsvis kombineres begge kanaler slik at det dannes en kombinert bærerkanal, og i tillegg til denne kombinerte kanal bestemmes intensitetsstereoinformasjonen som er avhengig av energien i den første kanal, energien i den andre kanal eller energien i den kombinerte kanal.
BCC-teknikken er beskrevet i: "AES convention paper 5574, Binaural cue coding applied to stereo and multichannel aduio compression, C. Faller, F. Baumgarten, mai 2002, Miinchen". I BCC-koding omvandles et antall lydinngangs-kanaler til en spektral representasjon ved bruk av en DFT-basert transformasjon (basert på diskret Fourier transformasjon) og med overlappende vinduer. Det resulterende jevne spektrum deles deretter opp i ikke-overlappende deler som hver har sin indeks. Hver del får da en båndbredde som er proporsjonal med den ekvivalente rektangulære båndbredde (ERB). Interkanalnivåforskjellene (1CLD) og interkanalstidsforskjellene (ICTD) estimeres deretter for hver del og for hver enkelt ramme k. ICLD og ICTD blir deretter kvantisert og kodet, hvilket fører til en BCC-bitstrøm. Disse størrelser ICLD og ICTD er gitt for hver kanal relativt til en referansekanal. Deretter beregnes parametrene i samsvar med forhåndsbeskrevne formelverk, hvilke avhenger av de bestemte deler man ønsker behandlet i signalet.
På en dekoderside mottar dekoderen et mono-signal og den aktuelle BCC-bitstrøm. Mono-signalet transformeres til frekvensplanet og føres til en romsynteseblokk som også mottar dekodede ICLD- og ICTD-verdier. I denne blokk blir disse verdier brukt til å utføre en veiing av mono-signalet for å syntetisere flerkanalssignalene som etter en tilbakeomvandling fra frekvens- til tidsplanet kommer til å representere en rekonstruksjon av det opprinnelige flerkanals lydsignal.
Når det gjelder BCC er joint stereomodulen 60 operativ for å føre ut kanalsideinformasjonen slik at de aktuelle parametriske kanaldata blir kvantiserte og dermed kodede ICLD- eller ICTD-parametere, idet en av de opprinnelige kanaler da brukes som referansekanal for koding av kanalsideinformasjonen.
Typisk dannes bærerkanalen i den mest enkle utførelse av summen av de deltakende originalkanaler.
Naturlig vil de ovenfor skisserte teknikker bare gi en mono-representasjon for en dekoder, idet denne bare kan behandle bærerkanalen, men ikke de parametriske data for generering av en eller flere tilnærmelser for mer enn én inngangskanal.
Den audiokodeteknikk som er kjent som den binaurale informasjonskoding (BCC) er også godt beskrevet i patentlitteraturen, nemlig i US patentsøknader 2003/0219130 Al, 2003/0026441 Al og 2003/0035553 Al. Ytterligere referanse gjøres også til: "Binaural cue coding. Part II: Schemes and Applications" av C. Faller og F. Baumgarten, IEEE Trans. On Audio and Speech Proe, Vol. 11, Nr. 6, november 2003. Patentskriftene nevnt ovenfor og de to siterte tekniske publikasjoner for BCC-teknikken av Faller og Baumgarten tas her med som referansemateriale i sin helhet.
Vesentlige forbedringer av BCC-skjemaene som gjør de parametriske skjemaer anvendbare for et langt større bitrateomfang er altså kjent som "parametrisk stereo"
(PS) og for eksempel standardisert i MPEG-4 høyeffektiv AAC v2. En av de viktigste utvidelser av den parametriske stereoteknikk er inkluderingen av en romlig parameter for diffusitet. Dette konsept er hjemmehørende i den matematiske egenskap av interkanalsrelasjonen eller interkanalskoherensen (ICC). Analysen, den oppfattelses-messige kvantisering, overføringen og synteseprosessene for PS-parametre er beskrevet i detalj i "Parametric coding of stereo audio", av J. Breebaart, S. van de Par, A. Kohlrausch og E. Schuijers, EURASIP J. Appl. Sign. Proe. 2005:9, 1305-1322. Ytterligere referanse er til artikkelen av J. Breebaart, S- van de Par, A. Kohlrasuch, E. Schuijers: "High-Quality Parametric Spatial Audio Coding at Low Bitrates" AES 116. Convention, Berlin, Preprint 6072, mai 2004 og av E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, : "Low Complexity Parametric Stereo Coding", AES 116. Convention, Berlin, Preprint 6073, mai 2004.
I det følgende skal et typisk generelt BCC-skjema for flerkanals lydkoding utredes i nærmere detalj, idet det samtidig vises til fig. 11-13 i tegningene. Fig. 11 viser et slikt generelt binauralt indikasjonskodeskjema for koding/overføring av flerkanals audiosignaler. Det flerkanals audioinngangssignal på en inngang 110 i en BCC-koder 112 er blandet ned i en nedblandingsblokk 114. I det foreliggende eksempel er det opprinnelige (originale) flerkanalssignal på inngangen 110 et femkanals surroundsignal med en venstre frontkanal, en høyre frontkanal, en venstre surroundkanal, en høyre surroundkanal og en sentral kanal eller midtkanal. I en foretrukket utførelse av denne foreliggende oppfinnelse frembringer nedblandingsblokken 114 et summesignal med enkel addisjon av disse fem kanaler til et mono-signal. Andre nedblandingsskjemaer er imidlertid kjente innenfor teknikken, slik at man ved å bruke et flerkanals inngangssignal kan komme frem til et nedblandingssignal med en enkelt kanal. Denne enkelt-kanal føres ut på en summesignallinje 115. Sideinformasjon som fremkommer ved hjelp av en BCC-analyseblokk 116 føres ut på en sideinformasjonslinje 117.1 analyseblokken 116 beregnes størrelsene i (ICLD) og (ICTD) definert ovenfor, og i senere tid har denne blokk 116 tatt opp i seg parametriske stereoparametere i form av interkanal-korrelasjonsverdier (ICC-verdier). Summesignalet og sideinformasjonen overføres deretter fortrinnsvis i kvantisert og kodet form til en BCC dekoder 120 som dekompo-nerer det overførte summesignal til flere subbånd og anvender skalering, forsinkelse og annen signalbehandling for å frembringe subbåndene for lydsignalene i utgaående multikanal. Denne behandling utføres slik at parametrene for ICLD, ICTD og ICC (indikasjonene) for et rekonstruert flerkanalssignal på en utgang 121 blir tilsvarende de respektive indikatorer det opprinnelige flerkanalssignal på inngangen 110 i BCC- koderen 112.1 dette henseendet omfatter BCC koderen 120 en BCC synteseblokk 122 og en sideinformasjonsbehandlingsblokk 123.
I det følende skal vi gjennomgå den indre oppbygging av BCC-synteseblokken 122, idet det vises til fig. 12 på tegningene. Summesignalet på linjen 115 føres inn til en omvandlerenhet eller filterbank FB 125 for tids/frekvensomvandling. På blokkens eller bankens 125 utgang foreligger det i alt N subbåndsignaler, eller i ekstremtilfellet er det der en hel blokk av spektralkoeffisienter, når banken eller blokken 125 utfører en liketransformasjon, dvs. en transformasjon 1:1 som frembringer de N spektralkoeffisienter fra i alt N tidsplansamplingsverdier.
BCC-synteseblokken 122 omfatter videre et forsinkelsestrin 126, et nivåmodi-fikasjonstrinn 127, et korrelasjonsbehandlingstrinn 128 og et inversfilterbanktrinn 1FB 129. På utgangen av dette sist nevnte trinn IFB 129 kan det rekonstruerte flerkanals lydsignal som for eksempel dekker 5 kanaler dersom man har et 5 kanals surround-system, føres ut til et sett høyttalere 124 slik det er illustrert på fig. 11.
Som vise på fig. 12 omvandels inngangssignalet s(n) til frekvensplanet eller filterbankplanet ved hjelp av det element 125 som ovenfor er kalt filterbanken FB eller blokken 125. Signalutgangen fra dette element 125 multipliseres slik at flere versjoner av samme signal fremkommer, slik det er illustrert med multiplikasjonsknutepunktet eller noden 130. Antallet versjoner av det opprinnelige signal vil være likt antallet utgangssignaler i utgangssignalet som skal rekonstrueres. Når generelt hver versjon av det opprinnelige signal (originalsignalet) i knutepunktet 130 heftes slik at det får en viss forsinkelse di, d2, ..., d,..., dN, og ved denne hefting eller forsinkelse blir forsinkelsesparametrene beregnet i sideinformasjonsbehandlingsblokken 123 vist på fig. 11 og utledes fra interkanals tidsforskjellen slik denne er fastlagt i BCC analyseblokken 116.
Det samme gjelder multiplikasjonsparametere at, a2,.--, a, ...,aN, som også beregnes ved hjelp av sideinformasjonsbehandlingsblokken 123, basert på interkanals nivåforskjellene slik de er beregnet ved hjelp av BCC analyseblokken 116.
De ICC parametere som er beregnet i denne blokk 116 brukes til styring/ kontroll av blokkens 128 funksjonsmessighet eller funksjonalitet, slik at visse korrela-sjoner mellom de forsinkede og nivåbehandlede signaler fremkommer på utgangene fra blokken. Det skal her bemerkes at rekkefølgen av trinne 126, 127, 128 kan avvike fra det tilfellet som er illustrert på fig. 12.
Det skal videre bemerkes her at BCC-analysen utføres ramme-for-ramme, når behandlingen av et lydsignal foregår på denne måte. Dette innebærer at utviklingen foregår tidsvarierende og dessuten frekvensvarierende. Dette innebærer på sin side at BCC parametrene for hvert spektralbånd fremkommer, på slik måte at dersom man har audiofilterbanken 125 for dekomponering av inngangssignalet til f.eks. 32 båndpass signaler, vil BCC-analyseblokken 116 danne et sett BCC parametere for hvert av disse 32 bånd. Naturligvis vil BCC synteseblokken 122 vist på fig. 11 og illustrert i nærmere detalj på fig. 12, utføre en rekonstruksjon som også er basert på eksempelets 32 bånd.
I det følgende skal vises til fig. 13 som illustrerer oppsettet for å bestemme bestemte BCC parametere. Normalt vil parametrene ICLD, ICTD og ICC kunne fastlegges mellom par av kanaler, men det foretrekkes likevel å bestemme parametrene ICLD og ICTD mellom en referansekanal og hver annen kanal, idet dette er illustrert på fig. 13 A. ICC-parametrene kan fastlegges på forskjellig måte, og vanligvis vil man kunne estimere dem i koderen mellom samtlige mulige kanalpar, slik det er indikert på fig. 13B. I dette tilfellet vil man la en dekoder syntetisere ICC slik at disse parametere blir tilnærmet de samme som i det opprinnelige flerkanalssignal mellom samtlige mulige kanalpar. Man har imidlertid foreslått å bare estimere ICC parametrene mellom de kraftigste to kanaler ved hvert tidspunkt, og et slikt skjema er illustrert på fig .13C, hvor et eksempel er vist hvor en bestemt ICC parameter i et bestemt tidspunkt estimeres mellom kanalene 1 og 2, mens en slik parameter ved et annet tidspunkt beregnes mellom kanalene 1 og 5. Dekoderen syntetiserer deretter interkanal-korrelasjonen mellom de kraftigste kanaler i dekoderen og legger inn en eller annen heuristisk regel for beregningen og syntesen av interkanals koherensen for de resterende kanalpar.
Når det gjelder beregningen av multiplikasjonsparametrene ah aN basert på overførte ICLD-parametere kan man for eksempel vise til AES convention paper 5574 sitert ovenfor. ICLD-parametrene representerer en energifordeling i et opprinnelig flerkanalssignal, og uten tap av generalitet er det på fig. 13A vist fire slike ICLD-parametere med vist energiforskjell mellom samtlige øvrige kanaler og den venstre frontkanal. I behandlingsblokken 123 for sideinformasjon utvikles multiplikasjonsparametrene ai, ...aN fra ICLD-parametrene slik at den totale energi av samtlige rekonstruerte utgangssignaler blir den samme som (eller proporsjonal med) energien for det overførte summesignal. En enkel måte til bestemmelse av disse parametere vil være en totrinns prosess hvor man i et første trinn setter multiplikasjonsfaktoren for venstre frontkanal til én, mens multiplikasjonsfaktorene for de øvrige kanaler vist på fig. 13A settes til de overførte ICLD verdier. Deretter beregnes energien for samtlige fem kanaler i et andre trinn og sammenliknes med energien av det overførte summesignal. Etter dette nedskaleres samtlige kanaler ved bruk av en nedskalerings-faktor som er den samme for samtlige kanaler, idet denne faktor da velges slik at totalenergien for alle rekonstruerte utgangssignaler etter nedskaleringen blir lik totalenergien for det overførte summesignal.
Man har naturligvis også andre måter å beregne multiplikasjonsfaktorene på, nemlig måter som ikke baserer seg på 2-trinns prosessoren, men som bare behøver en 1-trinns prosess. En slik 1-trinns måte er beskrevet i "AES preprint: The reference modell architecture for MPEG spatial audio coding", J. Herre et al., 2005, Barcelona".
Når det gjelder forsinkelsesparametrene skal her bemerkes at de parametere som er knyttet til ICTD og sendt fra en BCC koder, kan brukes direkte dersom forsinkelsesparameteren di for venstre frontkanal settes lik null. Ingen omskalering må da utføres, siden en forsinkelse ikke egentlig endrer signalets energi.
Når det gjelder interkanalkoherensmålet ICC som sendes fra BCC koderen til BCC dekoderen, skal her bemerkes at man kan utføre en koherensmanipulasjon ved å modifisere multiplikasjonsfaktorene ai, ..., a„ så som ved å multiplisere vektfaktorene for samtlige subbånd med tilfeldige tall hvis verdier ligger mellom 20/øg,ø(-6) og 20logid(+ 6). Den kvasitilfeldige sekvens som legges inn velges fortrinnsvis slik at dens varians blir tilnærmet konstant for samtlige kritiske bånd, og slik at dens middelverdi blir lik null innenfor hvert slikt kritisk bånd. Samme sekvens brukes da for spektralkoeffisientene for hver forskjellig ramme, og på denne måte vil den lydmessige persepsjonsbredde ("avbidningsbredden") kunne styres ved modifikasjon av variansen av denne kvasitilfeldige sekvens. En større varians vil da etablere en større "bildebredde". Variansmodifikasjonene kan utføres i separate bånd som har en kritisk båndbredde, og dette muliggjør samtidig tilstedeværelse av flere objekter i et lydse-narium, hvor hvert objekt får en innbyrdes forskjellig persepsjons- eller bildebredde. En passende amplitudefordeling for den kvasitilfeldige sekvens vil være en jevn fordeling langs en logaritmisk skala, slik det er skissert i patentskriftet US 2003/0219130 Al. Imidlertid vil samtlige typer BCC-syntesebehandlinger være relatert til en enkelt inngangskanal som overføres som summesignalet fra BCC koderen til BCC dekoderen, slik det er vist på fig. 11.
Som det er skissert ovenfor og indikert på fig. 13 kan den parametriske sideinformasjon, dvs. interkanalsnivåforskjellene (ICLD), interkanalkretsforskjellene (ICTD) eller interkanalkoherensparameteren (ICC) beregnes og overføres fr hver av de fem kanaler. Dette innebærer at man normalt vil overføre fem sett interkanalsnivå-forskjeller for et femkanals signal. Det samme gjelder for interkanalstids forskjel lene. Når det gjelder interkanalskoherensparameteren kan det også være tilstrekkelig bare å sende for eksempel to sett av disse parametrene.
Videre er det ovenfor indikert og vist på fig. 12 at det ikke er noen enkelt nivå-forskjellsparameter, tidsforskjellsparameter eller koherensparameter for en enkelt ramme eller et enkelt tidsavsnitt i et signal. I stedet blir disse parametere bestemt for flere ulike frekvensbånd slik at man oppnår en frekvensavhengig parameterisering. Siden det foretrekkes å bruke for eksempel 32 frekvenskanaler, dvs. en filterbank med 32 frekvensbånd, for BCC analysen og -syntesen kan parametrene oppta ganske store datamengder. Selv om den parametriske representasjon fører til en relativt lav dataoverføringshastighet eller datarate, sammenliknet med andre flerkanals over- føringsmetoder, vil man ha et kontinuerlig behov for ytterligere reduksjon av den datarate som trengs for representasjon av et flerkanalssignal så som et signal som har to kanaler (et stereosignal) eller et som har flere enn to kanaler så som et surround signal med flere kanaler.
Når det gjelder dette kvantiseres rekonstruksjonsparametrene som er beregnet på kodersiden i henhold til en bestemt kvantiseringsregel, og dette betyr at ukvantisert rekonstruksjon av parametere vil "mappes" (overføres konformt eller transformeres) til et begrenset sett kvantiseringsnivåer eller kvantiseringsindikatorer slik det er vist innenfor teknikkens stilling og beskrevet særskilt for parametrisk koding i detalj i artikkelen "Parametric coding of stereo audio" av J. Breebaart, S. van de Par, A. Kohlrausch og E. Schuijers, i EURASIP J. Appl. Sign. Proe. 2005:9, 1305-1322 og i artikkelen C. Faller og F. Baumgarten: "Binaural cue coding applied to audio compression with flexible rendering", i AES 113. Convention, Los Angeles, preprint 5686, oktober 2002.
Kvantiseringen har den virkning at samtlige parameterverdier som er under kvantiseringstrinnstørrelsen blir kvantisert til null, i avhengighet av om kvantiserings-utrustningen er av såkalt "mid-thread" eller "mid-riser"-typen. Ved mapping av et stort sett ukvantiserte verdier til et lite sett kvantiserte verdier oppnås ytterligere besparelse av datakraft. Disse besparelser i dataraten forsterkes ytterligere ved entropikoding av de kvantiserte rekonstruksjonsparametere på kodersiden. Fortrinnsvis er slike måter å utføre entropikoding på gjerne av typen Huffman-metoder og basert på forhåndsbestemte kodetabeller eller på en aktuell bestemmelse av signalstatistiske verdier og signaladaptiv oppsetting av kodebøker. Alternativt kan også andre verktøy av typen entropikoding brukes, herunder aritmetisk koding.
Generelt har man den regel at den dataoverføringshastighet eller datarate som trengs for rekonstruksjonsparametrene, reduseres med økende kvantiseringstrinn-størrelse. Med andre ord angis derved at et grovere kvantiseringsresultat fører til en lavere datarate, mens en finere kvantisering fører til en høyere datarate.
Siden parametrisk signalrepresentasjon normalt trengs for omgivelser hvor det brukes lav overføringshastighet for data, vil man forsøke å kvantisere rekonstruksjonsparametrene så grovt som mulig for å komme frem til en signalrepresentasjon som har en viss mengde data i basiskanalen og dessuten en fornuftig mindre datamengde for sideinformasjonen, idet denne omfatter de kvantiserte og entropikodede rekonstruksjonsparametere.
Allerede kjente metoder og fremgangsmåter utleder således rekonstruksjonsparametrene som skal overføres, direkte fra flerkanalsignalet som skal kodes. En grov kvantisering som indikert ovenfor fører således til rekonstruksjonsparameterfor-styrrelser, som igjen fører til store avrundingsfeil når den kvantiserte rekonstruksjonsparameter blir inverskvantisert i en dekoder og brukes til flerkanalsyntese. Naturligvis vil avrundingsfeilen øke med kvantiseringstirnnstørrelsen, og dette betyr at man blir låst til den valgte "kvantiseringsgrovhet". Slike avrundingsfeil kan føre til en kvantiseringsnivåendring, særskilt en endring fra et første kvantiseringsnivå ved et første tidspunkt til et andre kvantiseringsnivå ved et senere tidspunkt, idet forskjellen mellom et bestemt kvantiseringsnivå og et annet fastlegges ved det relativt store kvantiseringstrinn som er å foretrekke for en grov kvantisering. Uheldigvis vil en slik kvantiseringsnivåendring som ender opp med det større kvantiseringstrinn aktiveres ved bare en liten parameterendring når den ukvantiserte parameter ligger i middelområdet mellom to kvantiseringsnivåer. Det er klart at tilstedeværelsen av slike kvantisererindeksendringer i sideinformasjonen fører til samme kraftige endringer i signalsyntesetrinnet. Når - som et eksempel - interkanals nivåforskjellen tas i betraktning blir det klart at en stor endring til en stor reduksjon i lydstyrken fra et bestemt høyttalersignal og en tilhørende stor økning i lydstyrken for et signal for en annen høyttaler. Denne situasjon som bare aktiveres av en enkelt kvantiseringsnivåendring for en grovkvantisering kan oppfattes som en umiddelbar omlokalisering av en lydkilde fra en (virtuell) første posisjon til en likeledes (virtuell) andre posisjon. En slik umiddelbar omplassering fra et tidspunkt til et annet høres nemlig unaturlig ut, og dette innebærer at det oppfattes som en modulasjonsvirkning siden lydkilder for særskilt tonesignaler normalt ikke endrer sin posisjon særlig raskt.
Generelt kan også overføringsfeil føre til store endringer av kvantiseringsindekser, som umiddelbart fører til store endringer i det flerkanals utgangssignal, hvilket er enda mer virkningsfullt for situasjoner hvor en grov kvantiseringsenhet for datarategrunner er anvendt.
Den kjente teknikk for parametrisk koding av to ("stereo") eller flere ("flerkanals") audioinngangskanaler utleder romparametrene direkte fra inngangssignalene. Eksempler på slike parametere er - som indikerte ovenfor - forskjellene (ICLD) eller (IID) (interkanal intensitetsforskjellene), forsinkelsene (ICTD) eller faseforskjellene (IPD), samt interkanalkorrelasjonen/koherensen (ICC). Hver av disse størrelser overføres på en tids- og frekvensselektiv måte, dvs. i bestemte frekvensbånd og som en funksjon av tiden. For overføringen av slike parametere til dekoderen er det ønskelig med en grovkvantisering av dem for å holde sideinformasjonstakten på et minimum. Som en følge av dette finner betydelige avrundingsfeil sted når de overførte parameterverdier sammenliknes med sine opprinnelige verdier. Dette betyr at til og med en myk og gradvis endring av en bestemt parameter i originalsignalet, kan føre til en brå endring i parameterverdien som brukes i dekoderen dersom beslutningsterskeien fra én kvantisert parameterverdi til den neste verdi overskrides. Siden disse parameterverdier brukes for syntesen av utgangssignalet kan brå endringer i parameterverdier også forårsake "hopp" i utgangssignalet, og slike hopp eller "brudd" vil naturligvis oppfattes svært forstyrrende i visse signaltyper, som "switching" eller "mdoulasjon" av artefakter
(i avhengighet av den tidsmessige oppløsning eller "granularitet" og kvantiserings-oppløsningen for parametrene).
US patentsøknad 10/883 538 nevnt innledningsvis beskriver en prosess for post prosessering av overførte parameterverdier i sammenhengen med BCC-typemetoder for å unngå artefakter for bestemte signaltyper når disse representerer parametere ved liten oppløsning. Disse diskontinuerligteter i synteseprosessen fører nemlig til artefakter for tonesignaler, og av denne grunn foreslås i patentskriftet å bruke en tonalitetsdetektor i dekoderen for å analysere det overførte nedblandingssignal. Når signalet finnes å være tonalt settes en utjevningsoperasjon i gang over en viss tid for de overførte parametere, og følgelig vil en slik type signalbehandling representere et middel for effektiv overføring av parametere for tonale signaler.
Man har imidlertid klasser av inngangssignaler andre enn slike tonale inngangssignaler, hvilke er like følsomme overfor en grovkvantisering av romparametere: • Et eksempel på slike tilfeller er punktkilder som forflytter seg langsomt mellom to posisjoner (så som et støysignal som forflyttes meget langsomt mellom den midtre og den venstre fronthøyttaler). En grovkvantisering av nivåparametrene vil i et slikt tilfelle føre til hørbare "hopp" eller (diskontinuiteter) i romposisjonen og sporfølgingen av lydkilden. Siden disse signaler generelt ikke detekteres eller blir vurdert å være tonale i dekoderen, vil den tidligere kjente teknikks utjevning åpenbart ikke hjelpe i slike tilfeller. • Andre eksempler er punktkilder som forflytter seg raskt og har tonalt materiale, så som sinusoider som forflytter seg med relativt stor hastighet. Den tidligere kjente teknikks utjevning vil i dette tilfellet registrere disse komponenter som tonale og således sette i gang en utjevning. Siden imidlertid forflyttingshastigheten ikke er kjent for den kjente type utjevningsalgoritme, vil den brukte utjevningstidskonstant nødvendigvis generelt måtte bli uegnet, og for eksempel vil den kunne reprodusere en punktkilde som forflytter seg som å ha en langt lavere forflyttingshastighet, hvorved det oppstår en betydelig forsinkelse for den reproduserte romposisjon, sammenliknet med den opprinnelig mente posisjon.
Puplikasjonen WO03007656 fremleger forbedringer til tidligere kjent teknikk så som lydkodeker som genererer en stereo-illusjon gjennom etterprosessering av et mottatt monosignal.
Oppsummering
På denne bakgrunn er det et mål med den foreliggende oppfinnelse å komme frem til et signalbehandlingskonsept av forbedret type for audio- eller lydsignaler hvor man muliggjør bruk av lave overføringshastigheter på den ene side, men på den annen side oppnår god subjektiv kvalitet.
I samsvar med et første aspekt av denne foreliggende oppfinnelse nås dette mål ved at man har kommet frem til et A apparat for generering av et flerkanals synthesizerstyresignal, omfattende:
en signalanalysator for analyse av et flerkanals inngangssignal,
en kalkulator for å bestemme utjevningsstyreinformasjon i respons på resultater fra signalanalysatoren, hvilken kalkulator er innrettet for å bestemme denne styreinformasjon slik at en postprosessor på synthesizersiden i respons på utjevningsstyreinformasjonen genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt av et inngangssignal som skal behandles, og
en datagenerator for å generere et styresignal som representerer utjevningskontrollinformasjonen som det flerkanals synthesizerstyresignal. A
I samsvar med et andre aspekt av oppfinnelsen nås målet ved hjelp av en B flerkanals synthesizer for generering av et utgangssignal fra et inngangssignal, som omfatter minst én inngangskanal og en sekvens av kvantiserte, rekonstruksjonsparametere, hvor disse parametere kvantiseres i samsvar med en kvantiseringsregel og tilordnes påfølgende tidsavsnitt i inngangssignalet, hvor utgangssignalet har flere syntetiserte utgangskanaler, nemlig i et antall som er større enn antallet inngangskanaler, og hvor inngangskanalen er tilordnet et flerkanals synthesizerstyresignal som representerer utjevningsstyreinformasjon B, idet denne styreinformasjon er avhengig av en kodersidesignalanalyse og bestemmes slik at en postprosessor på synthesizersiden genererer, i respons på synthesizerstyresignalet, en postprosessert rekonstruksjonsparameter eller en postprosessert størrelse som utledes fra rekonstruksjonsparameteren, omfattende: C en styresignalgiver for å gi ut styresignalet med utjevningsstyreinformasjonen,
en postprosessor for å bestemme, i respons på styresignalet, den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse utledet fra rekonstruksjonsparameteren for et tidsavsnitt i inngangssignalet som skal behandles, idet postprosessoren er innrettet for å bestemme den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse slik at verdien av den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse er ulik en verdi som kan fremkomme ved bruk av omkvantisering i samsvar med kvantiseringsregelen, og
en flerkanals rekonstruksjonsenhet for rekonstruksjon av et tidsavsnitt av de syntetiserte utgangskanaler ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.C
Ytterligere aspekter ved denne foreliggende oppfinnelse gjelder en fremgangsmåte for å frembringe et flerkanals synthesizerstyresignal, en fremgangsmåte for å frembringe et utgangssignal fra et inngangssignal, tilhørende programmer for kjøring en datamaskin eller liknende, eller et flerkanals synthesizerstyresignal.
Den foreliggende patent er basert på den fundende kjensgjerning at en kodersiderettet utjevning av rekonstruksjonsparameteret vil føre til en bedret lydkvalitet av det syntetiserte flerkanals utgangssignal. Denne vesentlige forbedring av lydkvaliteten kan oppnås ved en ytterligere kodersidebehandling for å bestemme utjevningsstyreinformasjonen, hvilket i foretrukne utførelser av den foreliggende oppfinnelse kan styre overføringen til dekoderen, slik at overføringen bare trenger et begrenset (lite) antall bit.
På dekodersiden brukes utjevningsstyreinformasjonen til å styre utjevningen. Denne koderstyrte parameterutjevning på dekodersiden kan brukes i stedet for dekodersideparameterutjevning, hvilket bygger på for eksempel deteksjon av tonalitet/transienter eller kan brukes i kombinasjon med dekodersideparameterutjevning. Hvilken fremgangsmåte som brukes for en bestemt tidsdel eller et bestemt tidsavsnitt og et visst frekvensbånd for det overførte nedblandingssignal kan også signaleres ved bruk av utjevningsstyreinformasjonen slik den bestemmes av en signalanalysator på kodersiden.
For en oppsummering fremgår at denne oppfinnelse vil være fordelaktig ved at en kodersidestyrt/kontrollert adaptiv utjevning eller glatting av de aktuelle rekonstruksjonsparametere kan utføres i en flerkanals synteseinnretning eller synthesizer, hvilket fører til en vesentlig økning eller bedring av lydkvaliteten på den ene side, og hvor man dessuten får bare beskjeden bruk av ytterligere digitalsifre eller bit. Takket være det faktum at den inherente kvalitetsreduksjon ved kvantiseringen unngås ved bruk av den ytterligere utglattingsstyreinformasjon kan de oppfinneriske konsepter i forbindelse med den foreliggende utvikling også anvendes uten noen som helst økning, faktisk med en reduksjon av de overførte databit, siden disse bit for utjevningsstyreinformasjonen kan spares ved å anvende en enda grovere kvantisering slik at det trengs færre bit for kodingen av de kvantiserte verdier. Følgelig vil utjevningskontrollinformasjonen sammen med den aktuelle koding av de kvantiserte verdier til og med redusere behovet til samme eller mindre bitrate for de kvantiserte verdier uten utjevningskontrollinformasjon, slik det ble foreslått i den ikke-forhåndspubliserte omtalte US-patentsøknad, samtidig med at man holder samme eller høyere nivå av subjektiv lydkvalitet.
Generelt vil postprosesseringen for kvantiserte rekonstruksjonsparametere og som brukes i en flerkanals synthesizer være operativ for å redusere eller faktisk eliminere problemer som er knyttet til grovkvantiseringen på den ene side og kvantiseringsnivåendringer på den annen side.
Slik det i tidligere kjente systemer fører til at en liten parameterendring i en koder resulterer i en kraftig parameterendring i dekoderen, siden en omkvantisering i synthesizeren bare er tillatt for et begrenset sett kvantiserte verdier, utfører i motsetning til dette systemet ifølge oppfinnelsen en postprosessering av rekonstruksjonsparametrene slik at en bestemt slik parameter for et tidsavsnitt som skal behandles i inngangssignalet ikke blir bestemt av den kodertilpassede kvantiseringsrastermeka-nisme, men fører til en verdi av rekonstruksjonsparameteren som er ulik den verdi som kan oppnås ved hjelp av kvantiseringen i samsvar med den gjengse kvantiseringsregel.
I motsetning til at man i et lineært kvantiseringstilfelle ifølge den kjente teknikk bare tillater invers kvantiserte verdier i form av heltallmultiplum av kvanti-seringstrinnstørrelsen, tillates ifølge oppfinnelsens postprosessering inverskvantiserte verdier som kan være ikke-heltallige multippelstørrelser av kvantiseringstrinn-størrelsen, og dette betyr at man med oppfinnelsens postprosessering unngår begrens-ningene i kvantiseringstrinnstørrelse, siden også postprosesserte rekonstruksjonsparametere som ligger mellom to kvantiseringsnivåer kan fremkomme ved postprosessering og brukes av oppfinnelsens flerkanalrekonstruksjonsmekanisme, idet denne mekanisme i form av et apparat eller en eller flere enheter kan utnytte den postprosesserte rekonstruksjonsparameter.
Denne postprosessering kan utførelse før eller etter omkvantiseringen i en flerkanalssynthesizer, og når postprosesseringen utføres for de kvantiserte parametere, dvs. ved hjelp av kvantiseringsindeksene vil en inverskvantiseringsenhet være nødvendig, nemlig en som kan utføre inverskvantisering, ikke bare for kvantiseringstrinnmultipla, men også inverskvantisering av allerede inverskvantiserte verdier mellom multipla av kvantiseringstrinnstørrelsen.
I tilfeller hvor postprosesseringen utføres ved bruk av inverskvantiserte rekonstruksjonsparametere kan en rett frem inverskvantiseringsenhet brukes, og man kan utføre en interpolasjon/filtrering, glatting/utjevning for de aktuelle inverskvantiserte verdier.
I det tilfelle man bruker en ulineær kvantiseringsregel, så som en som er logaritmisk foretrekkes en postprosessering av de kvantiserte rekonstruksjonsparametere før omkvantiseringen, siden en slik logaritmisk kvantisering vil være tilsvarende ørets persepsjonskurve for lyd, hvilket blir mer nøyaktig for lavnivålyd, men mindre nøyaktig for høynivålyd, dvs. at man får en slags logaritmisk kompresjon.
Det skal her bemerkes at de inventive meritter ikke bare oppnås ved modifikasjon av rekonstruksjonsparameteren selv, hvilket omfattes i bitstrømmen som kvanti-seringsparameteren, men fordelene kan også oppnås ved å utlede en postprosessert størrelse ut fra rekonstruksjonsparameteren. Dette er spesielt anvendbart når rekonstruksjonsparameteren er en differanseparameter og en manipulasjon så som glatting eller utjevning utføres på en absoluttparameter som er utledet fra denne differanseparameter.
I en foretrukket utførelse av denne foreliggende oppfinnelse styres og kontrolleres postprosesseringen for rekonstruksjonsparametrene ved hjelp av en signalanalysator som utfører analyse av den signaldel som er tilordnet en rekonstruksjonsparameter, i den hensikt å finne ut hvilken signalkarakteristikk som foreligger. I en likeledes foretrukket utførelse aktiveres den dekoderkontrollerte/styrte postprosessering bare for tonale partier i signalet (når det gjelder frekvens og/eller tid) eller når disse tonale partier genereres av en punktskilde utelukkende for punktkilder som forflytter seg langsomt, mens postprosesseringen er deaktivert for partier som ikke er tonale, dvs. for transiente deler av inngangssignalet eller for punktkilder som forflytter seg raskt og som genererer tonalt materiale. Dette sikrer at full dynamikk for rekonstruksjonspara-meterendringer blir overført for transiente partier i audiosignalet, mens dette overhodet ikke er tilfelle for signalets tonale partier.
Fortrinnsvis utfører postprosessoren en modifikasjon i form av en glatting eller utjevning av rekonstruksjonsparametrene, der dette er av betydning eller er fornuftig ut fra et psykoakustisk betraktningssted, uten påvirkning av viktige romdeteksjonsindika-sjoner, hvilket er av spesielt stor viktighet for ikke-tonale, dvs. transiente signalpartier.
I og med denne foreliggende oppfinnelse kan man også komme frem til en lav datarate, siden kodersidekvantiseringen av rekonstruksjonsparameteret kan være en grovkvantisering, siden systemkonstruktøren ikke behøver å frykte vesentlige endringer i dekoderen på grunn av en endring fra en rekonstruksjonsparameter fra et inverskvantisert nivå til et annet inverskvantisert nivå, idet en slik endring reduseres ved den opprinneriske prosessering eller signalbehandling ved mapping eller konform transformasjon til en verdi som ligger mellom to omkvantiseringsnivåer.
En annen fordel med denne oppfinnelse er at systemkvaliteten bedres siden hørbare artefakter forårsaket av en endring fra ett omkvantiseringsnivå til det neste tillatte slike nivå blir redusert ved hjelp av oppfinnelsens postprosessering, idet denne er operativ for transformasjon eller mapping til en verdi mellom to tillatte omkvantiseringsnivåer.
På naturlig måte representerer den inventive postprosessering av kvantiserte rekonstruksjonsparametere et ytterligere informasjonstap, i tillegg til det informasjonstap som fremkommer ved parametiseringen i koderen og den etterfølgende kvantisering av den rekonstruerte parameter. Dette er imidlertid ikke noe problem siden postpro-sessorene ifølge oppfinnelsen fortrinnsvis bruker den aktuelle eller foregående kvantiserte rekonstruksjonsparameter for bestemmelse av en postprosessert slik parameter som skal brukes til rekonstruksjonen av det aktuelle tidsavsnitt i inngangssignalet, dvs. signalet i basiskanalen. Det har blitt demonstrert at dette fører til en bedret subjektiv lydkvalitet siden koderinduserte feil kan kompenseres for innenfor et visst omfang, og i tillegg vil kodersideinduserte feil som ikke kompenseres av postprosesseringen av rekonstruksjonsparametrene få redusert store endringer i romopp-fattelsen i det rekonstruerte flerkanals lydsignal, fortrinnsvis bare for tonalsignaldeler, slik at den subjektive lytterkvalitet bedres i ethvert tilfelle, uavhengig av det faktum at dette fører til et ytterligere informasjonstap eller ikke.
Kort gjennomgåelse av tegningen
Foretrukne utførelser av denne foreliggende oppfinnelse er forløpende beskrevet nedenfor, og samtidig vises til de tilhørende tegninger, hvor: fig. la viser skjematisk en innretning eller et apparat på kodersiden og et tilsvarende apparat på den tilhørende dekoderside, i samsvar med den første utførelse av
denne oppfinnelse,
fig. lb viser skjematisk det samme på koder- og dekodersiden, men nå i samsvar med
en ytterligere foretrukket utførelse av den foreliggende oppfinnelse,
fig. lc viser skjematisk et blokkskjema over en foretrukket kontroll/styresignal-generator,
fig. 2a viser skjematisk hvordan man bestemmer romposisjonen av en lydkilde,
fig. 2b viser et flytskjema over en foretrukket utførelse for beregning av en utjevnings- eller glattetidskonstant, som et eksempel for utjevningsinformasjon, fig. 3a viser en alternativ utførelse for beregning av kvantisert interkanalsintensitets-forskjeller og tilhørende glatte- eller utjevningsparametere,
fig. 3b viser et eksempel på skjema for illustrasjon av forskjellen mellom en målt IID-parameter pr. ramme og en kvantisert tilsvarende slik IID-parameter pr. ramme, samt en prosessert kvantisert IID-parameter pr. ramme, det hele for
ulike tidskonstanter,
fig. 3c viser et flytskjema over en foretrukket utførelse av konseptet som anvendt på
fig. 3a,
fig. 4a viser skjematisk oppsettet for et dekodersiderettet system,
fig. 4b viser et skjematisk diagram over en kombinasjon postprosessor/ signalanalysator for bruk i oppfinnelsens flerkanals synthesizer vist på fig. lb,
fig. 4c viser skjematisk representasjonen av tidsavsnitt for inngangssignalet og til-hørende kvantiserte rekonstruksjonsparametere for passerte signalavsnitt,
aktuelle signalavsnitt som skal behandles og fremtidige signalavsnitt,
fig. 5 viser utførelse av koderstyrt parameterutjevning i et apparat tilhørende fig. 1, fig. 6a viser en annen utførelse av et utjevnings- eller glatteapparat vist på fig.l for
koderstyrt parameterbehandling,
fig. 6b viser nok en foretrukket utførelse av et tilsvarende utjevningsapparat,
fig. 7a viser enda en utførelse av det koderstyrte parameterutjevningsapparat vist på
fig. 1,
fig. 7b viser en skjematisk indikasjon av de parametere som skal postprosesseres i samsvar med oppfinnelsen, slik at det vises også hvordan en størrelse som er
utledet fra rekonstruksjonsparameteren kan glattes ut eller utjevnes,
fig. 8 viser skjematisk en kvantiseringsenhet/inverskvantiseringsenhet som utfører en rett frem transformasjon eller mapping eller en avansert slik transformasjon,
fig. 9a viser et eksempel på tidsforløpet for kvantiserte rekonstruksjonsparametere
som er tilordnet påfølgende inngangssignalpartier,
fig. 9b viser tidsforløpet for postprosesserte rekonstruksjonsparametere som er postprosesserte ved hjelp av en postprosessor som implementerer en glatting eller
utjevning i form av en lavpassfunksjon,
fig. 10 illustrerer en sammenføyd "joint" stereokoder av tidligere kjent type,
fig. 11 viser et blokkskjema over en tidligere kjent BCC-koder/dekoderkjede,
fig. 12 viser et blokkskjema over en tidligere kjent implementering av en BCC synteseblokk fra fig. 11,
fig. 13 viser en representasjon av et velkjent skjema for å bestemme parametrene
ICLD, ICTD og ICC,
fig. 14 viser en sender og en mottaker i et overføringssystem, og fig. 15 viser en lydopptaker med en inventiv koder og en lydspiller med en dekoder.
Detaljert beskrivelse av utførelsesformer
Fig. la og lb viser altså blokkskjemaer over senarier for flerkanals kodere/- synthesizere ifølge oppfinnelsen. Som det vil vises senere når fig. 4c skal gjennomgås vil et signal som ankommer dekodersiden ha minst én inngangskanal og en hel sekvens av kvantiserte rekonstruksjonsparametere, idet disse parametere er kvantiserte i samsvar med en bestemt kvantiseringsregel. Hver slik parameter er tilordnet et tidsavsnitt for inngangskanalen slik at en sekvens av etterfølgende tidsavsnitt blir tilordnet en sekvens kvantiserte rekonstruksjonsparametere. I tillegg har utgangssignalet som genereres ved hjelp av en flerkanals synthesizer som vist på fig. la og lb flere syntetiserte utgangskanaler som i ethvert tilfelle er i et antall større enn antallet inngangskanaler i inngangssignalet. Når antallet inngangskanaler er lik 1, dvs. at det bare er en enkelt inngangskanal vil utgangskanalantallet være 2 eller flere. Når imidlertid antallet inngangskanaler er 2 eller 3, vil antallet utgangskanaler være minst 3 eller minst 4.
I BCC-tilfellet er antallet inngangskanaler 1 eller generelt ikke mer enn 2, mens antallet utgangskanaler vil være 5 (nemlig venstre surround, venstre, midtre, høyre og høyre surround) eller 6 (S surroundkanaler pluss 1 sub-woofer kanal for ekstrem bass) eller til og med flere i tilfelle man har et format 7.1 eller 9.1 for flerkanalene. Generelt angitt vil antallet utgangskilder være større enn antallet inngangskilder.
Fig. 1 a illustrerer til venstre et apparat 1 for å frembringe et flerkanals synthesizerstyresignal, idet originaluttrykket "controI" (her hovedsakelig er oversatt med styring, selv om både styring og kontroll vil være anvendelige). Boks 1 som er angitt med uttrekking av glatte- eller utjevningsparameter omfatter en signalanalysator, en kalkulator for glatteinformasjon og en datagenerator. Som vist på fig. lc mottar signal analysatoren la som en inngang det opprinnelige flerkanalssignal. Signalanalysatoren analyserer dette flerkanals inngangssignal for å komme frem til et analyseresultat som deretter videreformidles til kalkulatoren for glatterinformasjon for å bestemme glattekontrollinformasjonen i respons på resultatet fra signalanalysatoren, dvs. i form av utgangssignaler fra denne. Særskilt er kalkulatoren lb i drift eller innrettet for å bestemme glatteinformasjonen på en slik måte at en dekoderside-parameterpostpro-sessor i respons på glattekontroll/styreinformasjonen genererer en utjevnet eller glattet parameter eller en utjevnet eller glattet størrelse som er utledet fra parameteren, for et tidsavsnitt i inngangssignalet som skal behandles, slik at en størrelse for den utjevnede rekonstruksjonsparameter eller den utjevnede størrelse blir ulik en størrelse som kan oppnås ved bruk av omkvantisering i samsvar med en kvantiseringsregel.
Videre omfatter glatteparameteruttrekkingsapparatet 1 på fig. la en datagenerator for å sende ut et styresignal som representerer glattekontrollinformasjonen som dekoderstyresignal.
Særskilt kan styresignalet som representerer utjevnings- eller glattestyre-informasjonen være en utjevningsmaske, en utjevningstidskonstant eller en hvilken som helst annen størrelse som styrer dekodersideutjevningsdriften slik at et rekonstruert flerkanals utgangssignal som er basert på utjevnede verdier får en bedret kvalitet sammenliknet med utgangssignaler av rekonstruert multikanaltype, nemlig signaler som er basert på ikke utjevnede eller glattede verdier.
Utjevningsmasken omfatter signaleringsinformasjon som består av blant annet flagg for indikasjon av tilstanden av/på for hver frekvens som brukes for utjevningen eller glattingen. Følgelig kan glattemasken betraktes som en vektor som er tilordnet en bestemt ramme med en bit for hvert bånd, idet denne bit styrer om den koderstyrte glatting eller utjevning er aktiv for dette bånd eller ikke.
En audiokoder for romvirkningslyd og som vist på fig. la omfatter fortrinnsvis et nedtransponeringstrinn 3 ("nedblander") og en etterfølgende audiokoder 4. Videre omfatter audiokoderen med romvirkning totalt en uttrekkingsinnretning 2 for romparametere, for å gi ut kvantiserte romindikatorer ("cues") så som de allerede gjennomgåtte forskjeller (ICLD) og (ICTD) samt interkanalkoherensverdiene (ICC), interkanalfase-forskjelllene (ITD), interkanals intensitetsforskjellene (HD) etc. I denne sammenheng skal her skisseres at interkanals nivåforskjellene i alt vesentlig er de samme som interkanals intensitetsforskjellene.
Blanderen 3 eller nedtransponeringstrinnet kan være bygget opp som for gjenstand 114 på fig. 11, og dessuten kan innretningen 2 for parameterekstraksjon være implementert som skissert for gjenstanden 116 på fig. 11. Imidlertid kan også alternative utførelser for blanderen 3 så vel som ekstraktoren eller uttrekkeren 2, ovenfor kalt innretning, brukes i prinsippene for den foreliggende oppfinnelse.
Videre vil audiokoderen 4 ikke nødvendigvis være inkludert i alle tilfeller, men denne koder eller innretning vil særskilt måtte brukes når dataoverføringshastigheten for nedtransponeringssignalet på utgangen av elementet, innretningen eller ekstraktoren 3 er for stor til en overføring av dette signal via de aktuelle overførings/lagringsmidler/ kretser.
En audiodekoder for romvirkning omfatter videre en koderstyrt parameterutjevningsinnretning 9a koplet til et flerkanals opptransponeringstrinn 12 (en oppblander). Inngangssignalet for denne oppblander eller altså opptransponerings-trinnet 12 vil normalt være utgangssignalet fra en audiodekoder 8 for dekoding av det overførte/lagrede nedtransponeringssignal.
Fortrinnsvis er det i og med oppfinnelsen anordnet en styresignalgiver for å generere det styresignal som innbefatter utjevningsstyreinformasjonen, i oppfinnelsens flerkanals synthesizer for generering av et utgangssignal fra et inngangssignal, som omfatter minst én inngangskanal og en sekvens av kvantiserte, rekonstruksjonsparametere, hvor disse parametere kvantiseres i samsvar med en kvantiseringsregel og tilordnes påfølgende tidsavsnitt i inngangssignalet, hvor utgangssignalet har flere syntetiserte utgangskanaler, nemlig i et antall som er større enn antallet inngangskanaler, og hvor inngangskanalen er tilordnet et flerkanals synthesizerstyresignal som representerer utjevningsstyreinformasjon. Denne styresignalgiver kan være en datastrømdemulti-plekser, der styreinformasjonen blir multipleksordnet sammen med para-meterinformasjonen. Når imidlertid styreinformasjonen overføres fra apparatet 1 til apparatet eller innretningen 9a på fig. la via en separat kanal som er skilt fra para-meterkanalen 14a eller signalkanalen for nedtransponeringssignalet, tilkoplet inngangs-siden av audiodekoderen 8, vil styresignalgiveren rett og slett være en inngang på apparatet eller innretningen 9a for å motta det styresignal som genereres av uttrekkingsinnretningen 1 på fig. la.
Videre omfatter den inventive flerkanalsynthesizer en postprosessor 9a, som også her er kalt en koderstyrt parameterutjevningsinnretning. Postprosessoren brukes til å bestemme en postprosessert rekonstruksjonsparameter eller en postprosessert størrelse som er utledet fra denne rekonstruksjonsparameter, for et tidsavsnitt i inngangssignalet som skal behandles, idet postprosessoren er innrettet for å kunne bestemme rekonstruksjonsparameteren eller den postprosesserte størrelse slik at verdien av parameteren eller denne størrelse blir ulik en verdi som kan oppnås ved bruk av omkvantisering i samsvar med kvantiseringsregelen. Den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse formidles deretter fra innretningen eller apparatet 9a til flerkanalsopptransponeringstrinnet 12 slik at dette trinn i form av en blander eller en flerkanalsrekonstruksjonskrets 12 kan utføre rekonstruksjon av et tidsavsnitt fra antallet syntetiserte utgangskanaler og ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.
Videre skal her vises til den foretrukne utførelse av den foreliggende oppfinnelse og illustrert på fig. lb, idet det vises en kombinasjon av den koderstyrte parameterutjevning eller -glatting og den dekodede styrte parameterutjevning eller - glatting slik det er fastlagt i den ikke tidligere publiserte patentsøknad US 10/883 538.1 denne utførelse genererer utjevningsparameteruttrekkingsinnretningen 1, vist i detalj på fig. lc ytterligere et koder/dekoderstyreflagg 5a som overføres til en blokk 9b for kombinasjon/omkopling av resultater.
Den flerkanals synthesizer som er vist på fig. lb eller som også kan kalles en audiodekoder for romvirkning omfatter videre en postprosessor for rekonstruksjonsparametere, nemlig postprosessoren 10, idet denne er lik den dekoderstyrte para-meterutjevnende innretning, samt flerkanalsrekonstruksjonskretsen 12. Innretningen 10 er innrettet for å motta kvantiserte og fortrinnsvis kodede rekonstruksjonsparametere for fortløpende tidsavsnitt i inngangssignalet. Innretningen 10 i form av en postprosessor er videre innrettet for å bestemme den postprosesserte rekonstruksjonsparameter i en utgang, for et tidsavsnitt som skal behandles i inngangssignalet. Postprosessoren arbeider i samsvar med en postprosesseringsregel som i visse foretrukne utførelser er en lavpassfiltreringsregel, en utjevnings- eller glatteregel eller en annen tilsvarende operasjon. Særskilt er postprosessoren innrettet for å bestemme den postprosesserte rekonstruksjonsparameter slik at en størrelse eller verdi av denne parameter blir ulik den verdi som kan oppnås ved omkvantisering av enhver kvantisert rekonstruksjonsparameter i samsvar med kvantiseringsregelen.
Flerkanalstrinnet 12 for rekonstruksjon brukes til å rekonstruere et tidsavsnitt for hvert av antallet synteseutgangskanaler og ved bruk av tidsavsnittene i den behandlede inngangskanal og den postprosesserte rekonstruksjonsparameter.
I foretrukne utførelser av denne foreliggende oppfinnelse er de kvantiserte rekonstruksjonsparametere kvantiserte BCC parametere så som forskjellene interkanals nivåforskjeller interkanals tidsforskjeller eller interkanals koherens parametere eller interkanals forskjeller eller interkanals intensitetsforskjeller. Naturligvis vil alle andre rekonstruksjonsparametere så som stereoparametere for intensitetsstereo eller parametere for parametrisk stereo også kunne behandles i samsvar med den foreliggende oppfinnelse.
Styreflagget for koderen/dekoderen overføres via linjen 5a og er indikativt for styring av en omkopler eller en kombinasjon i innretningen 9b for formidling av enten dekoderstyrte utjevningsverdier eller koderstyrte utjevningsverdier, til blanderen 12 for opptransponering av flere kanaler.
I det følgende skal vises til fig. 4c som illustrerer et eksempel for en bitstrøm. Denne bitstrøm omfatter flere rammer 20a, 20b, 20c, ..., og hver ramme omfatter et tidsavsnitt av inngangssignalet, idet dette avsnitt er indikert med den øvre rektangel i en ramme på fig. 4c. I tillegg omfatter hver enkelt ramme et sett kvantiserte rekonstruksjonsparametere som tilordnes tidsavsnittet og som er illustrert på fig. 4c med den nedre rektangel i hver enkelt ramme 20a, 20b, 20c. Som et eksempel betraktes ramme 20b i ett tilfelle å være inngangssignalavsnittet som skal behandles, idet denne ramme har foregående inngangssignaldeler- eller avsnitt, dvs. deler eller avsnitt som danner fortiden for inngangssignalavsnittet som skal behandles. I tillegg har man etterfølgende inngangssignaldeler- eller avsnitt som danner "fremtiden" i forhold til den inngangssignaldel eller det avsnitt som skal behandles (idet inngangsavsnittet som skal behandles også kan kalles det "aktuelle" inngangssignalavsnitt). Inngangssignalavsnittet i "fortiden" kan også kalles tidligere avsnitt, mens signaldeler eller -avsnitt i fremtiden kan kalles senere signalavsnitt eller -deler.
Oppfinnelsens fremgangsmåte vil på vellykket måte kunne håndtere problema-tiske situasjoner med punktkilder som forflytter seg langsomt, særskilt slike som har støyliknende egenskaper, eller punktkilder som beveger seg raskt og har tonalt materiale, så som sinusoider som forflytter seg relativt raskt, og oppfinnelsen gjelder med dette tillatelse av en mer eksplisitt koderstyring av utjevningen som utføres i dekoderen.
Som skissert ovenfor er den foretrukne måte å utføre en postprosessering på inne i den koderstyrte parameterutjevningsinnretning 9a eller den tilsvarende dekoderstyrte parameterutjevningsinnretning 10 en utjevnings- eller glatteoperasjon som utføres på frekvensbåndorientert måte.
For videre aktivt å få styrt postprosesseringen i dekoderen, nemlig den postprosessering som utføres av innretningen 9a formidler koderen signaleringsinformasjon fortrinnsvis som en del av sideinformasjonen, til synthesizeren/dekoderen. Det flerkanals synthesizerstyrte styresignal kan imidlertid også overføres separat til dekoderen uten å ta del i sideinformasjonen for den parametriske informasjon eller informasjonen vedrørende nedtransponeringssignalet.
I en foretrukket utførelse består denne signaleringsinformasjon av flagg som indikerer tilstanden av eller på for hvert enkelt frekvensbånd som brukes for utjevningen eller glattingen. For å tillate en effektiv overføring av denne informasjon kan man i en foretrukket utførelse også bruke et sett "kortslutninger" eller "snarveier" overfor signaleringen av bestemte hyppig brukte konfigurasjoner som har svært få bit.
For dette brukes kalkulatoren lb for utjevningsinformasjon og vist på fig. lc til å bestemme om noen utjevning i det hele tatt skal utføres i et av frekvensbåndene. Dette signaleres via et "alt av" snarveissignal som genereres av datageneratoren lc. Særskilt kan et styresignal som representerer dette snarveissignal være et bestemt bitmønster eller et bestemt flagg.
Videre kan kalkulatoren lb for utjevningsinformasjon finne at det skal utføres en koderstyrt utjevning i samtlige frekvensbånd, og for dette genererer datageneratoren lc et snarveissignal av typen "alt på", idet dette signalerer at utjevning eller glatting skal anvendes i samtlige frekvensbånd. Signalet kan som ovenfor være et bestemt bit-mønster eller et flagg.
I tillegg til dette, når signalanalysatoren la finner at signalet ikke endret seg svært mye fra et bestemt tidsavsnitt og til det neste slike avsnitt, dvs. fra et aktuelt tidsavsnitt og til et fremtidig, kan kalkulatoren lb bestemme at det ikke behøves utført noen endring i den koderstyrte parameterutjevning. I tilfelle vil datageneratoren lc frembringe et snarveissignal av typen "gjenta siste maske", og dette signal vil da signalere overfor dekoderen/synthesizeren at samme båndmessige av/på-tilstand også skal brukes for utjevningen, slik denne tilstand ble brukt for behandlingen av den tidligere ramme.
I en foretrukket utførelse er signalanalysatoren la innrettet for å kunne estimere forflyttingshastigheten slik at pådraget på dekoderutjevningen tilpasses hastig-heten for en punktkildes forflytting. Som et resultat av denne prosess bestemmes en passende utjevningstidskonstant av kalkulatoren lb og blir signalert til dekoderen via dedikert sideinformasjon via datageneratoren lc. I en foretrukket utførelse genererer da denne generator en indeksverdi og overfører denne til en dekoder, hvilket lar dekoderen velge mellom ulike forhåndsbestemte utjevnings- eller glattetidskonstanter, for eksempel 125, 250, 500 ms eller annet. I en ytterligere foretrukket utførelse blir det bare overført en eneste tidskonstant for samtlige frekvensbånd, idet dette reduserer mengden av signaleringsinformasjon for utjevningstidskonstanter og vil være tilstrekkelig for det frekvensforeliggende tilfelle med en bestemt dominant punktkilde som forflytter seg i spekteret. Et eksempel på en prosess for bestemmelse av en passende tidskonstant for utjevningen er beskrevet i forbindelse med gjennomgåelsen av fig. 2a og 2b.
Den eksplisitte styring av dekoderutjevningsprosessen krever en overføring av ytterligere sideinformasjon, sammenliknet med en dekoderstyrt utjevningsmetode. Siden denne styring bare trenger å være nødvendig for en viss del av samtlige inngangssignaler som har bestemte egenskaper, vil begge tilnærmelser fortrinnsvis kunne kombineres i en enkelt metode eller fremgangsmåte, og en slik vil da gjerne kalles en hybrid metode. Kombinasjonen kan utføres ved å overføre signaleringsinformasjon slik at en bestemt bit bestemmer om utjevning eller glatting skal utføres, basert på en tonalitets/transientestimering i dekoderen og utført av innretningen 16 på fig, lb eller under eksplisittkoderstyring. I det siste tilfellet overføres sideinformasjonen 5a på fig. lb til dekoderen.
Etter dette skal gjennomgås foretrukne utførelser for identifikasjon av punktkilder som forflytter seg langsomt og estimeringen av passende tidskonstanter som skal signaleres overfor en dekoder. Fortrinnsvis utføres samtlige estimeringer i koderen og kan såtedes få tilgang til ikke kvantiserte versjoner av signalparametere, idet disse versjoner naturligvis ikke er tilgjengelige i dekoderen på grunn av det faktum at innretningen 2 på fig. la og fig. lb overfører kvantiserte romindikatorer, av data-kompresjonsgrunner.
Deretter vises til fig. 2a og 2b for illustrasjon av en foretrukket utførelse for identifikasjon av punktkilder som forflytter seg langsomt. Komposisjonen av en lyd-hendelse innenfor et bestemt frekvensbånd og en bestemt tidsramme blir identifisert som vist i forbindelse med fig. 2a. Særskilt vil en enhetslengdevektor ex for hver enkelt audioutgangskanal indikere den relative posisjonering av den tilhørende høyttaler i et regulært lytteoppsett. I eksempelet vist på fig. 2a brukes det felles 5-kanals lytteoppsett med høyttalerne L, C, R, Ls og Rs og de tilhørende enhetslengdevektorer eL, ec, eR, eLSog eRs.
Romposisjonen for lydhendelsen innenfor et visst frekvensbånd og en gitt tidsramme blir beregnet som den energiveide middelverdi av disse vektorer, slik det er satt opp i likningen på fig. 2a. Noe som er helt klart fra tegningen fig. 2a er at enhets-lendevektoren har bestemte koordinater x, y i koordinatsystemet x, y. Ved å multiplisere hvert koordinat for enhetslengdevektoren med den tilsvarende energi og ved å summere x-koordinatverdiene og y-koordinatverdiene får man romposisjonen for et bestemt frekvensbånd og en viss tidsramme ved en bestemt posisjon x, y.
Som skissert i trinn 40 på fig. 2b utføres denne bestemmelse for to påfølgende tidspunkter.
Deretter bestemmes i trinn 41 om kilden med romposisjoner p[, p2forflytter seg langsomt eller ikke. Dersom avstanden mellom påfølgende romposisjoner ligger under en forhåndsbestemt terskelverdi finnes at kilden er en kilde som beveger seg langsomt, men hvis det finnes at forskyvningen eller forskjellen ligger over en viss maksimal terskel for slik forskyvning eller posisjonsforskjell, finnes at kilden ikke beveger seg langsomt, men hurtigere, og prosessen på fig. 2b stanses da.
Verdiene L, C, R, Ls og Rs på fig. 2a angir energiene for de respektive tilhørende kanaler. Alternativt kan også energiene målt i desibel (dB) brukes for å bestemme en romposisjon p.
I trinn 42 bestemmes eller finnes om kilden er en punktkilde eller en kilde som tilnærmet er et punkt. Fortrinnsvis registreres punktkilder når de relevante ICC parametere overskrider et bestemt minste terskelnivå så som 0,85. Når det finnes at parameteren er under dette nivå, registreres kilden til ikke å være noen punktkilde, og prosessen på fig. 2a stanses. Når det imidlertid finnes at kilden er en punktkilde eller tilnærmet representerer et punkt, går prosessen videre på fig. 2b til trinn 43, og der bestemmes fortrinnsvis interkanals nivåforskjellsparametrene for det parametriske flerkanalsskjema innenfor et visst observasjonsintervall, hvilket fører til flere målerresultater. Observasjonsintervallet kan bestå av flere innkodingsrammer eller et sett observasjoner som finner sted ved en større tidsoppløsning enn fastlagt av sekvensen av rammer.
I et trinn 44 berenges helllingen av en ICLD-kurve for fortløpende tidspunkter. Deretter velges i trinn 45 en utjevnings- eller glattetidskonstant, nemlig en som er omvendt proporsjonal med den helning som ble funnet for kurven.
Deretter, i trinn 45 føres tidskonstanten ut som et eksempel på en utjevningsinformasjon og brukes i en utjevningsinnretning på dekodersiden, idet denne innretning kan være et glatte- eller utjevningsfilter, slik det fremgår av fig. 4a og 4b. Tidskonstanten som ble bestemt i trinn 45 vil derfor kunne brukes til å sette filterparametere i et digitalfilter som brukes for utjevning, i blokk 9a.
Når det gjelder fig. lb, legges vekt på at den koderstyrte parameterutjevning 9a og den dekoderstyrte parameterutjevning 10 også kan implementeres ved bruk av et enkelt apparat eller en enkel krets eller innretning, så som en som er vist på fig. 4b, 5 eller 6a, siden utjevningsstyreinformasjonen på den ene side og den dekoderbestemte informasjonsutgang fra styreparameteruttrekkingens innretning 16 på den annen side, begge virker på et utjevnings- eller glattefilter, slik at aktiveringen av dette filter utføres i samsvar med påvirkningen, i en foretrukket utførelse av den foreliggende oppfinnelse.
Når bare en enkelt utjevningstidskonstant signaleres for samtlige frekvensbånd, kan de enkelte resultater for hvert bånd kombineres til et overordnet totalresultat så som ved å utføre en middelverdiberegning eller å beregne ved å legge inn energi-vektkorreksjon. I dette tilfellet vil dekoderen brukes samme (energiveide) midlede utjevningstidskonstant for hvert bånd slik at bare en enkelt utjevningstidskonstant trengs for hele spekteret som skal overføres. Når båndene finnes å ha en signifikant forskjell, eller et avvik fra den kombinerte tidskonstant kan utjevningen eller glattingen frakoples for disse bånd, ved bruk av de tilhørende "av/på"-flagg.
Deretter vises til fig. 3a, 3b og 3c for å illustrere en alternativ utførelse som er basert på analyse ved syntese som en tilnærmelse for koderstyrt utjevningskontroll eller -styring. Grunnideen går her ut på en sammenlikning mellom en bestemt rekonstruksjonsparameter, fortrinnsvis parameteren IID/ICLD, fra en kvantiserings- og parameterutjevning, med den tilsvarende ikke-kvantiserte (dvs. målte) parameter av samme type. Denne prosess kan summeres i den skjematisk foretrukne utførelse som er illustrert på fig. 3a. To ulike flerkanalsinngangskanaler så som L på den ene side og R på den annen side føres da til sin respektive analysefilterbank, og utgangen fra denne filterbank blir da segmentert og vindusoppdelt for å komme frem til en passende tids/frekvensrepresentasjon.
Således omfatter fig. 3a en analysefilterbankinnretning med to separate analysefilterbanker 70a og 70b. Naturligvis vil en enkelt slik analysefilterbank og et lagringsmedium kunne brukes for to ganger å analysere begge kanaler. Deretter utføres tidssegmenteringen i segmenterings- og vindusinnretningen 72, og etter dette utføres en ICLD/IID-estimering pr. ramme, i innretningen 73. Parameteren for hver ramme sendes deretter til en kvantiseringskrets 74 for å komme frem til en kvantisert parameter på utgangen av denne krets. Den kvantiserte parameter går deretter til behandling eller prosessering i et sett ulike tidskonstanter i innretningen 75. Fortrinnsvis vil i alt vesentlig samtlige tidskonstanter som er tilgjengelige for dekoderen brukes av denne innretning 75. Til slutt utføres en sammenlikning i en sammenliknings- og velgerenhet 76, av de kvantiserte og utjevnede IID-parametere med de opprinnelige (ikke-prosesserte) IID-estimater. Fra utgangen av innretningen eller enheten 76 går de kvantiserte IID-parametere og utjevningstidskonstanten som førte til den neste tilpasning mellom de prosesserte og de opprinnelig målte IID-verdier.
Nå skal det vise til flytskjemaet på fig. 3c som tilsvarer flytskjemaet for apparatet på fig. 3a. Som satt opp i trinn 46 genereres IID-parametere for flere rammer, og deretter, i trinn 47 kvantiseres disse parametere. I trinn 48 utjevnes eller glattes disse kvantiserte parametere ved bruk av ulike tidskonstanter, og deretter, trinn 49 beregnes den eventuelle feil mellom en utjevnet sekvens og en opprinnelig generert sekvens, for hver tidskonstant som brukes i trinn 49 i skjemaet. Til slutt, i trinn 50 velges den kvantiserte sekvens sammen med den ujevningstidskonstant som førte til minste feil, og fra trinn 50 går sekvensen kvantiserte verdier sammen med denne bestemte tidskonstant ut.
I en mer utførlig utførelse som foretrekkes for avanserte apparater og innretninger kan også denne prosess utføres for et sett kvantiserte parametere IID/ ICLD valgt fra repertoaret av mulige IID-verdier fra kvantiseringsenheten, og i et slikt tilfelle vil sammenlikningen og valgte inneholde en sammenlikning av de allerede behandlede IID og ikke behandlede IID-parametere for ulike kombinasjoner av overførte eller kvantiserte IID-parametere og utjevningstidskonstanter. Følgelig vil det som oppsatt i kvadratklammene i trinn 47 være i kontrast med den første utførelse ved at den andre utførelse bruker ulike kvantiseringsregler eller samme kvantiseringsregler, men ulike kvantiseringstrinnstørrelser for kvantiseringen av IID-parametrene. Deretter beregnes en feil i trinn 51, for hver kvantiseringsmåte og for hver tidskonstant. Følgelig vil antallet kandidater som det besluttes om i trinn 52, sammenliknet med trinn 50 på fig. 3c, være større i den mer avanserte utførelse, nemlig med en faktor lik antallet ulike kvantiseringsmåter, i forhold til den første utførelse.
Etter dette utføres en todimensjonal optimalisering i trinn 52 for (1) feilen og (2) bitraten for å lete etter en sekvens av kvantiserte verdier og en tilhørende tidskonstant. Til slutt, i trinn 53 entropikodes sekvensen av kvantiserte verdier ved bruk av en Huffman-kode eller en aritmetisk kode. I trinn 53 føres resultatet i en bitsekvens som skal overføres til en dekoder eller en flerkanals synthesizer.
Fig. 3b illustrerer virkningen av postprosessering ved utjevning eller glatting. Gjenstanden 77 illustrerer en kvantisert IID parameter for ramme nr. n. Item 78 illustrerer en kvantisert IID parameter for en ramme med rammeindeks n+1. Den kvantiserte IID parameter 78 er utledet ved kvantisering fra den målte IID parameter pr. ramme, indikert ved referansetallet 79. Utjevningen av denne parametersekvens av kvantiserte parametere 77 og 78 med ulike tidskontanter fører til mindre postprosesserte parameterverdier ved 80a og 80b. Tidskonstanten for utjevning av para-metersekvensene 77 og 78, som førte til den postprosesserte (utjevnede eller glattede) parameter 80a, var mindre enn utjevningstidskonstanten, som førte til den postprosesserte parameter 80b. Som kjent fra tidligere er utjevningstidskonstanten en invers størrelse i forhold til avskjæringsfrekvensen for et tilhørende lavpassfilter.
Den utførelse som er illustrert i forbindelse med trinnene 51 -53 på fig. 3c er å foretrekke, siden man kan utføre en todimensjonal optimalisering for feilen og bitraten, siden ulike kvantiseringsregler kan føre til ulike antall bit for representasjon av de kvantiserte verdier, og videre baseres denne utførelse på den kjennskap man har til at den aktuelle verdi av den postprosesserte rekonstruksjonsparameter vil være avhengig av den kvantiserte rekonstruksjonsparameter så vel som på hvilken måte prosesseringen foregår.
Som et eksempel vil man ha en stor forskjell i kvantisert IID fra ramme til ramme, i kombinasjon med en stor utjevningstidskonstant som effektivt fører til bare en mindre netto effekt for den prosesserte IID. Samme netto effekt kan settes opp av en liten forskjell i IID-parametrene sammenliknet med den mindre tidskonstant. Denne ytterligere frihetsgrad gjør det mulig for koderen å optimalisere både den rekonstruerte IID så vel som den resulterende bitrate simultant (under forutsetning av at overføringen av en viss IID-verdi kan være mer kostbar enn overføringen av en viss alternativ IID-parameter).
Som skissert ovenfor er virkningen eller effekten av IID-forløpene for utjevningen eller glattingen skissert på fig. 3b, og figuren viser et IID-forløp for ulike verdier av utjevningstidskonstanter, hvor stjernen indikerer en målt IID pr. ramme, mens triangelet indikerer en mulig verdi av en IID-kvantiseringsenhet. Når det er gitt en begrenset nøyaktighet for denne IID-kvantiseringsenheten vil IID-verdien som er indikert med stjerne i ramme n+1 ikke være tilgjengelig. Den nærmeste IID-verdi er indikert av triangelet. Linjene i figuren viser IID-forløpet mellom rammene, nemlig et forløp som kunne føre til ulike tidskontanter for utjevningen. Seleksjonsalgoritmen vil velge den utjevningstidskonstant som fører til et IID-forløp som avsluttes nærmest den målte IID-parameter for rammen n+1.
Eksemplene ovenfor er alle relaterte til IID-parametere. I prinsippet kan imidlertid alle beskrevne fremgangsmåter og metoder anvendes for ulike para-metertyper, så som IPD, ITD eller ICC.
Den foreliggende oppfinnelse gjelder således en kodersideprosessering og en dekodersideprosessering, hvilke danner et system som bruker en utjevningsmaske for aktivering/sperring og en tidskonstant som er signalert via et utjevningskontrollsignal (eller -styresignal). Videre utføres en båndinndelt signalering pr. frekvensbånd, idet man foretrekker å bruke snarveier eller kortslutninger som kan omfatte samtlige bånd på, en "samtlige bånd av" eller en snarvei som gjelder repetisjon av tidligere tilstander. Videre foretrekkes at man bruker en felles utjevningstidskonstant for samtlige bånd, og i tillegg ønsker man gjerne at det i tillegg eller alternativt brukes et signal for automatisk tonalitetsbasert utjevning i forhold til eksplisitt koderkontroll eller -styring for overføring for implementering av en hybrid fremgangsmåte.
Etter dette skal det vises til dekodersideimplementeringen som arbeider i samband med den koderstyrte parameterutjevning.
Fig. 4a viser en koderside 21 og en dekoderside 22.1 koderen føres antallet N originale inngangskanaler inn i et nedtransponeringstrinn 23 (en nedblander). Trinnet 23 er innrettet for å redusere antallet kanaler til for eksempel en enkelt monokanal eller eventuelt to stereokanaler. Det nedtransponerte signal representerer på utgangen av trinnet 23 en inngang som føres til en kildekoder 24, idet denne er for eksempel implementert som en mp3-koder eller som en AC-koder for å frembringe en utgangsbttstrøm. Kodersiden 21 omfatter videre en parameterekstraktor 25 som i samsvar med den foreliggende oppfinnelse utfører den allerede omtalte BCC-analyse (blokk 116 på fig. 11) og gir ut de kvantiserte og fortrinnsvis Huffman-kodede interkanalnivåforskjeller (ICLD). Bitstrømmen på utgangen av kildekoderen 24 så vel som de kvantiserte rekonstruksjonsparametere som føres ut fra parameterekstraktoren 25, kan overføres til en dekoder 22 eller føres til lagring for senere overføring til en dekoder, etc.
Dekoderen 22 omfatter en kildedekoder 26 som er innrettet for å rekonstruere et signal fra den mottatte bitstrøm (som stammer fra kildekoderen 24). For dette gir kildedekoderen 26 ut på utgangen påfølgende tidsavsnitt av inngangssignalet til en opptransponeringskrets eller opp-blander 12 som utfører samme funksjoner som flerkanalsrekonstruksjonskretsen 12 på fig. 1. Fortrinnsvis er denne funksjonsmessig på slik måte at den kan utføre BCC-syntese slik denne implementeres av blokken 122 på fig. 11.
I motsetning til det som vises på fig. 11 omfatter denne inventive flerkanalssynthesizer ytterligere postprosessoren 10 (fig. 4a) som har samme funksjon som en "interkanalnivåforskjellsutjevner" og som kontrolleres/styres av inngangs-signalanalysatoren 16, idet denne fortrinnsvis utfører tonalitetanalyse av inngangssignalet..
Fra fig. 4a fremgår at det er rekonstruksjonsparametere så som i ICLD som føres inn i ICLD-utjevneren, og at det videre er en tilleggsforbindelse mellom para meterekstraktoren 25 og opptransformeringskretsen 12. Via denne tilkopling som samtidig er en forbikopling kan andre parametere for rekonstruksjon og som ikke behøver å være postprosessert, tilføres fra parameterekstraktoren 25 til kretsen 12.
Fig. 4b viser en foretrukket utførelse av den signaladaptive rekonstruksjons-parameterprosessering som utgjøres ved hjelp av signalanalysatoren 16 i ICLD-utjevneren 10.
Signalanalysatoren 16 er dannet av en tonalitetsbestemmelsesenhet 16a og en påfølgende terskeiinnretning 16b. I tillegg omfatter postprosessoren 10 vist på fig. 4a et glattefilter 10a og en postprosessoromkopler 10b. Denne omkopler er innrettet for styring/kontroll av terskel innretningen 16b slik at omkopleren aktiveres når denne innretning 16b gis informasjon om at en bestemt signalkarakteristikk for inngangssignalet, så som tonalitetskarakteristikken, er i en forhåndsbestemt relasjon til en gitt spesifisert terskel. I det foreliggende tilfellet er situasjonen slik at omkopleren aktiveres slik at den kommer i den viste øvre stilling, se fig. 4b når tonaliteten av en signaldel eller et signalavsnitt i inngangssignalet og særskilt et bestemt frekvensbånd som er tilordnet et bestemt tidsavsnitt i inngangssignalet har en tonalitet høyere enn et bestemt tonalitetsterskelnivå. I dette tilfellet aktiveres omkopleren 10b for kopling av utgangen av glattefilteret 10a til inngangen av den flerkanals rekonstruksjonskrets 12 slik at postprosesserte, men ennå ikke inverskvantiserte interkanalforskjeller blir overført til kretsen 12 for opptransponering og rekonstruksjon av flere kanaler i dekoderen.
Når imidlertid tonalitetsbestemmelsen i en dekoderstyrt implementering innebærer at et bestemt frekvensbånd tilhørende et aktuelt tidsavsnitt i inngangssignalet, så som et bestemt frekvensbånd som hører til et inngangssignalavsnitt som skal behandles, har en tonalitet som ligger under den spesifiserte terskel, dvs. er transient, aktiveres omkopleren slik at glattefilteret 10a blir forbikoplet.
I sistnevnte tilfelle sikrer den signal-adaptive postprosesseringen gjennom glattingsfilterne 10a at rekonstruksjonsparameteren endrer for transiente signaler passerer postprosesseringstrinnet umodifisert og resulterer i raske endringer i det rekonstruerte utgangssignal med tanke på det romlige bilde, som tilsvarer konkrete situasjoner med en høy grad av sannsynlighet for transiente signaler.
Det skal her bemerkes at utførelsen som er illustrert på fig. 4b, dvs. aktivering av postprosesseringen på den ene side og komplett deaktivering av slik postprosessering på den annen side, dvs. en binærbeslutning for postprosessering eller ikke, bare er en foretrukket utførelse, siden den har en enkel og effektiv oppbygging. Imidlertid skal her bemerkes at det særlig i forhold til tonalitet ikke bare er signalkarakteristikken som gir en kvalitativ parameter, men også en kvantitativ parameter som normalt kan ligge mellom 0 og 1.1 samsvar med en slik kvantitativt bestemt parameter kan utjevningsgraden som utføres i et glattefilter eller for eksempel avskjæringsfrekvensen for et lavpassfUter bestemmes eller settes slik at man får aktivert en kraftig utjevning eller glatting for "tungt" tonale signaler, mens signaler som ikke er så tonale blir det aktivert en utjevning eller glatting som har mindre utjevningsgrad.
Naturligvis kunne man også registrere transiente partier og overdrive endringene i de parametere man har, til verdier som ligger mellom foregående bestemte kvantiserte verdier eller kvantiseringsindekser, slik at man får kraftige transiente signaler for en postprosessering for rekonstruksjonsparametrene som fører til en enda mer forsert endring av rombildningen for et flerkanalsignal. I dette tilfelle kan et kvantiseringstrinn med størrelsen 1 og som instruert ved påføtende konstruksjonspara-metere for påfølgende tidsavsnitt økes til for eksempel 1,5,1,4,1,3 etc, hvilket fører til en enda mer dramatisk endring av romavbildningen for det rekonstruerte flerkanalsignal.
Det skal her bemerkes at en tonalsignalkarakteristikk, en transientsignal-karakteristikk eller en annen slik karakteristikk for signalet bare er tatt med som eksempler på karakteristikker og basert på hvordan signalanalysen kan utføres for styring/kontroll av en postprosessor for rekonstruksjonsparameteren. I respons på denne kontroll/styring bestemmer nemlig prosessoren en parameter som er postprosessert for rekonstruksjon og som har en verdi som er ulik enhver annen verdi for kvantiseringsindeksene på den ene side, eller omkvantiseringsverdiene på den annen side, som bestemt av en forhåndsbestemt kvantiseirngsregel.
Videre skal det bemerkes her at postprosesseringen av rekonstruksjonsparametrene vil være avhengig av en bestemt signalkarakteristikk, og dette innebærer at postprosesseringen av en parameter utført på signaladaptiv måte bare er ett valg. En signal uavhengig postprosessering gir også fordeler for mange signaler, og en gitt postprosesseringsfunksjon kan for eksempel velges av brukeren, slik at denne bruker får bedring av endringer, særskilt når det gjelder en fremhevningsfunksjon eller liknende, eller hvor endringene blir dempet, i tilfelle man har en utjevningsfunksjon. Alternativt kan en postprosessering som er uavhengig av enhver brukerseleksjon og likeledes uavhengig av signalkarakteristikker gi visse fordeler når det gjelder feilettergivenhet eller -toleranse. Det er således klart at man særskilt i tilfeller med store kvantiseringstrinnstørrelser kan få transmisjonsfeil i kvantiseringsindeksen og som fører til hørbare forstyrrelser i lydbildet (artefakter). Overfor dette vil man kunne utføre en forover feilkorreksjon eller en annen tilsvarende mekanisme eller operasjon når signalet skal overføres via kanaler som er beheftet med feil eller som innfører feil i signalene. I samsvar med denne foreliggende oppfinnelse kan postprosesseringen unngå behovet for enhver bit inneffektiv feilkorreksjonskode, siden postprosesseringen av rekonstruksjonsparametrene og basert på disse i tidligere sekvenser vil føre til en deteksjon av eventuelt feilaktig overførte kvantiserte rekonstruksjonsparametere og dermed fører til at passende mottiltak kan utføres mot slike feil. I tillegg er det slik at når postprosesseringsfunksjonen er utjevnings- eller glattefunksjon vil de kvantiserte rekonstruksjonsparametere avvike gangske mye fra tidligere eller senere tilsvarende parametere, og derfor kan de automatisk manipuleres, slik det vil bli beskrevet nedenfor.
Fig. 5 viser en foretrukket utførelse av en rekonstruksjonsparameter postprosessor 10 fra fig. 4a, og når det gjelder den viste situasjon hvor de kvantiserte rekonstruksjonsparametere er kodet vil disse parametere i kodet tilstand gå inn i en entropidekoder 10c som på utgangen gir en sekvens av dekodede kvantiserte rekonstruksjonsparametere. Disse parametere fra dekoderen er altså kvantiserte, hvilket innebærer at de ikke har noen bestemt "anvendelig" verdi, men at de indikerer visse kvantiseringsindekser eller kvantiseringsnivåer for en bestemt kvantiseringsregel som er implementert i den etterfølgende inverskvantiseringskrets. En manipulator 10d kan for eksempel være i form av et digitalfilter så som et filter av typen HR (hvilket foretrekkes og hvor forkortelsen betyr at filteret tar en uendelig pulsrespons), eller et FIR-filter (altså et filter med endelig pulsrespons), og disse filtre kan for eksempel ha en filterkarakteristikk som er fastlagt av den ønskede postprosesseringsfunksjon. En utjevning eller en lavpassifltrering knyttet til postprosesseringsfunksjonen foretrekkes. På utgangen av manipulatoren 10d får man derved en sekvens av manipulerte kvantiserte rekonstruksjonsparametere, og disse er ikke bare heltall, men er representert ved et hvilket som helst tall som ligger innenfor det området som er bestemt av kvantiseringsregelen. En slik manipulert kvantisert rekonstruksjonsparameter kan således ha verdiene 1,1,0,1,0,5,sammenliknet med verdiene 1,0,1 før trinnet 10d. Sekvensen av verdier i utgangen av blokken 10d går deretter inn til en inverskvantiseringskrets 10e for fremhevning ("enhancement ") for å danne postprosesserte rekonstruksjonsparametere som kan brukes til flerkanalsrekonstruksjonen (så som BCC-syntesen) i blokk 12 på fig. la og lb.
Her skal det bemerkes at denne kvantiseringskrets 10e (fig. 5) er ulik en normal inverskvantiseringskrets siden en slik normal krets bare vil avbilde/mappe/- transformere hver kvantiseringsinngang fra et begrenset antall kvantiseringsindekser til en spesifisert inverskvantisert utgangsverdi. Normale inverskvantiseringskretser kan nemlig ikke transformere kvantiseringsindekser som ikke representerer heltall. Den fremhevningskrets 10e man har anordnet implementeres derfor til fortrinnsvis å bruke samme kvantiseringsregel, så som en lineær eller logaritmisk regel, men den kan akseptere innganger som ikke representerer heltall, for å gi ut verdier som er ulike fra de verdier som kan oppnås ved bruk av bare heltallinnganger.
Når det gjelder den foreliggende oppfinnelse gjør det i prinsippet ingen forskjell om manipuleringen utføres før omkvantiseringen (se fig. 5) eller etter denne (se fig. 6a og 6b). I det siste tilfellet behøver bare inverskvantiseringskretsen være en normal og rett frem invers kvantiseringskrets, hvilket er ulik kretsen 10e som utfører fremhevet inverskvantisering og er vist på fig. 5, slik det er skissert ovenfor. Naturligvis vil valget mellom fig. 5 og fig. 6a når det gjelder kvantiseringskrets være et spørsmål om behov eller ønske og vil kunne gjøres avhengig av en bestemt implementering. For den foreliggende implementering foretrekkes at man bruker utførelsen vist på fig. 5, siden den er mer forenlig med allerede eksisterende BCC-algoritmer. Dette kan imidlertid være annerledes for andre anvendelser og behov.
Fig. 6a viser en utførelse hvor kretsen 10e på fig. 6a for fremhevet inverskvantisering erstattet av en rett frem inverskvantiseringskrets og en omvandler 10g som utfører mapping/avbildning/transformasjon, i samsvar med en lineær eller fortrinnsvis ikke-lineær kurve. Denne mapper kan implementeres med kretskomponenter (hardware) eller som et program (i software) så som en krets for å utføre en matematisk operasjon eller for å ta i bruk en oppslagstabell. Datamanipulasjon som for eksempel bruker ujevningskretsen 10g kan utføres før mapper 10g eller etter denne eller på begge steder i kombinasjon. Denne utførelse foretrekkes når postprosesseringen utføres i inverskvantiseringsdomenet, siden samtlige elementer 10f, 10h, 10g kan implementeres ved bruk av rett frem komponenter så som kretser med software rutiner.
Generelt implementeres postprosessoren 10 som en postprosessor som indikert på fig. 7a, idet den da mottar samtlige eller et utvalg av aktuelle kvantiserte rekonstruksjonsparametere, fremtidige rekonstruksjonsparametere eller tidligere kvantiserte rekonstruksjonsparametere. I det tilfelle hvor postprosessoren bare mottar minst én tidligere rekonstruksjonsparameter og den aktuelle rekonstruksjonsparameter, vil denne prosessor tjene som et lavpassfilter. Når imidlertid postprosessoren 10 mottar en fremtidig, men forsinket kvantiseringsrekonstruksjonsparameter, hvilket er mulig i sanntids-anvendelser som bruker en bestemt forsinkelse, vil prosessoren kunne utføre en interpolasjon mellom den fremtidige og den foreliggende eller en tidligere kvantisert rekonstruksjonsparameter for, for eksempel å jevne ut et tidsforløp for en rekonstruksjonsparameter, for eksempel for et bestemt frekvensbånd.
Fig. 7b viser et eksempel på en implementering hvor den postprosesserte verdi ikke er utledet fra den inverskvantiserte rekonstruksjonsparameter, men fra en verdi som er utledet fra den inverskvantiserte rekonstruksjonsparameter. Prosesseringen for utledningen utføres da ved hjelp av midler 700 for utledning, idet disse midler i dette tilfellet kan motta den kvantiserte rekonstruksjonsparameter via en linje 702 eller motta en inverskvantisert parameter via en linje 704. Man kunne for eksempel motta som en kvantisert parameter, en amplitudeverdi som brukes av midlene for utledning, for å beregne en energiverdi, og det vil da være denne energiverdi som underlegges postprosesseringen (så som utjevningen eller glattingen). Den kvantiserte parameter går videre til blokken 706 via linjen 708, og således kan postprosesseringen utføres ved bruk av den kvantiserte parameter direkte, slik det er vist ved linjen 710 eller ved å bruke den inverskvantiserte parameter som vist med linjen 712. Eventuelt kan man bruke den verdi som er utledet den inverskvantiserte parameter, slik det er illustrert med linjen 714.
Slik det er skissert ovenfor, kan den datamanipulasjon som brukes til å over-komme artefaktene ved basis av kvantiseringstrinnstørrelsene i en grovkvantiserings-omgivelse også utføres på en størrelse som er utledet fra den rekonstruksjonsparameter som er tilhørende basiskanalen i det parametrisk kodede flerkanalsignal. Når for eksempel den kvantiserte rekonstruksjonsparameter er en differanseparameter (ICLD), kan denne parameter inverskvantiseres uten noen som helst modifikasjon, og da kan et absoluttnivå i form av en verdi for en utgangskanal utledes og den inventive datamanipulasjon blir da utført for denne absoluttverdi. Denne prosedyre fører også til den inventive artefaktreduksjon, så lenge datamanipulasjonen i prosesseirngsveien mellom den kvantiserte rekonstruksjonsparameter og den aktuelle rekonstruksjon utføres slik at en verdi av den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse er ulik en verdi som kan oppnås ved bruk av omkvantisering i samsvar med kvantiseringsregelen, dvs. uten manipulasjon for å overvinne "trinnstørrelesbegrensningen".
Mange mappe- eller transformasjonsfunksjoner for å utlede den eventuelle eller endelige manipulerte kvantitet fra den kvantiserte rekonstruksjonsparameter vil kunne tenkes og brukes innenfor teknikken, hvor disse transformasjonsfunksjoner omfatter funksjoner for unik mapping eller transformasjon av en inngangsverdi til en utgangsverdi og i samsvar med en transformasjons- eller mapperegel, i den hensikt å komme frem til en størrelse som ikke er postprosessert, idet denne størrelse deretter postprosesseres for å komme frem til den postprosesserte størrelse som brukes i algoritmen for flerkanalrekonstruksjon (syntesen).
I det følgende skal det vises til fig. 8 som illustrerer forskjeller mellom en kvantiseringskrets 10e for fremhevet inverskvantisering, vist på fig. 5, og en tilsvarende kvantiseringsenhet eller -krets 1 Of for rett frem inverskvantisering og vist på fig. 6a. Når det gjelder dette viser illustrasjonen på fig. 8 som horisontalakse en inn-gangsverdiaske for ikke-kvantiserte verdier. Vertikalaksen viser kvantiseringsnivåene eller kvantiseringsindeksene, som fortrinnsvis er heltall med verdien 0, 1,2, 3. Det skal her bemerkes at kvantiseringsenheten eller -kretsen på fig. 8 ikke fører til et resultat i noen verdi mellom 0 og 1 eller mellom 1 og 2. Mapping eller transformasjon til disse kvantiseringsnivåer vil styres/kontrolleres av den trappeliknende funksjon, slik at verdiene mellom -10 og 10 for eksempel blir transformert til 0, mens verdier mellom 10 og 20 blir kvantisert til 1, etc.
En mulig inverskvantiseringsfunksjon er å mappe eller transformere et kvantiseringsnivå på 0 til en inverskvantisert verdi på 0. Et kvantiseringsnivå på 1 vil da transformeres til en inverskvantisert verdi på 10. Analogt vil et kvantiseringsnivå på 2 transformeres til en inverskvantisert verdi 20 som et eksempel. Omkvantiseringen vil derfor styres ved hjelp av en inverskvantiseringsfunksjon som er indikert med referansetallet 31. Det skal her bemerkes at man for en rett frem inverskvantiseringskrets bare får krysningspunkter mellom linjen 30 og linjen 31, og dette betyr at man for en slik rett frem inverskvantiseringskrets får en inverskvantiseringsregel fra fig. 8 med bare verdiene 0,10,20, 30 ved omkvantiseringen.
Dette er forskjellig i kvantiseringskretsen 10e for fremhevet inverskvantisering, siden denne krets som en inngang mottar verdier mellom 1 og 0 eller mellom 2 og 1, for eksempel verdien 0,5. Den avanserte omkvantisering med verdi 0,5 fremkommet i manipulatoren 10d vil føre til en inverskvantisert utgangsverdi på 5, dvs. i en postprosessert rekonstruksjonsparameter som har en verdi som er ulik den verdi som kan oppnås ved omkvantisering i samsvar med kvantiseringsregelen. Selv om den normale kvantiseringsregel bare tillater verdier på 0 eller 10, vil den foretrukne inverskvantiseringskrets som arbeider i samsvar med den foretrukne kvantiserings-funksjon 31 føre til en forskjellig verdi, dvs. verdien 5 som indikert på fig. 8.
Den kvantiseringskrets som utfører rett frem inverskvantisering mapper eller transformerer altså heltallige kvantiseirngsnivåer til bare kvantiserte nivåer, mens kvantiseringskretsen for fremhevet inverskvantisering mottar kvantiseringsnivåer som ikke er heltallige og mapper eller transformerer disse verdier til inverskvantiserte verdier som ligger mellom de verdier som ble bestemt ved inverskvantiseringsregelen. Fig. 9 viser virkningen av den foretrukne postprosessering for utførelsen på fig. 5. Fig. 9a viser således en sekvens av kvantiserte rekonstruksjonsparametere som varierer mellom 0 og 3, mens fig. 9b viser en tilsvarende sekvens som også kan kalles "modifiserte kvantiseringsindekser", når bølgeformen fra fig. 9a føres inn til et lavpassfilter (for utjevning eller glatting). Det skal her bemerkes at økningen/ reduksjonen ved tidspunktene 1, 4, 6, 8, 9 og 10 er redusert i utførelsen vist på fig. 9. Videre skal bemerkes at det legges vekt på at spissen mellom tidspunkt 8 og tidspunkt 9, idet denne spiss kan være en artefakt, er dempet av et helt kvantiseringstrinn. Dempningen av en slik ekstremverdi eller spiss kan imidlertid til en viss grad styres og reguleres av postprosesseringen i samsvar med en kvantitativ tonaiitetsverdi, slik det er skissert ovenfor.
Den foreliggende oppfinnelse er fordelaktig i og med at den inventive postprosessering sørger for utjevning eller glatting av fluktuasjoner eller jevner ut korte ekstremverdier. Situasjonen kan særskilt oppstå i et tilfelle hvor signaldeler fra flere inngangskanaler og med tilsvarende energi overlagres i et bestemt frekvensbånd for et signal, så som basiskanalen eller inngangssignalkanalen, og dette frekvensbånd vil da tidsmessig og i avhengighet av den momentane situasjon blandes med de respektive utgangskanaler på en meget fluktuerende måte. Fra psykoakustisk ståsted vil det imidlertid være bedre å jevne ut disse fluktuasjoner, siden de ikke bidrar vesentlig til deteksjonen av en lokalitet av en kilde, men påvirker det subjektive lytteinntrykk på negativ måte.
I overensstemmelse med en foretrukket utførelse av denne foreliggende oppfinnelse reduseres slike hørbare artefakter eller elimineres til og med, uten at det innføres noen som helst kvalitetstap ved forskjellig sted i systemet eller uten at det kreves en bedre oppløsning/kvantisering (og således en høyere dataoverføringshastig-het eller datarate) for de overførte rekonstruksjonsparametere. Den foreliggende oppfinnelsen når dette mål ved å utføre en signaladaptiv modifikasjon (glatting eller utjevning) av de aktuelle parametere og uten i alt vesentlig å påvirke viktige indikasjoner for deteksjon av romlokaliteter.
De plutselige oppstående endringer i karakteristikken av det rekonstruerte utgangssignal og som fører til hørbare artefakter, særskilt for audiosignaler som har en meget konstant stasjonær karakteristikk, gjelder for det tilfelle man har tonale signaler, og av denne grunn er det viktig å komme frem til en best mulig overgang mellom de kvantiserte rekonstruksjonsparametere for slike signaler, idet man med en god overgang naturligvis mener en jevn og glatt overgang. Dette kan oppnås for eksempel ved utjevning, glatting, interpolasjon etc.
I tillegg kan en slik parameterverdimodifikasjon innføre hørbare forstyrrelser for andre lydsignaltyper, og dette gjelder signaler som omfatter raske fluktuasjoner i karakteristikken. En slik karakteristikk kan finnes i transientdelen eller angreps-partikkel for et perkusjonsinstrument, og i dette tilfellet vil oppfinnelsens utførelse kunne gi en deaktivering av parameterutjevningen.
Dette oppnås ved hjelp av postprosessering av de overførte kvantiserte rekonstruksjonsparametere på nettopp en signaltilpasset måte.
Tilpasningsevnen eller adaptiviteten kan være lineær eller u-lineær. Er den u-lineær utføres en terskelsettingsprosedyre som beskrevet i forbindelse med fig. 3c.
Et annet kriterium for å styre/kontrollere denne tilpassbarhet er å få bestemt om den stasjonære tilstand av et signal går inn i dette signals karakteristikk, og en viss for å få bestemt hvor stor grad et signal er stasjonært eller ikke er å finne i karakteristikken og gjelder da evaluering av signalomhylningen eller særskilt signalets tonalitet. Det skal her bemerkes at denne tonalitet kan bestemmes for hele frekvensområdet eller fortrinnsvis enkeltvis for ulike frekvensbånd for et lydsignal.
Denne utførelse fører til en reduksjon eller faktisk til og med eliminasjon av artefakter, som til nå har vært uunngåelige, men nå uten å innføre noen som helst økning av den påkrevde datarate for overføring av parameterverdiene.
Som det er skissert ovenfor når det gjelder fig. 4a og 4b utfører den foretrukne utførelse av den foreliggende oppfinnelsen i dekoderstyre/kontrollmodus en utjevning av interkanals nivåforskjellene når signaldeien under betraktning har tonal karakteristikk. Interkanals forskjeller som beregnes i en koder og kvantiseres i en koder, sendes til en dekoder for å undergå en signaladaptiv utjevning eller glatting. Den adaptive komponent er en tonalitetsbestemmelse i forbindelse med terskelbestem-melsen, hvilken kopler om filtreringen av interkanals nivåforskjellene for tonale spektralkomponenter, og hvilke kopler av slik postprosessering for spektralkomponenter av typen støy og transienter. I denne utførelse trengs ingen ytterligere sideinformasjon i en koder, for å fa utført adaptive utjevningsalgoritmer.
Det skal her bemerkes at den inventive postprosessering også kan brukes for andre konsepter med parametrisk koding av flerkanalsignaler,, så som for parametrisk stereo, mp3, surround og tilsvarende fremgangsmåter.
De inventive fremgangsmåter eller kretser/apparater/innretninger eller data-maskinprogrammer kan implementeres eller inkluderes i ulike innretninger eller apparater, og fig. 14 viser et transmisjonssystem som har en sender som omfatter en koder av oppfinnelsens type og som har en mottaker som omfatter en dekoder, likeledes av oppfinnelsens type. Transmisjons- eller overføringskanalen kan være trådløs eller trådkopiet. Videre og som vist på fig. 15, kan koderen innbefattes i en lydopptaker, eller dekoderen kan innbefattes i en lydspiller. Lydregistreringer fra lydopptakeren kan distribueres til lydspilleren via Internett eller via et lagringsmedium som på sin side kan distribueres ved bruk av elektronisk post eller kurerresurser eller ved hjelp av andre muligheter for fordeling/distribusjon av lagringsmedia, så som lagringskort, CD-enheter eller DVD.
I avhengighet av visse implementeringskrav for oppfinnelsens fremgangsmåter, kan disse implementeres i maskinvare eller programvare. Implementeringen kan utføres ved bruk av et digitalt lagringsmedium, særskilt en plate eller en CD med elektronisk lesbare kontroll/styresignaler innlagret, og dette medium kan samvirke med et programmerbart datamaskinsystem slik at oppfinnelsens fremgangsmåter blir utført. Generelt gjelder således den foreliggende oppfinnelse et datamaskinprogramprodukt med en programkode som ligger lagret på en maskinlesbar bærer, idet programkoden er konfigurert for å utføre minst én av oppfinnelsens fremgangsmåter, når datamaskin-programproduktene kjøres på en datamaskin. Med andre ord, er oppfinnelsens fremgangsmåte således et datamaskinprogram som har en programkode for å utføre oppfinnelsens fremgangsmåter når dette datamaskinprogram kjøres på en datamaskin.
Selv om det som er beskrevet ovenfor særlig er vist og beskrevet i forbindelse med bestemte utførelsesformer, vil det være klart for fagfolk at ulike andre endringer i form og detalj, kan utføres uten at man derved fraviker konseptet og rammen om oppfinnelsen. Det skal likeledes forstås at ulike endringer kan utføres ved tilpasning til ulike utførelsesformer, uten at dette avviker fra det bredere konsept som er angitt her og som spesielt er gitt av den ramme patentkravene nedenfor setter.

Claims (32)

1 Apparat (1) for generering av et styre/kontrollsignal for en flerkanals synthesizer,karakterisert ved: en signalanalysator (la) for analyse av et flerkanals inngangssignal, en kalkulator (lb) for å bestemme utjevningskontroll/styreinformasjon i respons på resultater fra signalanalysatoren, hvilken kalkulator er innrettet for å bestemme denne utjevningskontroll/styreinformasjon slik at en postprosessor (9) på synthesizersiden i respons på utjevningskontroll/styreinformasjonen genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt av et inngangssignal som skal behandles, og en datagenerator (lc) for å generere et kontroll/styresignal som representerer utjevningskontroll/styreinformasjonen som det flerkanals synthesizer styre/kontrollsignal.
2 Apparat ifølge krav 1,karakterisert vedat signalanalysatoren (la) er innrettet for å analysere en endring av signalkarakteristikken for et flerkanalsignal, fra et første tidsavsnitt i det innkommende signal, til et senere tidsavsnitt i samme signal, og hvor kalkulatoren (lb) for utjevningsinformasjon er innrettet for å bestemme informasjon vedrørende en utjevningstidskonstant, basert på den analyserte endring.
3 Apparat ifølge krav 1,karakterisert vedat signalanalysatoren (1 a) er innrettet for å utføre båndrelatert analyse av det flerkanals inngangssignal, idet kalkulatoren (lb) videre er innrettet til å bestemme informasjon vedrørende båndrelatert utjevningskontroll/ styring.
4 Apparat ifølge krav 3,karakterisert vedat datageneratoren (lc) er innrettet for å generere en utjevningskontroll maske med en bit for hvert frekvensbånd, hvilken bit for hvert frekvensbånd indikerer om dekodersidens postprosessor skal utføre utjevning eller ikke.
5 Apparat ifølge krav 3,karakterisert vedat datageneratoren (lc) er innrettet for å generere et snarveissignal for "alt av" for indikasjon av at ingen utjevning skal utføres, eller generere et tilsvarende snarveissignal for "alt på" for indikasjon av at utjevning skal utføres i hvert enkelt frekvensbånd, eller generere et signal for repetisjon av siste maske for indikasjon av at en båndrelatert tilstand skal brukes for et aktuelt tidsavsnitt, som allerede er brukt av synthesizersidens postprosessor (9) for et foregående tidsavsnitt.
6 Apparat ifølge krav 1,karakterisert vedat datageneratoren (lc) er innrettet for å generere et synthesizeraktiveringssignal for indikasjon av om synthesizersidens postprosessor (9) skal arbeide ved bruk av informasjon som er overført i en datastrøm eller bruke informasjon som er utledet fra synthesizersidens signalanalyse.
7 Apparat ifølge krav 2,karakterisert vedat datageneratoren (lc) er innrettet for å generere, som utjevningskontroll/styreinformasjon, et signal for indikasjon av en bestemt utjevningstidskonstantverdi fra et sett verdier som er kjent for synthesizersidens postprosessor (9).
8 Apparat ifølge krav 2,karakterisert vedat signalanalysatoren (la) er innrettet for å bestemme om det foreligger en punktkilde, basert på en interkanalskoherenspara-meter for et flerkanals inngangssignals tidsavsnitt, og hvor kalkulatoren (lb) for utjevningsinformasjon eller datageneratoren (lc) bare er aktiv(e) når signalanalysatoren har fastslått at en slik punktkilde eksisterer.
9 Apparat ifølge krav 1,karakterisert vedat kalkulatoren (lb) er innrettet for å beregne en endring i en posisjon av en punktskilde for fortløpende tidsavsnitt i et flerkanals inngangssignal, og at datageneratoren (lc) er innrettet for å generere et kontroll/styresignal for indikasjon av at endringen i posisjonen ligger under en forhåndsbestemt terskel, slik at utjevning skal utføres ved hjelp av synthesizersidens postprosessor (9).
10 Apparat ifølge krav 2,karakterisert vedat signalanalysatoren (la) er innrettet for å generere en interkanalsnivåforskjell eller en interkanalsintensitetsforskjell for flere tidsavsnitt, og hvor kalkulatoren (lb) for utjevningsinformasjon er innrettet for å beregne en utjevningstidskonstant som er omvendt proporsjonal med en helning for en kurve for parametere for interkanalsnivåforskjellen eller interkanalsintensitetsforskjellen..
11 Apparat ifølge krav 2,karakterisert vedat kalkulatoren (lb) er innrettet for å beregne en enkelt utjevningstidskonstant for en gruppe med flere frekvensbånd, idet datageneratoren (lc) er innrettet for å indikere informasjon for ett eller flere bånd i gruppen av flere frekvensbånd, i hvilken synthesizersidens postprosessor (9) skal deaktiveres.
12 Apparat ifølge krav 1,karakterisert vedat kalkulatoren (lb) er innrettet for å utføre analyse ved synteseprosessering.
13 Apparat ifølge krav 12,karakterisert vedat kalkulatoren (lb) er innrettet for: beregning av flere tidskonstanter, simulering av en synthesizersidepostprosessering ved bruk av disse flere tidskonstanter, og valg av en tidskonstant som fører til verdier for påfølgende rammer, hvilken viser minste avvik fra ikke-kvantiserte tilsvarende verdier.
14 Apparat ifølge krav 12,karakterisert vedat ulike testpar genereres, idet et testpar har en bestemt utjevningstidskonstant og en bestemt kvantiseringsregel, og hvor kalkulatoren (Ib) er innrettet for å velge kvantiserte verdier ved bruk av kvantiseringsregelen og utjevningstidskonstanten fra testparet, hvilket fører til det minste avvik mellom postprosesserte verdier og ikke-kvantiserte tilsvarende verdier.
15 Fremgangsmåte for generering av et styre/kontrollsignal for en flerkanals synthesizer,karakterisert ved: analyse av et flerkanals inngangssignal, bestemmelse av utjevningskontroll/styreinformasjon i respons på signalana-lysetrinnet, slik at et postprosesseringstrinn i respons på utjevningskontroll/ styreinformasjonen genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra denne rekonstruksjonsparameter, for et tidsavsnitt av et inngangssignal som skal behandles, og generering av et kontroll/styresignal som representerer utjevningskontroll/- styreinformasjonen som det flerkanals synthesizer styre/kontrollsignal.
16 Flerkanals synthesizer for generering av et utgangssignal fra et inngangssignal, som omfatter minst én inngangskanal og en sekvens av kvantiserte, rekonstruksjonsparametere, hvor disse parametere kvantiseres i samsvar med en kvantiseringsregel og tilordnes påfølgende tidsavsnitt i inngangssignalet, hvor utgangssignalet har flere syntetiserte utgangskanaler, nemlig i et antall som er større enn antallet inngangskanaler, og hvor inngangskanalen er tilordnet et flerkanals synthesizerstyresignal som representerer utjevningsstyreinformasjon,karakterisert ved: en styresignalgiver for å gi ut styresignalet med utjevningsstyreinformasjonen, en postprosessor (9) for å bestemme, i respons på styresignalet, den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet utledet fra rekonstruksjonsparameteren for et tidsavsnitt i inngangssignalet som skal behandles, idet postprosessoren er innrettet for å bestemme den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet slik at verdien av den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet er ulik en verdi som kan fremkomme ved bruk av omkvantisering i samsvar med kvantiseringsregelen, og en flerkanals rekonstruksjonsenhet for rekonstruksjon av et tidsavsnitt av de syntetiserte utgangskanaler ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.
17 Flerkanals synthesizer ifølge krav 16,karakterisert vedat utjevningskontroll/styreinformasjonen indikerer en utjevningstidskonstant, og hvor postprosessoren (9) er innrettet for å utføre lavpassfiltrering, hvor en filterkarakteristikk er satt i respons på utjevningstidskonstanten.
18 Flerkanals synthesizer ifølge krav 16,karakterisert vedat styre/kontrollsignalet omfatter utjevningskontroll/styreinformasjon for hvert bånd av flere bånd for den minst ene inngangskanal, og hvor postprosessoren (9) er innrettet for å utrette postprosessoren på båndmessig måte i respons på kontroll/styresignalet.
19 Synthesizer ifølge krav 16, hvor styre/kontrollsignalet omfatter en utjevningskontroll/styremaske med en bit for hvert frekvensbånd, hvilken bit for hvert frekvensbånd gir indikasjon på om postprosessoren (9) er innrettet for å utføre utjevning eller ikke, og hvor postprosessoren er innrettet for å utføre utjevning i respons på kontroll/- styremasken, bare dersom en bit for frekvensbåndet i masken har en forhåndsbestemt verdi.
20 Synthesizer ifølge krav 16,karakterisert vedat styre/kontrollsignalet omfatter et snarveissignal for "alt av", et snarveissignal for "alt på" eller et snarveissignal for repetisjon av siste maske, og hvor postprosessoren (9) er innrettet for å utføre en utjevning i respons på et av de ovenfor nevnte tre snarveissignaler.
21 Synthesizer ifølge krav 16,karakterisert vedat datasignalet omfatter et dekoderaktiveringssignal for indikasjon av om postprosessoren (9) er innrettet for å arbeide ved bruk av informasjon som er overført i datasignalet, eller ved å bruke informasjon som er utledet fra en dekodersidesignalanalyse, og hvor postprosessoren er innrettet for å arbeide ved bruk av utjevningsstyre/kontrollinformasjonen eller basert på en dekodersidesignalanalyse i respons på styre/ kontrollsignalet.
22 Synthesizer ifølge krav 21,karakterisert veden inngangssignalanalysator for analyse av inngangssignalet for å bestemme en signalkarakteristikk for tidsavsnittet som skal behandles fra inngangssignalet, der postprosessoren (9) er innrettet for å bestemme den postprosesserte rekonstruksjonsparameter i avhengighet av signalkarakteristikken, og der signalkarakteristikken er en tonalitetskarakteristikk eller en transientkarakteri-stikk for tidsavsnittet i det inngangssignal som skal behandles.
23 Fremgangsmåte for generering av et utgangssignal fra et inngangssignal, som omfatter minst én inngangskanal og en sekvens av kvantiserte, rekonstruksjonsparametere, hvor disse parametere kvantiseres i samsvar med en kvantiseringsregel og tilordnes påfølgende tidsavsnitt i inngangssignalet, hvor utgangssignalet har flere syntetiserte utgangskanaler, nemlig i et antall som er større enn antallet inngangskanaler, og hvor inngangssignalet er tilordnet et flerkanals synthesizerstyresignal som representerer utjevningsstyreinformasjon,karakterisert ved: en styresignalgiver for å gi ut styresignalet med utjevningsstyreinformasjonen, bestemmelse, i respons på styresignalet, av den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt i det inngangssignal som skal behandles, og rekonstruksjons av et tidsavsnitt fra antallet syntetiserte utgangskanaler og ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.
24 Flerkanals synthesizerstyre/kontrollsignal som omfatter utjevningsstyre/kon-trollinformasjon i avhengighet av et flerkanals inngangssignal, hvilken informasjon er slik at en synthesizersides postprosessor (9) genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra rekonstruksjonsparameteren for et tidsavsnitt i inngangssignalet som skal behandles, i respons på utjevningsstyre/ kontrollinformasjonen, idet den genererte parameter eller kvantitet er ulik en verdi som kan oppnås ved bruk av omkvantisering i samsvar med en kvantiseringsregel.
25 Flerkanals synthesizers kontrollsignal ifølge krav 24,karakterisert vedå ligge lagret i et maskinlesbart lagringsmedium.
26 Sender eller lydopptaker som omfatter et apparat for generering av et flerkanals synthesizerstyre/kontrollsignal, hvilket apparat omfatter: en signalanalysator for analyse av et flerkanals inngangssignal, en kalkulator for å bestemme utjevningsstyreinformasjon i respons på resultater fra signalanalysatoren (la), hvilken kalkulator er innrettet for å bestemme denne styre informasjon slik at en postprosessor (9) på synthesizersiden i respons på utjevningsstyreinformasjonen genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt av et inngangssignal som skal behandles, og en datagenerator for å generere et styresignal som representerer utjevningskontrollinformasjonen som det flerkanals synthesizerstyresignal.
27 Mottaker eller lydavspiller med en flerkanals synthesizer for generering av et utgangssignal fra et inngangssignal, som omfatter minst én inngangskanal og en sekvens av kvantiserte, rekonstruksjonsparametere, hvor disse parametere kvantiseres i samsvar med en kvantiseringsregel og tilordnes påfølgende tidsavsnitt i inngangssignalet, hvor utgangssignalet har flere syntetiserte utgangskanaler, nemlig et større antall enn antallet inngangskanaler, og inngangskanalen er tilordnet et flerkanals synthesizerstyresignal som representerer utjevningsstyreinformasjon, idet mottaker omfatter: en styresignalgiver for å gi ut styresignalet med utjevningsstyreinformasjonen, en postprosessor (9) for å bestemme, i respons på styresignalet, den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet utledet fra rekonstruksjonsparameteren for et tidsavsnitt i inngangssignalet som skai behandles, idet postprosessoren er innrettet for å bestemme den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet slik at verdien av den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet er ulik en verdi som kan fremkomme ved bruk av omkvantisering i samsvar med kvantiseringsregelen, og en flerkanals rekonstruksjonsenhet for rekonstruksjon av et tidsavsnitt av de syntetiserte utgangskanaler ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.
28 Overføringssystem som omfatter en sender og en mottaker, hvor: senderen omfatter et apparat for generering av et flerkanals synthesizer-kontroll/styresignal, hvilket apparat omfatter: en signalanalysator for analyse av et flerkanals inngangssignal, en utjevnings-informasjonskalkulator for å bestemme utjevningskontrollinformasjon i respons på signalanalysatorens utgang, hvilken kalkulator er innrettet for å bestemme denne informasjon slik at en postprosessor (9) på synthesizersiden i respons på denne informasjon genererer en postprosessert rekonstruksjonsparameter eller postprosessert kvantitet utledet fra rekonstruksjonsparameteren for et tidsavsnitt i et inngangssignal som skal behandles, og en datagenerator for å generere et kontrollsignal som representerer utjevningskontrollinformasjonen som kontrollsignal for den flerkanals synthesizer, og der mottakeren omfatter en flerkanals synthesizer for generering av et utgangssignal fra et inngangssignal, idet inngangssignalet har minst én inngangskanal og en sekvens av kvantiserte rekonstruksjonsparametere som er kvantiserte i samsvar med en kvantiseringsregel, og er tilordnet påfølgende tidsavsnitt i inngangssignalet, der utgangssignalet har flere syntetiserte utgangskanaler hvis antall er større enn antallet inngangskanaler, der inngangskanalen er tilordnet et kontrollsignal fra en flerkanals synthesizer, hvilket signal representerer utjevningskontrollinformasjon, hvor mottakeren videre omfatter: en kontrollsignalgiver for å gi ut kontrollsignalet som omfatter utjevningskontrollinformasjonen, en postprosessor (9) for å bestemme, i respons på kontrollsignalet, den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt i inngangssignalet som skal behandles, hvor postprosessoren (9) er innrettet for å bestemme den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet slik at verdien av denne parameter eller kvantitet er ulik en verdi som kan oppnås ved bruk av omkvantisering i samsvar med kvantiseringsregelen, og en flerkanals rekonstruksjonsenhet for rekonstruksjon av et tidsavsnitt fra antallet syntetiserte utgangskanaler og ved bruk av tidsavsnittet i inngangskanalen og den postprosessete rekonstruksjonsparameter eller den postprosesserte størrelse.
29 Fremgangsmåte for sending eller lydregistrering og omfattende en fremgangsmåte for å generere et flerkanals synthesizerstyre/kontrollsignal,karakterisert ved: analyse av et flerkanals inngangssignal, bestemmelse av utjevningskontroll/styreinformasjon i respons på signal-analysetrinnet, slik at et postprosesseringstrinn i respons på utjevningskontroll/styreinformasjonen genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt i et inngangssignal som skal behandles, og generering av et kontroll/styresignal som representerer utjevningskontroll/- styreinformasjonen som det styre/kontrollsignal som frembringes av den flerkanals synthesizer.
30 Fremgangsmåte for å motta eller utføre lydavspilling og omfattende en fremgangsmåte for generering av et utgangssignal fra et inngangssignal, hvilket inngangssignal har minst én inngangskanal og en sekvens av kvantiserte rekonstruksjonsparametere som er kvantiserte i samsvar med en kvantiseringsregel, og er tilordnet fort-løpende tidsavsnittet i inngangssignalet, og hvor utgangssignalet har flere syntetiserte utgangskanaler i et antall som er større enn antallet inngangskanaler, og der inngangssignalet er tilordnet et kontroll/styresignal fra en flerkanals synthesizer, hvilket signal representerer utjevningskontroll/styreinformasjon,karakterisert vedat fremgangs-måten for generering omfatter: tilveiebringelse av styre/kontrollsignalet med utjevningskontrol/styreinnforma-sjonen, bestemmelse, i respons på styre/kontrollsignalet, av den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt i inngangssignalet som skal behandles, og rekonstruksjon av et tidsavsnitt i utgangssignalene fra synthesizeren og ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.
31 Fremgangsmåte for sending og mottaking og omfattende en sendefremgangs-måte som på sin side omfatter en fremgangsmåte for å generere et flerkanals synthesizer kontroll/styresignal, hvilken fremgangsmåte erkarakterisert ved: analyse av et flerkanals inngangssignal, bestemmelse av utjevningsstyre/kontrollinformasjon i respons på resultatet fra signalanalysen, slik at et postprosesseringstrinn i respons på denne informasjon genererer en postprosessert rekonstruksjonsparameter eller en postprosessert kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt tilhørende et inngangssignal som skal behandles, og generering av et kontroll/styresignal som representerer utjevningskontroll/- styreinformasjonen som det flerkanals synthesizerkontroll/styresignal, og omfattende en mottakingsfremgangsmåte som på sin side omfatter en fremgangsmåte for generering av et utgangssignal fra et inngangssignal, hvilket inngangssignal har minst én inngangskanal og en sekvens av kvantiserte rekonstruksjonsparametere som er kvantiserte i samsvar med en kvantiseirngsregel og er tilordnet for-løpende tidsavsnitt tilhørende inngangssignalet, der utgangssignalet har flere syntetiserte utgangskanaler hvis antall er større en antallet inngangskanaler, der inngangssignalet er tilordnet et flerkanals synthesizerstyre/kontrollsignal som representerer utjevningsstyre/kontrollinformasjon, hvilken fremgangsmåte for generering omfatter: tilveiebringelse av styresignalet som har denne utjevningsstyre/kontroll-informasjon, bestemmelse i respons på styre/kontrollsignalet, av den postprosesserte rekonstruksjonsparameter eller den postprosesserte kvantitet utledet fra rekonstruksjonsparameteren, for et tidsavsnitt i inngangssignalet som skal behandles, og rekonstruksjon av et tidsavsnitt av antallet syntetiserte utgangskanaler ved bruk av tidsavsnittet i inngangskanalen og den postprosesserte rekonstruksjonsparameter eller den postprosesserte størrelse.
32 Datamaskinprogram for å utføre under kjøring på en datamaskin, av en fremgangsmåte i samsvar med et hvilket som helst av de foregående fremgangsmåtekrav 15,23,29, 30 eller 31.
NO20065383A 2005-04-15 2006-11-22 Generering av kontrollsignal for flerkanals frekvensgeneratorer og flerkanals frekvensgenerering. NO338934B1 (no)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67158205P 2005-04-15 2005-04-15
US11/212,395 US7983922B2 (en) 2005-04-15 2005-08-27 Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
PCT/EP2006/000455 WO2006108456A1 (en) 2005-04-15 2006-01-19 Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing

Publications (2)

Publication Number Publication Date
NO20065383L NO20065383L (no) 2007-11-15
NO338934B1 true NO338934B1 (no) 2016-10-31

Family

ID=36274412

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20065383A NO338934B1 (no) 2005-04-15 2006-11-22 Generering av kontrollsignal for flerkanals frekvensgeneratorer og flerkanals frekvensgenerering.

Country Status (18)

Country Link
US (2) US7983922B2 (no)
EP (1) EP1738356B1 (no)
JP (3) JP5511136B2 (no)
KR (1) KR100904542B1 (no)
CN (1) CN101816040B (no)
AU (1) AU2006233504B2 (no)
BR (1) BRPI0605641B1 (no)
CA (1) CA2566992C (no)
ES (1) ES2399058T3 (no)
HK (1) HK1095195A1 (no)
IL (1) IL180046A (no)
MX (1) MXPA06014987A (no)
MY (1) MY141404A (no)
NO (1) NO338934B1 (no)
PL (1) PL1738356T3 (no)
RU (1) RU2361288C2 (no)
TW (1) TWI307248B (no)
WO (1) WO2006108456A1 (no)

Families Citing this family (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
JP2006504986A (ja) 2002-10-15 2006-02-09 ベランス・コーポレイション メディア・モニタリング、管理および情報システム
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US9055239B2 (en) 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR20070043651A (ko) 2005-10-20 2007-04-25 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
CN101326853B (zh) * 2005-12-13 2011-11-23 Nxp股份有限公司 处理音频数据流的装置和方法
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
ES2513265T3 (es) * 2006-01-19 2014-10-24 Lg Electronics Inc. Procedimiento y aparato para procesar una señal de medios
WO2007089129A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
WO2007091848A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US7584395B2 (en) * 2006-04-07 2009-09-01 Verigy (Singapore) Pte. Ltd. Systems, methods and apparatus for synthesizing state events for a test data stream
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8041041B1 (en) * 2006-05-30 2011-10-18 Anyka (Guangzhou) Microelectronics Technology Co., Ltd. Method and system for providing stereo-channel based multi-channel audio coding
US20070299657A1 (en) * 2006-06-21 2007-12-27 Kang George S Method and apparatus for monitoring multichannel voice transmissions
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
US9418667B2 (en) * 2006-10-12 2016-08-16 Lg Electronics Inc. Apparatus for processing a mix signal and method thereof
JP4838361B2 (ja) * 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
JP5463143B2 (ja) * 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
CN102789784B (zh) 2008-03-10 2016-06-08 弗劳恩霍夫应用研究促进协会 操纵具有瞬变事件的音频信号的方法和设备
US20090243578A1 (en) * 2008-03-31 2009-10-01 Riad Wahby Power Supply with Digital Control Loop
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
JP5340378B2 (ja) * 2009-02-26 2013-11-13 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
EP2413314A1 (en) * 2009-03-24 2012-02-01 Huawei Technologies Co., Ltd. Method and device for switching a signal delay
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
WO2011034090A1 (ja) * 2009-09-18 2011-03-24 日本電気株式会社 音声品質解析装置、音声品質解析方法およびプログラム
ES2644520T3 (es) 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
WO2011045549A1 (fr) * 2009-10-16 2011-04-21 France Telecom Decodage parametrique stereo optimise
WO2011048067A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling
KR101591704B1 (ko) * 2009-12-04 2016-02-04 삼성전자주식회사 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
JP6013918B2 (ja) * 2010-02-02 2016-10-25 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 空間音声再生
TWI557723B (zh) * 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
BR122020024855B1 (pt) 2010-04-13 2021-03-30 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio ou vídeo, decodificador de áudio ou vídeo e métodos relacionados para o processamento do sinal de áudio ou vídeo de múltiplos canais usando uma direção de previsão variável
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
US20120035940A1 (en) * 2010-08-06 2012-02-09 Samsung Electronics Co., Ltd. Audio signal processing method, encoding apparatus therefor, and decoding apparatus therefor
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
US8838978B2 (en) 2010-09-16 2014-09-16 Verance Corporation Content access management using extracted watermark information
CN103250206B (zh) 2010-10-07 2015-07-15 弗朗霍夫应用科学研究促进协会 用于比特流域中的编码音频帧的强度估计的装置及方法
FR2966277B1 (fr) * 2010-10-13 2017-03-31 Inst Polytechnique Grenoble Procede et dispositif de formation d'un signal mixe numerique audio, procede et dispositif de separation de signaux, et signal correspondant
US9424852B2 (en) 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
WO2012160472A1 (en) * 2011-05-26 2012-11-29 Koninklijke Philips Electronics N.V. An audio system and method therefor
CN103718466B (zh) * 2011-08-04 2016-08-17 杜比国际公司 通过使用参量立体声改善fm立体声无线电接收器
US9589550B2 (en) * 2011-09-30 2017-03-07 Harman International Industries, Inc. Methods and systems for measuring and reporting an energy level of a sound component within a sound mix
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
ES2571742T3 (es) 2012-04-05 2016-05-26 Huawei Tech Co Ltd Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal
ES2555579T3 (es) * 2012-04-05 2016-01-05 Huawei Technologies Co., Ltd Codificador de audio multicanal y método para codificar una señal de audio multicanal
EP2862166B1 (en) * 2012-06-14 2018-03-07 Dolby International AB Error concealment strategy in a decoding system
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US20140075469A1 (en) 2012-09-13 2014-03-13 Verance Corporation Content distribution including advertisements
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9654527B1 (en) 2012-12-21 2017-05-16 Juniper Networks, Inc. Failure detection manager
EP2939235B1 (en) 2013-01-29 2016-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-complexity tonality-adaptive audio signal quantization
US9262793B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
US9485089B2 (en) 2013-06-20 2016-11-01 Verance Corporation Stego key management
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
CN103702274B (zh) * 2013-12-27 2015-08-12 三星电子(中国)研发中心 立体环绕声重建方法及装置
EP3092641B1 (en) * 2014-01-08 2019-11-13 Dolby International AB Method and apparatus for improving the coding of side information required for coding a higher order ambisonics representation of a sound field
JP2017514345A (ja) 2014-03-13 2017-06-01 ベランス・コーポレイション 埋め込みコードを用いた対話型コンテンツ取得
US10504200B2 (en) 2014-03-13 2019-12-10 Verance Corporation Metadata acquisition using embedded watermarks
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
WO2016028934A1 (en) 2014-08-20 2016-02-25 Verance Corporation Content management based on dither-like watermark embedding
US9747922B2 (en) * 2014-09-19 2017-08-29 Hyundai Motor Company Sound signal processing method, and sound signal processing apparatus and vehicle equipped with the apparatus
US9942602B2 (en) 2014-11-25 2018-04-10 Verance Corporation Watermark detection and metadata delivery associated with a primary content
US9769543B2 (en) 2014-11-25 2017-09-19 Verance Corporation Enhanced metadata and content delivery using watermarks
US9602891B2 (en) 2014-12-18 2017-03-21 Verance Corporation Service signaling recovery for multimedia content using embedded watermarks
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016176056A1 (en) 2015-04-30 2016-11-03 Verance Corporation Watermark based content recognition improvements
US10477285B2 (en) 2015-07-20 2019-11-12 Verance Corporation Watermark-based data recovery for content with multiple alternative components
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
WO2017184648A1 (en) 2016-04-18 2017-10-26 Verance Corporation System and method for signaling security and database population
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
EP3264802A1 (en) 2016-06-30 2018-01-03 Nokia Technologies Oy Spatial audio processing for moving sound sources
US10949602B2 (en) 2016-09-20 2021-03-16 Nuance Communications, Inc. Sequencing medical codes methods and apparatus
US10362423B2 (en) * 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
US11297398B2 (en) 2017-06-21 2022-04-05 Verance Corporation Watermark-based metadata acquisition and processing
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
CN117292695A (zh) * 2017-08-10 2023-12-26 华为技术有限公司 时域立体声参数的编码方法和相关产品
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
GB2571949A (en) * 2018-03-13 2019-09-18 Nokia Technologies Oy Temporal spatial audio parameter smoothing
US11468149B2 (en) 2018-04-17 2022-10-11 Verance Corporation Device authentication in collaborative content screening
CN109710058A (zh) * 2018-11-27 2019-05-03 南京恩诺网络科技有限公司 触觉信息录制方法及装置、系统
US20220319526A1 (en) * 2019-08-30 2022-10-06 Dolby Laboratories Licensing Corporation Channel identification of multi-channel audio signals
CA3194884A1 (en) * 2020-10-09 2022-04-14 Franz REUTELHUBER Apparatus, method, or computer program for processing an encoded audio scene using a parameter conversion
JP2023549033A (ja) * 2020-10-09 2023-11-22 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン パラメータ平滑化を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム
US11722741B2 (en) 2021-02-08 2023-08-08 Verance Corporation System and method for tracking content timeline in the presence of playback rate changes
US12052573B2 (en) * 2021-11-11 2024-07-30 Verizon Patent And Licensing Inc. Systems and methods for mitigating fraud based on geofencing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
WO2003007656A1 (en) * 2001-07-10 2003-01-23 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate applications

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5001650A (en) * 1989-04-10 1991-03-19 Hughes Aircraft Company Method and apparatus for search and tracking
DE3943881B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US5267317A (en) * 1991-10-18 1993-11-30 At&T Bell Laboratories Method and apparatus for smoothing pitch-cycle waveforms
FI90477C (fi) * 1992-03-23 1994-02-10 Nokia Mobile Phones Ltd Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään
DE4217276C1 (no) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5703999A (en) 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3319677B2 (ja) * 1995-08-08 2002-09-03 三菱電機株式会社 周波数シンセサイザ
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5815117A (en) * 1997-01-02 1998-09-29 Raytheon Company Digital direction finding receiver
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
DE19716862A1 (de) * 1997-04-22 1998-10-29 Deutsche Telekom Ag Sprachaktivitätserkennung
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
JP4008607B2 (ja) 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6421454B1 (en) * 1999-05-27 2002-07-16 Litton Systems, Inc. Optical correlator assisted detection of calcifications for breast biopsy
US6718309B1 (en) * 2000-07-26 2004-04-06 Ssi Corporation Continuously variable time scale modification of digital audio signals
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
JP2002208858A (ja) * 2001-01-10 2002-07-26 Matsushita Electric Ind Co Ltd 周波数シンセサイザと周波数生成方法
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US8605911B2 (en) * 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7110940B2 (en) * 2002-10-30 2006-09-19 Microsoft Corporation Recursive multistage audio processing
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP4151020B2 (ja) 2004-02-27 2008-09-17 日本ビクター株式会社 音声信号伝送方法及び音声信号復号化装置
ES2324926T3 (es) * 2004-03-01 2009-08-19 Dolby Laboratories Licensing Corporation Descodificacion de audio multicanal.
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
TWI313362B (en) 2005-07-28 2009-08-11 Alpha Imaging Technology Corp Image capturing device and its image adjusting method
DE602006021347D1 (de) * 2006-03-28 2011-05-26 Fraunhofer Ges Forschung Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion
WO2011048067A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
WO2003007656A1 (en) * 2001-07-10 2003-01-23 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate applications

Also Published As

Publication number Publication date
CN101816040A (zh) 2010-08-25
IL180046A (en) 2011-07-31
US8532999B2 (en) 2013-09-10
RU2361288C2 (ru) 2009-07-10
EP1738356A1 (en) 2007-01-03
MY141404A (en) 2010-04-30
RU2006147255A (ru) 2008-07-10
CA2566992C (en) 2013-12-24
BRPI0605641A (pt) 2007-12-18
TWI307248B (en) 2009-03-01
US20110235810A1 (en) 2011-09-29
NO20065383L (no) 2007-11-15
EP1738356B1 (en) 2012-11-28
ES2399058T3 (es) 2013-03-25
US20080002842A1 (en) 2008-01-03
JP2012068651A (ja) 2012-04-05
JP5511136B2 (ja) 2014-06-04
KR20070088329A (ko) 2007-08-29
WO2006108456A1 (en) 2006-10-19
JP5625032B2 (ja) 2014-11-12
JP2013077017A (ja) 2013-04-25
MXPA06014987A (es) 2007-08-03
AU2006233504A1 (en) 2006-10-19
KR100904542B1 (ko) 2009-06-25
PL1738356T3 (pl) 2013-04-30
JP5624967B2 (ja) 2014-11-12
AU2006233504B2 (en) 2008-07-31
TW200701821A (en) 2007-01-01
HK1095195A1 (en) 2007-04-27
IL180046A0 (en) 2007-05-15
CA2566992A1 (en) 2006-10-19
BRPI0605641B1 (pt) 2020-04-07
US7983922B2 (en) 2011-07-19
JP2008511849A (ja) 2008-04-17
CN101816040B (zh) 2011-12-14

Similar Documents

Publication Publication Date Title
NO338934B1 (no) Generering av kontrollsignal for flerkanals frekvensgeneratorer og flerkanals frekvensgenerering.
US8843378B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
RU2639952C2 (ru) Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
JP2005523480A (ja) 空間的オーディオのパラメータ表示
EP2313886A1 (en) Multichannel audio coder and decoder
JP2009151183A (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法

Legal Events

Date Code Title Description
CHAD Change of the owner's name or address (par. 44 patent law, par. patentforskriften)

Owner name: FRAUNHOFER-GES ZUR FOERDERUNG DER ANGEWANDTEN, NL